slaren
|
bbecf3f415
llama : increase max nodes (#4115)
|
před 2 roky |
Roger Meier
|
8e9361089d
build : support ppc64le build for make and CMake (#3963)
|
před 2 roky |
Georgi Gerganov
|
5ad387e994
tokenize : fix trailing whitespace
|
před 2 roky |
zakkor
|
2fa02b4b3d
examples : add tokenize (#4039)
|
před 2 roky |
Don Mahurin
|
2ab0707acb
convert : use 'model' value if it exists. This allows karpathy/tinyllamas to load (#4089)
|
před 2 roky |
John
|
11173c92d6
py : Falcon HF compatibility (#4104)
|
před 2 roky |
Jannis Schönleber
|
9e87ef60e1
common : improve yaml log escaping (#4080)
|
před 2 roky |
Huawei Lin
|
c7cce1246e
llava : fix compilation warning that fread return value is not used (#4069)
|
před 2 roky |
Jiří Podivín
|
f7d5e97542
py : remove superfluous import statements (#4076)
|
před 2 roky |
Jiří Podivín
|
ba4cf5c0bf
train : move number of gpu layers argument parsing to common/train.cpp (#4074)
|
před 2 roky |
slaren
|
e85bb1a8e7
llama : add functions to get the model's metadata (#4013)
|
před 2 roky |
gwjr
|
3e916a07ac
finetune : speed-up ggml_compute_forward_out_prod_f32 via BLAS (#4079)
|
před 2 roky |
Andrew Godfrey
|
947f64f163
finetune : zero the loraB initial vectors (#4082)
|
před 2 roky |
Andrew Godfrey
|
b83e149ec6
cuda : get_row_rounding F32 (#4095)
|
před 2 roky |
Georgi Gerganov
|
4f447a4833
llama : fix data units (#4101)
|
před 2 roky |
Kerfuffle
|
91f6499393
Respect tokenizer.ggml.add_bos_token value when tokenizing (#4040)
|
před 2 roky |
texmex76
|
8da46278e1
gguf : fix potential infinite loops while parsing (#4100)
|
před 2 roky |
Jared Van Bortel
|
a6fc554e26
llama : restore prefix space in llama tokenizer (#4081)
|
před 2 roky |
slaren
|
1cf2850d52
ggml-cuda : increase max graph size (#4084)
|
před 2 roky |
Michael Potter
|
6bb4908a17
Fix MacOS Sonoma model quantization (#4052)
|
před 2 roky |
Galunid
|
36eed0c42c
stablelm : StableLM support (#3586)
|
před 2 roky |
afrideva
|
b46d12f86d
convert.py: also look for plain model.safetensors (#4043)
|
před 2 roky |
M. Yusuf Sarıgöz
|
bd90eca237
llava : fix regression for square images in #3613 (#4056)
|
před 2 roky |
Georgi Gerganov
|
3d68f364f1
ggml : sync (im2col, GPU conv, 32-bit arm compat) (#4060)
|
před 2 roky |
Georgi Gerganov
|
c049b37d7b
readme : update hot topics
|
před 2 roky |
Georgi Gerganov
|
4760e7cc0b
sync : ggml (backend v2) (#3912)
|
před 2 roky |
Kerfuffle
|
bb50a792ec
Add ReLU and SQR CUDA ops to (partially) fix Persimmon offloading (#4041)
|
před 2 roky |
Kerfuffle
|
21fd874c8d
gguf-py: gguf_writer: Use bytearray to build metadata (#4051)
|
před 2 roky |
Richard Kiss
|
532dd74e38
Fix some documentation typos/grammar mistakes (#4032)
|
před 2 roky |
M. Yusuf Sarıgöz
|
e86fc56f75
Fix gguf-convert-endian script (#4037)
|
před 2 roky |