Georgi Gerganov
|
7fdb6f73e3
flake.lock: Update (#8342)
|
hace 1 año |
Alberto Cabrera Pérez
|
a130eccef4
labeler : updated sycl to match docs and code refactor (#8373)
|
hace 1 año |
b4b4o
|
c4dd11d1d3
readme : fix web link error [no ci] (#8347)
|
hace 1 año |
Alberto Cabrera Pérez
|
2ec846d558
sycl : fix powf call in device code (#8368)
|
hace 1 año |
Georgi Gerganov
|
3f2d538b81
scripts : fix sync for sycl
|
hace 1 año |
Georgi Gerganov
|
2ee44c9a18
sync : ggml
|
hace 1 año |
Georgi Gerganov
|
6847d54c4f
tests : fix whitespace (#0)
|
hace 1 año |
John Balis
|
fde13b3bb9
feat: cuda implementation for `ggml_conv_transpose_1d` (ggml/854)
|
hace 1 año |
Kevin Wang
|
470939d483
common : preallocate sampling token data vector (#8363)
|
hace 1 año |
Georgi Gerganov
|
6f0dbf6ab0
infill : assert prefix/suffix tokens + remove old space logic (#8351)
|
hace 1 año |
Kevin Wang
|
ffd00797d8
common : avoid unnecessary logits fetch (#8358)
|
hace 1 año |
toyer
|
04ce3a8b19
readme : add supported glm models (#8360)
|
hace 1 año |
compilade
|
3fd62a6b1c
py : type-check all Python scripts with Pyright (#8341)
|
hace 1 año |
Denis Spasyuk
|
a8db2a9ce6
Update llama-cli documentation (#8315)
|
hace 1 año |
Alex Tuddenham
|
4090ea5501
ci : add checks for cmake,make and ctest in ci/run.sh (#8200)
|
hace 1 año |
Andy Tai
|
f1948f1e10
readme : update bindings list (#8222)
|
hace 1 año |
Brian
|
f7cab35ef9
gguf-hash: model wide and per tensor hashing using xxhash and sha1 (#8048)
|
hace 1 año |
toyer
|
905942abdb
llama : support glm3 and glm4 (#8031)
|
hace 1 año |
Georgi Gerganov
|
b5040086d4
llama : fix n_rot default (#8348)
|
hace 1 año |
compilade
|
d39130a398
py : use cpu-only torch in requirements.txt (#8335)
|
hace 1 año |
standby24x7
|
b81ba1f96b
finetune: Rename command name in README.md (#8343)
|
hace 1 año |
standby24x7
|
210eb9ed0a
finetune: Rename an old command name in finetune.sh (#8344)
|
hace 1 año |
Bjarke Viksøe
|
cb4d86c4d7
server: Retrieve prompt template in /props (#8337)
|
hace 1 año |
Derrick T. Woolworth
|
86e7299ef5
added support for Authorization Bearer tokens when downloading model (#8307)
|
hace 1 año |
Xuan Son Nguyen
|
60d83a0149
update main readme (#8333)
|
hace 1 año |
Daniel Bevenius
|
87e25a1d1b
llama : add early return for empty range (#8327)
|
hace 1 año |
jaime-m-p
|
213701b51a
Detokenizer fixes (#8039)
|
hace 1 año |
Xuan Son Nguyen
|
be20e7f49d
Reorganize documentation pages (#8325)
|
hace 1 año |
Georgi Gerganov
|
7ed03b8974
llama : fix compile warning (#8304)
|
hace 1 año |
Natsu
|
1d894a790e
cmake : add GGML_BUILD and GGML_SHARED macro definitions (#8281)
|
hace 1 año |