Georgi Gerganov
|
14278f55d2
ggml : restore vec dot stride arg names (#5453)
|
1 年間 前 |
Georgi Gerganov
|
b1de96824b
ci : fix wikitext url + compile warnings (#5569)
|
1 年間 前 |
Georgi Gerganov
|
7ad554f90e
metal : fix unused warnings (#0)
|
1 年間 前 |
Robey Holderith
|
5ee99c32f5
common, server : surface min_keep as its own parameter (#5567)
|
1 年間 前 |
Pierrick Hymbert
|
c145f8a132
server : slots monitoring endpoint (#5550)
|
1 年間 前 |
Georgi Gerganov
|
689a091bbe
sampling : do not set min_keep to n_probs (#5564)
|
1 年間 前 |
Georgi Gerganov
|
f3f28c5395
cmake : fix GGML_USE_SYCL typo (#5555)
|
1 年間 前 |
Pierrick Hymbert
|
e75c6279d1
server : enhanced health endpoint (#5548)
|
1 年間 前 |
Pierrick Hymbert
|
36376abe05
server : --n-predict option document and cap to max value (#5549)
|
1 年間 前 |
Daniel Hiltgen
|
66c1968f7a
server : graceful server shutdown (#5244)
|
1 年間 前 |
Georgi Gerganov
|
1dcc3fde00
common : fix ub (#5530)
|
1 年間 前 |
Herman Semenov
|
5d3de51f97
ggml, common, examples, tests : fixed type arguments in printf (#5528)
|
1 年間 前 |
Daniel Bevenius
|
fc0c8d286a
llava : update surgery script to not remove tensors (#5536)
|
1 年間 前 |
Kawrakow
|
bd2d4e393b
1.5 bit quantization (#5453)
|
1 年間 前 |
github-actions[bot]
|
c8e0d7efeb
flake.lock: Update
|
1 年間 前 |
Georgi Gerganov
|
8f1be0d42f
ggml : add ALiBi support for ggml_soft_max_ext (#5488)
|
1 年間 前 |
Ananta Bastola
|
6e4e973b26
ci : add an option to fail on compile warning (#3952)
|
1 年間 前 |
clibdev
|
d250c9d61d
gitignore : update for CLion IDE (#5544)
|
1 年間 前 |
Georgi Gerganov
|
5bf2b94dd4
cmake : fix VULKAN and ROCm builds (#5525)
|
1 年間 前 |
Georgi Gerganov
|
d2819d5577
scripts : add helpers script for bench comparing commits (#5521)
|
1 年間 前 |
Herman Semenov
|
4cb0727698
llava : removed excess free(NULL) operation (#5531)
|
1 年間 前 |
Herman Semenov
|
65085c713e
llama : minor fixed return int value (#5529)
|
1 年間 前 |
Alexey Parfenov
|
6dcc02d244
server : add "samplers" param to control the samplers order (#5494)
|
1 年間 前 |
Rőczey Barnabás
|
5f5808ca7b
server : fix system prompt cli (#5516)
|
1 年間 前 |
bmwl
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 年間 前 |
Daniel Bevenius
|
60ed04cf82
llava : fix clip-model-is-vision flag in README.md (#5509)
|
1 年間 前 |
Georgi Gerganov
|
594845aab1
ci : fix BERT model download and convert
|
1 年間 前 |
Douglas Hanley
|
4524290e87
Use correct type of pooling for embedding models (#5500)
|
1 年間 前 |
Georgi Gerganov
|
c06e45d729
clip : fix wrong loop condition
|
1 年間 前 |
slaren
|
9060a1e9df
cuda : print message when initialization fails (#5512)
|
1 年間 前 |