Slava Primenko
|
f77261a7c5
ggml: bypass code incompatible with CUDA < 11.1 (whisper/2020)
|
1 年間 前 |
Georgi Gerganov
|
43e8995e75
scripts : sync ggml-cuda folder
|
1 年間 前 |
limitedAtonement
|
9472bce308
Run make to build the project (#6457)
|
1 年間 前 |
Neo Zhang Jianyu
|
d4f220a5cc
support/fix OPs GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_XS, GGML_TYPE_IQ3_XXS, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M (#6521)
|
1 年間 前 |
Georgi Gerganov
|
54ea0698fb
sync : ggml
|
1 年間 前 |
Daniel Bevenius
|
b66aec675c
backend : fix typo in scheduler documentation (ggml/781)
|
1 年間 前 |
Clint Herron
|
57dd02c44b
Tests: Added integration tests for GBNF parser (#6472)
|
1 年間 前 |
Pierrick Hymbert
|
75cd4c7729
ci: bench: support sse and fix prompt processing time / server: add tokens usage in stream OAI response (#6495)
|
1 年間 前 |
Brian
|
a8bd14d557
gguf.py : add licence and version to gguf writer (#6504)
|
1 年間 前 |
Hoang Nguyen
|
d0f5deebf8
readme : update UI list (#6503)
|
1 年間 前 |
Ting Sun
|
87e21bbacd
bench : make n_batch and n_ubatch configurable in Batched bench (#6500)
|
1 年間 前 |
Ouadie EL FAROUKI
|
1b496a745c
[SYCL] Fixed minor bug when enabling FP16 for non intel targets (#6464)
|
1 年間 前 |
alexpinel
|
a307375c02
readme : add Dot to UI list (#6487)
|
1 年間 前 |
Jun Jie
|
b660a5729e
readme : fix typo (#6481)
|
1 年間 前 |
Ed Lepedus
|
0a1d889e27
server: add cURL support to server Dockerfiles (#6474)
|
1 年間 前 |
Minsoo Cheong
|
7dda1b727e
ci: exempt master branch workflows from getting cancelled (#6486)
|
1 年間 前 |
Ewout ter Hoeven
|
c666ba26c3
build CI: Name artifacts (#6482)
|
1 年間 前 |
Shakhar Dasgupta
|
2e66913e5f
server: allow penalizing repetition of newlines on server webpage (#6431)
|
1 年間 前 |
Pierrick Hymbert
|
8120efee1d
ci: bench fix concurrency for workflow trigger dispatch with sha1 (#6478)
|
1 年間 前 |
limitedAtonement
|
a74401f0e5
Correct README link (#6458)
|
1 年間 前 |
Pierrick Hymbert
|
7a2c92637a
ci: bench: add more ftype, fix triggers and bot comment (#6466)
|
1 年間 前 |
Daniel Bevenius
|
4bcd6b959c
common: remove duplicate check for curl (#6471)
|
1 年間 前 |
Clint Herron
|
9b84ae1806
examples : add GBNF validator program (#5948)
|
1 年間 前 |
Georgi Gerganov
|
4399f13fb9
server : remove obsolete --memory-f32 option
|
1 年間 前 |
Xiao-Yong Jin
|
1a43c7254e
server : add option to disable KV offload (#6468)
|
1 年間 前 |
Clint Herron
|
72d73af651
convert : fix for lint error complaining of bare except (#6470)
|
1 年間 前 |
Fattire
|
5fb1574c81
A few small fixes to server's README docs (#6428)
|
1 年間 前 |
JH23X
|
60cdf40cc3
server : handle exception on wrong type in request (#6452)
|
1 年間 前 |
bryanSwk
|
bb43cf7e9d
llama : add SEA-LION support (#6448)
|
1 年間 前 |
Ewout ter Hoeven
|
9f62c0173d
ci : update checkout, setup-python and upload-artifact to latest (#6456)
|
1 年間 前 |