Georgi Gerganov
|
f4d2b8846a
llama : add reranking support (#9510)
|
hace 1 año |
Xuan Son Nguyen
|
0b3bf966f4
server : add --no-context-shift option (#9607)
|
hace 1 año |
Georgi Gerganov
|
faf69d4237
llama : sanitize invalid tokens (#9357)
|
hace 1 año |
Olivier Chafik
|
8843a98c2b
Improve usability of --model-url & related flags (#6930)
|
hace 1 año |
Pierrick Hymbert
|
d01b3c4c32
common: llama_load_model_from_url using --model-url (#6098)
|
hace 1 año |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
hace 1 año |
Georgi Gerganov
|
2002bc96bf
server : refactor (#5882)
|
hace 1 año |