Xuan Son Nguyen
|
458367a906
server : better security control for public deployments (#9776)
|
1 年間 前 |
Georgi Gerganov
|
8c475b97b8
rerank : use [SEP] token instead of [BOS] (#9737)
|
1 年間 前 |
Georgi Gerganov
|
f4d2b8846a
llama : add reranking support (#9510)
|
1 年間 前 |
Xuan Son Nguyen
|
afbbfaa537
server : add more env vars, improve gen-docs (#9635)
|
1 年間 前 |
StrangeBytesDev
|
0aa15011e3
server : add newline after chat example (#9616)
|
1 年間 前 |
Xuan Son Nguyen
|
0b3bf966f4
server : add --no-context-shift option (#9607)
|
1 年間 前 |
Georgi Gerganov
|
6026da52d6
server : clean-up completed tasks from waiting list (#9531)
|
1 年間 前 |
Eric Zhang
|
f799155ab8
server : fix OpenSSL build (remove obsolete `LOG_INFO`) (#9529)
|
1 年間 前 |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
1 年間 前 |
VoidIsVoid
|
dcdcee3a74
server: add data: [DONE] to /chat/completions stream response (#9459)
|
1 年間 前 |
Xuan Son Nguyen
|
feff4aa846
server : add loading html page while model is loading (#9468)
|
1 年間 前 |
Mathijs Henquet
|
78203641fe
server : Add option to return token pieces in /tokenize endpoint (#9108)
|
1 年間 前 |
slaren
|
49006c67b4
llama : move random seed generation to the samplers (#9398)
|
1 年間 前 |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 年間 前 |
slaren
|
5fb5e24811
llama : minor sampling refactor (2) (#9386)
|
1 年間 前 |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
1 年間 前 |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 年間 前 |
Xuan Son Nguyen
|
9b2c24c099
server : simplify state machine for slot (#9283)
|
1 年間 前 |
Xuan Son Nguyen
|
4a1411b4f1
server : fix missing lock (#9334)
|
1 年間 前 |
Xuan Son Nguyen
|
6e7d133a5f
server : refactor multitask handling (#9274)
|
1 年間 前 |
Faisal Zaghloul
|
42c76d1358
Threadpool: take 2 (#8672)
|
1 年間 前 |
Jan Boon
|
9f7d4bcf5c
server : fix crash when error handler dumps invalid utf-8 json (#9195)
|
1 年間 前 |
Xuan Son Nguyen
|
fc54ef0d1c
server : support reading arguments from environment variables (#9105)
|
1 年間 前 |
Xuan Son Nguyen
|
8b3befc0e2
server : refactor middleware and /health endpoint (#9056)
|
1 年間 前 |
Riceball LEE
|
37501d9c79
server : fix duplicated n_predict key in the generation_settings (#8994)
|
1 年間 前 |
Zhenwei Jin
|
4af8420afb
common : remove duplicate function llama_should_add_bos_token (#8778)
|
1 年間 前 |
Jiří Podivín
|
234b30676a
server : init stop and error fields of the result struct (#9026)
|
1 年間 前 |
compilade
|
98a532d474
server : fix segfault on long system prompt (#8987)
|
1 年間 前 |
Georgi Gerganov
|
5ef07e25ac
server : handle models with missing EOS token (#8997)
|
1 年間 前 |
Mathieu Geli
|
daef3ab233
server : add one level list nesting for embeddings (#8936)
|
1 年間 前 |