Faisal Zaghloul
|
42c76d1358
Threadpool: take 2 (#8672)
|
1 an în urmă |
Jan Boon
|
9f7d4bcf5c
server : fix crash when error handler dumps invalid utf-8 json (#9195)
|
1 an în urmă |
Xuan Son Nguyen
|
fc54ef0d1c
server : support reading arguments from environment variables (#9105)
|
1 an în urmă |
Xuan Son Nguyen
|
8b3befc0e2
server : refactor middleware and /health endpoint (#9056)
|
1 an în urmă |
Riceball LEE
|
37501d9c79
server : fix duplicated n_predict key in the generation_settings (#8994)
|
1 an în urmă |
Zhenwei Jin
|
4af8420afb
common : remove duplicate function llama_should_add_bos_token (#8778)
|
1 an în urmă |
Jiří Podivín
|
234b30676a
server : init stop and error fields of the result struct (#9026)
|
1 an în urmă |
compilade
|
98a532d474
server : fix segfault on long system prompt (#8987)
|
1 an în urmă |
Georgi Gerganov
|
5ef07e25ac
server : handle models with missing EOS token (#8997)
|
1 an în urmă |
Mathieu Geli
|
daef3ab233
server : add one level list nesting for embeddings (#8936)
|
1 an în urmă |
Xuan Son Nguyen
|
1e6f6554aa
server : add lora hotswap endpoint (WIP) (#8857)
|
1 an în urmă |
Liu Jia
|
0a4ce78681
common : Changed tuple to struct (TODO fix) (#8823)
|
1 an în urmă |
ardfork
|
978ba3d83d
Server: Don't ignore llama.cpp params (#8754)
|
1 an în urmă |
RunningLeon
|
3807c3de04
server : respect `--special` cli arg (#8553)
|
1 an în urmă |
Douglas Hanley
|
c3ebcfa148
server : ensure batches are either all embed or all completion (#8420)
|
1 an în urmă |
Clint Herron
|
278d0e1846
Initialize default slot sampling parameters from the global context. (#8418)
|
1 an în urmă |
Clint Herron
|
a59f8fdc85
Server: Enable setting default sampling parameters via command-line (#8402)
|
1 an în urmă |
Bjarke Viksøe
|
cb4d86c4d7
server: Retrieve prompt template in /props (#8337)
|
1 an în urmă |
Sigbjørn Skjæret
|
38373cfbab
Add SPM infill support (#8016)
|
1 an în urmă |
Xuan Son Nguyen
|
48e6b92cc3
Add chat template support for llama-cli (#8068)
|
1 an în urmă |
sasha0552
|
ba58993152
server : fix smart slot selection (#8020)
|
1 an în urmă |
Sigbjørn Skjæret
|
91c188d6c2
Only use FIM middle token if it exists (#7648)
|
1 an în urmă |
Georgi Gerganov
|
704a35b183
server : restore numeric prompts (#7883)
|
1 an în urmă |
Georgi Gerganov
|
d9da0e4986
server : improve "prompt" handling (#7847)
|
1 an în urmă |
sasha0552
|
7a16ce7db2
server : smart slot selection using Longest Common Prefix (#7728)
|
1 an în urmă |
woodx
|
a5cabd7649
server : do not get prompt in infill mode (#7286)
|
1 an în urmă |
Georgi Gerganov
|
f83351f9a6
imatrix : migrate to gpt_params (#7771)
|
1 an în urmă |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
1 an în urmă |
Yazan Agha-Schrader
|
2e666832e6
server : new UI (#7633)
|
1 an în urmă |
Georgi Gerganov
|
6ff13987ad
common : normalize naming style (#7462)
|
1 an în urmă |