Georgi Gerganov
|
8901755ba3
server : add n_indent parameter for line indentation requirement (#9929)
|
1 год назад |
Georgi Gerganov
|
223c25a72f
server : improve infill context reuse (#9894)
|
1 год назад |
Georgi Gerganov
|
d4c19c0f5c
server : accept extra_context for the infill endpoint (#9874)
|
1 год назад |
Georgi Gerganov
|
c7181bd294
server : reuse cached context chunks (#9866)
|
1 год назад |
Georgi Gerganov
|
edc265661c
server : add option to time limit the generation phase (#9865)
|
1 год назад |
Georgi Gerganov
|
1bde94dd02
server : remove self-extend features (#9860)
|
1 год назад |
Georgi Gerganov
|
95c76e8e92
server : remove legacy system_prompt feature (#9857)
|
1 год назад |
Georgi Gerganov
|
11ac9800af
llama : improve infill support and special token detection (#9798)
|
1 год назад |
Xuan Son Nguyen
|
458367a906
server : better security control for public deployments (#9776)
|
1 год назад |
Daniel Kleine
|
133c7b46b3
Fixed RNG seed docs (#9723)
|
1 год назад |
Georgi Gerganov
|
f4d2b8846a
llama : add reranking support (#9510)
|
1 год назад |
Xuan Son Nguyen
|
afbbfaa537
server : add more env vars, improve gen-docs (#9635)
|
1 год назад |
Xuan Son Nguyen
|
0b3bf966f4
server : add --no-context-shift option (#9607)
|
1 год назад |
Vinesh Janarthanan
|
8a308354f6
server : match OAI structured output response (#9527)
|
1 год назад |
Bert Wagner
|
8b836ae731
arg : add env variable for parallel (#9513)
|
1 год назад |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
1 год назад |
Mathijs Henquet
|
78203641fe
server : Add option to return token pieces in /tokenize endpoint (#9108)
|
1 год назад |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 год назад |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
1 год назад |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 год назад |
Xuan Son Nguyen
|
a77feb5d71
server : add some missing env variables (#9116)
|
1 год назад |
Xuan Son Nguyen
|
fc54ef0d1c
server : support reading arguments from environment variables (#9105)
|
1 год назад |
Xuan Son Nguyen
|
8b3befc0e2
server : refactor middleware and /health endpoint (#9056)
|
1 год назад |
Xuan Son Nguyen
|
1e6f6554aa
server : add lora hotswap endpoint (WIP) (#8857)
|
1 год назад |
Igor Okulist
|
afbbcf3c04
server : update llama-server embedding flag documentation (#8779)
|
1 год назад |
Ujjawal Panchal
|
4b0eff3df5
docs : Quantum -> Quantized (#8666)
|
1 год назад |
Jan Boon
|
628154492a
server : update doc to clarify n_keep when there is bos token (#8619)
|
1 год назад |
Xuan Son Nguyen
|
4db8f60fe7
fix ci (#8494)
|
1 год назад |
M-A
|
f17f39ff9c
server: update README.md with llama-server --help output [no ci] (#8472)
|
1 год назад |
Bjarke Viksøe
|
cb4d86c4d7
server: Retrieve prompt template in /props (#8337)
|
1 год назад |