Historie revizí

Autor SHA1 Zpráva Datum
  wwoodsTM ff252ea48e llama : add DRY sampler (#9702) před 1 rokem
  Xuan Son Nguyen 958367bf53 server : refactor slot input data, move tokenizer to HTTP thread (#10023) před 1 rokem
  Georgi Gerganov 8901755ba3 server : add n_indent parameter for line indentation requirement (#9929) před 1 rokem
  Georgi Gerganov 223c25a72f server : improve infill context reuse (#9894) před 1 rokem
  Georgi Gerganov d4c19c0f5c server : accept extra_context for the infill endpoint (#9874) před 1 rokem
  Georgi Gerganov c7181bd294 server : reuse cached context chunks (#9866) před 1 rokem
  Georgi Gerganov edc265661c server : add option to time limit the generation phase (#9865) před 1 rokem
  Georgi Gerganov 1bde94dd02 server : remove self-extend features (#9860) před 1 rokem
  Georgi Gerganov 95c76e8e92 server : remove legacy system_prompt feature (#9857) před 1 rokem
  Georgi Gerganov 11ac9800af llama : improve infill support and special token detection (#9798) před 1 rokem
  Xuan Son Nguyen 458367a906 server : better security control for public deployments (#9776) před 1 rokem
  Daniel Kleine 133c7b46b3 Fixed RNG seed docs (#9723) před 1 rokem
  Georgi Gerganov f4d2b8846a llama : add reranking support (#9510) před 1 rokem
  Xuan Son Nguyen afbbfaa537 server : add more env vars, improve gen-docs (#9635) před 1 rokem
  Xuan Son Nguyen 0b3bf966f4 server : add --no-context-shift option (#9607) před 1 rokem
  Vinesh Janarthanan 8a308354f6 server : match OAI structured output response (#9527) před 1 rokem
  Bert Wagner 8b836ae731 arg : add env variable for parallel (#9513) před 1 rokem
  Georgi Gerganov 6262d13e0b common : reimplement logging (#9418) před 1 rokem
  Mathijs Henquet 78203641fe server : Add option to return token pieces in /tokenize endpoint (#9108) před 1 rokem
  Xuan Son Nguyen bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) před 1 rokem
  Xuan Son Nguyen 1b9ae5189c common : refactor arg parser (#9308) před 1 rokem
  Georgi Gerganov df270ef745 llama : refactor sampling v2 (#9294) před 1 rokem
  Xuan Son Nguyen a77feb5d71 server : add some missing env variables (#9116) před 1 rokem
  Xuan Son Nguyen fc54ef0d1c server : support reading arguments from environment variables (#9105) před 1 rokem
  Xuan Son Nguyen 8b3befc0e2 server : refactor middleware and /health endpoint (#9056) před 1 rokem
  Xuan Son Nguyen 1e6f6554aa server : add lora hotswap endpoint (WIP) (#8857) před 1 rokem
  Igor Okulist afbbcf3c04 server : update llama-server embedding flag documentation (#8779) před 1 rokem
  Ujjawal Panchal 4b0eff3df5 docs : Quantum -> Quantized (#8666) před 1 rokem
  Jan Boon 628154492a server : update doc to clarify n_keep when there is bos token (#8619) před 1 rokem
  Xuan Son Nguyen 4db8f60fe7 fix ci (#8494) před 1 rokem