Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov f4d2b8846a llama : add reranking support (#9510) vor 1 Jahr
  Xuan Son Nguyen afbbfaa537 server : add more env vars, improve gen-docs (#9635) vor 1 Jahr
  Xuan Son Nguyen 0b3bf966f4 server : add --no-context-shift option (#9607) vor 1 Jahr
  Vinesh Janarthanan 8a308354f6 server : match OAI structured output response (#9527) vor 1 Jahr
  Bert Wagner 8b836ae731 arg : add env variable for parallel (#9513) vor 1 Jahr
  Georgi Gerganov 6262d13e0b common : reimplement logging (#9418) vor 1 Jahr
  Mathijs Henquet 78203641fe server : Add option to return token pieces in /tokenize endpoint (#9108) vor 1 Jahr
  Xuan Son Nguyen bfe76d4a17 common : move arg parser code to `arg.cpp` (#9388) vor 1 Jahr
  Xuan Son Nguyen 1b9ae5189c common : refactor arg parser (#9308) vor 1 Jahr
  Georgi Gerganov df270ef745 llama : refactor sampling v2 (#9294) vor 1 Jahr
  Xuan Son Nguyen a77feb5d71 server : add some missing env variables (#9116) vor 1 Jahr
  Xuan Son Nguyen fc54ef0d1c server : support reading arguments from environment variables (#9105) vor 1 Jahr
  Xuan Son Nguyen 8b3befc0e2 server : refactor middleware and /health endpoint (#9056) vor 1 Jahr
  Xuan Son Nguyen 1e6f6554aa server : add lora hotswap endpoint (WIP) (#8857) vor 1 Jahr
  Igor Okulist afbbcf3c04 server : update llama-server embedding flag documentation (#8779) vor 1 Jahr
  Ujjawal Panchal 4b0eff3df5 docs : Quantum -> Quantized (#8666) vor 1 Jahr
  Jan Boon 628154492a server : update doc to clarify n_keep when there is bos token (#8619) vor 1 Jahr
  Xuan Son Nguyen 4db8f60fe7 fix ci (#8494) vor 1 Jahr
  M-A f17f39ff9c server: update README.md with llama-server --help output [no ci] (#8472) vor 1 Jahr
  Bjarke Viksøe cb4d86c4d7 server: Retrieve prompt template in /props (#8337) vor 1 Jahr
  Pieter Ouwerkerk 5a7447c569 readme : fix minor typos [no ci] (#8314) vor 1 Jahr
  Sigbjørn Skjæret 38373cfbab Add SPM infill support (#8016) vor 1 Jahr
  Olivier Chafik 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) vor 1 Jahr
  Johannes Gäßler 7027b27d76 server: update cache_prompt documentation [no ci] (#7745) vor 1 Jahr
  Johannes Gäßler 1b01f06db0 server: add test for token probs (#7347) vor 1 Jahr
  Johannes Gäßler cb42c29427 server: correct --threads documentation [no ci] (#7362) vor 1 Jahr
  Leon Knauer 9c4fdcbec8 [Server] Added --verbose option to README [no ci] (#7335) vor 1 Jahr
  Ryuei 27f65d6267 docs: Fix typo and update description for --embeddings flag (#7026) vor 1 Jahr
  Johan 911b3900dd server : add_special option for tokenize endpoint (#7059) vor 1 Jahr
  Johannes Gäßler af0a5b6163 server: fix incorrectly reported token probabilities (#7125) vor 1 Jahr