Commit Verlauf

Autor SHA1 Nachricht Datum
  Olivier Chafik 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) vor 1 Jahr
  Georgi Gerganov 1cc0155d04 server : tuning tests (#7388) vor 1 Jahr
  Johannes Gäßler 1b01f06db0 server: add test for token probs (#7347) vor 1 Jahr
  Benjamin Findley e586ee4259 change default temperature of OAI compat API from 0 to 1 (#7226) vor 1 Jahr
  compilade f98eb31c51 convert-hf : save memory with lazy evaluation (#7075) vor 1 Jahr
  Johan 911b3900dd server : add_special option for tokenize endpoint (#7059) vor 1 Jahr
  Johannes Gäßler 3ea0d36000 Server: add tests for batch size, different seeds (#6950) vor 1 Jahr
  Johannes Gäßler 28103f4832 Server: fix seed for multiple slots (#6835) vor 1 Jahr
  Jan Boon beea6e1b16 llama : save and restore kv cache for single seq id (#6341) vor 1 Jahr
  Pierrick Hymbert a016026a3a server: continuous performance monitoring and PR comment (#6283) vor 1 Jahr
  Pierrick Hymbert f482bb2e49 common: llama_load_model_from_url split support (#6192) vor 1 Jahr
  Olivier Chafik 5b7b0ac8df json-schema-to-grammar improvements (+ added to server) (#5978) vor 1 Jahr
  Georgi Gerganov bc0baab2ea server : allow to override -ngl in tests (#6170) vor 1 Jahr
  Jared Van Bortel bd60d82d0c server tests : more pythonic process management; fix bare `except:` (#6146) vor 1 Jahr
  Pierrick Hymbert d01b3c4c32 common: llama_load_model_from_url using --model-url (#6098) vor 1 Jahr
  Pierrick Hymbert 43241adf22 server: disable debug release type sanitizer, simplify trigger (#6047) vor 1 Jahr
  slaren f30ea47a87 llama : add pipeline parallelism support (#6017) vor 1 Jahr
  Xuan Son Nguyen caa106d4e0 Server: format error to json (#5961) vor 1 Jahr
  Pierrick Hymbert fa8a809a91 server: ci: windows build and tests (#5968) vor 1 Jahr
  Xuan Son Nguyen 950ba1ab84 Server: reorganize some http logic (#5939) vor 1 Jahr
  Pierrick Hymbert fd72d2d2a5 server: tests: add truncated prompt tests, better kv cache size (#5933) vor 1 Jahr
  Pierrick Hymbert 76e868821a server: metrics: add llamacpp:prompt_seconds_total and llamacpp:tokens_predicted_seconds_total, reset bucket only on /metrics. Fix values cast to int. Add Process-Start-Time-Unix header. (#5937) vor 1 Jahr
  Georgi Gerganov 2002bc96bf server : refactor (#5882) vor 1 Jahr
  Pierrick Hymbert 9731134296 server: tests: passkey challenge / self-extend with context shift demo (#5832) vor 1 Jahr
  Jorge A efc72253f7 server : add "/chat/completions" alias for "/v1/...` (#5722) vor 1 Jahr
  Pierrick Hymbert e3965cf35a server: tests - slow inference causes timeout on the CI (#5715) vor 1 Jahr
  Pierrick Hymbert 930b178026 server: logs - unified format and --log-format option (#5700) vor 1 Jahr
  Pierrick Hymbert d52d7819b8 server: concurrency fix + monitoring - add /metrics prometheus compatible endpoint (#5708) vor 1 Jahr
  Pierrick Hymbert 9e359a4f47 server: continue to update other slots on embedding concurrent request (#5699) vor 1 Jahr
  Pierrick Hymbert 525213d2f5 server: init functional tests (#5566) vor 1 Jahr