Histórico de Commits

Autor SHA1 Mensagem Data
  Pierrick Hymbert f482bb2e49 common: llama_load_model_from_url split support (#6192) há 1 ano atrás
  Olivier Chafik 5b7b0ac8df json-schema-to-grammar improvements (+ added to server) (#5978) há 1 ano atrás
  Jared Van Bortel bd60d82d0c server tests : more pythonic process management; fix bare `except:` (#6146) há 1 ano atrás
  Pierrick Hymbert d01b3c4c32 common: llama_load_model_from_url using --model-url (#6098) há 1 ano atrás
  Pierrick Hymbert fa8a809a91 server: ci: windows build and tests (#5968) há 1 ano atrás
  Pierrick Hymbert fd72d2d2a5 server: tests: add truncated prompt tests, better kv cache size (#5933) há 1 ano atrás
  Pierrick Hymbert 76e868821a server: metrics: add llamacpp:prompt_seconds_total and llamacpp:tokens_predicted_seconds_total, reset bucket only on /metrics. Fix values cast to int. Add Process-Start-Time-Unix header. (#5937) há 1 ano atrás
  Georgi Gerganov 2002bc96bf server : refactor (#5882) há 1 ano atrás
  Pierrick Hymbert 9731134296 server: tests: passkey challenge / self-extend with context shift demo (#5832) há 1 ano atrás
  Pierrick Hymbert 930b178026 server: logs - unified format and --log-format option (#5700) há 1 ano atrás
  Pierrick Hymbert d52d7819b8 server: concurrency fix + monitoring - add /metrics prometheus compatible endpoint (#5708) há 1 ano atrás
  Pierrick Hymbert 9e359a4f47 server: continue to update other slots on embedding concurrent request (#5699) há 1 ano atrás
  Pierrick Hymbert 525213d2f5 server: init functional tests (#5566) há 1 ano atrás