Historie revizí

Autor SHA1 Zpráva Datum
  Johannes Gäßler 5cae766541 scripts: synthetic prompt mode for server-bench.py (#14695) před 6 měsíci
  matteo caf5681fcb server : support jinja extra template kwargs (Qwen3 enable_thinking feature), from command line and from client (#13196) před 7 měsíci
  Nigel Bosch 1b809cee22 server : move no API key doc to /health (#14352) před 7 měsíci
  aa956 d67341dc18 server : add server parameters for draft model cache type (#13782) před 7 měsíci
  Olivier Chafik e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) před 8 měsíci
  Isaac McFadyen 6a2bc8bfb7 server : added --no-prefill-assistant flag (#13608) před 8 měsíci
  Georgi Gerganov 053174436f server : passthrough the /models endpoint during loading (#13535) před 8 měsíci
  Xuan-Son Nguyen 3b24d26c22 server : update docs (#13432) před 8 měsíci
  Xuan-Son Nguyen 33eff40240 server : vision support via libmtmd (#12898) před 8 měsíci
  Diego Devesa 1d36b3670b llama : move end-user examples to tools directory (#13249) před 9 měsíci