Olivier Chafik
|
03f582ae8f
server: fix streaming crashes (#13786)
|
před 7 měsíci |
Olivier Chafik
|
e121edc432
`server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771)
|
před 7 měsíci |
Olivier Chafik
|
d785f9c1fd
server: fix/test add_generation_prompt (#13770)
|
před 7 měsíci |
Olivier Chafik
|
f5cd27b71d
`server`: streaming of tool calls and thoughts when `--jinja` is on (#12379)
|
před 7 měsíci |
Xuan-Son Nguyen
|
9ecf3e66a3
server : support audio input (#13714)
|
před 7 měsíci |
Xuan-Son Nguyen
|
797990c4bc
mtmd : add ultravox audio input (#13623)
|
před 7 měsíci |
Isaac McFadyen
|
6a2bc8bfb7
server : added --no-prefill-assistant flag (#13608)
|
před 8 měsíci |
Piotr Wilkin (ilintar)
|
c753d7bed0
server : proper error handling for missing elements in messages array (OpenAI compatible backend) (#13540)
|
před 8 měsíci |
Xuan-Son Nguyen
|
360a9c98e1
server : fix cache_tokens bug with no cache_prompt (#13533)
|
před 8 měsíci |
Anudit Nagar
|
91159ee9df
server : allow content to be null in oaicompat_completion_params_parse (#13477)
|
před 8 měsíci |
Xuan-Son Nguyen
|
33eff40240
server : vision support via libmtmd (#12898)
|
před 8 měsíci |
Diego Devesa
|
1d36b3670b
llama : move end-user examples to tools directory (#13249)
|
před 8 měsíci |