Olivier Chafik e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
..
batched-bench b89d605a91 batched-bench : fix pp batch contents (#13492) hace 8 meses
cvector-generator 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
export-lora 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
gguf-split 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
imatrix efb8b47eda imatrix : Add --parse-special for enabling parsing of special tokens in imatrix calculation (#13389) hace 8 meses
llama-bench e298d2fbd0 kv-cache : add SWA support (#13194) hace 8 meses
main 27ebfcacba llama : do not crash if there is no CPU backend (#13395) hace 8 meses
mtmd 40aaa8a403 mtmd : add support for Qwen2-Audio and SeaLLM-Audio (#13760) hace 7 meses
perplexity 51fb96b1ff context : remove logits_all flag (#13284) hace 8 meses
quantize e5c834f718 quantize : improve tensor-type pattern matching (#13033) hace 8 meses
rpc c508256db2 rpc : Fix build on OpenBSD (#13541) hace 7 meses
run 797f2ac062 kv-cache : simplify the interface (#13660) hace 8 meses
server e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
tts 8a1d206f1d tts : fix n_ubatch + make WavTokenizer cache-less (#13713) hace 8 meses
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) hace 8 meses