Xuan-Son Nguyen 53d0a12658 server : allow specifying reasoning_format in HTTP request (#15238) před 5 měsíci
..
batched-bench 225e7a1438 llama : add high-throughput mode (#14363) před 6 měsíci
cvector-generator 745aa5319b llama : deprecate llama_kv_self_ API (#14030) před 7 měsíci
export-lora 749e0d27f0 mtmd : fix 32-bit narrowing issue in export-lora and mtmd clip (#14503) před 5 měsíci
gguf-split e9b6350e61 scripts : make the shell scripts cross-platform (#14341) před 6 měsíci
imatrix 19f68fa5a4 imatrix : warn when GGUF imatrix is saved without .gguf suffix (#15076) před 5 měsíci
llama-bench 476aa3fd57 Fixed name `-override-tensors` to `-override-tensor` (#15129) před 5 měsíci
main c82d48ec23 llama : fix `--reverse-prompt` crashing issue (#14794) před 6 měsíci
mtmd 36d3f00e14 requirements : fix PyTorch uint64 compatibility (#15134) před 5 měsíci
perplexity 1ebbaddff2 perplexity : update comments/error msg to use decode [no ci] (#15227) před 5 měsíci
quantize fd1234cb46 llama : add gpt-oss (#15091) před 5 měsíci
rpc c508256db2 rpc : Fix build on OpenBSD (#13541) před 7 měsíci
run a457551332 cmake : do not search for curl libraries by ourselves (#14613) před 6 měsíci
server 53d0a12658 server : allow specifying reasoning_format in HTTP request (#15238) před 5 měsíci
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) před 8 měsíci
tts 53f925074d sync : vendor (#13901) před 7 měsíci
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) před 8 měsíci