Sigbjørn Skjæret 6c019cb04e server : only attempt to enable thinking if using jinja (#15967) 4 месяцев назад
..
batched-bench a885dcff11 batched-bench : fix llama_synchronize usage during prompt processing (#15835) 4 месяцев назад
cvector-generator 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
export-lora 749e0d27f0 mtmd : fix 32-bit narrowing issue in export-lora and mtmd clip (#14503) 5 месяцев назад
gguf-split e9b6350e61 scripts : make the shell scripts cross-platform (#14341) 6 месяцев назад
imatrix 19f68fa5a4 imatrix : warn when GGUF imatrix is saved without .gguf suffix (#15076) 5 месяцев назад
llama-bench 360d6533db ggml-backend : add GGML_BACKEND_DEVICE_TYPE_IGPU device type (#15797) 4 месяцев назад
main d1c6f11f47 doc : update documentation for --tensor-split (#15980) 4 месяцев назад
mtmd 50f4281a6f llama : allow using iGPUs with --device (#15951) 4 месяцев назад
perplexity 3ea913f1ce perplexity: give more information about constraints on failure (#15303) 5 месяцев назад
quantize fd1234cb46 llama : add gpt-oss (#15091) 5 месяцев назад
rpc 918b26f197 rpc : fix regression when --device is used (#15981) 4 месяцев назад
run a457551332 cmake : do not search for curl libraries by ourselves (#14613) 6 месяцев назад
server 6c019cb04e server : only attempt to enable thinking if using jinja (#15967) 4 месяцев назад
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
tts e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665) 4 месяцев назад
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) 8 месяцев назад