cturan/llama.cpp @ 9e2b1e83c68a38ea0c64f726dd979439bd02189b

Xuan-Son Nguyen a68d914426 server: add exceed_context_size_error type (#15780)		4 місяців тому
..
batched-bench	e81b8e4b7f llama: use FA + max. GPU layers by default (#15434)	4 місяців тому
cvector-generator	745aa5319b llama : deprecate llama_kv_self_ API (#14030)	7 місяців тому
export-lora	749e0d27f0 mtmd : fix 32-bit narrowing issue in export-lora and mtmd clip (#14503)	5 місяців тому
gguf-split	e9b6350e61 scripts : make the shell scripts cross-platform (#14341)	6 місяців тому
imatrix	19f68fa5a4 imatrix : warn when GGUF imatrix is saved without .gguf suffix (#15076)	5 місяців тому
llama-bench	e81b8e4b7f llama: use FA + max. GPU layers by default (#15434)	4 місяців тому
main	d35a1e8c41 cli : change log to warning to explain reason for stopping (#15604)	4 місяців тому
mtmd	8ce3ff1d91 mtmd : fix mtmd ios build (#15579)	4 місяців тому
perplexity	3ea913f1ce perplexity: give more information about constraints on failure (#15303)	5 місяців тому
quantize	fd1234cb46 llama : add gpt-oss (#15091)	5 місяців тому
rpc	c508256db2 rpc : Fix build on OpenBSD (#13541)	7 місяців тому
run	a457551332 cmake : do not search for curl libraries by ourselves (#14613)	6 місяців тому
server	a68d914426 server: add exceed_context_size_error type (#15780)	4 місяців тому
tokenize	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 місяців тому
tts	e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665)	4 місяців тому
CMakeLists.txt	9b61acf060 mtmd : rename llava directory to mtmd (#13311)	8 місяців тому