cturan/llama.cpp @ 09232370fc6426aa5dd9be01a8271b9c28f5af3a

David Huang 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386)		8 месяцев назад
..
batched-bench	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
cvector-generator	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
export-lora	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
gguf-split	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
imatrix	efb8b47eda imatrix : Add --parse-special for enabling parsing of special tokens in imatrix calculation (#13389)	8 месяцев назад
llama-bench	7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386)	8 месяцев назад
main	27ebfcacba llama : do not crash if there is no CPU backend (#13395)	8 месяцев назад
mtmd	7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386)	8 месяцев назад
perplexity	51fb96b1ff context : remove logits_all flag (#13284)	8 месяцев назад
quantize	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
rpc	27ebfcacba llama : do not crash if there is no CPU backend (#13395)	8 месяцев назад
run	0527771dd8 llama-run: add support for downloading models from ModelScope (#13370)	8 месяцев назад
server	3b24d26c22 server : update docs (#13432)	8 месяцев назад
tokenize	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
tts	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 месяцев назад
CMakeLists.txt	9b61acf060 mtmd : rename llava directory to mtmd (#13311)	8 месяцев назад