David Huang 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) 8 месяцев назад
..
batched-bench 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
cvector-generator 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
export-lora 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
gguf-split 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
imatrix efb8b47eda imatrix : Add --parse-special for enabling parsing of special tokens in imatrix calculation (#13389) 8 месяцев назад
llama-bench 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) 8 месяцев назад
main 27ebfcacba llama : do not crash if there is no CPU backend (#13395) 8 месяцев назад
mtmd 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) 8 месяцев назад
perplexity 51fb96b1ff context : remove logits_all flag (#13284) 8 месяцев назад
quantize 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
rpc 27ebfcacba llama : do not crash if there is no CPU backend (#13395) 8 месяцев назад
run 0527771dd8 llama-run: add support for downloading models from ModelScope (#13370) 8 месяцев назад
server 3b24d26c22 server : update docs (#13432) 8 месяцев назад
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
tts 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) 8 месяцев назад