David Huang 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) 8 месяцев назад
..
llama-cpp.h afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) 1 год назад
llama.h 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) 8 месяцев назад