Ruben Ortlam db79dc06b1 llama-bench: add direct_io parameter (#18778) 2 недель назад
..
batched-bench 147a521636 tool/ex/tests: consistently free ctx, then model (#18168) 1 месяц назад
cli ce3bf9b1a4 server: update docs for sleeping [no ci] (#18777) 2 недель назад
completion ce3bf9b1a4 server: update docs for sleeping [no ci] (#18777) 2 недель назад
cvector-generator 254098a279 common : refactor common_sampler + grammar logic changes (#17937) 1 месяц назад
export-lora 07808ebb07 cmake : Do not install tools on iOS targets (#15903) 4 месяцев назад
fit-params 64848deb18 llama-fit-params: free memory target per device (#18679) 2 недель назад
gguf-split 6c2131773c cli: new CLI experience (#17824) 1 месяц назад
imatrix 254098a279 common : refactor common_sampler + grammar logic changes (#17937) 1 месяц назад
llama-bench db79dc06b1 llama-bench: add direct_io parameter (#18778) 2 недель назад
mtmd a61c8bc3bf mtmd: Add Gemma3n multimodal support with MobileNetV5 vision encoder (#18256) 2 недель назад
perplexity 254098a279 common : refactor common_sampler + grammar logic changes (#17937) 1 месяц назад
quantize 33ded988ba quantize: prevent input/output file collision (#18451) 4 недель назад
rpc d2d626938a Install rpc-server when GGML_RPC is ON. (#17149) 2 месяцев назад
server bcf7546160 server : add arg for disabling prompt caching (#18776) 2 недель назад
tokenize 07808ebb07 cmake : Do not install tools on iOS targets (#15903) 4 месяцев назад
tts 254098a279 common : refactor common_sampler + grammar logic changes (#17937) 1 месяц назад
CMakeLists.txt a180ba78c7 cmake: only build cli when server is enabled (#18670) 2 недель назад