cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
jacekpoplawski	8ff206097c llama-bench: add --n-cpu-moe support (#15952)	před 4 měsíci
Diego Devesa	360d6533db ggml-backend : add GGML_BACKEND_DEVICE_TYPE_IGPU device type (#15797)	před 4 měsíci
Johannes Gäßler	e81b8e4b7f llama: use FA + max. GPU layers by default (#15434)	před 4 měsíci
Georgi Gerganov	9ebebef62f llama : remove KV cache defragmentation logic (#15473)	před 4 měsíci
Juk Armstrong	476aa3fd57 Fixed name `-override-tensors` to `-override-tensor` (#15129)	před 5 měsíci
R0CKSTAR	3025b621d1 llama-bench: rename DB table name from test to llama_bench (#15003)	před 5 měsíci
Radoslav Gerganov	c556418b60 llama-bench : use local GPUs along with RPC servers (#14917)	před 5 měsíci
bashayer hijji	fffcce535e llama-bench : add --no-warmup flag (#14224) (#14270)	před 7 měsíci
Georgi Gerganov	745aa5319b llama : deprecate llama_kv_self_ API (#14030)	před 7 měsíci
Max Krasnyansky	053b1539c0 threading: support for GGML_SCHED_PRIO_LOW, update thread info on Windows to avoid throttling (#12995)	před 7 měsíci
Georgi Gerganov	e298d2fbd0 kv-cache : add SWA support (#13194)	před 8 měsíci
Diego Devesa	6c8b91500e llama-bench : fix -ot with dl backends (#13563)	před 8 měsíci
Georgi Gerganov	b2838049cc bench : handle decode errors (#13548)	před 8 měsíci
Diego Devesa	cf0a43bb64 llama-bench : add defrag-thold, check for invalid ranges (#13487)	před 8 měsíci
Diego Devesa	22cdab343b llama-bench : accept ranges for integer parameters (#13410)	před 8 měsíci
David Huang	7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386)	před 8 měsíci
Diego Devesa	1d36b3670b llama : move end-user examples to tools directory (#13249)	před 8 měsíci

Historie revizí Hledat

Historie revizí