cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
Johannes Gäßler	64848deb18 llama-fit-params: free memory target per device (#18679)	před 3 týdny
Julius Tischbein	2038101bd9 llama : add `use_direct_io` flag for model loading (#18166)	před 3 týdny
Daniel Bevenius	d3dce4e0a5 sampling : add support for backend sampling (#17004)	před 3 týdny
Xuan-Son Nguyen	cd78e57c3a lora: count lora nodes in graph_max_nodes (#18469)	před 1 měsícem
o7si	daa242dfc8 common: fix return value check for setpriority (#18412)	před 1 měsícem
Johannes Gäßler	026d2ad472 llama: fix magic number of 999 for GPU layers (#18266)	před 1 měsícem
Johannes Gäßler	147a521636 tool/ex/tests: consistently free ctx, then model (#18168)	před 1 měsícem
Johannes Gäßler	a2c199e479 common: clarify instructions for bug reports (#18134)	před 1 měsícem
Johannes Gäßler	b1f3a6e5db llama: automatically set parameters not set by the user in such a way that maximizes GPU utilization (#16653)	před 1 měsícem
Georgi Gerganov	254098a279 common : refactor common_sampler + grammar logic changes (#17937)	před 1 měsícem
Sigbjørn Skjæret	22577583a3 common : change --color to accept on/off/auto, default to auto (#17827)	před 1 měsícem
Adrien Gallouët	83c1171529 common: use native MultiByteToWideChar (#17738)	před 1 měsícem
Reese Levine	7ca5991d2b ggml webgpu: add support for emscripten builds (#17184)	před 1 měsícem
Xuan-Son Nguyen	13628d8bdb server: add --media-path for local media files (#17697)	před 1 měsícem
Xuan-Son Nguyen	ec18edfcba server: introduce API for serving / loading / unloading multiple models (#17470)	před 2 měsíci
Aaron Teo	877566d512 llama: introduce support for model-embedded sampling parameters (#17120)	před 2 měsíci
Georgi Gerganov	196f5083ef common : more accurate sampling timing (#17382)	před 2 měsíci
Xuan-Son Nguyen	9b17d74ab7 mtmd: add mtmd_log_set (#17268)	před 2 měsíci
Xuan-Son Nguyen	aa3b7a90b4 arg: add --cache-list argument to list cached models (#17073)	před 2 měsíci
Gadflyii	3df2244df4 llama : add --no-host to disable host buffers (#16310)	před 3 měsíci
Aaron Teo	624207e676 devops: add s390x & ppc64le CI (#15925)	před 4 měsíci
Douglas Hanley	b5bd037832 llama : add support for qwen3 reranker (#15824)	před 4 měsíci
Uilian Ries	152729f884 common : add missing chrono header for common.cpp (#16211)	před 4 měsíci
Johannes Gäßler	e81b8e4b7f llama: use FA + max. GPU layers by default (#15434)	před 5 měsíci
Sigbjørn Skjæret	84ab83cc0b model : jina-embeddings-v3 support (#13693)	před 5 měsíci
Georgi Gerganov	9ebebef62f llama : remove KV cache defragmentation logic (#15473)	před 5 měsíci
Jie Fu (傅杰)	2f3dbffb17 common : fix incorrect print of non-ascii characters in the logging (#15466)	před 5 měsíci
Jonathan Graehl	5cdb27e091 finetune: SGD optimizer, more CLI args (#13873)	před 5 měsíci
Diego Devesa	d6818d06a6 llama : allow other bufts when overriding to CPU, add --no-repack option (#14990)	před 6 měsíci
compilade	90083283ec imatrix : use GGUF to store importance matrices (#9400)	před 6 měsíci

Novější Starší

Historie revizí Hledat

Historie revizí