cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
R0CKSTAR	b81510a7b7 test-backend-ops: add support for specifying output format (#14368)	před 7 měsíci
Georgi Gerganov	ef797db357 metal : disable fast math in all quantize kernels (#14528)	před 7 měsíci
Georgi Gerganov	67d1ef23c6 batch : add optional for sequential equal split (#14511)	před 7 měsíci
Georgi Gerganov	7b50f7c025 graph : prepare for 4D mask (#14515)	před 7 měsíci
Georgi Gerganov	c79184d2d1 batch : add n_used count (#14512)	před 7 měsíci
luyhcsu	499a8f5a78 CANN: Replace aclrtMemsetSync with aclnnInplaceZero operator (#14002)	před 7 měsíci
Sigbjørn Skjæret	28657a8229 ggml : implement GEGLU_ERF and GEGLU_QUICK ops (#14445)	před 7 měsíci
lhez	bee28421be opencl : broadcast for soft_max (#14510)	před 7 měsíci
Jeff Bolz	2b72bedec1 vulkan: support mixed/deepseekR1 FA head sizes (#14509)	před 7 měsíci
Johannes Gäßler	c8c4495b8d ggml: backward pass for split swiglu (#14483)	před 7 měsíci
Nicolò Scipione	7b63a71a6b Fix conditional enabling following arch checks for ggml-sycl (#14504)	před 7 měsíci
Xuan-Son Nguyen	0c2ee38ab7 convert : correct gemma 3n conversion (#14450)	před 7 měsíci
Georgi Gerganov	a70c8a0c4b kv-cache : use ggml_set_rows (#14285)	před 7 měsíci
Georgi Gerganov	9067487c44 ggml : fix FA mask dim 2 and 3 (#14505)	před 7 měsíci
Georgi Gerganov	d4cdd9c1c3 ggml : remove kompute backend (#14501)	před 7 měsíci
Aman Gupta	55c2646b45 CUDA: add dynamic shared mem to softmax, refactor general usage (#14497)	před 7 měsíci
Sigbjørn Skjæret	e75ba4c043 gguf-py : add support for chat template jinja files (#14508)	před 7 měsíci
compilade	5d46babdc2 llama : initial Mamba-2 support (#9126)	před 7 měsíci
Georgi Gerganov	e17991c466 sync : ggml	před 7 měsíci
Daniel Bevenius	c46944aa25 ggml : add version function to get lib version (ggml/1286)	před 7 měsíci
Rotem Dan	f3ed38d793 Set RPATH to "@loader_path" / "$ORIGIN" to ensure executables and dynamic libraries search for dependencies in their origin directory. (#14309)	před 7 měsíci
Aman Gupta	55a1c5a5fd CUDA: add softmax broadcast (#14475)	před 7 měsíci
Johannes Gäßler	12a81af45f CUDA: broadcasting for FlashAttention mask (#14500)	před 7 měsíci
Jeff Bolz	8875523eb3 vulkan: support softmax/FA batch and broadcast (#14449)	před 7 měsíci
Georgi Gerganov	ec68e84c32 ggml : support bcast ggml_soft_max_ext, ggml_flash_attn_ext (#14435)	před 7 měsíci
zhouwg	307e79d33d opencl : fix possible buffer overflow in dump_tensor (#14490)	před 7 měsíci
Georgi Gerganov	d7f5f4e578 simple-chat : fix context-exceeded condition (#14494)	před 7 měsíci
Eric Zhang	c8a4e470f6 opencl : skip empty nodes on cgraph compute (#14491)	před 7 měsíci
lhez	603e43dc91 opencl : update upscale to support align corners (#14488)	před 7 měsíci
Sigbjørn Skjæret	611ba4b264 ci : add OpenCL to labeler workflow (#14496)	před 7 měsíci

Novější Starší

Historie revizí Hledat

Historie revizí