cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
cmdr2	f54a4ba11e Support pure float16 add/sub/mul/div operations in the CUDA (and CPU) backend (ggml/1121)	před 10 měsíci
Diego Devesa	d5c63cd7f9 test-backend-ops : add option -p to filter by op params (#12155)	před 10 měsíci
William Tambellini	70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854)	před 10 měsíci
Johannes Gäßler	5fa07c2f93 CUDA: optimize FA for GQA + large batches (#12014)	před 10 měsíci
Rémy O	2eea03d86a vulkan: implement several ops relevant for ggml_opt (#11769)	před 11 měsíci
Johannes Gäßler	fd08255d0d CUDA: non-contiguous (RMS) norm support (#11659)	před 11 měsíci
Akarshan Biswas	6e84b0ab8e SYCL : SOFTMAX F16 mask support and other fixes (#11261)	před 11 měsíci
Johannes Gäßler	8137b4bb2b CPU/CUDA: fix (GQA) mul mat back, add CUDA support (#11380)	před 11 měsíci
Jeff Bolz	564804b79b tests: fix some mul_mat test gaps (#11375)	před 11 měsíci
Jeff Bolz	44e18ef939 vulkan: fix coopmat2 flash attention for non-contiguous inputs (#11281)	před 1 rokem
Jeff Bolz	bd38ddea01 vulkan: support copy from f32 to q4_0/q4_1/q5_0/q5_1/q8_0/iq4_nl (#11166)	před 1 rokem
Johannes Gäßler	9c8dcefe17 CUDA: backwards pass for misc. ops, add tests (#11257)	před 1 rokem
Johannes Gäßler	432df2d5f9 RoPE: fix back, CUDA support for back + noncont. (#11240)	před 1 rokem
Molly Sophia	ee7136c6d1 llama: add support for QRWKV6 model architecture (#11001)	před 1 rokem
Jeff Bolz	716bd6dec3 vulkan: optimize mul_mat for small values of N (#10991)	před 1 rokem
Jeff Bolz	a813badbbd vulkan: im2col and matmul optimizations for stable diffusion (#10942)	před 1 rokem
Georgi Gerganov	0006f5a74a ggml : update ggml_backend_cpu_device_supports_op (#10867)	před 1 rokem
HimariO	ba1cb19cdd llama : add Qwen2VL support + multimodal RoPE (#10361)	před 1 rokem
PAB	a8cbab201d ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037)	před 1 rokem
PAB	c2082d93a8 ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)	před 1 rokem
Jeff Bolz	2759916d86 vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (#10642)	před 1 rokem
PAB	efb6ae9630 feat: add `GGML_UNARY_OP_ARGMAX` Metal kernel (ggml/1019)	před 1 rokem
Georgi Gerganov	0115df2f65 metal : small-batch mat-mul kernels (#10581)	před 1 rokem
Georgi Gerganov	f0678c5ff4 ggml : fix I8MM Q4_1 scaling factor conversion (#10562)	před 1 rokem
Jeff Bolz	904109ed0d vulkan: fix group_norm (#10496)	před 1 rokem
Diego Devesa	5931c1f233 ggml : add support for dynamic loading of backends (#10469)	před 1 rokem
Diego Devesa	a5e47592b6 cuda : optimize argmax (#10441)	před 1 rokem
Johannes Gäßler	02e4eaf22f ggml-opt: fix data corruption (ggml/1022)	před 1 rokem
Jeff Bolz	b3e585988f vulkan: Optimize soft_max (#10301)	před 1 rokem
Johannes Gäßler	8a43e940ab ggml: new optimization interface (ggml/988)	před 1 rokem

Novější Starší

Historie revizí Hledat

Historie revizí