cturan/llama.cpp

Author	SHA1 Message	Date
Jeff Bolz	a05e2afcc2 vulkan: disable spirv-opt for coopmat shaders (#10763)	1 year ago
Johannes Gäßler	26a8406ba9 CUDA: fix shared memory access condition for mmv (#10740)	1 year ago
Srihari-mcw	c37fb4cf62 Changes to CMakePresets.json to add ninja clang target on windows (#10668)	1 year ago
Jeff Bolz	3d98b4cb22 vulkan: fix compile warnings (#10731)	1 year ago
Borislav Stanimirov	1a05004743 cmake : simplify msvc charsets (#10672)	1 year ago
Xuan Son Nguyen	ce8784bdb1 server : fix format_infill (#10724)	1 year ago
Xuan Son Nguyen	e52522b869 server : bring back info of final chunk in stream mode (#10722)	1 year ago
stduhpf	06d70147e6 Vulkan: fix NaN in tanh.comp with AMD proprietary driver on Windows (#10723)	1 year ago
Diego Devesa	43ed389a3f llama : use cmake for swift build (#10525)	1 year ago
Jeff Bolz	ecc93d0558 vulkan: compile a test shader in cmake to check for coopmat2 support (#10713)	1 year ago
Robert Collins	62e84d9848 llama : add 128k yarn context for Qwen (#10698)	1 year ago
Xuan Son Nguyen	3573fa8e7b server : (refactor) no more json in server_task input (#10691)	1 year ago
Georgi Gerganov	d9c3ba2b77 ggml : disable iq4_nl interleave size 8 (#10709)	1 year ago
Georgi Gerganov	ce4a7b8493 server : various fixes (#10704)	1 year ago
Djip007	19d8762ab6 ggml : refactor online repacking (#10446)	1 year ago
Georgi Gerganov	c2a16c0bdb server : fix free of spec context and batch (#10651)	1 year ago
0cc4m	3df784b305 Vulkan: VK_KHR_cooperative_matrix support to speed up prompt processing (#10597)	1 year ago
Robert Ormandi	86a1934978 metal : Extend how Llama.cpp locates metal resources (#10676)	1 year ago
Sukriti Sharma	784a14aa49 convert : add support for Roberta embeddings (#10695)	1 year ago
Georgi Gerganov	c5ede3849f convert : add custom attention mapping	1 year ago
Xuan Son Nguyen	f162d45a21 common : bring back --no-warmup to server (#10686)	1 year ago
Xuan Son Nguyen	6c5bc0625f server : (refactoring) do not rely on JSON internally (#10643)	1 year ago
Plamen Minev	7736837d62 fix(server) : not show alert when DONE is received (#10674)	1 year ago
Jeff Bolz	c9c6e01dae vulkan: Add VK_NV_cooperative_matrix2 support for mul_mat and flash attention (#10206)	1 year ago
Riccardo Orlando	6fe6247831 llama : add Minerva 7B model support (#10673)	1 year ago
Georgi Gerganov	0cd182ebcc sync : ggml	1 year ago
PAB	a8cbab201d ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037)	1 year ago
PAB	c2082d93a8 ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)	1 year ago
Daniel Bevenius	d405804be8 py : update outdated copy-paste instructions [no ci] (#10667)	1 year ago
aryantandon01	f112d198cd Update deprecation-warning.cpp (#10619)	1 year ago

Newer Older

Commit History Find

Commit History