cturan/llama.cpp

Автор	SHA1 Опис	Дата
Diego Devesa	59f4db1088 ggml : add predefined list of CPU backend variants to build (#10626)	1 рік тому
Diego Devesa	2803540814 ggml-cpu : fix HWCAP2_I8MM value (#10646)	1 рік тому
ltoniazzi	253b7fde91 Fix HF repo commit to clone lora test models (#10649)	1 рік тому
JFLFY2255	8d0cfd554a llama: Support MiniCPM-1B (with & w/o longrope) (#10559)	1 рік тому
Jeff Bolz	2759916d86 vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (#10642)	1 рік тому
Nicolò Scipione	40c6d79fb5 SYCL : Move to compile time oneMKL interface backend selection for NVIDIA backend (#10584)	1 рік тому
Wang Ran (汪然)	98036d5670 fix typo of README.md (#10605)	1 рік тому
Frankie Robertson	cd2f37b304 Avoid using __fp16 on ARM with old nvcc (#10616)	1 рік тому
Benson Wong	da6aac91f1 Add docs for creating a static build (#10268) (#10630)	1 рік тому
piDack	01e6d9bb71 clip : add sycl support (#10574)	1 рік тому
Jeff Bolz	cc98896db8 vulkan: optimize and reenable split_k (#10637)	1 рік тому
Xuan Son Nguyen	91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599)	1 рік тому
Georgi Gerganov	1cd3df46bd scripts : remove amx sync	1 рік тому
Georgi Gerganov	c505471857 sync : ggml	1 рік тому
mahorozte	e9e661bd59 CUDA: remove unnecessary warp reduce in FA (ggml/1032)	1 рік тому
PAB	efb6ae9630 feat: add `GGML_UNARY_OP_ARGMAX` Metal kernel (ggml/1019)	1 рік тому
PAB	667d70d170 metal : add `GGML_OP_CONV_TRANSPOSE_1D` kernels (ggml/1026)	1 рік тому
Xuan Son Nguyen	3b4f2e33e2 llama : add missing LLAMA_API for llama_chat_builtin_templates (#10636)	1 рік тому
Nikolaos Pothitos	82bca2257b readme : add option, update default value, fix formatting (#10271)	1 рік тому
Georgi Gerganov	0115df2f65 metal : small-batch mat-mul kernels (#10581)	1 рік тому
Georgi Gerganov	515d4e5372 github : minify link [no ci] (revert)	1 рік тому
Georgi Gerganov	844e2e1fee github : minify link [no ci]	1 рік тому
Georgi Gerganov	70b98fadbc server : fix default draft model parameters (#10586)	1 рік тому
Xuan Son Nguyen	642330ac7c llama : add enum for built-in chat templates (#10623)	1 рік тому
Georgi Gerganov	8648c52101 make : deprecate (#10514)	1 рік тому
haopeng	64ed2091b2 server: Add "tokens per second" information in the backend (#10548)	1 рік тому
Akarshan Biswas	991f8aabee SYCL: Fix and switch to GGML_LOG system instead of fprintf (#10579)	1 рік тому
Georgi Gerganov	4cb003dd8d contrib : refresh (#10593)	1 рік тому
Juk Armstrong	917786f43d Add `mistral-v1`, `mistral-v3`, `mistral-v3-tekken` and `mistral-v7` chat template types (#10572)	1 рік тому
Georgi Gerganov	5e1ed95583 grammars : add English-only grammar (#10612)	1 рік тому

Новіші Старіші

Історія комітів Пошук

Історія комітів