cturan/llama.cpp

Autore	SHA1 Messaggio	Data
AidanBeltonS	6bf9b66fa3 [SYCL] Update SYCL upscale operation (#7321)	1 anno fa
AidanBeltonS	9a17ab914b Add missing " (#7303)	1 anno fa
John Balis	48aa8fd1f2 ggml : add `ggml_upscale_ext` (ggml/814)	1 anno fa
Neo Zhang	948f4ec7c5 [SYCL] rm wait() (#7233)	1 anno fa
Georgi Gerganov	9cb317f77e ggml : full ALiBi support (#7192)	1 anno fa
Ouadie EL FAROUKI	8c570c9496 Minor arithmetic improvement to mmvq wrapper kernel (#7172)	1 anno fa
Georgi Gerganov	9c67c2773d ggml : add Flash Attention (#5021)	1 anno fa
Neo Zhang	ce023f6f2f add device version in device list (#6959)	1 anno fa
slaren	0d56246f4b ggml : group all experts in a single ggml_mul_mat_id (#6505)	1 anno fa
Neo Zhang Jianyu	17e98d4c96 fix mul_mat_id() for new input, make the ut pass (#6682)	1 anno fa
Neo Zhang Jianyu	de17e3f745 fix memcpy() crash, add missed cmd in guide, fix softmax (#6622)	1 anno fa
Abhilash Majumder	87fb5b4234 remove row=1 cond (#6532)	1 anno fa
Neo Zhang Jianyu	d4f220a5cc support/fix OPs GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_XS, GGML_TYPE_IQ3_XXS, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M (#6521)	1 anno fa
Ouadie EL FAROUKI	1b496a745c [SYCL] Fixed minor bug when enabling FP16 for non intel targets (#6464)	1 anno fa
Meng, Hengyu	52604860f9 [SYCL] Disable iqx on windows as WA (#6435)	1 anno fa
Neo Zhang Jianyu	25f4a613c4 [SYCL] fix set main gpu crash (#6339)	1 anno fa
AidanBeltonS	e82f9e2b83 [SYCL] Fix batched impl for NVidia GPU (#6164)	1 anno fa
compilade	557410b8f0 llama : greatly reduce output buffer memory usage (#6122)	1 anno fa
Meng, Hengyu	ddf6568510 [SYCL] offload op (#6217)	1 anno fa
AidanBeltonS	c5b8595e3f Add nvidia and amd backends (#6157)	1 anno fa
slaren	2bf8d0f7c4 backend : offload large batches to GPU (#6083)	1 anno fa
Neo Zhang Jianyu	46acb36767 fix set main gpu error (#6073)	1 anno fa
AidanBeltonS	753e36f650 [SYCL] Fix non-intel device selection (#6042)	1 anno fa
slaren	f30ea47a87 llama : add pipeline parallelism support (#6017)	1 anno fa
AidanBeltonS	b3d978600f Update get version (#6025)	1 anno fa
Georgi Gerganov	8030da7afe ggml : reuse quantum structs across backends (#5943)	1 anno fa
Georgi Gerganov	48358b2e5b sycl : update IQ1_S kernels (WIP - not working!) (#5995)	1 anno fa
Abhilash Majumder	ef3ced26a3 [SYCL] Add q3_s and q1_s (#5886)	1 anno fa
Georgi Gerganov	8a3012a4ad ggml : add ggml-common.h to deduplicate shared code (#5940)	1 anno fa
Neo Zhang Jianyu	89fb735fcf Revert "[SYCL] fix error when set main gpu to non-zero (#5901)" (#5918)	1 anno fa

Più recente Più vecchio

Cronologia Commit Cerca

Cronologia Commit