Georgi Gerganov
|
fb76ec31a9
ggml : fix YARN + add tests + add asserts (#7617)
|
1 năm trước cách đây |
Meng, Hengyu
|
b864b50ce5
[SYCL] Align GEMM dispatch (#7566)
|
1 năm trước cách đây |
Georgi Gerganov
|
6bd12ce409
sycl : fix assert (#7563)
|
1 năm trước cách đây |
Neo Zhang
|
e2b065071c
[SYCL]fix ggml_sycl_mul_mat_id() to match the change of api (#7436)
|
1 năm trước cách đây |
Georgi Gerganov
|
0548a4187f
ggml : generalize GGML_OP_CONCAT (#7563)
|
1 năm trước cách đây |
AidanBeltonS
|
95f84d5ce8
Fix q_xxs using mul_mat_q (#7459)
|
1 năm trước cách đây |
AidanBeltonS
|
5487593bc7
Add freq factors (#7495)
|
1 năm trước cách đây |
Georgi Gerganov
|
e84b71c2c6
ggml : drop support for QK_K=64 (#7473)
|
1 năm trước cách đây |
liuwei-git
|
201cc11afa
llama : add phi3 128K model support (#7225)
|
1 năm trước cách đây |
AidanBeltonS
|
6bf9b66fa3
[SYCL] Update SYCL upscale operation (#7321)
|
1 năm trước cách đây |
AidanBeltonS
|
9a17ab914b
Add missing " (#7303)
|
1 năm trước cách đây |
John Balis
|
48aa8fd1f2
ggml : add `ggml_upscale_ext` (ggml/814)
|
1 năm trước cách đây |
Neo Zhang
|
948f4ec7c5
[SYCL] rm wait() (#7233)
|
1 năm trước cách đây |
Georgi Gerganov
|
9cb317f77e
ggml : full ALiBi support (#7192)
|
1 năm trước cách đây |
Ouadie EL FAROUKI
|
8c570c9496
Minor arithmetic improvement to mmvq wrapper kernel (#7172)
|
1 năm trước cách đây |
Georgi Gerganov
|
9c67c2773d
ggml : add Flash Attention (#5021)
|
1 năm trước cách đây |
Neo Zhang
|
ce023f6f2f
add device version in device list (#6959)
|
1 năm trước cách đây |
slaren
|
0d56246f4b
ggml : group all experts in a single ggml_mul_mat_id (#6505)
|
1 năm trước cách đây |
Neo Zhang Jianyu
|
17e98d4c96
fix mul_mat_id() for new input, make the ut pass (#6682)
|
1 năm trước cách đây |
Neo Zhang Jianyu
|
de17e3f745
fix memcpy() crash, add missed cmd in guide, fix softmax (#6622)
|
1 năm trước cách đây |
Abhilash Majumder
|
87fb5b4234
remove row=1 cond (#6532)
|
1 năm trước cách đây |
Neo Zhang Jianyu
|
d4f220a5cc
support/fix OPs GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_XS, GGML_TYPE_IQ3_XXS, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M (#6521)
|
1 năm trước cách đây |
Ouadie EL FAROUKI
|
1b496a745c
[SYCL] Fixed minor bug when enabling FP16 for non intel targets (#6464)
|
1 năm trước cách đây |
Meng, Hengyu
|
52604860f9
[SYCL] Disable iqx on windows as WA (#6435)
|
1 năm trước cách đây |
Neo Zhang Jianyu
|
25f4a613c4
[SYCL] fix set main gpu crash (#6339)
|
1 năm trước cách đây |
AidanBeltonS
|
e82f9e2b83
[SYCL] Fix batched impl for NVidia GPU (#6164)
|
1 năm trước cách đây |
compilade
|
557410b8f0
llama : greatly reduce output buffer memory usage (#6122)
|
1 năm trước cách đây |
Meng, Hengyu
|
ddf6568510
[SYCL] offload op (#6217)
|
1 năm trước cách đây |
AidanBeltonS
|
c5b8595e3f
Add nvidia and amd backends (#6157)
|
1 năm trước cách đây |
slaren
|
2bf8d0f7c4
backend : offload large batches to GPU (#6083)
|
1 năm trước cách đây |