Kawrakow
|
6769e944c7
k-quants : support for super-block size of 64 (#2001)
|
2 vuotta sitten |
Aaron Miller
|
0711a5f6dc
metal : add norm, cpy f16->f16, alibi kernels (#1823)
|
2 vuotta sitten |
Kawrakow
|
74a6d922f1
Metal implementation for all k_quants (#1807)
|
2 vuotta sitten |
Kawrakow
|
e9b66ee982
metal : add Q4_1 implementation (#1785)
|
2 vuotta sitten |
Georgi Gerganov
|
b33dee282f
metal : fix build "tanhf" -> "tanh"
|
2 vuotta sitten |
AT
|
92f44ff7f7
metal : add GELU implementation (#1770)
|
2 vuotta sitten |
Kawrakow
|
245fc3c37d
metal : faster q4_0 (#1775)
|
2 vuotta sitten |
Kawrakow
|
72ff5282bf
metal : add Q2_K implementation (#1762)
|
2 vuotta sitten |
Kawrakow
|
0f291e1f65
metal : Q6_K implementation (#1752)
|
2 vuotta sitten |
Kawrakow
|
4161bdc04d
metal : add Q4_K implementation (#1733)
|
2 vuotta sitten |
Georgi Gerganov
|
44f906e853
metal : add f16 support
|
2 vuotta sitten |
Georgi Gerganov
|
ecb217db4f
llama : Metal inference (#1642)
|
2 vuotta sitten |