Forráskód Böngészése

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (#12332)

* Add block interleaving support for Q4_K quantization

* Remove whitespaces and fix CI/CD issues

* Update pointer of bsums from int16_t to const int16_t

* Add vector version of quantize_q8_K_4x8 function

* Update code formatting based on review comments
Srihari-mcw 10 hónapja
szülő
commit
3d82dbcbce
1 módosított fájl, 1349 hozzáadás és 0 törlés
  1. 1349 0
      ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp

A különbségek nem kerülnek megjelenítésre, a fájl túl nagy
+ 1349 - 0
ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp


Nem az összes módosított fájl került megjelenítésre, mert túl sok fájl változott