cturan/llama.cpp

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (#12332)

* Add block interleaving support for Q4_K quantization

* Remove whitespaces and fix CI/CD issues

* Update pointer of bsums from int16_t to const int16_t

* Add vector version of quantize_q8_K_4x8 function

* Update code formatting based on review comments

Srihari-mcw 10 hónapja

szülő

732b5fbf5e

commit

3d82dbcbce

1 módosított fájl, 1349 hozzáadás és 0 törlés

Osztott Nézet Diff Statisztika Mutatása

				
					A különbségek nem kerülnek megjelenítésre, a fájl túl nagy
					
						+ 1349
						
						- 0
					
ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp

			
				Nem az összes módosított fájl került megjelenítésre, mert túl sok fájl változott

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (#12332)

A különbségek nem kerülnek megjelenítésre, a fájl túl nagy + 1349 - 0 ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp

Nem az összes módosított fájl került megjelenítésre, mert túl sok fájl változott

A különbségek nem kerülnek megjelenítésre, a fájl túl nagy
+ 1349 - 0
ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp