cturan/llama.cpp

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (#12332)

* Add block interleaving support for Q4_K quantization

* Remove whitespaces and fix CI/CD issues

* Update pointer of bsums from int16_t to const int16_t

* Add vector version of quantize_q8_K_4x8 function

* Update code formatting based on review comments

Srihari-mcw 10 месяцев назад

Родитель

732b5fbf5e

Сommit

3d82dbcbce

1 измененных файлов с 1349 добавлено и 0 удалено

Единый вид Показать статистику Diff

				
					Разница между файлами не показана из-за своего большого размера
					
						+ 1349
						
						- 0
					
ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp

			
				Некоторые файлы не были показаны из-за большого количества измененных файлов

ggml : block interleaving support for Q4_K quantization for x86 AVX2 architecture (#12332)

Разница между файлами не показана из-за своего большого размера + 1349 - 0 ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp

Некоторые файлы не были показаны из-за большого количества измененных файлов

Разница между файлами не показана из-за своего большого размера
+ 1349 - 0
ggml/src/ggml-cpu/ggml-cpu-aarch64.cpp