gguf-py : add IQ1_M to GGML_QUANT_SIZES (#6761) · c1386c936e - Git

Просмотр исходного кода

gguf-py : add IQ1_M to GGML_QUANT_SIZES (#6761)

pmysl 1 год назад

Родитель

e8d35f47cb

Сommit

c1386c936e

1 измененных файлов с 1 добавлено и 0 удалено

Разделённый вид Показать статистику Diff

						
							+ 1
							
							- 0
						
gguf-py/gguf/constants.py
							 
								Просмотреть файл
							
				@@ -872,6 +872,7 @@ GGML_QUANT_SIZES = {
			
				     GGMLQuantizationType.I32:     (1, 4),
			
				     GGMLQuantizationType.I64:     (1, 8),
			
				     GGMLQuantizationType.F64:     (1, 8),
			
				+    GGMLQuantizationType.IQ1_M:   (256, QK_K // 8 + QK_K // 16  + QK_K // 32),
			
				 }