Просмотр исходного кода

k-quants : fix zero-weight guard in Q6_K (ref #3040)

Georgi Gerganov 2 лет назад
Родитель
Сommit
178b1850eb
1 измененных файлов с 1 добавлено и 0 удалено
  1. 1 0
      k_quants.c

+ 1 - 0
k_quants.c

@@ -1089,6 +1089,7 @@ void quantize_row_q6_K_reference(const float * restrict x, block_q6_K * restrict
         if (!max_abs_scale) {
             memset(&y[i], 0, sizeof(block_q6_K));
             y[i].d = ggml_fp32_to_fp16(0.f);
+            x += QK_K;
             continue;
         }