Просмотр исходного кода

CUDA: fix shared memory access condition for mmv (#10740)

Johannes Gäßler 1 год назад
Родитель
Сommit
26a8406ba9
1 измененных файлов с 1 добавлено и 1 удалено
  1. 1 1
      ggml/src/ggml-cuda/mmv.cu

+ 1 - 1
ggml/src/ggml-cuda/mmv.cu

@@ -57,7 +57,7 @@ static __global__ void mul_mat_vec(
     if (block_size > WARP_SIZE) {
         buf_iw[tid/WARP_SIZE] = sumf;
         __syncthreads();
-        if (tid > WARP_SIZE) {
+        if (tid >= WARP_SIZE) {
             return;
         }
         sumf = buf_iw[tid];