Просмотр исходного кода

cuda : fix LLAMA_CUDA_F16 build (#6298)

slaren 1 год назад
Родитель
Сommit
2f34b865b6
1 измененных файлов с 1 добавлено и 0 удалено
  1. 1 0
      ggml-cuda/dmmv.cu

+ 1 - 0
ggml-cuda/dmmv.cu

@@ -1,5 +1,6 @@
 #include "dmmv.cuh"
 #include "dequantize.cuh"
+#include "convert.cuh"
 
 // dmmv = dequantize_mul_mat_vec
 #ifndef GGML_CUDA_DMMV_X