Просмотр исходного кода

CUDA: faster k-quant mul_mat_q kernels (#2525)

Johannes Gäßler 2 лет назад
Родитель
Сommit
f514d1b306
1 измененных файлов с 455 добавлено и 303 удалено
  1. 455 303
      ggml-cuda.cu

Разница между файлами не показана из-за своего большого размера
+ 455 - 303
ggml-cuda.cu


Некоторые файлы не были показаны из-за большого количества измененных файлов