Commit History

Auteur SHA1 Bericht Datum
  Johannes Gäßler 7d1a378b8f CUDA: refactor mmq, dmmv, mmvq (#7716) 1 jaar geleden
  Johannes Gäßler 9b596417af CUDA: quantized KV support for FA vec (#7527) 1 jaar geleden
  Georgi Gerganov e84b71c2c6 ggml : drop support for QK_K=64 (#7473) 1 jaar geleden
  Kawrakow 55c1b2a3bb IQ1_M: 1.75 bpw quantization (#6302) 1 jaar geleden
  slaren ae1f211ce2 cuda : refactor into multiple files (#6269) 1 jaar geleden