Просмотр исходного кода

ggml : remove assert for AArch64 GEMV and GEMM Q4 kernels (#9217)

* ggml : remove assert for AArch64 GEMV and GEMM Q4 kernels

* added fallback mechanism when the offline re-quantized model is not
optimized for the underlying target.

* fix for build errors

* remove prints from the low-level code

* Rebase to the latest upstream
Charles Xu 1 год назад
Родитель
Сommit
1e43630218
1 измененных файлов с 648 добавлено и 670 удалено
  1. 648 670
      ggml/src/ggml-aarch64.c

Разница между файлами не показана из-за своего большого размера
+ 648 - 670
ggml/src/ggml-aarch64.c


Некоторые файлы не были показаны из-за большого количества измененных файлов