cturan/llama.cpp @ f12ceaca0c7b59def30b7a832a6904df7ed3f4f7

Johannes Gäßler e11bd856d5 CPU/CUDA: Gemma 2 FlashAttention support (#8542)		пре 1 година
..
ggml-alloc.h	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	пре 1 година
ggml-backend.h	a15ef8f8a0 CUDA: fix partial offloading for ne0 % 256 != 0 (#8572)	пре 1 година
ggml-blas.h	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	пре 1 година
ggml-cann.h	1bdd8ae19f [CANN] Add Ascend NPU backend (#6035)	пре 1 година
ggml-cuda.h	e54c35e4fb feat: Support Moore Threads GPU (#8383)	пре 1 година
ggml-kompute.h	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	пре 1 година
ggml-metal.h	85fca8deb6 metal : add abort callback (ggml/905)	пре 1 година
ggml-rpc.h	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	пре 1 година
ggml-sycl.h	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	пре 1 година
ggml-vulkan.h	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	пре 1 година
ggml.h	e11bd856d5 CPU/CUDA: Gemma 2 FlashAttention support (#8542)	пре 1 година