Johannes Gäßler 1425f587a8 CUDA: attention sinks for mma FlashAttention (#15157) 5 ヶ月 前
..
cmake 9a96389544 ggml: Skip backend library linking code when GGML_BACKEND_DL=ON (#15094) 5 ヶ月 前
include fd1234cb46 llama : add gpt-oss (#15091) 5 ヶ月 前
src 1425f587a8 CUDA: attention sinks for mma FlashAttention (#15157) 5 ヶ月 前
.gitignore 17eb6aa8a9 vulkan : cmake integration (#8119) 1 年間 前
CMakeLists.txt 7ad67ba9fe HIP: add cmake option to enable compiler output of kernel resource usage metrics (#15103) 5 ヶ月 前