cturan/llama.cpp @ 4ccea213bc629c4eef7b520f7f6c59ce9bbdaca0

Georgi Gerganov 1a1ab7e7a4 cuda : fix HIP and MUSA BF16 (#0)		9 месяцев назад
..
ggml-blas	5931c1f233 ggml : add support for dynamic loading of backends (#10469)	1 год назад
ggml-cann	52b3d71f12 CANN: fix typo in ggml-cann (#12733)	9 месяцев назад
ggml-cpu	ff067dbcb9 ggml : simplify Arm fp16 CPU logic (ggml/1177)	9 месяцев назад
ggml-cuda	1a1ab7e7a4 cuda : fix HIP and MUSA BF16 (#0)	9 месяцев назад
ggml-hip	becade5de7 HIP: implement FlashAttention via rocWMMA for CDNA and RDNA3+ (#12032)	10 месяцев назад
ggml-kompute	ba1cb19cdd llama : add Qwen2VL support + multimodal RoPE (#10361)	1 год назад
ggml-metal	3fd072a540 metal : use F32 prec in FA kernels (#12688)	9 месяцев назад
ggml-musa	b1b132efcb cuda : enable CUDA Graph on CUDA Toolkit < 12.x (#12394)	10 месяцев назад
ggml-opencl	97a20c012b opencl: use `max_alloc_size` in backend ctx instead of querying again (#12705)	9 месяцев назад
ggml-rpc	ab6ab8f809 rpc : send hash when tensor data is above some fixed threshold (#12496)	9 месяцев назад
ggml-sycl	518a01480e sycl: remove redundant memcopy in function ggml_backend_sycl_buffer_set_tensor (#12734)	9 месяцев назад
ggml-vulkan	0c74b04376 vulkan: fix NaN issue in flash attention shader (#12776)	9 месяцев назад
CMakeLists.txt	a69f846351 cmake : fix ccache conflict (#12522)	9 месяцев назад
ggml-alloc.c	70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854)	10 месяцев назад
ggml-backend-impl.h	70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854)	10 месяцев назад
ggml-backend-reg.cpp	ba7654380a ggml-backend : fix backend search path (#12330)	10 месяцев назад
ggml-backend.cpp	5bbe6a9fe9 ggml : portability fixes for VS 2017 (#12150)	10 месяцев назад
ggml-common.h	492d7f1ff7 musa: fix all warnings, re-enable `-DLLAMA_FATAL_WARNINGS=ON` in ci and update doc (#12611)	9 месяцев назад
ggml-impl.h	ff067dbcb9 ggml : simplify Arm fp16 CPU logic (ggml/1177)	9 месяцев назад
ggml-opt.cpp	02e4eaf22f ggml-opt: fix data corruption (ggml/1022)	1 год назад
ggml-quants.c	5bbe6a9fe9 ggml : portability fixes for VS 2017 (#12150)	10 месяцев назад
ggml-quants.h	ae8de6d50a ggml : build backends as libraries (#10256)	1 год назад
ggml-threading.cpp	ae8de6d50a ggml : build backends as libraries (#10256)	1 год назад
ggml-threading.h	cb13ef85a4 remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)	1 год назад
ggml.c	e0e912f49b llama : add option to override model tensor buffers (#11397)	9 месяцев назад
gguf.cpp	a6f32f0b34 Fix clang warning in gguf_check_reserved_keys (#12686)	9 месяцев назад