| .. |
|
ggml-blas
|
5931c1f233
ggml : add support for dynamic loading of backends (#10469)
|
1 год назад |
|
ggml-cann
|
52b3d71f12
CANN: fix typo in ggml-cann (#12733)
|
9 месяцев назад |
|
ggml-cpu
|
ff067dbcb9
ggml : simplify Arm fp16 CPU logic (ggml/1177)
|
9 месяцев назад |
|
ggml-cuda
|
1a1ab7e7a4
cuda : fix HIP and MUSA BF16 (#0)
|
9 месяцев назад |
|
ggml-hip
|
becade5de7
HIP: implement FlashAttention via rocWMMA for CDNA and RDNA3+ (#12032)
|
10 месяцев назад |
|
ggml-kompute
|
ba1cb19cdd
llama : add Qwen2VL support + multimodal RoPE (#10361)
|
1 год назад |
|
ggml-metal
|
3fd072a540
metal : use F32 prec in FA kernels (#12688)
|
9 месяцев назад |
|
ggml-musa
|
b1b132efcb
cuda : enable CUDA Graph on CUDA Toolkit < 12.x (#12394)
|
10 месяцев назад |
|
ggml-opencl
|
97a20c012b
opencl: use `max_alloc_size` in backend ctx instead of querying again (#12705)
|
9 месяцев назад |
|
ggml-rpc
|
ab6ab8f809
rpc : send hash when tensor data is above some fixed threshold (#12496)
|
9 месяцев назад |
|
ggml-sycl
|
518a01480e
sycl: remove redundant memcopy in function ggml_backend_sycl_buffer_set_tensor (#12734)
|
9 месяцев назад |
|
ggml-vulkan
|
0c74b04376
vulkan: fix NaN issue in flash attention shader (#12776)
|
9 месяцев назад |
|
CMakeLists.txt
|
a69f846351
cmake : fix ccache conflict (#12522)
|
9 месяцев назад |
|
ggml-alloc.c
|
70680c48e5
ggml : upgrade init_tensor API to return a ggml_status (#11854)
|
10 месяцев назад |
|
ggml-backend-impl.h
|
70680c48e5
ggml : upgrade init_tensor API to return a ggml_status (#11854)
|
10 месяцев назад |
|
ggml-backend-reg.cpp
|
ba7654380a
ggml-backend : fix backend search path (#12330)
|
10 месяцев назад |
|
ggml-backend.cpp
|
5bbe6a9fe9
ggml : portability fixes for VS 2017 (#12150)
|
10 месяцев назад |
|
ggml-common.h
|
492d7f1ff7
musa: fix all warnings, re-enable `-DLLAMA_FATAL_WARNINGS=ON` in ci and update doc (#12611)
|
9 месяцев назад |
|
ggml-impl.h
|
ff067dbcb9
ggml : simplify Arm fp16 CPU logic (ggml/1177)
|
9 месяцев назад |
|
ggml-opt.cpp
|
02e4eaf22f
ggml-opt: fix data corruption (ggml/1022)
|
1 год назад |
|
ggml-quants.c
|
5bbe6a9fe9
ggml : portability fixes for VS 2017 (#12150)
|
10 месяцев назад |
|
ggml-quants.h
|
ae8de6d50a
ggml : build backends as libraries (#10256)
|
1 год назад |
|
ggml-threading.cpp
|
ae8de6d50a
ggml : build backends as libraries (#10256)
|
1 год назад |
|
ggml-threading.h
|
cb13ef85a4
remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)
|
1 год назад |
|
ggml.c
|
e0e912f49b
llama : add option to override model tensor buffers (#11397)
|
9 месяцев назад |
|
gguf.cpp
|
a6f32f0b34
Fix clang warning in gguf_check_reserved_keys (#12686)
|
9 месяцев назад |