| .. |
|
ggml-amx
|
60ce97c9d8
add amx kernel for gemm (#8998)
|
před 1 rokem |
|
ggml-cann
|
904837e0cb
cann: fix crash when llama-bench is running on multiple cann devices (#9627)
|
před 1 rokem |
|
ggml-cuda
|
5b359bb1e3
ggml: fix zero division in ‘dne’ calculation in CUDA COUNT_EQUAL operator when ‘ne’ is small (#10213)
|
před 1 rokem |
|
ggml-sycl
|
3bcd40b3c5
Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133)
|
před 1 rokem |
|
kompute @ 4565194ed7
|
f3f65429c4
llama : reorganize source code + improve CMake (#8006)
|
před 1 rokem |
|
kompute-shaders
|
1329c0a75e
kompute: add mul_mat_q4_k shader (#10097)
|
před 1 rokem |
|
llamafile
|
e89213492d
ggml : optimize llamafile cpu matrix multiplication for ppc64le (#10156)
|
před 1 rokem |
|
vulkan-shaders
|
80dd7ff22f
vulkan: Optimize contiguous copies (#10254)
|
před 1 rokem |
|
CMakeLists.txt
|
e89213492d
ggml : optimize llamafile cpu matrix multiplication for ppc64le (#10156)
|
před 1 rokem |
|
ggml-aarch64.c
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
před 1 rokem |
|
ggml-aarch64.h
|
370b1f7e7a
ggml : minor naming changes (#8433)
|
před 1 rokem |
|
ggml-alloc.c
|
cd60b88bf7
ggml-alloc : remove buffer_id from leaf_alloc (ggml/987)
|
před 1 rokem |
|
ggml-amx.cpp
|
c5b0f4b5d9
llama : refactor model loader with backend registry (#10026)
|
před 1 rokem |
|
ggml-backend-impl.h
|
c5b0f4b5d9
llama : refactor model loader with backend registry (#10026)
|
před 1 rokem |
|
ggml-backend.cpp
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
před 1 rokem |
|
ggml-blas.cpp
|
c5b0f4b5d9
llama : refactor model loader with backend registry (#10026)
|
před 1 rokem |
|
ggml-cann.cpp
|
329ed914c9
CANN: adjust backend registry refactor. (#10158)
|
před 1 rokem |
|
ggml-common.h
|
9bc6db28d0
ggml-quants : ternary packing for TriLMs and BitNet b1.58 (#8151)
|
před 1 rokem |
|
ggml-cpu-impl.h
|
23e0d70bac
ggml : move common CPU backend impl to new header (#9509)
|
před 1 rokem |
|
ggml-cpu.c
|
2319126a70
fix q4_0_8_8 format for corrupted tokens issue (#10198)
|
před 1 rokem |
|
ggml-cuda.cu
|
841f27abdb
metal : optimize FA kernels (#10171)
|
před 1 rokem |
|
ggml-impl.h
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
před 1 rokem |
|
ggml-kompute.cpp
|
1329c0a75e
kompute: add mul_mat_q4_k shader (#10097)
|
před 1 rokem |
|
ggml-metal.m
|
39a334a9aa
metal : fix build and some more comments (#10229)
|
před 1 rokem |
|
ggml-metal.metal
|
b0cefea58a
metal : more precise Q*K in FA vec kernel (#10247)
|
před 1 rokem |
|
ggml-quants.c
|
3407364776
Q6_K AVX improvements (#10118)
|
před 1 rokem |
|
ggml-quants.h
|
6a0f779484
ggml : add run-time detection of neon, i8mm and sve (#9331)
|
před 1 rokem |
|
ggml-rpc.cpp
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
před 1 rokem |
|
ggml-sycl.cpp
|
3bcd40b3c5
Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133)
|
před 1 rokem |
|
ggml-vulkan.cpp
|
80dd7ff22f
vulkan: Optimize contiguous copies (#10254)
|
před 1 rokem |
|
ggml.c
|
841f27abdb
metal : optimize FA kernels (#10171)
|
před 1 rokem |