Georgi Gerganov
|
841f27abdb
metal : optimize FA kernels (#10171)
|
před 1 rokem |
Zhiyuan Li
|
3bcd40b3c5
Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133)
|
před 1 rokem |
Georgi Gerganov
|
1dc04b2dee
ggml : adjust is_first_call init value (#10193)
|
před 1 rokem |
Diego Devesa
|
a9e8a9a030
ggml : fix arch check in bf16_to_fp32 (#10164)
|
před 1 rokem |
Diego Devesa
|
401558b7ba
ggml : fix q4xx mat mul, increase ggml_aligned_malloc alignment (#10167)
|
před 1 rokem |
Diego Devesa
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
před 1 rokem |
Georgi Gerganov
|
1804adb0cf
ggml : remove ggml_scratch (#10121)
|
před 1 rokem |
Georgi Gerganov
|
f221d56220
ggml : alloc ggml_contexts on the heap (whisper/2525)
|
před 1 rokem |
Diego Devesa
|
c02e5ab2a6
llama : fix buffer checks for mamba and rwk (#10111)
|
před 1 rokem |
Diego Devesa
|
dea5e86051
ggml : check tensor name lengths in gguf files (#10100)
|
před 1 rokem |
Diego Devesa
|
b9e02e8184
ggml : fix memory leaks when loading invalid gguf files (#10094)
|
před 1 rokem |
Diego Devesa
|
c5b0f4b5d9
llama : refactor model loader with backend registry (#10026)
|
před 1 rokem |
Johannes Gäßler
|
c39665f589
CUDA: fix MMQ for non-contiguous src0, add tests (#10021)
|
před 1 rokem |
Daniel Bevenius
|
c19af0acb1
ggml : remove redundant set of contexts used field (ggml/978)
|
před 1 rokem |
Georgi Gerganov
|
f594bc80ba
ggml : add asserts for type conversion in fattn kernels (#9971)
|
před 1 rokem |
Ma Mingfei
|
60ce97c9d8
add amx kernel for gemm (#8998)
|
před 1 rokem |
Gilad S.
|
73afe681aa
fix: use `vm_allocate` to allocate CPU backend buffer on macOS (#9875)
|
před 1 rokem |
Diego Devesa
|
dca1d4b58a
ggml : fix BLAS with unsupported types (#9775)
|
před 1 rokem |
Johannes Gäßler
|
fabdc3bda3
ggml/ex: calculate accuracy in graph, adapt MNIST (ggml/980)
|
před 1 rokem |
Johannes Gäßler
|
eee39bdc96
ggml: refactor cross entropy loss CPU impl. (ggml/976)
|
před 1 rokem |
bandoti
|
d6fe7abf04
ggml: unify backend logging mechanism (#9709)
|
před 1 rokem |
Diego Devesa
|
c83ad6d01e
ggml-backend : add device and backend reg interfaces (#9707)
|
před 1 rokem |
Johannes Gäßler
|
e98c1c188e
test: fix OPT_STEP_ADAMW for test-backend-ops (ggml/974)
|
před 1 rokem |
Borislav Stanimirov
|
6c5322481a
ggml : fix ggml_cast (ggml/973)
|
před 1 rokem |
Johannes Gäßler
|
7254cdf7e8
ggml: fix gradient allocation logic (ggml/966)
|
před 1 rokem |
Georgi Gerganov
|
c919d5db39
ggml : define missing HWCAP flags (#9684)
|
před 1 rokem |
Dan Johansson
|
6a0f779484
ggml : add run-time detection of neon, i8mm and sve (#9331)
|
před 1 rokem |
Georgi Gerganov
|
c038931615
examples : adapt to ggml.h changes (ggml/0)
|
před 1 rokem |
Max Krasnyansky
|
c087b6f11d
threads: fix msvc build without openmp (#9615)
|
před 1 rokem |
Max Krasnyansky
|
f0c7b5edf8
threads: improve ggml_barrier scaling with large number of threads (#9598)
|
před 1 rokem |