Diego Devesa
|
360d6533db
ggml-backend : add GGML_BACKEND_DEVICE_TYPE_IGPU device type (#15797)
|
4 달 전 |
Diego Devesa
|
9777032dcc
llama : separate compute buffer reserve from fattn check (#15696)
|
4 달 전 |
Jeff Bolz
|
bd9c981d72
vulkan: Add fusion support for RMS_NORM+MUL (#14366)
|
6 달 전 |
David Huang
|
7f323a589f
Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386)
|
8 달 전 |
Johannes Gäßler
|
9070365020
CUDA: fix logic for clearing padding with -ngl 0 (#13320)
|
8 달 전 |
William Tambellini
|
70680c48e5
ggml : upgrade init_tensor API to return a ggml_status (#11854)
|
10 달 전 |
Radoslav Gerganov
|
667d72846c
rpc : early register backend devices (#11262)
|
1 년 전 |
Gilad S.
|
43041d2eb3
ggml: load all backends from a user-provided search path (#10699)
|
1 년 전 |
Diego Devesa
|
5931c1f233
ggml : add support for dynamic loading of backends (#10469)
|
1 년 전 |
Johannes Gäßler
|
8a43e940ab
ggml: new optimization interface (ggml/988)
|
1 년 전 |
Diego Devesa
|
ae8de6d50a
ggml : build backends as libraries (#10256)
|
1 년 전 |
Diego Devesa
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
1 년 전 |
Diego Devesa
|
c5b0f4b5d9
llama : refactor model loader with backend registry (#10026)
|
1 년 전 |
Diego Devesa
|
6374743747
ggml : add backend registry / device interfaces to BLAS backend (#9752)
|
1 년 전 |
Georgi Gerganov
|
d5ac8cf2f2
ggml : add metal backend registry / device (#9713)
|
1 년 전 |
Johannes Gäßler
|
eee39bdc96
ggml: refactor cross entropy loss CPU impl. (ggml/976)
|
1 년 전 |
bandoti
|
d6fe7abf04
ggml: unify backend logging mechanism (#9709)
|
1 년 전 |
Diego Devesa
|
c83ad6d01e
ggml-backend : add device and backend reg interfaces (#9707)
|
1 년 전 |
Johannes Gäßler
|
424c5d00a9
ggml/examples: add backend support for numerical optimization (ggml/949)
|
1 년 전 |
Faisal Zaghloul
|
42c76d1358
Threadpool: take 2 (#8672)
|
1 년 전 |
Georgi Gerganov
|
231cff5f6f
sync : ggml
|
1 년 전 |
Johannes Gäßler
|
a15ef8f8a0
CUDA: fix partial offloading for ne0 % 256 != 0 (#8572)
|
1 년 전 |
Georgi Gerganov
|
f3f65429c4
llama : reorganize source code + improve CMake (#8006)
|
1 년 전 |