Jeff Bolz
|
716bd6dec3
vulkan: optimize mul_mat for small values of N (#10991)
|
hace 1 año |
Jeff Bolz
|
a813badbbd
vulkan: im2col and matmul optimizations for stable diffusion (#10942)
|
hace 1 año |
Georgi Gerganov
|
0006f5a74a
ggml : update ggml_backend_cpu_device_supports_op (#10867)
|
hace 1 año |
HimariO
|
ba1cb19cdd
llama : add Qwen2VL support + multimodal RoPE (#10361)
|
hace 1 año |
PAB
|
a8cbab201d
ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037)
|
hace 1 año |
PAB
|
c2082d93a8
ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)
|
hace 1 año |
Jeff Bolz
|
2759916d86
vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (#10642)
|
hace 1 año |
PAB
|
efb6ae9630
feat: add `GGML_UNARY_OP_ARGMAX` Metal kernel (ggml/1019)
|
hace 1 año |
Georgi Gerganov
|
0115df2f65
metal : small-batch mat-mul kernels (#10581)
|
hace 1 año |
Georgi Gerganov
|
f0678c5ff4
ggml : fix I8MM Q4_1 scaling factor conversion (#10562)
|
hace 1 año |
Jeff Bolz
|
904109ed0d
vulkan: fix group_norm (#10496)
|
hace 1 año |
Diego Devesa
|
5931c1f233
ggml : add support for dynamic loading of backends (#10469)
|
hace 1 año |
Diego Devesa
|
a5e47592b6
cuda : optimize argmax (#10441)
|
hace 1 año |
Johannes Gäßler
|
02e4eaf22f
ggml-opt: fix data corruption (ggml/1022)
|
hace 1 año |
Jeff Bolz
|
b3e585988f
vulkan: Optimize soft_max (#10301)
|
hace 1 año |
Johannes Gäßler
|
8a43e940ab
ggml: new optimization interface (ggml/988)
|
hace 1 año |
Jeff Bolz
|
80dd7ff22f
vulkan: Optimize contiguous copies (#10254)
|
hace 1 año |
Georgi Gerganov
|
841f27abdb
metal : optimize FA kernels (#10171)
|
hace 1 año |
Zhiyuan Li
|
3bcd40b3c5
Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133)
|
hace 1 año |
Georgi Gerganov
|
5c333e0140
metal : add BF16 support (#8439)
|
hace 1 año |
Diego Devesa
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
hace 1 año |
Johannes Gäßler
|
c39665f589
CUDA: fix MMQ for non-contiguous src0, add tests (#10021)
|
hace 1 año |
Johannes Gäßler
|
80273a306d
CUDA: fix 1D im2col, add tests (ggml/993)
|
hace 1 año |
Jun Hee Yoo
|
4c9388fb96
metal : add POOL2D and fix IM2COL (#9943)
|
hace 1 año |
Diego Devesa
|
dca1d4b58a
ggml : fix BLAS with unsupported types (#9775)
|
hace 1 año |
Diego Devesa
|
6374743747
ggml : add backend registry / device interfaces to BLAS backend (#9752)
|
hace 1 año |
Johannes Gäßler
|
fabdc3bda3
ggml/ex: calculate accuracy in graph, adapt MNIST (ggml/980)
|
hace 1 año |
Diego Devesa
|
c83ad6d01e
ggml-backend : add device and backend reg interfaces (#9707)
|
hace 1 año |
Johannes Gäßler
|
e98c1c188e
test: fix OPT_STEP_ADAMW for test-backend-ops (ggml/974)
|
hace 1 año |
Johannes Gäßler
|
7254cdf7e8
ggml: fix gradient allocation logic (ggml/966)
|
hace 1 año |