Jeff Bolz
|
d413dca003
tests: large sizes for get_rows (#15687)
|
4 месяцев назад |
Jeff Bolz
|
3976dfbe00
vulkan: support im2col_3d (#15795)
|
4 месяцев назад |
Jeff Bolz
|
c97b5e5854
vulkan: Support pad_ext (#15794)
|
4 месяцев назад |
Daniel Bevenius
|
3a550b5ca4
tests : add --list-ops and --show-coverage options (#15745)
|
4 месяцев назад |
leejet
|
0a1b3982cd
ggml: add ops for WAN video model (cuda && cpu) (#15669)
|
4 месяцев назад |
rmatif
|
86076f92de
OpenCL: add fused group_norm/norm, mul, add (#15314)
|
4 месяцев назад |
Eve
|
44b1efa41a
tests: add performance test for mul mat id (#15543)
|
4 месяцев назад |
Georgi Gerganov
|
1d8d83deaa
metal : improve `MUL_MAT_ID` (#15541)
|
4 месяцев назад |
Jeff Bolz
|
34bdbbd7c2
vulkan: Remove splitting for mul_mat_id (#15568)
|
4 месяцев назад |
Jeff Bolz
|
886b97a5d6
tests: Generate unique input values for count_equal (#15487)
|
4 месяцев назад |
Jeff Bolz
|
c9a24fb932
vulkan: Support FA with any multiple of 8 head sizes (#15537)
|
4 месяцев назад |
Jeff Bolz
|
611f419cff
vulkan: optimize rms_norm, and allow the work to spread across multiple SMs (#15281)
|
4 месяцев назад |
Acly
|
0a9b43e507
vulkan : support ggml_mean (#15393)
|
4 месяцев назад |
rmatif
|
92f7f0a53c
ggml: add `conv3d` op (#15182)
|
4 месяцев назад |
Jeff Bolz
|
96452a3fa4
vulkan: Reuse conversion results in prealloc_y (#15410)
|
4 месяцев назад |
Jeff Bolz
|
de5627910d
vulkan: Optimize argsort (#15354)
|
5 месяцев назад |
Jeff Bolz
|
1fe00296f5
vulkan: fuse adds (#15252)
|
5 месяцев назад |
Jeff Bolz
|
2e2b22ba66
vulkan: Add missing bounds checking to scalar/coopmat1 mul_mat_id (#15334)
|
5 месяцев назад |
Georgi Gerganov
|
5edf1592fd
vulkan : fix out-of-bounds access in argmax kernel (#15342)
|
5 месяцев назад |
Jonathan Graehl
|
5cdb27e091
finetune: SGD optimizer, more CLI args (#13873)
|
5 месяцев назад |
Oliver Simons
|
6028bf7435
CUDA: Optimize `reduce_rows_f32` kernel, leading up to 25x perf improvement on kernel-level and 10% perf increase for Gemma3n (#15132)
|
5 месяцев назад |
Georgi Gerganov
|
fd1234cb46
llama : add gpt-oss (#15091)
|
5 месяцев назад |
Jeff Bolz
|
ec0b18802c
vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (#15015)
|
5 месяцев назад |
Sigbjørn Skjæret
|
138b288b59
cuda : add softcap fusion (#14907)
|
5 месяцев назад |
Leonard Mosescu
|
bda62193b2
test-backend-ops : extend test case filtering (#14865)
|
5 месяцев назад |
Erik Scholz
|
89d1029559
vulkan : add fp16 support for the conv_2d kernel (#14872)
|
5 месяцев назад |
Aman Gupta
|
446595b9b3
Docs: add instructions for adding backends (#14889)
|
5 месяцев назад |
Georgi Gerganov
|
18f3b5ff9e
tests : add non-cont K,V FA tests
|
6 месяцев назад |
Aman Gupta
|
8c988fa41d
CUDA: add fused rms norm (#14800)
|
5 месяцев назад |
Jeff Bolz
|
c2e058f1b4
vulkan/cuda: Fix im2col when KW!=KH (#14789)
|
6 месяцев назад |