Georgi Gerganov
|
365a3e8c31
ggml : add ggml_build_forward_select (#18550)
|
2 недель назад |
Boian Berberov
|
94de74e7b1
cmake: Added more x86_64 CPU backends when building with `GGML_CPU_ALL_VARIANTS=On` (#18186)
|
1 месяц назад |
Piotr Wilkin (ilintar)
|
389ac78b26
ggml : add ops SOFTPLUS, EXPM1, TRI, SOLVE_TRI, CUMSUM (#17063)
|
2 месяцев назад |
Jeff Bolz
|
10fcc41290
vulkan: Update topk_moe fusion to handle gpt's late softmax (#16656)
|
3 месяцев назад |
Aman Gupta
|
4926419c4d
ggml: add ggml_can_fuse_subgraph (#16662)
|
3 месяцев назад |
Jeff Bolz
|
e56abd2098
vulkan: Implement topk_moe fused shader, ported from CUDA (#16641)
|
3 месяцев назад |
Piotr Wilkin (ilintar)
|
34fcc5a4ac
model : Apertus model implementation (#15852)
|
4 месяцев назад |
Acly
|
f2a789e334
ggml : split graph allocations according to backend max buffer size (#15815)
|
4 месяцев назад |
Georgi Gerganov
|
4f324a556c
ggml : extend ggml_can_fuse to work with non-sequential nodes (#16123)
|
4 месяцев назад |
Georgi Gerganov
|
a71ae3ba7a
ggml : add ggml_op_is_empty (#16122)
|
4 месяцев назад |
Georgi Gerganov
|
fd1234cb46
llama : add gpt-oss (#15091)
|
6 месяцев назад |
Georgi Gerganov
|
bf9087f59a
metal : fuse add, mul + add tests (#14596)
|
6 месяцев назад |
Jeff Bolz
|
bd9c981d72
vulkan: Add fusion support for RMS_NORM+MUL (#14366)
|
7 месяцев назад |
Aaron Teo
|
60ef23d6c1
ggml-cpu: enable IBM NNPA Vector Intrinsics (#14317)
|
7 месяцев назад |
Daniel Tang
|
fedf034a98
ggml : Print backtrace on uncaught C++ exceptions (ggml/1232)
|
8 месяцев назад |
xctan
|
05f6ac6283
ggml : riscv: add xtheadvector support (#13720)
|
8 месяцев назад |
cmdr2
|
cb79c2e7fa
ggml: don't include arm_neon.h when using CUDA 12 with ARM Neon (ggml/1187)
|
10 месяцев назад |
Diego Devesa
|
459895c326
ggml : add more generic custom op, remove deprecated custom ops (ggml/1183)
|
10 месяцев назад |
Piotr Kubaj
|
2391506ace
ggml-impl.h: fix build on POWER9 (#12855)
|
10 месяцев назад |
Georgi Gerganov
|
ff067dbcb9
ggml : simplify Arm fp16 CPU logic (ggml/1177)
|
10 месяцев назад |
xctan
|
24feaec057
ggml : riscv: add 128-bit RVV support (#12530)
|
10 месяцев назад |
Bodhi
|
0b3863ff95
MUSA: support ARM64 and enable dp4a .etc (#11843)
|
11 месяцев назад |
Johannes Gäßler
|
53ff6b9b9f
GGUF: C++ refactor, backend support, misc fixes (#11030)
|
1 год назад |
Johannes Gäßler
|
081b29bd2a
tests: add tests for GGUF (#10830)
|
1 год назад |
Diego Devesa
|
cb13ef85a4
remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)
|
1 год назад |
Frankie Robertson
|
cd2f37b304
Avoid using __fp16 on ARM with old nvcc (#10616)
|
1 год назад |
Diego Devesa
|
7cc2d2c889
ggml : move AMX to the CPU backend (#10570)
|
1 год назад |
Frankie Robertson
|
9150f8fef9
Do not include arm_neon.h when compiling CUDA code (ggml/1028)
|
1 год назад |
Johannes Gäßler
|
02e4eaf22f
ggml-opt: fix data corruption (ggml/1022)
|
1 год назад |
Johannes Gäßler
|
8a43e940ab
ggml: new optimization interface (ggml/988)
|
1 год назад |