Georgi Gerganov
|
d48ccf3ad4
sync : ggml (#6351)
|
1 an în urmă |
slaren
|
2bf8d0f7c4
backend : offload large batches to GPU (#6083)
|
1 an în urmă |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 an în urmă |
Georgi Gerganov
|
a3145bdc30
ggml-alloc : apply ggml/731
|
1 an în urmă |
Georgi Gerganov
|
8f1be0d42f
ggml : add ALiBi support for ggml_soft_max_ext (#5488)
|
1 an în urmă |
Georgi Gerganov
|
3b169441df
sync : ggml (#5452)
|
1 an în urmă |
Paul Tsochantaris
|
ceebbb5b21
ggml alloc: Fix for null dereference on alloc failure (#5200)
|
1 an în urmă |
0cc4m
|
2307523d32
ggml : add Vulkan backend (#2059)
|
1 an în urmă |
slaren
|
15b4538ff2
ggml-alloc : add 10% margin to the buffer sizes (#5149)
|
2 ani în urmă |
slaren
|
1387ea2117
llama : pre-allocate input tensors in a separate buffer (#5100)
|
2 ani în urmă |
slaren
|
e7e4df031b
llama : ggml-backend integration (#4766)
|
2 ani în urmă |
Georgi Gerganov
|
ba66175132
sync : ggml (fix im2col) (#4591)
|
2 ani în urmă |
slaren
|
d232aca5a7
llama : initial ggml-backend integration (#4520)
|
2 ani în urmă |
Georgi Gerganov
|
fe680e3d10
sync : ggml (new ops, tests, backend, etc.) (#4359)
|
2 ani în urmă |
Georgi Gerganov
|
ef47ec18da
ggml : add ggml_soft_max_ext (#4256)
|
2 ani în urmă |
Georgi Gerganov
|
4760e7cc0b
sync : ggml (backend v2) (#3912)
|
2 ani în urmă |
slaren
|
875fb42871
ggml-alloc : fix backend assignments of views (#3982)
|
2 ani în urmă |
slaren
|
95bd60a0a6
ggml-alloc : fix assert in debug builds (#3555)
|
2 ani în urmă |
Georgi Gerganov
|
db3abcc114
sync : ggml (ggml-backend) (#3548)
|
2 ani în urmă |
xaedes
|
0e76a8992c
train : finetune LORA (#2632)
|
2 ani în urmă |
Georgi Gerganov
|
8c00b7a6ff
sync : ggml (Metal F32 support + reduce ggml-alloc size) (#3192)
|
2 ani în urmă |
Przemysław Pawełczyk
|
cb6c44c5e0
build : do not use _GNU_SOURCE gratuitously (#2035)
|
2 ani în urmă |
slaren
|
ebc96086af
ggml-alloc : correctly check mmap return value for errors (#3075)
|
2 ani în urmă |
Cebtenzzre
|
00d62adb79
fix some warnings from gcc and clang-tidy (#3038)
|
2 ani în urmă |
slaren
|
cf9b08485c
ggml-alloc : use virtual memory for measurement (#2973)
|
2 ani în urmă |
Jhen-Jie Hong
|
21f3d1be86
k-quants : fix build on armv7 (android only) (#2920)
|
2 ani în urmă |
slaren
|
06abf8eeba
ggml : add view_src and view_offs to ggml_tensor for views (#2874)
|
2 ani în urmă |
xaedes
|
44c117f41e
train : mem usage and other improvements (#2439)
|
2 ani în urmă |
Georgi Gerganov
|
35feac6560
ggml : sync (mem align to header + conv_transpose_2d fixes + ggml_alloc) (#2852)
|
2 ani în urmă |
Shouzheng Liu
|
b91ad7f461
ggml-alloc : enlarge size of parse_seq (#2776)
|
2 ani în urmă |