slaren
|
2bf8d0f7c4
backend : offload large batches to GPU (#6083)
|
1 год назад |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 год назад |
Michael Podvitskiy
|
9fa2627347
ggml : introduce ggml_status (ggml/750)
|
1 год назад |
UEXTM.com
|
5f70671856
Introduce backend GUIDs (ggml/743)
|
1 год назад |
0cc4m
|
2307523d32
ggml : add Vulkan backend (#2059)
|
2 лет назад |
Justine Tunney
|
a0b3ac8c48
ggml : introduce GGML_CALL function annotation (#4850)
|
2 лет назад |
slaren
|
e7e4df031b
llama : ggml-backend integration (#4766)
|
2 лет назад |
Finn Voorhees
|
1bf681f90e
ggml : add error handling to graph_compute (whisper/1714)
|
2 лет назад |
slaren
|
d232aca5a7
llama : initial ggml-backend integration (#4520)
|
2 лет назад |
Georgi Gerganov
|
fe680e3d10
sync : ggml (new ops, tests, backend, etc.) (#4359)
|
2 лет назад |
Georgi Gerganov
|
4760e7cc0b
sync : ggml (backend v2) (#3912)
|
2 лет назад |