compilade
|
557410b8f0
llama : greatly reduce output buffer memory usage (#6122)
|
1 năm trước cách đây |
slaren
|
2bf8d0f7c4
backend : offload large batches to GPU (#6083)
|
1 năm trước cách đây |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 năm trước cách đây |
Michael Podvitskiy
|
9fa2627347
ggml : introduce ggml_status (ggml/750)
|
1 năm trước cách đây |
UEXTM.com
|
5f70671856
Introduce backend GUIDs (ggml/743)
|
1 năm trước cách đây |
Jared Van Bortel
|
fbf1ddec69
Nomic Vulkan backend (#4456)
|
2 năm trước cách đây |