liuwei-git
|
201cc11afa
llama : add phi3 128K model support (#7225)
|
1 jaar geleden |
Georgi Gerganov
|
9cb317f77e
ggml : full ALiBi support (#7192)
|
1 jaar geleden |
Georgi Gerganov
|
9c67c2773d
ggml : add Flash Attention (#5021)
|
1 jaar geleden |
compilade
|
557410b8f0
llama : greatly reduce output buffer memory usage (#6122)
|
1 jaar geleden |
slaren
|
2bf8d0f7c4
backend : offload large batches to GPU (#6083)
|
1 jaar geleden |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 jaar geleden |
Michael Podvitskiy
|
9fa2627347
ggml : introduce ggml_status (ggml/750)
|
1 jaar geleden |
UEXTM.com
|
5f70671856
Introduce backend GUIDs (ggml/743)
|
1 jaar geleden |
Jared Van Bortel
|
fbf1ddec69
Nomic Vulkan backend (#4456)
|
1 jaar geleden |