Commit History

Autor SHA1 Mensaxe Data
  Georgi Gerganov 9cb317f77e ggml : full ALiBi support (#7192) hai 1 ano
  Georgi Gerganov 9c67c2773d ggml : add Flash Attention (#5021) hai 1 ano
  compilade 557410b8f0 llama : greatly reduce output buffer memory usage (#6122) hai 1 ano
  slaren 2bf8d0f7c4 backend : offload large batches to GPU (#6083) hai 1 ano
  slaren f30ea47a87 llama : add pipeline parallelism support (#6017) hai 1 ano
  Michael Podvitskiy 9fa2627347 ggml : introduce ggml_status (ggml/750) hai 1 ano
  UEXTM.com 5f70671856 Introduce backend GUIDs (ggml/743) hai 1 ano
  Jared Van Bortel fbf1ddec69 Nomic Vulkan backend (#4456) hai 1 ano