cturan/llama.cpp

mirrorاز https://github.com/cturan/llama.cpp

نویسنده	SHA1 پیام	تاریخ
Srinivas Billa	9dda13e5e1 readme : server compile flag (#1874)	2 سال پیش
Johannes Gäßler	254a7a7a5f CUDA full GPU acceleration, KV cache in VRAM (#1827)	2 سال پیش
Johannes Gäßler	17366df842 Multi GPU support, CUDA refactor, CUDA scratch buffer (#1703)	2 سال پیش
Kerfuffle	1b78ed2081 Only show -ngl option when relevant + other doc/arg handling updates (#1625)	2 سال پیش
Steward Garcia	7e4ea5beff examples : add server example with REST API (#1443)	2 سال پیش