cturan/llama.cpp

réplica de https://github.com/cturan/llama.cpp

Autor	SHA1 Mensaxe	Data
Georgi Gerganov	dd665cc9d4 parallel : increase the variability of the prompt lengths (#13927)	hai 7 meses
Georgi Gerganov	518329b2d4 parallel : add option for non-shared and larger prompts (#13598)	hai 8 meses
Richard Kiss	532dd74e38 Fix some documentation typos/grammar mistakes (#4032)	%!s(int64=2) %!d(string=hai) anos
Georgi Gerganov	ec893798b7 llama : custom attention mask + parallel decoding + no context swaps (#3228)	%!s(int64=2) %!d(string=hai) anos