cturan/llama.cpp

Mirror von https://github.com/cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Georgi Gerganov	dd665cc9d4 parallel : increase the variability of the prompt lengths (#13927)	vor 7 Monaten
Georgi Gerganov	518329b2d4 parallel : add option for non-shared and larger prompts (#13598)	vor 8 Monaten
Richard Kiss	532dd74e38 Fix some documentation typos/grammar mistakes (#4032)	vor 2 Jahren
Georgi Gerganov	ec893798b7 llama : custom attention mask + parallel decoding + no context swaps (#3228)	vor 2 Jahren