cturan/llama.cpp

cermin dari https://github.com/cturan/llama.cpp

Pembuat	SHA1 Pesan	Tanggal
Georgi Gerganov	dd665cc9d4 parallel : increase the variability of the prompt lengths (#13927)	7 bulan lalu
Georgi Gerganov	518329b2d4 parallel : add option for non-shared and larger prompts (#13598)	8 bulan lalu
Richard Kiss	532dd74e38 Fix some documentation typos/grammar mistakes (#4032)	2 tahun lalu
Georgi Gerganov	ec893798b7 llama : custom attention mask + parallel decoding + no context swaps (#3228)	2 tahun lalu