cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Anas Ahouzi	6aade19ee7 Add StableLM2 pre-tokenizer (#7349)	vor 1 Jahr
Radoslav Gerganov	5e31828d3e ggml : add RPC backend (#6829)	vor 1 Jahr
Ren Xuancheng	229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114)	vor 1 Jahr
DAN™	4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132)	vor 1 Jahr
Justine Tunney	3855416027 ggml : introduce bfloat16 support (#6412)	vor 1 Jahr
nopperl	b6aa670203 Fix OLMo HF to GGUF conversion (#6910)	vor 1 Jahr
DAN™	889bdd7686 command-r : add BPE pre-tokenization (#7063)	vor 1 Jahr
Georgi Gerganov	92139b90af tests : add test-tokenizer-0.sh + fix some tokenizers (#7036)	vor 1 Jahr
Daniel Bevenius	433def286e llama : rename ctx to user_data in progress_callback (#7045)	vor 1 Jahr
Georgi Gerganov	9c67c2773d ggml : add Flash Attention (#5021)	vor 1 Jahr
Georgi Gerganov	f4ab2a4147 llama : fix BPE pre-tokenization (#6920)	vor 1 Jahr
Pierrick Hymbert	0c4d489e29 quantize: add imatrix and dataset metadata in GGUF (#6658)	vor 1 Jahr
slaren	017e6999b5 add basic tensor data validation function (#6884)	vor 1 Jahr
jiez	1966eb2615 quantize : add '--keep-split' to quantize model into shards (#6688)	vor 1 Jahr
Douglas Hanley	b4e4b8a935 llama : add llama_get_pooling_type function (#6862)	vor 1 Jahr
Johannes Gäßler	28103f4832 Server: fix seed for multiple slots (#6835)	vor 1 Jahr
Georgi Gerganov	40f74e4d73 llama : add option to render special/control tokens (#6807)	vor 1 Jahr
Pedro Cuenca	b97bc3966e llama : support Llama 3 HF conversion (#6745)	vor 1 Jahr
Olivier Chafik	cbaadc9294 grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609)	vor 1 Jahr
Jared Van Bortel	1b67731e18 BERT tokenizer fixes (#6498)	vor 1 Jahr
Rick G	e3c337d87c llama : support negative ith in llama_get_ API (#6519)	vor 1 Jahr
Jan Boon	beea6e1b16 llama : save and restore kv cache for single seq id (#6341)	vor 1 Jahr
Clint Herron	9b84ae1806 examples : add GBNF validator program (#5948)	vor 1 Jahr
Jared Van Bortel	be55134a53 convert : refactor vocab selection logic (#6355)	vor 1 Jahr
compilade	557410b8f0 llama : greatly reduce output buffer memory usage (#6122)	vor 1 Jahr
Kawrakow	55c1b2a3bb IQ1_M: 1.75 bpw quantization (#6302)	vor 1 Jahr
Kawrakow	d25b1c31b0 quantize : be able to override metadata by key (#6321)	vor 1 Jahr
Kawrakow	1d0331c12a quantize: options for output and token embedding tensors qtype (#6239)	vor 1 Jahr
Pierrick Hymbert	dba1af6129 llama_model_loader: support multiple split/shard GGUFs (#6187)	vor 1 Jahr
Theia Vogel	877b4d0c62 llama : add support for control vectors (#5970)	vor 1 Jahr

Neuer Älter

Commit Verlauf Finden

Commit Verlauf