cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Xuan-Son Nguyen	cb9178f885 llama : remove llm_graph_input_one (#14603)	vor 6 Monaten
compilade	4a5686da22 llama : support Jamba hybrid Transformer-Mamba models (#7531)	vor 6 Monaten
Georgi Gerganov	7b50f7c025 graph : prepare for 4D mask (#14515)	vor 7 Monaten
Georgi Gerganov	a70c8a0c4b kv-cache : use ggml_set_rows (#14285)	vor 7 Monaten
compilade	5d46babdc2 llama : initial Mamba-2 support (#9126)	vor 7 Monaten
Sigbjørn Skjæret	a0535ffa0d ggml : implement REGLU/GEGLU/SWIGLU ops (#14158)	vor 7 Monaten
Georgi Gerganov	72babea5de graph : make llm_graph_context destructor virtual (#14410)	vor 7 Monaten
Xuan-Son Nguyen	8846aace49 model : gemma3n text-only (#14400)	vor 7 Monaten
Georgi Gerganov	692e3cdd0a memory : rename interface to llama_memory_context_i (#14296)	vor 7 Monaten
Georgi Gerganov	4c9fdfbe15 ubatch : new splitting logic (#14217)	vor 7 Monaten
Gabe Goodhart	edc4a29eff memory : Hybrid recurrent cache (#13979)	vor 7 Monaten
Georgi Gerganov	60c666347b batch : rework llama_batch_allocr (#14153)	vor 7 Monaten
compilade	dad5c44398 kv-cache : avoid modifying recurrent cells when setting inputs (#13834)	vor 7 Monaten
Đinh Trọng Huy	91a8ee6a6f add geglu activation function (#14074)	vor 7 Monaten
Georgi Gerganov	7f37b6cf1e memory : migrate from llama_kv_cache to more generic llama_memory (#14006)	vor 7 Monaten
Georgi Gerganov	12d0188c0d kv-cache : refactor + add llama_memory_state_i (#13746)	vor 8 Monaten
Georgi Gerganov	e298d2fbd0 kv-cache : add SWA support (#13194)	vor 8 Monaten
Johannes Gäßler	10d2af0eaa llama/ggml: add LLM training support (#10544)	vor 8 Monaten
Georgi Gerganov	c642bc014c kv-cache : separate recurrent vs non-recurrent impl (#12799)	vor 9 Monaten
Xuan-Son Nguyen	d2b2031e5f llama : (mrope) allow using normal 1D position for text token (#13138)	vor 9 Monaten
Juk Armstrong	daa422881a llama : DeepSeek V2/V3 MLA implementation (#12801)	vor 9 Monaten
Xuan-Son Nguyen	1466621e73 llama : Support llama 4 text-only (#12791)	vor 9 Monaten
Georgi Gerganov	75422e8bc4 graph : normalize Q, K, V shapes + sync cross attention (#12449)	vor 10 Monaten
Georgi Gerganov	c522ce4143 graph : simplify attn input build for unified KV cache (#12381)	vor 10 Monaten
Georgi Gerganov	e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181)	vor 10 Monaten

Commit Verlauf Finden

Commit Verlauf