cturan/llama.cpp

Аутор	SHA1 Порука	Датум
Georgi Gerganov	cf0e3ba150 model : avoid ggml_cont_3d for fused QKV weights (#15662)	пре 4 месеци
Georgi Gerganov	c610b6c11b kv-cache : fix SWA checks + disable cacheless iSWA (#15811)	пре 4 месеци
Daniel Bevenius	fb15d649ed llama : add support for EmbeddingGemma 300m (#15798)	пре 4 месеци
Daniel Bevenius	2c8dac72eb llama : fix incorrect model type for Gemma 270M (#15764)	пре 4 месеци
Johannes Gäßler	e81b8e4b7f llama: use FA + max. GPU layers by default (#15434)	пре 4 месеци
Gabe Goodhart	e8d99dd0b6 nvidia nemotron nano v2 (nemotronh) (#15507)	пре 4 месеци
Sigbjørn Skjæret	84ab83cc0b model : jina-embeddings-v3 support (#13693)	пре 4 месеци
Georgi Gerganov	b730706a49 kv-cache : support layer reuse (#15504)	пре 5 месеци
Piotr Wilkin (ilintar)	b1afcab804 model : add support for Seed-OSS (#15490)	пре 5 месеци
Tarek Dakhran	e288693669 readme : model : mtdm : lfm2 improvements (#15476)	пре 5 месеци
Georgi Gerganov	3f196be84b graph : remove build_attn_with_sinks overload (#15469)	пре 5 месеци
Georgi Gerganov	715a6db02c kv-cache : drop the "unified" prefix (#15467)	пре 5 месеци
Georgi Gerganov	9ef6b0b835 model : add gpt-oss type strings (#15424)	пре 5 месеци
Sigbjørn Skjæret	baa9255a45 llama : merge conts and reshapes and remove unnecessary cont (#15380)	пре 5 месеци
Daniel Bevenius	7a0de96045 llama : add 18-layer model type for Gemma 3-270m (#15319)	пре 5 месеци
Georgi Gerganov	fd1234cb46 llama : add gpt-oss (#15091)	пре 5 месеци
Juk Armstrong	c81de6e107 Fix `glm4moe` bug (#15088)	пре 5 месеци
Sam	ef0144c087 model: support GLM 4.5 family of models (#14939)	пре 5 месеци
compilade	11a3811164 memory : handle kv_unified for hybrid models (#15050)	пре 5 месеци
Douglas Hanley	339bd0268c model : support Qwen3-Embedding (#15023)	пре 5 месеци
stevenkuang	0f5ccd6fd1 model : add hunyuan dense (#14878)	пре 5 месеци
Diego Devesa	d6818d06a6 llama : allow other bufts when overriding to CPU, add --no-repack option (#14990)	пре 5 месеци
Dongliang Wei	c1dacaa99b llama : merge build_moe_ffn_from_probs function into build_moe_ffn (#14968)	пре 5 месеци
Aman Gupta	8a4a856277 Add LLaDA 8b Diffusion model (#14771)	пре 5 месеци
Dongliang Wei	6c6e397aff model : add support for SmallThinker series (#14898)	пре 6 месеци
Gabriel Larson	4762ad7316 model : make rope_yarn_log_mul optional for deepseek2 (#14896)	пре 6 месеци
Shunta Saito	1dc9614e06 llama : fix kq_scale for the attention layers of PLaMo2 (#14892)	пре 6 месеци
yummy	86f5623d90 llama : fix MiniCPM inference after Granite Four changes (#14850)	пре 6 месеци
Molly Sophia	d4d1522b20 llama : add model type detection for rwkv7 7B&14B (#14816)	пре 6 месеци
Georgi Gerganov	eacdeb5bfc model : fix build after merge conflict (#14754)	пре 6 месеци

Новије Старије

Историја ревизија Пронађи

Историја ревизија