cturan/llama.cpp

Autor	SHA1 Mensaje	Fecha
Georgi Gerganov	fd1234cb46 llama : add gpt-oss (#15091)	hace 5 meses
Juk Armstrong	c81de6e107 Fix `glm4moe` bug (#15088)	hace 5 meses
Sam	ef0144c087 model: support GLM 4.5 family of models (#14939)	hace 5 meses
compilade	11a3811164 memory : handle kv_unified for hybrid models (#15050)	hace 5 meses
Douglas Hanley	339bd0268c model : support Qwen3-Embedding (#15023)	hace 5 meses
stevenkuang	0f5ccd6fd1 model : add hunyuan dense (#14878)	hace 5 meses
Diego Devesa	d6818d06a6 llama : allow other bufts when overriding to CPU, add --no-repack option (#14990)	hace 5 meses
Dongliang Wei	c1dacaa99b llama : merge build_moe_ffn_from_probs function into build_moe_ffn (#14968)	hace 5 meses
Aman Gupta	8a4a856277 Add LLaDA 8b Diffusion model (#14771)	hace 5 meses
Dongliang Wei	6c6e397aff model : add support for SmallThinker series (#14898)	hace 5 meses
Gabriel Larson	4762ad7316 model : make rope_yarn_log_mul optional for deepseek2 (#14896)	hace 5 meses
Shunta Saito	1dc9614e06 llama : fix kq_scale for the attention layers of PLaMo2 (#14892)	hace 5 meses
yummy	86f5623d90 llama : fix MiniCPM inference after Granite Four changes (#14850)	hace 5 meses
Molly Sophia	d4d1522b20 llama : add model type detection for rwkv7 7B&14B (#14816)	hace 6 meses
Georgi Gerganov	eacdeb5bfc model : fix build after merge conflict (#14754)	hace 6 meses
lgai-exaone	e0cb5c5cb8 model : add EXAONE 4.0 support (#14630)	hace 6 meses
Georgi Gerganov	8f974bc1e9 graph : refactor context to not pass gf explicitly (#14629)	hace 6 meses
Piotr Wilkin (ilintar)	cb887f1bc1 model: add Ernie 4.5 MoE support (#14658)	hace 6 meses
Georgi Gerganov	01612b7409 llama : reuse compute graphs (#14482)	hace 6 meses
Tarek Dakhran	086cf81e88 llama : fix parallel processing for lfm2 (#14705)	hace 6 meses
tempstudio	b0f0ecc3dc model : support output bias for qwen2 (#14711)	hace 6 meses
Georgi Gerganov	225e7a1438 llama : add high-throughput mode (#14363)	hace 6 meses
Aman Gupta	ab14019821 Support diffusion models: Add Dream 7B (#14644)	hace 6 meses
Shunta Saito	e4841d24d3 llama : fix parallel processing for plamo2 (#14716)	hace 6 meses
Shunta Saito	68e37a61a7 model : add PLaMo-2 support (#14560)	hace 6 meses
Tarek Dakhran	f5e96b368f model : support LiquidAI LFM2 hybrid family (#14620)	hace 6 meses
Gabe Goodhart	0aedae00e6 model : Granite Four (#13550)	hace 6 meses
Ryan Mangeno	4bb625b713 Smoldocling support (#14597)	hace 6 meses
Xuan-Son Nguyen	cb9178f885 llama : remove llm_graph_input_one (#14603)	hace 6 meses
compilade	4a5686da22 llama : support Jamba hybrid Transformer-Mamba models (#7531)	hace 6 meses

Posterior Anterior

Historial de Commits Buscar

Historial de Commits