cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Max Krasnyansky	63d2fc46e1 Add experimental ggml-hexagon backend for the Hexagon NPU (#16547)	2 месяцев назад
Sigbjørn Skjæret	84bf3c6778 model : add BailingMoeV2 support (#16063)	3 месяцев назад
Giuseppe Scrivano	0398752dd4 model : add Granite Hybrid types (#16635)	3 месяцев назад
Johannes Gäßler	66b0dbcb2d llama-model: fix insonsistent ctxs <-> bufs order (#16581)	3 месяцев назад
Xuan-Son Nguyen	3e3cb19f64 llama-quant: add support for mmproj (#16592)	3 месяцев назад
Georgi Gerganov	e38b7c6e9e graph : support cacheless embeddings with FA and iSWA (#16528)	3 месяцев назад
Georgi Gerganov	a3cb04744f metal : fix mul-mm condition + fix mul-mv permuted kernels (#16494)	3 месяцев назад
Saba Fallah	e08db42595 model: EmbeddingGemma Adding Support for SentenceTransformers Dense Modules (#16367)	3 месяцев назад
Tarek Dakhran	aeaf8a36f0 llama : support LiquidAI LFM2-MoE hybrid model (#16464)	3 месяцев назад
Gadflyii	3df2244df4 llama : add --no-host to disable host buffers (#16310)	3 месяцев назад
ddh0	f6dcda3900 server : context checkpointing for hybrid and recurrent models (#16382)	3 месяцев назад
Sigbjørn Skjæret	946f71ed9a llama : fix shapes for bert/mpt q/k norm (#16409)	3 месяцев назад
Piotr Wilkin (ilintar)	34fcc5a4ac model : Apertus model implementation (#15852)	3 месяцев назад
Shunta Saito	ded67b9444 llama : parameter conversion and loading fixes for PLaMo2 variants (#16075)	3 месяцев назад
Bartowski	e74c92e842 model : support GLM 4.6 (make a few NextN/MTP tensors not required) (#16359)	3 месяцев назад
anavp-nvidia	a014310374 cuda : Enable CUDA Graph usage for Nemotron Nano v2 (NemotronH) (#16328)	3 месяцев назад
Vinkal	72b24d96c6 model : make minicpm embedding_scale, residual_scale and logit_scale optional with legacy defaults (#16273)	3 месяцев назад
Sigbjørn Skjæret	835b2b915c model : add GroveMoE support (#15510)	3 месяцев назад
Douglas Hanley	b5bd037832 llama : add support for qwen3 reranker (#15824)	3 месяцев назад
Johannes Gäßler	e789095502 llama: print memory breakdown on exit (#15860)	3 месяцев назад
Tarek Dakhran	3a59971967 model : add label for LiquidAI LFM2-2.6B model (#16204)	3 месяцев назад
Xuan-Son Nguyen	8f8f2274ee convert : add Llama4ForCausalLM (#16042)	4 месяцев назад
Shane A	85286f3548 model : add OLMo3 support (#16015)	4 месяцев назад
Aman Gupta	6d758839ff Add LLaDA-7b-MoE diffusion model (#16003)	4 месяцев назад
Sigbjørn Skjæret	b8e09f08b9 model : add grok-2 support (#15539)	4 месяцев назад
Jie Fu (傅杰)	4f658855fa llama : support T5 models with unequal number of encoder-decoder layers (#15909)	4 месяцев назад
Georgi Gerganov	cf0e3ba150 model : avoid ggml_cont_3d for fused QKV weights (#15662)	4 месяцев назад
Georgi Gerganov	c610b6c11b kv-cache : fix SWA checks + disable cacheless iSWA (#15811)	4 месяцев назад
Daniel Bevenius	fb15d649ed llama : add support for EmbeddingGemma 300m (#15798)	4 месяцев назад
Daniel Bevenius	2c8dac72eb llama : fix incorrect model type for Gemma 270M (#15764)	4 месяцев назад

Новее Раньше

История коммитов Найти

История коммитов