cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Sigbjørn Skjæret	9008027aa3 hparams : add n_embd_inp() to support extended embed (#16928)	vor 2 Monaten
JJJYmmm	d261223d24 model: add support for qwen3vl series (#16780)	vor 2 Monaten
Daniel Bevenius	a2fba89a42 hparams : add check for layer index in is_recurrent (#16511)	vor 3 Monaten
Georgi Gerganov	c610b6c11b kv-cache : fix SWA checks + disable cacheless iSWA (#15811)	vor 4 Monaten
Daniel Bevenius	fb15d649ed llama : add support for EmbeddingGemma 300m (#15798)	vor 4 Monaten
Georgi Gerganov	b730706a49 kv-cache : support layer reuse (#15504)	vor 4 Monaten
Dongliang Wei	6c6e397aff model : add support for SmallThinker series (#14898)	vor 5 Monaten
Georgi Gerganov	225e7a1438 llama : add high-throughput mode (#14363)	vor 6 Monaten
Tarek Dakhran	f5e96b368f model : support LiquidAI LFM2 hybrid family (#14620)	vor 6 Monaten
compilade	5d46babdc2 llama : initial Mamba-2 support (#9126)	vor 6 Monaten
Georgi Gerganov	4c9fdfbe15 ubatch : new splitting logic (#14217)	vor 7 Monaten
Gabe Goodhart	edc4a29eff memory : Hybrid recurrent cache (#13979)	vor 7 Monaten
Georgi Gerganov	d13d0f6135 hparams : initialize arrays (#13728)	vor 8 Monaten
Xuan-Son Nguyen	8a2afb7520 llama : allow custom list of swa_layers (#13726)	vor 8 Monaten
Georgi Gerganov	8e186ef0e7 hparams : support models for which all layers use SWA (#13682)	vor 8 Monaten
Georgi Gerganov	081bee8c64 hparams : add SWA rope parameters (#12374)	vor 10 Monaten
Georgi Gerganov	84d5475541 llama : fix Gemma3 SWA KV cache shift (#12373)	vor 10 Monaten
Molly Sophia	ee7136c6d1 llama: add support for QRWKV6 model architecture (#11001)	vor 1 Jahr
Georgi Gerganov	f66f582927 llama : refactor `src/llama.cpp` (#10902)	vor 1 Jahr

Commit Verlauf Finden

Commit Verlauf