Georgi Gerganov
|
225e7a1438
llama : add high-throughput mode (#14363)
|
6 месяцев назад |
Tarek Dakhran
|
f5e96b368f
model : support LiquidAI LFM2 hybrid family (#14620)
|
6 месяцев назад |
compilade
|
5d46babdc2
llama : initial Mamba-2 support (#9126)
|
6 месяцев назад |
Georgi Gerganov
|
4c9fdfbe15
ubatch : new splitting logic (#14217)
|
7 месяцев назад |
Gabe Goodhart
|
edc4a29eff
memory : Hybrid recurrent cache (#13979)
|
7 месяцев назад |
Georgi Gerganov
|
d13d0f6135
hparams : initialize arrays (#13728)
|
7 месяцев назад |
Xuan-Son Nguyen
|
8a2afb7520
llama : allow custom list of swa_layers (#13726)
|
7 месяцев назад |
Georgi Gerganov
|
8e186ef0e7
hparams : support models for which all layers use SWA (#13682)
|
8 месяцев назад |
Georgi Gerganov
|
081bee8c64
hparams : add SWA rope parameters (#12374)
|
10 месяцев назад |
Georgi Gerganov
|
84d5475541
llama : fix Gemma3 SWA KV cache shift (#12373)
|
10 месяцев назад |
Molly Sophia
|
ee7136c6d1
llama: add support for QRWKV6 model architecture (#11001)
|
1 год назад |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
1 год назад |