Johannes Gäßler
|
7a0e900e36
llama: consistent ctx <-> buf order for KV cache (#16746)
|
3 місяців тому |
Johannes Gäßler
|
e789095502
llama: print memory breakdown on exit (#15860)
|
4 місяців тому |
Georgi Gerganov
|
b730706a49
kv-cache : support layer reuse (#15504)
|
5 місяців тому |
Georgi Gerganov
|
715a6db02c
kv-cache : drop the "unified" prefix (#15467)
|
5 місяців тому |
Georgi Gerganov
|
d32e03f449
server : add SWA checkpoints (#15293)
|
5 місяців тому |
Georgi Gerganov
|
692e3cdd0a
memory : rename interface to llama_memory_context_i (#14296)
|
7 місяців тому |
Georgi Gerganov
|
4c9fdfbe15
ubatch : new splitting logic (#14217)
|
7 місяців тому |
Gabe Goodhart
|
edc4a29eff
memory : Hybrid recurrent cache (#13979)
|
7 місяців тому |