Georgi Gerganov
|
e3a9421b78
kv-cache : fix out-of-bounds view during reserve graph (#13547)
|
8 miesięcy temu |
Georgi Gerganov
|
c642bc014c
kv-cache : separate recurrent vs non-recurrent impl (#12799)
|
8 miesięcy temu |
Juk Armstrong
|
daa422881a
llama : DeepSeek V2/V3 MLA implementation (#12801)
|
9 miesięcy temu |
Georgi Gerganov
|
3e1d29348b
kv-cache : simplify + fix warning for recurrent models (#12756)
|
9 miesięcy temu |
Georgi Gerganov
|
a10b36c91a
llama : refactor kv cache guard (#12695)
|
9 miesięcy temu |
Georgi Gerganov
|
e0dbec0bc6
llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181)
|
10 miesięcy temu |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
1 rok temu |
Daniel Bevenius
|
6369f867a4
llama : rename missed batch params/vars to ubatch (#10059)
|
1 rok temu |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
1 rok temu |