Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov c8d0d14e77 kv-cache : fix find_slot to not search for continuous slot (#15638) hace 4 meses
  Georgi Gerganov 8a4280ce43 kv-cache : remove LLAMA_SET_ROWS checks (#15505) hace 4 meses
  Georgi Gerganov 1bded5a3b3 kv-cache : better estimate of n_kv for multi-sequence batches (#15610) hace 4 meses
  Georgi Gerganov b730706a49 kv-cache : support layer reuse (#15504) hace 4 meses
  Georgi Gerganov 9ebebef62f llama : remove KV cache defragmentation logic (#15473) hace 5 meses
  Georgi Gerganov 715a6db02c kv-cache : drop the "unified" prefix (#15467) hace 5 meses
  Georgi Gerganov 7f37b6cf1e memory : migrate from llama_kv_cache to more generic llama_memory (#14006) hace 7 meses
  Georgi Gerganov 0fc16b42e8 kv-cache : split implementation in separate sources (#13920) hace 7 meses
  Georgi Gerganov 3600cc2886 llama : use n_swa + n_ubatch cells for SWA cache (#13833) hace 7 meses
  Georgi Gerganov 3f55f781f1 llama : auto-batch preparation (#13845) hace 7 meses
  Georgi Gerganov 12d0188c0d kv-cache : refactor + add llama_memory_state_i (#13746) hace 7 meses
  Xuan-Son Nguyen 763d06edb7 llama : fix KV shift for qwen2vl (#13870) hace 7 meses
  Georgi Gerganov 81713121ee kv-cells : track min/max used cells and per-sequence positions (#13808) hace 7 meses
  Georgi Gerganov de2ef53a4b kv-cache : rework kv_cell (#13706) hace 8 meses
  Georgi Gerganov 797f2ac062 kv-cache : simplify the interface (#13660) hace 8 meses
  Georgi Gerganov a4090d1174 llama : remove llama_kv_cache_view API + remove deprecated (#13653) hace 8 meses
  Georgi Gerganov e298d2fbd0 kv-cache : add SWA support (#13194) hace 8 meses
  Georgi Gerganov e3a9421b78 kv-cache : fix out-of-bounds view during reserve graph (#13547) hace 8 meses
  Georgi Gerganov c642bc014c kv-cache : separate recurrent vs non-recurrent impl (#12799) hace 8 meses
  Juk Armstrong daa422881a llama : DeepSeek V2/V3 MLA implementation (#12801) hace 9 meses
  Georgi Gerganov 3e1d29348b kv-cache : simplify + fix warning for recurrent models (#12756) hace 9 meses
  Georgi Gerganov a10b36c91a llama : refactor kv cache guard (#12695) hace 9 meses
  Georgi Gerganov e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) hace 10 meses
  Georgi Gerganov afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110) hace 1 año
  Daniel Bevenius 6369f867a4 llama : rename missed batch params/vars to ubatch (#10059) hace 1 año
  Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902) hace 1 año