Historial de Commits

Autor SHA1 Mensaje Fecha
  Markus Tavenrath bb16041cae Add support for VK_EXT_debug_utils to add labels to Vulkan objects. (#13792) hace 7 meses
  Sigbjørn Skjæret 58cba76a9a gguf-py : fix TemplateProcessing pair when bos/eos is missing (#14312) hace 7 meses
  Georgi Gerganov 67ae5312e2 metal : fix thread-safety (#14300) hace 7 meses
  Georgi Gerganov 692e3cdd0a memory : rename interface to llama_memory_context_i (#14296) hace 7 meses
  Daniel Han b23fa0b3f4 convert : fix Llama 4 conversion (#14311) hace 7 meses
  Georgi Gerganov 06cbedfca1 sync : ggml hace 7 meses
  Acly b7147673f2 Add `ggml_roll` (ggml/1274) hace 7 meses
  David Chiu d860dd99a4 docs : fix the link to llama.h (#14293) hace 7 meses
  Aman Gupta c959f462a0 CUDA: add conv_2d_transpose (#14287) hace 7 meses
  Sigbjørn Skjæret 22015b2092 lint : remove trailing whitepace (#14304) hace 7 meses
  Ruikai Peng dd6e6d0b6a vocab : prevent tokenizer overflow (#14301) hace 7 meses
  Nicolò Scipione 8308f98c7f sycl: add usage of enqueue_functions extension (#14244) hace 7 meses
  Christian Kastner 6369be0735 Implement GGML_CPU_ALL_VARIANTS for PowerPC (#14286) hace 7 meses
  Sigbjørn Skjæret 88fc854b4b llama : improve sep token handling (#14272) hace 7 meses
  Diego Devesa e28c1b93fd cuda : synchronize graph capture and cublas handle destruction (#14288) hace 7 meses
  Georgi Gerganov d27b3ca175 ggml : fix repack work size for mul_mat_id (#14292) hace 7 meses
  Charles Xu 9230dbe2c7 ggml: Update KleidiAI to v1.9.0 (#14277) hace 7 meses
  Georgi Gerganov 812939a9e9 model : more uniform output id handling (#14275) hace 7 meses
  Georgi Gerganov 4c9fdfbe15 ubatch : new splitting logic (#14217) hace 7 meses
  Aman Gupta 9eaa51e7f0 CUDA: add conv_2d_dw (#14265) hace 7 meses
  Diego Devesa 8f71d0f3e8 ggml-cpu : remove unnecesary arm feature detection (#14281) hace 7 meses
  Alex Trotta 381174bbda gguf-py : make sentencepiece optional (#14200) hace 7 meses
  aa956 d67341dc18 server : add server parameters for draft model cache type (#13782) hace 7 meses
  fanyang 456af35eb7 build : suppress gcc15 compile warnings (#14261) hace 7 meses
  Anton Mitkov 600e3e9b50 sycl: Cleanup codepaths in Get Rows in sycl backend (#14215) hace 7 meses
  bashayer hijji fffcce535e llama-bench : add --no-warmup flag (#14224) (#14270) hace 7 meses
  pqnet 5fc7856815 convert : fix remote option in Windows (#14100) hace 7 meses
  Aaron Teo faed5a5f5d llamafile : support s390x SIMD instruction set (#14273) hace 7 meses
  0cc4m 10bb545c5b Vulkan: Set device max size for host memory to avoid OOM warning and fallback to CPU buffer (#14249) hace 7 meses
  Gabe Goodhart edc4a29eff memory : Hybrid recurrent cache (#13979) hace 7 meses