Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov c00a2634be metal : fix typo in FA kernel comments (#13651) hace 8 meses
  Georgi Gerganov e298d2fbd0 kv-cache : add SWA support (#13194) hace 8 meses
  Xinpeng Dou f0adb80bf7 CANN: Update CANN model support (#13162) hace 8 meses
  Nicolò Scipione f7c9429c85 sycl : Overcoming workaround for mmap() allocation on Windows (#13482) hace 8 meses
  psocolovsky 1dfbf2cf3a common : add load_progress_callback (#13617) hace 8 meses
  0cc4m 8960efd0a6 Vulkan: Add f32 accumulator support to quantized mul mat to fix GLM4 32B incoherence (#13607) hace 8 meses
  Alberto Cabrera Pérez 725f23f1f3 sycl : backend documentation review (#13544) hace 8 meses
  Xuan-Son Nguyen 92ecdcc06a mtmd : add vision support for llama 4 (#13282) hace 8 meses
  Alberto Cabrera Pérez f71f40a284 ci : upgraded oneAPI version in SYCL workflows and dockerfile (#13532) hace 8 meses
  Georgi Gerganov d30cb5a7fa sync : ggml hace 8 meses
  Johannes Gäßler 6c35981a64 mnist: fix segmentation fault (ggml/1227) hace 8 meses
  Diego Devesa 8b5e19aea6 ggml : fix apple OS check in ggml_print_backtrace (ggml/1229) hace 8 meses
  Daniel Tang 60aea028b5 ggml : Fix missing backtrace on Linux (ggml/1228) hace 8 meses
  Nick 9c55e5c5c2 fix: check model pointer validity before use (#13631) hace 8 meses
  Chenguang Li 33d7aed4a8 CANN: Support MOE Model MUL_MAT_ID (#13042) hace 8 meses
  Isaac McFadyen 6a2bc8bfb7 server : added --no-prefill-assistant flag (#13608) hace 8 meses
  Gilad S. e3a7cf6c5b cmake: use the current build config for vulkan-shaders-gen (#13595) hace 8 meses
  Georgi Gerganov 518329b2d4 parallel : add option for non-shared and larger prompts (#13598) hace 8 meses
  Jeff Bolz 2f5a4e1e09 vulkan: move common FA code to flash_attn_base.comp (#13556) hace 8 meses
  Jeff Bolz 4f41ee11d6 vulkan: use scalar FA rather than coopmat2 when N==1 (#13554) hace 8 meses
  Z 3e0be1cace llguidance : official v0.7.20 release (no actual changes) [noci] (#13594) hace 8 meses
  Xuan-Son Nguyen 6aa892ec2a server : do not return error out of context (with ctx shift disabled) (#13577) hace 8 meses
  Xuan-Son Nguyen aea9f8b4e7 webui : improve accessibility for visually impaired people (#13551) hace 8 meses
  Xuan-Son Nguyen 06c1e4abc1 readme : add list of dependencies and their license (#13591) hace 8 meses
  Diego Devesa 415e40a357 releases : use arm version of curl for arm releases (#13592) hace 8 meses
  Georgi Gerganov 654a67794f metal : add FA-vec kernel for head size 64 (#13583) hace 8 meses
  Diego Devesa 5364ae4ba5 llama : print hint when loading a model when no backends are loaded (#13589) hace 8 meses
  Sigbjørn Skjæret 7c07ac244d ci : add ppc64el to build-linux-cross (#13575) hace 8 meses
  Łukasz Ślusarczyk 0a338ed013 sycl : fixed compilation warnings (#13582) hace 8 meses
  Olivier Chafik bc098c3cf0 minja: sync (qwen3) (#13573) hace 8 meses