Commit Verlauf

Autor SHA1 Nachricht Datum
  Alawode Oluwandabira 17a1f0d2d4 server: Add ability to mount server at prefix (#14544) vor 6 Monaten
  Xuan-Son Nguyen 8f22dc0a53 model : add hunyuan moe (#14425) vor 6 Monaten
  Jeff Bolz 53903ae6fa vulkan: increase timeout for CI (#14574) vor 6 Monaten
  Georgi Gerganov 4d0dcd4a06 cuda : fix rope with partial rotation and non-cont src (#14580) vor 6 Monaten
  Aman Gupta 75c91de6e9 CUDA: add bilinear interpolation for upscale (#14563) vor 6 Monaten
  R0CKSTAR 68155c66f0 musa: fix build warnings (unused variable) (#14561) vor 6 Monaten
  Sigbjørn Skjæret e1a7059053 llama : fix incorrect minicpm3 v_states shape (#14571) vor 6 Monaten
  Sigbjørn Skjæret 12f55c302b llama : remove ggml_cont where possible (#14568) vor 6 Monaten
  Aman Gupta b9c3eefde1 CUDA: add bf16 and i32 to getrows (#14529) vor 6 Monaten
  Eve 6491d6e4f1 vulkan: increase LOAD_VEC_A to 8 (IQ1/IQ2) or 4 (IQ3) (#14485) vor 6 Monaten
  Jeff Bolz e592be1575 vulkan: fix rms_norm+mul fusion (#14545) vor 6 Monaten
  Jeff Bolz a0374a67e2 vulkan: Handle updated FA dim2/3 definition (#14518) vor 6 Monaten
  Sigbjørn Skjæret ddef99522d server : fix assistant prefilling when content is an array (#14360) vor 6 Monaten
  Sigbjørn Skjæret 6681688146 opencl: add GELU_ERF (#14476) vor 6 Monaten
  Georgi Gerganov bac8bed248 eval-callback : check for empty input (#14539) vor 6 Monaten
  R0CKSTAR b81510a7b7 test-backend-ops: add support for specifying output format (#14368) vor 6 Monaten
  Georgi Gerganov ef797db357 metal : disable fast math in all quantize kernels (#14528) vor 6 Monaten
  Georgi Gerganov 67d1ef23c6 batch : add optional for sequential equal split (#14511) vor 6 Monaten
  Georgi Gerganov 7b50f7c025 graph : prepare for 4D mask (#14515) vor 6 Monaten
  Georgi Gerganov c79184d2d1 batch : add n_used count (#14512) vor 6 Monaten
  luyhcsu 499a8f5a78 CANN: Replace aclrtMemsetSync with aclnnInplaceZero operator (#14002) vor 6 Monaten
  Sigbjørn Skjæret 28657a8229 ggml : implement GEGLU_ERF and GEGLU_QUICK ops (#14445) vor 6 Monaten
  lhez bee28421be opencl : broadcast for soft_max (#14510) vor 6 Monaten
  Jeff Bolz 2b72bedec1 vulkan: support mixed/deepseekR1 FA head sizes (#14509) vor 6 Monaten
  Johannes Gäßler c8c4495b8d ggml: backward pass for split swiglu (#14483) vor 6 Monaten
  Nicolò Scipione 7b63a71a6b Fix conditional enabling following arch checks for ggml-sycl (#14504) vor 6 Monaten
  Xuan-Son Nguyen 0c2ee38ab7 convert : correct gemma 3n conversion (#14450) vor 6 Monaten
  Georgi Gerganov a70c8a0c4b kv-cache : use ggml_set_rows (#14285) vor 6 Monaten
  Georgi Gerganov 9067487c44 ggml : fix FA mask dim 2 and 3 (#14505) vor 6 Monaten
  Georgi Gerganov d4cdd9c1c3 ggml : remove kompute backend (#14501) vor 6 Monaten