Historial de Commits

Autor SHA1 Mensaje Fecha
  Adrien Gallouët dd5e8cab51 vendor : update cpp-httplib to 0.27.0 (#16846) hace 2 meses
  Xuan-Son Nguyen cf659bbb8e mtmd: refactor preprocessing + support max/min pixels (#16878) hace 2 meses
  Aleksander Grygier d8b860a219 Add a setting to display message generation statistics (#16901) hace 2 meses
  Jaromír Hradílek 1ae74882f8 webui: recognize AsciiDoc files as valid text files (#16850) hace 2 meses
  Sigbjørn Skjæret 961660b8c3 common : allow --system-prompt-file for diffusion-cli (#16903) hace 3 meses
  Sigbjørn Skjæret 74fef4129f codeowners : update after refactor (#16905) hace 3 meses
  Jeff Bolz 5d8bb900bc vulkan: Fix multi_add invalid descriptor usage (#16899) hace 3 meses
  Jeff Bolz 2e76e01360 vulkan: fuse mul_mat+add and mul_mat_id+add_id (#16868) hace 3 meses
  Oliver Simons d3dc9dd898 CUDA: Remove unneded bias/gate dims in fused mmvq (#16858) hace 3 meses
  Piotr Wilkin (ilintar) bea04522ff refactor : llama-model.cpp (#16252) hace 3 meses
  Piotr Wilkin (ilintar) 0de0a01576 model : Minimax M2 (#16831) hace 3 meses
  Giuseppe Scrivano e58d585604 model : add Granite Hybrid nano types (#16896) hace 3 meses
  Johannes Gäßler 31c511a968 CUDA: Volta tensor core support for MMF (#16843) hace 3 meses
  Georgi Gerganov 6d39015a74 sync : ggml hace 3 meses
  Aman Gupta 4146d6a1a6 CUDA: add expert reduce kernel (#16857) hace 3 meses
  Georgi Gerganov 8da3c0e200 batch : fix consistency checks for the input positions (#16890) hace 3 meses
  Georgi Gerganov c22473b580 server : don't print user inputs to console (#16871) hace 3 meses
  Daniel Bevenius 0f715b4e75 server : fix typos in server.cpp comments [no ci] (#16883) hace 3 meses
  Jeff Bolz d2d931f173 vulkan: disable spirv-opt for rope shaders (#16872) hace 3 meses
  Masato Nakasaka 2976b0374d vulkan: Fix crash when FP16 mul_mat accumulation is not supported (#16796) hace 3 meses
  Ruben Ortlam d2a2673dd1 vulkan: fix shmem overrun in mmq id shader (#16873) hace 3 meses
  l3utterfly 13002a0896 ggml-hexagon: respect input size when getting/setting tensor data (#16836) hace 3 meses
  Sigbjørn Skjæret 6eb208d17e ci : enable free-disk-space on cuda docker build (#16877) hace 3 meses
  lhez 9984cbb61d opencl: fix boundary handling for mul_mm (#16875) hace 3 meses
  RodriMora ce18efeaf1 convert : update transformers requirements (#16866) hace 3 meses
  chansikpark 16724b5b68 server : bump request URI max length to 32768 (#16862) hace 3 meses
  Georgi Gerganov b52edd2558 server : remove n_past (#16818) hace 3 meses
  Max Krasnyansky 517b7170e1 cpu: introduce chunking for repack matmuls and enable matmul-id chunking on ARM64 (#16833) hace 3 meses
  Shagun Bera 835e918d84 common: fix typo in cli help text (#16864) hace 3 meses
  JJJYmmm d261223d24 model: add support for qwen3vl series (#16780) hace 3 meses