Historial de Commits

Autor SHA1 Mensaje Fecha
  Daniel Bevenius 36d3f00e14 requirements : fix PyTorch uint64 compatibility (#15134) hace 6 meses
  Reese Levine 5fd160bbd9 ggml: Add basic SET_ROWS support in WebGPU (#15137) hace 6 meses
  rmatif 756cfea826 fix profiling crash (#15072) hace 6 meses
  lhez e725a1a982 opencl: add `swiglu_oai` and `add_id` (#15121) hace 6 meses
  Sachin Desai 3db4da56a5 chat : support Granite model reasoning and tool call (#14864) hace 6 meses
  Juk Armstrong 476aa3fd57 Fixed name `-override-tensors` to `-override-tensor` (#15129) hace 6 meses
  Diego Devesa 0d8831543c ggml : fix fallback to CPU for ununsupported ops (#15118) hace 6 meses
  Sigbjørn Skjæret 65c797c4fa chat : fix yandex chat template (#15116) hace 6 meses
  stevenkuang 25726898e8 chat : fix hunyuan auto-detection (#15114) hace 6 meses
  Chenguang Li 2241453252 CANN: add support for ACL Graph (#15065) hace 6 meses
  Reese Levine 9515c6131a ggml: WebGPU disable SET_ROWS for now (#15078) hace 6 meses
  Georgi Gerganov fd1234cb46 llama : add gpt-oss (#15091) hace 6 meses
  Sigbjørn Skjæret f324a3b715 chat : only remove double bos/eos if added (#15086) hace 6 meses
  Georgi Gerganov be42642581 readme : update hot topics (#15097) hace 6 meses
  Romain Biessy 3306ceabf0 sycl: fix mul_mat selection (#15092) hace 6 meses
  Juk Armstrong c81de6e107 Fix `glm4moe` bug (#15088) hace 6 meses
  Alex Wu 22f060c9c4 webui: fix markdown table (#15081) hace 6 meses
  compilade ee3a9fcf88 context : fix index overflow on huge outputs (#15080) hace 6 meses
  Diego Devesa ec428b02c3 llama : add --n-cpu-moe option (#15077) hace 6 meses
  compilade 19f68fa5a4 imatrix : warn when GGUF imatrix is saved without .gguf suffix (#15076) hace 6 meses
  Christian Kastner 41613437ff cmake: Add GGML_BACKEND_DIR option (#15074) hace 6 meses
  Sigbjørn Skjæret e5bebe5251 gguf-py : add --chat-template-file to gguf_new_metadata (#15075) hace 6 meses
  Sam ef0144c087 model: support GLM 4.5 family of models (#14939) hace 6 meses
  Sigbjørn Skjæret 2721257e3e quantize : fix confusing error message if ftype is invalid (#15071) hace 6 meses
  Reese Levine 587d0118f5 ggml: WebGPU backend host improvements and style fixing (#14978) hace 6 meses
  Jeff Bolz 5aa1105da2 vulkan: fix build when using glslang that does not support coopmat2 (#15062) hace 6 meses
  compilade d31192b4ee imatrix : use GGUF by default (#14842) hace 6 meses
  compilade 0a2f5496be imatrix : fix 3d activation handling for hybrid and recurrent models (#14994) hace 6 meses
  compilade 11a3811164 memory : handle kv_unified for hybrid models (#15050) hace 6 meses
  Csaba Kecskemeti 97366dc6ab vocab : JetBrains Mellum pre-tokenizer (#15045) hace 6 meses