Historial de Commits

Autor SHA1 Mensaje Fecha
  igardev b34c859146 server : Webui - change setText command from parent window to also send the message. (#13309) hace 8 meses
  Xuan-Son Nguyen 9b61acf060 mtmd : rename llava directory to mtmd (#13311) hace 8 meses
  Xuan-Son Nguyen 5215b91e93 clip : fix confused naming ffn_up and ffn_down (#13290) hace 8 meses
  Sigbjørn Skjæret ae803bfc3d convert : bailingmoe : set yarn metadata if present (#13312) hace 8 meses
  Akarshan Biswas 66645a5285 SYCL: Disable mul_mat kernels for noncontiguous tensor b (#13308) hace 8 meses
  Xuan-Son Nguyen 27aa259532 mtmd : add C public API (#13184) hace 8 meses
  Diego Devesa 9fdfcdaedd rpc : use backend registry, support dl backends (#13304) hace 8 meses
  Aaron Teo 6eb7d25c70 ggml : activate s390x simd for Q3_K (#13301) hace 8 meses
  Diego Devesa 86bd60d3fe llava/mtmd : fixes to fully support dl backends (#13303) hace 8 meses
  Diego Devesa 9f2da5871f llama : build windows releases with dl backends (#13220) hace 8 meses
  Johannes Gäßler 93c4e23905 CUDA: fix race condition in MMQ stream-k fixup (#13299) hace 8 meses
  Johannes Gäßler 8afbd96818 CUDA: fix race condition in MMQ ids_dst (#13294) hace 8 meses
  Jeff Bolz 8ae5ebcf85 vulkan: Additional type support for unary, binary, and copy (#13266) hace 8 meses
  Johannes Gäßler 3e959f0976 imatrix: fix oob writes if src1 is not contiguous (#13286) hace 8 meses
  Xuan-Son Nguyen 36667c8edc clip : revert the change of BOI/EOI token for GLM-edge (⚠️ breaking change) (#13259) hace 8 meses
  ymcki 3bf785f3ef llama : Llama-3_1-Nemotron-Ultra-253B-v1 support (#12843) hace 8 meses
  Diego Devesa 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
  Georgi Gerganov b34443923c sync : ggml (#13268) hace 8 meses
  Georgi Gerganov a75cb30dc9 context : fix reorder logic (#13267) hace 8 meses
  shalinib-ibm 3f3769ba76 ggml : Enable MMA for BF16 in llamafile_sgemm (#13148) hace 8 meses
  Jared Van Bortel 2f567611c0 llama-model : support Qwen2 embedding models and pooling_mode_lasttoken (#13245) hace 8 meses
  Jared Van Bortel 7d2123484e convert : use correct context length for nomic-embed-text-v2 (#13216) hace 8 meses
  Xuan-Son Nguyen 074e42ab31 convert : converting mmproj for Qwen2/2.5VL from convert_hf_to_gguf (#13209) hace 8 meses
  Georgi Gerganov c642bc014c kv-cache : separate recurrent vs non-recurrent impl (#12799) hace 8 meses
  Sigbjørn Skjæret cb06a3c363 llama : orion rope type is neox (#13261) hace 8 meses
  Sigbjørn Skjæret 626083faf7 llama : plamo rope type is neox (#13260) hace 8 meses
  piDack 2af6880178 llama-chat : reset glmedge chat template (#13253) hace 8 meses
  Shakil Ahmed e84773ab60 mtmd-cli : fix out_of_range when input image path is empty (#13244) hace 8 meses
  Georgi Gerganov fab647e884 server : add cache reuse card link to help (#13230) hace 8 meses
  Xuan-Son Nguyen dcf886007d convert : explicitly disable trust_remote_code for AutoConfig (#13246) hace 8 meses