Historial de Commits

Autor SHA1 Mensaje Fecha
  Eve f7b1116af1 update release requirements (#11897) hace 11 meses
  Antoine Viallon c4d29baf32 server : fix divide-by-zero in metrics reporting (#11915) hace 11 meses
  Rémy O 2eea03d86a vulkan: implement several ops relevant for ggml_opt (#11769) hace 11 meses
  Xuan-Son Nguyen 0f2bbe6564 server : bump httplib to 0.19.0 (#11908) hace 11 meses
  standby24x7 fe163d5bf3 common : Fix a typo in help (#11899) hace 11 meses
  Xuan-Son Nguyen 818a340ea8 ci : fix (again) arm64 build fails (#11895) hace 11 meses
  Jeff Bolz bf42a23d0a vulkan: support multi/vision rope, and noncontiguous rope (#11902) hace 11 meses
  Hale Chan c2ea16f260 metal : fix the crash caused by the lack of residency set support on Intel Macs. (#11904) hace 11 meses
  Johannes Gäßler 6dde178248 scripts: fix compare-llama-bench commit hash logic (#11891) hace 11 meses
  708-145 fc10c38ded examples: fix typo in imatrix/README.md (#11884) hace 11 meses
  Adrian Kretz 22885105a6 metal : optimize dequant q6_K kernel (#11892) hace 11 meses
  Georgi Gerganov c2cd24fbfd readme : add notice about new package registry (#11890) hace 11 meses
  Georgi Gerganov 68ff663a04 repo : update links to new url (#11886) hace 11 meses
  Olivier Chafik f355229692 server: fix type promotion typo causing crashes w/ --jinja w/o tools (#11880) hace 11 meses
  Rémy O fc1b0d0936 vulkan: initial support for IQ1_S and IQ1_M quantizations (#11528) hace 11 meses
  Michał Moskal 89daa2564f llguidance build fixes for Windows (#11664) hace 11 meses
  lhez 300907b211 opencl: Fix rope and softmax (#11833) hace 11 meses
  Diego Devesa 94b87f87b5 cuda : add ampere to the list of default architectures (#11870) hace 11 meses
  Georgi Gerganov dbc2ec59b5 docker : drop to CUDA 12.4 (#11869) hace 11 meses
  Daniel Bevenius 3d68f034da llama : add completion for --chat-template-file (#11860) hace 11 meses
  Jinyang He 38e32eb6a0 ggml: optimize some vec dot functions for LoongArch ASX (#11842) hace 11 meses
  Eve a4f011e8d0 vulkan: linux builds + small subgroup size fixes (#11767) hace 11 meses
  theraininsky a7b8ce2260 llama-bench : fix unexpected global variable initialize sequence issue (#11832) hace 11 meses
  Georgi Gerganov 04045bb842 readme : minor hace 11 meses
  Jeffrey Morgan 8a8c4ceb60 llamafile: use member variable instead of constant for iq4nlt (#11780) hace 11 meses
  Reza Rahemtola c1f958c038 server : (docs) Update wrong tool calling example (#11809) hace 11 meses
  Daniel Bevenius c48f630d1c llama : add --completion-bash option (#11846) hace 11 meses
  R0CKSTAR bd6e55bfd3 musa: bump MUSA SDK version to rc3.1.1 (#11822) hace 11 meses
  Olivier Chafik c7f460ab88 `server`: fix tool-call of DeepSeek R1 Qwen, return reasoning_content (Command 7RB & DeepSeek R1) unless `--reasoning-format none` (#11607) hace 11 meses
  Vinesh Janarthanan 27e8a23300 sampling: add Top-nσ sampler (#11223) hace 11 meses