Historie revizí

Autor SHA1 Zpráva Datum
  Daniel Bevenius d07c621393 common : add llama.vim preset for Qwen2.5 Coder (#11945) před 11 měsíci
  Georgi Gerganov abd4d0bc4f speculative : update default params (#11954) před 11 měsíci
  Daniel Bevenius 9626d9351a llama : fix indentation in llama-grammar [no ci] (#11943) před 11 měsíci
  igardev b58934c183 server : (webui) Enable communication with parent html (if webui is in iframe) (#11940) před 11 měsíci
  Olivier Chafik 63e489c025 tool-call: refactor common chat / tool-call api (+ tests / fixes) (#11900) před 11 měsíci
  Xuan-Son Nguyen 63ac128563 server : add TEI API format for /rerank endpoint (#11942) před 11 měsíci
  MoonRide303 5137da7b8c scripts: corrected encoding when getting chat template (#11866) (#11907) před 11 měsíci
  xiaobing318 09aaf4f1f5 docs : Fix duplicated file extension in test command (#11935) před 11 měsíci
  Johannes Gäßler 73e2ed3ce3 CUDA: use async data loading for FlashAttention (#11894) před 11 měsíci
  Eve f7b1116af1 update release requirements (#11897) před 11 měsíci
  Antoine Viallon c4d29baf32 server : fix divide-by-zero in metrics reporting (#11915) před 11 měsíci
  Rémy O 2eea03d86a vulkan: implement several ops relevant for ggml_opt (#11769) před 11 měsíci
  Xuan-Son Nguyen 0f2bbe6564 server : bump httplib to 0.19.0 (#11908) před 11 měsíci
  standby24x7 fe163d5bf3 common : Fix a typo in help (#11899) před 11 měsíci
  Xuan-Son Nguyen 818a340ea8 ci : fix (again) arm64 build fails (#11895) před 11 měsíci
  Jeff Bolz bf42a23d0a vulkan: support multi/vision rope, and noncontiguous rope (#11902) před 11 měsíci
  Hale Chan c2ea16f260 metal : fix the crash caused by the lack of residency set support on Intel Macs. (#11904) před 11 měsíci
  Johannes Gäßler 6dde178248 scripts: fix compare-llama-bench commit hash logic (#11891) před 11 měsíci
  708-145 fc10c38ded examples: fix typo in imatrix/README.md (#11884) před 11 měsíci
  Adrian Kretz 22885105a6 metal : optimize dequant q6_K kernel (#11892) před 11 měsíci
  Georgi Gerganov c2cd24fbfd readme : add notice about new package registry (#11890) před 11 měsíci
  Georgi Gerganov 68ff663a04 repo : update links to new url (#11886) před 11 měsíci
  Olivier Chafik f355229692 server: fix type promotion typo causing crashes w/ --jinja w/o tools (#11880) před 11 měsíci
  Rémy O fc1b0d0936 vulkan: initial support for IQ1_S and IQ1_M quantizations (#11528) před 11 měsíci
  Michał Moskal 89daa2564f llguidance build fixes for Windows (#11664) před 11 měsíci
  lhez 300907b211 opencl: Fix rope and softmax (#11833) před 11 měsíci
  Diego Devesa 94b87f87b5 cuda : add ampere to the list of default architectures (#11870) před 11 měsíci
  Georgi Gerganov dbc2ec59b5 docker : drop to CUDA 12.4 (#11869) před 11 měsíci
  Daniel Bevenius 3d68f034da llama : add completion for --chat-template-file (#11860) před 11 měsíci
  Jinyang He 38e32eb6a0 ggml: optimize some vec dot functions for LoongArch ASX (#11842) před 11 měsíci