Историја ревизија

Аутор SHA1 Порука Датум
  Eric Curtin 0cc63754b8 Introduce llama-run (#10291) пре 1 година
  Diego Devesa 50d5cecbda ci : build docker images only once daily (#10503) пре 1 година
  Georgi Gerganov 9fd8c2687f server : add more information about error (#10455) пре 1 година
  Georgi Gerganov 47f931c8f9 server : enable cache_prompt by default (#10501) пре 1 година
  Georgi Gerganov 106964e3d2 metal : enable mat-vec kernels for bs <= 4 (#10491) пре 1 година
  Shane A 80acb7b430 Rename Olmo1124 to Olmo2 (#10500) пре 1 година
  Diego Devesa 10bce0450f llama : accept a list of devices to use to offload a model (#10497) пре 1 година
  Johannes Gäßler 1f922254f0 Github: update issue templates [no ci] (#10489) пре 1 година
  brucepro a9a678a6b2 Add download chat feature to server chat (#10481) пре 1 година
  Georgi Gerganov 9ca2e67762 server : add speculative decoding support (#10455) пре 1 година
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) пре 1 година
  Georgi Gerganov f6d12e7df8 tests : fix compile warning пре 1 година
  Georgi Gerganov b756441104 metal : minor code formatting пре 1 година
  Neo Zhang Jianyu 5a8987793f [SYCL] Fix building Win package for oneAPI 2025.0 update (#10483) пре 1 година
  Georgi Gerganov d9d54e498d speculative : refactor and add a simpler example (#10362) пре 1 година
  Georgi Gerganov cce5a90075 flake.lock: Update (#10470) пре 1 година
  Diego Devesa dc39012cba llama : fix op mul check with command-r-plus (#10476) пре 1 година
  Gabe Goodhart 9336db462c convert : XLMRoberta Type Vocab Size (#10458) пре 1 година
  momonga 96fa2c5e2d fix gguf-py: Conversion error when multiple licenses are configured (#9807) пре 1 година
  Diego Devesa 55ed008b2d ggml : do not use ARM features not included in the build (#10457) пре 1 година
  蕭澧邦 6dfcfef078 ci: Update oneAPI runtime dll packaging (#10428) пре 1 година
  Johannes Gäßler 599b3e0cd4 GitHub: ask for more info in issue templates (#10426) пре 1 година
  leo-pony c18610b4ee CANN: Support Ascend310P to accelerate F32 and F16 Model (#10216) пре 1 година
  Diego Devesa a5e47592b6 cuda : optimize argmax (#10441) пре 1 година
  Georgi Gerganov 1bb30bf28c llama : handle KV shift for recurrent models (#10402) пре 1 година
  Georgi Gerganov 87a533be57 sync : ggml пре 1 година
  slaren 59b9172822 ggml/sched : do not skip views in pre-assignments пре 1 година
  Johannes Gäßler 02e4eaf22f ggml-opt: fix data corruption (ggml/1022) пре 1 година
  Jeff Bolz 9abe9eeae9 vulkan: predicate max operation in soft_max shaders/soft_max (#10437) пре 1 година
  bandoti f95caa7954 cmake: add link dependencies to cmake find pkg (#10433) пре 1 година