Историја ревизија

Аутор SHA1 Порука Датум
  Borislav Stanimirov 1a05004743 cmake : simplify msvc charsets (#10672) пре 1 година
  Xuan Son Nguyen ce8784bdb1 server : fix format_infill (#10724) пре 1 година
  Xuan Son Nguyen e52522b869 server : bring back info of final chunk in stream mode (#10722) пре 1 година
  stduhpf 06d70147e6 Vulkan: fix NaN in tanh.comp with AMD proprietary driver on Windows (#10723) пре 1 година
  Diego Devesa 43ed389a3f llama : use cmake for swift build (#10525) пре 1 година
  Jeff Bolz ecc93d0558 vulkan: compile a test shader in cmake to check for coopmat2 support (#10713) пре 1 година
  Robert Collins 62e84d9848 llama : add 128k yarn context for Qwen (#10698) пре 1 година
  Xuan Son Nguyen 3573fa8e7b server : (refactor) no more json in server_task input (#10691) пре 1 година
  Georgi Gerganov d9c3ba2b77 ggml : disable iq4_nl interleave size 8 (#10709) пре 1 година
  Georgi Gerganov ce4a7b8493 server : various fixes (#10704) пре 1 година
  Djip007 19d8762ab6 ggml : refactor online repacking (#10446) пре 1 година
  Georgi Gerganov c2a16c0bdb server : fix free of spec context and batch (#10651) пре 1 година
  0cc4m 3df784b305 Vulkan: VK_KHR_cooperative_matrix support to speed up prompt processing (#10597) пре 1 година
  Robert Ormandi 86a1934978 metal : Extend how Llama.cpp locates metal resources (#10676) пре 1 година
  Sukriti Sharma 784a14aa49 convert : add support for Roberta embeddings (#10695) пре 1 година
  Georgi Gerganov c5ede3849f convert : add custom attention mapping пре 1 година
  Xuan Son Nguyen f162d45a21 common : bring back --no-warmup to server (#10686) пре 1 година
  Xuan Son Nguyen 6c5bc0625f server : (refactoring) do not rely on JSON internally (#10643) пре 1 година
  Plamen Minev 7736837d62 fix(server) : not show alert when DONE is received (#10674) пре 1 година
  Jeff Bolz c9c6e01dae vulkan: Add VK_NV_cooperative_matrix2 support for mul_mat and flash attention (#10206) пре 1 година
  Riccardo Orlando 6fe6247831 llama : add Minerva 7B model support (#10673) пре 1 година
  Georgi Gerganov 0cd182ebcc sync : ggml пре 1 година
  PAB a8cbab201d ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037) пре 1 година
  PAB c2082d93a8 ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034) пре 1 година
  Daniel Bevenius d405804be8 py : update outdated copy-paste instructions [no ci] (#10667) пре 1 година
  aryantandon01 f112d198cd Update deprecation-warning.cpp (#10619) пре 1 година
  Georgi Gerganov 1da7b76569 server : fix speculative decoding with context shift (#10641) пре 1 година
  Diego Devesa 59f4db1088 ggml : add predefined list of CPU backend variants to build (#10626) пре 1 година
  Diego Devesa 2803540814 ggml-cpu : fix HWCAP2_I8MM value (#10646) пре 1 година
  ltoniazzi 253b7fde91 Fix HF repo commit to clone lora test models (#10649) пре 1 година