Komit Sejarah

Pembuat SHA1 Pesan Tanggal
  0cc4m 3df784b305 Vulkan: VK_KHR_cooperative_matrix support to speed up prompt processing (#10597) 1 tahun lalu
  Robert Ormandi 86a1934978 metal : Extend how Llama.cpp locates metal resources (#10676) 1 tahun lalu
  Sukriti Sharma 784a14aa49 convert : add support for Roberta embeddings (#10695) 1 tahun lalu
  Georgi Gerganov c5ede3849f convert : add custom attention mapping 1 tahun lalu
  Xuan Son Nguyen f162d45a21 common : bring back --no-warmup to server (#10686) 1 tahun lalu
  Xuan Son Nguyen 6c5bc0625f server : (refactoring) do not rely on JSON internally (#10643) 1 tahun lalu
  Plamen Minev 7736837d62 fix(server) : not show alert when DONE is received (#10674) 1 tahun lalu
  Jeff Bolz c9c6e01dae vulkan: Add VK_NV_cooperative_matrix2 support for mul_mat and flash attention (#10206) 1 tahun lalu
  Riccardo Orlando 6fe6247831 llama : add Minerva 7B model support (#10673) 1 tahun lalu
  Georgi Gerganov 0cd182ebcc sync : ggml 1 tahun lalu
  PAB a8cbab201d ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037) 1 tahun lalu
  PAB c2082d93a8 ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034) 1 tahun lalu
  Daniel Bevenius d405804be8 py : update outdated copy-paste instructions [no ci] (#10667) 1 tahun lalu
  aryantandon01 f112d198cd Update deprecation-warning.cpp (#10619) 1 tahun lalu
  Georgi Gerganov 1da7b76569 server : fix speculative decoding with context shift (#10641) 1 tahun lalu
  Diego Devesa 59f4db1088 ggml : add predefined list of CPU backend variants to build (#10626) 1 tahun lalu
  Diego Devesa 2803540814 ggml-cpu : fix HWCAP2_I8MM value (#10646) 1 tahun lalu
  ltoniazzi 253b7fde91 Fix HF repo commit to clone lora test models (#10649) 1 tahun lalu
  JFLFY2255 8d0cfd554a llama: Support MiniCPM-1B (with & w/o longrope) (#10559) 1 tahun lalu
  Jeff Bolz 2759916d86 vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (#10642) 1 tahun lalu
  Nicolò Scipione 40c6d79fb5 SYCL : Move to compile time oneMKL interface backend selection for NVIDIA backend (#10584) 1 tahun lalu
  Wang Ran (汪然) 98036d5670 fix typo of README.md (#10605) 1 tahun lalu
  Frankie Robertson cd2f37b304 Avoid using __fp16 on ARM with old nvcc (#10616) 1 tahun lalu
  Benson Wong da6aac91f1 Add docs for creating a static build (#10268) (#10630) 1 tahun lalu
  piDack 01e6d9bb71 clip : add sycl support (#10574) 1 tahun lalu
  Jeff Bolz cc98896db8 vulkan: optimize and reenable split_k (#10637) 1 tahun lalu
  Xuan Son Nguyen 91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599) 1 tahun lalu
  Georgi Gerganov 1cd3df46bd scripts : remove amx sync 1 tahun lalu
  Georgi Gerganov c505471857 sync : ggml 1 tahun lalu
  mahorozte e9e661bd59 CUDA: remove unnecessary warp reduce in FA (ggml/1032) 1 tahun lalu