Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov 0cd182ebcc sync : ggml hace 1 año
  PAB a8cbab201d ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037) hace 1 año
  PAB c2082d93a8 ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034) hace 1 año
  Daniel Bevenius d405804be8 py : update outdated copy-paste instructions [no ci] (#10667) hace 1 año
  aryantandon01 f112d198cd Update deprecation-warning.cpp (#10619) hace 1 año
  Georgi Gerganov 1da7b76569 server : fix speculative decoding with context shift (#10641) hace 1 año
  Diego Devesa 59f4db1088 ggml : add predefined list of CPU backend variants to build (#10626) hace 1 año
  Diego Devesa 2803540814 ggml-cpu : fix HWCAP2_I8MM value (#10646) hace 1 año
  ltoniazzi 253b7fde91 Fix HF repo commit to clone lora test models (#10649) hace 1 año
  JFLFY2255 8d0cfd554a llama: Support MiniCPM-1B (with & w/o longrope) (#10559) hace 1 año
  Jeff Bolz 2759916d86 vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (#10642) hace 1 año
  Nicolò Scipione 40c6d79fb5 SYCL : Move to compile time oneMKL interface backend selection for NVIDIA backend (#10584) hace 1 año
  Wang Ran (汪然) 98036d5670 fix typo of README.md (#10605) hace 1 año
  Frankie Robertson cd2f37b304 Avoid using __fp16 on ARM with old nvcc (#10616) hace 1 año
  Benson Wong da6aac91f1 Add docs for creating a static build (#10268) (#10630) hace 1 año
  piDack 01e6d9bb71 clip : add sycl support (#10574) hace 1 año
  Jeff Bolz cc98896db8 vulkan: optimize and reenable split_k (#10637) hace 1 año
  Xuan Son Nguyen 91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599) hace 1 año
  Georgi Gerganov 1cd3df46bd scripts : remove amx sync hace 1 año
  Georgi Gerganov c505471857 sync : ggml hace 1 año
  mahorozte e9e661bd59 CUDA: remove unnecessary warp reduce in FA (ggml/1032) hace 1 año
  PAB efb6ae9630 feat: add `GGML_UNARY_OP_ARGMAX` Metal kernel (ggml/1019) hace 1 año
  PAB 667d70d170 metal : add `GGML_OP_CONV_TRANSPOSE_1D` kernels (ggml/1026) hace 1 año
  Xuan Son Nguyen 3b4f2e33e2 llama : add missing LLAMA_API for llama_chat_builtin_templates (#10636) hace 1 año
  Nikolaos Pothitos 82bca2257b readme : add option, update default value, fix formatting (#10271) hace 1 año
  Georgi Gerganov 0115df2f65 metal : small-batch mat-mul kernels (#10581) hace 1 año
  Georgi Gerganov 515d4e5372 github : minify link [no ci] (revert) hace 1 año
  Georgi Gerganov 844e2e1fee github : minify link [no ci] hace 1 año
  Georgi Gerganov 70b98fadbc server : fix default draft model parameters (#10586) hace 1 año
  Xuan Son Nguyen 642330ac7c llama : add enum for built-in chat templates (#10623) hace 1 año