Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov 9ca2e67762 server : add speculative decoding support (#10455) vor 1 Jahr
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) vor 1 Jahr
  Georgi Gerganov f6d12e7df8 tests : fix compile warning vor 1 Jahr
  Georgi Gerganov b756441104 metal : minor code formatting vor 1 Jahr
  Neo Zhang Jianyu 5a8987793f [SYCL] Fix building Win package for oneAPI 2025.0 update (#10483) vor 1 Jahr
  Georgi Gerganov d9d54e498d speculative : refactor and add a simpler example (#10362) vor 1 Jahr
  Georgi Gerganov cce5a90075 flake.lock: Update (#10470) vor 1 Jahr
  Diego Devesa dc39012cba llama : fix op mul check with command-r-plus (#10476) vor 1 Jahr
  Gabe Goodhart 9336db462c convert : XLMRoberta Type Vocab Size (#10458) vor 1 Jahr
  momonga 96fa2c5e2d fix gguf-py: Conversion error when multiple licenses are configured (#9807) vor 1 Jahr
  Diego Devesa 55ed008b2d ggml : do not use ARM features not included in the build (#10457) vor 1 Jahr
  蕭澧邦 6dfcfef078 ci: Update oneAPI runtime dll packaging (#10428) vor 1 Jahr
  Johannes Gäßler 599b3e0cd4 GitHub: ask for more info in issue templates (#10426) vor 1 Jahr
  leo-pony c18610b4ee CANN: Support Ascend310P to accelerate F32 and F16 Model (#10216) vor 1 Jahr
  Diego Devesa a5e47592b6 cuda : optimize argmax (#10441) vor 1 Jahr
  Georgi Gerganov 1bb30bf28c llama : handle KV shift for recurrent models (#10402) vor 1 Jahr
  Georgi Gerganov 87a533be57 sync : ggml vor 1 Jahr
  slaren 59b9172822 ggml/sched : do not skip views in pre-assignments vor 1 Jahr
  Johannes Gäßler 02e4eaf22f ggml-opt: fix data corruption (ggml/1022) vor 1 Jahr
  Jeff Bolz 9abe9eeae9 vulkan: predicate max operation in soft_max shaders/soft_max (#10437) vor 1 Jahr
  bandoti f95caa7954 cmake: add link dependencies to cmake find pkg (#10433) vor 1 Jahr
  Diego Devesa fab5d30ff6 llama : add .clang-format file (#10415) vor 1 Jahr
  Jeff Bolz 8fd4b7fa29 vulkan: copy iq4_nl LUT into shared memory (#10409) vor 1 Jahr
  Jeff Bolz 1bacb9f625 vulkan: further optimize mul_mat_vec using larger loads (#10387) vor 1 Jahr
  Neo Zhang Jianyu ad21c9e1f1 update rel to 4040 (#10395) vor 1 Jahr
  Anthony Van de Gejuchte 3952a221af Fix missing file renames in Makefile due to changes in commit ae8de6d50a (#10413) vor 1 Jahr
  haopeng 42ae10bbcd add cmake rvv support (#10411) vor 1 Jahr
  Georgi Gerganov 9fe0fb0626 sync : ggml vor 1 Jahr
  Plamen Minev 611fabd792 metal : fox offset integer overflows in im2col (ggml/1015) vor 1 Jahr
  PAB 12b0ad953a metal : add `GGML_UNARY_OP_ELU` kernel (ggml/1018) vor 1 Jahr