コミット履歴

作者 SHA1 メッセージ 日付
  Akarshan Biswas e62e9789cd Revert "[SYCL] fallback mmvq (#9088)" (#9579) 1 年間 前
  R0CKSTAR c35e586ea5 musa: enable building fat binaries, enable unified memory, and disable Flash Attention on QY1 (MTT S80) (#9526) 1 年間 前
  Molly Sophia 912c331d3d Fix merge error in #9454 (#9589) 1 年間 前
  Johannes Gäßler a5b57b08ce CUDA: enable Gemma FA for HIP/Pascal (#9581) 1 年間 前
  Shankar ecd5d6b65b llama: remove redundant loop when constructing ubatch (#9574) 1 年間 前
  Molly Sophia 2a63caaa69 RWKV v6: RWKV_WKV op CUDA implementation (#9454) 1 年間 前
  slaren d09770cae7 ggml-alloc : fix list of allocated tensors with GGML_ALLOCATOR_DEBUG (#9573) 1 年間 前
  agray3 41f477879f Update CUDA graph on scale change plus clear nodes/params (#9550) 1 年間 前
  Huang Qi e948a7da7a CI: Provide prebuilt windows binary for hip (#9467) 1 年間 前
  slaren 63351143b2 quantize : improve type name parsing (#9570) 1 年間 前
  Georgi Gerganov d13edb17ed ggml : fix builds (#0) 1 年間 前
  Georgi Gerganov 27609c49b9 ggml : fix trailing whitespace (#0) 1 年間 前
  Georgi Gerganov 4301535326 sync : ggml 1 年間 前
  Johannes Gäßler 424c5d00a9 ggml/examples: add backend support for numerical optimization (ggml/949) 1 年間 前
  Georgi Gerganov a6809c6a2e examples : add null threadpool args where needed (ggml/0) 1 年間 前
  Johannes Gäßler 5cb12f6839 CUDA: fix sum.cu compilation for CUDA < 11.7 (#9562) 1 年間 前
  Georgi Gerganov d39e26741f examples : flush log upon ctrl+c (#9559) 1 年間 前
  Sigbjørn Skjæret 722ec1eb51 perplexity : do not escape input data by default (#9548) 1 年間 前
  Georgi Gerganov 6026da52d6 server : clean-up completed tasks from waiting list (#9531) 1 年間 前
  Sigbjørn Skjæret eca0fab44e imatrix : disable prompt escape by default (#9543) 1 年間 前
  slaren 64c6af3195 ggml : fix n_threads_cur initialization with one thread (#9538) 1 年間 前
  Georgi Gerganov 0d2f22e45c scripts : verify py deps at the start of compare (#9520) 1 年間 前
  Daniel Bevenius 6443ddd985 llama : use reserve/emplace_back in sampler_sample (#9534) 1 年間 前
  Vinesh Janarthanan 8a308354f6 server : match OAI structured output response (#9527) 1 年間 前
  Eric Zhang f799155ab8 server : fix OpenSSL build (remove obsolete `LOG_INFO`) (#9529) 1 年間 前
  Neo Zhang Jianyu faf67b3de4 [SYCL]set context default value to avoid memory issue, update guide (#9476) 1 年間 前
  Michael Podvitskiy 7be099fa81 llama-bench: correct argument parsing error message (#9524) 1 年間 前
  Bert Wagner 8b836ae731 arg : add env variable for parallel (#9513) 1 年間 前
  Michael Podvitskiy 8344ef58f8 llama : fix n_vocab init for 'no_vocab' case (#9511) 1 年間 前
  Max Krasnyansky 0226613853 threadpool : skip polling for unused threads (#9461) 1 年間 前