Histórico de Commits

Autor SHA1 Mensagem Data
  Georgi Gerganov cea1486ecf log : add CONT level for continuing previous log entry (#9610) há 1 ano atrás
  StrangeBytesDev 0aa15011e3 server : add newline after chat example (#9616) há 1 ano atrás
  Georgi Gerganov b0f27361f3 sampling : avoid expensive softmax during greedy sampling (#9605) há 1 ano atrás
  Max Krasnyansky c087b6f11d threads: fix msvc build without openmp (#9615) há 1 ano atrás
  Ivan 116efee0ee cuda: add q8_0->f32 cpy operation (#9571) há 1 ano atrás
  Xuan Son Nguyen 0b3bf966f4 server : add --no-context-shift option (#9607) há 1 ano atrás
  Max Krasnyansky f0c7b5edf8 threads: improve ggml_barrier scaling with large number of threads (#9598) há 1 ano atrás
  Riceball LEE 1d48e98e4f readme : add programmable prompt engine language CLI (#9599) há 1 ano atrás
  Georgi Gerganov f3979df762 flake.lock: Update (#9586) há 1 ano atrás
  Srihari-mcw 1e7b9299c6 ggml : AVX512 gemm for Q4_0_8_8 (#9532) há 1 ano atrás
  Georgi Gerganov 37f8c7b4c9 perplexity : remove extra new lines after chunks (#9596) há 1 ano atrás
  Georgi Gerganov bf9c1013ac metal : use F32 prec for K*Q in vec FA (#9595) há 1 ano atrás
  Akarshan Biswas e62e9789cd Revert "[SYCL] fallback mmvq (#9088)" (#9579) há 1 ano atrás
  R0CKSTAR c35e586ea5 musa: enable building fat binaries, enable unified memory, and disable Flash Attention on QY1 (MTT S80) (#9526) há 1 ano atrás
  Molly Sophia 912c331d3d Fix merge error in #9454 (#9589) há 1 ano atrás
  Johannes Gäßler a5b57b08ce CUDA: enable Gemma FA for HIP/Pascal (#9581) há 1 ano atrás
  Shankar ecd5d6b65b llama: remove redundant loop when constructing ubatch (#9574) há 1 ano atrás
  Molly Sophia 2a63caaa69 RWKV v6: RWKV_WKV op CUDA implementation (#9454) há 1 ano atrás
  slaren d09770cae7 ggml-alloc : fix list of allocated tensors with GGML_ALLOCATOR_DEBUG (#9573) há 1 ano atrás
  agray3 41f477879f Update CUDA graph on scale change plus clear nodes/params (#9550) há 1 ano atrás
  Huang Qi e948a7da7a CI: Provide prebuilt windows binary for hip (#9467) há 1 ano atrás
  slaren 63351143b2 quantize : improve type name parsing (#9570) há 1 ano atrás
  Georgi Gerganov d13edb17ed ggml : fix builds (#0) há 1 ano atrás
  Georgi Gerganov 27609c49b9 ggml : fix trailing whitespace (#0) há 1 ano atrás
  Georgi Gerganov 4301535326 sync : ggml há 1 ano atrás
  Johannes Gäßler 424c5d00a9 ggml/examples: add backend support for numerical optimization (ggml/949) há 1 ano atrás
  Georgi Gerganov a6809c6a2e examples : add null threadpool args where needed (ggml/0) há 1 ano atrás
  Johannes Gäßler 5cb12f6839 CUDA: fix sum.cu compilation for CUDA < 11.7 (#9562) há 1 ano atrás
  Georgi Gerganov d39e26741f examples : flush log upon ctrl+c (#9559) há 1 ano atrás
  Sigbjørn Skjæret 722ec1eb51 perplexity : do not escape input data by default (#9548) há 1 ano atrás