Историја ревизија

Аутор SHA1 Порука Датум
  Georgi Gerganov cc4a95426d llama : fix attention layer count sanity check (#6550) пре 1 година
  kunnis cecd8d3c98 Comment explaining a decision (#6531) пре 1 година
  Georgi Gerganov b73e564b16 quantize : fix precedence of cli args (#6541) пре 1 година
  Rick G e3c337d87c llama : support negative ith in llama_get_ API (#6519) пре 1 година
  Jan Boon beea6e1b16 llama : save and restore kv cache for single seq id (#6341) пре 1 година
  Abhilash Majumder 87fb5b4234 remove row=1 cond (#6532) пре 1 година
  Firat d752327c33 Adding KodiBot to UI list (#6535) пре 1 година
  Mark Fairbairn 855f54402e Change Windows AMD example to release build to make inference much faster. (#6525) пре 1 година
  Georgi Gerganov b909236c0b flake.lock: Update (#6517) пре 1 година
  DAN™ e0717e751e Add GritLM as supported models. (#6513) пре 1 година
  Georgi Gerganov c37247796b sync : ggml пре 1 година
  Slava Primenko f77261a7c5 ggml: bypass code incompatible with CUDA < 11.1 (whisper/2020) пре 1 година
  Georgi Gerganov 43e8995e75 scripts : sync ggml-cuda folder пре 1 година
  limitedAtonement 9472bce308 Run make to build the project (#6457) пре 1 година
  Neo Zhang Jianyu d4f220a5cc support/fix OPs GGML_TYPE_IQ4_NL, GGML_TYPE_IQ4_XS, GGML_TYPE_IQ3_XXS, GGML_TYPE_IQ3_S, GGML_TYPE_IQ2_XXS, GGML_TYPE_IQ2_XS, GGML_TYPE_IQ2_S, GGML_TYPE_IQ1_S, GGML_TYPE_IQ1_M (#6521) пре 1 година
  Georgi Gerganov 54ea0698fb sync : ggml пре 1 година
  Daniel Bevenius b66aec675c backend : fix typo in scheduler documentation (ggml/781) пре 1 година
  Clint Herron 57dd02c44b Tests: Added integration tests for GBNF parser (#6472) пре 1 година
  Pierrick Hymbert 75cd4c7729 ci: bench: support sse and fix prompt processing time / server: add tokens usage in stream OAI response (#6495) пре 1 година
  Brian a8bd14d557 gguf.py : add licence and version to gguf writer (#6504) пре 1 година
  Hoang Nguyen d0f5deebf8 readme : update UI list (#6503) пре 1 година
  Ting Sun 87e21bbacd bench : make n_batch and n_ubatch configurable in Batched bench (#6500) пре 1 година
  Ouadie EL FAROUKI 1b496a745c [SYCL] Fixed minor bug when enabling FP16 for non intel targets (#6464) пре 1 година
  alexpinel a307375c02 readme : add Dot to UI list (#6487) пре 1 година
  Jun Jie b660a5729e readme : fix typo (#6481) пре 1 година
  Ed Lepedus 0a1d889e27 server: add cURL support to server Dockerfiles (#6474) пре 1 година
  Minsoo Cheong 7dda1b727e ci: exempt master branch workflows from getting cancelled (#6486) пре 1 година
  Ewout ter Hoeven c666ba26c3 build CI: Name artifacts (#6482) пре 1 година
  Shakhar Dasgupta 2e66913e5f server: allow penalizing repetition of newlines on server webpage (#6431) пре 1 година
  Pierrick Hymbert 8120efee1d ci: bench fix concurrency for workflow trigger dispatch with sha1 (#6478) пре 1 година