Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov 6381d4e110 gguf : new file format with flexible meta data (beta) (#2398) před 2 roky
  Stephan Walter 1b107b8550 ggml : generalize `quantize_fns` for simpler FP16 handling (#1237) před 2 roky
  Didzis Gosko 527b6fba1d llama : make model stateless and context stateful (llama_state) (#1797) před 2 roky
  Borislav Stanimirov 9cbf50c041 build : fix and ignore MSVC warnings (#1889) před 2 roky
  Kawrakow 99009e72f8 ggml : add SOTA 2,3,4,5,6 bit k-quantizations (#1684) před 2 roky
  Stephan Walter dc271c52ed Remove unused n_parts parameter (#1509) před 2 roky
  DannyDaemonic f4cef87edf Add git-based build information for better issue tracking (#1232) před 2 roky
  Kawrakow 38de86a711 llama : multi-threaded quantization (#1075) před 2 roky
  Georgi Gerganov eb17a026fd quantize-stats : fix bug in --type argument před 2 roky
  Pavol Rusnak c56b715269 Expose type name from ggml (#970) před 2 roky
  Georgi Gerganov 9190e8eac8 llama : merge llama_internal.h into llama.h před 2 roky
  comex f963b63afa Rewrite loading code to try to satisfy everyone: před 2 roky
  unbounded 62cfc54f77 Add quantize-stats command for testing quantization (#728) před 2 roky