Commit History

Autor SHA1 Mensaxe Data
  Dawid Potocki 83330d8cd6 main : add --conversation / -cnv flag (#7108) hai 1 ano
  Eve 465263d0cf sgemm : AVX Q4_0 and Q8_0 (#6891) hai 1 ano
  Johan 911b3900dd server : add_special option for tokenize endpoint (#7059) hai 1 ano
  20kdc ad211edef5 convert.py : --vocab-only generates false but valid params (#7027) hai 1 ano
  Ren Xuancheng 229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114) hai 1 ano
  Xuan Son Nguyen 1fd9c1741d clean up json_value & server_log (#7142) hai 1 ano
  DAN™ 4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132) hai 1 ano
  Georgi Gerganov 7e0b6a7b3b py : also print the normalizers hai 1 ano
  Brian acdce3cdef compare-llama-bench.py: add missing basicConfig (#7138) hai 1 ano
  Justine Tunney 3855416027 ggml : introduce bfloat16 support (#6412) hai 1 ano
  Georgi Gerganov c0e6fbf8c3 metal : fix unused warning hai 1 ano
  Jeximo c780e75305 Further tidy on Android instructions README.md (#7077) hai 1 ano
  jukofyork 48b2f9c1fc Fixed save_imatrix to match old behaviour for MoE (#7099) hai 1 ano
  Johannes Gäßler af0a5b6163 server: fix incorrectly reported token probabilities (#7125) hai 1 ano
  nopperl b6aa670203 Fix OLMo HF to GGUF conversion (#6910) hai 1 ano
  Kyle Mistele 260b7c6529 server : update readme with undocumented options (#7013) hai 1 ano
  Georgi Gerganov 53d6c52e22 readme : update hot topics hai 1 ano
  RhinoDevel 3af34c1d1b main : update log text (EOS to EOG) (#7104) hai 1 ano
  omahs 04976db7a8 docs: fix typos (#7124) hai 1 ano
  Georgi Gerganov 947d3ad27d ci : add GG_BUILD_EXTRA_TESTS_0 env (#7098) hai 1 ano
  William Tambellini 858f6b73f6 Add an option to build without CUDA VMM (#7067) hai 1 ano
  Georgi Gerganov b3a995b416 flake.lock: Update (#7079) hai 1 ano
  Georgi Gerganov bcdee0daa7 minor : fix trailing whitespace hai 1 ano
  kunnis 628b299106 Adding support for the --numa argument for llama-bench. (#7080) hai 1 ano
  Sigbjørn Skjæret 8f8acc8683 Disable benchmark on forked repo (#7034) hai 1 ano
  Lyle Dean ca36326020 readme : add note that LLaMA 3 is not supported with convert.py (#7065) hai 1 ano
  DAN™ 889bdd7686 command-r : add BPE pre-tokenization (#7063) hai 1 ano
  Brian 6fbd432211 py : logging and flake8 suppression refactoring (#7081) hai 1 ano
  Xuan Son Nguyen 842500144e gguf-split: add --no-tensor-first-split (#7072) hai 1 ano
  Jeximo cf768b7e71 Tidy Android Instructions README.md (#7016) hai 1 ano