История коммитов

Автор SHA1 Сообщение Дата
  omahs 04976db7a8 docs: fix typos (#7124) 1 год назад
  Georgi Gerganov 947d3ad27d ci : add GG_BUILD_EXTRA_TESTS_0 env (#7098) 1 год назад
  William Tambellini 858f6b73f6 Add an option to build without CUDA VMM (#7067) 1 год назад
  Georgi Gerganov b3a995b416 flake.lock: Update (#7079) 1 год назад
  Georgi Gerganov bcdee0daa7 minor : fix trailing whitespace 1 год назад
  kunnis 628b299106 Adding support for the --numa argument for llama-bench. (#7080) 1 год назад
  Sigbjørn Skjæret 8f8acc8683 Disable benchmark on forked repo (#7034) 1 год назад
  Lyle Dean ca36326020 readme : add note that LLaMA 3 is not supported with convert.py (#7065) 1 год назад
  DAN™ 889bdd7686 command-r : add BPE pre-tokenization (#7063) 1 год назад
  Brian 6fbd432211 py : logging and flake8 suppression refactoring (#7081) 1 год назад
  Xuan Son Nguyen 842500144e gguf-split: add --no-tensor-first-split (#7072) 1 год назад
  Jeximo cf768b7e71 Tidy Android Instructions README.md (#7016) 1 год назад
  viric fcd84a0f5a Fix Linux /sys cpu path to guess number of cores (#7064) 1 год назад
  maor-ps 03fb8a002d If first token generated from the server is the stop word the server will crash (#7038) 1 год назад
  Georgi Gerganov 92139b90af tests : add test-tokenizer-0.sh + fix some tokenizers (#7036) 1 год назад
  Brian a2ac89d6ef convert.py : add python logging instead of print() (#6511) 1 год назад
  Daniel Bevenius 433def286e llama : rename ctx to user_data in progress_callback (#7045) 1 год назад
  Bartowski 60325fa56f Remove .attention from skipped tensors to match more accurately (#7051) 1 год назад
  alwqx 6ecf3189e0 chore: fix typo in llama.cpp (#7032) 1 год назад
  Andrew Downing b0d943de17 Update LOG_IMPL and LOG_TEE_IMPL (#7029) 1 год назад
  l3utterfly 8d608a81b7 main : fix off by one error for context shift (#6921) 1 год назад
  Johannes Gäßler 3ea0d36000 Server: add tests for batch size, different seeds (#6950) 1 год назад
  Johannes Gäßler 1613ef8d8e CUDA: CUDART < 11.7 workaround for __hmax, __hmax2 (#7019) 1 год назад
  slaren c4ec9c0d3d ci : exempt confirmed bugs from being tagged as stale (#7014) 1 год назад
  Johannes Gäßler a8f9b07631 perplexity: more statistics, added documentation (#6936) 1 год назад
  Kevin Gibbons f364eb6fb5 switch to using localizedDescription (#7010) 1 год назад
  Georgi Gerganov 77e15bec62 metal : remove deprecated error code (#7008) 1 год назад
  Kevin Gibbons a68a1e7ed0 metal : log more info on error (#6987) 1 год назад
  Georgi Gerganov 9c67c2773d ggml : add Flash Attention (#5021) 1 год назад
  Georgi Gerganov 952d03dbea convert : use utf8 encoding (#7000) 1 год назад