История коммитов

Автор SHA1 Сообщение Дата
  Johannes Gäßler 1613ef8d8e CUDA: CUDART < 11.7 workaround for __hmax, __hmax2 (#7019) 1 год назад
  slaren c4ec9c0d3d ci : exempt confirmed bugs from being tagged as stale (#7014) 1 год назад
  Johannes Gäßler a8f9b07631 perplexity: more statistics, added documentation (#6936) 1 год назад
  Kevin Gibbons f364eb6fb5 switch to using localizedDescription (#7010) 1 год назад
  Georgi Gerganov 77e15bec62 metal : remove deprecated error code (#7008) 1 год назад
  Kevin Gibbons a68a1e7ed0 metal : log more info on error (#6987) 1 год назад
  Georgi Gerganov 9c67c2773d ggml : add Flash Attention (#5021) 1 год назад
  Georgi Gerganov 952d03dbea convert : use utf8 encoding (#7000) 1 год назад
  Olivier Chafik 8843a98c2b Improve usability of --model-url & related flags (#6930) 1 год назад
  Clint Herron b8c1476e44 Extending grammar integration tests (#6644) 1 год назад
  Daniel Bevenius 5539e6fdd1 main : fix typo in comment in main.cpp (#6985) 1 год назад
  Olivier Chafik b8a7a5a90f build(cmake): simplify instructions (`cmake -B build && cmake --build build ...`) (#6964) 1 год назад
  Georgi Gerganov d2c898f746 ci : tmp disable gguf-split (#6983) 1 год назад
  Georgi Gerganov 544f1f10ad ggml : fix __MSC_VER -> _MSC_VER (#6977) 1 год назад
  cpumaxx ffe666572f llava-cli : multiple images (#6969) 1 год назад
  Georgi Gerganov 24affa7db3 readme : update hot topics 1 год назад
  Georgi Gerganov f4ab2a4147 llama : fix BPE pre-tokenization (#6920) 1 год назад
  David Renshaw 3f167476b1 sampling : use std::random_device{}() for default random seed (#6962) 1 год назад
  Christian Zhou-Zheng 3055a41805 convert : fix conversion of some BERT embedding models (#6937) 1 год назад
  Przemysław Pawełczyk 577277ffd2 make : change GNU make default CXX from g++ to c++ (#6966) 1 год назад
  Przemysław Pawełczyk ca7f29f568 ci : add building in MSYS2 environments (Windows) (#6967) 1 год назад
  Johannes Gäßler c4f708a93f llama : fix typo LAMMAFILE -> LLAMAFILE (#6974) 1 год назад
  DAN™ e00b4a8f81 Fix more int overflow during quant (PPL/CUDA). (#6563) 1 год назад
  Xuan Son Nguyen 7bb36ccf91 gguf : enforce that tensor names are unique (#6905) 1 год назад
  Neo Zhang ce023f6f2f add device version in device list (#6959) 1 год назад
  github-actions[bot] 6e472f58e4 flake.lock: Update 1 год назад
  mgroeber9110 4dba7e8114 Replace "alternative" boolean operator in conditional compilation directive (#6949) 1 год назад
  Pierrick Hymbert b7368332e2 ci: server: tests python env on github container ubuntu latest / fix n_predict (#6935) 1 год назад
  agray3 928e0b7013 Reset schedule earlier to allow overlap with ggml graph computation on device (#6933) 1 год назад
  Pierrick Hymbert 0c4d489e29 quantize: add imatrix and dataset metadata in GGUF (#6658) 1 год назад