コミット履歴

作者 SHA1 メッセージ 日付
  Georgi Gerganov 14278f55d2 ggml : restore vec dot stride arg names (#5453) 1 年間 前
  Georgi Gerganov b1de96824b ci : fix wikitext url + compile warnings (#5569) 1 年間 前
  Georgi Gerganov 7ad554f90e metal : fix unused warnings (#0) 1 年間 前
  Robey Holderith 5ee99c32f5 common, server : surface min_keep as its own parameter (#5567) 1 年間 前
  Pierrick Hymbert c145f8a132 server : slots monitoring endpoint (#5550) 1 年間 前
  Georgi Gerganov 689a091bbe sampling : do not set min_keep to n_probs (#5564) 1 年間 前
  Georgi Gerganov f3f28c5395 cmake : fix GGML_USE_SYCL typo (#5555) 1 年間 前
  Pierrick Hymbert e75c6279d1 server : enhanced health endpoint (#5548) 1 年間 前
  Pierrick Hymbert 36376abe05 server : --n-predict option document and cap to max value (#5549) 1 年間 前
  Daniel Hiltgen 66c1968f7a server : graceful server shutdown (#5244) 1 年間 前
  Georgi Gerganov 1dcc3fde00 common : fix ub (#5530) 1 年間 前
  Herman Semenov 5d3de51f97 ggml, common, examples, tests : fixed type arguments in printf (#5528) 1 年間 前
  Daniel Bevenius fc0c8d286a llava : update surgery script to not remove tensors (#5536) 1 年間 前
  Kawrakow bd2d4e393b 1.5 bit quantization (#5453) 1 年間 前
  github-actions[bot] c8e0d7efeb flake.lock: Update 1 年間 前
  Georgi Gerganov 8f1be0d42f ggml : add ALiBi support for ggml_soft_max_ext (#5488) 1 年間 前
  Ananta Bastola 6e4e973b26 ci : add an option to fail on compile warning (#3952) 1 年間 前
  clibdev d250c9d61d gitignore : update for CLion IDE (#5544) 1 年間 前
  Georgi Gerganov 5bf2b94dd4 cmake : fix VULKAN and ROCm builds (#5525) 1 年間 前
  Georgi Gerganov d2819d5577 scripts : add helpers script for bench comparing commits (#5521) 1 年間 前
  Herman Semenov 4cb0727698 llava : removed excess free(NULL) operation (#5531) 1 年間 前
  Herman Semenov 65085c713e llama : minor fixed return int value (#5529) 1 年間 前
  Alexey Parfenov 6dcc02d244 server : add "samplers" param to control the samplers order (#5494) 1 年間 前
  Rőczey Barnabás 5f5808ca7b server : fix system prompt cli (#5516) 1 年間 前
  bmwl f486f6e1e5 ggml : add numa options (#5377) 1 年間 前
  Daniel Bevenius 60ed04cf82 llava : fix clip-model-is-vision flag in README.md (#5509) 1 年間 前
  Georgi Gerganov 594845aab1 ci : fix BERT model download and convert 1 年間 前
  Douglas Hanley 4524290e87 Use correct type of pooling for embedding models (#5500) 1 年間 前
  Georgi Gerganov c06e45d729 clip : fix wrong loop condition 1 年間 前
  slaren 9060a1e9df cuda : print message when initialization fails (#5512) 1 年間 前