Историја ревизија

Аутор SHA1 Порука Датум
  Georgi Gerganov d795988d9e Revert "llava : add a MobileVLM_V2-1.7B backup (#6152)" пре 1 година
  Ziang Wu f8c4e745e1 llava : add a MobileVLM_V2-1.7B backup (#6152) пре 1 година
  Karthick 47cc7a7bf9 Server: Handle n_keep parameter in the request (#6174) пре 1 година
  Jared Van Bortel bd60d82d0c server tests : more pythonic process management; fix bare `except:` (#6146) пре 1 година
  Neo Zhang Jianyu 6c0b287748 update readme sycl for new update (#6151) пре 1 година
  Abhilash Majumder d26e8b669d increase igpu cluster limit (#6159) пре 1 година
  DAN™ d8b009a945 Remove undeed header file. (#6158) пре 1 година
  Pierrick Hymbert d0d5de42e5 gguf-split: split and merge gguf per batch of tensors (#6135) пре 1 година
  Georgi Gerganov b80cf3b2d1 common : disable repeat penalties by default (#6127) пре 1 година
  slaren 970a48060a ci : exempt some labels from being tagged as stale (#6140) пре 1 година
  DAN™ 4c28b82529 common : print usage on '-h' and '--help' (#6145) пре 1 година
  github-actions[bot] 2d15886bb0 flake.lock: Update пре 1 година
  Jared Van Bortel d199ca79f2 mpt : implement backwards compatiblity with duped output tensor (#6139) пре 1 година
  Felix 104f5e0fc1 clip : fix memory leak (#6138) пре 1 година
  slaren 5e1b7f94a0 backend : set max split inputs to GGML_MAX_SRC (#6137) пре 1 година
  Georgi Gerganov ac9ee6a4ad ci : disable stale issue messages (#6126) пре 1 година
  Georgi Gerganov 4f6d1337ca ci : temporary disable sanitizer builds (#6128) пре 1 година
  slaren 2bf8d0f7c4 backend : offload large batches to GPU (#6083) пре 1 година
  DAN™ 496bc79bc2 common : tidy-up argument parsing (#6105) пре 1 година
  Thérence 9b03719ad7 convert : add support for CamembertModel architecture (#6119) пре 1 година
  Romain D 3a6efdd03c convert : use f32 outtype for bf16 tensors (#6106) пре 1 година
  Pierrick Hymbert d01b3c4c32 common: llama_load_model_from_url using --model-url (#6098) пре 1 година
  Georgi Gerganov cd776c37c9 ci : close all stale issues at once (#6115) пре 1 година
  GainLee dc0f612548 ggml:fix finding transfer queue family index error (#6094) пре 1 година
  AmirAli Mirian c47cf414ef ggml : add AVX512F SIMD (#6088) пре 1 година
  Daniel Bevenius b5f4ae09c3 gritlm : add initial README.md (#6086) пре 1 година
  Xuan Son Nguyen dfbfdd60f9 readme : add wllama as a wasm binding (#6100) пре 1 година
  DAN™ 15961ec04d common : refactor nested if causing error C1061 on MSVC (#6101) пре 1 година
  Pierrick Hymbert a56d09a440 ci : close inactive issue with workflow (#6053) пре 1 година
  slaren d84c48505f llama : fix Baichuan2 13B (#6092) пре 1 година