Commit Verlauf

Autor SHA1 Nachricht Datum
  fairydreaming 7c3f55c100 Add support for encoder-only T5 models (#8900) vor 1 Jahr
  Georgi Gerganov 45a55b91aa llama : better replace_all (cont) (#8926) vor 1 Jahr
  Xuan Son Nguyen 1e6f6554aa server : add lora hotswap endpoint (WIP) (#8857) vor 1 Jahr
  Liu Jia 0a4ce78681 common : Changed tuple to struct (TODO fix) (#8823) vor 1 Jahr
  Igor Okulist afbbcf3c04 server : update llama-server embedding flag documentation (#8779) vor 1 Jahr
  Daniel Bevenius 9d03d085dd common : add --no-warmup option for main/llama-cli (#8712) vor 1 Jahr
  Xuan Son Nguyen 96952e7181 llama : fix `llama_chat_format_single` for mistral (#8657) vor 1 Jahr
  Xuan Son Nguyen de280085e7 examples : Fix `llama-export-lora` example (#8607) vor 1 Jahr
  Xuan Son Nguyen 97bdd26eee Refactor lora adapter support (#8332) vor 1 Jahr
  Georgi Gerganov 9104bc20ed common : add --no-cont-batching arg (#6358) vor 1 Jahr
  Borislav Stanimirov 7a80710d93 msvc : silence codecvt c++17 deprecation warnings (#8395) vor 1 Jahr
  Derrick T. Woolworth 86e7299ef5 added support for Authorization Bearer tokens when downloading model (#8307) vor 1 Jahr
  jaime-m-p 213701b51a Detokenizer fixes (#8039) vor 1 Jahr
  Douglas Hanley d12f781074 llama : streamline embeddings from "non-embedding" models (#8087) vor 1 Jahr
  Xuan Son Nguyen a38b884c6c cli: add EOT when user hit Ctrl+C (#8296) vor 1 Jahr
  fairydreaming 807b0c49ff Inference support for T5 and FLAN-T5 model families (#5763) vor 1 Jahr
  MistApproach a27152b602 fix: add missing short command line argument -mli for multiline-input (#8261) vor 1 Jahr
  Xuan Son Nguyen 9ef0780062 Fix new line issue with chat template, disable template when in-prefix/suffix is set (#8203) vor 1 Jahr
  Sigbjørn Skjæret 38373cfbab Add SPM infill support (#8016) vor 1 Jahr
  Xuan Son Nguyen 16791b8f0b Add chatml fallback for cpp `llama_chat_apply_template` (#8160) vor 1 Jahr
  jukofyork 97877eb10b Control vector loading fixes (#8137) vor 1 Jahr
  Xuan Son Nguyen 49c03c79cd cvector: better prompt handling, add "mean vector" method (#8069) vor 1 Jahr
  Xuan Son Nguyen 48e6b92cc3 Add chat template support for llama-cli (#8068) vor 1 Jahr
  HatsuneMikuUwU33 f702a90e24 Update control vector help (#8104) vor 1 Jahr
  Yann Follet 646ef4a9cf embedding : more cli arguments (#7458) vor 1 Jahr
  Xuan Son Nguyen 3e58b0ee35 cvector: fix CI + correct help message (#8064) vor 1 Jahr
  Douglas Hanley 80ea089d77 llama : allow pooled embeddings on any model (#7477) vor 1 Jahr
  Johannes Gäßler abd894ad96 common: fix warning (#8036) vor 1 Jahr
  Xuan Son Nguyen 0c7b3595b9 Add `cvector-generator` example (#7514) vor 1 Jahr
  Olivier Chafik d4d915d351 url: save -mu downloads to new cache location (#7826) vor 1 Jahr