Commit History

Автор SHA1 Съобщение Дата
  Kyle Mistele 39baaf55a1 docker : add server-first container images (#5157) преди 2 години
  Maximilian Winter ec903c0341 server : add self-extend support (#5104) преди 2 години
  Michael Coppola 27379455c3 server : support for multiple api keys (#4864) преди 2 години
  Behnam M 7a9f75c38b server : update readme to document the new `/health` endpoint (#4866) преди 2 години
  Behnam M 128de3585b server : update readme about token probs (#4777) преди 2 години
  Zsapi 8c58330318 server : add api-key flag to documentation (#4832) преди 2 години
  Michael Coppola e5804313a1 server : fix options in README.md (#4765) преди 2 години
  Karthik Sethuraman b93edd22f5 server : allow to generate multimodal embeddings (#4681) преди 2 години
  Alexey Parfenov 6123979952 server : allow to specify custom prompt for penalty calculation (#3727) преди 2 години
  Yueh-Po Peng 8a7b2fa528 Update README.md (#4388) преди 2 години
  Georgi Gerganov af19d35734 server : OAI API compatibility (#4198) преди 2 години
  Mihai 57ad015dc3 server : add min_p param (#3877) преди 2 години
  Thái Hoàng Tâm bb60fd0bf6 server : fix typo for --alias shortcut from -m to -a (#3958) преди 2 години
  Georgi Gerganov 438c2ca830 server : parallel decoding and multimodal (#3677) преди 2 години
  Georgi Gerganov e74c705e15 editorconfig : remove trailing spaces преди 2 години
  coezbek 3ad1e3f1a1 server : documentation of JSON return value of /completion endpoint (#3632) преди 2 години
  Mihai cb13d73a72 server : docs fix default values and add n_probs (#3506) преди 2 години
  vvhg1 c97f01c362 infill : add new example + extend server API (#3296) преди 2 години
  slaren 16bc66d947 llama.cpp : split llama_context_params into model and context params (#3301) преди 2 години
  Bruce MacDonald c1ac54b77a server : add `/detokenize` endpoint (#2802) преди 2 години
  lon bae5c5f679 examples : skip unnecessary external lib in server README.md how-to (#2804) преди 2 години
  Xiao-Yong Jin b8ad1b66b2 server : allow json array in prompt or content for direct token input (#2306) преди 2 години
  Georgi Gerganov 6381d4e110 gguf : new file format with flexible meta data (beta) (#2398) преди 2 години
  Cheng Shao d75561df20 server : add --numa support (#2524) преди 2 години
  Martin Krasser f5bfea0580 Allow passing grammar to completion endpoint (#2532) преди 2 години
  Bono Lv c574bddb36 fix a typo in examples/server/README.md (#2478) преди 2 години
  Xiao-Yong Jin 6e7cca4047 llama : add custom RoPE (#2054) преди 2 години
  Howard Su 32c5411631 Revert "Support using mmap when applying LoRA (#2095)" (#2206) преди 2 години
  Howard Su 2347463201 Support using mmap when applying LoRA (#2095) преди 2 години
  Judd 36680f6e40 convert : update for baichuan (#2081) преди 2 години