Historial de Commits

Autor SHA1 Mensaje Fecha
  Olivier Chafik 6171c9d258 Add Jinja template support (#11016) hace 1 año
  Georgi Gerganov a3c1232c3f arg : option to exclude arguments from specific examples (#11136) hace 1 año
  Xuan Son Nguyen 0da5d86026 server : allow using LoRA adapters per-request (#10994) hace 1 año
  Xuan Son Nguyen 5896c65232 server : add OAI compat for /v1/completions (#10974) hace 1 año
  Isaac McFadyen f865ea149d server: added more docs for response_fields field (#10995) hace 1 año
  NeverLucky 09fe2e7613 server: allow filtering llama server response fields (#10940) hace 1 año
  Xuan Son Nguyen 485dc01214 server : add system_fingerprint to chat/completion (#10917) hace 1 año
  Xuan Son Nguyen 57bb2c40cd server : fix logprobs, make it OAI-compatible (#10783) hace 1 año
  Georgi Gerganov 152610eda9 server : output embeddings for all tokens when pooling = none (#10861) hace 1 año
  Georgi Gerganov 0e70ba686e server : add "tokens" output (#10853) hace 1 año
  Georgi Gerganov 644fd71b44 sampling : refactor + optimize penalties sampler (#10803) hace 1 año
  Xuan Son Nguyen adffa6ffd5 common : improve -ctv -ctk CLI arguments (#10806) hace 1 año
  CentricStorm 5555c0c1f6 docs: update server streaming mode documentation (#9519) hace 1 año
  CentricStorm 4b4d92b098 docs: fix server documentation formatting (#10776) hace 1 año
  Yüg a86ad841f1 server : add flag to disable the web-ui (#10762) (#10751) hace 1 año
  Xuan Son Nguyen 3573fa8e7b server : (refactor) no more json in server_task input (#10691) hace 1 año
  Georgi Gerganov ce4a7b8493 server : various fixes (#10704) hace 1 año
  Xuan Son Nguyen 6c5bc0625f server : (refactoring) do not rely on JSON internally (#10643) hace 1 año
  Xuan Son Nguyen 91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599) hace 1 año
  Nikolaos Pothitos 82bca2257b readme : add option, update default value, fix formatting (#10271) hace 1 año
  Xuan Son Nguyen 642330ac7c llama : add enum for built-in chat templates (#10623) hace 1 año
  Georgi Gerganov 8648c52101 make : deprecate (#10514) hace 1 año
  haopeng 64ed2091b2 server: Add "tokens per second" information in the backend (#10548) hace 1 año
  Georgi Gerganov 47f931c8f9 server : enable cache_prompt by default (#10501) hace 1 año
  Johannes Gäßler 4e54be0ec6 llama/ex: remove --logdir argument (#10339) hace 1 año
  Alexey Parfenov ff7fb670d0 server : add missing docs (#10269) hace 1 año
  Georgi Gerganov b141e5f6ef server : enable KV cache defrag by default (#10233) hace 1 año
  Xuan Son Nguyen a71d81cf8c server : revamp chat UI with vuejs and daisyui (#10175) hace 1 año
  Xuan Son Nguyen 9e0ecfb697 server : clarify /slots endpoint, add is_processing (#10162) hace 1 año
  Georgi Gerganov 8d8ff71536 llama : remove Tail-Free sampling (#10071) hace 1 año