Историја ревизија

Аутор SHA1 Порука Датум
  Georgi Gerganov 1da7b76569 server : fix speculative decoding with context shift (#10641) пре 1 година
  Xuan Son Nguyen 91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599) пре 1 година
  Georgi Gerganov 70b98fadbc server : fix default draft model parameters (#10586) пре 1 година
  haopeng 64ed2091b2 server: Add "tokens per second" information in the backend (#10548) пре 1 година
  alek3y 86dc11c5bc server : bind to any port when specified (#10590) пре 1 година
  Georgi Gerganov 84e1c33cde server : fix parallel speculative decoding (#10513) пре 1 година
  Georgi Gerganov 47f931c8f9 server : enable cache_prompt by default (#10501) пре 1 година
  Diego Devesa 10bce0450f llama : accept a list of devices to use to offload a model (#10497) пре 1 година
  Georgi Gerganov 9ca2e67762 server : add speculative decoding support (#10455) пре 1 година
  Georgi Gerganov d9d54e498d speculative : refactor and add a simpler example (#10362) пре 1 година
  MaggotHATE bcdb7a2386 server: (web UI) Add samplers sequence customization (#10255) пре 1 година
  Xuan Son Nguyen 9901068ac7 server : (web UI) add copy button for code block, fix api key (#10242) пре 1 година
  Jhen-Jie Hong 0e712a5acb server : fix incorrect res in validate_model_chat_template (#10272) пре 1 година
  Xuan Son Nguyen a71d81cf8c server : revamp chat UI with vuejs and daisyui (#10175) пре 1 година
  Georgi Gerganov b11f9ba9b8 server : remove hack for extra parallel slot (#10187) пре 1 година
  Xuan Son Nguyen 9e0ecfb697 server : clarify /slots endpoint, add is_processing (#10162) пре 1 година
  sasha0552 42cadc74bd server : fix slot selection by lru (#10126) пре 1 година
  Georgi Gerganov 45950415ed server : fix endpoint checks (#10135) пре 1 година
  sasha0552 d865d1478c server : fix smart selection of available slot (#10120) пре 1 година
  Kevin Gibbons 0a683e8088 server : include scheme when printing URL (#10106) пре 1 година
  Georgi Gerganov 8d8ff71536 llama : remove Tail-Free sampling (#10071) пре 1 година
  Georgi Gerganov 8125e6cbfc server : don't overfill the batch during infill (#10018) пре 1 година
  wwoodsTM ff252ea48e llama : add DRY sampler (#9702) пре 1 година
  Michael Podvitskiy d80fb71f8b llama: string_split fix (#10022) пре 1 година
  Georgi Gerganov bc5ba007b2 server : check that the prompt fits in the slot's context (#10030) пре 1 година
  Xuan Son Nguyen 958367bf53 server : refactor slot input data, move tokenizer to HTTP thread (#10023) пре 1 година
  wwoodsTM 0a1c750c80 server : samplers accept the prompt correctly (#10019) пре 1 година
  Xuan Son Nguyen cda0e4b648 llama : remove all_pos_0, all_pos_1, all_seq_id from llama_batch (#9745) пре 1 година
  Georgi Gerganov 8901755ba3 server : add n_indent parameter for line indentation requirement (#9929) пре 1 година
  Alexey Parfenov 1f66b699c4 server : fix the disappearance of the end of the text (#9867) пре 1 година