Historie revizí

Autor SHA1 Zpráva Datum
  Robey Holderith 5ee99c32f5 common, server : surface min_keep as its own parameter (#5567) před 1 rokem
  Pierrick Hymbert c145f8a132 server : slots monitoring endpoint (#5550) před 1 rokem
  Pierrick Hymbert e75c6279d1 server : enhanced health endpoint (#5548) před 1 rokem
  Pierrick Hymbert 36376abe05 server : --n-predict option document and cap to max value (#5549) před 1 rokem
  Daniel Hiltgen 66c1968f7a server : graceful server shutdown (#5244) před 1 rokem
  Alexey Parfenov 6dcc02d244 server : add "samplers" param to control the samplers order (#5494) před 1 rokem
  Rőczey Barnabás 5f5808ca7b server : fix system prompt cli (#5516) před 1 rokem
  bmwl f486f6e1e5 ggml : add numa options (#5377) před 1 rokem
  Elbios 0d4177126b llava : fix memory management bug (#5491) před 1 rokem
  John aa23412989 llava : support v1.6 (#5267) před 1 rokem
  Alexey Parfenov 684780141a server : allow to specify tokens as strings in logit_bias (#5003) před 1 rokem
  Xuan Son Nguyen 907e08c110 server : add llama2 chat template (#5425) před 1 rokem
  Riley Stewart 7c777fcd5d server : fix prompt caching for repeated prompts (#5420) před 1 rokem
  Justin Parker f3e2b4fa3f server : update `/props` with "total_slots" value (#5373) před 1 rokem
  Alexey Parfenov 213d1439fa server : remove model.json endpoint (#5371) před 1 rokem
  Justin Parker 8a79c591de server : include total "num_slots" in props endpoint (#5349) před 1 rokem
  Michael Coppola 31e7903221 server : add `dynatemp_range` and `dynatemp_exponent` (#5352) před 1 rokem
  Niall Coates 4ffc7a17d4 server : various fixes for the prompt field in /completion (#5300) před 1 rokem
  Alexey Parfenov a2d60c9158 server : allow to get default generation settings for completion (#5307) před 1 rokem
  Michael Klimenko 52bb63c708 refactor : switch to emplace_back to avoid extra object (#5291) před 1 rokem
  Georgi Gerganov 5cb04dbc16 llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240) před 1 rokem
  Georgi Gerganov e6f291d158 server : fix context shift (#5195) před 1 rokem
  Wu Jian Ping c82d18e863 server : embeddings compatibility for OpenAI (#5190) před 1 rokem
  Abhilash Majumder 0f648573dd ggml : add unified SYCL backend for Intel GPUs (#2690) před 2 roky
  Michael Klimenko 35a2ee9143 Remove unused data and add fixes (#5154) před 2 roky
  Maximilian Winter ec903c0341 server : add self-extend support (#5104) před 2 roky
  Xuan Son Nguyen 48c857aa10 server : refactored the task processing logic (#5065) před 2 roky
  Xuan Son Nguyen 821f0a271e server : defer tasks when "slot unavailable" (#5018) před 2 roky
  Georgi Gerganov 0ea069b87b server : fix prompt caching with system prompt (#4914) před 2 roky
  Ziad Ben Hadj-Alouane 356327feb3 server : fix deadlock that occurs in multi-prompt scenarios (#4905) před 2 roky