Historial de Commits

Autor SHA1 Mensaje Fecha
  Alexey Parfenov 213d1439fa server : remove model.json endpoint (#5371) hace 1 año
  Justin Parker 8a79c591de server : include total "num_slots" in props endpoint (#5349) hace 1 año
  Michael Coppola 31e7903221 server : add `dynatemp_range` and `dynatemp_exponent` (#5352) hace 1 año
  Niall Coates 4ffc7a17d4 server : various fixes for the prompt field in /completion (#5300) hace 1 año
  Alexey Parfenov a2d60c9158 server : allow to get default generation settings for completion (#5307) hace 1 año
  Michael Klimenko 52bb63c708 refactor : switch to emplace_back to avoid extra object (#5291) hace 1 año
  Georgi Gerganov 5cb04dbc16 llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240) hace 1 año
  Georgi Gerganov e6f291d158 server : fix context shift (#5195) hace 1 año
  Wu Jian Ping c82d18e863 server : embeddings compatibility for OpenAI (#5190) hace 1 año
  Abhilash Majumder 0f648573dd ggml : add unified SYCL backend for Intel GPUs (#2690) hace 2 años
  Michael Klimenko 35a2ee9143 Remove unused data and add fixes (#5154) hace 2 años
  Maximilian Winter ec903c0341 server : add self-extend support (#5104) hace 2 años
  Xuan Son Nguyen 48c857aa10 server : refactored the task processing logic (#5065) hace 2 años
  Xuan Son Nguyen 821f0a271e server : defer tasks when "slot unavailable" (#5018) hace 2 años
  Georgi Gerganov 0ea069b87b server : fix prompt caching with system prompt (#4914) hace 2 años
  Ziad Ben Hadj-Alouane 356327feb3 server : fix deadlock that occurs in multi-prompt scenarios (#4905) hace 2 años
  makomk ee8243adaa server : fix crash with multimodal models without BOS token (#4904) hace 2 años
  slaren e7e4df031b llama : ggml-backend integration (#4766) hace 2 años
  Georgi Gerganov 1d118386fe server : fix infill when prompt is empty (#4833) hace 2 años
  Laura 4330bd83fe server : implement credentialed CORS (#4514) hace 2 años
  Michael Coppola 27379455c3 server : support for multiple api keys (#4864) hace 2 años
  Behnam M eab6795006 server : add `LOG_INFO` when model is successfully loaded (#4881) hace 2 años
  Isaac McFadyen 2f043328e3 server : fix typo in model name (#4876) hace 2 años
  Georgi Gerganov 5c1980d8d4 server : fix build + rename enums (#4870) hace 2 años
  Behnam M cd108e641d server : add a `/health` endpoint (#4860) hace 2 años
  Georgi Gerganov 67984921a7 server : fix n_predict check (#4798) hace 2 años
  Georgi Gerganov 012cf349ae server : send token probs for "stream == false" (#4714) hace 2 años
  Georgi Gerganov 32866c5edd editorconfig : fix whitespace and indentation #4710 hace 2 años
  minarchist 5d7002d437 server : add --override-kv parameter (#4710) hace 2 años
  Georgi Gerganov 9fbda719de clip : refactor + bug fixes (#4696) hace 2 años