Historial de Commits

Autor SHA1 Mensaje Fecha
  Ziad Ben Hadj-Alouane 356327feb3 server : fix deadlock that occurs in multi-prompt scenarios (#4905) hace 2 años
  makomk ee8243adaa server : fix crash with multimodal models without BOS token (#4904) hace 2 años
  slaren e7e4df031b llama : ggml-backend integration (#4766) hace 2 años
  Georgi Gerganov 1d118386fe server : fix infill when prompt is empty (#4833) hace 2 años
  Laura 4330bd83fe server : implement credentialed CORS (#4514) hace 2 años
  Michael Coppola 27379455c3 server : support for multiple api keys (#4864) hace 2 años
  Behnam M eab6795006 server : add `LOG_INFO` when model is successfully loaded (#4881) hace 2 años
  Isaac McFadyen 2f043328e3 server : fix typo in model name (#4876) hace 2 años
  Georgi Gerganov 5c1980d8d4 server : fix build + rename enums (#4870) hace 2 años
  Behnam M cd108e641d server : add a `/health` endpoint (#4860) hace 2 años
  Georgi Gerganov 67984921a7 server : fix n_predict check (#4798) hace 2 años
  Georgi Gerganov 012cf349ae server : send token probs for "stream == false" (#4714) hace 2 años
  Georgi Gerganov 32866c5edd editorconfig : fix whitespace and indentation #4710 hace 2 años
  minarchist 5d7002d437 server : add --override-kv parameter (#4710) hace 2 años
  Georgi Gerganov 9fbda719de clip : refactor + bug fixes (#4696) hace 2 años
  Justine Tunney db49ff8ed7 server : replace sleep with condition variables (#4673) hace 2 años
  SakuraUmi 60f55e888c server : fix OpenAI server sampling w.r.t. penalty. (#4675) hace 2 años
  Karthik Sethuraman b93edd22f5 server : allow to generate multimodal embeddings (#4681) hace 2 años
  Justine Tunney 65e5f6dadb Fix OpenAI server sampling w.r.t. temp and seed (#4668) hace 2 años
  Alexey Parfenov 6123979952 server : allow to specify custom prompt for penalty calculation (#3727) hace 2 años
  olexiyb 0ffc92d2d2 server : disable llm logs if SERVER_VERBOSE is off (#3792) hace 2 años
  AdithyanI 8edd2b40fd server : fix grammar being ignored (#4494) hace 2 años
  Alexey Parfenov eb16dae7e7 server : fix possible ambiguity in content type charset (#4501) hace 2 años
  mzcu 62bd52b7bf server : allow requests larger than 8K (#4500) hace 2 años
  ShadovvBeast 88ae8952b6 server : add optional API Key Authentication example (#4441) hace 2 años
  shibe2 948ff137ec server : fix handling of characters that span multiple tokens when streaming (#4446) hace 2 años
  Vladimir Zorin d9d4cfef64 server : fix local model name in server (#4420) hace 2 años
  Georgi Gerganov bcc0eb4591 llama : per-layer KV cache + quantum K cache (#4309) hace 2 años
  Georgi Gerganov 05cd6e5036 server : recognize cache_prompt parameter in OAI API (#4347) hace 2 años
  Ed Lee 33e171d1e9 server : fix OpenAI API `stop` field to be optional (#4299) hace 2 años