Historial de Commits

Autor SHA1 Mensaje Fecha
  VoidIsVoid a89f75e1b7 server : handle "logprobs" field with false value (#9871) hace 1 año
  Georgi Gerganov c7181bd294 server : reuse cached context chunks (#9866) hace 1 año
  Diego Devesa 7eee341bee common : use common_ prefix for common library functions (#9805) hace 1 año
  Xuan Son Nguyen 458367a906 server : better security control for public deployments (#9776) hace 1 año
  Georgi Gerganov f4d2b8846a llama : add reranking support (#9510) hace 1 año
  Vinesh Janarthanan 8a308354f6 server : match OAI structured output response (#9527) hace 1 año
  Georgi Gerganov 6262d13e0b common : reimplement logging (#9418) hace 1 año
  Mathijs Henquet 78203641fe server : Add option to return token pieces in /tokenize endpoint (#9108) hace 1 año
  Xuan Son Nguyen 6e7d133a5f server : refactor multitask handling (#9274) hace 1 año
  ardfork 978ba3d83d Server: Don't ignore llama.cpp params (#8754) hace 1 año
  Georgi Gerganov 4e24cffd8c server : handle content array in chat API (#8449) hace 1 año
  Xuan Son Nguyen 48e6b92cc3 Add chat template support for llama-cli (#8068) hace 1 año
  sasha0552 7a16ce7db2 server : smart slot selection using Longest Common Prefix (#7728) hace 1 año
  Georgi Gerganov 1442677f92 common : refactor cli arg parsing (#7675) hace 1 año
  Benjamin Findley e586ee4259 change default temperature of OAI compat API from 0 to 1 (#7226) hace 1 año
  Johannes Gäßler c12452c7ae JSON: [key] -> .at(key), assert() -> GGML_ASSERT (#7143) hace 1 año
  Xuan Son Nguyen 1fd9c1741d clean up json_value & server_log (#7142) hace 1 año
  Pedro Cuenca b97bc3966e llama : support Llama 3 HF conversion (#6745) hace 1 año
  Pierrick Hymbert 75cd4c7729 ci: bench: support sse and fix prompt processing time / server: add tokens usage in stream OAI response (#6495) hace 1 año
  JH23X 60cdf40cc3 server : handle exception on wrong type in request (#6452) hace 1 año
  Xuan Son Nguyen ad3a0505e3 Server: clean up OAI params parsing function (#6284) hace 1 año
  Pierrick Hymbert 1b26aebe4d server: flush stdout after logging in both text and json layout (#6253) hace 1 año
  Olivier Chafik 72114edf06 json-schema-to-grammar : fix order of props + non-str const/enum (#6232) hace 1 año
  Olivier Chafik 5b7b0ac8df json-schema-to-grammar improvements (+ added to server) (#5978) hace 1 año
  Karthick 47cc7a7bf9 Server: Handle n_keep parameter in the request (#6174) hace 1 año
  Xuan Son Nguyen 99b71c068f Server: Use multi-task for embeddings endpoint (#6001) hace 1 año
  Xuan Son Nguyen caa106d4e0 Server: format error to json (#5961) hace 1 año
  Minsoo Cheong 332bdfd798 server : maintain chat completion id for streaming responses (#5988) hace 1 año
  Georgi Gerganov 2002bc96bf server : refactor (#5882) hace 1 año
  Pierrick Hymbert 9731134296 server: tests: passkey challenge / self-extend with context shift demo (#5832) hace 1 año