Commit Verlauf

Autor SHA1 Nachricht Datum
  Jan Boon 628154492a server : update doc to clarify n_keep when there is bos token (#8619) vor 1 Jahr
  Xuan Son Nguyen 4db8f60fe7 fix ci (#8494) vor 1 Jahr
  M-A f17f39ff9c server: update README.md with llama-server --help output [no ci] (#8472) vor 1 Jahr
  Bjarke Viksøe cb4d86c4d7 server: Retrieve prompt template in /props (#8337) vor 1 Jahr
  Pieter Ouwerkerk 5a7447c569 readme : fix minor typos [no ci] (#8314) vor 1 Jahr
  Sigbjørn Skjæret 38373cfbab Add SPM infill support (#8016) vor 1 Jahr
  Olivier Chafik 1c641e6aac `build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809) vor 1 Jahr
  Johannes Gäßler 7027b27d76 server: update cache_prompt documentation [no ci] (#7745) vor 1 Jahr
  Johannes Gäßler 1b01f06db0 server: add test for token probs (#7347) vor 1 Jahr
  Johannes Gäßler cb42c29427 server: correct --threads documentation [no ci] (#7362) vor 1 Jahr
  Leon Knauer 9c4fdcbec8 [Server] Added --verbose option to README [no ci] (#7335) vor 1 Jahr
  Ryuei 27f65d6267 docs: Fix typo and update description for --embeddings flag (#7026) vor 1 Jahr
  Johan 911b3900dd server : add_special option for tokenize endpoint (#7059) vor 1 Jahr
  Johannes Gäßler af0a5b6163 server: fix incorrectly reported token probabilities (#7125) vor 1 Jahr
  Kyle Mistele 260b7c6529 server : update readme with undocumented options (#7013) vor 1 Jahr
  Olivier Chafik b8a7a5a90f build(cmake): simplify instructions (`cmake -B build && cmake --build build ...`) (#6964) vor 1 Jahr
  Olivier Chafik ab9a3240a9 JSON schema conversion: ⚡️ faster repetitions, min/maxLength for strings, cap number length (#6555) vor 1 Jahr
  Jan Boon beea6e1b16 llama : save and restore kv cache for single seq id (#6341) vor 1 Jahr
  Georgi Gerganov 4399f13fb9 server : remove obsolete --memory-f32 option vor 1 Jahr
  Fattire 5fb1574c81 A few small fixes to server's README docs (#6428) vor 1 Jahr
  slaren 280345968d cuda : rename build flag to LLAMA_CUDA (#6299) vor 1 Jahr
  Xuan Son Nguyen ad3a0505e3 Server: clean up OAI params parsing function (#6284) vor 1 Jahr
  Pierrick Hymbert f482bb2e49 common: llama_load_model_from_url split support (#6192) vor 1 Jahr
  Pierrick Hymbert 1997577d5e server: docs: `--threads` and `--threads`, `--ubatch-size`, `--log-disable` (#6254) vor 1 Jahr
  Jan Boon be07a03217 server : update readme doc from `slot_id` to `id_slot` (#6213) vor 1 Jahr
  Pierrick Hymbert d01b3c4c32 common: llama_load_model_from_url using --model-url (#6098) vor 1 Jahr
  Jakub N 828defefb6 Update server docker image URLs (#5997) vor 1 Jahr
  Xuan Son Nguyen caa106d4e0 Server: format error to json (#5961) vor 1 Jahr
  Georgi Gerganov 97c09585d6 server : clarify some items in the readme (#5957) vor 1 Jahr
  Xuan Son Nguyen 950ba1ab84 Server: reorganize some http logic (#5939) vor 1 Jahr