Historial de Commits

Autor SHA1 Mensaje Fecha
  Daniel Bevenius bd4ef13476 common : skip model validation when --help is requested (#17755) hace 1 mes
  Reese Levine 7ca5991d2b ggml webgpu: add support for emscripten builds (#17184) hace 1 mes
  Xuan-Son Nguyen 13628d8bdb server: add --media-path for local media files (#17697) hace 1 mes
  Xuan-Son Nguyen a96283adc4 mtmd: fix --no-warmup (#17695) hace 1 mes
  Xuan-Son Nguyen ec18edfcba server: introduce API for serving / loading / unloading multiple models (#17470) hace 1 mes
  Xuan-Son Nguyen 7733409734 common: improve verbosity level definitions (#17630) hace 1 mes
  Aaron Teo def5404f26 common: add LLAMA_LOG_FILE env var (#17609) hace 1 mes
  ddh0 5a6241feb0 common: update env var name (#17588) hace 1 mes
  Xuan-Son Nguyen e509411cf1 server: enable jinja by default, update docs (#17524) hace 1 mes
  Aaron Teo 877566d512 llama: introduce support for model-embedded sampling parameters (#17120) hace 1 mes
  Georgi Gerganov f914544b16 batched-bench : add "separate text gen" mode (#17103) hace 2 meses
  Xuan-Son Nguyen aa3b7a90b4 arg: add --cache-list argument to list cached models (#17073) hace 2 meses
  Xuan-Son Nguyen 5c9a18e674 common: move download functions to download.(cpp|h) (#17059) hace 2 meses
  Xuan-Son Nguyen 070ff4d535 mtmd: add --image-min/max-tokens (#16921) hace 2 meses
  Sigbjørn Skjæret 961660b8c3 common : allow --system-prompt-file for diffusion-cli (#16903) hace 2 meses
  Shagun Bera 835e918d84 common: fix typo in cli help text (#16864) hace 2 meses
  Sam Malayek 1c1409e131 embedding: add raw option for --embd-output-format (#16541) hace 2 meses
  Xuan-Son Nguyen d0660f237a mtmd-cli : allow using --jinja (#16718) hace 2 meses
  takasurazeem 6f5d924637 common : Update the docs on -t --threads (#16236) hace 3 meses
  Georgi Gerganov 4b2dae383d common : update presets (#16504) hace 3 meses
  Georgi Gerganov d00cbea63c server : host-memory prompt caching (#16391) hace 3 meses
  Pascal 12bbc3fa50 refactor: centralize CoT parsing in backend for streaming mode (#16394) hace 3 meses
  Georgi Gerganov ef4c5b87ea presets : fix pooling param for embedding models (#16455) hace 3 meses
  Gadflyii 3df2244df4 llama : add --no-host to disable host buffers (#16310) hace 3 meses
  Radoslav Gerganov 898acba681 rpc : add support for multiple devices (#16276) hace 3 meses
  ddh0 f6dcda3900 server : context checkpointing for hybrid and recurrent models (#16382) hace 3 meses
  Adrien Gallouët 4201deae9c common: introduce http.h for httplib-based client (#16373) hace 3 meses
  Adrien Gallouët bf6f3b3a19 common : disable progress bar without a tty (#16352) hace 3 meses
  Adrien Gallouët 364a7a6d4a common : remove common_has_curl() (#16351) hace 3 meses
  Adrien Gallouët 3c62aed89f common : simplify etag tracking by removing json (#16342) hace 3 meses