Commit Verlauf

Autor SHA1 Nachricht Datum
  Olivier Chafik 6171c9d258 Add Jinja template support (#11016) vor 1 Jahr
  Georgi Gerganov 80d0d6b4b7 common : add -hfd option for the draft model (#11318) vor 1 Jahr
  LostRuins Concedo 6390a998bf tts : add guide tokens support (#11186) vor 1 Jahr
  Radoslav Gerganov 667d72846c rpc : early register backend devices (#11262) vor 1 Jahr
  Xuan Son Nguyen 84a44815f7 cli : auto activate conversation mode if chat template is available (#11214) vor 1 Jahr
  Xuan Son Nguyen 00b4c3da62 common : support tag-based --hf-repo like on ollama (#11195) vor 1 Jahr
  Georgi Gerganov a3c1232c3f arg : option to exclude arguments from specific examples (#11136) vor 1 Jahr
  Georgi Gerganov f66f582927 llama : refactor `src/llama.cpp` (#10902) vor 1 Jahr
  Molly Sophia 0a11f8b7b5 convert : fix RWKV v6 model conversion (#10913) vor 1 Jahr
  Georgi Gerganov 36319dec5d tts : small QoL for easy model fetch (#10903) vor 1 Jahr
  Georgi Gerganov 0bf2d10c55 tts : add OuteTTS support (#10784) vor 1 Jahr
  Georgi Gerganov 644fd71b44 sampling : refactor + optimize penalties sampler (#10803) vor 1 Jahr
  Xuan Son Nguyen adffa6ffd5 common : improve -ctv -ctk CLI arguments (#10806) vor 1 Jahr
  Xuan Son Nguyen 9fdb124304 common : add missing env var for speculative (#10801) vor 1 Jahr
  Bartowski ae4b922614 imatrix : Add imatrix to --no-context-shift (#10766) vor 1 Jahr
  Yüg a86ad841f1 server : add flag to disable the web-ui (#10762) (#10751) vor 1 Jahr
  Xuan Son Nguyen f162d45a21 common : bring back --no-warmup to server (#10686) vor 1 Jahr
  Xuan Son Nguyen 642330ac7c llama : add enum for built-in chat templates (#10623) vor 1 Jahr
  Johannes Gäßler 890719311b common: fix warning message when no GPU found (#10564) vor 1 Jahr
  Xuan Son Nguyen 9f912511bc common : fix duplicated file name with hf_repo and hf_file (#10550) vor 1 Jahr
  Diego Devesa 10bce0450f llama : accept a list of devices to use to offload a model (#10497) vor 1 Jahr
  Georgi Gerganov d9d54e498d speculative : refactor and add a simpler example (#10362) vor 1 Jahr
  Johannes Gäßler 4e54be0ec6 llama/ex: remove --logdir argument (#10339) vor 1 Jahr
  Georgi Gerganov 8d8ff71536 llama : remove Tail-Free sampling (#10071) vor 1 Jahr
  wwoodsTM ff252ea48e llama : add DRY sampler (#9702) vor 1 Jahr
  Michael Podvitskiy d80fb71f8b llama: string_split fix (#10022) vor 1 Jahr
  Daniel Bevenius 674804a996 arg : fix typo in embeddings argument help [no ci] (#9994) vor 1 Jahr
  Daniel Bevenius 94008cc760 arg : fix attention non-causal arg value hint (#9985) vor 1 Jahr
  MaggotHATE fbc98b748e sampling : add XTC sampler (#9742) vor 1 Jahr
  Georgi Gerganov c7181bd294 server : reuse cached context chunks (#9866) vor 1 Jahr