Historial de Commits

Autor SHA1 Mensaje Fecha
  Johannes Gäßler af0a5b6163 server: fix incorrectly reported token probabilities (#7125) hace 1 año
  David Renshaw 3f167476b1 sampling : use std::random_device{}() for default random seed (#6962) hace 1 año
  Johannes Gäßler 28103f4832 Server: fix seed for multiple slots (#6835) hace 1 año
  Minsoo Cheong 586e7bc561 sampling : deduplicated code for probability distribution access (#6240) hace 1 año
  Clint Herron 463628372d grammar : handle missing "root" node (#6004) hace 1 año
  Minsoo Cheong 6d341ab6c5 speculative : implement stochastic speculative sampling (#5625) hace 1 año
  Pierrick Hymbert e3965cf35a server: tests - slow inference causes timeout on the CI (#5715) hace 1 año
  Robey Holderith 5ee99c32f5 common, server : surface min_keep as its own parameter (#5567) hace 1 año
  Georgi Gerganov 689a091bbe sampling : do not set min_keep to n_probs (#5564) hace 1 año
  Alexey Parfenov 6dcc02d244 server : add "samplers" param to control the samplers order (#5494) hace 1 año
  Alexey Parfenov a803333a4e common : use enums for sampler types (#5418) hace 1 año
  Georgi Gerganov 139b62a839 common : fix compile warning hace 1 año
  Johannes Gäßler 26d4efd11e sampling: fix top_k <= 0 (#5388) hace 1 año
  Michael Klimenko 35a2ee9143 Remove unused data and add fixes (#5154) hace 2 años
  l3utterfly 5eaf9964fc llama : dynamic temperature sampling (#4972) hace 2 años
  David Friehs 4483396751 llama : apply classifier-free guidance to logits directly (#4951) hace 2 años
  Alexey Parfenov 6123979952 server : allow to specify custom prompt for penalty calculation (#3727) hace 2 años
  kalomaze b9ec82d262 grammar : check the full vocab only if necessary (opt) (#4306) hace 2 años
  Georgi Gerganov caa9249217 common : fix compile warning hace 2 años
  MaggotHATE 52c8bc3cf3 sampling : custom samplers order (#4285) hace 2 años
  l3utterfly e75dfdd31b sampling : null grammar field after reset (#3885) hace 2 años
  kalomaze 238657db23 samplers : Min-P sampler implementation [alternative to Top P/Top K] (#3841) hace 2 años
  Georgi Gerganov ee1a0ec9cb llama : add option for greedy sampling with probs (#3813) hace 2 años
  Marcus Dunn 5be6c803fa llama : remove token functions with `context` args in favor of `model` (#3720) hace 2 años
  Georgi Gerganov d1031cf49c sampling : refactor init to use llama_sampling_params (#3696) hace 2 años
  Georgi Gerganov 0e89203b51 speculative : add tree-based sampling example (#3624) hace 2 años
  Kerfuffle 70c29da118 common : fix mirostat state when using multiple sequences (#3543) hace 2 años