Commit History

Autor SHA1 Mensaxe Data
  Georgi Gerganov 40f74e4d73 llama : add option to render special/control tokens (#6807) hai 1 ano
  Jan Boon e8d35f47cb doc : add link to falcon (#6789) hai 1 ano
  Mohammadreza Hendiani 2cca09d509 readme : add Fedora instructions (#6783) hai 1 ano
  nopperl 9958c81b79 Implement the OLMo architecture (#6741) hai 1 ano
  Yaroslav 8dd1ec8b3f readme : add UI (#6724) hai 1 ano
  Pierrick Hymbert 4bd0f93e4a model: support arch `DbrxForCausalLM` (#6515) hai 1 ano
  Rene Leonhardt 5c4d767ac0 chore: Fix markdown warnings (#6625) hai 1 ano
  Pierrick Hymbert 67fac4b95f docs : how to add a model (#6565) hai 1 ano
  Artem Zinnatullin 29122d32ac readme : fix ROCm link (#6579) hai 1 ano
  sjxx b231b37b09 readme : update UI list (#6560) hai 1 ano
  Jiří Sejkora ba5e134e07 readme: fix typo in amdgpu target name (#6573) hai 1 ano
  Jan Boon beea6e1b16 llama : save and restore kv cache for single seq id (#6341) hai 1 ano
  Firat d752327c33 Adding KodiBot to UI list (#6535) hai 1 ano
  Mark Fairbairn 855f54402e Change Windows AMD example to release build to make inference much faster. (#6525) hai 1 ano
  DAN™ e0717e751e Add GritLM as supported models. (#6513) hai 1 ano
  Hoang Nguyen d0f5deebf8 readme : update UI list (#6503) hai 1 ano
  alexpinel a307375c02 readme : add Dot to UI list (#6487) hai 1 ano
  Jun Jie b660a5729e readme : fix typo (#6481) hai 1 ano
  bryanSwk bb43cf7e9d llama : add SEA-LION support (#6448) hai 1 ano
  Francisco Melo 154d4ee39c readme : add feature-rich rust bindings (#6465) hai 1 ano
  Georgi Gerganov 076b08649e readme : update hot topics hai 1 ano
  Georgi Gerganov c50a82ce0f readme : update hot topics hai 1 ano
  0cc4m ba0c7c70ab Vulkan k-quant mmq and ggml-backend offload functionality (#6155) hai 1 ano
  hxer7963 069574775c [Model] Add support for xverse (#6301) hai 1 ano
  zhouwg b910287954 readme : add project (#6356) hai 1 ano
  Georgi Gerganov bfe7dafc9c readme : add notice for UI list hai 1 ano
  Mateusz Charytoniuk 1740d6dd4e readme : add php api bindings (#6326) hai 1 ano
  compilade 557410b8f0 llama : greatly reduce output buffer memory usage (#6122) hai 1 ano
  slaren 280345968d cuda : rename build flag to LLAMA_CUDA (#6299) hai 1 ano
  Pierrick Hymbert dba1af6129 llama_model_loader: support multiple split/shard GGUFs (#6187) hai 1 ano