Historial de Commits

Autor SHA1 Mensaje Fecha
  MasterYi1024 dee7f8d692 Correct free memory and total memory. (#6630) hace 1 año
  Pierrick Hymbert 81da18e71c eval-callback: use ggml_op_desc to pretty print unary operator name (#6631) hace 1 año
  Georgi Gerganov 9ed2737acc ci : disable Metal for macOS-latest-cmake-x64 (#6628) hace 1 año
  Clint Herron 04a5ac211e Optimization: eliminate addition of redundant stacks when advancing grammar. (#6616) hace 1 año
  Clint Herron f7001ccc5a As suggested by @slaren, disabling Metal for test to fix CI build on OSX from #6576 (#6619) hace 1 año
  Nikolas a474f50ebb Refactor Error Handling for CUDA (#6575) hace 1 año
  Olivier Chafik cbaadc9294 grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609) hace 1 año
  Hugo Roussel 1bbdaf6ecd ci: download artifacts to release directory (#6612) hace 1 año
  Daniel Bevenius f4183afe6a scripts : add --outdir option to hf.sh (#6600) hace 1 año
  Pierrick Hymbert b804b1ef77 eval-callback: Example how to use eval callback for debugging (#6576) hace 1 año
  Daniel Bevenius 8228b66dbc gguf : add option to not check tensor data (#6582) hace 1 año
  Ralph Soika b3a96f27f0 minor layout improvements (#6572) hace 1 año
  slaren 4f407a0a35 llama : add model types for mixtral (#6589) hace 1 año
  slaren 65c64dc36f convert.py : add consolidated.safetensors for mixtral 8x22b (#6587) hace 1 año
  Pierrick Hymbert 67fac4b95f docs : how to add a model (#6565) hace 1 año
  Artem Zinnatullin 29122d32ac readme : fix ROCm link (#6579) hace 1 año
  sjxx b231b37b09 readme : update UI list (#6560) hace 1 año
  Jiří Sejkora ba5e134e07 readme: fix typo in amdgpu target name (#6573) hace 1 año
  Jared Van Bortel 1b67731e18 BERT tokenizer fixes (#6498) hace 1 año
  Georgi Gerganov c4a3a4ff47 sync : ggml hace 1 año
  Ed Lee 400d5d722d server : detect search query to start webchat (#6554) hace 1 año
  Carolinabanana 5dc9dd7152 llama : add Command R Plus support (#6491) hace 1 año
  Georgi Gerganov e11a8999b5 license : update copyright notice + add AUTHORS (#6405) hace 1 año
  Georgi Gerganov cc4a95426d llama : fix attention layer count sanity check (#6550) hace 1 año
  kunnis cecd8d3c98 Comment explaining a decision (#6531) hace 1 año
  Georgi Gerganov b73e564b16 quantize : fix precedence of cli args (#6541) hace 1 año
  Rick G e3c337d87c llama : support negative ith in llama_get_ API (#6519) hace 1 año
  Jan Boon beea6e1b16 llama : save and restore kv cache for single seq id (#6341) hace 1 año
  Abhilash Majumder 87fb5b4234 remove row=1 cond (#6532) hace 1 año
  Firat d752327c33 Adding KodiBot to UI list (#6535) hace 1 año