Commit Verlauf

Autor SHA1 Nachricht Datum
  Anas Ahouzi 6aade19ee7 Add StableLM2 pre-tokenizer (#7349) vor 1 Jahr
  Radoslav Gerganov 5e31828d3e ggml : add RPC backend (#6829) vor 1 Jahr
  Ren Xuancheng 229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114) vor 1 Jahr
  DAN™ 4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132) vor 1 Jahr
  Justine Tunney 3855416027 ggml : introduce bfloat16 support (#6412) vor 1 Jahr
  nopperl b6aa670203 Fix OLMo HF to GGUF conversion (#6910) vor 1 Jahr
  DAN™ 889bdd7686 command-r : add BPE pre-tokenization (#7063) vor 1 Jahr
  Georgi Gerganov 92139b90af tests : add test-tokenizer-0.sh + fix some tokenizers (#7036) vor 1 Jahr
  Daniel Bevenius 433def286e llama : rename ctx to user_data in progress_callback (#7045) vor 1 Jahr
  Georgi Gerganov 9c67c2773d ggml : add Flash Attention (#5021) vor 1 Jahr
  Georgi Gerganov f4ab2a4147 llama : fix BPE pre-tokenization (#6920) vor 1 Jahr
  Pierrick Hymbert 0c4d489e29 quantize: add imatrix and dataset metadata in GGUF (#6658) vor 1 Jahr
  slaren 017e6999b5 add basic tensor data validation function (#6884) vor 1 Jahr
  jiez 1966eb2615 quantize : add '--keep-split' to quantize model into shards (#6688) vor 1 Jahr
  Douglas Hanley b4e4b8a935 llama : add llama_get_pooling_type function (#6862) vor 1 Jahr
  Johannes Gäßler 28103f4832 Server: fix seed for multiple slots (#6835) vor 1 Jahr
  Georgi Gerganov 40f74e4d73 llama : add option to render special/control tokens (#6807) vor 1 Jahr
  Pedro Cuenca b97bc3966e llama : support Llama 3 HF conversion (#6745) vor 1 Jahr
  Olivier Chafik cbaadc9294 grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609) vor 1 Jahr
  Jared Van Bortel 1b67731e18 BERT tokenizer fixes (#6498) vor 1 Jahr
  Rick G e3c337d87c llama : support negative ith in llama_get_ API (#6519) vor 1 Jahr
  Jan Boon beea6e1b16 llama : save and restore kv cache for single seq id (#6341) vor 1 Jahr
  Clint Herron 9b84ae1806 examples : add GBNF validator program (#5948) vor 1 Jahr
  Jared Van Bortel be55134a53 convert : refactor vocab selection logic (#6355) vor 1 Jahr
  compilade 557410b8f0 llama : greatly reduce output buffer memory usage (#6122) vor 1 Jahr
  Kawrakow 55c1b2a3bb IQ1_M: 1.75 bpw quantization (#6302) vor 1 Jahr
  Kawrakow d25b1c31b0 quantize : be able to override metadata by key (#6321) vor 1 Jahr
  Kawrakow 1d0331c12a quantize: options for output and token embedding tensors qtype (#6239) vor 1 Jahr
  Pierrick Hymbert dba1af6129 llama_model_loader: support multiple split/shard GGUFs (#6187) vor 1 Jahr
  Theia Vogel 877b4d0c62 llama : add support for control vectors (#5970) vor 1 Jahr