Commit History

Автор SHA1 Съобщение Дата
  John aa23412989 llava : support v1.6 (#5267) преди 1 година
  Sang-Kil Park f68664ac24 convert : fix TypeError on GPT-2 vocab.json (#5288) преди 1 година
  Georgi Gerganov 906cff55c2 py : handle byte tokens in `get_token_type` (#5341) преди 1 година
  Georgi Gerganov 14fef85e2d py : fix except (#5194) преди 2 години
  Sang-Kil Park e76627bcce py : improve BPE tokenizer support (#5189) преди 2 години
  Jared Van Bortel b43ebde3b0 convert : partially revert PR #4818 (#5041) преди 2 години
  David Sommers b46757735d convert.py : fix llama/llama2 conversion due to vocab_size=-1 (#5019) преди 2 години
  Georgi Gerganov 0f83e727af py : fix whitespace преди 2 години
  Georgi Gerganov 4f4bf35f46 py : fix missing added_tokens_dict for SPM and BPE vocabs (#4971) преди 2 години
  Austin 6efb8eb30e convert.py : fix vanilla LLaMA model conversion (#4818) преди 2 години
  Nam D. Tran f6793491b5 llama : add AWQ for llama, llama2, mpt, and mistral models (#4593) преди 2 години
  wonjun Jang f56d6077d0 Add byte token type when tokenizer.model is not exists (#4641) преди 2 години
  wonjun Jang 873637afc7 convert : support loading vocab from fast tokenizer config (#3633) преди 2 години
  slaren 799a1cb13b llama : add Mixtral support (#4406) преди 2 години
  Richard Kiss 9494d7c477 english : use `typos` to fix comments and logs (#4354) преди 2 години
  slaren f4d973cecb convert.py : fix llama/llama2 conversion due to vocab_size=-1 (#4258) преди 2 години
  crasm 3014b5415d Update docs for yarn_ext_factor <0.0 as unspecified instead of NaN (#4189) преди 2 години
  Galunid f23c0359a3 ci : add flake8 to github actions (python linting) (#4129) преди 2 години
  Don Mahurin 2ab0707acb convert : use 'model' value if it exists. This allows karpathy/tinyllamas to load (#4089) преди 2 години
  afrideva b46d12f86d convert.py: also look for plain model.safetensors (#4043) преди 2 години
  Kerfuffle 34b0a08207 gguf-py: Refactor and allow reading/modifying existing GGUF files (#3981) преди 2 години
  Galunid a75fa576ab scripts: Generalize convert scripts (#3838) преди 2 години
  cebtenzzre 898aeca90a llama : implement YaRN RoPE scaling (#2268) преди 2 години
  Georgi Gerganov 8a2f2fea29 convert : ignore tokens if their IDs are within [0, vocab_size) (#3831) преди 2 години
  Kerfuffle a5e7dbd614 llama : validate special token ids are in range when loading GGUF model (#3635) преди 2 години
  Qin Yue Chen 8cf19d60dc gguf : support big endian platform (#3552) преди 2 години
  goerch ff5a3f0c09 Work on the BPE tokenizer (#3252) преди 2 години
  cebtenzzre 0fe321031a gguf : general usability improvements (#3409) преди 2 години
  Zhang Peiyuan e519621010 convert : remove bug in convert.py permute function (#3364) преди 2 години
  Erik Scholz 6eeb4d9083 convert: remove most of the n_mult usage in convert.py (#3098) преди 2 години