提交歷史

作者 SHA1 備註 提交日期
  Valentin Mamedov a0974156f3 llama : add Deepseek MoE v1 & GigaChat models (#10827) 1 年之前
  HimariO ba1cb19cdd llama : add Qwen2VL support + multimodal RoPE (#10361) 1 年之前
  Robert Collins 62e84d9848 llama : add 128k yarn context for Qwen (#10698) 1 年之前
  Sukriti Sharma 784a14aa49 convert : add support for Roberta embeddings (#10695) 1 年之前
  Riccardo Orlando 6fe6247831 llama : add Minerva 7B model support (#10673) 1 年之前
  JFLFY2255 8d0cfd554a llama: Support MiniCPM-1B (with & w/o longrope) (#10559) 1 年之前
  Shane A 80acb7b430 Rename Olmo1124 to Olmo2 (#10500) 1 年之前
  Gabe Goodhart 9336db462c convert : XLMRoberta Type Vocab Size (#10458) 1 年之前
  Shane A a88ad007de llama : add OLMo November 2024 support (#10394) 1 年之前
  Faisal Zaghloul 60e17ce23c Remove identical wte/etw logic for jais (#10203) 1 年之前
  Xuan Son Nguyen 7554aa4655 convert-lora : make `--base` optional (#10110) 1 年之前
  Georgi Gerganov bc5ba007b2 server : check that the prompt fits in the slot's context (#10030) 1 年之前
  Molly Sophia 11d47057a5 Rwkv chat template fix (#10001) 1 年之前
  Molly Sophia 4ff7fe1fb3 llama : add chat template for RWKV-World + fix EOT (#9968) 1 年之前
  compilade 1927378bcc convert : refactor rope_freqs generation (#9396) 1 年之前
  nopperl f99d3f8367 py : add model class for Chameleon conversion (#9683) 1 年之前
  Georgi Gerganov f4d2b8846a llama : add reranking support (#9510) 1 年之前
  nopperl 9a913110cf llama : add support for Chameleon (#8543) 1 年之前
  Gabe Goodhart 3d6bf6919f llama : add IBM Granite MoE architecture (#9438) 1 年之前
  Gabe Goodhart 0d2ec43833 llama : support IBM Granite architecture (#9412) 1 年之前
  compilade d54c21df7e convert : identify missing model files (#9397) 1 年之前
  Shane A 0aadac10c7 llama : support OLMoE (#9462) 1 年之前
  CarryFun 95ca85168b llama : support MiniCPM3 (#9322) 1 年之前
  Csaba Kecskemeti 3c7989fd29 py : add "LLaMAForCausalLM" conversion support (#9485) 1 年之前
  daminho c837981bba py : add Phi-1.5/Phi-2 tokenizer (#9361) 1 年之前
  Molly Sophia 39f852f440 py : add special tokens in hf_converter for RWKV v6 (#9428) 1 年之前
  Molly Sophia 0b4ac75772 RWKV v6: Add time_mix_decay_w1/w2 in quant exclusion list (#9387) 1 年之前
  compilade 9bc6db28d0 ggml-quants : ternary packing for TriLMs and BitNet b1.58 (#8151) 1 年之前
  Molly Sophia 8f1d81a0b6 llama : support RWKV v6 models (#8980) 1 年之前
  Carsten Kragelund Jørgensen 75e1dbbaab llama : fix llama3.1 rope_freqs not respecting custom head_dim (#9141) 1 年之前