compilade
|
4a5686da22
llama : support Jamba hybrid Transformer-Mamba models (#7531)
|
hace 7 meses |
ibrahim khadraoui
|
04655063c4
model : add support for Falcon-H1 family (#14534)
|
hace 7 meses |
Xuan-Son Nguyen
|
08382869a2
model : add SmolLM3 (#14581)
|
hace 7 meses |
Xuan-Son Nguyen
|
8f22dc0a53
model : add hunyuan moe (#14425)
|
hace 7 meses |
compilade
|
5d46babdc2
llama : initial Mamba-2 support (#9126)
|
hace 7 meses |
Weizhao Ouyang
|
566c16fcce
model : add support for ERNIE 4.5 0.3B model (#14408)
|
hace 7 meses |
Xuan-Son Nguyen
|
8846aace49
model : gemma3n text-only (#14400)
|
hace 7 meses |
Sigbjørn Skjæret
|
88fc854b4b
llama : improve sep token handling (#14272)
|
hace 7 meses |
Gabe Goodhart
|
edc4a29eff
memory : Hybrid recurrent cache (#13979)
|
hace 7 meses |
Đinh Trọng Huy
|
ad590be98c
model : add NeoBERT (#14164)
|
hace 7 meses |
Bartowski
|
d7da8dc83a
model : Add support for Arcee AI's upcoming AFM model (#14185)
|
hace 7 meses |
Mikko Juola
|
9ae4143bc6
model : add dots.llm1 architecture support (#14044) (#14118)
|
hace 7 meses |
Sigbjørn Skjæret
|
0974ad7a7c
llama : fix llama_model_chat_template with template name (LLM_KV with suffix) (#14050)
|
hace 8 meses |
Sigbjørn Skjæret
|
6385b843a8
llama : add RobertaForSequenceClassification reranker support (#13875)
|
hace 8 meses |
AT
|
5f5e39e1ba
model : Nomic Embed Text V2 with Mixture-of-Experts (MoE) architecture (#12466)
|
hace 9 meses |
Juk Armstrong
|
daa422881a
llama : DeepSeek V2/V3 MLA implementation (#12801)
|
hace 9 meses |
Yuxuan Zhang
|
06bb53ad9b
llama-model : add Glm4Model implementation for GLM-4-0414 (#12867)
|
hace 9 meses |
Bo Zheng
|
d3bd7193ba
llama : Support Qwen3 and Qwen3MoE (#12828)
|
hace 10 meses |
Xuan-Son Nguyen
|
1466621e73
llama : Support llama 4 text-only (#12791)
|
hace 10 meses |
jklincn
|
e39e727e9a
llama : use LLM_KV_GENERAL_FILE_TYPE instead of gguf_find_key (#12672)
|
hace 10 meses |
Sigbjørn Skjæret
|
2c3f8b850a
llama : support BailingMoE (Ling) (#12634)
|
hace 10 meses |
Si1w
|
f125b8dccf
llama : add PLM GGUF Conversion & Inference Support (#12457)
|
hace 10 meses |
Molly Sophia
|
7dfad387e3
llama: Add support for RWKV v7 architecture (#12412)
|
hace 10 meses |
Xuan-Son Nguyen
|
7841fc723e
llama : Add Gemma 3 support (+ experimental vision capability) (#12343)
|
hace 10 meses |
Olivier Chafik
|
6171c9d258
Add Jinja template support (#11016)
|
hace 1 año |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
hace 1 año |
Molly Sophia
|
ee7136c6d1
llama: add support for QRWKV6 model architecture (#11001)
|
hace 1 año |
Pierrick Hymbert
|
f8feb4b01a
model: Add support for PhiMoE arch (#11003)
|
hace 1 año |
fairydreaming
|
9394bbd484
llama : Add support for DeepSeek V3 (#11049)
|
hace 1 año |
DAN™
|
46be942214
llama : add support for the cohere2 model architecture (#10900)
|
hace 1 año |