Xuan-Son Nguyen
|
8ea958d4d9
model : add ASR support for LFM2-Audio-1.5B (conformer) (#18106)
|
4 săptămâni în urmă |
Sigbjørn Skjæret
|
9cff4cc554
convert : sort and use file parts from model index if present (#18043)
|
1 lună în urmă |
Sigbjørn Skjæret
|
5166aaf868
convert : force patch_merger tensors to f16/f32 (#18124)
|
1 lună în urmă |
Xuan-Son Nguyen
|
3d86c6c2b5
model: support GLM4V vision encoder (#18042)
|
1 lună în urmă |
Daniel Bevenius
|
2995341730
llama : add support for NVIDIA Nemotron 3 Nano (#18058)
|
1 lună în urmă |
Sigbjørn Skjæret
|
d6a1e18c65
convert : move rope_parameters to TextModel class (#18061)
|
1 lună în urmă |
HelloKS
|
9d52f17ae3
model : add KORMo model (#18032)
|
1 lună în urmă |
piDack
|
745fa0e78b
model : add glm-asr support (#17901)
|
1 lună în urmă |
Sigbjørn Skjæret
|
5c8a717128
convert : refactor rope scaling handling (#18013)
|
1 lună în urmă |
Georgi Gerganov
|
7bed317f53
models : fix the attn_factor for mistral3 graphs + improve consistency (#17945)
|
1 lună în urmă |
Xuan-Son Nguyen
|
9e79b0116e
convert: allow using quantized Mistral weight (#17889)
|
1 lună în urmă |
philip-essential
|
1d2a1ab73d
model : support Rnj-1 (#17811)
|
1 lună în urmă |
Xuan-Son Nguyen
|
dbc15a7967
convert: support Mistral 3 Large MoE (#17730)
|
1 lună în urmă |
SmartestWashingMachine
|
3659aa28e9
convert: use existing local chat_template if mistral-format model has one. (#17749)
|
1 lună în urmă |
Xuan-Son Nguyen
|
2c453c6c77
convert: add error message for mistral3 quantized weight (#17686)
|
1 lună în urmă |
Xuan-Son Nguyen
|
cd3c118908
model: support Ministral3 (#17644)
|
1 lună în urmă |
Piotr Wilkin (ilintar)
|
ff55414c42
model : Qwen3 Next (#16095)
|
1 lună în urmă |
Aleksei Nikiforov
|
05872ac885
convert : fix big-endian conversion (#17431)
|
1 lună în urmă |
Sigbjørn Skjæret
|
b61de2b2df
convert : allow quantizing lora again (#17453)
|
1 lună în urmă |
william pan
|
4902eebe33
models : Added support for RND1 Diffusion Language Model (#17433)
|
1 lună în urmă |
Sigbjørn Skjæret
|
07b0e7a5ac
convert : use self.block_count everywhere instead of reading hparams (#17359)
|
1 lună în urmă |
Sigbjørn Skjæret
|
662192e1dc
convert : remove unnecessary chat template patching (#17289)
|
2 luni în urmă |
Sigbjørn Skjæret
|
9a8860cf5d
convert : use all parts in safetensors index (#17286)
|
2 luni în urmă |
Sigbjørn Skjæret
|
9d3ef4809f
convert : set expert gating func in base class (#17279)
|
2 luni în urmă |
Bartowski
|
e1fcf8b09b
model : add AfmoeForCausalLM support (#16477)
|
2 luni în urmă |
levkropp
|
2fc392ce35
convert : register UMT5Model architecture for T5 conversion (#17160)
|
2 luni în urmă |
compilade
|
802cef44bf
convert : parse safetensors directly (#15667)
|
2 luni în urmă |
compilade
|
1c07c0c68c
convert : handle compressed-tensors quant method (#17069)
|
2 luni în urmă |
Li Pengzhan
|
9f052478c2
model : add openPangu-Embedded (#16941)
|
2 luni în urmă |
Zhiyong Wang
|
6b9a52422b
model: add Janus Pro for image understanding (#16906)
|
2 luni în urmă |