Georgi Gerganov
|
fd1234cb46
llama : add gpt-oss (#15091)
|
hace 5 meses |
Juk Armstrong
|
c81de6e107
Fix `glm4moe` bug (#15088)
|
hace 5 meses |
Sam
|
ef0144c087
model: support GLM 4.5 family of models (#14939)
|
hace 5 meses |
compilade
|
11a3811164
memory : handle kv_unified for hybrid models (#15050)
|
hace 5 meses |
Douglas Hanley
|
339bd0268c
model : support Qwen3-Embedding (#15023)
|
hace 5 meses |
stevenkuang
|
0f5ccd6fd1
model : add hunyuan dense (#14878)
|
hace 5 meses |
Diego Devesa
|
d6818d06a6
llama : allow other bufts when overriding to CPU, add --no-repack option (#14990)
|
hace 5 meses |
Dongliang Wei
|
c1dacaa99b
llama : merge build_moe_ffn_from_probs function into build_moe_ffn (#14968)
|
hace 5 meses |
Aman Gupta
|
8a4a856277
Add LLaDA 8b Diffusion model (#14771)
|
hace 5 meses |
Dongliang Wei
|
6c6e397aff
model : add support for SmallThinker series (#14898)
|
hace 5 meses |
Gabriel Larson
|
4762ad7316
model : make rope_yarn_log_mul optional for deepseek2 (#14896)
|
hace 5 meses |
Shunta Saito
|
1dc9614e06
llama : fix kq_scale for the attention layers of PLaMo2 (#14892)
|
hace 5 meses |
yummy
|
86f5623d90
llama : fix MiniCPM inference after Granite Four changes (#14850)
|
hace 5 meses |
Molly Sophia
|
d4d1522b20
llama : add model type detection for rwkv7 7B&14B (#14816)
|
hace 6 meses |
Georgi Gerganov
|
eacdeb5bfc
model : fix build after merge conflict (#14754)
|
hace 6 meses |
lgai-exaone
|
e0cb5c5cb8
model : add EXAONE 4.0 support (#14630)
|
hace 6 meses |
Georgi Gerganov
|
8f974bc1e9
graph : refactor context to not pass gf explicitly (#14629)
|
hace 6 meses |
Piotr Wilkin (ilintar)
|
cb887f1bc1
model: add Ernie 4.5 MoE support (#14658)
|
hace 6 meses |
Georgi Gerganov
|
01612b7409
llama : reuse compute graphs (#14482)
|
hace 6 meses |
Tarek Dakhran
|
086cf81e88
llama : fix parallel processing for lfm2 (#14705)
|
hace 6 meses |
tempstudio
|
b0f0ecc3dc
model : support output bias for qwen2 (#14711)
|
hace 6 meses |
Georgi Gerganov
|
225e7a1438
llama : add high-throughput mode (#14363)
|
hace 6 meses |
Aman Gupta
|
ab14019821
Support diffusion models: Add Dream 7B (#14644)
|
hace 6 meses |
Shunta Saito
|
e4841d24d3
llama : fix parallel processing for plamo2 (#14716)
|
hace 6 meses |
Shunta Saito
|
68e37a61a7
model : add PLaMo-2 support (#14560)
|
hace 6 meses |
Tarek Dakhran
|
f5e96b368f
model : support LiquidAI LFM2 hybrid family (#14620)
|
hace 6 meses |
Gabe Goodhart
|
0aedae00e6
model : Granite Four (#13550)
|
hace 6 meses |
Ryan Mangeno
|
4bb625b713
Smoldocling support (#14597)
|
hace 6 meses |
Xuan-Son Nguyen
|
cb9178f885
llama : remove llm_graph_input_one (#14603)
|
hace 6 meses |
compilade
|
4a5686da22
llama : support Jamba hybrid Transformer-Mamba models (#7531)
|
hace 6 meses |