Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov fd1234cb46 llama : add gpt-oss (#15091) hace 5 meses
  Juk Armstrong c81de6e107 Fix `glm4moe` bug (#15088) hace 5 meses
  Sam ef0144c087 model: support GLM 4.5 family of models (#14939) hace 5 meses
  compilade 11a3811164 memory : handle kv_unified for hybrid models (#15050) hace 5 meses
  Douglas Hanley 339bd0268c model : support Qwen3-Embedding (#15023) hace 5 meses
  stevenkuang 0f5ccd6fd1 model : add hunyuan dense (#14878) hace 5 meses
  Diego Devesa d6818d06a6 llama : allow other bufts when overriding to CPU, add --no-repack option (#14990) hace 5 meses
  Dongliang Wei c1dacaa99b llama : merge build_moe_ffn_from_probs function into build_moe_ffn (#14968) hace 5 meses
  Aman Gupta 8a4a856277 Add LLaDA 8b Diffusion model (#14771) hace 5 meses
  Dongliang Wei 6c6e397aff model : add support for SmallThinker series (#14898) hace 5 meses
  Gabriel Larson 4762ad7316 model : make rope_yarn_log_mul optional for deepseek2 (#14896) hace 5 meses
  Shunta Saito 1dc9614e06 llama : fix kq_scale for the attention layers of PLaMo2 (#14892) hace 5 meses
  yummy 86f5623d90 llama : fix MiniCPM inference after Granite Four changes (#14850) hace 5 meses
  Molly Sophia d4d1522b20 llama : add model type detection for rwkv7 7B&14B (#14816) hace 6 meses
  Georgi Gerganov eacdeb5bfc model : fix build after merge conflict (#14754) hace 6 meses
  lgai-exaone e0cb5c5cb8 model : add EXAONE 4.0 support (#14630) hace 6 meses
  Georgi Gerganov 8f974bc1e9 graph : refactor context to not pass gf explicitly (#14629) hace 6 meses
  Piotr Wilkin (ilintar) cb887f1bc1 model: add Ernie 4.5 MoE support (#14658) hace 6 meses
  Georgi Gerganov 01612b7409 llama : reuse compute graphs (#14482) hace 6 meses
  Tarek Dakhran 086cf81e88 llama : fix parallel processing for lfm2 (#14705) hace 6 meses
  tempstudio b0f0ecc3dc model : support output bias for qwen2 (#14711) hace 6 meses
  Georgi Gerganov 225e7a1438 llama : add high-throughput mode (#14363) hace 6 meses
  Aman Gupta ab14019821 Support diffusion models: Add Dream 7B (#14644) hace 6 meses
  Shunta Saito e4841d24d3 llama : fix parallel processing for plamo2 (#14716) hace 6 meses
  Shunta Saito 68e37a61a7 model : add PLaMo-2 support (#14560) hace 6 meses
  Tarek Dakhran f5e96b368f model : support LiquidAI LFM2 hybrid family (#14620) hace 6 meses
  Gabe Goodhart 0aedae00e6 model : Granite Four (#13550) hace 6 meses
  Ryan Mangeno 4bb625b713 Smoldocling support (#14597) hace 6 meses
  Xuan-Son Nguyen cb9178f885 llama : remove llm_graph_input_one (#14603) hace 6 meses
  compilade 4a5686da22 llama : support Jamba hybrid Transformer-Mamba models (#7531) hace 6 meses