Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov 663027fd54 context : fix n_outputs during reserve (#15858) před 4 měsíci
  Georgi Gerganov c610b6c11b kv-cache : fix SWA checks + disable cacheless iSWA (#15811) před 4 měsíci
  Daniel Bevenius fb15d649ed llama : add support for EmbeddingGemma 300m (#15798) před 4 měsíci
  Johannes Gäßler e81b8e4b7f llama: use FA + max. GPU layers by default (#15434) před 5 měsíci
  Georgi Gerganov 8a4280ce43 kv-cache : remove LLAMA_SET_ROWS checks (#15505) před 5 měsíci
  Georgi Gerganov 0373486dbc graph : fix assert in memory-less build_attn (#15590) před 5 měsíci
  Georgi Gerganov 3f196be84b graph : remove build_attn_with_sinks overload (#15469) před 5 měsíci
  Georgi Gerganov 715a6db02c kv-cache : drop the "unified" prefix (#15467) před 5 měsíci
  Georgi Gerganov fd1234cb46 llama : add gpt-oss (#15091) před 5 měsíci
  Sam ef0144c087 model: support GLM 4.5 family of models (#14939) před 6 měsíci
  Dongliang Wei c1dacaa99b llama : merge build_moe_ffn_from_probs function into build_moe_ffn (#14968) před 6 měsíci
  compilade 66625a59a5 graph : reduce splits for recurrent and hybrid models (#14825) před 6 měsíci
  Douglas Hanley a118d80233 embeddings: fix extraction of CLS pooling results (#14927) před 6 měsíci
  Dongliang Wei 6c6e397aff model : add support for SmallThinker series (#14898) před 6 měsíci
  Georgi Gerganov bf9087f59a metal : fuse add, mul + add tests (#14596) před 6 měsíci
  Georgi Gerganov 9fb1042ce6 graph : fix graph reuse reset of params (#14760) před 6 měsíci
  Georgi Gerganov d498af3d5a graph : avoid huge warm-up graphs for MoE models (#14753) před 6 měsíci
  Georgi Gerganov 8f974bc1e9 graph : refactor context to not pass gf explicitly (#14629) před 6 měsíci
  Nexes the Elder 09651d09ff graph : Pass the graph placeholder message in debug mode (#14748) před 6 měsíci
  Georgi Gerganov 01612b7409 llama : reuse compute graphs (#14482) před 6 měsíci
  Georgi Gerganov 225e7a1438 llama : add high-throughput mode (#14363) před 6 měsíci
  Xuan-Son Nguyen cb9178f885 llama : remove llm_graph_input_one (#14603) před 6 měsíci
  compilade 4a5686da22 llama : support Jamba hybrid Transformer-Mamba models (#7531) před 6 měsíci
  Georgi Gerganov 7b50f7c025 graph : prepare for 4D mask (#14515) před 7 měsíci
  Georgi Gerganov a70c8a0c4b kv-cache : use ggml_set_rows (#14285) před 7 měsíci
  compilade 5d46babdc2 llama : initial Mamba-2 support (#9126) před 7 měsíci
  Sigbjørn Skjæret a0535ffa0d ggml : implement REGLU/GEGLU/SWIGLU ops (#14158) před 7 měsíci
  Xuan-Son Nguyen 8846aace49 model : gemma3n text-only (#14400) před 7 měsíci
  Georgi Gerganov 692e3cdd0a memory : rename interface to llama_memory_context_i (#14296) před 7 měsíci
  Georgi Gerganov 812939a9e9 model : more uniform output id handling (#14275) před 7 měsíci