Историја ревизија

Аутор SHA1 Порука Датум
  Daniel Bevenius 233d773d02 convert : force setting sliding_window from original config (#15867) пре 5 месеци
  Georgi Gerganov a885dcff11 batched-bench : fix llama_synchronize usage during prompt processing (#15835) пре 5 месеци
  Georgi Gerganov 663027fd54 context : fix n_outputs during reserve (#15858) пре 5 месеци
  Georgi Gerganov cf0e3ba150 model : avoid ggml_cont_3d for fused QKV weights (#15662) пре 5 месеци
  Jeff Bolz d413dca003 tests: large sizes for get_rows (#15687) пре 5 месеци
  Chenguang Li 85ca66a746 CANN: Stream sync between devices for acl_graph (#15809) пре 5 месеци
  Jeff Bolz 3976dfbe00 vulkan: support im2col_3d (#15795) пре 5 месеци
  Aaron Teo d36e61c580 ggml-cpu: clean up s390x SIMD (#15855) пре 5 месеци
  Jeff Bolz c97b5e5854 vulkan: Support pad_ext (#15794) пре 5 месеци
  Jeff Bolz 267e99867f vulkan: Use larger loads in scalar/coopmat1 matmul (#15729) пре 5 месеци
  Daniel Bevenius 3b15924d71 ggml WebGPU: remove userdata from request adapter callback (#15527) пре 5 месеци
  Johannes Gäßler 79bc429262 CUDA: faster tile FA (Pascal/AMD), headsize 256 (#15769) пре 5 месеци
  Charles Xu c4df49a42d kleidiai: generalize compute_forward_kv_cache to compute_forward_fp16 (#15817) пре 5 месеци
  Xuan-Son Nguyen 3c3635d2f2 server : speed up tests (#15836) пре 5 месеци
  Xuan-Son Nguyen 61bdfd5298 server : implement prompt processing progress report in stream mode (#15827) пре 5 месеци
  Johannes Gäßler 01806e7771 ggml-cpu: document use of "free" memory [no ci] (#15834) пре 5 месеци
  Aaron Teo 186415d595 ggml-cpu: drop support for nnpa intrinsics (#15821) пре 5 месеци
  Gabe Goodhart fd621880f3 aLoRA Support (#15327) пре 5 месеци
  Sigbjørn Skjæret 4281c7b315 ci : exempt correct research label (#15825) пре 5 месеци
  Gabe Goodhart 5fac79cbc7 Thinking model disabled assistant prefill (#15404) пре 5 месеци
  Eric Curtin 408ff524b4 Implement --log-colors with always/never/auto (#15792) пре 5 месеци
  Johannes Gäßler 5143fa895e CUDA: fastdiv, launch bounds for mmvq + q8_1 quant (#15802) пре 5 месеци
  Daniel Bevenius 3a550b5ca4 tests : add --list-ops and --show-coverage options (#15745) пре 5 месеци
  Erik Scholz a81283820a gguf: gguf_writer refactor (#15691) пре 5 месеци
  Georgi Gerganov c610b6c11b kv-cache : fix SWA checks + disable cacheless iSWA (#15811) пре 5 месеци
  Daniel Bevenius 5d6688de08 model-conversion : add --embeddings flag to modelcard.template [no ci] (#15801) пре 5 месеци
  ExtReMLapin 4fd1242bef chat : fixed crash when Hermes 2 <tool_call> had a newline before it (#15639) пре 5 месеци
  Piotr Wilkin (ilintar) b2426e469e chat : nemotron thinking & toolcalling support (#15676) пре 5 месеци
  Piotr Wilkin (ilintar) 9e2b1e83c6 scripts : add Jinja tester PySide6 simple app (#15756) пре 5 месеци
  Daniel Bevenius fb15d649ed llama : add support for EmbeddingGemma 300m (#15798) пре 5 месеци