Historie revizí

Autor SHA1 Zpráva Datum
  Sigbjørn Skjæret 39842a7f73 gguf-py : remove erroneous FFN_GATE entry (#15583) před 5 měsíci
  Sigbjørn Skjæret 0fd90db585 metal : remove contiguous assertion for src0 in IM2COL (#15577) před 5 měsíci
  Yoshi_likes_e4 4c37636b3e Add a warning for special devices (#15563) před 5 měsíci
  Jeff Bolz 34bdbbd7c2 vulkan: Remove splitting for mul_mat_id (#15568) před 5 měsíci
  Qeeweew 74f52f77f2 CUDA: Accelerate MXFP4 table lookup using `__byte_perm` (#15451) před 5 měsíci
  lhez f7207b0415 opencl: fix support ops condition for `rms_norm` (#15560) před 5 měsíci
  Ruben Ortlam 4d917cd4f6 vulkan: fix min subgroup 16 condition for mmid subgroup optimization (#15565) před 5 měsíci
  Jeff Bolz 886b97a5d6 tests: Generate unique input values for count_equal (#15487) před 5 měsíci
  Ihar Hrachyshka 111f8d06f0 metal: fix regression when no metal devices are present (#15531) před 5 měsíci
  Johannes Gäßler 5eff6ec9b1 CUDA: MoE helper in device code, better tile sizes (#15525) před 5 měsíci
  Daniel Bevenius dfd9b5f6c7 model-conversion : set pooling type to none in logits.cpp (#15564) před 5 měsíci
  Daniel Bevenius 5a6bc6b1a6 model-conversion : add model card template for embeddings [no ci] (#15557) před 5 měsíci
  Georgi Gerganov 6b64f74b55 batched-bench : fix unified KV cache handling + pp timing (#15562) před 5 měsíci
  Weizhao Ouyang 0d5a470223 convert : update Ernie 4.5 dense architecture name (#15555) před 5 měsíci
  Georgi Gerganov b0ba31f525 metal : add FA kernels for HS=40 (#15559) před 5 měsíci
  RunningLeon 7da9fed0d6 convert : support interns1-mini (#15412) před 5 měsíci
  Chenguang Li c247d06f38 CANN: ROPE cache sin/cos repeat (#15501) před 5 měsíci
  Ruben Ortlam 043fb27d38 vulkan: apply MUL_MAT_ID subgroup optimization to non-coopmat devices (#15524) před 5 měsíci
  Georgi Gerganov b730706a49 kv-cache : support layer reuse (#15504) před 5 měsíci
  Jeff Bolz c9a24fb932 vulkan: Support FA with any multiple of 8 head sizes (#15537) před 5 měsíci
  Ruben Ortlam a9c6ffcbfa vulkan: enable Conv2D for Apple after MoltenVK fixed the bug (#15526) před 5 měsíci
  Jeff Bolz e78cf0d4b1 vulkan: workaround MoltenVK compile failure in multi_add (#15506) před 5 měsíci
  Johannes Gäßler 710dfc465a CUDA: fix half2 -> half conversion for HIP (#15529) před 5 měsíci
  Jeff Bolz 611f419cff vulkan: optimize rms_norm, and allow the work to spread across multiple SMs (#15281) před 5 měsíci
  Piotr Wilkin (ilintar) b1afcab804 model : add support for Seed-OSS (#15490) před 5 měsíci
  Johannes Gäßler 9ef536907d scripts: fix compare-llama-bench.py (#15521) před 5 měsíci
  LaffeyNyaa 21dc4ddaf2 chat : fix debug build assertion in trim function (#15520) před 5 měsíci
  Jeff Bolz 289bf4113e vulkan: Rewrite synchronization to allow some overlap between nodes (#15489) před 5 měsíci
  R0CKSTAR b55f06e1aa vulkan.Dockerfile: install vulkan SDK using tarball (#15282) před 5 měsíci
  Acly 0a9b43e507 vulkan : support ggml_mean (#15393) před 5 měsíci