История коммитов

Автор SHA1 Сообщение Дата
  Johannes Gäßler 10d2af0eaa llama/ggml: add LLM training support (#10544) 8 месяцев назад
  Georgi Gerganov b34443923c sync : ggml (#13268) 8 месяцев назад
  Johannes Gäßler b0ecbd434b test: non-cont. b in test-backend-ops -o MUL_MAT (#13187) 8 месяцев назад
  Johannes Gäßler e1e8e0991f CUDA: batched+noncont MMQ, refactor bs>1 MoE code (#13199) 8 месяцев назад
  Xuan-Son Nguyen edb18b6e8f clip : fix pixtral on some GPU backends (#13097) 8 месяцев назад
  Johannes Gäßler 658987cfc9 CUDA: noncont MMVQ + batched bs1 MUL_MAT_ID (#13014) 8 месяцев назад
  Georgi Gerganov 2f74c354c0 graph : make FA compatible with MLA + add initial Metal kernels (#12953) 9 месяцев назад
  Jeff Bolz 015022bb53 vulkan: enable coopmat2 FA gqa and split_k optimizations more often (#12931) 9 месяцев назад
  Georgi Gerganov 1d2b613445 tests : fix init order (#0) 9 месяцев назад
  Diego Devesa fe92821ea9 ggml : add bilinear upscale support (ggml/1185) 9 месяцев назад
  Jeff Bolz f01bd02376 vulkan: Implement split_k for coopmat2 flash attention. (#12627) 9 месяцев назад
  Georgi Gerganov b4ae50810e metal : improve FA + improve MoE (#12612) 9 месяцев назад
  Jeff Bolz 9b169a4d4e vulkan: fix mul_mat_vec failure in backend tests (#12529) 9 месяцев назад
  Georgi Gerganov ba932dfb50 ggml : fix quantized cpy op (#12310) 10 месяцев назад
  Jeff Bolz eddfb43850 vulkan: Optimize mul_mat_vec p021 and nc shaders (#12505) 10 месяцев назад
  Gaurav Garg 517b5ddbf0 CUDA: Improve flash decoding kernel GPU occupancy for BS=1 case (#12183) 10 месяцев назад
  Molly Sophia 7dfad387e3 llama: Add support for RWKV v7 architecture (#12412) 10 месяцев назад
  Jeff Bolz bf69cfe62f vulkan: fix bug in coopmat1 mul_mat_id (#12316) 10 месяцев назад
  cmdr2 0cbee131ad cuda/vulkan: specify fp32-only support for some operations in supports_op (ggml/1129) 10 месяцев назад
  cmdr2 87abb7e903 cuda/cpu: Increase support for fp16 unary operations (ggml/1125) 10 месяцев назад
  cmdr2 f54a4ba11e Support pure float16 add/sub/mul/div operations in the CUDA (and CPU) backend (ggml/1121) 10 месяцев назад
  Diego Devesa d5c63cd7f9 test-backend-ops : add option -p to filter by op params (#12155) 10 месяцев назад
  William Tambellini 70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854) 10 месяцев назад
  Johannes Gäßler 5fa07c2f93 CUDA: optimize FA for GQA + large batches (#12014) 10 месяцев назад
  Rémy O 2eea03d86a vulkan: implement several ops relevant for ggml_opt (#11769) 11 месяцев назад
  Johannes Gäßler fd08255d0d CUDA: non-contiguous (RMS) norm support (#11659) 11 месяцев назад
  Akarshan Biswas 6e84b0ab8e SYCL : SOFTMAX F16 mask support and other fixes (#11261) 11 месяцев назад
  Johannes Gäßler 8137b4bb2b CPU/CUDA: fix (GQA) mul mat back, add CUDA support (#11380) 11 месяцев назад
  Jeff Bolz 564804b79b tests: fix some mul_mat test gaps (#11375) 11 месяцев назад
  Jeff Bolz 44e18ef939 vulkan: fix coopmat2 flash attention for non-contiguous inputs (#11281) 1 год назад