Преглед на файлове

ggml : refactor llamafile_sgemm PPC code (#14673)

Remove un-necessary templates from class definition and packing functions
Reduce deeply nested conditionals, if-else switching in mnapck function
Replace repetitive code with inline functions in Packing functions

2 ~ 7% improvement in Q8 Model
15 ~ 50% improvement in Q4 Model

Signed-off-by: Shalini Salomi Bodapati <Shalini.Salomi.Bodapati@ibm.com>
shalinib-ibm преди 6 месеца
родител
ревизия
55c509daf5
променени са 1 файла, в които са добавени 172 реда и са изтрити 691 реда
  1. 172 691
      ggml/src/ggml-cpu/llamafile/sgemm.cpp

Файловите разлики са ограничени, защото са твърде много
+ 172 - 691
ggml/src/ggml-cpu/llamafile/sgemm.cpp


Някои файлове не бяха показани, защото твърде много файлове са промени