|
|
@@ -14,14 +14,14 @@ Legend:
|
|
|
|
|
|
| Operation | BLAS | CANN | CPU | CUDA | Metal | OpenCL | SYCL | Vulkan | zDNN |
|
|
|
|-----------|------|------|------|------|------|------|------|------|------|
|
|
|
-| ABS | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
+| ABS | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | ๐ก | โ |
|
|
|
| ACC | โ | โ
| โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
| ADD | โ | โ
| โ
| โ
| ๐ก | ๐ก | โ
| โ
| โ |
|
|
|
| ADD1 | โ | โ
| โ
| โ
| โ | โ | โ
| โ | โ |
|
|
|
-| ADD_ID | โ | โ | โ
| โ
| โ | โ | โ | โ | โ |
|
|
|
+| ADD_ID | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
| ARANGE | โ | โ
| โ
| โ
| โ
| โ | โ
| โ | โ |
|
|
|
| ARGMAX | โ | โ
| โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
-| ARGSORT | โ | โ
| โ
| โ
| โ
| โ
| โ
| โ
| โ |
|
|
|
+| ARGSORT | โ | โ
| โ
| โ
| โ
| โ
| โ
| ๐ก | โ |
|
|
|
| CEIL | โ | โ | โ
| ๐ก | โ | โ | ๐ก | โ | โ |
|
|
|
| CLAMP | โ | โ
| โ
| โ
| ๐ก | ๐ก | โ
| ๐ก | โ |
|
|
|
| CONCAT | โ | โ
| โ
| ๐ก | โ
| ๐ก | โ
| โ
| โ |
|
|
|
@@ -30,7 +30,7 @@ Legend:
|
|
|
| CONV_2D_DW | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
| CONV_3D | โ | โ | โ
| โ | โ | โ | โ | โ | โ |
|
|
|
| CONV_TRANSPOSE_1D | โ | โ
| โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
-| CONV_TRANSPOSE_2D | โ | โ | โ
| โ
| โ | โ | โ | โ | โ |
|
|
|
+| CONV_TRANSPOSE_2D | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
| COS | โ | โ
| โ
| โ
| ๐ก | โ | โ
| ๐ก | โ |
|
|
|
| COUNT_EQUAL | โ | โ
| โ
| โ
| โ | โ | โ
| โ
| โ |
|
|
|
| CPY | โ | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | โ |
|
|
|
@@ -41,7 +41,7 @@ Legend:
|
|
|
| DIV | โ | โ
| โ
| โ
| ๐ก | ๐ก | โ
| โ
| โ |
|
|
|
| DUP | โ | โ
| โ
| ๐ก | ๐ก | ๐ก | โ
| ๐ก | โ |
|
|
|
| ELU | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
-| EXP | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
+| EXP | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | ๐ก | โ |
|
|
|
| EXPM1 | โ | โ | โ
| ๐ก | โ | โ | โ | โ | โ |
|
|
|
| FILL | โ | โ | โ
| โ | โ | โ | โ | โ | โ |
|
|
|
| FLASH_ATTN_EXT | โ | ๐ก | โ
| ๐ก | ๐ก | โ | โ | ๐ก | โ |
|
|
|
@@ -57,22 +57,22 @@ Legend:
|
|
|
| GET_ROWS_BACK | โ | โ | ๐ก | ๐ก | โ | โ | โ | โ | โ |
|
|
|
| GROUP_NORM | โ | โ
| โ
| โ
| โ
| โ
| โ
| โ
| โ |
|
|
|
| GROUP_NORM_MUL_ADD | โ | โ | โ | โ | โ | โ | โ
| โ | โ |
|
|
|
-| HARDSIGMOID | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
-| HARDSWISH | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
+| HARDSIGMOID | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | ๐ก | โ |
|
|
|
+| HARDSWISH | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | ๐ก | โ |
|
|
|
| IM2COL | โ | โ
| โ
| โ
| ๐ก | โ
| โ
| โ
| โ |
|
|
|
-| IM2COL_3D | โ | โ | โ
| โ
| โ | โ | โ | โ | โ |
|
|
|
+| IM2COL_3D | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
| L2_NORM | โ | โ | โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
-| LEAKY_RELU | โ | โ
| โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
+| LEAKY_RELU | โ | โ
| โ
| โ
| โ
| โ | โ
| ๐ก | โ |
|
|
|
| LOG | โ | โ
| โ
| โ
| โ | โ | โ
| โ | โ |
|
|
|
-| MEAN | โ | โ
| โ
| โ
| โ
| โ | โ
| โ | โ |
|
|
|
+| MEAN | โ | โ
| โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
| MUL | โ | โ
| โ
| โ
| ๐ก | ๐ก | โ
| โ
| โ |
|
|
|
| MUL_MAT | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก | ๐ก |
|
|
|
| MUL_MAT_ID | โ | ๐ก | โ
| โ
| โ
| ๐ก | ๐ก | โ
| โ |
|
|
|
-| NEG | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
+| NEG | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | ๐ก | โ |
|
|
|
| NORM | โ | โ
| โ
| โ
| ๐ก | โ
| โ
| ๐ก | โ |
|
|
|
| NORM_MUL_ADD | โ | โ | โ | โ | โ | โ | โ
| โ | โ |
|
|
|
| OPT_STEP_ADAMW | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
-| OPT_STEP_SGD | โ | โ | โ
| โ
| โ | โ | โ | โ | โ |
|
|
|
+| OPT_STEP_SGD | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
| OUT_PROD | ๐ก | โ | ๐ก | ๐ก | โ | โ | ๐ก | โ | โ |
|
|
|
| PAD | โ | โ
| โ
| ๐ก | โ
| โ
| ๐ก | โ
| โ |
|
|
|
| PAD_REFLECT_1D | โ | โ
| โ
| โ
| โ
| โ | โ
| โ | โ |
|
|
|
@@ -83,7 +83,7 @@ Legend:
|
|
|
| REPEAT_BACK | โ | โ | โ
| โ
| โ | โ | โ
| โ
| โ |
|
|
|
| RMS_NORM | โ | โ
| โ
| โ
| ๐ก | โ
| โ
| โ
| โ |
|
|
|
| RMS_NORM_BACK | โ | โ | โ
| โ
| โ | โ | โ
| โ
| โ |
|
|
|
-| RMS_NORM_MUL_ADD | โ | โ
| โ | โ | โ
| โ
| โ
| โ
| โ |
|
|
|
+| RMS_NORM_MUL_ADD | โ | โ
| โ | โ | โ
| โ
| โ
| โ | โ |
|
|
|
| ROLL | โ | โ | โ
| โ
| โ | โ | โ
| โ
| โ |
|
|
|
| ROPE | โ | ๐ก | โ
| โ
| โ
| โ
| โ
| โ
| โ |
|
|
|
| ROPE_BACK | โ | โ | โ
| โ
| โ | โ | โ | โ
| โ |
|
|
|
@@ -104,15 +104,15 @@ Legend:
|
|
|
| SOFT_MAX_BACK | โ | โ | ๐ก | ๐ก | โ | โ | ๐ก | โ
| โ |
|
|
|
| SOLVE_TRI | โ | โ | โ
| โ | โ | โ | โ | โ | โ |
|
|
|
| SQR | โ | โ
| โ
| โ
| ๐ก | โ | โ
| ๐ก | โ |
|
|
|
-| SQRT | โ | โ
| โ
| โ
| ๐ก | โ | โ
| โ | โ |
|
|
|
+| SQRT | โ | โ
| โ
| โ
| ๐ก | โ | โ
| ๐ก | โ |
|
|
|
| SSM_CONV | โ | โ | โ
| โ
| โ
| โ | โ
| โ
| โ |
|
|
|
-| SSM_SCAN | โ | โ | โ
| โ
| โ
| โ | โ | โ
| โ |
|
|
|
+| SSM_SCAN | โ | โ | โ
| โ
| โ
| โ | โ | ๐ก | โ |
|
|
|
| STEP | โ | โ
| โ
| ๐ก | ๐ก | โ | ๐ก | โ | โ |
|
|
|
| SUB | โ | โ
| โ
| โ
| ๐ก | ๐ก | โ
| โ
| โ |
|
|
|
-| SUM | โ | โ
| โ
| ๐ก | โ | โ | ๐ก | โ
| โ |
|
|
|
+| SUM | โ | โ
| โ
| ๐ก | โ | โ | ๐ก | ๐ก | โ |
|
|
|
| SUM_ROWS | โ | โ
| โ
| ๐ก | โ
| โ
| ๐ก | โ
| โ |
|
|
|
| SWIGLU | โ | โ
| โ
| โ
| ๐ก | โ
| โ
| ๐ก | โ |
|
|
|
-| SWIGLU_OAI | โ | โ | โ
| โ
| โ | โ | โ | โ | โ |
|
|
|
+| SWIGLU_OAI | โ | โ | โ
| โ
| โ | โ | โ | ๐ก | โ |
|
|
|
| TANH | โ | โ
| โ
| ๐ก | ๐ก | โ
| ๐ก | ๐ก | โ |
|
|
|
| TIMESTEP_EMBEDDING | โ | โ
| โ
| โ
| โ
| โ
| โ
| โ
| โ |
|
|
|
| TOPK_MOE | โ | โ | โ | โ | โ | โ | โ
| โ | โ |
|