6 месяцев назад · 05fec5bd29
--- a/ggml/src/ggml-cann/ggml-cann.cpp
+++ b/ggml/src/ggml-cann/ggml-cann.cpp
@@ -2090,6 +2090,7 @@ static bool ggml_backend_cann_supports_op(ggml_backend_dev_t dev,
 
				             {
			
 
				                 // TODO: add support
			
 
				                 // ref: https://github.com/ggml-org/llama.cpp/pull/14274
			
 
				+#pragma message("TODO: implement F32, F16, BF16, Q4_0, Q4_1, Q5_0, Q5_1, Q8_0, IQ4_NL support (https://github.com/ggml-org/llama.cpp/pull/14661)")
			
 
				                 return false;
			
 
				             } break;
			
 
				         case GGML_OP_CPY: {
			
--- a/ggml/src/ggml-cuda/ggml-cuda.cu
+++ b/ggml/src/ggml-cuda/ggml-cuda.cu
@@ -3222,6 +3222,7 @@ static bool ggml_backend_cuda_device_supports_op(ggml_backend_dev_t dev, const g
 
				             } break;
			
 
				         case GGML_OP_SET_ROWS:
			
 
				             {
			
 
				+#pragma message("TODO: implement BF16, Q4_0, Q4_1, Q5_0, Q5_1, Q8_0, IQ4_NL support (https://github.com/ggml-org/llama.cpp/pull/14661)")
			
 
				                 return (op->type == GGML_TYPE_F32 || op->type == GGML_TYPE_F16) &&
			
 
				                        op->src[0]->type == GGML_TYPE_F32 &&
			
 
				                        op->src[1]->type == GGML_TYPE_I64;
			
--- a/ggml/src/ggml-opencl/ggml-opencl.cpp
+++ b/ggml/src/ggml-opencl/ggml-opencl.cpp
@@ -2280,6 +2280,7 @@ static bool ggml_opencl_supports_op(ggml_backend_dev_t dev, const struct ggml_te
 
				             {
			
 
				                 // TODO: add support
			
 
				                 // ref: https://github.com/ggml-org/llama.cpp/pull/14274
			
 
				+#pragma message("TODO: implement BF16, Q4_0, Q4_1, Q5_0, Q5_1, Q8_0, IQ4_NL support (https://github.com/ggml-org/llama.cpp/pull/14661)")
			
 
				                 if (op->src[0]->type != GGML_TYPE_F32) {
			
 
				                     return false;
			
 
				                 }
			
--- a/ggml/src/ggml-sycl/ggml-sycl.cpp
+++ b/ggml/src/ggml-sycl/ggml-sycl.cpp
@@ -4303,6 +4303,7 @@ static bool ggml_backend_sycl_device_supports_op(ggml_backend_dev_t dev, const g
 
				             {
			
 
				                 // TODO: add support
			
 
				                 // ref: https://github.com/ggml-org/llama.cpp/pull/14274
			
 
				+#pragma message("TODO: implement BF16, Q4_0, Q4_1, Q5_0, Q5_1, Q8_0, IQ4_NL support (https://github.com/ggml-org/llama.cpp/pull/14661)")
			
 
				                 return (op->type == GGML_TYPE_F32 || (op->type == GGML_TYPE_F16 && op->src[0]->type == GGML_TYPE_F32 && op->src[1]->type == GGML_TYPE_I64));
			
 
				             } break;
			
 
				         case GGML_OP_CPY: