hai 1 ano · 61d1c88e15
--- a/ggml-vulkan-shaders.hpp
+++ b/ggml-vulkan-shaders.hpp
--- a/ggml-vulkan.cpp
+++ b/ggml-vulkan.cpp
--- a/ggml-vulkan.h
+++ b/ggml-vulkan.h
@@ -10,6 +10,7 @@ extern "C" {
 
				 #define GGML_VK_NAME "Vulkan"
			
 
				 #define GGML_VK_MAX_DEVICES 16
			
 
				 
			
 
				+GGML_API void ggml_vk_instance_init(void);
			
 
				 GGML_API void ggml_vk_init_cpu_assist(void);
			
 
				 
			
 
				 GGML_API void ggml_vk_preallocate_buffers_graph_cpu_assist(struct ggml_tensor * node);
			
--- a/ggml_vk_generate_shaders.py
+++ b/ggml_vk_generate_shaders.py
--- a/llama.cpp
+++ b/llama.cpp
@@ -5014,8 +5014,8 @@ static struct ggml_tensor * llm_build_kqv(
 
				         ggml_mul_mat_set_prec(kq, GGML_PREC_F32);
			
 
				     }
			
 
				 
			
 
				-#if defined(GGML_USE_VULKAN) || defined(GGML_USE_KOMPUTE)
			
 
				-#pragma message("TODO: ALiBi support in ggml_soft_max_ext is not implemented for Vulkan, and Kompute")
			
 
				+#if defined(GGML_USE_KOMPUTE)
			
 
				+#pragma message("TODO: ALiBi support in ggml_soft_max_ext is not implemented for Kompute")
			
 
				 #pragma message("      Falling back to ggml_alibi(). Will become an error in Mar 2024")
			
 
				 #pragma message("ref:  https://github.com/ggerganov/llama.cpp/pull/5488")
			
 
				     if (hparams.f_max_alibi_bias > 0.0f) {