před 1 rokem · 61d1c88e15
--- a/ggml-vulkan-shaders.hpp
+++ b/ggml-vulkan-shaders.hpp
--- a/ggml-vulkan.cpp
+++ b/ggml-vulkan.cpp
--- a/ggml-vulkan.h
+++ b/ggml-vulkan.h
@@ -10,6 +10,7 @@ extern "C" {
 
															 #define GGML_VK_NAME "Vulkan"
														
 
															 #define GGML_VK_MAX_DEVICES 16
														
 
															+GGML_API void ggml_vk_instance_init(void);
														
 
															 GGML_API void ggml_vk_init_cpu_assist(void);
														
 
															 GGML_API void ggml_vk_preallocate_buffers_graph_cpu_assist(struct ggml_tensor * node);
														
--- a/ggml_vk_generate_shaders.py
+++ b/ggml_vk_generate_shaders.py
--- a/llama.cpp
+++ b/llama.cpp
@@ -5014,8 +5014,8 @@ static struct ggml_tensor * llm_build_kqv(
 
															         ggml_mul_mat_set_prec(kq, GGML_PREC_F32);
														
 
															     }
														
 
															-#if defined(GGML_USE_VULKAN) || defined(GGML_USE_KOMPUTE)
														
 
															-#pragma message("TODO: ALiBi support in ggml_soft_max_ext is not implemented for Vulkan, and Kompute")
														
 
															+#if defined(GGML_USE_KOMPUTE)
														
 
															+#pragma message("TODO: ALiBi support in ggml_soft_max_ext is not implemented for Kompute")
														
 
															 #pragma message("      Falling back to ggml_alibi(). Will become an error in Mar 2024")
														
 
															 #pragma message("ref:  https://github.com/ggerganov/llama.cpp/pull/5488")
														
 
															     if (hparams.f_max_alibi_bias > 0.0f) {