2 år sedan · 1a941869cb
--- a/llama.cpp
+++ b/llama.cpp
@@ -1722,9 +1722,10 @@ static bool llama_eval_internal(
 
															 #ifdef GGML_USE_METAL
														
 
															     if (lctx.ctx_metal && N == 1) {
														
 
															-        if (!ggml_metal_if_optimized(lctx.ctx_metal)) {
														
 
															-            ggml_metal_graph_find_concurrency(lctx.ctx_metal, gf);
														
 
															-        }
														
 
															+        // TODO: disabled until #2413 is resolved
														
 
															+        //if (!ggml_metal_if_optimized(lctx.ctx_metal)) {
														
 
															+        //    ggml_metal_graph_find_concurrency(lctx.ctx_metal, gf);
														
 
															+        //}
														
 
															         ggml_metal_set_n_cb     (lctx.ctx_metal, n_threads);
														
 
															         ggml_metal_graph_compute(lctx.ctx_metal, gf);
														
 
															         ggml_metal_get_tensor   (lctx.ctx_metal, cur);