1 jaar geleden · 3b8f1ec4b1
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -43,6 +43,18 @@ else()
 
															     set(LLAMA_METAL_DEFAULT OFF)
														
 
															 endif()
														
 
															+# TODO: fix this for Android CI
														
 
															+#       https://github.com/ggerganov/llama.cpp/pull/6716#issuecomment-2061509191
														
 
															+#if (CMAKE_SYSTEM_NAME MATCHES "ANDROID")
														
 
															+#    set(LLAMA_LLAMAFILE_DEFAULT OFF)
														
 
															+#else()
														
 
															+#    set(LLAMA_LLAMAFILE_DEFAULT ON)
														
 
															+#endif()
														
 
															+
														
 
															+# TODO: temporary disable until MoE is fixed
														
 
															+#       https://github.com/ggerganov/llama.cpp/pull/6716
														
 
															+set(LLAMA_LLAMAFILE_DEFAULT OFF)
														
 
															+
														
 
															 # general
														
 
															 option(BUILD_SHARED_LIBS                "build shared libraries"                                OFF)
														
 
															 option(LLAMA_STATIC                     "llama: static link libraries"                          OFF)
														
@@ -88,7 +100,7 @@ endif()
 
															 # 3rd party libs
														
 
															 option(LLAMA_ACCELERATE                      "llama: enable Accelerate framework"               ON)
														
 
															 option(LLAMA_BLAS                            "llama: use BLAS"                                  OFF)
														
 
															-option(LLAMA_LLAMAFILE                       "llama: use llamafile SGEMM"                       ON)
														
 
															+option(LLAMA_LLAMAFILE                       "llama: use llamafile SGEMM"                       ${LLAMA_LLAMAFILE_DEFAULT})
														
 
															 set(LLAMA_BLAS_VENDOR "Generic" CACHE STRING "llama: BLAS library vendor")
														
 
															 option(LLAMA_CUDA                            "llama: use CUDA"                                  OFF)
														
 
															 option(LLAMA_CUBLAS                          "llama: use CUDA (deprecated, use LLAMA_CUDA)"     OFF)
														
@@ -372,6 +384,9 @@ endif()
 
															 if (LLAMA_LLAMAFILE)
														
 
															     add_compile_definitions(GGML_USE_LLAMAFILE)
														
 
															+
														
 
															+    set(GGML_HEADERS_LLAMAFILE sgemm.h)
														
 
															+    set(GGML_SOURCES_LLAMAFILE sgemm.cpp)
														
 
															 endif()
														
 
															 if (LLAMA_QKK_64)
														
@@ -1157,17 +1172,16 @@ add_library(ggml OBJECT
 
															             ggml-backend.h
														
 
															             ggml-quants.c
														
 
															             ggml-quants.h
														
 
															-            sgemm.cpp
														
 
															-            sgemm.h
														
 
															-            ${GGML_SOURCES_CUDA}    ${GGML_HEADERS_CUDA}
														
 
															-            ${GGML_SOURCES_OPENCL}  ${GGML_HEADERS_OPENCL}
														
 
															-            ${GGML_SOURCES_METAL}   ${GGML_HEADERS_METAL}
														
 
															-            ${GGML_SOURCES_MPI}     ${GGML_HEADERS_MPI}
														
 
															-            ${GGML_SOURCES_EXTRA}   ${GGML_HEADERS_EXTRA}
														
 
															-            ${GGML_SOURCES_SYCL}    ${GGML_HEADERS_SYCL}
														
 
															-            ${GGML_SOURCES_KOMPUTE} ${GGML_HEADERS_KOMPUTE}
														
 
															-            ${GGML_SOURCES_VULKAN}  ${GGML_HEADERS_VULKAN}
														
 
															-            ${GGML_SOURCES_ROCM}    ${GGML_HEADERS_ROCM}
														
 
															+            ${GGML_SOURCES_CUDA}      ${GGML_HEADERS_CUDA}
														
 
															+            ${GGML_SOURCES_OPENCL}    ${GGML_HEADERS_OPENCL}
														
 
															+            ${GGML_SOURCES_METAL}     ${GGML_HEADERS_METAL}
														
 
															+            ${GGML_SOURCES_MPI}       ${GGML_HEADERS_MPI}
														
 
															+            ${GGML_SOURCES_EXTRA}     ${GGML_HEADERS_EXTRA}
														
 
															+            ${GGML_SOURCES_SYCL}      ${GGML_HEADERS_SYCL}
														
 
															+            ${GGML_SOURCES_KOMPUTE}   ${GGML_HEADERS_KOMPUTE}
														
 
															+            ${GGML_SOURCES_VULKAN}    ${GGML_HEADERS_VULKAN}
														
 
															+            ${GGML_SOURCES_ROCM}      ${GGML_HEADERS_ROCM}
														
 
															+            ${GGML_SOURCES_LLAMAFILE} ${GGML_HEADERS_LLAMAFILE}
														
 
															             )
														
 
															 target_include_directories(ggml PUBLIC . ${LLAMA_EXTRA_INCLUDES})
														
--- a/Makefile
+++ b/Makefile
@@ -219,13 +219,6 @@ ifdef LLAMA_DISABLE_LOGS
 
															 	MK_CPPFLAGS += -DLOG_DISABLE_LOGS
														
 
															 endif # LLAMA_DISABLE_LOGS
														
 
															-# disable ggml.c's use of sgemm.cpp
														
 
															-ifdef LLAMA_NO_LLAMAFILE
														
 
															-	MK_CPPFLAGS += -DGGML_USE_LLAMAFILE=0
														
 
															-else
														
 
															-	MK_CPPFLAGS += -DGGML_USE_LLAMAFILE=1
														
 
															-endif
														
 
															-
														
 
															 # warnings
														
 
															 WARN_FLAGS    = -Wall -Wextra -Wpedantic -Wcast-qual -Wno-unused-function
														
 
															 MK_CFLAGS    += $(WARN_FLAGS) -Wshadow -Wstrict-prototypes -Wpointer-arith -Wmissing-prototypes -Werror=implicit-int \
														
@@ -391,6 +384,15 @@ ifdef LLAMA_OPENBLAS
 
															 	MK_LDFLAGS  += $(shell pkg-config --libs openblas)
														
 
															 endif # LLAMA_OPENBLAS
														
 
															+# TODO: temporary disable until MoE is fixed
														
 
															+#       https://github.com/ggerganov/llama.cpp/pull/6716
														
 
															+LLAMA_NO_LLAMAFILE := 1
														
 
															+
														
 
															+ifndef LLAMA_NO_LLAMAFILE
														
 
															+	MK_CPPFLAGS += -DGGML_USE_LLAMAFILE
														
 
															+	OBJS        += sgemm.o
														
 
															+endif
														
 
															+
														
 
															 ifdef LLAMA_BLIS
														
 
															 	MK_CPPFLAGS += -DGGML_USE_OPENBLAS -I/usr/local/include/blis -I/usr/include/blis
														
 
															 	MK_LDFLAGS  += -lblis -L/usr/local/lib
														
@@ -487,11 +489,9 @@ ggml-cuda/%.o: ggml-cuda/%.cu ggml-cuda/%.cuh ggml.h ggml-common.h ggml-cuda/com
 
															 ggml-cuda.o: ggml-cuda.cu ggml-cuda.h ggml.h ggml-backend.h ggml-backend-impl.h ggml-common.h $(wildcard ggml-cuda/*.cuh)
														
 
															 	$(NVCC_COMPILE)
														
 
															-
														
 
															 endif # LLAMA_CUDA
														
 
															 ifdef LLAMA_CLBLAST
														
 
															-
														
 
															 	MK_CPPFLAGS += -DGGML_USE_CLBLAST $(shell pkg-config --cflags-only-I clblast OpenCL)
														
 
															 	MK_CFLAGS   += $(shell pkg-config --cflags-only-other clblast OpenCL)
														
 
															 	MK_CXXFLAGS += $(shell pkg-config --cflags-only-other clblast OpenCL)
														
@@ -610,6 +610,11 @@ ggml-mpi.o: ggml-mpi.c ggml-mpi.h
 
															 	$(CC) $(CFLAGS) -c $< -o $@
														
 
															 endif # LLAMA_MPI
														
 
															+ifndef LLAMA_NO_LLAMAFILE
														
 
															+sgemm.o: sgemm.cpp sgemm.h ggml.h
														
 
															+	$(CXX) $(CXXFLAGS) -c $< -o $@
														
 
															+endif
														
 
															+
														
 
															 GF_CC := $(CC)
														
 
															 include scripts/get-flags.mk
														
@@ -683,16 +688,13 @@ ggml-backend.o: ggml-backend.c ggml.h ggml-backend.h
 
															 ggml-quants.o: ggml-quants.c ggml.h ggml-quants.h ggml-common.h
														
 
															 	$(CC) $(CFLAGS)    -c $< -o $@
														
 
															-sgemm.o: sgemm.cpp sgemm.h ggml.h
														
 
															-	$(CXX) $(CXXFLAGS) -c $< -o $@
														
 
															-
														
 
															 unicode.o: unicode.cpp unicode.h
														
 
															 	$(CXX) $(CXXFLAGS) -c $< -o $@
														
 
															 unicode-data.o: unicode-data.cpp unicode-data.h
														
 
															 	$(CXX) $(CXXFLAGS) -c $< -o $@
														
 
															-OBJS += ggml-alloc.o ggml-backend.o ggml-quants.o unicode.o unicode-data.o sgemm.o
														
 
															+OBJS += ggml-alloc.o ggml-backend.o ggml-quants.o unicode.o unicode-data.o
														
 
															 llama.o: llama.cpp unicode.h ggml.h ggml-alloc.h ggml-backend.h ggml-cuda.h ggml-metal.h llama.h
														
 
															 	$(CXX) $(CXXFLAGS) -c $< -o $@