Historial de Commits

Autor SHA1 Mensaje Fecha
  Georgi Gerganov 4de0334f5c cmake : fix Metal build (close #1791) hace 2 años
  Andrei 303f5809f1 metal : fix issue with ggml-metal.metal path. Closes #1769 (#1782) hace 2 años
  johnson442 0035858273 k-quants : add missing compile definition to CMakeLists (#1748) hace 2 años
  Georgi Gerganov 5c64a0952e k-quants : allow to optionally disable at compile time (#1734) hace 2 años
  Kawrakow 99009e72f8 ggml : add SOTA 2,3,4,5,6 bit k-quantizations (#1684) hace 2 años
  Georgi Gerganov ecb217db4f llama : Metal inference (#1642) hace 2 años
  Henri Vasserman 0ecb1bbbeb [CI] Fix openblas (#1613) hace 2 años
  Johannes Gäßler 1fcdcc28b1 cuda : performance optimizations (#1530) hace 2 años
  0cc4m 2e6cd4b025 OpenCL Token Generation Acceleration (#1459) hace 2 años
  Steward Garcia 7e4ea5beff examples : add server example with REST API (#1443) hace 2 años
  Zenix b8ee340abe feature : support blis and other blas implementation (#1536) hace 2 años
  Georgi Gerganov ea600071cb Revert "feature : add blis and other BLAS implementation support (#1502)" hace 2 años
  Zenix 07e9ace0f9 feature : add blis and other BLAS implementation support (#1502) hace 2 años
  kuvaus 9daff419f6 fix build-info.h for git submodules (#1289) hace 2 años
  Marvin Gießing cc0bb7235c ggml : fix ppc64le build error and make cmake detect Power processors (#1284) hace 2 años
  DannyDaemonic f4cef87edf Add git-based build information for better issue tracking (#1232) hace 2 años
  Pavol Rusnak 6f79699286 build: add armv{6,7,8} support to cmake (#1251) hace 2 años
  Georgi Gerganov 305eb5afd5 build : fix reference to old llama_util.h hace 2 años
  0cc4m 7296c961d9 ggml : add CLBlast support (#1164) hace 2 años
  Georgi Gerganov 0e018fe008 ggml : fix Q4_3 cuBLAS hace 2 años
  Howard Su 7e312f165c cmake : fix build under Windows when enable BUILD_SHARED_LIBS (#1100) hace 2 años
  源文雨 018f2279f5 cmake : link threads publicly to ggml (#1042) hace 2 años
  slaren 02d6988121 Improve cuBLAS performance by dequantizing on the GPU (#1065) hace 2 años
  Stephan Walter f3d4edf504 ggml : Q4 cleanup - remove 4-bit dot product code (#1061) hace 2 años
  slaren 8944a13296 Add NVIDIA cuBLAS support (#1044) hace 2 años
  Kawrakow 5ecff35151 Adding a simple program to measure speed of dot products (#1041) hace 2 años
  Ivan Komarov f266259ad9 Speedup the AVX-512 implementation of ggml_vec_dot_q4_0() (#933) hace 2 años
  katsu560 106faaf297 cmake : add finding the OpenBLAS header file (#992) hace 2 años
  Georgi Gerganov 9190e8eac8 llama : merge llama_internal.h into llama.h hace 2 años
  anzz1 585d91a156 cmake : add explicit F16C option (x86) (#576) hace 2 años