Georgi Gerganov
|
4de0334f5c
cmake : fix Metal build (close #1791)
|
hace 2 años |
Andrei
|
303f5809f1
metal : fix issue with ggml-metal.metal path. Closes #1769 (#1782)
|
hace 2 años |
johnson442
|
0035858273
k-quants : add missing compile definition to CMakeLists (#1748)
|
hace 2 años |
Georgi Gerganov
|
5c64a0952e
k-quants : allow to optionally disable at compile time (#1734)
|
hace 2 años |
Kawrakow
|
99009e72f8
ggml : add SOTA 2,3,4,5,6 bit k-quantizations (#1684)
|
hace 2 años |
Georgi Gerganov
|
ecb217db4f
llama : Metal inference (#1642)
|
hace 2 años |
Henri Vasserman
|
0ecb1bbbeb
[CI] Fix openblas (#1613)
|
hace 2 años |
Johannes Gäßler
|
1fcdcc28b1
cuda : performance optimizations (#1530)
|
hace 2 años |
0cc4m
|
2e6cd4b025
OpenCL Token Generation Acceleration (#1459)
|
hace 2 años |
Steward Garcia
|
7e4ea5beff
examples : add server example with REST API (#1443)
|
hace 2 años |
Zenix
|
b8ee340abe
feature : support blis and other blas implementation (#1536)
|
hace 2 años |
Georgi Gerganov
|
ea600071cb
Revert "feature : add blis and other BLAS implementation support (#1502)"
|
hace 2 años |
Zenix
|
07e9ace0f9
feature : add blis and other BLAS implementation support (#1502)
|
hace 2 años |
kuvaus
|
9daff419f6
fix build-info.h for git submodules (#1289)
|
hace 2 años |
Marvin Gießing
|
cc0bb7235c
ggml : fix ppc64le build error and make cmake detect Power processors (#1284)
|
hace 2 años |
DannyDaemonic
|
f4cef87edf
Add git-based build information for better issue tracking (#1232)
|
hace 2 años |
Pavol Rusnak
|
6f79699286
build: add armv{6,7,8} support to cmake (#1251)
|
hace 2 años |
Georgi Gerganov
|
305eb5afd5
build : fix reference to old llama_util.h
|
hace 2 años |
0cc4m
|
7296c961d9
ggml : add CLBlast support (#1164)
|
hace 2 años |
Georgi Gerganov
|
0e018fe008
ggml : fix Q4_3 cuBLAS
|
hace 2 años |
Howard Su
|
7e312f165c
cmake : fix build under Windows when enable BUILD_SHARED_LIBS (#1100)
|
hace 2 años |
源文雨
|
018f2279f5
cmake : link threads publicly to ggml (#1042)
|
hace 2 años |
slaren
|
02d6988121
Improve cuBLAS performance by dequantizing on the GPU (#1065)
|
hace 2 años |
Stephan Walter
|
f3d4edf504
ggml : Q4 cleanup - remove 4-bit dot product code (#1061)
|
hace 2 años |
slaren
|
8944a13296
Add NVIDIA cuBLAS support (#1044)
|
hace 2 años |
Kawrakow
|
5ecff35151
Adding a simple program to measure speed of dot products (#1041)
|
hace 2 años |
Ivan Komarov
|
f266259ad9
Speedup the AVX-512 implementation of ggml_vec_dot_q4_0() (#933)
|
hace 2 años |
katsu560
|
106faaf297
cmake : add finding the OpenBLAS header file (#992)
|
hace 2 años |
Georgi Gerganov
|
9190e8eac8
llama : merge llama_internal.h into llama.h
|
hace 2 años |
anzz1
|
585d91a156
cmake : add explicit F16C option (x86) (#576)
|
hace 2 años |