Johannes Gäßler
|
8a4ca9af56
CUDA: add device number to error messages (#3112)
|
2 年 前 |
Kawrakow
|
f31b6f4e2d
metal : PP speedup (#3084)
|
2 年 前 |
Erik Scholz
|
6eeb4d9083
convert: remove most of the n_mult usage in convert.py (#3098)
|
2 年 前 |
kchro3
|
21ac3a1503
metal : support for Swift (#3078)
|
2 年 前 |
Jhen-Jie Hong
|
4fd5477955
metal : support build for iOS/tvOS (#3089)
|
2 年 前 |
takov751
|
ec2a24fedf
flake : add train-text-from-scratch to flake.nix (#3042)
|
2 年 前 |
Ikko Eltociear Ashimine
|
7d99aca759
readme : fix typo (#3043)
|
2 年 前 |
Kawrakow
|
ba7ffbb251
metal : Q3_K speedup (#2995)
|
2 年 前 |
Cebtenzzre
|
e64f5b5578
examples : make n_ctx warning work again (#3066)
|
2 年 前 |
Georgi Gerganov
|
94f10b91ed
readme : update hot tpoics
|
2 年 前 |
Georgi Gerganov
|
b3e9852e47
sync : ggml (CUDA GLM RoPE + POSIX) (#3082)
|
2 年 前 |
Przemysław Pawełczyk
|
cb6c44c5e0
build : do not use _GNU_SOURCE gratuitously (#2035)
|
2 年 前 |
hongbo.mo
|
a21baeb122
docker : add git to full-cuda.Dockerfile main-cuda.Dockerfile (#3044)
|
2 年 前 |
Yui
|
6ff712a6d1
Update deprecated GGML TheBloke links to GGUF (#3079)
|
2 年 前 |
slaren
|
ebc96086af
ggml-alloc : correctly check mmap return value for errors (#3075)
|
2 年 前 |
Kunshang Ji
|
7f412dab9c
enable CPU HBM (#2603)
|
2 年 前 |
Cebtenzzre
|
6336d834ec
convert : fix F32 ftype not being saved (#3048)
|
2 年 前 |
Cebtenzzre
|
00d62adb79
fix some warnings from gcc and clang-tidy (#3038)
|
2 年 前 |
Cebtenzzre
|
4fa2cc1750
make : improve test target (#3031)
|
2 年 前 |
Cebtenzzre
|
5ffab089a5
make : fix CPPFLAGS (#3035)
|
2 年 前 |
slaren
|
15b67a66c2
llama-bench : use two tokens in the warmup run for prompt evals (#3059)
|
2 年 前 |
Kawrakow
|
be8c9c245b
metal : parallel RoPE on Metal (#3024)
|
2 年 前 |
Kawrakow
|
be6beeb8d7
metal : correct fix of kernel_norm (#3060)
|
2 年 前 |
Georgi Gerganov
|
c4f496648c
metal : fix kernel_norm (fixes Falcon on Metal) (#3057)
|
2 年 前 |
Przemysław Pawełczyk
|
fec2fb19e4
ggml : posixify madvise and pagesize (#3037)
|
2 年 前 |
Georgi Gerganov
|
178b1850eb
k-quants : fix zero-weight guard in Q6_K (ref #3040)
|
2 年 前 |
Kerfuffle
|
ea2c85d5d2
convert-llama-ggml-to-gguf: Try to handle files older than GGJTv3 (#3023)
|
2 年 前 |
Cebtenzzre
|
9912b9efc8
build : add LLAMA_METAL_NDEBUG flag (#3033)
|
2 年 前 |
Cebtenzzre
|
9e2023156e
make : use new flag variables for recent changes (#3019)
|
2 年 前 |
Cebtenzzre
|
de2fe892af
examples : replace fprintf to stdout with printf (#3017)
|
2 年 前 |