akawrykow
|
5c872dbca2
falcon : use stated vocab size (#2914)
|
2 ani în urmă |
bandoti
|
990a5e226a
cmake : add relocatable Llama package (#2960)
|
2 ani în urmă |
dylan
|
980ab41afb
docker : add gpu image CI builds (#3103)
|
2 ani în urmă |
Kerfuffle
|
e394084166
gguf-py : support identity operation in TensorNameMap (#3095)
|
2 ani în urmă |
jameswu2014
|
4c8643dd6e
feature : support Baichuan serial models (#3009)
|
2 ani în urmă |
Leng Yue
|
35f73049af
speculative : add heuristic algorithm (#3006)
|
2 ani în urmă |
goerch
|
71ca2fad7d
whisper : tokenizer fix + re-enable tokenizer test for LLaMa (#3096)
|
2 ani în urmă |
Tristan Ross
|
1b6c650d16
cmake : add a compiler flag check for FP16 format (#3086)
|
2 ani în urmă |
Johannes Gäßler
|
0a5eebb45d
CUDA: mul_mat_q RDNA2 tunings (#2910)
|
2 ani în urmă |
FK
|
84e723653c
speculative: add --n-gpu-layers-draft option (#3063)
|
2 ani în urmă |
Eric Sommerlade
|
b52b29ab9d
arm64 support for windows (#3007)
|
2 ani în urmă |
Johannes Gäßler
|
4f7cd6ba9c
CUDA: fix LoRAs (#3130)
|
2 ani în urmă |
Johannes Gäßler
|
89e89599fd
CUDA: fix mul_mat_q not used for output tensor (#3127)
|
2 ani în urmă |
Johannes Gäßler
|
d54a4027a6
CUDA: lower GPU latency + fix Windows performance (#3110)
|
2 ani în urmă |
Jhen-Jie Hong
|
1b0d09259e
cmake : support build for iOS/tvOS (#3116)
|
2 ani în urmă |
Johannes Gäßler
|
8a4ca9af56
CUDA: add device number to error messages (#3112)
|
2 ani în urmă |
Kawrakow
|
f31b6f4e2d
metal : PP speedup (#3084)
|
2 ani în urmă |
Erik Scholz
|
6eeb4d9083
convert: remove most of the n_mult usage in convert.py (#3098)
|
2 ani în urmă |
kchro3
|
21ac3a1503
metal : support for Swift (#3078)
|
2 ani în urmă |
Jhen-Jie Hong
|
4fd5477955
metal : support build for iOS/tvOS (#3089)
|
2 ani în urmă |
takov751
|
ec2a24fedf
flake : add train-text-from-scratch to flake.nix (#3042)
|
2 ani în urmă |
Ikko Eltociear Ashimine
|
7d99aca759
readme : fix typo (#3043)
|
2 ani în urmă |
Kawrakow
|
ba7ffbb251
metal : Q3_K speedup (#2995)
|
2 ani în urmă |
Cebtenzzre
|
e64f5b5578
examples : make n_ctx warning work again (#3066)
|
2 ani în urmă |
Georgi Gerganov
|
94f10b91ed
readme : update hot tpoics
|
2 ani în urmă |
Georgi Gerganov
|
b3e9852e47
sync : ggml (CUDA GLM RoPE + POSIX) (#3082)
|
2 ani în urmă |
Przemysław Pawełczyk
|
cb6c44c5e0
build : do not use _GNU_SOURCE gratuitously (#2035)
|
2 ani în urmă |
hongbo.mo
|
a21baeb122
docker : add git to full-cuda.Dockerfile main-cuda.Dockerfile (#3044)
|
2 ani în urmă |
Yui
|
6ff712a6d1
Update deprecated GGML TheBloke links to GGUF (#3079)
|
2 ani în urmă |
slaren
|
ebc96086af
ggml-alloc : correctly check mmap return value for errors (#3075)
|
2 ani în urmă |