Cebtenzzre
|
de2fe892af
examples : replace fprintf to stdout with printf (#3017)
|
2 ani în urmă |
Erik Scholz
|
c9c3220c48
convert: fix convert.py not working with int filename_stem (#3028)
|
2 ani în urmă |
Kawrakow
|
d59bd97065
Guard against all weights in a super-block being zero (#3010)
|
2 ani în urmă |
Georgi Gerganov
|
35938ee3b0
llama : update logic for number of threads when using BLAS
|
2 ani în urmă |
Georgi Gerganov
|
921772104b
speculative : add grammar support (#2991)
|
2 ani în urmă |
Georgi Gerganov
|
2ba85c8609
py : minor
|
2 ani în urmă |
Georgi Gerganov
|
e36ecdccc8
build : on Mac OS enable Metal by default (#2901)
|
2 ani în urmă |
slaren
|
bd33e5ab92
ggml-opencl : store GPU buffer in ggml_tensor::extra (#2994)
|
2 ani în urmă |
Cebtenzzre
|
3103568144
llama-bench : make cpp file non-executable (#2999)
|
2 ani în urmă |
Leng Yue
|
5b8530d88c
make : add speculative example (#3003)
|
2 ani în urmă |
Aarni Koskela
|
e4386f417f
server : add a subtle loading animation to the edit box (#2466)
|
2 ani în urmă |
Jiahao Li
|
35195689cd
2x faster (rms) norm cuda kernels (3.7% e2e improvement) (#2985)
|
2 ani în urmă |
slaren
|
cf9b08485c
ggml-alloc : use virtual memory for measurement (#2973)
|
2 ani în urmă |
Georgi Gerganov
|
47068e5170
speculative : PoC for speeding-up inference via speculative sampling (#2926)
|
2 ani în urmă |
Georgi Gerganov
|
8f429fa511
perplexity : fix ETA by warming up the model with an empty run
|
2 ani în urmă |
Kerfuffle
|
6519e9c99c
gguf(python): Fix special vocab handling when id < 0 (#2984)
|
2 ani în urmă |
Georgi Gerganov
|
b7f2aa9e51
metal : restore 363f0bf and fix reduce in F16_F32 kernels (#2986)
|
2 ani în urmă |
Alon
|
73a12a6344
cov : disable comment in PRs (#2989)
|
2 ani în urmă |
opparco
|
3730134776
llama : fix bpe tokenize from byte (#2889)
|
2 ani în urmă |
Georgi Gerganov
|
d9151e6f57
metal : revert 6af0bab until we fix it
|
2 ani în urmă |
Alon
|
afc43d5f82
cov : add Code Coverage and codecov.io integration (#2928)
|
2 ani în urmă |
Wentai Zhang
|
6460f758db
opencl : fix a bug in ggml_cl_pool_malloc() for ggml_cl_mul_mat_f32() (#2955)
|
2 ani în urmă |
Kawrakow
|
ca82cf7bac
metal : more optimizations (#2959)
|
2 ani în urmă |
kchro3
|
6a31a3bd98
swift : add support for k-quants (#2983)
|
2 ani în urmă |
Kerfuffle
|
cff7b0bf07
convert.py : BPE fixes (#2938)
|
2 ani în urmă |
Ido S
|
340af42f09
docs : add `catai` to `README.md` (#2967)
|
2 ani în urmă |
momonga
|
c42f0ec6b3
examples : fix gpt-neox (#2943)
|
2 ani în urmă |
kchro3
|
2753415afd
swift : add missing c file to Package.swift (#2978)
|
2 ani în urmă |
Cebtenzzre
|
bc054af97a
make : support overriding CFLAGS/CXXFLAGS/CPPFLAGS/LDFLAGS (#2886)
|
2 ani în urmă |
Kerfuffle
|
3358c381f6
logging: Fix creating empty file even when disabled (#2966)
|
2 ani în urmă |