Georgi Gerganov
|
7eb41179ed
readme : update hot topics
|
hace 2 años |
Cebtenzzre
|
a5661d7e71
llama : allow gguf RoPE keys to be overridden with defaults (#3240)
|
hace 2 años |
Cebtenzzre
|
65c2c1c5ab
benchmark-matmult : do not use integer abs() on a float (#3277)
|
hace 2 años |
kang
|
80834daecf
flake : Restore default package's buildInputs (#3262)
|
hace 2 años |
Alon
|
a40f2b656f
CI: FreeBSD fix (#3258)
|
hace 2 años |
Georgi Gerganov
|
d119c04c15
examples : fix benchmark-matmult (#1554)
|
hace 2 años |
Cebtenzzre
|
8781013ef6
make : restore build-info.h dependency for several targets (#3205)
|
hace 2 años |
Erik Scholz
|
7ddf185537
ci : switch cudatoolkit install on windows to networked (#3236)
|
hace 2 años |
Johannes Gäßler
|
ee66942d7e
CUDA: fix peer access logic (#3231)
|
hace 2 años |
Johannes Gäßler
|
111163e246
CUDA: enable peer access between devices (#2470)
|
hace 2 años |
slaren
|
8b428c9bc8
llama.cpp : show model size and BPW on load (#3223)
|
hace 2 años |
Johannes Gäßler
|
578d8c8f5c
CUDA: fix scratch malloced on non-main device (#3220)
|
hace 2 años |
IsaacDynamo
|
b541b4f0b1
Enable BUILD_SHARED_LIBS=ON on all Windows builds (#3215)
|
hace 2 años |
Vlad
|
5dbc2b3213
Enable build with CUDA 11.0 (make) (#3132)
|
hace 2 años |
goerch
|
b08e75baea
Fixing the last deviations from sentencepiece indicated by test-tokenizer-1 (#3170)
|
hace 2 años |
Cebtenzzre
|
e6616cf0db
examples : add compiler version and target to build info (#2998)
|
hace 2 años |
Cebtenzzre
|
3aefaab9e5
check C++ code with -Wmissing-declarations (#3184)
|
hace 2 años |
Cebtenzzre
|
69eb67e282
fix build numbers by setting fetch-depth=0 (#3197)
|
hace 2 años |
Meng Zhang
|
4fe09dfe66
llama : add support for StarCoder model architectures (#3187)
|
hace 2 años |
Cebtenzzre
|
80291a1d02
common : do not use GNU zero-length __VA_ARGS__ extension (#3195)
|
hace 2 años |
Georgi Gerganov
|
c6f1491da0
metal : fix bug in soft_max kernels (out-of-bounds access) (#3194)
|
hace 2 años |
Cebtenzzre
|
e3d87a6c36
convert : make ftype optional in simple scripts (#3185)
|
hace 2 años |
Georgi Gerganov
|
8c00b7a6ff
sync : ggml (Metal F32 support + reduce ggml-alloc size) (#3192)
|
hace 2 años |
Engininja2
|
7e50d34be6
cmake : fix building shared libs for clang (rocm) on windows (#3176)
|
hace 2 años |
Evgeny Kurnevsky
|
235f7c193b
flake : use pkg-config instead of pkgconfig (#3188)
|
hace 2 años |
Georgi Gerganov
|
a51b687657
metal : relax conditions on fast matrix multiplication kernel (#3168)
|
hace 2 años |
Andrei
|
76164fe2e6
cmake : fix llama.h location when built outside of root directory (#3179)
|
hace 2 años |
Ali Tariq
|
c2ab6fe661
ci : Cloud-V for RISC-V builds (#3160)
|
hace 2 años |
Roland
|
2d770505a8
llama : remove mtest (#3177)
|
hace 2 años |
Cebtenzzre
|
98311c4277
llama : make quantize example up to 2.7x faster (#3115)
|
hace 2 años |