xaedes
|
0e76a8992c
train : finetune LORA (#2632)
|
vor 2 Jahren |
Cebtenzzre
|
2db94d98ed
gguf : basic type checking in gguf_get_* (#3346)
|
vor 2 Jahren |
Cebtenzzre
|
ecf90b1a51
gguf : make token scores and types optional (#3347)
|
vor 2 Jahren |
Georgi Gerganov
|
2619109ad5
ci : disable freeBSD builds due to lack of VMs (#3381)
|
vor 2 Jahren |
Georgi Gerganov
|
ec893798b7
llama : custom attention mask + parallel decoding + no context swaps (#3228)
|
vor 2 Jahren |
Kevin Ji
|
45855b3f1c
docs : mark code as Bash (#3375)
|
vor 2 Jahren |
Pierre Alexandre SCHEMBRI
|
4aea3b846e
readme : add Mistral AI release 0.1 (#3362)
|
vor 2 Jahren |
slaren
|
da0400344b
ggml-cuda : perform cublas fp16 matrix multiplication as fp16 (#3370)
|
vor 2 Jahren |
Zhang Peiyuan
|
e519621010
convert : remove bug in convert.py permute function (#3364)
|
vor 2 Jahren |
Richard Roberson
|
ac43576124
make-ggml.py : compatibility with more models and GGUF (#3290)
|
vor 2 Jahren |
Cebtenzzre
|
20c7e1e804
gguf : fix a few general keys (#3341)
|
vor 2 Jahren |
Rickard Hallerbäck
|
dc6897404e
metal : reusing llama.cpp logging (#3152)
|
vor 2 Jahren |
Jag Chadha
|
527e57cfd8
build : add ACCELERATE_NEW_LAPACK to fix warning on macOS Sonoma (#3342)
|
vor 2 Jahren |
BarfingLemurs
|
ffe88a36a9
readme : add some recent perplexity and bpw measurements to READMES, link for k-quants (#3340)
|
vor 2 Jahren |
DAN™
|
99115f3fa6
cmake : fix build-info.h on MSVC (#3309)
|
vor 2 Jahren |
2f38b454
|
1726f9626f
docs: Fix typo CLBlast_DIR var. (#3330)
|
vor 2 Jahren |
Erik Scholz
|
a98b1633d5
nix : add cuda, use a symlinked toolkit for cmake (#3202)
|
vor 2 Jahren |
slaren
|
c091cdfb24
llama-bench : add README (#3317)
|
vor 2 Jahren |
Cebtenzzre
|
51a7cf5c6e
examples : fix RoPE defaults to match PR #3240 (#3315)
|
vor 2 Jahren |
Kevin Ji
|
bedb92b603
scripts : use `/usr/bin/env` in shebang (#3313)
|
vor 2 Jahren |
Lee Drake
|
bc9d3e3971
Update README.md (#3289)
|
vor 2 Jahren |
shibe2
|
36b904e200
ggml-opencl.cpp: Make private functions static (#3300)
|
vor 2 Jahren |
Edward Taylor
|
324f3403d5
zig : fix for updated c lib (#3259)
|
vor 2 Jahren |
yuiseki
|
f56c418ab0
embedding : update README.md (#3224)
|
vor 2 Jahren |
Johannes Gäßler
|
8185710a80
CUDA: use only 1 thread if fully offloaded (#2915)
|
vor 2 Jahren |
Georgi Gerganov
|
7eb41179ed
readme : update hot topics
|
vor 2 Jahren |
Cebtenzzre
|
a5661d7e71
llama : allow gguf RoPE keys to be overridden with defaults (#3240)
|
vor 2 Jahren |
Cebtenzzre
|
65c2c1c5ab
benchmark-matmult : do not use integer abs() on a float (#3277)
|
vor 2 Jahren |
kang
|
80834daecf
flake : Restore default package's buildInputs (#3262)
|
vor 2 Jahren |
Alon
|
a40f2b656f
CI: FreeBSD fix (#3258)
|
vor 2 Jahren |