Georgi Gerganov
|
e92d53b29e
sampling : optimize samplers by reusing bucket sort (#15665)
|
há 4 meses atrás |
Georgi Gerganov
|
f9cd68398b
sampling : make sure samplers return at least 1 token (#13822)
|
há 7 meses atrás |
DocShotgun
|
ffc727203a
sampling : make top_n_sigma no-op at <=0 or a single candidate (#13345)
|
há 8 meses atrás |
Vinesh Janarthanan
|
27e8a23300
sampling: add Top-nσ sampler (#11223)
|
há 11 meses atrás |
Georgi Gerganov
|
4dd34ff831
cmake : add sanitizer flags for llama.cpp (#11279)
|
há 1 ano atrás |
Georgi Gerganov
|
644fd71b44
sampling : refactor + optimize penalties sampler (#10803)
|
há 1 ano atrás |
Diego Devesa
|
7cc2d2c889
ggml : move AMX to the CPU backend (#10570)
|
há 1 ano atrás |
Georgi Gerganov
|
8d8ff71536
llama : remove Tail-Free sampling (#10071)
|
há 1 ano atrás |
wwoodsTM
|
ff252ea48e
llama : add DRY sampler (#9702)
|
há 1 ano atrás |
Georgi Gerganov
|
55e47786e3
llama : default sampling changes + greedy update (#9897)
|
há 1 ano atrás |
MaggotHATE
|
fbc98b748e
sampling : add XTC sampler (#9742)
|
há 1 ano atrás |
Georgi Gerganov
|
b0f27361f3
sampling : avoid expensive softmax during greedy sampling (#9605)
|
há 1 ano atrás |
slaren
|
5fb5e24811
llama : minor sampling refactor (2) (#9386)
|
há 1 ano atrás |
slaren
|
19f4a7b296
llama : refactor samplers internal implementation (#9370)
|
há 1 ano atrás |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
há 1 ano atrás |
Georgi Gerganov
|
879275ac98
tests : fix compile warnings for unreachable code (#9185)
|
há 1 ano atrás |
slaren
|
2b1f616b20
ggml : reduce hash table reset cost (#8698)
|
há 1 ano atrás |
Johannes Gäßler
|
26d4efd11e
sampling: fix top_k <= 0 (#5388)
|
há 1 ano atrás |
Johannes Gäßler
|
b2b2bf988c
Tests for min_p, sampling queue (#5147)
|
há 2 anos atrás |
Georgi Gerganov
|
d1031cf49c
sampling : refactor init to use llama_sampling_params (#3696)
|
há 2 anos atrás |
Cebtenzzre
|
3aefaab9e5
check C++ code with -Wmissing-declarations (#3184)
|
há 2 anos atrás |
Georgi Gerganov
|
d01bccde9f
ci : integrate with ggml-org/ci (#2250)
|
há 2 anos atrás |
Alex Renda
|
b061ba9e2a
llama : fix top-p sampling to match the canonical definition (#1953)
|
há 2 anos atrás |
Borislav Stanimirov
|
9cbf50c041
build : fix and ignore MSVC warnings (#1889)
|
há 2 anos atrás |
Georgi Gerganov
|
6986c7835a
tests : add missing header
|
há 2 anos atrás |
Georgi Gerganov
|
4b7e245adf
minor : fix compile warnings
|
há 2 anos atrás |
Jed Fox
|
3924088512
Remove default arguments from sampling functions (#1343)
|
há 2 anos atrás |
Georgi Gerganov
|
0e6cbff1b7
llama : fix compile warnings
|
há 2 anos atrás |
Ivan Stepanov
|
dd7eff57d8
llama : new sampling algorithms (#1126)
|
há 2 anos atrás |