Georgi Gerganov
|
37f8c7b4c9
perplexity : remove extra new lines after chunks (#9596)
|
1 год назад |
Sigbjørn Skjæret
|
722ec1eb51
perplexity : do not escape input data by default (#9548)
|
1 год назад |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
1 год назад |
Georgi Gerganov
|
0abc6a2c25
llama : llama_perf + option to disable timings during decode (#9355)
|
1 год назад |
slaren
|
49006c67b4
llama : move random seed generation to the samplers (#9398)
|
1 год назад |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 год назад |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
1 год назад |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 год назад |
Zhenwei Jin
|
4af8420afb
common : remove duplicate function llama_should_add_bos_token (#8778)
|
1 год назад |
Liu Jia
|
0a4ce78681
common : Changed tuple to struct (TODO fix) (#8823)
|
1 год назад |
slaren
|
5f2d4e60e2
ppl : fix n_seq_max for perplexity (#8277)
|
1 год назад |
Olivier Chafik
|
1c641e6aac
`build`: rename main → llama-cli, server → llama-server, llava-cli → llama-llava-cli, etc... (#7809)
|
1 год назад |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
1 год назад |
Georgi Gerganov
|
6ff13987ad
common : normalize naming style (#7462)
|
1 год назад |
strawberrymelonpanda
|
ca57e0f35e
perplexity : ndot progress and show stats with < 100 tasks (#7348)
|
1 год назад |
Johannes Gäßler
|
a8f9b07631
perplexity: more statistics, added documentation (#6936)
|
1 год назад |
Georgi Gerganov
|
58227ffdeb
perplexity : require positive --ctx-size arg (#6695)
|
1 год назад |
Jared Van Bortel
|
1b67731e18
BERT tokenizer fixes (#6498)
|
1 год назад |
compilade
|
557410b8f0
llama : greatly reduce output buffer memory usage (#6122)
|
1 год назад |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 год назад |
Georgi Gerganov
|
05b06210c9
llama : more consistent names of count variables (#5994)
|
1 год назад |
slaren
|
d894f352bf
perplexity : support using multiple sequences to allow larger batch sizes (#5946)
|
1 год назад |
compilade
|
c2101a2e90
llama : support Mamba Selective State Space Models (#5328)
|
1 год назад |
Georgi Gerganov
|
b1de96824b
ci : fix wikitext url + compile warnings (#5569)
|
1 год назад |
Herman Semenov
|
5d3de51f97
ggml, common, examples, tests : fixed type arguments in printf (#5528)
|
1 год назад |
bmwl
|
f486f6e1e5
ggml : add numa options (#5377)
|
1 год назад |
Michael Klimenko
|
52bb63c708
refactor : switch to emplace_back to avoid extra object (#5291)
|
1 год назад |
kalomaze
|
191221178f
perplexity : fix KL divergence calculations on Windows (#5273)
|
1 год назад |
Kawrakow
|
44879ee885
Additional KL-divergence statistics (#5081)
|
2 лет назад |
Georgi Gerganov
|
89758723c7
minor : clean-up some warnings and style (#5094)
|
2 лет назад |