Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 tahun lalu |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
1 tahun lalu |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 tahun lalu |
Guoliang Hua
|
b60074f1c2
llama-cli : remove duplicated log message (#9275)
|
1 tahun lalu |
Faisal Zaghloul
|
42c76d1358
Threadpool: take 2 (#8672)
|
1 tahun lalu |
Zhenwei Jin
|
4af8420afb
common : remove duplicate function llama_should_add_bos_token (#8778)
|
1 tahun lalu |
Liu Jia
|
0a4ce78681
common : Changed tuple to struct (TODO fix) (#8823)
|
1 tahun lalu |
Xuan Son Nguyen
|
96952e7181
llama : fix `llama_chat_format_single` for mistral (#8657)
|
1 tahun lalu |
Georgi Gerganov
|
6af51c0d96
main : print error on empty input (#8456)
|
1 tahun lalu |
Xuan Son Nguyen
|
a38b884c6c
cli: add EOT when user hit Ctrl+C (#8296)
|
1 tahun lalu |
fairydreaming
|
807b0c49ff
Inference support for T5 and FLAN-T5 model families (#5763)
|
1 tahun lalu |
Xuan Son Nguyen
|
9ef0780062
Fix new line issue with chat template, disable template when in-prefix/suffix is set (#8203)
|
1 tahun lalu |
Xuan Son Nguyen
|
72272b83a3
fix code typo in llama-cli (#8198)
|
1 tahun lalu |
Xuan Son Nguyen
|
48e6b92cc3
Add chat template support for llama-cli (#8068)
|
1 tahun lalu |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
1 tahun lalu |
Brian
|
d298382ad9
main: replace --no-special with --special (#7534)
|
1 tahun lalu |
Justine Tunney
|
00c6390793
main : don't print special tokens with --grammar (#6923)
|
1 tahun lalu |
Georgi Gerganov
|
fbf777d2b9
main : minor (#7462)
|
1 tahun lalu |
Georgi Gerganov
|
6ff13987ad
common : normalize naming style (#7462)
|
1 tahun lalu |
Olivier Chafik
|
e402de364b
`grammars`: fix resampling logic regression (#7424)
|
1 tahun lalu |
Justine Tunney
|
4e3880978f
Fix memory bug in grammar parser (#7194)
|
1 tahun lalu |
HanishKVC
|
f89fe2732c
Main+: optionally allow special tokens from user in interactive mode (#7097)
|
1 tahun lalu |
Dawid Potocki
|
83330d8cd6
main : add --conversation / -cnv flag (#7108)
|
1 tahun lalu |
RhinoDevel
|
3af34c1d1b
main : update log text (EOS to EOG) (#7104)
|
1 tahun lalu |
l3utterfly
|
8d608a81b7
main : fix off by one error for context shift (#6921)
|
1 tahun lalu |
Daniel Bevenius
|
5539e6fdd1
main : fix typo in comment in main.cpp (#6985)
|
1 tahun lalu |
Johannes Gäßler
|
28103f4832
Server: fix seed for multiple slots (#6835)
|
1 tahun lalu |
Pedro Cuenca
|
b97bc3966e
llama : support Llama 3 HF conversion (#6745)
|
1 tahun lalu |
Jared Van Bortel
|
1b67731e18
BERT tokenizer fixes (#6498)
|
1 tahun lalu |
Jan Boon
|
beea6e1b16
llama : save and restore kv cache for single seq id (#6341)
|
1 tahun lalu |