Georgi Gerganov
|
196f5083ef
common : more accurate sampling timing (#17382)
|
před 1 měsícem |
Gabe Goodhart
|
0c74f32632
memory: Hybrid context shift (#17009)
|
před 2 měsíci |
Vinkal
|
2f61c0f5bf
llama-cli: prevent spurious assistant token (#16202)
|
před 3 měsíci |
Georgi Gerganov
|
4d0a7cbc61
ci : adjust params for less runtime (#16167)
|
před 3 měsíci |
Joshua Cogliati
|
d35a1e8c41
cli : change log to warning to explain reason for stopping (#15604)
|
před 4 měsíci |
Diego Devesa
|
f75b830647
chat : include kwargs in template example (#15309)
|
před 5 měsíci |
Molly Sophia
|
c82d48ec23
llama : fix `--reverse-prompt` crashing issue (#14794)
|
před 6 měsíci |
Sigbjørn Skjæret
|
abf241045d
main : honor --verbose-prompt on interactive prompts (#14350)
|
před 6 měsíci |
Molly Sophia
|
72c6bc3f3d
llama : better rwkv chat template and add missing `inputs.use_jinja` setting (#14336)
|
před 6 měsíci |
Georgi Gerganov
|
745aa5319b
llama : deprecate llama_kv_self_ API (#14030)
|
před 7 měsíci |
Diego Devesa
|
27ebfcacba
llama : do not crash if there is no CPU backend (#13395)
|
před 8 měsíci |
Georgi Gerganov
|
51fb96b1ff
context : remove logits_all flag (#13284)
|
před 8 měsíci |
Diego Devesa
|
1d36b3670b
llama : move end-user examples to tools directory (#13249)
|
před 8 měsíci |