Georgi Gerganov
|
0bf2d10c55
tts : add OuteTTS support (#10784)
|
1 年間 前 |
Georgi Gerganov
|
152610eda9
server : output embeddings for all tokens when pooling = none (#10861)
|
1 年間 前 |
Georgi Gerganov
|
644fd71b44
sampling : refactor + optimize penalties sampler (#10803)
|
1 年間 前 |
Eric Curtin
|
c27ac678dd
Opt class for positional argument handling (#10508)
|
1 年間 前 |
Xuan Son Nguyen
|
adffa6ffd5
common : improve -ctv -ctk CLI arguments (#10806)
|
1 年間 前 |
Xuan Son Nguyen
|
6c5bc0625f
server : (refactoring) do not rely on JSON internally (#10643)
|
1 年間 前 |
haopeng
|
64ed2091b2
server: Add "tokens per second" information in the backend (#10548)
|
1 年間 前 |
Xuan Son Nguyen
|
9f912511bc
common : fix duplicated file name with hf_repo and hf_file (#10550)
|
1 年間 前 |
Diego Devesa
|
10bce0450f
llama : accept a list of devices to use to offload a model (#10497)
|
1 年間 前 |
Georgi Gerganov
|
d9d54e498d
speculative : refactor and add a simpler example (#10362)
|
1 年間 前 |
Johannes Gäßler
|
4e54be0ec6
llama/ex: remove --logdir argument (#10339)
|
1 年間 前 |
Georgi Gerganov
|
b141e5f6ef
server : enable KV cache defrag by default (#10233)
|
1 年間 前 |
Georgi Gerganov
|
1926d6e39d
llama : adjust default context size + print warnings (#10136)
|
1 年間 前 |
Georgi Gerganov
|
8d8ff71536
llama : remove Tail-Free sampling (#10071)
|
1 年間 前 |
wwoodsTM
|
ff252ea48e
llama : add DRY sampler (#9702)
|
1 年間 前 |
Michael Podvitskiy
|
d80fb71f8b
llama: string_split fix (#10022)
|
1 年間 前 |
Daniel Bevenius
|
674804a996
arg : fix typo in embeddings argument help [no ci] (#9994)
|
1 年間 前 |
Georgi Gerganov
|
755a9b2bf0
llama : add infill sampler (#9896)
|
1 年間 前 |
MaggotHATE
|
fbc98b748e
sampling : add XTC sampler (#9742)
|
1 年間 前 |
Georgi Gerganov
|
c7181bd294
server : reuse cached context chunks (#9866)
|
1 年間 前 |
Georgi Gerganov
|
95c76e8e92
server : remove legacy system_prompt feature (#9857)
|
1 年間 前 |
Georgi Gerganov
|
11ac9800af
llama : improve infill support and special token detection (#9798)
|
1 年間 前 |
Diego Devesa
|
7eee341bee
common : use common_ prefix for common library functions (#9805)
|
1 年間 前 |
Xuan Son Nguyen
|
458367a906
server : better security control for public deployments (#9776)
|
1 年間 前 |
Georgi Gerganov
|
f4d2b8846a
llama : add reranking support (#9510)
|
1 年間 前 |
Vinesh Janarthanan
|
441b72b91f
main : option to disable context shift (#9484)
|
1 年間 前 |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
1 年間 前 |
Georgi Gerganov
|
0abc6a2c25
llama : llama_perf + option to disable timings during decode (#9355)
|
1 年間 前 |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 年間 前 |
Xuan Son Nguyen
|
3f7ccfd649
common : bring back missing args, add env var duplication check (#9375)
|
1 年間 前 |