Xuan Son Nguyen
|
84a44815f7
cli : auto activate conversation mode if chat template is available (#11214)
|
1 vuosi sitten |
Xuan Son Nguyen
|
00b4c3da62
common : support tag-based --hf-repo like on ollama (#11195)
|
1 vuosi sitten |
Georgi Gerganov
|
afa8a9ec9b
llama : add `llama_vocab`, functions -> methods, naming (#11110)
|
1 vuosi sitten |
Georgi Gerganov
|
f66f582927
llama : refactor `src/llama.cpp` (#10902)
|
1 vuosi sitten |
Xuan Son Nguyen
|
45095a61bf
server : clean up built-in template detection (#11026)
|
1 vuosi sitten |
Georgi Gerganov
|
0bf2d10c55
tts : add OuteTTS support (#10784)
|
1 vuosi sitten |
Georgi Gerganov
|
152610eda9
server : output embeddings for all tokens when pooling = none (#10861)
|
1 vuosi sitten |
Georgi Gerganov
|
644fd71b44
sampling : refactor + optimize penalties sampler (#10803)
|
1 vuosi sitten |
Eric Curtin
|
c27ac678dd
Opt class for positional argument handling (#10508)
|
1 vuosi sitten |
Xuan Son Nguyen
|
adffa6ffd5
common : improve -ctv -ctk CLI arguments (#10806)
|
1 vuosi sitten |
Xuan Son Nguyen
|
6c5bc0625f
server : (refactoring) do not rely on JSON internally (#10643)
|
1 vuosi sitten |
haopeng
|
64ed2091b2
server: Add "tokens per second" information in the backend (#10548)
|
1 vuosi sitten |
Xuan Son Nguyen
|
9f912511bc
common : fix duplicated file name with hf_repo and hf_file (#10550)
|
1 vuosi sitten |
Diego Devesa
|
10bce0450f
llama : accept a list of devices to use to offload a model (#10497)
|
1 vuosi sitten |
Georgi Gerganov
|
d9d54e498d
speculative : refactor and add a simpler example (#10362)
|
1 vuosi sitten |
Johannes Gäßler
|
4e54be0ec6
llama/ex: remove --logdir argument (#10339)
|
1 vuosi sitten |
Georgi Gerganov
|
b141e5f6ef
server : enable KV cache defrag by default (#10233)
|
1 vuosi sitten |
Georgi Gerganov
|
1926d6e39d
llama : adjust default context size + print warnings (#10136)
|
1 vuosi sitten |
Georgi Gerganov
|
8d8ff71536
llama : remove Tail-Free sampling (#10071)
|
1 vuosi sitten |
wwoodsTM
|
ff252ea48e
llama : add DRY sampler (#9702)
|
1 vuosi sitten |
Michael Podvitskiy
|
d80fb71f8b
llama: string_split fix (#10022)
|
1 vuosi sitten |
Daniel Bevenius
|
674804a996
arg : fix typo in embeddings argument help [no ci] (#9994)
|
1 vuosi sitten |
Georgi Gerganov
|
755a9b2bf0
llama : add infill sampler (#9896)
|
1 vuosi sitten |
MaggotHATE
|
fbc98b748e
sampling : add XTC sampler (#9742)
|
1 vuosi sitten |
Georgi Gerganov
|
c7181bd294
server : reuse cached context chunks (#9866)
|
1 vuosi sitten |
Georgi Gerganov
|
95c76e8e92
server : remove legacy system_prompt feature (#9857)
|
1 vuosi sitten |
Georgi Gerganov
|
11ac9800af
llama : improve infill support and special token detection (#9798)
|
1 vuosi sitten |
Diego Devesa
|
7eee341bee
common : use common_ prefix for common library functions (#9805)
|
1 vuosi sitten |
Xuan Son Nguyen
|
458367a906
server : better security control for public deployments (#9776)
|
1 vuosi sitten |
Georgi Gerganov
|
f4d2b8846a
llama : add reranking support (#9510)
|
1 vuosi sitten |