Georgi Gerganov
|
a3c1232c3f
arg : option to exclude arguments from specific examples (#11136)
|
1 год назад |
Xuan Son Nguyen
|
0da5d86026
server : allow using LoRA adapters per-request (#10994)
|
1 год назад |
Xuan Son Nguyen
|
5896c65232
server : add OAI compat for /v1/completions (#10974)
|
1 год назад |
Isaac McFadyen
|
f865ea149d
server: added more docs for response_fields field (#10995)
|
1 год назад |
NeverLucky
|
09fe2e7613
server: allow filtering llama server response fields (#10940)
|
1 год назад |
Xuan Son Nguyen
|
485dc01214
server : add system_fingerprint to chat/completion (#10917)
|
1 год назад |
Xuan Son Nguyen
|
57bb2c40cd
server : fix logprobs, make it OAI-compatible (#10783)
|
1 год назад |
Georgi Gerganov
|
152610eda9
server : output embeddings for all tokens when pooling = none (#10861)
|
1 год назад |
Georgi Gerganov
|
0e70ba686e
server : add "tokens" output (#10853)
|
1 год назад |
Georgi Gerganov
|
644fd71b44
sampling : refactor + optimize penalties sampler (#10803)
|
1 год назад |
Xuan Son Nguyen
|
adffa6ffd5
common : improve -ctv -ctk CLI arguments (#10806)
|
1 год назад |
CentricStorm
|
5555c0c1f6
docs: update server streaming mode documentation (#9519)
|
1 год назад |
CentricStorm
|
4b4d92b098
docs: fix server documentation formatting (#10776)
|
1 год назад |
Yüg
|
a86ad841f1
server : add flag to disable the web-ui (#10762) (#10751)
|
1 год назад |
Xuan Son Nguyen
|
3573fa8e7b
server : (refactor) no more json in server_task input (#10691)
|
1 год назад |
Georgi Gerganov
|
ce4a7b8493
server : various fixes (#10704)
|
1 год назад |
Xuan Son Nguyen
|
6c5bc0625f
server : (refactoring) do not rely on JSON internally (#10643)
|
1 год назад |
Xuan Son Nguyen
|
91c36c269b
server : (web ui) Various improvements, now use vite as bundler (#10599)
|
1 год назад |
Nikolaos Pothitos
|
82bca2257b
readme : add option, update default value, fix formatting (#10271)
|
1 год назад |
Xuan Son Nguyen
|
642330ac7c
llama : add enum for built-in chat templates (#10623)
|
1 год назад |
Georgi Gerganov
|
8648c52101
make : deprecate (#10514)
|
1 год назад |
haopeng
|
64ed2091b2
server: Add "tokens per second" information in the backend (#10548)
|
1 год назад |
Georgi Gerganov
|
47f931c8f9
server : enable cache_prompt by default (#10501)
|
1 год назад |
Johannes Gäßler
|
4e54be0ec6
llama/ex: remove --logdir argument (#10339)
|
1 год назад |
Alexey Parfenov
|
ff7fb670d0
server : add missing docs (#10269)
|
1 год назад |
Georgi Gerganov
|
b141e5f6ef
server : enable KV cache defrag by default (#10233)
|
1 год назад |
Xuan Son Nguyen
|
a71d81cf8c
server : revamp chat UI with vuejs and daisyui (#10175)
|
1 год назад |
Xuan Son Nguyen
|
9e0ecfb697
server : clarify /slots endpoint, add is_processing (#10162)
|
1 год назад |
Georgi Gerganov
|
8d8ff71536
llama : remove Tail-Free sampling (#10071)
|
1 год назад |
wwoodsTM
|
ff252ea48e
llama : add DRY sampler (#9702)
|
1 год назад |