| .. |
|
test_basic.py
|
e7c2cf1356
server: add router multi-model tests (#17704) (#17722)
|
1 månad sedan |
|
test_chat_completion.py
|
c42712b056
server: support multiple generations from one prompt (OAI "n" option) (#17775)
|
1 månad sedan |
|
test_compat_anthropic.py
|
254098a279
common : refactor common_sampler + grammar logic changes (#17937)
|
1 månad sedan |
|
test_completion.py
|
cb1adf8851
server : handle failures to restore host cache (#17078)
|
2 månader sedan |
|
test_ctx_shift.py
|
85a7d8677b
memory : remove KV cache size padding (#16812)
|
2 månader sedan |
|
test_embedding.py
|
d2fcd91cf9
server : disable context shift by default (#15416)
|
5 månader sedan |
|
test_infill.py
|
cd5e3b5754
server : support unified cache across slots (#16736)
|
2 månader sedan |
|
test_lora.py
|
d2fcd91cf9
server : disable context shift by default (#15416)
|
5 månader sedan |
|
test_rerank.py
|
31d0ff1869
server / ranking : add sorting and management of top_n (#16403)
|
3 månader sedan |
|
test_router.py
|
e7c2cf1356
server: add router multi-model tests (#17704) (#17722)
|
1 månad sedan |
|
test_security.py
|
13628d8bdb
server: add --media-path for local media files (#17697)
|
1 månad sedan |
|
test_slot_save.py
|
d2fcd91cf9
server : disable context shift by default (#15416)
|
5 månader sedan |
|
test_speculative.py
|
16bcc1259d
kv-cache : pad the cache size to 256 for performance (#17046)
|
2 månader sedan |
|
test_template.py
|
3c3635d2f2
server : speed up tests (#15836)
|
4 månader sedan |
|
test_tokenize.py
|
d2fcd91cf9
server : disable context shift by default (#15416)
|
5 månader sedan |
|
test_tool_call.py
|
3c3635d2f2
server : speed up tests (#15836)
|
4 månader sedan |
|
test_vision_api.py
|
3c3635d2f2
server : speed up tests (#15836)
|
4 månader sedan |