Xuan Son Nguyen 0da5d86026 server : allow using LoRA adapters per-request (#10994) před 1 rokem
..
test_basic.py a86ad841f1 server : add flag to disable the web-ui (#10762) (#10751) před 1 rokem
test_chat_completion.py 45095a61bf server : clean up built-in template detection (#11026) před 1 rokem
test_completion.py 5896c65232 server : add OAI compat for /v1/completions (#10974) před 1 rokem
test_ctx_shift.py 45abe0f74e server : replace behave with pytest (#10416) před 1 rokem
test_embedding.py 9ba399dfa7 server : add support for "encoding_format": "base64" to the */embeddings endpoints (#10967) před 1 rokem
test_infill.py ce8784bdb1 server : fix format_infill (#10724) před 1 rokem
test_lora.py 0da5d86026 server : allow using LoRA adapters per-request (#10994) před 1 rokem
test_rerank.py 05c3a444b8 server : fill usage info in embeddings and rerank responses (#10852) před 1 rokem
test_security.py 45abe0f74e server : replace behave with pytest (#10416) před 1 rokem
test_slot_save.py 45abe0f74e server : replace behave with pytest (#10416) před 1 rokem
test_speculative.py 0da5d86026 server : allow using LoRA adapters per-request (#10994) před 1 rokem
test_tokenize.py 45abe0f74e server : replace behave with pytest (#10416) před 1 rokem