Djip007 2cd43f4900 ggml : more perfo with llamafile tinyblas on x86_64 (#10714) hace 1 año
..
test_basic.py a86ad841f1 server : add flag to disable the web-ui (#10762) (#10751) hace 1 año
test_chat_completion.py 485dc01214 server : add system_fingerprint to chat/completion (#10917) hace 1 año
test_completion.py 2cd43f4900 ggml : more perfo with llamafile tinyblas on x86_64 (#10714) hace 1 año
test_ctx_shift.py 45abe0f74e server : replace behave with pytest (#10416) hace 1 año
test_embedding.py 57bb2c40cd server : fix logprobs, make it OAI-compatible (#10783) hace 1 año
test_infill.py ce8784bdb1 server : fix format_infill (#10724) hace 1 año
test_lora.py 45abe0f74e server : replace behave with pytest (#10416) hace 1 año
test_rerank.py 05c3a444b8 server : fill usage info in embeddings and rerank responses (#10852) hace 1 año
test_security.py 45abe0f74e server : replace behave with pytest (#10416) hace 1 año
test_slot_save.py 45abe0f74e server : replace behave with pytest (#10416) hace 1 año
test_speculative.py 1da7b76569 server : fix speculative decoding with context shift (#10641) hace 1 año
test_tokenize.py 45abe0f74e server : replace behave with pytest (#10416) hace 1 año