Georgi Gerganov 254098a279 common : refactor common_sampler + grammar logic changes (#17937) před 1 měsícem
..
test_basic.py e7c2cf1356 server: add router multi-model tests (#17704) (#17722) před 1 měsícem
test_chat_completion.py c42712b056 server: support multiple generations from one prompt (OAI "n" option) (#17775) před 1 měsícem
test_compat_anthropic.py 254098a279 common : refactor common_sampler + grammar logic changes (#17937) před 1 měsícem
test_completion.py cb1adf8851 server : handle failures to restore host cache (#17078) před 2 měsíci
test_ctx_shift.py 85a7d8677b memory : remove KV cache size padding (#16812) před 2 měsíci
test_embedding.py d2fcd91cf9 server : disable context shift by default (#15416) před 5 měsíci
test_infill.py cd5e3b5754 server : support unified cache across slots (#16736) před 2 měsíci
test_lora.py d2fcd91cf9 server : disable context shift by default (#15416) před 5 měsíci
test_rerank.py 31d0ff1869 server / ranking : add sorting and management of top_n (#16403) před 3 měsíci
test_router.py e7c2cf1356 server: add router multi-model tests (#17704) (#17722) před 1 měsícem
test_security.py 13628d8bdb server: add --media-path for local media files (#17697) před 1 měsícem
test_slot_save.py d2fcd91cf9 server : disable context shift by default (#15416) před 5 měsíci
test_speculative.py 16bcc1259d kv-cache : pad the cache size to 256 for performance (#17046) před 2 měsíci
test_template.py 3c3635d2f2 server : speed up tests (#15836) před 4 měsíci
test_tokenize.py d2fcd91cf9 server : disable context shift by default (#15416) před 5 měsíci
test_tool_call.py 3c3635d2f2 server : speed up tests (#15836) před 4 měsíci
test_vision_api.py 3c3635d2f2 server : speed up tests (#15836) před 4 měsíci