cturan/llama.cpp @ b6814

Yann Follet 31d0ff1869 server / ranking : add sorting and management of top_n (#16403)		há 3 meses atrás
..
test_basic.py	d00cbea63c server : host-memory prompt caching (#16391)	há 3 meses atrás
test_chat_completion.py	68ee98ae18 server : return HTTP 400 if prompt exceeds context length (#16486)	há 3 meses atrás
test_completion.py	d00cbea63c server : host-memory prompt caching (#16391)	há 3 meses atrás
test_ctx_shift.py	d00cbea63c server : host-memory prompt caching (#16391)	há 3 meses atrás
test_embedding.py	d2fcd91cf9 server : disable context shift by default (#15416)	há 5 meses atrás
test_infill.py	d2fcd91cf9 server : disable context shift by default (#15416)	há 5 meses atrás
test_lora.py	d2fcd91cf9 server : disable context shift by default (#15416)	há 5 meses atrás
test_rerank.py	31d0ff1869 server / ranking : add sorting and management of top_n (#16403)	há 3 meses atrás
test_security.py	d2fcd91cf9 server : disable context shift by default (#15416)	há 5 meses atrás
test_slot_save.py	d2fcd91cf9 server : disable context shift by default (#15416)	há 5 meses atrás
test_speculative.py	e81b8e4b7f llama: use FA + max. GPU layers by default (#15434)	há 4 meses atrás
test_template.py	3c3635d2f2 server : speed up tests (#15836)	há 4 meses atrás
test_tokenize.py	d2fcd91cf9 server : disable context shift by default (#15416)	há 5 meses atrás
test_tool_call.py	3c3635d2f2 server : speed up tests (#15836)	há 4 meses atrás
test_vision_api.py	3c3635d2f2 server : speed up tests (#15836)	há 4 meses atrás