Xuan Son Nguyen
|
0da5d86026
server : allow using LoRA adapters per-request (#10994)
|
1 年間 前 |
Georgi Gerganov
|
1da7b76569
server : fix speculative decoding with context shift (#10641)
|
1 年間 前 |
Xuan Son Nguyen
|
b782e5c7d4
server : add more test cases (#10569)
|
1 年間 前 |