Georgi Gerganov 2bc96931d2 server : make cache_reuse configurable per request (#17858) 1 месяц назад
..
batched-bench f914544b16 batched-bench : add "separate text gen" mode (#17103) 2 месяцев назад
cvector-generator 07808ebb07 cmake : Do not install tools on iOS targets (#15903) 4 месяцев назад
export-lora 07808ebb07 cmake : Do not install tools on iOS targets (#15903) 4 месяцев назад
gguf-split 1d660d2fae ci : use smaller model (#16168) 3 месяцев назад
imatrix fe6a9882ac Manually link -lbsd to resolve flock symbol on AIX (#16610) 2 месяцев назад
llama-bench 017761daf5 ggml-zendnn : add ZenDNN backend for AMD CPUs (#17690) 1 месяц назад
main 3c136b21a3 cli: add migration warning (#17620) 1 месяц назад
mtmd a96283adc4 mtmd: fix --no-warmup (#17695) 1 месяц назад
perplexity 3ffd0fae47 perplexity : show more kl-divergence data (#16321) 3 месяцев назад
quantize 1d660d2fae ci : use smaller model (#16168) 3 месяцев назад
rpc d2d626938a Install rpc-server when GGML_RPC is ON. (#17149) 2 месяцев назад
run fe6a9882ac Manually link -lbsd to resolve flock symbol on AIX (#16610) 2 месяцев назад
server 2bc96931d2 server : make cache_reuse configurable per request (#17858) 1 месяц назад
tokenize 07808ebb07 cmake : Do not install tools on iOS targets (#15903) 4 месяцев назад
tts 34fcc5a4ac model : Apertus model implementation (#15852) 3 месяцев назад
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) 8 месяцев назад