Georgi Gerganov 225e7a1438 llama : add high-throughput mode (#14363) пре 6 месеци
..
batched-bench 225e7a1438 llama : add high-throughput mode (#14363) пре 6 месеци
cvector-generator 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
export-lora 1d36b3670b llama : move end-user examples to tools directory (#13249) пре 8 месеци
gguf-split e9b6350e61 scripts : make the shell scripts cross-platform (#14341) пре 6 месеци
imatrix 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
llama-bench fffcce535e llama-bench : add --no-warmup flag (#14224) (#14270) пре 7 месеци
main abf241045d main : honor --verbose-prompt on interactive prompts (#14350) пре 6 месеци
mtmd 28657a8229 ggml : implement GEGLU_ERF and GEGLU_QUICK ops (#14445) пре 6 месеци
perplexity 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
quantize e9b6350e61 scripts : make the shell scripts cross-platform (#14341) пре 6 месеци
rpc c508256db2 rpc : Fix build on OpenBSD (#13541) пре 7 месеци
run a457551332 cmake : do not search for curl libraries by ourselves (#14613) пре 6 месеци
server 6ffd4e9c44 server : pre-calculate EOG logit biases (#14721) пре 6 месеци
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) пре 8 месеци
tts 53f925074d sync : vendor (#13901) пре 7 месеци
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) пре 8 месеци