Sigbjørn Skjæret ddef99522d server : fix assistant prefilling when content is an array (#14360) hace 6 meses
..
batched-bench 745aa5319b llama : deprecate llama_kv_self_ API (#14030) hace 7 meses
cvector-generator 745aa5319b llama : deprecate llama_kv_self_ API (#14030) hace 7 meses
export-lora 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
gguf-split e9b6350e61 scripts : make the shell scripts cross-platform (#14341) hace 6 meses
imatrix 745aa5319b llama : deprecate llama_kv_self_ API (#14030) hace 7 meses
llama-bench fffcce535e llama-bench : add --no-warmup flag (#14224) (#14270) hace 7 meses
main abf241045d main : honor --verbose-prompt on interactive prompts (#14350) hace 6 meses
mtmd 28657a8229 ggml : implement GEGLU_ERF and GEGLU_QUICK ops (#14445) hace 6 meses
perplexity 745aa5319b llama : deprecate llama_kv_self_ API (#14030) hace 7 meses
quantize e9b6350e61 scripts : make the shell scripts cross-platform (#14341) hace 6 meses
rpc c508256db2 rpc : Fix build on OpenBSD (#13541) hace 7 meses
run 66aba7aca9 run : avoid double tokenization (#14327) hace 6 meses
server ddef99522d server : fix assistant prefilling when content is an array (#14360) hace 6 meses
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) hace 8 meses
tts 53f925074d sync : vendor (#13901) hace 7 meses
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) hace 8 meses