Ed Addario fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037) 6 месяцев назад
..
batched-bench 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
cvector-generator 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
export-lora 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
gguf-split 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
imatrix 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
llama-bench fffcce535e llama-bench : add --no-warmup flag (#14224) (#14270) 7 месяцев назад
main 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
mtmd 5d5c066de8 mtmd : fix Pixtral OOM with large images by capping image_size to 1024 (#14326) 6 месяцев назад
perplexity 745aa5319b llama : deprecate llama_kv_self_ API (#14030) 7 месяцев назад
quantize fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037) 6 месяцев назад
rpc c508256db2 rpc : Fix build on OpenBSD (#13541) 7 месяцев назад
run 66aba7aca9 run : avoid double tokenization (#14327) 6 месяцев назад
server 88fc854b4b llama : improve sep token handling (#14272) 7 месяцев назад
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) 8 месяцев назад
tts 53f925074d sync : vendor (#13901) 7 месяцев назад
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) 8 месяцев назад