Ed Addario fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037) пре 6 месеци
..
batched-bench 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
cvector-generator 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
export-lora 1d36b3670b llama : move end-user examples to tools directory (#13249) пре 8 месеци
gguf-split 1d36b3670b llama : move end-user examples to tools directory (#13249) пре 8 месеци
imatrix 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
llama-bench fffcce535e llama-bench : add --no-warmup flag (#14224) (#14270) пре 7 месеци
main 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
mtmd 5d5c066de8 mtmd : fix Pixtral OOM with large images by capping image_size to 1024 (#14326) пре 6 месеци
perplexity 745aa5319b llama : deprecate llama_kv_self_ API (#14030) пре 7 месеци
quantize fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037) пре 6 месеци
rpc c508256db2 rpc : Fix build on OpenBSD (#13541) пре 7 месеци
run 66aba7aca9 run : avoid double tokenization (#14327) пре 6 месеци
server 88fc854b4b llama : improve sep token handling (#14272) пре 7 месеци
tokenize 1d36b3670b llama : move end-user examples to tools directory (#13249) пре 8 месеци
tts 53f925074d sync : vendor (#13901) пре 7 месеци
CMakeLists.txt 9b61acf060 mtmd : rename llava directory to mtmd (#13311) пре 8 месеци