Diego Devesa be5caccef9 llama : only use default buffer types for the KV cache (#10358) hai 1 ano
..
CMakeLists.txt ae8de6d50a ggml : build backends as libraries (#10256) hai 1 ano
llama-grammar.cpp df270ef745 llama : refactor sampling v2 (#9294) hai 1 ano
llama-grammar.h df270ef745 llama : refactor sampling v2 (#9294) hai 1 ano
llama-impl.h cea1486ecf log : add CONT level for continuing previous log entry (#9610) hai 1 ano
llama-sampling.cpp 5107e8cea3 DRY: Fixes clone functionality (#10192) hai 1 ano
llama-sampling.h ff252ea48e llama : add DRY sampler (#9702) hai 1 ano
llama-vocab.cpp ff252ea48e llama : add DRY sampler (#9702) hai 1 ano
llama-vocab.h ff252ea48e llama : add DRY sampler (#9702) hai 1 ano
llama.cpp be5caccef9 llama : only use default buffer types for the KV cache (#10358) hai 1 ano
unicode-data.cpp 458367a906 server : better security control for public deployments (#9776) hai 1 ano
unicode-data.h a39ab216aa llama : reduce compile time and binary size (#9712) hai 1 ano
unicode.cpp a39ab216aa llama : reduce compile time and binary size (#9712) hai 1 ano
unicode.h 938943cdbf llama : move vocab, grammar and sampling into separate files (#8508) hai 1 ano