Georgi Gerganov e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665) před 4 měsíci
..
CMakeLists.txt a457551332 cmake : do not search for curl libraries by ourselves (#14613) před 6 měsíci
arg.cpp 0d161f021a server : enable /slots by default and make it secure (#15630) před 4 měsíci
arg.h 2d451c8059 common : add common_remote_get_content (#13123) před 8 měsíci
base64.hpp 381efbf480 llava : expose as a shared library for downstream projects (#3613) před 2 roky
build-info.cpp.in cc8d081879 cmake: Add ability to pass in LLAMA_BUILD_NUMBER/COMMIT (#14167) před 7 měsíci
chat-parser.cpp 3db4da56a5 chat : support Granite model reasoning and tool call (#14864) před 5 měsíci
chat-parser.h 3cb203c89f llama-chat : Do not throw when tool parsing fails (#14012) před 7 měsíci
chat.cpp 60e5eee31f chat : Seed OSS thinking + tool call support (#15552) před 4 měsíci
chat.h 60e5eee31f chat : Seed OSS thinking + tool call support (#15552) před 4 měsíci
common.cpp e81b8e4b7f llama: use FA + max. GPU layers by default (#15434) před 4 měsíci
common.h 0d161f021a server : enable /slots by default and make it secure (#15630) před 4 měsíci
console.cpp 8277a817f1 console : utf-8 fix for windows stdin (#9690) před 1 rokem
console.h 6381d4e110 gguf : new file format with flexible meta data (beta) (#2398) před 2 roky
json-partial.cpp 53f925074d sync : vendor (#13901) před 7 měsíci
json-partial.h 53f925074d sync : vendor (#13901) před 7 měsíci
json-schema-to-grammar.cpp 40bfa04c95 common : use std::string_view now that we target c++17 (#14319) před 6 měsíci
json-schema-to-grammar.h 53f925074d sync : vendor (#13901) před 7 měsíci
llguidance.cpp 43dfd741a5 llguidance : set tokenizer slices to default (#13424) před 8 měsíci
log.cpp bfd11a2344 Fix: Compile failure due to Microsoft STL breaking change (#11836) před 11 měsíci
log.h fef0cbeadf cleanup: fix compile warnings associated with gnu_printf (#11811) před 11 měsíci
ngram-cache.cpp 5bbe6a9fe9 ggml : portability fixes for VS 2017 (#12150) před 10 měsíci
ngram-cache.h 727368c60f llama : use LLAMA_TOKEN_NULL (#11062) před 1 rokem
regex-partial.cpp 3198405e98 `common`: add partial regex support (#12808) před 8 měsíci
regex-partial.h 3198405e98 `common`: add partial regex support (#12808) před 8 měsíci
sampling.cpp e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665) před 4 měsíci
sampling.h e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665) před 4 měsíci
speculative.cpp e92d53b29e sampling : optimize samplers by reusing bucket sort (#15665) před 4 měsíci
speculative.h 94933c8c2e server : implement universal assisted decoding (#12635) před 5 měsíci