Olivier Chafik e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
..
cmake f3f65429c4 llama : reorganize source code + improve CMake (#8006) hace 1 año
minja bc098c3cf0 minja: sync (qwen3) (#13573) hace 8 meses
CMakeLists.txt f5cd27b71d `server`: streaming of tool calls and thoughts when `--jinja` is on (#12379) hace 7 meses
arg.cpp e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
arg.h 2d451c8059 common : add common_remote_get_content (#13123) hace 8 meses
base64.hpp 381efbf480 llava : expose as a shared library for downstream projects (#3613) hace 2 años
build-info.cpp.in b12fa0d1c1 build : link against build info instead of compiling against it (#3879) hace 2 años
chat-parser.cpp f5cd27b71d `server`: streaming of tool calls and thoughts when `--jinja` is on (#12379) hace 7 meses
chat-parser.h f5cd27b71d `server`: streaming of tool calls and thoughts when `--jinja` is on (#12379) hace 7 meses
chat.cpp e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
chat.h e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
common.cpp c508256db2 rpc : Fix build on OpenBSD (#13541) hace 7 meses
common.h e121edc432 `server`: add `--reasoning-budget 0` to disable thinking (incl. qwen3 w/ enable_thinking:false) (#13771) hace 7 meses
console.cpp 8277a817f1 console : utf-8 fix for windows stdin (#9690) hace 1 año
console.h 6381d4e110 gguf : new file format with flexible meta data (beta) (#2398) hace 2 años
json-partial.cpp f5cd27b71d `server`: streaming of tool calls and thoughts when `--jinja` is on (#12379) hace 7 meses
json-partial.h f5cd27b71d `server`: streaming of tool calls and thoughts when `--jinja` is on (#12379) hace 7 meses
json-schema-to-grammar.cpp d5fe4e81bd grammar : handle maxItems == 0 in JSON schema (#13117) hace 8 meses
json-schema-to-grammar.h 669912d9a5 `tool-call`: fix Qwen 2.5 Coder support, add micro benchmarks, support trigger patterns for lazy grammars (#12034) hace 10 meses
json.hpp 5b7b0ac8df json-schema-to-grammar improvements (+ added to server) (#5978) hace 1 año
llguidance.cpp 43dfd741a5 llguidance : set tokenizer slices to default (#13424) hace 8 meses
log.cpp bfd11a2344 Fix: Compile failure due to Microsoft STL breaking change (#11836) hace 11 meses
log.h fef0cbeadf cleanup: fix compile warnings associated with gnu_printf (#11811) hace 11 meses
ngram-cache.cpp 5bbe6a9fe9 ggml : portability fixes for VS 2017 (#12150) hace 10 meses
ngram-cache.h 727368c60f llama : use LLAMA_TOKEN_NULL (#11062) hace 1 año
regex-partial.cpp 3198405e98 `common`: add partial regex support (#12808) hace 8 meses
regex-partial.h 3198405e98 `common`: add partial regex support (#12808) hace 8 meses
sampling.cpp f5cd27b71d `server`: streaming of tool calls and thoughts when `--jinja` is on (#12379) hace 7 meses
sampling.h ff227703d6 sampling : support for llguidance grammars (#10224) hace 11 meses
speculative.cpp e0dbec0bc6 llama : refactor llama_context, llama_kv_cache, llm_build_context (#12181) hace 10 meses
speculative.h abd4d0bc4f speculative : update default params (#11954) hace 11 meses
stb_image.h ad76569f8e common : Update stb_image.h to latest version (#9161) hace 1 año