| .. |
|
CMakeLists.txt
|
f32ca51bfe
server: add presets (config) when using multiple models (#17859)
|
1 lună în urmă |
|
arg.cpp
|
9e39a1e6a9
server: support load model on startup, support preset-only options (#18206)
|
4 săptămâni în urmă |
|
arg.h
|
9e39a1e6a9
server: support load model on startup, support preset-only options (#18206)
|
4 săptămâni în urmă |
|
base64.hpp
|
381efbf480
llava : expose as a shared library for downstream projects (#3613)
|
2 ani în urmă |
|
build-info.cpp.in
|
cc8d081879
cmake: Add ability to pass in LLAMA_BUILD_NUMBER/COMMIT (#14167)
|
7 luni în urmă |
|
chat-parser-xml-toolcall.cpp
|
636fc17a37
Fix Kimi-K2 tool-call parsing issues (#17376)
|
1 lună în urmă |
|
chat-parser-xml-toolcall.h
|
636fc17a37
Fix Kimi-K2 tool-call parsing issues (#17376)
|
1 lună în urmă |
|
chat-parser.cpp
|
636fc17a37
Fix Kimi-K2 tool-call parsing issues (#17376)
|
1 lună în urmă |
|
chat-parser.h
|
1920345c3b
common : Generalized XML-style tool-call parsing with streaming support (GLM 4.5/4.6 + MiniMax M2 + SeedOSS + Kimi-K2 + Qwen3-Coder + Apriel-1.5 + Xiaomi-MiMo) (#16932)
|
1 lună în urmă |
|
chat-peg-parser.cpp
|
c05aa69f32
common : add nemotron 3 parsing (#18077)
|
1 lună în urmă |
|
chat-peg-parser.h
|
0a8026e768
common : introduce composable PEG parser combinators for chat parsing (#17136)
|
1 lună în urmă |
|
chat.cpp
|
c05aa69f32
common : add nemotron 3 parsing (#18077)
|
1 lună în urmă |
|
chat.h
|
190c4838bd
chat : reserve memory in compute_diffs and improve naming (#17729)
|
1 lună în urmă |
|
common.cpp
|
a2c199e479
common: clarify instructions for bug reports (#18134)
|
1 lună în urmă |
|
common.h
|
6ce3d85796
server: (webui) add --webui-config (#18028)
|
1 lună în urmă |
|
console.cpp
|
6c2131773c
cli: new CLI experience (#17824)
|
1 lună în urmă |
|
console.h
|
6c2131773c
cli: new CLI experience (#17824)
|
1 lună în urmă |
|
download.cpp
|
b8ee22cfde
common : add minimalist multi-thread progress bar (#17602)
|
1 lună în urmă |
|
download.h
|
ec18edfcba
server: introduce API for serving / loading / unloading multiple models (#17470)
|
1 lună în urmă |
|
http.h
|
4201deae9c
common: introduce http.h for httplib-based client (#16373)
|
3 luni în urmă |
|
json-partial.cpp
|
1920345c3b
common : Generalized XML-style tool-call parsing with streaming support (GLM 4.5/4.6 + MiniMax M2 + SeedOSS + Kimi-K2 + Qwen3-Coder + Apriel-1.5 + Xiaomi-MiMo) (#16932)
|
1 lună în urmă |
|
json-partial.h
|
53f925074d
sync : vendor (#13901)
|
7 luni în urmă |
|
json-schema-to-grammar.cpp
|
c05aa69f32
common : add nemotron 3 parsing (#18077)
|
1 lună în urmă |
|
json-schema-to-grammar.h
|
c05aa69f32
common : add nemotron 3 parsing (#18077)
|
1 lună în urmă |
|
llguidance.cpp
|
43dfd741a5
llguidance : set tokenizer slices to default (#13424)
|
8 luni în urmă |
|
log.cpp
|
6c2131773c
cli: new CLI experience (#17824)
|
1 lună în urmă |
|
log.h
|
6c2131773c
cli: new CLI experience (#17824)
|
1 lună în urmă |
|
ngram-cache.cpp
|
5bbe6a9fe9
ggml : portability fixes for VS 2017 (#12150)
|
10 luni în urmă |
|
ngram-cache.h
|
727368c60f
llama : use LLAMA_TOKEN_NULL (#11062)
|
1 an în urmă |
|
peg-parser.cpp
|
c05aa69f32
common : add nemotron 3 parsing (#18077)
|
1 lună în urmă |
|
peg-parser.h
|
0a8026e768
common : introduce composable PEG parser combinators for chat parsing (#17136)
|
1 lună în urmă |
|
preset.cpp
|
9e39a1e6a9
server: support load model on startup, support preset-only options (#18206)
|
4 săptămâni în urmă |
|
preset.h
|
98c1c7a7bf
presets: refactor, allow cascade presets from different sources, add global section (#18169)
|
4 săptămâni în urmă |
|
regex-partial.cpp
|
3198405e98
`common`: add partial regex support (#12808)
|
8 luni în urmă |
|
regex-partial.h
|
3198405e98
`common`: add partial regex support (#12808)
|
8 luni în urmă |
|
sampling.cpp
|
4301e27319
common : restore grammar-based rejection sampling (#18137)
|
1 lună în urmă |
|
sampling.h
|
4301e27319
common : restore grammar-based rejection sampling (#18137)
|
1 lună în urmă |
|
speculative.cpp
|
4301e27319
common : restore grammar-based rejection sampling (#18137)
|
1 lună în urmă |
|
speculative.h
|
94933c8c2e
server : implement universal assisted decoding (#12635)
|
5 luni în urmă |
|
unicode.cpp
|
0a8026e768
common : introduce composable PEG parser combinators for chat parsing (#17136)
|
1 lună în urmă |
|
unicode.h
|
0a8026e768
common : introduce composable PEG parser combinators for chat parsing (#17136)
|
1 lună în urmă |