Xuan Son Nguyen
|
9ef0780062
Fix new line issue with chat template, disable template when in-prefix/suffix is set (#8203)
|
hace 1 año |
Andrei
|
1c5eba6f8e
llama: Add attention and final logit soft-capping, update scaling factor to Gemma2 (#8197)
|
hace 1 año |
Xuan Son Nguyen
|
72272b83a3
fix code typo in llama-cli (#8198)
|
hace 1 año |
Olivier Chafik
|
8748d8ac6f
json: attempt to skip slow tests when running under emulator (#8189)
|
hace 1 año |
Xuan Son Nguyen
|
26a39bbd6b
Add MiniCPM, Deepseek V2 chat template + clean up `llama_chat_apply_template_internal` (#8172)
|
hace 1 año |
Sigbjørn Skjæret
|
38373cfbab
Add SPM infill support (#8016)
|
hace 1 año |
slaren
|
b851b3fba0
cmake : allow user to override default options (#8178)
|
hace 1 año |
Olivier Chafik
|
139cc621e9
`json`: restore default additionalProperties to false, fix some pattern escapes (#8180)
|
hace 1 año |
pculliton
|
e57dc62057
llama: Add support for Gemma2ForCausalLM (#8156)
|
hace 1 año |
Xuan Son Nguyen
|
a27aa50ab7
Add missing items in makefile (#8177)
|
hace 1 año |
Olivier Chafik
|
cb0b06a8a6
`json`: update grammars/README w/ examples & note about additionalProperties (#8132)
|
hace 1 año |
loonerin
|
558f44bf83
CI: fix release build (Ubuntu+Mac) (#8170)
|
hace 1 año |
slaren
|
8172ee9da9
cmake : fix deprecated option names not working (#8171)
|
hace 1 año |
Xuan Son Nguyen
|
16791b8f0b
Add chatml fallback for cpp `llama_chat_apply_template` (#8160)
|
hace 1 año |
Georgi Gerganov
|
ab3679112d
flake.lock: Update (#8071)
|
hace 1 año |
jukofyork
|
97877eb10b
Control vector loading fixes (#8137)
|
hace 1 año |
Raj Hammeer Singh Hada
|
387952651a
Delete examples/llama.android/llama/CMakeLists.txt (#8165)
|
hace 1 año |
Sigbjørn Skjæret
|
6030c61281
Add Qwen2MoE 57B-A14B model identifier (#8158)
|
hace 1 año |
Johannes Gäßler
|
85a267daaa
CUDA: fix MMQ stream-k for --split-mode row (#8167)
|
hace 1 año |
kustaaya
|
f675b20a3b
Added support for Viking pre-tokenizer (#8135)
|
hace 1 año |
Sigbjørn Skjæret
|
911e35bb8b
llama : fix CodeLlama FIM token checks (#8144)
|
hace 1 año |
Raj Hammeer Singh Hada
|
ac146628e4
Fix llama-android.cpp for error - "common/common.h not found" (#8145)
|
hace 1 año |
Daniel Bevenius
|
9b31a40c6d
clip : suppress unused variable warnings (#8105)
|
hace 1 año |
Georgi Gerganov
|
c70d117c37
scripts : fix filename sync
|
hace 1 año |
slaren
|
ae5d0f4b89
ci : publish new docker images only when the files change (#8142)
|
hace 1 año |
slaren
|
31ec3993f6
ggml : add GGML_CUDA_USE_GRAPHS option, restore GGML_CUDA_FORCE_CUBLAS (cmake) (#8140)
|
hace 1 año |
slaren
|
c7ab7b612c
make : fix missing -O3 (#8143)
|
hace 1 año |
Georgi Gerganov
|
f2d48fffde
sync : ggml
|
hace 1 año |
Georgi Gerganov
|
4713bf3093
authors : regen
|
hace 1 año |
Georgi Gerganov
|
0e814dfc42
devops : remove clblast + LLAMA_CUDA -> GGML_CUDA (#8139)
|
hace 1 año |