Просмотр исходного кода

llama : bump max seq limit from 64 to 256 (#15916)

ggml-ci
Georgi Gerganov 4 месяцев назад
Родитель
Сommit
e58174cecb
1 измененных файлов с 1 добавлено и 1 удалено
  1. 1 1
      src/llama-cparams.h

+ 1 - 1
src/llama-cparams.h

@@ -4,7 +4,7 @@
 
 #include <cstdint>
 
-#define LLAMA_MAX_SEQ 64
+#define LLAMA_MAX_SEQ 256
 
 struct llama_cparams {
     uint32_t n_ctx;           // context size used during inference