Explorar o código

llama : bump max seq limit from 64 to 256 (#15916)

ggml-ci
Georgi Gerganov hai 4 meses
pai
achega
e58174cecb
Modificáronse 1 ficheiros con 1 adicións e 1 borrados
  1. 1 1
      src/llama-cparams.h

+ 1 - 1
src/llama-cparams.h

@@ -4,7 +4,7 @@
 
 #include <cstdint>
 
-#define LLAMA_MAX_SEQ 64
+#define LLAMA_MAX_SEQ 256
 
 struct llama_cparams {
     uint32_t n_ctx;           // context size used during inference