Sfoglia il codice sorgente

llama : bump max seq limit from 64 to 256 (#15916)

ggml-ci
Georgi Gerganov 4 mesi fa
parent
commit
e58174cecb
1 ha cambiato i file con 1 aggiunte e 1 eliminazioni
  1. 1 1
      src/llama-cparams.h

+ 1 - 1
src/llama-cparams.h

@@ -4,7 +4,7 @@
 
 #include <cstdint>
 
-#define LLAMA_MAX_SEQ 64
+#define LLAMA_MAX_SEQ 256
 
 struct llama_cparams {
     uint32_t n_ctx;           // context size used during inference