瀏覽代碼

Bump memory buffer

Georgi Gerganov 2 年之前
父節點
當前提交
7d9ed7b25f
共有 1 個文件被更改,包括 1 次插入1 次删除
  1. 1 1
      main.cpp

+ 1 - 1
main.cpp

@@ -529,7 +529,7 @@ bool llama_eval(
 
     const int d_key = n_embd/n_head;
 
-    static size_t buf_size = 256u*1024*1024;
+    static size_t buf_size = 512u*1024*1024;
     static void * buf = malloc(buf_size);
 
     if (mem_per_token > 0 && mem_per_token*N > buf_size) {