2 лет назад · ee8243adaa
--- a/examples/server/server.cpp
+++ b/examples/server/server.cpp
@@ -1835,7 +1835,7 @@ struct llama_server_context
 
				 
			
 
				                     slot.cache_tokens = prompt_tokens;
			
 
				 
			
 
				-                    if (slot.n_past == slot.num_prompt_tokens)
			
 
				+                    if (slot.n_past == slot.num_prompt_tokens && slot.n_past > 0)
			
 
				                     {
			
 
				                         // we have to evaluate at least 1 token to generate logits.
			
 
				                         LOG_TEE("slot %d : we have to evaluate at least 1 token to generate logits\n", slot.id);