cturan/llama.cpp

mirror de https://github.com/cturan/llama.cpp

Autor	SHA1 Mensagem	Data
Lukas Straub	a9f77a8be3 server : add openai-style logit_bias support (#14946)	5 meses atrás
Olivier Chafik	f13847cfb5 server: fix regression on streamed non-chat completion w/ stops (#13785)	8 meses atrás
Xuan-Son Nguyen	360a9c98e1 server : fix cache_tokens bug with no cache_prompt (#13533)	8 meses atrás
Diego Devesa	1d36b3670b llama : move end-user examples to tools directory (#13249)	8 meses atrás