Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov 16bcc1259d kv-cache : pad the cache size to 256 for performance (#17046) vor 2 Monaten
  Johannes Gäßler e81b8e4b7f llama: use FA + max. GPU layers by default (#15434) vor 4 Monaten
  Georgi Gerganov d2fcd91cf9 server : disable context shift by default (#15416) vor 5 Monaten
  Diego Devesa 1d36b3670b llama : move end-user examples to tools directory (#13249) vor 8 Monaten