Commit Verlauf

Autor SHA1 Nachricht Datum
  slaren 29b7baab67 Add timings for the prompt evaluation (#478) vor 2 Jahren
  Georgi Gerganov 4a7129acd2 Remove obsolete information from README vor 2 Jahren
  Georgi Gerganov 6b6dbc8910 Remove obsolete assert and fix compiler warning vor 2 Jahren
  Georgi Gerganov 2a2e63ce05 Fix nasty bug in ggml_compute_forward_mul_mat_f32() and reenable BLAS vor 2 Jahren
  anzz1 e899bf54b2 bounds checking for input prefix (#492) vor 2 Jahren
  anzz1 fbd4d38c64 feat: '--in-prefix STRING' option (#426) vor 2 Jahren
  Jed Fox 58e6c9f36f Add support for file load progress reporting callbacks (#434) vor 2 Jahren
  Doomsdayrs 36d07532ef Add missing struct annotation (#483) vor 2 Jahren
  Chris Kuehl 6f1ee4b640 Fix crash for 65B model with pre-allocated memory (#485) vor 2 Jahren
  Georgi Gerganov 8520fc310e Disable BLAS altogether - the bug is not just for qunatized mat mul vor 2 Jahren
  Georgi Gerganov b3f460e941 Disable BLAS branch in mul_mat - seems there is a bug vor 2 Jahren
  Georgi Gerganov 04c6f5ed6f Immediately start processing the prompt before user input has been provided (#476) vor 2 Jahren
  Georgi Gerganov 7a9b6c3a8b Reduce memory usage and allocate enough memory for largest context (#473) vor 2 Jahren
  Georgi Gerganov 31572d9665 Temporary bump the memory buffer size - hopefully fix issues from 483bab2e vor 2 Jahren
  Gary Mulder f4f5362edb Update README.md (#444) vor 2 Jahren
  rabidcopy 863f65e2e3 fix instruct mode (#445) vor 2 Jahren
  Georgi Gerganov afd220d9c6 Properly free llama_context on failure vor 2 Jahren
  Cameron Kaiser 481044d50c additional optimizations for POWER9 (#454) vor 2 Jahren
  comex 563cdc391d Support calling mlock() on loaded model data on Linux and macOS (#453) vor 2 Jahren
  Luciano 8d4a855c24 Add embedding mode with arg flag. Currently working (#282) vor 2 Jahren
  Georgi Gerganov b6b268d441 Add link to Roadmap discussion vor 2 Jahren
  Georgi Gerganov 3cd8dde0d1 Revert "Fix memory allocation issues and seg faults" vor 2 Jahren
  Georgi Gerganov 4870e455b3 Fix memory allocation issues and seg faults vor 2 Jahren
  Georgi Gerganov 483bab2e3d Avoid the transposed X branch in the Z = X * Y matrix multiplication (#439) vor 2 Jahren
  Jed Fox 404e1da38e Fix quantize script not finding models in parent directory (#428) vor 2 Jahren
  Georgi Gerganov 4cc053b6d5 Remove oboslete command from Docker script vor 2 Jahren
  Georgi Gerganov 0ba5a3a9a5 Obsolete vor 2 Jahren
  rabidcopy 2e17dfd80a Replace EOS with newline to prevent context/memory being flushed by EOS in interactive mode (#333) vor 2 Jahren
  Timmy Knight 20a1a4e09c Fix GPTQ converter (#423) vor 2 Jahren
  nusu-github ad072fc5ad Generate library with CMake (#430) vor 2 Jahren