Historie revizí

Autor SHA1 Zpráva Datum
  Georgi Gerganov eeaa7b0492 ggml : multi-thread ggml_rope() (~3-4 times faster on M1) (#781) před 2 roky
  Georgi Gerganov 986b6ce9f9 ggml, llama : avoid heavy V transpose + improvements (#775) před 2 roky
  SebastianApel 437e77855a 10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 (#654) před 2 roky
  Marian Cepok c0bb1d3ce2 ggml : change ne to int64_t (#626) před 2 roky
  Stephan Walter 3525899277 Enable -std= for cmake builds, fix warnings (#598) před 2 roky
  slaren 1d08882afa Optimize AVX2 ggml_vec_dot_q4_0 (#642) před 2 roky
  perserk 02c5b27e91 Add AVX acceleration (#617) před 2 roky
  Justine Tunney 6f23ba5ee2 Ensure --mlock works properly with mmap() support před 2 roky
  Slaren c03ae8dca1 Add mmap support for model files před 2 roky
  Casey Primozic a4755cf288 Remove unused variable (#607) před 2 roky
  Georgi Gerganov 77efdf5a50 ggml : fix NEON signs (close #620, #622) před 2 roky
  slaren ed3c680bcd Fix GGML_F32Cx8_STORE in AVX without F16C path (#619) před 2 roky
  Georgi Gerganov b51c717d5c ggml : init time on first ggml_init() call před 2 roky
  Georgi Gerganov cea1c85948 ggml : add ARM_NEON dequantize_row_q4_1() před 2 roky
  Georgi Gerganov f202ada131 ggml : add ARM_NEON quantize_row_q4_1() před 2 roky
  Georgi Gerganov 3b44d30d9b ggml : add ARM_NEON ggml_vec_dot_q4_1() před 2 roky
  anzz1 83df5639eb Fix GCC warning about binary literal (#595) před 2 roky
  anzz1 5a5f8b1501 Enable Fused-Multiply-Add (FMA) and F16C/CVT16 vector extensions on MSVC (#375) před 2 roky
  slaren 2a98bc18ea ggml : add AVX2 implementation of quantize_row_q4_1 (#515) před 2 roky
  Stephan Walter 99c5b27654 ggml : refactor quantized processing functions (#509) před 2 roky
  Stephan Walter 436e561931 all : be more strict about converting float to double (#458) před 2 roky
  Stephan Walter c1f885067c ggml : introduce structs for the q4 data blocks (#356) před 2 roky
  slaren a6bdc47cba Fix usage of F16C intrinsics in AVX code (#563) před 2 roky
  Stephan Walter 939ad2d3a5 Fix undefined variables in debug build, remove unused variables (#531) před 2 roky
  slaren 459e93cce0 Add AVX2 implementation of dequantize_row_q4_1 (#505) před 2 roky
  Georgi Gerganov a316a425d0 Overhaul the examples structure před 2 roky
  Georgi Gerganov ecbe466a36 Retire the ggml_mul_mat() branch for transposed src0 (#500) před 2 roky
  slaren 09aecbf628 Add AVX2 implementation of dequantize_row_q4_0 (#467) před 2 roky
  Georgi Gerganov 6b6dbc8910 Remove obsolete assert and fix compiler warning před 2 roky
  Georgi Gerganov 2a2e63ce05 Fix nasty bug in ggml_compute_forward_mul_mat_f32() and reenable BLAS před 2 roky