Commit történet

Szerző SHA1 Üzenet Dátum
  Stephan Walter dc271c52ed Remove unused n_parts parameter (#1509) 2 éve
  rankaiyx c238b5873a benchmark-matmul: Print the average of the test results (#1490) 2 éve
  Tom Jobbins 2b2646931b convert.py: Support models which are stored in a single pytorch_model.bin (#1469) 2 éve
  Ilya Kurdyukov 42627421ec ~7% faster Q5_1 AVX2 code (#1477) 2 éve
  András Salamon 9560655409 define default model path once, sync path with readme (#1366) 2 éve
  sandyiscool 2a5ee023ad Add alternate include path for openblas (#1476) 2 éve
  zrm 63d20469b8 fix get_num_physical_cores() (#1436) 2 éve
  slaren b5c9295eef benchmark-matmul: fix clang-tidy issues, report results in GFLOPS (#1458) 2 éve
  Johannes Gäßler eb363627fd cuda : deduplicated dequantization code (#1453) 2 éve
  xaedes 79b2d5b69d ggml : alternative fix for race condition bug in non-inplace ggml_compute_forward_diag_mask_f32 (#1454) 2 éve
  Georgi Gerganov 13c351ad72 ggml : various fixes (#1450) 2 éve
  katsu560 60f8c361ca ggml : add AVX support based on AVX2 code (#1430) 2 éve
  Georgi Gerganov 601a033475 ggml : add GGML_QNT_VERSION to track quantization format changes 2 éve
  Georgi Gerganov 08737ef720 cuda : fix convert function (#1412) 2 éve
  Georgi Gerganov bda4d7c215 make : fix PERF build with cuBLAS 2 éve
  Georgi Gerganov 5a5aeb1e91 llama : fix unused warning 2 éve
  Georgi Gerganov 66841fdb0e ggml : multi-thread mul and diag_mask ops (#1428) 2 éve
  Johannes Gäßler 905d87b70a ggml : GPU-accelerated token generation (#1412) 2 éve
  xaedes f954edda93 ggml : implement backward pass for llama + small training-llama-from-scratch example (#1360) 2 éve
  Georgi Gerganov f048af0230 ggml : sync alibi fix from ggml repo 2 éve
  3ooabkhxtn ac0cd259d5 Adding SSE instructions to ggml_vec_dot_q4_0_q8_0 (#1413) 2 éve
  Georgi Gerganov 0cd22e190a llama : fix various warnings 2 éve
  Rinne 6456a4eb9f embedding : remove unused code (#1426) 2 éve
  Georgi Gerganov cdd5350892 readme : update Q4_0 perplexities 2 éve
  Georgi Gerganov 738ace394a llama : free ggml context in set / copy state data (close #1425) 2 éve
  Henri Vasserman 699b1ad7fe opencl : fix kernels for the new formats (#1422) 2 éve
  Georgi Gerganov fb62f92433 llama : fix --mtest option (close #1414) 2 éve
  Johannes Gäßler 773ee249fb CLI args use - instead of _, backwards compatible (#1416) 2 éve
  slaren 553fd4d4b5 Add clang-tidy reviews to CI (#1407) 2 éve
  Rinne 089b1c93ba readme : add C#/.NET bindings repo (#1409) 2 éve