Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov 872c365a91 ggml : fix AVX build + update to new Q8_0 format vor 2 Jahren
  slaren 50cb666b8a Improve cuBLAS performance by using a memory pool (#1094) vor 2 Jahren
  slaren 2005469ea1 Add Q4_3 support to cuBLAS (#1086) vor 2 Jahren
  源文雨 5addcb120c fix: LLAMA_CUBLAS=1 undefined reference 'shm_open' (#1080) vor 2 Jahren
  slaren 02d6988121 Improve cuBLAS performance by dequantizing on the GPU (#1065) vor 2 Jahren
  Stephan Walter f3d4edf504 ggml : Q4 cleanup - remove 4-bit dot product code (#1061) vor 2 Jahren
  slaren 8944a13296 Add NVIDIA cuBLAS support (#1044) vor 2 Jahren
  Kawrakow 5ecff35151 Adding a simple program to measure speed of dot products (#1041) vor 2 Jahren
  Georgi Gerganov e95b6554b4 ggml : add Q8_0 quantization for intermediate results (#951) vor 2 Jahren
  Stephan Walter 93265e988a make : fix dependencies, use auto variables (#983) vor 2 Jahren
  Georgi Gerganov 9190e8eac8 llama : merge llama_internal.h into llama.h vor 2 Jahren
  CRD716 8cda5c981d fix whitespace (#944) vor 2 Jahren
  SebastianApel 95ea26f6e9 benchmark : add tool for timing q4_0 matrix multiplication (#653) vor 2 Jahren
  comex f963b63afa Rewrite loading code to try to satisfy everyone: vor 2 Jahren
  unbounded 62cfc54f77 Add quantize-stats command for testing quantization (#728) vor 2 Jahren
  bhubbb 698f7b5d63 make : add libllama.so target for llama-cpp-python (#797) vor 2 Jahren
  Ivan Stepanov 0c44427df1 make : missing host optimizations in CXXFLAGS (#763) vor 2 Jahren
  Fabian c4f89d8d73 make : use -march=native -mtune=native on x86 (#609) vor 2 Jahren
  david raistrick 1f0414feec make : fix darwin f16c flags check (#615) vor 2 Jahren
  Stephan Walter 436e561931 all : be more strict about converting float to double (#458) vor 2 Jahren
  RJ Adriaansen 4b8efff0e3 Add embedding example to Makefile (#540) vor 2 Jahren
  Georgi Gerganov a316a425d0 Overhaul the examples structure vor 2 Jahren
  Cameron Kaiser 481044d50c additional optimizations for POWER9 (#454) vor 2 Jahren
  Kerfuffle a140219e81 Fix Makefile echo escape codes (by removing them). (#418) vor 2 Jahren
  Georgi Gerganov f5a77a629b Introduce C-style API (#370) vor 2 Jahren
  Alex von Gluck IV f157088cb7 makefile: Fix CPU feature detection on Haiku (#218) vor 2 Jahren
  Kevin Lo 715d292ee0 Add OpenBSD support (#314) vor 2 Jahren
  Qingyou Meng c3b2306b18 Makefile: slightly cleanup for Mac Intel; echo instead of run ./main -h (#335) vor 2 Jahren
  Georgi Gerganov eb34620aec Add tokenizer test + revert to C++11 (#355) vor 2 Jahren
  Casey Primozic 2e664f1ff4 Add initial AVX512 support for dot product on Linux (#320) vor 2 Jahren