Historie revizí

Autor SHA1 Zpráva Datum
  slaren 7fc50c051a cuBLAS: use host pinned memory and dequantize while copying (#1207) před 2 roky
  0cc4m 7296c961d9 ggml : add CLBlast support (#1164) před 2 roky
  Johannes Gäßler 92a6e13a31 Add Manjaro CUDA include and lib dirs to Makefile (#1212) před 2 roky
  slaren e4cf982e0d Fix cuda compilation (#1128) před 2 roky
  Georgi Gerganov e4422e299c ggml : better PERF prints + support "LLAMA_PERF=1 make" před 2 roky
  Georgi Gerganov 872c365a91 ggml : fix AVX build + update to new Q8_0 format před 2 roky
  slaren 50cb666b8a Improve cuBLAS performance by using a memory pool (#1094) před 2 roky
  slaren 2005469ea1 Add Q4_3 support to cuBLAS (#1086) před 2 roky
  源文雨 5addcb120c fix: LLAMA_CUBLAS=1 undefined reference 'shm_open' (#1080) před 2 roky
  slaren 02d6988121 Improve cuBLAS performance by dequantizing on the GPU (#1065) před 2 roky
  Stephan Walter f3d4edf504 ggml : Q4 cleanup - remove 4-bit dot product code (#1061) před 2 roky
  slaren 8944a13296 Add NVIDIA cuBLAS support (#1044) před 2 roky
  Kawrakow 5ecff35151 Adding a simple program to measure speed of dot products (#1041) před 2 roky
  Georgi Gerganov e95b6554b4 ggml : add Q8_0 quantization for intermediate results (#951) před 2 roky
  Stephan Walter 93265e988a make : fix dependencies, use auto variables (#983) před 2 roky
  Georgi Gerganov 9190e8eac8 llama : merge llama_internal.h into llama.h před 2 roky
  CRD716 8cda5c981d fix whitespace (#944) před 2 roky
  SebastianApel 95ea26f6e9 benchmark : add tool for timing q4_0 matrix multiplication (#653) před 2 roky
  comex f963b63afa Rewrite loading code to try to satisfy everyone: před 2 roky
  unbounded 62cfc54f77 Add quantize-stats command for testing quantization (#728) před 2 roky
  bhubbb 698f7b5d63 make : add libllama.so target for llama-cpp-python (#797) před 2 roky
  Ivan Stepanov 0c44427df1 make : missing host optimizations in CXXFLAGS (#763) před 2 roky
  Fabian c4f89d8d73 make : use -march=native -mtune=native on x86 (#609) před 2 roky
  david raistrick 1f0414feec make : fix darwin f16c flags check (#615) před 2 roky
  Stephan Walter 436e561931 all : be more strict about converting float to double (#458) před 2 roky
  RJ Adriaansen 4b8efff0e3 Add embedding example to Makefile (#540) před 2 roky
  Georgi Gerganov a316a425d0 Overhaul the examples structure před 2 roky
  Cameron Kaiser 481044d50c additional optimizations for POWER9 (#454) před 2 roky
  Kerfuffle a140219e81 Fix Makefile echo escape codes (by removing them). (#418) před 2 roky
  Georgi Gerganov f5a77a629b Introduce C-style API (#370) před 2 roky