Historie revizí

Autor SHA1 Zpráva Datum
  Johannes Gäßler 0a5eebb45d CUDA: mul_mat_q RDNA2 tunings (#2910) před 2 roky
  FK 84e723653c speculative: add --n-gpu-layers-draft option (#3063) před 2 roky
  Eric Sommerlade b52b29ab9d arm64 support for windows (#3007) před 2 roky
  Johannes Gäßler 4f7cd6ba9c CUDA: fix LoRAs (#3130) před 2 roky
  Johannes Gäßler 89e89599fd CUDA: fix mul_mat_q not used for output tensor (#3127) před 2 roky
  Johannes Gäßler d54a4027a6 CUDA: lower GPU latency + fix Windows performance (#3110) před 2 roky
  Jhen-Jie Hong 1b0d09259e cmake : support build for iOS/tvOS (#3116) před 2 roky
  Johannes Gäßler 8a4ca9af56 CUDA: add device number to error messages (#3112) před 2 roky
  Kawrakow f31b6f4e2d metal : PP speedup (#3084) před 2 roky
  Erik Scholz 6eeb4d9083 convert: remove most of the n_mult usage in convert.py (#3098) před 2 roky
  kchro3 21ac3a1503 metal : support for Swift (#3078) před 2 roky
  Jhen-Jie Hong 4fd5477955 metal : support build for iOS/tvOS (#3089) před 2 roky
  takov751 ec2a24fedf flake : add train-text-from-scratch to flake.nix (#3042) před 2 roky
  Ikko Eltociear Ashimine 7d99aca759 readme : fix typo (#3043) před 2 roky
  Kawrakow ba7ffbb251 metal : Q3_K speedup (#2995) před 2 roky
  Cebtenzzre e64f5b5578 examples : make n_ctx warning work again (#3066) před 2 roky
  Georgi Gerganov 94f10b91ed readme : update hot tpoics před 2 roky
  Georgi Gerganov b3e9852e47 sync : ggml (CUDA GLM RoPE + POSIX) (#3082) před 2 roky
  Przemysław Pawełczyk cb6c44c5e0 build : do not use _GNU_SOURCE gratuitously (#2035) před 2 roky
  hongbo.mo a21baeb122 docker : add git to full-cuda.Dockerfile main-cuda.Dockerfile (#3044) před 2 roky
  Yui 6ff712a6d1 Update deprecated GGML TheBloke links to GGUF (#3079) před 2 roky
  slaren ebc96086af ggml-alloc : correctly check mmap return value for errors (#3075) před 2 roky
  Kunshang Ji 7f412dab9c enable CPU HBM (#2603) před 2 roky
  Cebtenzzre 6336d834ec convert : fix F32 ftype not being saved (#3048) před 2 roky
  Cebtenzzre 00d62adb79 fix some warnings from gcc and clang-tidy (#3038) před 2 roky
  Cebtenzzre 4fa2cc1750 make : improve test target (#3031) před 2 roky
  Cebtenzzre 5ffab089a5 make : fix CPPFLAGS (#3035) před 2 roky
  slaren 15b67a66c2 llama-bench : use two tokens in the warmup run for prompt evals (#3059) před 2 roky
  Kawrakow be8c9c245b metal : parallel RoPE on Metal (#3024) před 2 roky
  Kawrakow be6beeb8d7 metal : correct fix of kernel_norm (#3060) před 2 roky