Commit Verlauf

Autor SHA1 Nachricht Datum
  ngc92 3e5ca7931c pass cpu-architecture arguments only to host code (C;C++) (#4943) vor 2 Jahren
  David Friehs 4483396751 llama : apply classifier-free guidance to logits directly (#4951) vor 2 Jahren
  Victor Z. Peng d9aa4ffa6e awq-py : fix typo in awq-py/README.md (#4947) vor 2 Jahren
  Georgi Gerganov ddb008d845 cuda : fix dequantize kernel names (#4938) vor 2 Jahren
  Kawrakow 2faaef3979 llama : check for 256 divisibility for IQ2_XS, IQ2_XXS (#4950) vor 2 Jahren
  Kawrakow 4a3156de2f CUDA: faster dequantize kernels for Q4_0 and Q4_1 (#4938) vor 2 Jahren
  David Pflug a836c8f534 llama : fix missing quotes (#4937) vor 2 Jahren
  Kawrakow 467a882fd2 Add ability to use importance matrix for all k-quants (#4930) vor 2 Jahren
  Georgi Gerganov bb0c139247 llama : check LLAMA_TRACE env for extra logging (#4929) vor 2 Jahren
  Georgi Gerganov 9408cfdad6 scripts : sync-ggml-am.sh option to skip commits vor 2 Jahren
  Georgi Gerganov 03c5267490 llama : use LLAMA_LOG_ macros for logging vor 2 Jahren
  Kawrakow a128c38de8 Fix ffn_down quantization mix for MoE models (#4927) vor 2 Jahren
  Alex Azarov 5f5fe1bd60 metal : correctly set SIMD support flags on iOS (#4923) vor 2 Jahren
  Karthik Kumar Viswanathan ac32902a87 llama : support WinXP build with MinGW 8.1.0 (#3419) vor 2 Jahren
  Kawrakow 147b17ac94 2-bit quantizations (#4897) vor 2 Jahren
  Kawrakow 807179ec58 Make Q3_K_S be the same as olf Q3_K_L for Mixtral-8x7B (#4906) vor 2 Jahren
  Georgi Gerganov 76484fbfd3 sync : ggml vor 2 Jahren
  Johannes Gäßler c71d608ce7 ggml: cache sin/cos for RoPE (#4908) vor 2 Jahren
  Georgi Gerganov 4be5ef556d metal : remove old API (#4919) vor 2 Jahren
  Georgi Gerganov 0ea069b87b server : fix prompt caching with system prompt (#4914) vor 2 Jahren
  Georgi Gerganov f172de03f1 llama : fix detokenization of non-special added-tokens (#4916) vor 2 Jahren
  Georgi Gerganov 2d57de5255 metal : disable log for loaded kernels (#4794) vor 2 Jahren
  David Friehs df845cc982 llama : minimize size used for state save/load (#4820) vor 2 Jahren
  Someone 6b48ed0893 workflows: unbreak nix-build-aarch64, and split it out (#4915) vor 2 Jahren
  Yann Follet 722d33f34e main : add parameter --no-display-prompt (#4541) vor 2 Jahren
  texmex76 c30b1ef39a gguf : fix potential infinite for-loop (#4600) vor 2 Jahren
  Georgi Gerganov b38b5e93ae metal : refactor kernel loading code (#4794) vor 2 Jahren
  Johannes Gäßler 7dc78764e2 compare-llama-bench: tweak output format (#4910) vor 2 Jahren
  Ziad Ben Hadj-Alouane 356327feb3 server : fix deadlock that occurs in multi-prompt scenarios (#4905) vor 2 Jahren
  makomk ee8243adaa server : fix crash with multimodal models without BOS token (#4904) vor 2 Jahren