Commit Verlauf

Autor SHA1 Nachricht Datum
  Georgi Gerganov b4ae50810e metal : improve FA + improve MoE (#12612) vor 10 Monaten
  Icenowy Zheng b86f600723 vulkan: fix coopmat shader generation when cross-compiling (#12272) vor 10 Monaten
  Johannes Gäßler dd373dd3bf llama: fix error on bad grammar (#12628) vor 10 Monaten
  Benson Wong 5d01670266 server : include speculative decoding stats when timings_per_token is enabled (#12603) vor 10 Monaten
  Radoslav Gerganov ef03229ff4 rpc : update README for cache usage (#12620) vor 10 Monaten
  amritahs-ibm 13731766db llamafile : ppc64le GEMV forwarding for FP32. (#12594) vor 10 Monaten
  Radoslav Gerganov ab6ab8f809 rpc : send hash when tensor data is above some fixed threshold (#12496) vor 10 Monaten
  Piotr 2099a9d5db server : Support listening on a unix socket (#12613) vor 10 Monaten
  Georgi Gerganov 2969019837 media : add SVG logo [no ci] (#12616) vor 10 Monaten
  lhez 5dec47dcd4 opencl: add multi and vision rope, `gelu_quick` and `im2col` (#12600) vor 10 Monaten
  Si1w f125b8dccf llama : add PLM GGUF Conversion & Inference Support (#12457) vor 10 Monaten
  HighDoping 953c2a62cf model : restore support for T5Encoder (#12590) vor 10 Monaten
  Csaba Kecskemeti d5c6309d91 convert : Support Qwen2_5_VLForConditionalGeneration (#12595) vor 10 Monaten
  Georgi Gerganov 029c693fdc sync : ggml vor 10 Monaten
  Georgi Gerganov 771d84371c scripts : update sync + fix cmake merge vor 10 Monaten
  Georgi Gerganov df0665a483 sync : ggml vor 10 Monaten
  Georgi Gerganov 0306aad1ca cmake : sync/merge PowerPC build commands (#0) vor 10 Monaten
  amritahs-ibm c7b43ab608 llamafile : ppc64le MMA implementation for Q4_0. (#12489) vor 10 Monaten
  xctan 24feaec057 ggml : riscv: add 128-bit RVV support (#12530) vor 10 Monaten
  Georgi Gerganov f28bc4c286 llama : make loras compatible with repacking (#12593) vor 10 Monaten
  Akarshan Biswas f17a3bb4e8 SYCL: implement memset ggml backend buffer interface (#12580) vor 10 Monaten
  Slobodan Josic bd40678df7 HIP: Add support for RDNA4 targets (#12372) vor 10 Monaten
  Georgi Gerganov b3298fa47a metal : refactor mat-vec code (#12569) vor 10 Monaten
  Michał Moskal 2447ad8a98 upgrade to llguidance 0.7.10 (#12576) vor 10 Monaten
  Ivy233 02082f1519 clip: Fix llama-llava-clip-quantize-cli quantization error under CUDA backend (#12566) vor 10 Monaten
  Georgi Gerganov df4d20cd53 convert : fix squeeze for ssm_conv tensors (#12573) vor 10 Monaten
  Georgi Gerganov 5ed38b6852 ggml : fix MUL_MAT_ID repack with Q8_K (#12544) vor 10 Monaten
  R0CKSTAR fd7855f8f5 doc: [MUSA] minor changes (#12583) vor 10 Monaten
  Sigbjørn Skjæret 53af4dba42 convert: fix Mistral3/Gemma3 model hparams init (#12571) vor 10 Monaten
  Eric Curtin ef19c71769 run: de-duplicate fmt and format functions and optimize (#11596) vor 10 Monaten