История коммитов

Автор SHA1 Сообщение Дата
  compilade 19f68fa5a4 imatrix : warn when GGUF imatrix is saved without .gguf suffix (#15076) 5 месяцев назад
  Christian Kastner 41613437ff cmake: Add GGML_BACKEND_DIR option (#15074) 5 месяцев назад
  Sigbjørn Skjæret e5bebe5251 gguf-py : add --chat-template-file to gguf_new_metadata (#15075) 5 месяцев назад
  Sam ef0144c087 model: support GLM 4.5 family of models (#14939) 5 месяцев назад
  Sigbjørn Skjæret 2721257e3e quantize : fix confusing error message if ftype is invalid (#15071) 5 месяцев назад
  Reese Levine 587d0118f5 ggml: WebGPU backend host improvements and style fixing (#14978) 5 месяцев назад
  Jeff Bolz 5aa1105da2 vulkan: fix build when using glslang that does not support coopmat2 (#15062) 5 месяцев назад
  compilade d31192b4ee imatrix : use GGUF by default (#14842) 5 месяцев назад
  compilade 0a2f5496be imatrix : fix 3d activation handling for hybrid and recurrent models (#14994) 5 месяцев назад
  compilade 11a3811164 memory : handle kv_unified for hybrid models (#15050) 5 месяцев назад
  Csaba Kecskemeti 97366dc6ab vocab : JetBrains Mellum pre-tokenizer (#15045) 5 месяцев назад
  Gabriel Larson 83bc2f288c model : add text-only support for Kimi-VL (and find special tokens in text_config) (#15051) 5 месяцев назад
  Jeff Bolz 6c7a441161 vulkan: Use coopmat2 for conv2d (#14982) 5 месяцев назад
  lhez 5c0eb5ef54 opencl: fix adreno compiler detection logic (#15029) 5 месяцев назад
  Johannes Gäßler 03d4698218 CUDA: use mma FA kernel for gqa > 4 on RTX 4000 (#15035) 5 месяцев назад
  leejet 3303c19b16 cuda: make im2col a little faster (#15025) 5 месяцев назад
  Daniel Bevenius 4fdea540bd kv-cache : skip alignment of n_stream in kv-cache log msg [no ci] (#15040) 5 месяцев назад
  Georgi Gerganov a4569c41fd llama : enable LLAMA_SET_ROWS=1 by default (#14959) 5 месяцев назад
  Georgi Gerganov 15e92fd337 cuda, sycl : fix batched gemm when ne02 == 1 && ne03 > 1 (#15038) 5 месяцев назад
  Sigbjørn Skjæret 2bf3fbf0b5 ci : check that pre-tokenizer hashes are up-to-date (#15032) 5 месяцев назад
  Douglas Hanley 711d5e6fe6 convert : fix Qwen3-Embedding pre-tokenizer hash (#15030) 5 месяцев назад
  Jhen-Jie Hong f738989dcb chat : fix multiple tool_calls on hermes-2-pro (#14962) 5 месяцев назад
  Jeff Bolz 4cb208c93c vulkan: coopmat2 mul_mat optimizations (#14934) 5 месяцев назад
  R0CKSTAR 3025b621d1 llama-bench: rename DB table name from test to llama_bench (#15003) 5 месяцев назад
  Jeff Bolz ec0b18802c vulkan: Support ne[3]>1 in noncontig matrix-vector multiply (#15015) 5 месяцев назад
  Douglas Hanley 339bd0268c model : support Qwen3-Embedding (#15023) 5 месяцев назад
  Johannes Gäßler f906275537 server: enable token array inputs for OAI API (#15001) 5 месяцев назад
  Jeff Bolz a9f7541ec2 vulkan: optimizations for direct convolution (#14933) 5 месяцев назад
  Johannes Gäßler 9c35706b98 CUDA: fix MMQ nwarps for AMD with warp_size==32 (#15014) 5 месяцев назад
  l-austenfeld c76b420e4c vendor : update vendored copy of google/minja (#15011) 5 месяцев назад