Historia zmian

Autor SHA1 Wiadomość Data
  Ruben Ortlam 261e6a20ff Vulkan: Clean up mul_mm shader (#15987) 4 miesięcy temu
  lcy a0e13dcbe5 build: fix the build failures of Windows HIP release job (#15984) 4 miesięcy temu
  Georgi Gerganov a14bd35014 metal : fix kernel requirements (#15983) 4 miesięcy temu
  Radoslav Gerganov 918b26f197 rpc : fix regression when --device is used (#15981) 4 miesięcy temu
  Diego Devesa 9ecb884346 releases : update ROCM, add gfx1200, gfx1201, gfx1151 (#15972) 4 miesięcy temu
  Radoslav Gerganov d1c6f11f47 doc : update documentation for --tensor-split (#15980) 4 miesięcy temu
  Aaron Teo 6380d6a3e7 ggml-zdnn: rm user mapped buffers (#15965) 4 miesięcy temu
  Jeff Bolz aa0c461efe vulkan: fix failing dequant shaders (#15862) 4 miesięcy temu
  Jeff Bolz b9c9c9f789 vulkan: initialize vulkan-hpp to allow using extension function pointers (#15705) 4 miesięcy temu
  Diego Devesa 50f4281a6f llama : allow using iGPUs with --device (#15951) 4 miesięcy temu
  Georgi Gerganov 55758b00ca metal : refactor kernel loading (#15964) 4 miesięcy temu
  Georgi Gerganov f161463a54 metal : allow ops to run concurrently (#15929) 4 miesięcy temu
  Georgi Gerganov 84d7b2fca1 metal : fix memory leaks (#15962) 4 miesięcy temu
  Aaron Teo 40be51152d ggml-zdnn: fix #15414, activate FP16 and BF16 acceleration and incorrect zTensor free (#15839) 4 miesięcy temu
  Eric Curtin 4bf5549269 Add docker protocol support for llama-server model loading (#15790) 4 miesięcy temu
  Haiyue Wang f4e664f838 context : remove redundant explicit casting to the same type (#15948) 4 miesięcy temu
  Georgi Gerganov f088b6a84f server : adjust prompt similarity thold + add logs (#15913) 4 miesięcy temu
  Ruben Ortlam 304ac5693d Vulkan iGPU device selection overhaul and PCI ID API support (#15947) 4 miesięcy temu
  Mathieu Baudier 6c88ad8fa7 vulkan: Make device memory check more portable (#15939) 4 miesięcy temu
  Neo Zhang Jianyu 704d90c987 Revert "sycl: add usage of enqueue_functions extension (#14244)" (#15910) 4 miesięcy temu
  Diego Devesa 360d6533db ggml-backend : add GGML_BACKEND_DEVICE_TYPE_IGPU device type (#15797) 4 miesięcy temu
  Johannes Gäßler 0e6ff0046f CUDA: larger SRAM reads for tile FA, AMD FP16 dot (#15927) 4 miesięcy temu
  ddh0 df082f5630 nitpick : correct MB to MiB (#15934) 4 miesięcy temu
  Daniel Bevenius 24a6734daf ggml-cpu : add check for ARM MATMUL_INT8/i8mm support (#15922) 4 miesięcy temu
  Charles Xu 2b3efea9a4 kleidiai: fix GGML_ASSERT(*cur_backend_id != -1) failed (#15614) 4 miesięcy temu
  hipudding c0389dba43 CANN: Disable acl_graph for prefill stage (#15933) 4 miesięcy temu
  Oliver Simons 00681dfc16 CUDA: Add `fastdiv` to `k_bin_bcast*`, giving 1-3% E2E performance (#15872) 4 miesięcy temu
  Jie Fu (傅杰) 4f658855fa llama : support T5 models with unequal number of encoder-decoder layers (#15909) 4 miesięcy temu
  Sigbjørn Skjæret 6ab397e12b graph : support non-contiguous Q in build_attn_mha (#15908) 4 miesięcy temu
  Daniel Bevenius 9de447d94e ggml-cpu : fix padding in ggml_timestep_embedding (#15917) 4 miesięcy temu