Histórico de Commits

Autor SHA1 Mensagem Data
  Radoslav Gerganov 15d2b46b4d rpc : cache and reuse compute graphs (#15405) há 1 mês atrás
  yulo 6bca76ff5e HIP: enable mul_mat_f for RDNA4 (#17437) há 1 mês atrás
  Piotr Wilkin (ilintar) cd0e3a7a3b SOLVE_TRI CUDA kernel for small matrices (#17457) há 1 mês atrás
  Neo Zhang Jianyu efaaccdd69 refactor pad_reflect_1d to make the UT case pass (#17204) há 1 mês atrás
  Jeff Bolz 4abef75f2c vulkan: Implement SOLVE_TRI (#17486) há 1 mês atrás
  Georgi Gerganov c386114922 arch : add description about LLM_TENSOR_INFOS (#17550) há 1 mês atrás
  Georgi Gerganov 6783b11fb0 models : fix LFM2 tensors (#17548) há 1 mês atrás
  matt23654 909072abcf cuda : fix UMA detection on discrete GPUs. (#17537) há 1 mês atrás
  Alberto Cabrera Pérez cd8370b408 ggml-cpu: aarm64: q4_K repack gemm and gemv implementations (dotprod only) (#17494) há 1 mês atrás
  Eric Curtin d21a76ac38 devops: Add build-essential to Ubuntu 26.04 image (#17531) há 1 mês atrás
  Aleksei Nikiforov 4fcd87cf7c gguf-py : skip endian-conversion of MXFP4 data (#17523) há 1 mês atrás
  Acly b78db3bd50 vulkan : move contiguous checks to device_supports_op (#17490) há 1 mês atrás
  Jeff Bolz 142df17c9c vulkan: use a fixed 1KB buffer for the add_rms_fusion opt (#17514) há 1 mês atrás
  Xuan-Son Nguyen e509411cf1 server: enable jinja by default, update docs (#17524) há 1 mês atrás
  lhez 7cba58bbea opencl: add sqr, sqrt, mean and ssm_conv (#17476) há 1 mês atrás
  Alberto Cabrera Pérez 5449367b21 Fix chunks being too small with small matrix sizes (#17526) há 1 mês atrás
  Han Qingzhe 1d594c295c clip: (minicpmv) fix resampler kq_scale (#17516) há 1 mês atrás
  Jeff Bolz eec1e33a9e vulkan: allow graph_optimize for prompt processing workloads (#17475) há 1 mês atrás
  Jeff Bolz 879d673759 vulkan: Implement top-k (#17418) há 1 mês atrás
  xctan 6ab4e50d9c ggml-cpu : add RISC-V Zvfh impl for ggml_vec_mad_f16 (#17448) há 1 mês atrás
  Adrien Gallouët 2336cc4784 cmake : use EXCLUDE_FROM_ALL to avoid patch-boringssl.cmake (#17520) há 1 mês atrás
  Adrien Gallouët e6923caaec ggml : fix ARM feature verification (#17519) há 1 mês atrás
  Jiacheng (Jason) Chen 3e18dba9fd HIP: Patch failed testcase in WMMA-MMQ kernels for RDNA 4 (#17502) há 1 mês atrás
  hipudding eeb5605de2 CANN: Add MROPE and IMROPE support (#17401) há 1 mês atrás
  o7si f3a848a3b1 chore: upgrade cpp-httplib from v0.27.0 to v0.28.0 (#17513) há 1 mês atrás
  Jeff Bolz b3b03a7baf vulkan: Implement GGML_OP_CUMSUM (#17479) há 1 mês atrás
  Georgi Gerganov 583cb83416 ggml : add ggml_top_k (#17365) há 1 mês atrás
  Aleksei Nikiforov 05872ac885 convert : fix big-endian conversion (#17431) há 1 mês atrás
  Diego Devesa 55ab25caf5 codeowners : remove slaren (#17492) há 1 mês atrás
  TianHao324 064c90d843 CANN: supports out_prod operator for F32 and F16 (#17406) há 1 mês atrás