Historie revizí

Autor SHA1 Zpráva Datum
  Aleksei Nikiforov d82b7a7c1d gguf-py : fix passing non-native endian tensors (editor-gui and new-metadata) (#17553) před 1 měsícem
  DAN™ 03914c7ef8 common : move all common_chat_parse_* to chat-parser.cpp. (#17481) před 1 měsícem
  o7si 3ce7a65c2f server: fix: /metrics endpoint returning JSON-escaped Prometheus format (#17386) před 1 měsícem
  Diego Devesa e072b2052e ggml : add GGML_SCHED_NO_REALLOC option to disable reallocations in ggml_backend_sched (#17276) před 1 měsícem
  R0CKSTAR c6f7a423c8 [MUSA] enable fp16/fast_fp16/bf16_mma on PH1 (#17551) před 1 měsícem
  Aman Gupta 2e7ef98f18 ggml-cuda: add stricter checking for fusion (#17568) před 1 měsícem
  Fredrik Hultin ddf9f94389 server : add Anthropic Messages API support (#17570) před 1 měsícem
  Piotr Wilkin (ilintar) ff55414c42 model : Qwen3 Next (#16095) před 1 měsícem
  Johannes Gäßler 73955f7d2a CUDA: no FP16 arithmetic for vector FA kernel (#17558) před 1 měsícem
  Jeff Bolz 35cf8887e1 vulkan: Implement GGML_OP_TRI (#17503) před 1 měsícem
  Radoslav Gerganov 15d2b46b4d rpc : cache and reuse compute graphs (#15405) před 1 měsícem
  yulo 6bca76ff5e HIP: enable mul_mat_f for RDNA4 (#17437) před 1 měsícem
  Piotr Wilkin (ilintar) cd0e3a7a3b SOLVE_TRI CUDA kernel for small matrices (#17457) před 1 měsícem
  Neo Zhang Jianyu efaaccdd69 refactor pad_reflect_1d to make the UT case pass (#17204) před 1 měsícem
  Jeff Bolz 4abef75f2c vulkan: Implement SOLVE_TRI (#17486) před 1 měsícem
  Georgi Gerganov c386114922 arch : add description about LLM_TENSOR_INFOS (#17550) před 1 měsícem
  Georgi Gerganov 6783b11fb0 models : fix LFM2 tensors (#17548) před 1 měsícem
  matt23654 909072abcf cuda : fix UMA detection on discrete GPUs. (#17537) před 1 měsícem
  Alberto Cabrera Pérez cd8370b408 ggml-cpu: aarm64: q4_K repack gemm and gemv implementations (dotprod only) (#17494) před 1 měsícem
  Eric Curtin d21a76ac38 devops: Add build-essential to Ubuntu 26.04 image (#17531) před 1 měsícem
  Aleksei Nikiforov 4fcd87cf7c gguf-py : skip endian-conversion of MXFP4 data (#17523) před 1 měsícem
  Acly b78db3bd50 vulkan : move contiguous checks to device_supports_op (#17490) před 1 měsícem
  Jeff Bolz 142df17c9c vulkan: use a fixed 1KB buffer for the add_rms_fusion opt (#17514) před 1 měsícem
  Xuan-Son Nguyen e509411cf1 server: enable jinja by default, update docs (#17524) před 1 měsícem
  lhez 7cba58bbea opencl: add sqr, sqrt, mean and ssm_conv (#17476) před 1 měsícem
  Alberto Cabrera Pérez 5449367b21 Fix chunks being too small with small matrix sizes (#17526) před 1 měsícem
  Han Qingzhe 1d594c295c clip: (minicpmv) fix resampler kq_scale (#17516) před 1 měsícem
  Jeff Bolz eec1e33a9e vulkan: allow graph_optimize for prompt processing workloads (#17475) před 2 měsíci
  Jeff Bolz 879d673759 vulkan: Implement top-k (#17418) před 2 měsíci
  xctan 6ab4e50d9c ggml-cpu : add RISC-V Zvfh impl for ggml_vec_mad_f16 (#17448) před 2 měsíci