커밋 기록

작성자 SHA1 메시지 날짜
  Igor Smirnov 0874693b44 common : fix json schema with '\' in literals (#17307) 1 개월 전
  Neo Zhang 7d2add51d8 sycl : support to malloc memory on device more than 4GB, update the doc and script (#17566) 1 개월 전
  ixgbe f698a79c63 ggml: replace hwcap with riscv_hwprobe for RVV detection (#17567) 1 개월 전
  Ruben Ortlam 47a268ea50 Vulkan: MMVQ Integer Dot K-Quant and MUL_MAT_ID support (#16900) 1 개월 전
  Jeff Bolz 59d8d4e963 vulkan: improve topk perf for large k, fix overflow in unit tests (#17582) 1 개월 전
  Aleksei Nikiforov d82b7a7c1d gguf-py : fix passing non-native endian tensors (editor-gui and new-metadata) (#17553) 1 개월 전
  DAN™ 03914c7ef8 common : move all common_chat_parse_* to chat-parser.cpp. (#17481) 1 개월 전
  o7si 3ce7a65c2f server: fix: /metrics endpoint returning JSON-escaped Prometheus format (#17386) 1 개월 전
  Diego Devesa e072b2052e ggml : add GGML_SCHED_NO_REALLOC option to disable reallocations in ggml_backend_sched (#17276) 1 개월 전
  R0CKSTAR c6f7a423c8 [MUSA] enable fp16/fast_fp16/bf16_mma on PH1 (#17551) 1 개월 전
  Aman Gupta 2e7ef98f18 ggml-cuda: add stricter checking for fusion (#17568) 1 개월 전
  Fredrik Hultin ddf9f94389 server : add Anthropic Messages API support (#17570) 1 개월 전
  Piotr Wilkin (ilintar) ff55414c42 model : Qwen3 Next (#16095) 1 개월 전
  Johannes Gäßler 73955f7d2a CUDA: no FP16 arithmetic for vector FA kernel (#17558) 1 개월 전
  Jeff Bolz 35cf8887e1 vulkan: Implement GGML_OP_TRI (#17503) 1 개월 전
  Radoslav Gerganov 15d2b46b4d rpc : cache and reuse compute graphs (#15405) 1 개월 전
  yulo 6bca76ff5e HIP: enable mul_mat_f for RDNA4 (#17437) 1 개월 전
  Piotr Wilkin (ilintar) cd0e3a7a3b SOLVE_TRI CUDA kernel for small matrices (#17457) 1 개월 전
  Neo Zhang Jianyu efaaccdd69 refactor pad_reflect_1d to make the UT case pass (#17204) 1 개월 전
  Jeff Bolz 4abef75f2c vulkan: Implement SOLVE_TRI (#17486) 1 개월 전
  Georgi Gerganov c386114922 arch : add description about LLM_TENSOR_INFOS (#17550) 1 개월 전
  Georgi Gerganov 6783b11fb0 models : fix LFM2 tensors (#17548) 1 개월 전
  matt23654 909072abcf cuda : fix UMA detection on discrete GPUs. (#17537) 1 개월 전
  Alberto Cabrera Pérez cd8370b408 ggml-cpu: aarm64: q4_K repack gemm and gemv implementations (dotprod only) (#17494) 1 개월 전
  Eric Curtin d21a76ac38 devops: Add build-essential to Ubuntu 26.04 image (#17531) 1 개월 전
  Aleksei Nikiforov 4fcd87cf7c gguf-py : skip endian-conversion of MXFP4 data (#17523) 1 개월 전
  Acly b78db3bd50 vulkan : move contiguous checks to device_supports_op (#17490) 1 개월 전
  Jeff Bolz 142df17c9c vulkan: use a fixed 1KB buffer for the add_rms_fusion opt (#17514) 1 개월 전
  Xuan-Son Nguyen e509411cf1 server: enable jinja by default, update docs (#17524) 1 개월 전
  lhez 7cba58bbea opencl: add sqr, sqrt, mean and ssm_conv (#17476) 1 개월 전