cturan/llama.cpp

作者	SHA1 備註	提交日期
Aman Gupta	48e2fa9fb7 CUDA: add fp kernel for larger batch size MoE (#16512)	3 月之前
Georgi Gerganov	e60f241eac metal : FA support F32 K and V and head size = 32 (#16531)	3 月之前
Georgi Gerganov	0a319bb75e metal : add support for non-padded FA KV (#16148)	3 月之前
Georgi Gerganov	1d6092fc72 tests : add -INF blocks to the KQ mask in the FA tests (#16380)	3 月之前
Reese Levine	ef07a40906 ggml webgpu: add support for soft_max, optimize rms_norm (#16357)	3 月之前
Reese Levine	8d78cd2613 ggml webgpu: support for rope,div,sub,glu,scale,cont operators (#16187)	3 月之前
Jeff Bolz	a74a0d69f3 tests: override test_set_rows::max_nmse_err to allow for occasional rounding differences (#16295)	3 月之前
Sigbjørn Skjæret	adc76347d7 ggml : check cuda and metal argsort limits and add test (#16323)	3 月之前
Sigbjørn Skjæret	b887d2f341 ggml : fix GGML_F32_VEC_FMA argument order in ggml_vec_mad1_f32 (#16307)	3 月之前
Jeff Bolz	d8359f5fde vulkan: 64-bit im2col (#16135)	3 月之前
Georgi Gerganov	6a2c6145a0 metal : extend mat-mat multiplication support (#16225)	3 月之前
Jeff Bolz	1384abf8b8 vulkan: handle mat_mul with A matrix > 4GB (#16176)	3 月之前
Aman Gupta	c0bfc57af4 CUDA: mul_mat_id for mmf for bs <= 64 for f16 and bs <= 32 for f32 (#16277)	3 月之前
Aman Gupta	077c94d0ca CUDA: add a fused top-K MoE kernel (#16130)	3 月之前
Georgi Gerganov	dfcd53f7ec metal : fuse NORM + MUL + ADD, support non-multiples of 4 (#16220)	3 月之前
Sigbjørn Skjæret	3ecb2f671a ggml : implement set_rows with i32 index (#16159)	3 月之前
Shin-myoung-serp	96fdca043b Vulkan: add conv_transpose_2d operation (#16022)	3 月之前
Ruben Ortlam	9073a73d82 vulkan: vec dot matrix multiplication fix (#16151)	3 月之前
Xuan-Son Nguyen	0dd58b6877 ggml : refactor forward_dup for cpu backend (#16062)	4 月之前
Bowen Han	38dbdf4c05 CUDA: Optimize PAD_REFLECT_1D (#15957)	4 月之前
Reese Levine	d304f459d8 GGML WebGPU: Support for ADD, MUL, RMS_NORM, GET_ROWS operators (#16018)	4 月之前
Georgi Gerganov	0320ac5264 metal : refactor + optimize v2 (#15995)	4 月之前
Oliver Simons	00681dfc16 CUDA: Add `fastdiv` to `k_bin_bcast*`, giving 1-3% E2E performance (#15872)	4 月之前
Daniel Bevenius	e7b6d83b52 tests : filter out no-ops from coverage report (#15900)	4 月之前
Jeff Bolz	4f63cd705c vulkan: Fix OOB accesses in soft_max_back (#15861)	4 月之前
Aman Gupta	a972faebed CUDA: Add mul_mat_id support for the mmf kernel (#15767)	4 月之前
Georgi Gerganov	f28d4f4ac9 metal : refactor + optimize (#15857)	4 月之前
Xuan-Son Nguyen	9fcb29f22f ggml: allow casting between f32 and i32 (#15783)	4 月之前
Jeff Bolz	d413dca003 tests: large sizes for get_rows (#15687)	4 月之前
Jeff Bolz	3976dfbe00 vulkan: support im2col_3d (#15795)	4 月之前

更新的提交更舊的提交

提交歷史 查找

提交歷史