cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Sigbjørn Skjæret	229bf68628 cuda : fix argsort with 64k+ rows (#16849)	2 месяцев назад
Jan Boon	d7395115ba llama : use std::abs instead of abs (#16853)	2 месяцев назад
Jeff Bolz	052df28b0e vulkan: Handle argsort with a large number of rows (#16851)	2 месяцев назад
Oliver Simons	8b11deea46 Hide latency of bias and gate-loading (#16847)	2 месяцев назад
Jeff Bolz	b9ce940177 vulkan: Fuse rope+set_rows (#16769)	2 месяцев назад
Xuan-Son Nguyen	3464bdac37 llama: fix ASAN error with M-RoPE (#16848)	2 месяцев назад
Xuan-Son Nguyen	e3af5563bd llama: store mrope data in KV cell (#16825)	2 месяцев назад
Jeff Bolz	10fcc41290 vulkan: Update topk_moe fusion to handle gpt's late softmax (#16656)	2 месяцев назад
Ruben Ortlam	bcf5bda6f5 Vulkan MMQ Integer Dot Refactor and K-Quant support (#16536)	2 месяцев назад
Max Krasnyansky	3eb2be1ca5 Hexagon Op queue & dispatch optimizations (#16820)	2 месяцев назад
Aman Gupta	e41bcce8f0 CUDA: use fastdiv in set-rows (#16834)	2 месяцев назад
Sigbjørn Skjæret	144a4ce824 vendor : sync minja (#16500)	2 месяцев назад
Jeff Bolz	f549b0007d vulkan: Call ggml_vk_buffer_write_2d from ggml_vk_buffer_copy (#16793)	2 месяцев назад
Aman Gupta	9a3ea685b9 CUDA: Fix bug in topk-moe for gpt-oss (#16821)	2 месяцев назад
YaelLogic	338074c383 sycl: add RMS_NORM_BACK operation support (#16808)	2 месяцев назад
YaelGitAccount	851553ea6b cuda: add SET operation support (#16804)	2 месяцев назад
Georgi Gerganov	85a7d8677b memory : remove KV cache size padding (#16812)	2 месяцев назад
Georgi Gerganov	a8ca18b4b8 llama-bench : clarify benchmarked parts of the computation (#16823)	2 месяцев назад
l3utterfly	8284efc35c initialise buffer.device in ggml_hexagon_session (#16816)	2 месяцев назад
Sam Malayek	1c1409e131 embedding: add raw option for --embd-output-format (#16541)	2 месяцев назад
Johannes Gäßler	7a0e900e36 llama: consistent ctx <-> buf order for KV cache (#16746)	2 месяцев назад
Aldehir Rojas	280d97be96 grammar : support array references in json schema (#16792)	2 месяцев назад
Chenguang Li	3479efd112 CANN: Improve device ID handling and aclnnArange checks (#16752)	2 месяцев назад
Aman Gupta	463bbf20bf CUDA: add unused vars to mmvf and mmvq (#16807)	2 месяцев назад
tamarPal	ad8d36beff sycl: add SSM_CONV operation support (#16800)	2 месяцев назад
Yuri Khrustalev	c053e18a66 chat: Add LFM2 tool handling (#16763)	2 месяцев назад
Xuan-Son Nguyen	e1ab084803 mtmd : fix idefics3 preprocessing (#16806)	2 месяцев назад
Diego Devesa	5a4ff43e7d llama : disable pipeline parallelism if compute buffer allocation fails (#16748)	2 месяцев назад
Acly	10640e31aa ggml : fix interpolate with align-corners and ne=1 (#16700)	2 месяцев назад
Johannes Gäßler	80d28f104c HIP: fix AMDGPU_TARGETS, update documentation (#16803)	2 месяцев назад

Новее Раньше

История коммитов Найти

История коммитов