kiwi
|
749e0d27f0
mtmd : fix 32-bit narrowing issue in export-lora and mtmd clip (#14503)
|
před 5 měsíci |
Chris Rohlf
|
64bf1c3744
rpc : check for null buffers in get/set/copy tensor endpoints (#14868)
|
před 5 měsíci |
Diego Devesa
|
c12bbde372
sched : fix multiple evaluations of the same graph with pipeline parallelism (#14855)
|
před 5 měsíci |
R0CKSTAR
|
3f4fc97f1d
musa: upgrade musa sdk to rc4.2.0 (#14498)
|
před 5 měsíci |
Georgi Gerganov
|
2df255da3c
sync : ggml
|
před 5 měsíci |
Kai Pastor
|
60f816a79d
cmake : fix usage issues (ggml/1257)
|
před 5 měsíci |
Daniel Bevenius
|
5592f278b6
ggml-cpu : remove stdlib include from repack.cpp (ggml/1276)
|
před 5 měsíci |
Georgi Gerganov
|
e4868d16d2
context : perform output reorder lazily upon access after sync (#14853)
|
před 5 měsíci |
Xuan-Son Nguyen
|
820de57d4f
chat : fix kimi-k2 chat template (#14852)
|
před 5 měsíci |
Alberto Cabrera Pérez
|
cb4a63aad6
sycl: fixed semantics of block offset calculation (#14814)
|
před 5 měsíci |
yummy
|
86f5623d90
llama : fix MiniCPM inference after Granite Four changes (#14850)
|
před 5 měsíci |
Pouya
|
39cffdf188
docs: add libcurl-dev install hint for Linux distros (#14801)
|
před 5 měsíci |
Georgi Gerganov
|
065908cb09
metal : fix fusion across different encoders (#14849)
|
před 5 měsíci |
Donghyeon Jeong
|
4ec6291a24
sycl: fix undefined variable in work group size check (#14843)
|
před 5 měsíci |
jacekpoplawski
|
a12363bbf0
convert : text-only support for GLM-4.1V-9B-Thinking (#14823)
|
před 5 měsíci |
Johannes Gäßler
|
a86f52b285
CUDA: fix overflow in FA, tune performance (#14840)
|
před 5 měsíci |
Johannes Gäßler
|
b284197df4
CUDA: fix compilation with GGML_CUDA_F16 (#14837)
|
před 5 měsíci |
Sigbjørn Skjæret
|
221c0e0c58
ci : correct label refactor->refactoring (#14832)
|
před 5 měsíci |
Johannes Gäßler
|
07a19e27a2
CUDA: fix quantized KV cache + multiple sequences (#14822)
|
před 5 měsíci |
Georgi Gerganov
|
18f3b5ff9e
tests : add non-cont K,V FA tests
|
před 6 měsíci |
l3utterfly
|
7233358d29
memory : handle saving/loading null layers in recurrent memory (#14675)
|
před 5 měsíci |
lixing-star
|
6c88b3bb25
ggml: fix loongarch quantize_row_q8_1 error (#14827)
|
před 5 měsíci |
chen fan
|
14c28dfc50
CANN: weight format to NZ for Ascend310P3 (#14407)
|
před 5 měsíci |
Aman Gupta
|
8c988fa41d
CUDA: add fused rms norm (#14800)
|
před 5 měsíci |
Csaba Kecskemeti
|
acd6cb1c41
ggml : model card yaml tab->2xspace (#14819)
|
před 5 měsíci |
Jeff Bolz
|
84712b6043
vulkan: fix rms_norm_mul to handle broadcasting dim0 (#14817)
|
před 5 měsíci |
Molly Sophia
|
d4d1522b20
llama : add model type detection for rwkv7 7B&14B (#14816)
|
před 5 měsíci |
Ed Addario
|
d1aa0cc5d1
imatrix: add option to display importance score statistics for a given imatrix file (#12718)
|
před 5 měsíci |
stduhpf
|
c8ade30036
Mtmd: add a way to select device for vision encoder (#14236)
|
před 5 měsíci |
Sigbjørn Skjæret
|
e28c0b80c2
cuda : implement bf16 cpy ops and enable bf16 cont (#14763)
|
před 5 měsíci |