Jeff Bolz
|
a0552c8bee
vulkan: Add env var to disable host visible vidmem (#15109)
|
před 5 měsíci |
RunningLeon
|
99acbc9921
llama : Support intern-s1 (#14875)
|
před 5 měsíci |
uvos
|
7ad67ba9fe
HIP: add cmake option to enable compiler output of kernel resource usage metrics (#15103)
|
před 5 měsíci |
Christian Kastner
|
9a96389544
ggml: Skip backend library linking code when GGML_BACKEND_DL=ON (#15094)
|
před 5 měsíci |
Johannes Gäßler
|
1d72c84188
CUDA: GEMM for FP32/FP16/BF16 and ne11 <= 16 (#15131)
|
před 5 měsíci |
Johannes Gäßler
|
20638e4f16
scripts: fix crash when --tool is not set (#15133)
|
před 5 měsíci |
Daniel Bevenius
|
36d3f00e14
requirements : fix PyTorch uint64 compatibility (#15134)
|
před 5 měsíci |
Reese Levine
|
5fd160bbd9
ggml: Add basic SET_ROWS support in WebGPU (#15137)
|
před 5 měsíci |
rmatif
|
756cfea826
fix profiling crash (#15072)
|
před 5 měsíci |
lhez
|
e725a1a982
opencl: add `swiglu_oai` and `add_id` (#15121)
|
před 5 měsíci |
Sachin Desai
|
3db4da56a5
chat : support Granite model reasoning and tool call (#14864)
|
před 5 měsíci |
Juk Armstrong
|
476aa3fd57
Fixed name `-override-tensors` to `-override-tensor` (#15129)
|
před 5 měsíci |
Diego Devesa
|
0d8831543c
ggml : fix fallback to CPU for ununsupported ops (#15118)
|
před 5 měsíci |
Sigbjørn Skjæret
|
65c797c4fa
chat : fix yandex chat template (#15116)
|
před 5 měsíci |
stevenkuang
|
25726898e8
chat : fix hunyuan auto-detection (#15114)
|
před 5 měsíci |
Chenguang Li
|
2241453252
CANN: add support for ACL Graph (#15065)
|
před 5 měsíci |
Reese Levine
|
9515c6131a
ggml: WebGPU disable SET_ROWS for now (#15078)
|
před 5 měsíci |
Georgi Gerganov
|
fd1234cb46
llama : add gpt-oss (#15091)
|
před 5 měsíci |
Sigbjørn Skjæret
|
f324a3b715
chat : only remove double bos/eos if added (#15086)
|
před 5 měsíci |
Georgi Gerganov
|
be42642581
readme : update hot topics (#15097)
|
před 5 měsíci |
Romain Biessy
|
3306ceabf0
sycl: fix mul_mat selection (#15092)
|
před 5 měsíci |
Juk Armstrong
|
c81de6e107
Fix `glm4moe` bug (#15088)
|
před 5 měsíci |
Alex Wu
|
22f060c9c4
webui: fix markdown table (#15081)
|
před 5 měsíci |
compilade
|
ee3a9fcf88
context : fix index overflow on huge outputs (#15080)
|
před 5 měsíci |
Diego Devesa
|
ec428b02c3
llama : add --n-cpu-moe option (#15077)
|
před 5 měsíci |
compilade
|
19f68fa5a4
imatrix : warn when GGUF imatrix is saved without .gguf suffix (#15076)
|
před 5 měsíci |
Christian Kastner
|
41613437ff
cmake: Add GGML_BACKEND_DIR option (#15074)
|
před 5 měsíci |
Sigbjørn Skjæret
|
e5bebe5251
gguf-py : add --chat-template-file to gguf_new_metadata (#15075)
|
před 5 měsíci |
Sam
|
ef0144c087
model: support GLM 4.5 family of models (#14939)
|
před 5 měsíci |
Sigbjørn Skjæret
|
2721257e3e
quantize : fix confusing error message if ftype is invalid (#15071)
|
před 5 měsíci |