thom-dev-fr
|
79456a690a
readme : update UIs (#18751)
|
пре 2 недеља |
Xuan-Son Nguyen
|
28068af789
security: narrow down the scope of what we consider a vulnerability (#18752)
|
пре 2 недеља |
shaofeiqi
|
707cbafcaa
opencl: add SOFTPLUS op support (#18726)
|
пре 2 недеља |
Aman Gupta
|
b137718878
test-backend-ops: fix mxfp4 tests on blackwell (#18736)
|
пре 2 недеља |
Johannes Gäßler
|
d2ff4e23ac
HIP: adjust RDNA3.5 MMQ kernel selction logic (#18666)
|
пре 2 недеља |
Perry Naseck
|
657a2e644b
cmake : update blas logic (#18205)
|
пре 2 недеља |
Georgi Gerganov
|
f307926482
server : adjust unified KV cache tests (#18716)
|
пре 2 недеља |
Sigbjørn Skjæret
|
7fdc8c893d
scripts : follow api redirects in pr2wt.sh (#18739)
|
пре 2 недеља |
Xuan-Son Nguyen
|
23f82f2420
preset: allow named remote preset (#18728)
|
пре 2 недеља |
Aaron Teo
|
2656c0d265
docs(ggml): update backend ops (#18734)
|
пре 2 недеља |
Michael Wand
|
600a366478
Corrected: changed s13 = src1->nb[3] instead of nb[2] (#18724)
|
пре 2 недеља |
Adrien Gallouët
|
ea23c15990
common : add --license to display embedded licenses (#18696)
|
пре 2 недеља |
Xuan-Son Nguyen
|
9ac2693a30
server: fix n_cmpl not skipping processing prompt (#18663)
|
пре 2 недеља |
Simranjeet Singh
|
a61c8bc3bf
mtmd: Add Gemma3n multimodal support with MobileNetV5 vision encoder (#18256)
|
пре 2 недеља |
shaofeiqi
|
593da7fa49
opencl: add EXPM1 op (#18704)
|
пре 2 недеља |
Reese Levine
|
9e41884dce
Updates to webgpu get_memory (#18707)
|
пре 2 недеља |
Pascal
|
ec8fd7876b
Webui/file upload (#18694)
|
пре 2 недеља |
Asbjørn Olling
|
a180ba78c7
cmake: only build cli when server is enabled (#18670)
|
пре 2 недеља |
Georgi Gerganov
|
53eb9435da
server : fix timing of prompt/generation (#18713)
|
пре 2 недеља |
Georgi Gerganov
|
d3435efc8a
scripts : pr2wt.sh reset to remote head (#18695)
|
пре 2 недеља |
Georgi Gerganov
|
f5f8812f7c
server : use different seeds for child completions (#18700)
|
пре 2 недеља |
Xuan-Son Nguyen
|
8ece3836b4
common: support remote preset (#18520)
|
пре 2 недеља |
Aaron Teo
|
046d5fd44e
llama: use host memory if device reports 0 memory (#18587)
|
пре 2 недеља |
Masashi Yoshimura
|
480160d472
ggml-webgpu: Fix GGML_MEM_ALIGN to 8 for emscripten. (#18628)
|
пре 2 недеља |
Reese Levine
|
15bff84bf5
ggml webgpu: initial flashattention implementation (#18610)
|
пре 2 недеља |
Jeff Bolz
|
2524c26164
vulkan: fix push constant size for quantize_q8_1 (#18687)
|
пре 2 недеља |
Jeff Bolz
|
cb14b06995
vulkan: optimize ssm_scan (#18630)
|
пре 2 недеља |
Adrien Gallouët
|
55abc39355
vendor : update cpp-httplib to 0.30.0 (#18660)
|
пре 2 недеља |
Georgi Gerganov
|
f2f6c88067
scripts : support chaining commands in pr2wt.sh (#18671)
|
пре 2 недеља |
도로로도로또
|
945bf10627
metal : add MoE kernel specialization for ne20=5 (#18667)
|
пре 2 недеља |