Sigbjørn Skjæret
|
2a13180100
model-loader : support bool array sliding window pattern (#18850)
|
пре 2 недеља |
Adrien Gallouët
|
ec997b4f2b
tests : download models only when running ctest (#18843)
|
пре 2 недеља |
Max Krasnyansky
|
cff777f226
hexagon: support for OP_CPY, host buffers now optional, hvx-utils refactoring and optimizations (#18822)
|
пре 2 недеља |
Oliver Simons
|
36f0132464
CUDA: Factor out and re-use `block_reduce` function (#18785)
|
пре 2 недеља |
Piotr Wilkin (ilintar)
|
d98b548120
Restore clip's cb() to its rightful glory - extract common debugging elements in llama (#17914)
|
пре 2 недеља |
Junwon Hwang
|
8fb7175576
model : clean up and fix EXAONE-MoE configuration (#18840)
|
пре 2 недеља |
Adrien Gallouët
|
516a4ca9b5
refactor : remove libcurl, use OpenSSL when available (#18828)
|
пре 2 недеља |
Jeff Bolz
|
3e4bb29666
vulkan: Check maxStorageBufferRange in supports_op (#18709)
|
пре 2 недеља |
Aman Gupta
|
47f9612492
llama-model: fix unfortunate typo (#18832)
|
пре 2 недеља |
Daniel Bevenius
|
01cbdfd7eb
CUDA : fix typo in clang pragma comment [no ci] (#18830)
|
пре 2 недеља |
Ruben Ortlam
|
635ef78ec5
vulkan: work around Intel fp16 bug in mmq (#18814)
|
пре 2 недеља |
Perry Naseck
|
7d587e5544
ggml-metal: do not copy headers for embedded, use current binary dir for embedded (#18705)
|
пре 2 недеља |
Daniel Benjaminsson
|
d34aa07193
mmap: add Haiku support by skipping RLIMIT_MEMLOCK check (#18819)
|
пре 2 недеља |
Adrien Gallouët
|
f709c7a33f
ci, tests : use cmake to download models and remove libcurl dependency (#18791)
|
пре 2 недеља |
ddh0
|
6e36299b47
llama : print_info alignment fix (#18708)
|
пре 2 недеља |
Junwon Hwang
|
60591f01d4
model : add EXAONE MoE (#18543)
|
пре 2 недеља |
Georgi Gerganov
|
e4832e3ae4
vocab : fix attribute overrides for harmony (#18806)
|
пре 2 недеља |
Ruben Ortlam
|
960e5e3b46
llama-mmap: fix direct-io loading fallback EOF exception (#18801)
|
пре 2 недеља |
Daniel Bevenius
|
20ca2e12c4
model-conversion : remove -c 0 from model card template [no ci] (#18807)
|
пре 2 недеља |
yulo
|
ea4a321f2a
HIP: add fattn-mma-f16 for RDNA4 (#18481)
|
пре 2 недеља |
Johannes Gäßler
|
c1e79e610f
doc: ban AI-generated PR descriptions [no ci] (#18765)
|
пре 2 недеља |
Xuan-Son Nguyen
|
e047f9ee9d
mtmd: fix use_non_causal being reported incorrectly (#18793)
|
пре 2 недеља |
Georgi Gerganov
|
0a57271ab6
CUDA : fix unused argument when USE_CUDA_GRAPH=OFF (#18800)
|
пре 2 недеља |
Gabe Goodhart
|
076b0faf7d
graph : clean up t5 input builders (#18795)
|
пре 2 недеља |
Ruben Ortlam
|
db79dc06b1
llama-bench: add direct_io parameter (#18778)
|
пре 2 недеља |
Adrien Gallouët
|
537d4240d4
ci : remove libcurl in releases (#18775)
|
пре 2 недеља |
Radoslav Gerganov
|
bcf7546160
server : add arg for disabling prompt caching (#18776)
|
пре 2 недеља |
Adrien Gallouët
|
36c5913c45
ci : use openssl for openEuler-latest-cmake-cann (#18779)
|
пре 2 недеља |
Adrien Gallouët
|
8e649571cd
vendor : update cpp-httplib to 0.30.1 (#18771)
|
пре 2 недеља |
Daniel Bevenius
|
4150da9a95
examples : add --kv-unified to batched example (#18774)
|
пре 2 недеља |