Georgi Gerganov
|
a8ca18b4b8
llama-bench : clarify benchmarked parts of the computation (#16823)
|
před 2 měsíci |
l3utterfly
|
8284efc35c
initialise buffer.device in ggml_hexagon_session (#16816)
|
před 2 měsíci |
Sam Malayek
|
1c1409e131
embedding: add raw option for --embd-output-format (#16541)
|
před 2 měsíci |
Johannes Gäßler
|
7a0e900e36
llama: consistent ctx <-> buf order for KV cache (#16746)
|
před 2 měsíci |
Aldehir Rojas
|
280d97be96
grammar : support array references in json schema (#16792)
|
před 2 měsíci |
Chenguang Li
|
3479efd112
CANN: Improve device ID handling and aclnnArange checks (#16752)
|
před 2 měsíci |
Aman Gupta
|
463bbf20bf
CUDA: add unused vars to mmvf and mmvq (#16807)
|
před 2 měsíci |
tamarPal
|
ad8d36beff
sycl: add SSM_CONV operation support (#16800)
|
před 2 měsíci |
Yuri Khrustalev
|
c053e18a66
chat: Add LFM2 tool handling (#16763)
|
před 2 měsíci |
Xuan-Son Nguyen
|
e1ab084803
mtmd : fix idefics3 preprocessing (#16806)
|
před 2 měsíci |
Diego Devesa
|
5a4ff43e7d
llama : disable pipeline parallelism if compute buffer allocation fails (#16748)
|
před 2 měsíci |
Acly
|
10640e31aa
ggml : fix interpolate with align-corners and ne=1 (#16700)
|
před 2 měsíci |
Johannes Gäßler
|
80d28f104c
HIP: fix AMDGPU_TARGETS, update documentation (#16803)
|
před 2 měsíci |
Xuan-Son Nguyen
|
c55d53acec
model : add LightOnOCR-1B model (#16764)
|
před 2 měsíci |
Johannes Gäßler
|
945501f5ea
llama: fix leaked buffers for mmap + split files (#16765)
|
před 2 měsíci |
Aman Gupta
|
75cbdd3fce
test-backend-ops: print failed tests at the end (#16785)
|
před 2 měsíci |
tamarPal
|
2b9bd9bf4e
sycl: add ROLL operation support (#16665)
|
před 2 měsíci |
shani-f
|
59fc1ec8e8
sycl: add REPEAT_BACK operation support (#16734)
|
před 2 měsíci |
Aman Gupta
|
75d33b9302
CUDA: support for weight clamp in top-k norm (#16702)
|
před 2 měsíci |
Acly
|
3470a5c891
ggml-alloc : make gallocr prefer chunks that allow memory reuse (#16788)
|
před 2 měsíci |
Sigbjørn Skjæret
|
bd562fe4f7
cuda : use fast copy when src and dst are of different type and contiguous (#16789)
|
před 2 měsíci |
leejet
|
bbac6a26b2
ggml: fix cuda kernel launch configuration for k_compute_batched_ptrs to support large batch (#16744)
|
před 2 měsíci |
Sigbjørn Skjæret
|
73a48c9790
convert : enable expert group selection for all models with it (#16691)
|
před 2 měsíci |
Sigbjørn Skjæret
|
f696428ce8
graph : add clamping to ffn_moe_weights_sum to avoid div-by-zero (#16655)
|
před 2 měsíci |
Sigbjørn Skjæret
|
7cce4f8158
model : set res->t_embd in SmallThinker models (#16782)
|
před 2 měsíci |
amirai21
|
8d8862829c
docs : add Jamba to Text-only models list (#16778)
|
před 2 měsíci |
Aman Gupta
|
f77c13b91f
CUDA: General GEMV fusion (#16715)
|
před 2 měsíci |
Gilad S.
|
3cfa9c3f12
vulkan: deduplicate Microsoft Direct3D12 devices (#16689)
|
před 2 měsíci |
Galunid
|
5d195f17bc
convert : handle mmproj filename/path properly (#16760)
|
před 2 měsíci |
Shunta Saito
|
226f295f4d
model : set res->t_embd in PLaMo2 models (#16766)
|
před 2 měsíci |