Diego Devesa
|
d7a14c42a1
build : fix build info on windows (#13239)
|
před 8 měsíci |
Loïc Carrère
|
b6e4ff69b8
clip : (minicpmv) Re-enable upscaling of images smaller than the CLIP image size (#13237)
|
před 8 měsíci |
matteo
|
e0f572c846
llama-chat : update GLM4 chat template (#13238)
|
před 8 měsíci |
Jeff Bolz
|
79f26e9e12
vulkan: Add bfloat16 support (#12554)
|
před 8 měsíci |
Jeff Bolz
|
fc727bcdd5
vulkan: Handle src1 batch dimension in non-contiguous mat-vec-mul shader (#13191)
|
před 8 měsíci |
Johannes Gäßler
|
b0ecbd434b
test: non-cont. b in test-backend-ops -o MUL_MAT (#13187)
|
před 8 měsíci |
Georgi Gerganov
|
b1dd4d08e8
sync : ggml
|
před 8 měsíci |
Daniel Bevenius
|
99881f77d8
whisper : add check that target name exists (whisper/3103)
|
před 8 měsíci |
Daniel Bevenius
|
b5769d92b4
ggml : suppress Windows compiler warnings (whisper/3075)
|
před 8 měsíci |
Xuan-Son Nguyen
|
8936784f7a
mtmd : add **vision** support for Mistral Small 3.1 (#13231)
|
před 8 měsíci |
Xuan-Son Nguyen
|
13c9a3319b
arg : remove CURLINFO_EFFECTIVE_METHOD (#13228)
|
před 8 měsíci |
Jared Van Bortel
|
a70183eb00
llama-model : fix the reported size class for nomic-embed-text-v2-moe (#13223)
|
před 8 měsíci |
Georgi Gerganov
|
8d33d740c3
sync : ggml
|
před 8 měsíci |
Diego Devesa
|
4254bb4951
ggml : fix ggml_gallocr_ptr type (ggml/1205)
|
před 8 měsíci |
Georgi Gerganov
|
9998540149
cuda : fix unused variable compile warning (whisper/0)
|
před 8 měsíci |
Johannes Gäßler
|
e1e8e0991f
CUDA: batched+noncont MMQ, refactor bs>1 MoE code (#13199)
|
před 8 měsíci |
Xuan-Son Nguyen
|
6f67cf1f48
arg : -hf do not fail if url mismatch (#13219)
|
před 8 měsíci |
ddh0
|
16a457facd
fix typo: `n_ctx_pre_seq` -> `n_ctx_per_seq` (#13221)
|
před 8 měsíci |
Xuan-Son Nguyen
|
3e168bede4
convert : improve model arch handling (#13122)
|
před 8 měsíci |
Tatsuya Tanaka
|
ceda28ef8e
llava : remove duplicate include (#13207)
|
před 8 měsíci |
Olivier Chafik
|
3b127c7385
common : add -jf / --json-schema-file flag (#12011)
|
před 8 měsíci |
Jeff Bolz
|
e5007a5edf
vulkan: use uint array index to avoid glslang bug (#13193)
|
před 8 měsíci |
shalinib-ibm
|
416313773b
ggml : fix ppc64le build (#13176)
|
před 8 měsíci |
Xuan-Son Nguyen
|
07c2e2f76c
convert : correct typo image_mean --> image_std (#13208)
|
před 8 měsíci |
Aaron Teo
|
44cd8d91ff
feat(ggml-cpu): enable z17 compile (#13182)
|
před 8 měsíci |
Xuan-Son Nguyen
|
5933e6fdc9
arg : allow using -hf offline (#13202)
|
před 8 měsíci |
Xuan-Son Nguyen
|
da84c04d8f
docker : do not build tests (#13204)
|
před 8 měsíci |
xiaofei
|
a0f7016d17
rpc : fix cache directory initialization (#13188)
|
před 8 měsíci |
Johannes Gäßler
|
19e899ce21
scripts: n_depth for compare-llama-bench [no ci] (#13201)
|
před 8 měsíci |
matteo
|
e2e1ddb93a
server : Prefilling assistant message in openai compatible API (#13174)
|
před 8 měsíci |