Xuan-Son Nguyen
|
edb18b6e8f
clip : fix pixtral on some GPU backends (#13097)
|
8 månader sedan |
Neo Zhang Jianyu
|
514c45608f
change the reorder tensor from init to execute OP (#13003)
|
8 månader sedan |
Radoslav Gerganov
|
553a5c3a9f
rpc : do not wait for response when sending RPC_CMD_SET_TENSOR (#12943)
|
8 månader sedan |
Xuan-Son Nguyen
|
13be08daf9
clip : remove boi/eoi embeddings for GLM-edge model (#13081)
|
8 månader sedan |
Georgi Gerganov
|
226251ed56
embeddings : fix batch sizes (#13076)
|
8 månader sedan |
Georgi Gerganov
|
87616f0680
ggml : fix trailing whitespaces (#0)
|
8 månader sedan |
Georgi Gerganov
|
63b4911494
sync : ggml
|
8 månader sedan |
Acly
|
c6e8cc28c1
ggml : Depthwise 2D convolution (ggml/1152)
|
9 månader sedan |
Johannes Gäßler
|
b10d8bfdb1
CUDA: use switch statements in constexpr functions (#13095)
|
8 månader sedan |
Georgi Gerganov
|
13b4548877
cmake : do not include ./src as public for libllama (#13062)
|
8 månader sedan |
Georgi Gerganov
|
572b3141d3
clang-tidy : disable warning about missing math parenthesis (#13091)
|
8 månader sedan |
Xuan-Son Nguyen
|
7c727fbe39
arg : add --no-mmproj-offload (#13093)
|
8 månader sedan |
Xuan-Son Nguyen
|
80982e815e
arg : clean up handling --mmproj with -hf (#13082)
|
8 månader sedan |
Georgi Gerganov
|
7604a7d6b8
metal : fix floating-point range of attention scores in FA kernels (#13090)
|
8 månader sedan |
Eve
|
b3b6d862cf
vulkan: matmul gcn tuning (#13016)
|
8 månader sedan |
pl752
|
5630406959
llama-mtmd-cli: Sigint rework in mtmd vision example (#13080)
|
9 månader sedan |
Xuan-Son Nguyen
|
ecda2ec4b3
mtmd : Support Pixtral 12B (#13065)
|
9 månader sedan |
piDack
|
eb1776b15a
convert : Append mult-eos,half-rope,bos to GLM4-0414 and Z (#13021)
|
9 månader sedan |
Radoslav Gerganov
|
2cca6c01e4
rpc : add command line option for number of threads for the CPU backend (#13060)
|
9 månader sedan |
Johannes Gäßler
|
658987cfc9
CUDA: noncont MMVQ + batched bs1 MUL_MAT_ID (#13014)
|
9 månader sedan |
Xuan-Son Nguyen
|
dc39a5e7a8
mtmd : support SmolVLM (version 1 and 2) (#13050)
|
9 månader sedan |
Georgi Gerganov
|
ab47dec3d3
security : add note about RPC and server functionality (#13061)
|
9 månader sedan |
Georgi Gerganov
|
7b53389c24
metal : add memory pool for temp allocs (#12850)
|
9 månader sedan |
Xuan-Son Nguyen
|
243453533e
llava : update documentations (#13055)
|
9 månader sedan |
Diego Devesa
|
1d735c0b4f
ggml : add SSE 4.2 and x64 base variant for CPUs without AVX (#12871)
|
9 månader sedan |
Akarshan Biswas
|
5368ddda7a
SYCL: Add non-contiguous support in ROPE (#12993)
|
9 månader sedan |
Xuan-Son Nguyen
|
84a9bf2fc2
mtmd : merge llava, gemma3 and minicpmv CLI into single `llama-mtmd-cli` (#13012)
|
9 månader sedan |
Xuan-Son Nguyen
|
2016f07bd1
convert : experimental support for `--mmproj` flag (#13023)
|
9 månader sedan |
Jeffrey Morgan
|
6602304814
llava: fix errors in clip.h on certain compilers (#13030)
|
9 månader sedan |
Jeff Bolz
|
66168204be
vulkan: support noncontiguous rms_norm (#13031)
|
9 månader sedan |