Pavels Zaicenkovs
|
dbed61294a
vulkan: add LOG operation support for F32 and F16 (#17183)
|
před 2 měsíci |
Ruben Ortlam
|
80deff3648
vulkan: fix MMQ quantize_y condition (#17301)
|
před 2 měsíci |
Eve
|
8b1c339bd2
ci : revert #16249 (#17303)
|
před 2 měsíci |
Georgi Gerganov
|
416e7c7f47
metal : remove obosolete asserts (#17295)
|
před 2 měsíci |
Georgi Gerganov
|
5b2093becc
server : handle context overflow during decode (#17267)
|
před 2 měsíci |
lhez
|
52e5d421f1
opencl: fix rms_norm_mul (#17250)
|
před 2 měsíci |
shaofeiqi
|
4db5641210
opencl: add kernel to handle mat mul in attention to improve encoding speed (#17181)
|
před 2 měsíci |
shani-f
|
72bd7321a7
sycl : unify unary kernels with a generic implementation and enable wide operator support (#17213)
|
před 2 měsíci |
Aleksander Grygier
|
22e1ce2f81
webui: Fix clickability around chat processing statistics UI (#17278)
|
před 2 měsíci |
Pascal
|
1411d9275a
webui: add OAI-Compat Harmony tool-call streaming visualization and persistence in chat UI (#16618)
|
před 2 měsíci |
Sigbjørn Skjæret
|
662192e1dc
convert : remove unnecessary chat template patching (#17289)
|
před 2 měsíci |
Jeff Bolz
|
24dc769f1b
vulkan: Fuse mul_mat_id+add_id+mul and mul_mat+add+add. (#17287)
|
před 2 měsíci |
Ruben Ortlam
|
4dca015b7e
vulkan: Replace 16-bit unpack8 calls to work around legacy Windows AMD driver bug (#17285)
|
před 2 měsíci |
Sigbjørn Skjæret
|
9a8860cf5d
convert : use all parts in safetensors index (#17286)
|
před 2 měsíci |
Sigbjørn Skjæret
|
9d3ef4809f
convert : set expert gating func in base class (#17279)
|
před 2 měsíci |
Ankur Verma
|
c7b7db0445
mtmd-cli: Avoid logging to stdout for model loading messages in mtmd-cli (#17277)
|
před 2 měsíci |
Giuseppe Scrivano
|
1568d13c2c
vulkan: implement ABS and NEG (#17245)
|
před 2 měsíci |
Jeff Bolz
|
439342ea0b
vulkan: Use ggml_vk_tensor_subbuffer in mul_mat_vec(id) paths (#17244)
|
před 2 měsíci |
Jeff Bolz
|
234ae7d7bd
vulkan: skip all-negative-inf blocks in FA (#17186)
|
před 2 měsíci |
Jeff Bolz
|
38eaf32af1
vulkan: change graph_compute to be async and enable get_tensor_async (#17158)
|
před 2 měsíci |
Xuan-Son Nguyen
|
9b17d74ab7
mtmd: add mtmd_log_set (#17268)
|
před 2 měsíci |
Bartowski
|
e1fcf8b09b
model : add AfmoeForCausalLM support (#16477)
|
před 2 měsíci |
Marek Hradil jr.
|
6cd0cf72ce
fix : Dangling pointer for non-empty trigger words in lazy grammar construction (#17048)
|
před 2 měsíci |
Georgi Gerganov
|
d396b43748
server : fix "can batch with" bug (#17263)
|
před 2 měsíci |
Georgi Gerganov
|
45c6ef7307
metal : support argsort for ne00 > 1024 (#17247)
|
před 2 měsíci |
Georgi Gerganov
|
2606b0adab
metal : make the FA extra sizes consistent (#17143)
|
před 2 měsíci |
ixgbe
|
307772fcda
readme : add RVV,ZVFH,ZFH,ZICBOP support for RISC-V (#17259)
|
před 2 měsíci |
Aleksander Grygier
|
f1bad23f88
Better UX for handling multiple attachments in WebUI (#17246)
|
před 2 měsíci |
Alberto Cabrera Pérez
|
becc4816dd
ggml-cpu: handle 3d tensors in repack mat_mul (#17241)
|
před 2 měsíci |
Xuan-Son Nguyen
|
c4abcb2457
server: fixing naming conflict res_error (#17243)
|
před 2 měsíci |