Sigbjørn Skjæret
|
a0535ffa0d
ggml : implement REGLU/GEGLU/SWIGLU ops (#14158)
|
před 6 měsíci |
Jeff Bolz
|
bd9c981d72
vulkan: Add fusion support for RMS_NORM+MUL (#14366)
|
před 6 měsíci |
Aman Gupta
|
27208bf657
CUDA: add bf16 and f32 support to cublas_mul_mat_batched (#14361)
|
před 6 měsíci |
Jeff Bolz
|
63a7bb3c7e
vulkan: handle noncontig in the final case of ggml_vk_get_cpy_pipeline (#14378)
|
před 6 měsíci |
Jeff Bolz
|
00d5282c7f
vulkan: lock accesses of pinned_memory vector (#14333)
|
před 6 měsíci |
Weizhao Ouyang
|
566c16fcce
model : add support for ERNIE 4.5 0.3B model (#14408)
|
před 6 měsíci |
Xinpeng Dou
|
b25e92774e
fix async_mode bug (#14432)
|
před 6 měsíci |
Sigbjørn Skjæret
|
6609507a91
ci : fix windows build and release (#14431)
|
před 6 měsíci |
Jeff Bolz
|
ceb1bf5a34
vulkan: Fix GGML_VULKAN_SHADER_DEBUG_INFO (#14427)
|
před 6 měsíci |
Georgi Gerganov
|
72babea5de
graph : make llm_graph_context destructor virtual (#14410)
|
před 6 měsíci |
Georgi Gerganov
|
43678060c1
recurrent : call balloc split_reset() in init_batch() (#14414)
|
před 6 měsíci |
Radoslav Gerganov
|
8d94219a4a
ggml : add ggml_set_rows (#14274)
|
před 6 měsíci |
Sigbjørn Skjæret
|
f667f1e624
convert : fix broken sentencepiece vocab (#14416)
|
před 6 měsíci |
Xuan-Son Nguyen
|
8846aace49
model : gemma3n text-only (#14400)
|
před 6 měsíci |
bandoti
|
a01047b041
cmake: regen vulkan shaders when shaders-gen sources change (#14398)
|
před 6 měsíci |
Sigbjørn Skjæret
|
b25346221d
llama : return mistral-v7-tekken as default template only (#14390)
|
před 6 měsíci |
Georgi Gerganov
|
e8215dbb96
metal : add special-case mat-vec mul for ne00 == 4 (#14385)
|
před 6 měsíci |
Georgi Gerganov
|
5783ae4359
metal : batch rows copy in a single threadgroup (#14384)
|
před 6 měsíci |
Aaron Teo
|
bf5bcd0b85
docs: update s390x documentation + add faq (#14389)
|
před 6 měsíci |
R0CKSTAR
|
716301d1b0
musa: enable fp16 mma (all) and cublas on qy2 (#13842)
|
před 6 měsíci |
Aaron Teo
|
60ef23d6c1
ggml-cpu: enable IBM NNPA Vector Intrinsics (#14317)
|
před 6 měsíci |
Sigbjørn Skjæret
|
b193d53069
ggml : do not output unprintable characters on GGUF load failure (#14381)
|
před 6 měsíci |
Anton Mitkov
|
2bf9d539dd
sycl: GGML_SYCL_DISABLE_OPT on by default for all Intel Devices (#13973)
|
před 6 měsíci |
lhez
|
73e53dc834
opencl: ref count `ggml_backend_opencl_context` and refactor profiling (#14254)
|
před 6 měsíci |
Georgi Gerganov
|
62af464227
batch : fix check for empty sequences in memory (#14364)
|
před 6 měsíci |
Mathieu Baudier
|
c148cf1946
cmake : use LLAMA_BUILD_NUMBER when defining LLAMA_INSTALL_VERSION (#14362)
|
před 6 měsíci |
Nigel Bosch
|
1b809cee22
server : move no API key doc to /health (#14352)
|
před 6 měsíci |
Sigbjørn Skjæret
|
abf241045d
main : honor --verbose-prompt on interactive prompts (#14350)
|
před 6 měsíci |
Bartowski
|
901e20bbe5
jinja : Add Mistral-Small-3.2-24B-Instruct-2506.jinja (#14349)
|
před 6 měsíci |
uvos
|
0142961a2e
CUDA/HIP: optimize mmv paths taken for HIP devices (#14324)
|
před 6 měsíci |