cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
Galunid	5d195f17bc convert : handle mmproj filename/path properly (#16760)	před 2 měsíci
Shunta Saito	226f295f4d model : set res->t_embd in PLaMo2 models (#16766)	před 3 měsíci
Giuseppe Scrivano	f90b4a8efe vulkan: delete dead code (#16732)	před 3 měsíci
Jeff Bolz	8423d01931 vulkan: Optimize SSM_SCAN (#16645)	před 3 měsíci
compilade	5cca2542ac convert : avoid dequantizing mxfp4 for GPT-OSS (#16756)	před 3 měsíci
leejet	55945d2ef5 ggml: fix CUDA grid launch condition for large block_nums.y in binbcast (#16742)	před 3 měsíci
Aman Gupta	0bcb40b48c CUDA: use CUB for arbitary size argsort (#16754)	před 3 měsíci
Florian Badie	69e9ff0103 webui: support q URL parameter (#16728)	před 3 měsíci
Daniel Bevenius	5a91109a5d model-conversion : add trust_remote_code for orig model run [no ci] (#16751)	před 3 měsíci
compilade	f8f071fadd convert : handle pre-quantized models (#14810)	před 3 měsíci
Johannes Gäßler	0bf47a1dbb server: add memory breakdown print (#16740)	před 3 měsíci
Julien Denize	dd62dcfab9 convert : Make mistral-common dependency optional (#16738)	před 3 měsíci
Xuan-Son Nguyen	d0660f237a mtmd-cli : allow using --jinja (#16718)	před 3 měsíci
Prajwal B Mehendarkar	fe6a9882ac Manually link -lbsd to resolve flock symbol on AIX (#16610)	před 3 měsíci
Aman Gupta	061f0eff02 ggml-cuda: use passed ops instead of hardcoded ops (#16712)	před 3 měsíci
matteo	8cf6b42d46 server : send partial stop string when <EOG> is reached (#15007)	před 3 měsíci
Matthew Michel	9de9672adb sycl: use async memory allocation to fix crashes during graph recording (#16644)	před 3 měsíci
Max Krasnyansky	63d2fc46e1 Add experimental ggml-hexagon backend for the Hexagon NPU (#16547)	před 3 měsíci
Diego Devesa	a2e0088d92 Revert "ggml : Leverage the existing GGML_F32_VEC helpers to vectorize ggml_v…" (#16723)	před 3 měsíci
Pascal	9b9201f65a webui: introduce OpenAI-compatible model selector in JSON payload (#16562)	před 3 měsíci
sirus20x6	19a5a3edfd ggml : Leverage the existing GGML_F32_VEC helpers to vectorize ggml_vec_set_f32 for faster fills (#16522)	před 3 měsíci
Acly	d8eaa26e4d tests : fix test-thread-safety when compiling with multiple backends (#16699)	před 3 měsíci
Aman Gupta	9285325ce0 CUDA: fix bug in topk-moe softmax (#16711)	před 3 měsíci
Aman Gupta	03792ad936 CUDA: topk-moe: add optional parameter for gpt-oss (#16649)	před 3 měsíci
Johannes Gäßler	51d1a8c997 CUDA: better error for FA kernel with 0 occupancy (#16643)	před 3 měsíci
Aman Gupta	4926419c4d ggml: add ggml_can_fuse_subgraph (#16662)	před 3 měsíci
lhez	6ea37f5739 opencl: fix warnings and clean up profiling (#16688)	před 3 měsíci
Jeff Bolz	fb349848f3 vulkan: Handle FA with all -inf mask values (#16447)	před 3 měsíci
YehuditE	6de8ed7519 sycl : add PAD_REFLECT_D1 operator support (#16145)	před 3 měsíci
Sigbjørn Skjæret	84bf3c6778 model : add BailingMoeV2 support (#16063)	před 3 měsíci

Novější Starší

Historie revizí Hledat

Historie revizí