cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
Georgi Gerganov	a8ca18b4b8 llama-bench : clarify benchmarked parts of the computation (#16823)	před 2 měsíci
l3utterfly	8284efc35c initialise buffer.device in ggml_hexagon_session (#16816)	před 2 měsíci
Sam Malayek	1c1409e131 embedding: add raw option for --embd-output-format (#16541)	před 2 měsíci
Johannes Gäßler	7a0e900e36 llama: consistent ctx <-> buf order for KV cache (#16746)	před 2 měsíci
Aldehir Rojas	280d97be96 grammar : support array references in json schema (#16792)	před 2 měsíci
Chenguang Li	3479efd112 CANN: Improve device ID handling and aclnnArange checks (#16752)	před 2 měsíci
Aman Gupta	463bbf20bf CUDA: add unused vars to mmvf and mmvq (#16807)	před 2 měsíci
tamarPal	ad8d36beff sycl: add SSM_CONV operation support (#16800)	před 2 měsíci
Yuri Khrustalev	c053e18a66 chat: Add LFM2 tool handling (#16763)	před 2 měsíci
Xuan-Son Nguyen	e1ab084803 mtmd : fix idefics3 preprocessing (#16806)	před 2 měsíci
Diego Devesa	5a4ff43e7d llama : disable pipeline parallelism if compute buffer allocation fails (#16748)	před 2 měsíci
Acly	10640e31aa ggml : fix interpolate with align-corners and ne=1 (#16700)	před 2 měsíci
Johannes Gäßler	80d28f104c HIP: fix AMDGPU_TARGETS, update documentation (#16803)	před 2 měsíci
Xuan-Son Nguyen	c55d53acec model : add LightOnOCR-1B model (#16764)	před 2 měsíci
Johannes Gäßler	945501f5ea llama: fix leaked buffers for mmap + split files (#16765)	před 2 měsíci
Aman Gupta	75cbdd3fce test-backend-ops: print failed tests at the end (#16785)	před 2 měsíci
tamarPal	2b9bd9bf4e sycl: add ROLL operation support (#16665)	před 2 měsíci
shani-f	59fc1ec8e8 sycl: add REPEAT_BACK operation support (#16734)	před 2 měsíci
Aman Gupta	75d33b9302 CUDA: support for weight clamp in top-k norm (#16702)	před 2 měsíci
Acly	3470a5c891 ggml-alloc : make gallocr prefer chunks that allow memory reuse (#16788)	před 2 měsíci
Sigbjørn Skjæret	bd562fe4f7 cuda : use fast copy when src and dst are of different type and contiguous (#16789)	před 2 měsíci
leejet	bbac6a26b2 ggml: fix cuda kernel launch configuration for k_compute_batched_ptrs to support large batch (#16744)	před 2 měsíci
Sigbjørn Skjæret	73a48c9790 convert : enable expert group selection for all models with it (#16691)	před 2 měsíci
Sigbjørn Skjæret	f696428ce8 graph : add clamping to ffn_moe_weights_sum to avoid div-by-zero (#16655)	před 2 měsíci
Sigbjørn Skjæret	7cce4f8158 model : set res->t_embd in SmallThinker models (#16782)	před 2 měsíci
amirai21	8d8862829c docs : add Jamba to Text-only models list (#16778)	před 2 měsíci
Aman Gupta	f77c13b91f CUDA: General GEMV fusion (#16715)	před 2 měsíci
Gilad S.	3cfa9c3f12 vulkan: deduplicate Microsoft Direct3D12 devices (#16689)	před 2 měsíci
Galunid	5d195f17bc convert : handle mmproj filename/path properly (#16760)	před 2 měsíci
Shunta Saito	226f295f4d model : set res->t_embd in PLaMo2 models (#16766)	před 2 měsíci

Novější Starší

Historie revizí Hledat

Historie revizí