cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
Nick	9c55e5c5c2 fix: check model pointer validity before use (#13631)	před 8 měsíci
Chenguang Li	33d7aed4a8 CANN: Support MOE Model MUL_MAT_ID (#13042)	před 8 měsíci
Isaac McFadyen	6a2bc8bfb7 server : added --no-prefill-assistant flag (#13608)	před 8 měsíci
Gilad S.	e3a7cf6c5b cmake: use the current build config for vulkan-shaders-gen (#13595)	před 8 měsíci
Georgi Gerganov	518329b2d4 parallel : add option for non-shared and larger prompts (#13598)	před 8 měsíci
Jeff Bolz	2f5a4e1e09 vulkan: move common FA code to flash_attn_base.comp (#13556)	před 8 měsíci
Jeff Bolz	4f41ee11d6 vulkan: use scalar FA rather than coopmat2 when N==1 (#13554)	před 8 měsíci
Z	3e0be1cace llguidance : official v0.7.20 release (no actual changes) [noci] (#13594)	před 8 měsíci
Xuan-Son Nguyen	6aa892ec2a server : do not return error out of context (with ctx shift disabled) (#13577)	před 8 měsíci
Xuan-Son Nguyen	aea9f8b4e7 webui : improve accessibility for visually impaired people (#13551)	před 8 měsíci
Xuan-Son Nguyen	06c1e4abc1 readme : add list of dependencies and their license (#13591)	před 8 měsíci
Diego Devesa	415e40a357 releases : use arm version of curl for arm releases (#13592)	před 8 měsíci
Georgi Gerganov	654a67794f metal : add FA-vec kernel for head size 64 (#13583)	před 8 měsíci
Diego Devesa	5364ae4ba5 llama : print hint when loading a model when no backends are loaded (#13589)	před 8 měsíci
Sigbjørn Skjæret	7c07ac244d ci : add ppc64el to build-linux-cross (#13575)	před 8 měsíci
Łukasz Ślusarczyk	0a338ed013 sycl : fixed compilation warnings (#13582)	před 8 měsíci
Olivier Chafik	bc098c3cf0 minja: sync (qwen3) (#13573)	před 8 měsíci
Diego Devesa	c6a2c9e741 gguf : use ggml log system (#13571)	před 8 měsíci
Daniel Tang	07ad2b6db3 gguf-py : fix disconnect-before-connect in editor-gui (#13569)	před 8 měsíci
Xuan-Son Nguyen	c531edfa34 convert : fix conversion for llama 4 (#13567)	před 8 měsíci
Atharva Dubey	02cdd2d8b0 sycl: simplify bin_bcast_kernel (#13383)	před 8 měsíci
Svetlozar Georgiev	64bb51cf90 sycl: reordered Q4_K MMVQ (#13109)	před 8 měsíci
Łukasz Ślusarczyk	9c404ed54c sycl: use oneDNN for matrices multiplication (#12972)	před 8 měsíci
Diego Devesa	6c8b91500e llama-bench : fix -ot with dl backends (#13563)	před 8 měsíci
Xuan-Son Nguyen	3cc1f1f1d2 webui : handle PDF input (as text or image) + convert pasted long content to file (#13562)	před 8 měsíci
Piotr Wilkin (ilintar)	c753d7bed0 server : proper error handling for missing elements in messages array (OpenAI compatible backend) (#13540)	před 8 měsíci
Georgi Gerganov	b2838049cc bench : handle decode errors (#13548)	před 8 měsíci
Olivier Chafik	aa48e373f2 `server`: inject date_string in llama 3.x template + fix date for firefunction v2 (#12802)	před 8 měsíci
Georgi Gerganov	e3a9421b78 kv-cache : fix out-of-bounds view during reserve graph (#13547)	před 8 měsíci
Yibo Cai	5ab5d5fb25 arm64: optimize q6_k_q8_k kernel with i8mm (#13519)	před 8 měsíci

Novější Starší

Historie revizí Hledat

Historie revizí