cturan/llama.cpp

Автор	SHA1 Сообщение	Дата
Gabe Goodhart	5886f4f545 examples(gguf): GGUF example outputs (#17025)	2 месяцев назад
Xuan-Son Nguyen	92bb84f775 mtmd: allow QwenVL to process larger image by default (#17020)	2 месяцев назад
Georgi Gerganov	13b339bcd9 server : do not default to multiple slots with speculative decoding (#17017)	2 месяцев назад
Xuan-Son Nguyen	2f0c2db43e mtmd: improve struct initialization (#16981)	2 месяцев назад
손희준	fd2f84f468 docs: Clarify the endpoint that webui uses (#17001)	2 месяцев назад
Li Pengzhan	9f052478c2 model : add openPangu-Embedded (#16941)	2 месяцев назад
Reese Levine	03ea04175d ggml webgpu: minor set rows optimization (#16810)	2 месяцев назад
Georgi Gerganov	cdabeb2c27 sync : ggml	2 месяцев назад
Georgi Gerganov	852ce5180a ggml : fix conv2d_dw SVE path (ggml/1380)	2 месяцев назад
mnehete32	9aa63374f2 CUDA: update ops.md (#17005)	2 месяцев назад
lhez	5e90233bdb opencl: update doc (#17011)	2 месяцев назад
nullname	a5c07dcd7b refactor: replace sprintf with snprintf for safer string handling in dump functions (#16913)	2 месяцев назад
Jeff Bolz	ad51c0a720 vulkan: remove the need for the dryrun (#16826)	2 месяцев назад
Georgi Gerganov	66d8eccd42 server : do context shift only while generating (#17000)	2 месяцев назад
Georgi Gerganov	afd353246d readme : update hot topics (#17002)	2 месяцев назад
Acly	cc98f8d349 ggml-cpu : bicubic interpolation (#16891)	2 месяцев назад
Sigbjørn Skjæret	d945834366 ci : apply model label to models (#16994)	2 месяцев назад
Sigbjørn Skjæret	b164259bba chore : fix models indent after refactor (#16992)	2 месяцев назад
Noah	1f5accb8d0 Fix garbled output with REPACK at high thread counts (#16956)	2 месяцев назад
Aman Gupta	2759ccdb4a CUDA: avoid mul + bias fusion when doing fusion (#16935)	2 месяцев назад
lhez	c5023daf60 opencl: support imrope (#16914)	2 месяцев назад
Aleksander Grygier	e7da30b584 fix: Viewing multiple PDF attachments (#16974)	2 месяцев назад
Daniel Bevenius	ed8aa63320 model-conversion : pass config to from_pretrained (#16963)	2 месяцев назад
Georgi Gerganov	48bd26501b server : add props.model_alias (#16943)	2 месяцев назад
theo77186	622cd010ff ggml: CUDA: add head size 72 for flash-attn (#16962)	2 месяцев назад
Xuan-Son Nguyen	070ff4d535 mtmd: add --image-min/max-tokens (#16921)	2 месяцев назад
Xuan-Son Nguyen	bf7b0c9725 mtmd: pad mask for qwen2.5vl (#16954)	2 месяцев назад
Jinyang He	fcfce040e8 ggml : LoongArch fixes (#16958)	2 месяцев назад
Olivier Chafik	ee3a5a10ad sync: minja (glm 4.6 & minmax m2 templates) (#16949)	2 месяцев назад
shani-f	7e994168b1 SYCL: optimized repeat_back kernel (3× fewer asm instructions, 2× faster)Feature/sycl repeat back opt (#16869)	2 месяцев назад

Новее Раньше

История коммитов Найти

История коммитов