Nick
|
9c55e5c5c2
fix: check model pointer validity before use (#13631)
|
před 8 měsíci |
Chenguang Li
|
33d7aed4a8
CANN: Support MOE Model MUL_MAT_ID (#13042)
|
před 8 měsíci |
Isaac McFadyen
|
6a2bc8bfb7
server : added --no-prefill-assistant flag (#13608)
|
před 8 měsíci |
Gilad S.
|
e3a7cf6c5b
cmake: use the current build config for vulkan-shaders-gen (#13595)
|
před 8 měsíci |
Georgi Gerganov
|
518329b2d4
parallel : add option for non-shared and larger prompts (#13598)
|
před 8 měsíci |
Jeff Bolz
|
2f5a4e1e09
vulkan: move common FA code to flash_attn_base.comp (#13556)
|
před 8 měsíci |
Jeff Bolz
|
4f41ee11d6
vulkan: use scalar FA rather than coopmat2 when N==1 (#13554)
|
před 8 měsíci |
Z
|
3e0be1cace
llguidance : official v0.7.20 release (no actual changes) [noci] (#13594)
|
před 8 měsíci |
Xuan-Son Nguyen
|
6aa892ec2a
server : do not return error out of context (with ctx shift disabled) (#13577)
|
před 8 měsíci |
Xuan-Son Nguyen
|
aea9f8b4e7
webui : improve accessibility for visually impaired people (#13551)
|
před 8 měsíci |
Xuan-Son Nguyen
|
06c1e4abc1
readme : add list of dependencies and their license (#13591)
|
před 8 měsíci |
Diego Devesa
|
415e40a357
releases : use arm version of curl for arm releases (#13592)
|
před 8 měsíci |
Georgi Gerganov
|
654a67794f
metal : add FA-vec kernel for head size 64 (#13583)
|
před 8 měsíci |
Diego Devesa
|
5364ae4ba5
llama : print hint when loading a model when no backends are loaded (#13589)
|
před 8 měsíci |
Sigbjørn Skjæret
|
7c07ac244d
ci : add ppc64el to build-linux-cross (#13575)
|
před 8 měsíci |
Łukasz Ślusarczyk
|
0a338ed013
sycl : fixed compilation warnings (#13582)
|
před 8 měsíci |
Olivier Chafik
|
bc098c3cf0
minja: sync (qwen3) (#13573)
|
před 8 měsíci |
Diego Devesa
|
c6a2c9e741
gguf : use ggml log system (#13571)
|
před 8 měsíci |
Daniel Tang
|
07ad2b6db3
gguf-py : fix disconnect-before-connect in editor-gui (#13569)
|
před 8 měsíci |
Xuan-Son Nguyen
|
c531edfa34
convert : fix conversion for llama 4 (#13567)
|
před 8 měsíci |
Atharva Dubey
|
02cdd2d8b0
sycl: simplify bin_bcast_kernel (#13383)
|
před 8 měsíci |
Svetlozar Georgiev
|
64bb51cf90
sycl: reordered Q4_K MMVQ (#13109)
|
před 8 měsíci |
Łukasz Ślusarczyk
|
9c404ed54c
sycl: use oneDNN for matrices multiplication (#12972)
|
před 8 měsíci |
Diego Devesa
|
6c8b91500e
llama-bench : fix -ot with dl backends (#13563)
|
před 8 měsíci |
Xuan-Son Nguyen
|
3cc1f1f1d2
webui : handle PDF input (as text or image) + convert pasted long content to file (#13562)
|
před 8 měsíci |
Piotr Wilkin (ilintar)
|
c753d7bed0
server : proper error handling for missing elements in messages array (OpenAI compatible backend) (#13540)
|
před 8 měsíci |
Georgi Gerganov
|
b2838049cc
bench : handle decode errors (#13548)
|
před 8 měsíci |
Olivier Chafik
|
aa48e373f2
`server`: inject date_string in llama 3.x template + fix date for firefunction v2 (#12802)
|
před 8 měsíci |
Georgi Gerganov
|
e3a9421b78
kv-cache : fix out-of-bounds view during reserve graph (#13547)
|
před 8 měsíci |
Yibo Cai
|
5ab5d5fb25
arm64: optimize q6_k_q8_k kernel with i8mm (#13519)
|
před 8 měsíci |