Georgi Gerganov
|
178a7eb952
metal : use residency sets (#11427)
|
11 månader sedan |
Nuno
|
6f53d8a6b4
docker: add missing vulkan library to base layer and update to 24.04 (#11422)
|
11 månader sedan |
bandoti
|
19f65187cb
cmake: add ggml find package (#11369)
|
11 månader sedan |
Frank Mai
|
1d8ee06000
rpc: fix register position (#11424)
|
11 månader sedan |
Georgi Gerganov
|
2cc9b8c32c
readme : update hot topics
|
11 månader sedan |
Jeff Bolz
|
f35726c2fb
build: apply MSVC /bigobj option to c/cpp files only (#11423)
|
11 månader sedan |
Jeff Bolz
|
4a75d19376
vulkan: compile shaders on-demand (#11406)
|
11 månader sedan |
uvos
|
26771a1491
Hip: disable VMM on hip as it seams that it dosent work in some configurations (#11420)
|
11 månader sedan |
Jeff Bolz
|
ca6baf76c1
build: add /bigobj to MSVC build (#11407)
|
11 månader sedan |
Diego Devesa
|
6e264a905b
docker : add GGML_CPU_ARM_ARCH arg to select ARM architecture to build for (#11419)
|
11 månader sedan |
Xuan Son Nguyen
|
49b0e3cec4
server : fix cleaning up stream task (#11418)
|
11 månader sedan |
Diego Devesa
|
20a758155b
docker : fix CPU ARM build (#11403)
|
11 månader sedan |
Georgi Gerganov
|
00c24acb2a
ci : fix line breaks on windows builds (#11409)
|
11 månader sedan |
jiahao su
|
466ea66f33
CANN: Add Ascend CANN build ci (#10217)
|
11 månader sedan |
uvos
|
5f0db9522f
hip : Add hipGraph and VMM support to ROCM (#11362)
|
11 månader sedan |
Johannes Gäßler
|
c5d9effb49
CUDA: fix FP16 cuBLAS GEMM (#11396)
|
11 månader sedan |
uvos
|
9fbadaef4f
rocBLAS: Avoid fp32->fp16->fp32 conversion on cdna (#11356)
|
11 månader sedan |
Georgi Gerganov
|
9755129c27
release : pack /lib in the packages (#11392)
|
11 månader sedan |
Jafar Uruç
|
a07c2c8a52
docs : Update readme to build targets for local docker build (#11368)
|
11 månader sedan |
Johannes Gäßler
|
8137b4bb2b
CPU/CUDA: fix (GQA) mul mat back, add CUDA support (#11380)
|
11 månader sedan |
Bernhard M. Wiedemann
|
1af6945eb0
cmake : avoid -march=native when reproducible build is wanted (#11366)
|
11 månader sedan |
Eric Curtin
|
01f37edf1a
Update llama-run README.md (#11386)
|
11 månader sedan |
stduhpf
|
c07e87f38b
server : (webui) put DeepSeek R1 CoT in a collapsible <details> element (#11364)
|
11 månader sedan |
Jeff Bolz
|
564804b79b
tests: fix some mul_mat test gaps (#11375)
|
11 månader sedan |
Eric Curtin
|
05f63cc9ee
Update documentation (#11373)
|
11 månader sedan |
Eric Curtin
|
f7fb43cd0b
Add -ngl (#11372)
|
11 månader sedan |
Xuan Son Nguyen
|
5845661640
server : add more clean up when cancel_tasks is called (#11340)
|
11 månader sedan |
Eric Curtin
|
f211d1dc10
Treat hf.co/ prefix the same as hf:// (#11350)
|
11 månader sedan |
amd-dwang
|
955a6c2d91
Vulkan-run-test: fix mmq_wg_denoms (#11343)
|
11 månader sedan |
Jeff Bolz
|
1971adf55e
vulkan: sort shaders for more deterministic binary (#11315)
|
11 månader sedan |