uvos
|
3ad5451f3b
Add some minimal optimizations for CDNA (#10498)
|
1 年間 前 |
Diego Devesa
|
46c69e0e75
ci : faster CUDA toolkit installation method and use ccache (#10537)
|
1 年間 前 |
Georgi Gerganov
|
9e2301f4a4
metal : fix group_norm support condition (#0)
|
1 年間 前 |
Georgi Gerganov
|
fee824a1a1
sync : ggml
|
1 年間 前 |
Frankie Robertson
|
9150f8fef9
Do not include arm_neon.h when compiling CUDA code (ggml/1028)
|
1 年間 前 |
Jeff Bolz
|
c31ed2abfc
vulkan: define all quant data structures in types.comp (#10440)
|
1 年間 前 |
Jeff Bolz
|
5b3466bedf
vulkan: Handle GPUs with less shared memory (#10468)
|
1 年間 前 |
Jeff Bolz
|
249a7902ec
vulkan: further optimize q5_k mul_mat_vec (#10479)
|
1 年間 前 |
Jeff Bolz
|
71a64989a5
vulkan: skip integer div/mod in get_offsets for batch_idx==0 (#10506)
|
1 年間 前 |
Jeff Bolz
|
4a57d362e1
vulkan: optimize Q2_K and Q3_K mul_mat_vec (#10459)
|
1 年間 前 |
Diego Devesa
|
c9b00a70b0
ci : fix cuda releases (#10532)
|
1 年間 前 |
Shane A
|
de5097351c
Add OLMo 2 model in docs (#10530)
|
1 年間 前 |
Diego Devesa
|
5a349f2809
ci : remove nix workflows (#10526)
|
1 年間 前 |
Diego Devesa
|
30ec398321
llama : disable warnings for 3rd party sha1 dependency (#10527)
|
1 年間 前 |
Tristan Druyen
|
be0e350c8b
Fix HIP flag inconsistency & build docs (#10524)
|
1 年間 前 |
R0CKSTAR
|
249cd93da3
mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516)
|
1 年間 前 |
Jeff Bolz
|
904109ed0d
vulkan: fix group_norm (#10496)
|
1 年間 前 |
Xuan Son Nguyen
|
45abe0f74e
server : replace behave with pytest (#10416)
|
1 年間 前 |
Neo Zhang Jianyu
|
0bbd2262a3
restore the condistion to build & update pacakge when merge (#10507)
|
1 年間 前 |
Georgi Gerganov
|
ab96610b1e
cmake : enable warnings in llama (#10474)
|
1 年間 前 |
Diego Devesa
|
7db3846a94
ci : publish the docker images created during scheduled runs (#10515)
|
1 年間 前 |
Diego Devesa
|
c6807b3f28
ci : add ubuntu cuda build, build with one arch on windows (#10456)
|
1 年間 前 |
Charles Xu
|
25669aa92c
ggml-cpu: cmake add arm64 cpu feature check for macos (#10487)
|
1 年間 前 |
Georgi Gerganov
|
84e1c33cde
server : fix parallel speculative decoding (#10513)
|
1 年間 前 |
Georgi Gerganov
|
811872a59d
speculative : simplify the implementation (#10504)
|
1 年間 前 |
Shanshan Shen
|
9a4b79bcfa
CANN: Improve the Inferencing Performance for Ascend NPU Device (#10454)
|
1 年間 前 |
Chenguang Li
|
7066b4cce2
CANN: RoPE and CANCAT operator optimization (#10488)
|
1 年間 前 |
Junil Kim
|
0eb4e12bee
vulkan: Fix a vulkan-shaders-gen arugment parsing error (#10484)
|
1 年間 前 |
Eric Curtin
|
0cc63754b8
Introduce llama-run (#10291)
|
1 年間 前 |
Diego Devesa
|
50d5cecbda
ci : build docker images only once daily (#10503)
|
1 年間 前 |