Georgi Gerganov
|
84274a10c3
tests : remove test-grad0
|
1 год назад |
Georgi Gerganov
|
68fcb4759c
ggml : fix compile warnings (#0)
|
1 год назад |
Johannes Gäßler
|
8a43e940ab
ggml: new optimization interface (ggml/988)
|
1 год назад |
Georgi Gerganov
|
5c9a8b22b1
scripts : update sync
|
1 год назад |
FirstTimeEZ
|
0fff7fd798
docs : vulkan build instructions to use git bash mingw64 (#10303)
|
1 год назад |
Johannes Gäßler
|
4e54be0ec6
llama/ex: remove --logdir argument (#10339)
|
1 год назад |
Georgi Gerganov
|
db4cfd5dbc
llamafile : fix include path (#0)
|
1 год назад |
Georgi Gerganov
|
8ee0d09ae6
make : auto-determine dependencies (#0)
|
1 год назад |
MaggotHATE
|
bcdb7a2386
server: (web UI) Add samplers sequence customization (#10255)
|
1 год назад |
Georgi Gerganov
|
f245cc28d4
scripts : fix missing key in compare-llama-bench.py (#10332)
|
1 год назад |
Jeff Bolz
|
772703c8ff
vulkan: Optimize some mat-vec mul quant shaders (#10296)
|
1 год назад |
FirstTimeEZ
|
dd3a6ce9f8
vulkan : add cmake preset debug/release (#10306)
|
1 год назад |
Dan Johansson
|
1e58ee1318
ggml : optimize Q4_0 into Q4_0_X_Y repack (#10324)
|
1 год назад |
FirstTimeEZ
|
89e4caaaf0
llama : save number of parameters and the size in llama_model (#10286)
|
1 год назад |
Srihari-mcw
|
74d73dc85c
Make updates to fix issues with clang-cl builds while using AVX512 flags (#10314)
|
1 год назад |
Johannes Gäßler
|
4047be74da
scripts: update compare-llama-bench.py (#10319)
|
1 год назад |
slaren
|
883d206fbd
ggml : fix some build issues
|
1 год назад |
Georgi Gerganov
|
09ecbcb596
cmake : fix ppc64 check (whisper/0)
|
1 год назад |
thewh1teagle
|
3225008973
ggml : vulkan logs (whisper/2547)
|
1 год назад |
Georgi Gerganov
|
cbf5541a82
sync : ggml
|
1 год назад |
Eve
|
18429220bd
AVX BF16 and single scale quant optimizations (#10212)
|
1 год назад |
R0CKSTAR
|
f0204a0ec7
ci: build test musa with cmake (#10298)
|
1 год назад |
Romain Biessy
|
57f8355b29
sycl: Update Intel docker images to use DPC++ 2025.0 (#10305)
|
1 год назад |
Xuan Son Nguyen
|
9901068ac7
server : (web UI) add copy button for code block, fix api key (#10242)
|
1 год назад |
Chenguang Li
|
231f9360d9
cann: dockerfile and doc adjustment (#10302)
|
1 год назад |
Georgi Gerganov
|
4802ad350b
scripts : fix regex in sync [no ci]
|
1 год назад |
Romain Biessy
|
5a54af4d4f
sycl: Use syclcompat::dp4a (#10267)
|
1 год назад |
Charles Xu
|
1607a5e5b0
backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (#9921)
|
1 год назад |
Diego Devesa
|
ae8de6d50a
ggml : build backends as libraries (#10256)
|
1 год назад |
Johannes Gäßler
|
4a8ccb37ad
CUDA: no -sm row for very small matrices (#10185)
|
1 год назад |