Tristan Druyen
|
be0e350c8b
Fix HIP flag inconsistency & build docs (#10524)
|
1 an în urmă |
R0CKSTAR
|
249cd93da3
mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516)
|
1 an în urmă |
Eric Curtin
|
0cc63754b8
Introduce llama-run (#10291)
|
1 an în urmă |
Diego Devesa
|
5931c1f233
ggml : add support for dynamic loading of backends (#10469)
|
1 an în urmă |
Georgi Gerganov
|
d9d54e498d
speculative : refactor and add a simpler example (#10362)
|
1 an în urmă |
Anthony Van de Gejuchte
|
3952a221af
Fix missing file renames in Makefile due to changes in commit ae8de6d50a (#10413)
|
1 an în urmă |
Georgi Gerganov
|
cf32a9b93a
metal : refactor kernel args into structs (#10238)
|
1 an în urmă |
Johannes Gäßler
|
c3ea58aca4
CUDA: remove DMMV, consolidate F16 mult mat vec (#10318)
|
1 an în urmă |
Georgi Gerganov
|
a4200cafad
make : add ggml-opt (#0)
|
1 an în urmă |
Georgi Gerganov
|
84274a10c3
tests : remove test-grad0
|
1 an în urmă |
Georgi Gerganov
|
8ee0d09ae6
make : auto-determine dependencies (#0)
|
1 an în urmă |
slaren
|
883d206fbd
ggml : fix some build issues
|
1 an în urmă |
Charles Xu
|
1607a5e5b0
backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (#9921)
|
1 an în urmă |
Diego Devesa
|
ae8de6d50a
ggml : build backends as libraries (#10256)
|
1 an în urmă |
Georgi Gerganov
|
ec450d3bbf
metal : opt-in compile flag for BF16 (#10218)
|
1 an în urmă |
Xuan Son Nguyen
|
a71d81cf8c
server : revamp chat UI with vuejs and daisyui (#10175)
|
1 an în urmă |
Diego Devesa
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
1 an în urmă |
Diego Devesa
|
a6744e43e8
llama : add simple-chat example (#10124)
|
1 an în urmă |
Ma Mingfei
|
60ce97c9d8
add amx kernel for gemm (#8998)
|
1 an în urmă |
Diego Devesa
|
c83ad6d01e
ggml-backend : add device and backend reg interfaces (#9707)
|
1 an în urmă |
Georgi Gerganov
|
148844fe97
examples : remove benchmark (#9704)
|
1 an în urmă |
R0CKSTAR
|
c35e586ea5
musa: enable building fat binaries, enable unified memory, and disable Flash Attention on QY1 (MTT S80) (#9526)
|
1 an în urmă |
Georgi Gerganov
|
19514d632e
cmake : do not hide GGML options + rename option (#9465)
|
1 an în urmă |
Georgi Gerganov
|
6262d13e0b
common : reimplement logging (#9418)
|
1 an în urmă |
Xuan Son Nguyen
|
feff4aa846
server : add loading html page while model is loading (#9468)
|
1 an în urmă |
Ahmad Tameem
|
2b00fa7997
riscv : modify Makefile and add a RISCV_VECT to print log info (#9442)
|
1 an în urmă |
slaren
|
fb3f249815
make : do not run llama-gen-docs when building (#9399)
|
1 an în urmă |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 an în urmă |
Xuan Son Nguyen
|
1b9ae5189c
common : refactor arg parser (#9308)
|
1 an în urmă |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 an în urmă |