Daniel Bevenius
|
b66aec675c
backend : fix typo in scheduler documentation (ggml/781)
|
1 год назад |
slaren
|
2bf8d0f7c4
backend : offload large batches to GPU (#6083)
|
1 год назад |
slaren
|
f30ea47a87
llama : add pipeline parallelism support (#6017)
|
1 год назад |
Michael Podvitskiy
|
9fa2627347
ggml : introduce ggml_status (ggml/750)
|
1 год назад |
UEXTM.com
|
5f70671856
Introduce backend GUIDs (ggml/743)
|
1 год назад |
Georgi Gerganov
|
3b169441df
sync : ggml (#5452)
|
1 год назад |
Michael Podvitskiy
|
4633d93af0
ggml : add abort_callback for cpu backend (ggml/725)
|
1 год назад |
0cc4m
|
2307523d32
ggml : add Vulkan backend (#2059)
|
2 лет назад |
Georgi Gerganov
|
44a1a4a41a
backend : add eval callback (#4935)
|
2 лет назад |
Justine Tunney
|
a0b3ac8c48
ggml : introduce GGML_CALL function annotation (#4850)
|
2 лет назад |
slaren
|
e7e4df031b
llama : ggml-backend integration (#4766)
|
2 лет назад |
Finn Voorhees
|
1bf681f90e
ggml : add error handling to graph_compute (whisper/1714)
|
2 лет назад |
slaren
|
d232aca5a7
llama : initial ggml-backend integration (#4520)
|
2 лет назад |
Georgi Gerganov
|
fe680e3d10
sync : ggml (new ops, tests, backend, etc.) (#4359)
|
2 лет назад |
Georgi Gerganov
|
4760e7cc0b
sync : ggml (backend v2) (#3912)
|
2 лет назад |
Georgi Gerganov
|
db3abcc114
sync : ggml (ggml-backend) (#3548)
|
2 лет назад |