Diego Devesa
|
5931c1f233
ggml : add support for dynamic loading of backends (#10469)
|
1 год назад |
Diego Devesa
|
fab5d30ff6
llama : add .clang-format file (#10415)
|
1 год назад |
Diego Devesa
|
ae8de6d50a
ggml : build backends as libraries (#10256)
|
1 год назад |
Georgi Gerganov
|
841f27abdb
metal : optimize FA kernels (#10171)
|
1 год назад |
Diego Devesa
|
c5b0f4b5d9
llama : refactor model loader with backend registry (#10026)
|
1 год назад |
Xuan Son Nguyen
|
cda0e4b648
llama : remove all_pos_0, all_pos_1, all_seq_id from llama_batch (#9745)
|
1 год назад |
Ouadie EL FAROUKI
|
87421a23e8
[SYCL] Add SYCL Backend registry, device and Event Interfaces (#9705)
|
1 год назад |
Diego Devesa
|
0e9f760eb1
rpc : add backend registry / device interfaces (#9812)
|
1 год назад |
Michael Podvitskiy
|
7be099fa81
llama-bench: correct argument parsing error message (#9524)
|
1 год назад |
Georgi Gerganov
|
0abc6a2c25
llama : llama_perf + option to disable timings during decode (#9355)
|
1 год назад |
Georgi Gerganov
|
df270ef745
llama : refactor sampling v2 (#9294)
|
1 год назад |
Aarni Koskela
|
134bc38ecf
llama-bench : log benchmark progress (#9287)
|
1 год назад |
slaren
|
bdf314f38a
llama-bench : fix NUL terminators in CPU name (#9313)
|
1 год назад |
Radoslav Gerganov
|
82e3b03c11
rpc : make RPC servers come first in the device list (#9296)
|
1 год назад |
Aarni Koskela
|
8962422b1c
llama-bench : add JSONL (NDJSON) output mode (#9288)
|
1 год назад |
Faisal Zaghloul
|
42c76d1358
Threadpool: take 2 (#8672)
|
1 год назад |
Zhenwei Jin
|
506122d854
llama-bench : add support for getting cpu info on Windows (#8824)
|
1 год назад |
slaren
|
2b1f616b20
ggml : reduce hash table reset cost (#8698)
|
1 год назад |
hipudding
|
1bdd8ae19f
[CANN] Add Ascend NPU backend (#6035)
|
1 год назад |
Radoslav Gerganov
|
e65bbf606c
llama-bench : fix RPC indication (#7936)
|
1 год назад |
slaren
|
f578b86b21
move BLAS to a separate backend (#6210)
|
1 год назад |
Johannes Gäßler
|
148995e5e5
llama-bench: more compact markdown tables (#7879)
|
1 год назад |
Georgi Gerganov
|
1442677f92
common : refactor cli arg parsing (#7675)
|
1 год назад |
Georgi Gerganov
|
554c247caf
ggml : remove OpenCL (#7735)
|
1 год назад |
slaren
|
adc9ff3841
llama-bench : allow using a different printer for stderr with -oe (#7722)
|
1 год назад |
Radoslav Gerganov
|
210d99173d
llama-bench : add support for the RPC backend (#7435)
|
1 год назад |
Georgi Gerganov
|
6ff13987ad
common : normalize naming style (#7462)
|
1 год назад |
slaren
|
b18532a4ef
phi3 : duplicate rope factors in each layer (#7447)
|
1 год назад |
slaren
|
e849648888
llama-bench : add pp+tg test type (#7199)
|
1 год назад |
kunnis
|
628b299106
Adding support for the --numa argument for llama-bench. (#7080)
|
1 год назад |