slaren
|
519c981f8b
embedding : evaluate prompt in batches (#2713)
|
hace 2 años |
Georgi Gerganov
|
6381d4e110
gguf : new file format with flexible meta data (beta) (#2398)
|
hace 2 años |
Evan Miller
|
5656d10599
mpi : add support for distributed inference via MPI (#2099)
|
hace 2 años |
Judd
|
36680f6e40
convert : update for baichuan (#2081)
|
hace 2 años |
Howard Su
|
b8c8dda75f
Use unsigned for random seed (#2006)
|
hace 2 años |
zrm
|
b853d45601
ggml : add NUMA support (#1556)
|
hace 2 años |
Didzis Gosko
|
527b6fba1d
llama : make model stateless and context stateful (llama_state) (#1797)
|
hace 2 años |
Borislav Stanimirov
|
9cbf50c041
build : fix and ignore MSVC warnings (#1889)
|
hace 2 años |
Georgi Gerganov
|
ec2e10c444
llama : add llama_init_backend() API (close #1527)
|
hace 2 años |
András Salamon
|
9560655409
define default model path once, sync path with readme (#1366)
|
hace 2 años |
Rinne
|
6456a4eb9f
embedding : remove unused code (#1426)
|
hace 2 años |
Ron Evans
|
67c77799e0
examples : add llama_init_from_gpt_params() common function (#1290)
|
hace 2 años |
Robert Brisita
|
2bb992f034
llama : allow 0 as a seed number. (#1275)
|
hace 2 años |
DannyDaemonic
|
f4cef87edf
Add git-based build information for better issue tracking (#1232)
|
hace 2 años |
Pavol Rusnak
|
489537e6cf
examples: add missing <ctime> include for time() (#1011)
|
hace 2 años |
comex
|
f963b63afa
Rewrite loading code to try to satisfy everyone:
|
hace 2 años |
Georgi Gerganov
|
03f7e33560
Cleanup STL headers + fix embedding examples + minor stuff
|
hace 2 años |
Georgi Gerganov
|
a316a425d0
Overhaul the examples structure
|
hace 2 años |