Johannes Gäßler
|
affc76edfd
cuda : loading models directly into VRAM, norm calculation on GPU, broadcasting for ggml_mul (#1483)
|
2 năm trước cách đây |
Maxime
|
503db28849
llama : fix name shadowing and C4146 (#1526)
|
2 năm trước cách đây |
Ivan Stepanov
|
34d9f22f44
Wrap exceptions in std::exception to verbose output on exception. (#1316)
|
2 năm trước cách đây |
xloem
|
ea3a0ad6b6
llama : update stubs for systems without mmap and mlock (#1266)
|
2 năm trước cách đây |
slaren
|
b925f1f1b0
cuBLAS: fall back to pageable memory if pinned alloc fails (#1233)
|
2 năm trước cách đây |
Georgi Gerganov
|
84ca9c2ecf
examples : fix save-load-state + rename llama-util.h
|
2 năm trước cách đây |