le.chang
|
cbbd1efa06
Makefile: use variables for cublas (#5689)
|
vor 1 Jahr |
kwin1412
|
f1a98c5254
make : fix nvcc version is empty (#5713)
|
vor 1 Jahr |
CJ Pais
|
6560bed3f0
server : support llava 1.6 (#5553)
|
vor 1 Jahr |
slaren
|
06bf2cf8c4
make : fix debug build with CUDA (#5616)
|
vor 1 Jahr |
Haoxiang Fei
|
8dbbd75754
metal : add build system support for embedded metal library (#5604)
|
vor 1 Jahr |
Jared Van Bortel
|
f24ed14ee0
make : pass CPPFLAGS directly to nvcc, not via -Xcompiler (#5598)
|
vor 1 Jahr |
Georgi Gerganov
|
d0e3ce51f4
ci : enable -Werror for CUDA builds (#5579)
|
vor 1 Jahr |
Georgi Gerganov
|
68a6b98b3c
make : fix CUDA build (#5580)
|
vor 1 Jahr |
Xuan Son Nguyen
|
11b12de39b
llama : add llama_chat_apply_template() (#5538)
|
vor 1 Jahr |
Jared Van Bortel
|
a0c2dad9d4
build : pass all warning flags to nvcc via -Xcompiler (#5570)
|
vor 1 Jahr |
Ananta Bastola
|
6e4e973b26
ci : add an option to fail on compile warning (#3952)
|
vor 1 Jahr |
Johannes Gäßler
|
ad014bba97
make: add error message for bad CUDA version (#5444)
|
vor 1 Jahr |
Johannes Gäßler
|
098f6d737b
make: Use ccache for faster compilation (#5318)
|
vor 1 Jahr |
Johannes Gäßler
|
3c0d25c475
make: add nvcc info print (#5310)
|
vor 1 Jahr |
Johannes Gäßler
|
3cc5ed353c
make: fix nvcc optimization flags for host code (#5309)
|
vor 1 Jahr |
0cc4m
|
e920ed393d
Vulkan Intel Fixes, Optimizations and Debugging Flags (#5301)
|
vor 1 Jahr |
Ali Nehzat
|
d71ac90985
make : generate .a library for static linking (#5205)
|
vor 1 Jahr |
0cc4m
|
2307523d32
ggml : add Vulkan backend (#2059)
|
vor 1 Jahr |
Xuan Son Nguyen
|
48c857aa10
server : refactored the task processing logic (#5065)
|
vor 2 Jahren |
crasm
|
413e7b0559
ci : add model tests + script wrapper (#4586)
|
vor 2 Jahren |
Georgi Gerganov
|
c918fe8dca
metal : create autorelease pool during library build (#4970)
|
vor 2 Jahren |
Georgi Gerganov
|
4be5ef556d
metal : remove old API (#4919)
|
vor 2 Jahren |
Kawrakow
|
326b418b59
Importance Matrix calculation (#4861)
|
vor 2 Jahren |
Georgi Gerganov
|
b0034d93ce
examples : add passkey test (#3856)
|
vor 2 Jahren |
slaren
|
5bf3953d7e
cuda : improve cuda pool efficiency using virtual memory (#4606)
|
vor 2 Jahren |
LeonEricsson
|
7082d24cec
lookup : add prompt lookup decoding example (#4484)
|
vor 2 Jahren |
FantasyGmm
|
a55876955b
cuda : fix jetson compile error (#4560)
|
vor 2 Jahren |
Michael Kesper
|
28cb35a0ec
make : add LLAMA_HIP_UMA option (#4587)
|
vor 2 Jahren |
Georgi Gerganov
|
32259b2dad
gguf : simplify example dependencies
|
vor 2 Jahren |
slaren
|
d232aca5a7
llama : initial ggml-backend integration (#4520)
|
vor 2 Jahren |