cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
le.chang	cbbd1efa06 Makefile: use variables for cublas (#5689)	vor 1 Jahr
kwin1412	f1a98c5254 make : fix nvcc version is empty (#5713)	vor 1 Jahr
CJ Pais	6560bed3f0 server : support llava 1.6 (#5553)	vor 1 Jahr
slaren	06bf2cf8c4 make : fix debug build with CUDA (#5616)	vor 1 Jahr
Haoxiang Fei	8dbbd75754 metal : add build system support for embedded metal library (#5604)	vor 1 Jahr
Jared Van Bortel	f24ed14ee0 make : pass CPPFLAGS directly to nvcc, not via -Xcompiler (#5598)	vor 1 Jahr
Georgi Gerganov	d0e3ce51f4 ci : enable -Werror for CUDA builds (#5579)	vor 1 Jahr
Georgi Gerganov	68a6b98b3c make : fix CUDA build (#5580)	vor 1 Jahr
Xuan Son Nguyen	11b12de39b llama : add llama_chat_apply_template() (#5538)	vor 1 Jahr
Jared Van Bortel	a0c2dad9d4 build : pass all warning flags to nvcc via -Xcompiler (#5570)	vor 1 Jahr
Ananta Bastola	6e4e973b26 ci : add an option to fail on compile warning (#3952)	vor 1 Jahr
Johannes Gäßler	ad014bba97 make: add error message for bad CUDA version (#5444)	vor 1 Jahr
Johannes Gäßler	098f6d737b make: Use ccache for faster compilation (#5318)	vor 1 Jahr
Johannes Gäßler	3c0d25c475 make: add nvcc info print (#5310)	vor 1 Jahr
Johannes Gäßler	3cc5ed353c make: fix nvcc optimization flags for host code (#5309)	vor 1 Jahr
0cc4m	e920ed393d Vulkan Intel Fixes, Optimizations and Debugging Flags (#5301)	vor 1 Jahr
Ali Nehzat	d71ac90985 make : generate .a library for static linking (#5205)	vor 1 Jahr
0cc4m	2307523d32 ggml : add Vulkan backend (#2059)	vor 1 Jahr
Xuan Son Nguyen	48c857aa10 server : refactored the task processing logic (#5065)	vor 2 Jahren
crasm	413e7b0559 ci : add model tests + script wrapper (#4586)	vor 2 Jahren
Georgi Gerganov	c918fe8dca metal : create autorelease pool during library build (#4970)	vor 2 Jahren
Georgi Gerganov	4be5ef556d metal : remove old API (#4919)	vor 2 Jahren
Kawrakow	326b418b59 Importance Matrix calculation (#4861)	vor 2 Jahren
Georgi Gerganov	b0034d93ce examples : add passkey test (#3856)	vor 2 Jahren
slaren	5bf3953d7e cuda : improve cuda pool efficiency using virtual memory (#4606)	vor 2 Jahren
LeonEricsson	7082d24cec lookup : add prompt lookup decoding example (#4484)	vor 2 Jahren
FantasyGmm	a55876955b cuda : fix jetson compile error (#4560)	vor 2 Jahren
Michael Kesper	28cb35a0ec make : add LLAMA_HIP_UMA option (#4587)	vor 2 Jahren
Georgi Gerganov	32259b2dad gguf : simplify example dependencies	vor 2 Jahren
slaren	d232aca5a7 llama : initial ggml-backend integration (#4520)	vor 2 Jahren

Neuer Älter

Commit Verlauf Finden

Commit Verlauf