cturan/llama.cpp

Автор	SHA1 Съобщение	Дата
Johannes Gäßler	49e7cb5bb1 CUDA: fixed LLAMA_FAST compilation option (#2473)	преди 2 години
Johannes Gäßler	0728c5a8b9 CUDA: mmq CLI option, fixed mmq build issues (#2453)	преди 2 години
slaren	a113689571 ggml : add graph tensor allocator (#2411)	преди 2 години
Johannes Gäßler	11f3ca06b8 CUDA: Quantized matrix matrix multiplication (#2160)	преди 2 години
Cebtenzzre	6df1f5940f make : build with -Wmissing-prototypes (#2394)	преди 2 години
Aarni Koskela	b3f138d058 Chat UI extras (#2366)	преди 2 години
Evan Jones	84e09a7d8b llama : add grammar-based sampling (#1773)	преди 2 години
Jose Maldonado	91171b8072 make : fix CLBLAST compile support in FreeBSD (#2331)	преди 2 години
Jose Maldonado	73643f5fb1 gitignore : changes for Poetry users + chat examples (#2284)	преди 2 години
Georgi Gerganov	a814d04f81 make : fix indentation	преди 2 години
Sky Yan	42c7c2e2e9 make : support customized LLAMA_CUDA_NVCC and LLAMA_CUDA_CCBIN (#2275)	преди 2 години
Jiří Podivín	54e3bc76fe make : add new target for test binaries (#2244)	преди 2 години
Przemysław Pawełczyk	9cf022a188 make : fix embdinput library and server examples building on MSYS2 (#2235)	преди 2 години
wzy	7dabc66f3c make : use pkg-config for OpenBLAS (#2222)	преди 2 години
James Reynolds	229aab351c make : fix combination of LLAMA_METAL and LLAMA_MPI (#2208)	преди 2 години
Evan Miller	5656d10599 mpi : add support for distributed inference via MPI (#2099)	преди 2 години
dylan	84525e7962 docker : add support for CUDA in docker (#1461)	преди 2 години
Johannes Gäßler	924dd22fd3 Quantized dot products for CUDA mul mat vec (#2067)	преди 2 години
Henri Vasserman	acc111caf9 Allow old Make to build server. (#2098)	преди 2 години
ZhouYuChen	23c7c6fc91 Update Makefile: clean simple (#2097)	преди 2 години
ningshanwutuobang	cfa0750bc9 llama : support input embeddings directly (#1910)	преди 2 години
Kawrakow	6769e944c7 k-quants : support for super-block size of 64 (#2001)	преди 2 години
Johannes Gäßler	16b9cd1939 Convert vector to f16 for dequantize mul mat vec (#1913)	преди 2 години
Georgi Gerganov	ce2c7d72e2 metal : handle buffers larger than device's maxBufferLength (#1826)	преди 2 години
Georgi Gerganov	b2416493ab make : do not print help for simple example	преди 2 години
DaniAndTheWeb	86c7571864 make : update for latest Arch (#1701)	преди 2 години
Randall Fitzgerald	794db3e7b9 Server Example Refactor and Improvements (#1570)	преди 2 години
SuperUserNameMan	b41b4cad6f examples : add "simple" (#1840)	преди 2 години
Kawrakow	3d01122610 CUDA : faster k-quant dot kernels (#1862)	преди 2 години
daboe01	cf267d1c71 make : add train-text-from-scratch (#1850)	преди 2 години

По-нови По-стари

Commit History Намери

Commit History