cturan/llama.cpp

Autor	SHA1 Permisiunea de a trimite mesaje. Dacă este dezactivată, utilizatorul nu va putea trimite nici un fel de mesaj	Data
akawrykow	5c872dbca2 falcon : use stated vocab size (#2914)	2 ani în urmă
bandoti	990a5e226a cmake : add relocatable Llama package (#2960)	2 ani în urmă
dylan	980ab41afb docker : add gpu image CI builds (#3103)	2 ani în urmă
Kerfuffle	e394084166 gguf-py : support identity operation in TensorNameMap (#3095)	2 ani în urmă
jameswu2014	4c8643dd6e feature : support Baichuan serial models (#3009)	2 ani în urmă
Leng Yue	35f73049af speculative : add heuristic algorithm (#3006)	2 ani în urmă
goerch	71ca2fad7d whisper : tokenizer fix + re-enable tokenizer test for LLaMa (#3096)	2 ani în urmă
Tristan Ross	1b6c650d16 cmake : add a compiler flag check for FP16 format (#3086)	2 ani în urmă
Johannes Gäßler	0a5eebb45d CUDA: mul_mat_q RDNA2 tunings (#2910)	2 ani în urmă
FK	84e723653c speculative: add --n-gpu-layers-draft option (#3063)	2 ani în urmă
Eric Sommerlade	b52b29ab9d arm64 support for windows (#3007)	2 ani în urmă
Johannes Gäßler	4f7cd6ba9c CUDA: fix LoRAs (#3130)	2 ani în urmă
Johannes Gäßler	89e89599fd CUDA: fix mul_mat_q not used for output tensor (#3127)	2 ani în urmă
Johannes Gäßler	d54a4027a6 CUDA: lower GPU latency + fix Windows performance (#3110)	2 ani în urmă
Jhen-Jie Hong	1b0d09259e cmake : support build for iOS/tvOS (#3116)	2 ani în urmă
Johannes Gäßler	8a4ca9af56 CUDA: add device number to error messages (#3112)	2 ani în urmă
Kawrakow	f31b6f4e2d metal : PP speedup (#3084)	2 ani în urmă
Erik Scholz	6eeb4d9083 convert: remove most of the n_mult usage in convert.py (#3098)	2 ani în urmă
kchro3	21ac3a1503 metal : support for Swift (#3078)	2 ani în urmă
Jhen-Jie Hong	4fd5477955 metal : support build for iOS/tvOS (#3089)	2 ani în urmă
takov751	ec2a24fedf flake : add train-text-from-scratch to flake.nix (#3042)	2 ani în urmă
Ikko Eltociear Ashimine	7d99aca759 readme : fix typo (#3043)	2 ani în urmă
Kawrakow	ba7ffbb251 metal : Q3_K speedup (#2995)	2 ani în urmă
Cebtenzzre	e64f5b5578 examples : make n_ctx warning work again (#3066)	2 ani în urmă
Georgi Gerganov	94f10b91ed readme : update hot tpoics	2 ani în urmă
Georgi Gerganov	b3e9852e47 sync : ggml (CUDA GLM RoPE + POSIX) (#3082)	2 ani în urmă
Przemysław Pawełczyk	cb6c44c5e0 build : do not use _GNU_SOURCE gratuitously (#2035)	2 ani în urmă
hongbo.mo	a21baeb122 docker : add git to full-cuda.Dockerfile main-cuda.Dockerfile (#3044)	2 ani în urmă
Yui	6ff712a6d1 Update deprecated GGML TheBloke links to GGUF (#3079)	2 ani în urmă
slaren	ebc96086af ggml-alloc : correctly check mmap return value for errors (#3075)	2 ani în urmă

Mai nou Mai vechi

Istoricul angajamentelor Găsiți

Istoricul angajamentelor