cturan/llama.cpp

Pembuat	SHA1 Pesan	Tanggal
l3utterfly	8596af4277 ggml : fix bug in ggml_compute_forward_add_q_f32 (#1918)	2 tahun lalu
Mike	e1886cf4fe readme : update Android build instructions (#1922)	2 tahun lalu
Kawrakow	8ab8ba62eb llama : prevent usage of k-quants when tensor size is not a multiple of 256 (#1921)	2 tahun lalu
Kawrakow	90cc59d6ab examples : fix examples/metal (#1920)	2 tahun lalu
Georgi Gerganov	ce2c7d72e2 metal : handle buffers larger than device's maxBufferLength (#1826)	2 tahun lalu
Howard Su	57cd69460f cmake : add CUDA_ARCHITECTURES to new target ggml_static (#1917)	2 tahun lalu
Georgi Gerganov	b2416493ab make : do not print help for simple example	2 tahun lalu
Georgi Gerganov	4f9c43e3bd minor : warning fixes	2 tahun lalu
Johannes Gäßler	2c9380dd2f Only one CUDA stream per device for async compute (#1898)	2 tahun lalu
Georgi Gerganov	051e1b0e6a llama : fix kv_cache `n` init (close #1903)	2 tahun lalu
DaniAndTheWeb	86c7571864 make : update for latest Arch (#1701)	2 tahun lalu
Howard Su	3d59ec5935 ggml : fix warnings under MSVC (#1908)	2 tahun lalu
Aaron Miller	0711a5f6dc metal : add norm, cpy f16->f16, alibi kernels (#1823)	2 tahun lalu
Faez Shakil	fc45a81bc6 exposed modules so that they can be invoked by nix run github:ggerganov/llama.cpp#server etc (#1863)	2 tahun lalu
Randall Fitzgerald	794db3e7b9 Server Example Refactor and Improvements (#1570)	2 tahun lalu
Jiří Podivín	5ddf7ea1fb hooks : setting up flake8 and pre-commit hooks (#1681)	2 tahun lalu
Gustavo Rocha Dias	bac19927c3 readme : alternative way to build for Android with CLBlast. (#1828)	2 tahun lalu
Kerfuffle	b4c6f46f17 Allow cmake to build ggml as a library (#1896)	2 tahun lalu
David Yang	92f20d9942 train : get raw text instead of page with html (#1905)	2 tahun lalu
0cc4m	d411968e99 opencl : support k-quants (#1836)	2 tahun lalu
SuperUserNameMan	b41b4cad6f examples : add "simple" (#1840)	2 tahun lalu
Zenix	13fe9d2d84 cmake : add auto detection of BLAS_INCLUDE_DIRS (#1886)	2 tahun lalu
Johannes Gäßler	ac3b886953 llama : fix embd when offloading non-repeating layers (#1891)	2 tahun lalu
FrankHB	5b9ccaf104 Fixed possible macro redefinition (#1892)	2 tahun lalu
Borislav Stanimirov	9cbf50c041 build : fix and ignore MSVC warnings (#1889)	2 tahun lalu
Kawrakow	3d01122610 CUDA : faster k-quant dot kernels (#1862)	2 tahun lalu
Borislav Stanimirov	602c748863 gitignore : add several entries specific to Visual Studio (#1888)	2 tahun lalu
Johannes Gäßler	a09f9195be Fixed CUDA runtime version check (#1879)	2 tahun lalu
Georgi Gerganov	bed9275617 cmake : remove whitespaces	2 tahun lalu
yangli2	c36e81da62 examples : add chat-vicuna.sh (#1854)	2 tahun lalu

Terbaru Lawas

Komit Sejarah Cari

Komit Sejarah