cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Pavol Rusnak	8b679987cd Fix whitespace, add .editorconfig, add GitHub workflow (#883)	vor 2 Jahren
Stephan Walter	3e6e70d8e8 Add enum llama_ftype, sync ggml_type to model files (#709)	vor 2 Jahren
comex	2663d2c678 Windows fixes (#890)	vor 2 Jahren
Georgi Gerganov	461ba9e66e ggml : fix WASM build	vor 2 Jahren
Georgi Gerganov	c3ac702e5e ggml : add ggml_cont() + optimize ggml_cpy() for contiguous dst	vor 2 Jahren
Georgi Gerganov	9d634ef452 ggml : remove trailing whitespaces	vor 2 Jahren
Marco Matthies	d9a239c410 Simplify to include lower-case windows.h always, fix compile on mingw32 (#747)	vor 2 Jahren
Georgi Gerganov	684da25926 ggml : fix quantize_row_q4_1() ARM_NEON (close #876)	vor 2 Jahren
comex	f963b63afa Rewrite loading code to try to satisfy everyone:	vor 2 Jahren
unbounded	62cfc54f77 Add quantize-stats command for testing quantization (#728)	vor 2 Jahren
Georgi Gerganov	eeaa7b0492 ggml : multi-thread ggml_rope() (~3-4 times faster on M1) (#781)	vor 2 Jahren
Georgi Gerganov	986b6ce9f9 ggml, llama : avoid heavy V transpose + improvements (#775)	vor 2 Jahren
SebastianApel	437e77855a 10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 (#654)	vor 2 Jahren
Marian Cepok	c0bb1d3ce2 ggml : change ne to int64_t (#626)	vor 2 Jahren
Stephan Walter	3525899277 Enable -std= for cmake builds, fix warnings (#598)	vor 2 Jahren
slaren	1d08882afa Optimize AVX2 ggml_vec_dot_q4_0 (#642)	vor 2 Jahren
perserk	02c5b27e91 Add AVX acceleration (#617)	vor 2 Jahren
Justine Tunney	6f23ba5ee2 Ensure --mlock works properly with mmap() support	vor 2 Jahren
Slaren	c03ae8dca1 Add mmap support for model files	vor 2 Jahren
Casey Primozic	a4755cf288 Remove unused variable (#607)	vor 2 Jahren
Georgi Gerganov	77efdf5a50 ggml : fix NEON signs (close #620, #622)	vor 2 Jahren
slaren	ed3c680bcd Fix GGML_F32Cx8_STORE in AVX without F16C path (#619)	vor 2 Jahren
Georgi Gerganov	b51c717d5c ggml : init time on first ggml_init() call	vor 2 Jahren
Georgi Gerganov	cea1c85948 ggml : add ARM_NEON dequantize_row_q4_1()	vor 2 Jahren
Georgi Gerganov	f202ada131 ggml : add ARM_NEON quantize_row_q4_1()	vor 2 Jahren
Georgi Gerganov	3b44d30d9b ggml : add ARM_NEON ggml_vec_dot_q4_1()	vor 2 Jahren
anzz1	83df5639eb Fix GCC warning about binary literal (#595)	vor 2 Jahren
anzz1	5a5f8b1501 Enable Fused-Multiply-Add (FMA) and F16C/CVT16 vector extensions on MSVC (#375)	vor 2 Jahren
slaren	2a98bc18ea ggml : add AVX2 implementation of quantize_row_q4_1 (#515)	vor 2 Jahren
Stephan Walter	99c5b27654 ggml : refactor quantized processing functions (#509)	vor 2 Jahren

Neuer Älter

Commit Verlauf Finden

Commit Verlauf