Pavol Rusnak
|
8b679987cd
Fix whitespace, add .editorconfig, add GitHub workflow (#883)
|
vor 2 Jahren |
Stephan Walter
|
3e6e70d8e8
Add enum llama_ftype, sync ggml_type to model files (#709)
|
vor 2 Jahren |
comex
|
2663d2c678
Windows fixes (#890)
|
vor 2 Jahren |
Georgi Gerganov
|
461ba9e66e
ggml : fix WASM build
|
vor 2 Jahren |
Georgi Gerganov
|
c3ac702e5e
ggml : add ggml_cont() + optimize ggml_cpy() for contiguous dst
|
vor 2 Jahren |
Georgi Gerganov
|
9d634ef452
ggml : remove trailing whitespaces
|
vor 2 Jahren |
Marco Matthies
|
d9a239c410
Simplify to include lower-case windows.h always, fix compile on mingw32 (#747)
|
vor 2 Jahren |
Georgi Gerganov
|
684da25926
ggml : fix quantize_row_q4_1() ARM_NEON (close #876)
|
vor 2 Jahren |
comex
|
f963b63afa
Rewrite loading code to try to satisfy everyone:
|
vor 2 Jahren |
unbounded
|
62cfc54f77
Add quantize-stats command for testing quantization (#728)
|
vor 2 Jahren |
Georgi Gerganov
|
eeaa7b0492
ggml : multi-thread ggml_rope() (~3-4 times faster on M1) (#781)
|
vor 2 Jahren |
Georgi Gerganov
|
986b6ce9f9
ggml, llama : avoid heavy V transpose + improvements (#775)
|
vor 2 Jahren |
SebastianApel
|
437e77855a
10+% performance improvement of ggml_vec_dot_q4_0 on AVX2 (#654)
|
vor 2 Jahren |
Marian Cepok
|
c0bb1d3ce2
ggml : change ne to int64_t (#626)
|
vor 2 Jahren |
Stephan Walter
|
3525899277
Enable -std= for cmake builds, fix warnings (#598)
|
vor 2 Jahren |
slaren
|
1d08882afa
Optimize AVX2 ggml_vec_dot_q4_0 (#642)
|
vor 2 Jahren |
perserk
|
02c5b27e91
Add AVX acceleration (#617)
|
vor 2 Jahren |
Justine Tunney
|
6f23ba5ee2
Ensure --mlock works properly with mmap() support
|
vor 2 Jahren |
Slaren
|
c03ae8dca1
Add mmap support for model files
|
vor 2 Jahren |
Casey Primozic
|
a4755cf288
Remove unused variable (#607)
|
vor 2 Jahren |
Georgi Gerganov
|
77efdf5a50
ggml : fix NEON signs (close #620, #622)
|
vor 2 Jahren |
slaren
|
ed3c680bcd
Fix GGML_F32Cx8_STORE in AVX without F16C path (#619)
|
vor 2 Jahren |
Georgi Gerganov
|
b51c717d5c
ggml : init time on first ggml_init() call
|
vor 2 Jahren |
Georgi Gerganov
|
cea1c85948
ggml : add ARM_NEON dequantize_row_q4_1()
|
vor 2 Jahren |
Georgi Gerganov
|
f202ada131
ggml : add ARM_NEON quantize_row_q4_1()
|
vor 2 Jahren |
Georgi Gerganov
|
3b44d30d9b
ggml : add ARM_NEON ggml_vec_dot_q4_1()
|
vor 2 Jahren |
anzz1
|
83df5639eb
Fix GCC warning about binary literal (#595)
|
vor 2 Jahren |
anzz1
|
5a5f8b1501
Enable Fused-Multiply-Add (FMA) and F16C/CVT16 vector extensions on MSVC (#375)
|
vor 2 Jahren |
slaren
|
2a98bc18ea
ggml : add AVX2 implementation of quantize_row_q4_1 (#515)
|
vor 2 Jahren |
Stephan Walter
|
99c5b27654
ggml : refactor quantized processing functions (#509)
|
vor 2 Jahren |