cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Georgi Gerganov	6381d4e110 gguf : new file format with flexible meta data (beta) (#2398)	vor 2 Jahren
Stephan Walter	1b107b8550 ggml : generalize `quantize_fns` for simpler FP16 handling (#1237)	vor 2 Jahren
Didzis Gosko	527b6fba1d llama : make model stateless and context stateful (llama_state) (#1797)	vor 2 Jahren
Borislav Stanimirov	9cbf50c041 build : fix and ignore MSVC warnings (#1889)	vor 2 Jahren
Kawrakow	99009e72f8 ggml : add SOTA 2,3,4,5,6 bit k-quantizations (#1684)	vor 2 Jahren
Stephan Walter	dc271c52ed Remove unused n_parts parameter (#1509)	vor 2 Jahren
DannyDaemonic	f4cef87edf Add git-based build information for better issue tracking (#1232)	vor 2 Jahren
Kawrakow	38de86a711 llama : multi-threaded quantization (#1075)	vor 2 Jahren
Georgi Gerganov	eb17a026fd quantize-stats : fix bug in --type argument	vor 2 Jahren
Pavol Rusnak	c56b715269 Expose type name from ggml (#970)	vor 2 Jahren
Georgi Gerganov	9190e8eac8 llama : merge llama_internal.h into llama.h	vor 2 Jahren
comex	f963b63afa Rewrite loading code to try to satisfy everyone:	vor 2 Jahren
unbounded	62cfc54f77 Add quantize-stats command for testing quantization (#728)	vor 2 Jahren