cturan/llama.cpp

Autor	SHA1 Zpráva	Datum
Ed Addario	fa4a9f2a1c quantize : handle user-defined pruning of whole layers (blocks) (#13037)	před 6 měsíci
Ed Addario	30e5b01de2 quantize : change int to unsigned int for KV overrides (#14197)	před 7 měsíci
Ed Addario	e5c834f718 quantize : improve tensor-type pattern matching (#13033)	před 8 měsíci
Johannes Gäßler	10d2af0eaa llama/ggml: add LLM training support (#10544)	před 8 měsíci
Ed Addario	71e90e8813 quantize: Handle user-defined quantization levels for additional tensors (#12511)	před 9 měsíci
Diego Devesa	e0e912f49b llama : add option to override model tensor buffers (#11397)	před 9 měsíci
Molly Sophia	7dfad387e3 llama: Add support for RWKV v7 architecture (#12412)	před 10 měsíci
Xuan Son Nguyen	681149ced2 llama : add `llama_model_load_from_splits` (#11255)	před 1 rokem
Georgi Gerganov	afa8a9ec9b llama : add `llama_vocab`, functions -> methods, naming (#11110)	před 1 rokem
Molly Sophia	ee7136c6d1 llama: add support for QRWKV6 model architecture (#11001)	před 1 rokem
Georgi Gerganov	c07d437bbd llama : avoid hardcoded QK_K (#11061)	před 1 rokem
Johannes Gäßler	53ff6b9b9f GGUF: C++ refactor, backend support, misc fixes (#11030)	před 1 rokem
Georgi Gerganov	5047dd3546 llama : use _impl suffix instead of _internal (#11060)	před 1 rokem
Georgi Gerganov	f66f582927 llama : refactor `src/llama.cpp` (#10902)	před 1 rokem