Brian c8ad35955a Gguf dump start data offset via --data-offset and some extra refactor (#8054) hace 1 año
..
__init__.py ee52225067 convert-hf : support direct Q8_0 conversion (#7234) hace 1 año
constants.py 52fc8705a0 Option to split during conversion (#6942) hace 1 año
gguf.py 34b0a08207 gguf-py: Refactor and allow reading/modifying existing GGUF files (#3981) hace 2 años
gguf_reader.py c8ad35955a Gguf dump start data offset via --data-offset and some extra refactor (#8054) hace 1 año
gguf_writer.py 52fc8705a0 Option to split during conversion (#6942) hace 1 año
lazy.py ee52225067 convert-hf : support direct Q8_0 conversion (#7234) hace 1 año
py.typed dc07dc492e convert : various script cleanups/fixes + merges and special token handling (#2842) hace 2 años
quants.py b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) hace 1 año
tensor_mapping.py de0d6a68ac gguf-py, convert-hf : model conversion support for T5 and FLAN-T5 model variants (#5763) hace 1 año
vocab.py 9c4c9cc83f Move convert.py to examples/convert-legacy-llama.py (#7430) hace 1 año