compilade b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) před 1 rokem
..
__init__.py ee52225067 convert-hf : support direct Q8_0 conversion (#7234) před 1 rokem
constants.py fbca2f27fc Add support for ArcticForCausalLM (#7020) před 1 rokem
gguf.py 34b0a08207 gguf-py: Refactor and allow reading/modifying existing GGUF files (#3981) před 2 roky
gguf_reader.py b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) před 1 rokem
gguf_writer.py b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) před 1 rokem
lazy.py ee52225067 convert-hf : support direct Q8_0 conversion (#7234) před 1 rokem
py.typed dc07dc492e convert : various script cleanups/fixes + merges and special token handling (#2842) před 2 roky
quants.py b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) před 1 rokem
tensor_mapping.py fbca2f27fc Add support for ArcticForCausalLM (#7020) před 1 rokem
vocab.py f98eb31c51 convert-hf : save memory with lazy evaluation (#7075) před 1 rokem