Joan Fontanals f5d7b268ec llama : add jina v2 base code (#7596) há 1 ano atrás
..
__init__.py ee52225067 convert-hf : support direct Q8_0 conversion (#7234) há 1 ano atrás
constants.py f5d7b268ec llama : add jina v2 base code (#7596) há 1 ano atrás
gguf.py 34b0a08207 gguf-py: Refactor and allow reading/modifying existing GGUF files (#3981) há 2 anos atrás
gguf_reader.py b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) há 1 ano atrás
gguf_writer.py ee3dff6b8e Add support for DeepseekV2ForCausalLM (#7519) há 1 ano atrás
lazy.py ee52225067 convert-hf : support direct Q8_0 conversion (#7234) há 1 ano atrás
py.typed dc07dc492e convert : various script cleanups/fixes + merges and special token handling (#2842) há 2 anos atrás
quants.py b83bab15a5 gguf-py : fix and simplify quantized shape round-trip (#7483) há 1 ano atrás
tensor_mapping.py f5d7b268ec llama : add jina v2 base code (#7596) há 1 ano atrás
vocab.py 9c4c9cc83f Move convert.py to examples/convert-legacy-llama.py (#7430) há 1 ano atrás