Historial de Commits

Autor SHA1 Mensaje Fecha
  liuwei-git c8297c6af5 llama : add phi3 support (#6852) hace 1 año
  pmysl c1386c936e gguf-py : add IQ1_M to GGML_QUANT_SIZES (#6761) hace 1 año
  nopperl 9958c81b79 Implement the OLMo architecture (#6741) hace 1 año
  Sigbjørn Skjæret 03c0946d73 convert : support models with multiple chat templates (#6588) hace 1 año
  Ashish dbceec87c0 llama : add StableLM2 12B (#6635) hace 1 año
  Shijie f4dea7da18 llama : add qwen2moe (#6074) hace 1 año
  Daniel Bevenius 4fbd8098e6 gguf : add special tokens metadata for FIM/Infill (#6689) hace 1 año
  Pierrick Hymbert 4bd0f93e4a model: support arch `DbrxForCausalLM` (#6515) hace 1 año
  Carolinabanana 5dc9dd7152 llama : add Command R Plus support (#6491) hace 1 año
  Brian a8bd14d557 gguf.py : add licence and version to gguf writer (#6504) hace 1 año
  bryanSwk bb43cf7e9d llama : add SEA-LION support (#6448) hace 1 año
  slaren 08a0c02060 ggml : mul_mat_id use the same tensor for all the experts (#6387) hace 1 año
  hxer7963 069574775c [Model] Add support for xverse (#6301) hace 1 año
  Kawrakow 55c1b2a3bb IQ1_M: 1.75 bpw quantization (#6302) hace 1 año
  Julius Arkenberg 476b0251b2 llama : add grok-1 support (#6204) hace 1 año
  Andrew Canis 12247f4c69 llama : add Command-R support (#6033) hace 1 año
  Ondřej Čertík 7ce2c77f88 gguf : add support for I64 and F64 arrays (#6062) hace 1 año
  Michael Podvitskiy 69ff61397d llama : support models without vocabulary (#5798) hace 1 año
  Ondřej Čertík 3ca23481dd gguf-py : add support for I8, I16 and I32 (#6045) hace 1 año
  compilade c2101a2e90 llama : support Mamba Selective State Space Models (#5328) hace 1 año
  Nindaleth 87c2e8b279 gguf-dump : support i-quants (#5841) hace 1 año
  Sourab Mangrulkar c29af7e225 llama : add StarCoder2 support (#5795) hace 1 año
  postmasters 580111d42b llama : add `gemma` model (#5631) hace 1 año
  Douglas Hanley 4524290e87 Use correct type of pooling for embedding models (#5500) hace 1 año
  Michaël de Vries 73122473ff fix(gguf-py): special tokens are no longer skipped when add_<token>_token is set to false (#5487) hace 1 año
  Jared Van Bortel ea9c8e1143 llama : add support for Nomic Embed (#5468) hace 1 año
  Douglas Hanley 03bf161eb6 llama : support batched embeddings (#5466) hace 1 año
  Douglas Hanley 2891c8aa9a Add support for BERT embedding models (#5423) hace 1 año
  runfuture 316c7faf77 llama : add MiniCPM support (#5346) hace 1 año
  Guoteng ce32060198 llama : support InternLM2 (#5184) hace 1 año