liuwei-git
|
c8297c6af5
llama : add phi3 support (#6852)
|
hace 1 año |
pmysl
|
c1386c936e
gguf-py : add IQ1_M to GGML_QUANT_SIZES (#6761)
|
hace 1 año |
nopperl
|
9958c81b79
Implement the OLMo architecture (#6741)
|
hace 1 año |
Sigbjørn Skjæret
|
03c0946d73
convert : support models with multiple chat templates (#6588)
|
hace 1 año |
Ashish
|
dbceec87c0
llama : add StableLM2 12B (#6635)
|
hace 1 año |
Shijie
|
f4dea7da18
llama : add qwen2moe (#6074)
|
hace 1 año |
Daniel Bevenius
|
4fbd8098e6
gguf : add special tokens metadata for FIM/Infill (#6689)
|
hace 1 año |
Pierrick Hymbert
|
4bd0f93e4a
model: support arch `DbrxForCausalLM` (#6515)
|
hace 1 año |
Carolinabanana
|
5dc9dd7152
llama : add Command R Plus support (#6491)
|
hace 1 año |
Brian
|
a8bd14d557
gguf.py : add licence and version to gguf writer (#6504)
|
hace 1 año |
bryanSwk
|
bb43cf7e9d
llama : add SEA-LION support (#6448)
|
hace 1 año |
slaren
|
08a0c02060
ggml : mul_mat_id use the same tensor for all the experts (#6387)
|
hace 1 año |
hxer7963
|
069574775c
[Model] Add support for xverse (#6301)
|
hace 1 año |
Kawrakow
|
55c1b2a3bb
IQ1_M: 1.75 bpw quantization (#6302)
|
hace 1 año |
Julius Arkenberg
|
476b0251b2
llama : add grok-1 support (#6204)
|
hace 1 año |
Andrew Canis
|
12247f4c69
llama : add Command-R support (#6033)
|
hace 1 año |
Ondřej Čertík
|
7ce2c77f88
gguf : add support for I64 and F64 arrays (#6062)
|
hace 1 año |
Michael Podvitskiy
|
69ff61397d
llama : support models without vocabulary (#5798)
|
hace 1 año |
Ondřej Čertík
|
3ca23481dd
gguf-py : add support for I8, I16 and I32 (#6045)
|
hace 1 año |
compilade
|
c2101a2e90
llama : support Mamba Selective State Space Models (#5328)
|
hace 1 año |
Nindaleth
|
87c2e8b279
gguf-dump : support i-quants (#5841)
|
hace 1 año |
Sourab Mangrulkar
|
c29af7e225
llama : add StarCoder2 support (#5795)
|
hace 1 año |
postmasters
|
580111d42b
llama : add `gemma` model (#5631)
|
hace 1 año |
Douglas Hanley
|
4524290e87
Use correct type of pooling for embedding models (#5500)
|
hace 1 año |
Michaël de Vries
|
73122473ff
fix(gguf-py): special tokens are no longer skipped when add_<token>_token is set to false (#5487)
|
hace 1 año |
Jared Van Bortel
|
ea9c8e1143
llama : add support for Nomic Embed (#5468)
|
hace 1 año |
Douglas Hanley
|
03bf161eb6
llama : support batched embeddings (#5466)
|
hace 1 año |
Douglas Hanley
|
2891c8aa9a
Add support for BERT embedding models (#5423)
|
hace 1 año |
runfuture
|
316c7faf77
llama : add MiniCPM support (#5346)
|
hace 1 año |
Guoteng
|
ce32060198
llama : support InternLM2 (#5184)
|
hace 1 año |