Georgi Gerganov
|
938943cdbf
llama : move vocab, grammar and sampling into separate files (#8508)
|
hace 1 año |
Keke Han
|
081fe431aa
llama : fix codeshell support (#8599)
|
hace 1 año |
Jason Stillerman
|
d94c6e0ccb
llama : add support for SmolLm pre-tokenizer (#8609)
|
hace 1 año |
Michael Coppola
|
940362224d
llama : add support for Tekken pre-tokenizer (#8579)
|
hace 1 año |
Georgi Gerganov
|
d197545530
llama : bump max layers from 256 to 512 (#8530)
|
hace 1 año |
Georgi Gerganov
|
0efec57787
llama : valign + remove unused ftype (#8502)
|
hace 1 año |
Xuan Son Nguyen
|
97bdd26eee
Refactor lora adapter support (#8332)
|
hace 1 año |
Dibakar Gope
|
0f1a39f343
ggml : add AArch64 optimized GEMV and GEMM Q4 kernels (#5780)
|
hace 1 año |
toyer
|
905942abdb
llama : support glm3 and glm4 (#8031)
|
hace 1 año |
jaime-m-p
|
213701b51a
Detokenizer fixes (#8039)
|
hace 1 año |
Douglas Hanley
|
d12f781074
llama : streamline embeddings from "non-embedding" models (#8087)
|
hace 1 año |
fairydreaming
|
807b0c49ff
Inference support for T5 and FLAN-T5 model families (#5763)
|
hace 1 año |
Faisal Zaghloul
|
968967376d
Add `JAIS` model(s) (#8118)
|
hace 1 año |
kustaaya
|
f675b20a3b
Added support for Viking pre-tokenizer (#8135)
|
hace 1 año |
Georgi Gerganov
|
f3f65429c4
llama : reorganize source code + improve CMake (#8006)
|
hace 1 año |