Clint Herron
|
ad675e1c67
Added support for . (any character) token in grammar engine. (#6467)
|
hace 1 año |
jaime-m-p
|
c90dbe026b
Fix per token atrributes bits (#7749)
|
hace 1 año |
Georgi Gerganov
|
0cd6bd3483
llama : remove beam search (#7736)
|
hace 1 año |
jaime-m-p
|
3b38d48609
Per token attributes (#7685)
|
hace 1 año |
Georgi Gerganov
|
5921b8f089
llama : cache llama_token_to_piece (#7587)
|
hace 1 año |
Georgi Gerganov
|
eaf6e03174
llama : add comments about experimental flags (#7544)
|
hace 1 año |
Bartowski
|
c429b33beb
llama : add Smaug 70B support (#7402)
|
hace 1 año |
Justine Tunney
|
00c6390793
main : don't print special tokens with --grammar (#6923)
|
hace 1 año |
Daniel Bevenius
|
3015851c5a
llama : add getters for n_threads/n_threads_batch (#7464)
|
hace 1 año |
Anas Ahouzi
|
6aade19ee7
Add StableLM2 pre-tokenizer (#7349)
|
hace 1 año |
Radoslav Gerganov
|
5e31828d3e
ggml : add RPC backend (#6829)
|
hace 1 año |
Ren Xuancheng
|
229ffff872
llama : add BPE pre-tokenization for Qwen2 (#7114)
|
hace 1 año |
DAN™
|
4cd621c26d
convert : add BPE pre-tokenization for DBRX (#7132)
|
hace 1 año |
Justine Tunney
|
3855416027
ggml : introduce bfloat16 support (#6412)
|
hace 1 año |
nopperl
|
b6aa670203
Fix OLMo HF to GGUF conversion (#6910)
|
hace 1 año |
DAN™
|
889bdd7686
command-r : add BPE pre-tokenization (#7063)
|
hace 1 año |
Georgi Gerganov
|
92139b90af
tests : add test-tokenizer-0.sh + fix some tokenizers (#7036)
|
hace 1 año |
Daniel Bevenius
|
433def286e
llama : rename ctx to user_data in progress_callback (#7045)
|
hace 1 año |
Georgi Gerganov
|
9c67c2773d
ggml : add Flash Attention (#5021)
|
hace 1 año |
Georgi Gerganov
|
f4ab2a4147
llama : fix BPE pre-tokenization (#6920)
|
hace 1 año |
Pierrick Hymbert
|
0c4d489e29
quantize: add imatrix and dataset metadata in GGUF (#6658)
|
hace 1 año |
slaren
|
017e6999b5
add basic tensor data validation function (#6884)
|
hace 1 año |
jiez
|
1966eb2615
quantize : add '--keep-split' to quantize model into shards (#6688)
|
hace 1 año |
Douglas Hanley
|
b4e4b8a935
llama : add llama_get_pooling_type function (#6862)
|
hace 1 año |
Johannes Gäßler
|
28103f4832
Server: fix seed for multiple slots (#6835)
|
hace 1 año |
Georgi Gerganov
|
40f74e4d73
llama : add option to render special/control tokens (#6807)
|
hace 1 año |
Pedro Cuenca
|
b97bc3966e
llama : support Llama 3 HF conversion (#6745)
|
hace 1 año |
Olivier Chafik
|
cbaadc9294
grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609)
|
hace 1 año |
Jared Van Bortel
|
1b67731e18
BERT tokenizer fixes (#6498)
|
hace 1 año |
Rick G
|
e3c337d87c
llama : support negative ith in llama_get_ API (#6519)
|
hace 1 año |