Daniel Bevenius
|
e6bf007744
llama : return nullptr from llama_grammar_init (#8093)
|
1 년 전 |
Daniel Bevenius
|
11318d9aa1
Fix typo in llama_set_embeddings comment (#8077)
|
1 년 전 |
Douglas Hanley
|
80ea089d77
llama : allow pooled embeddings on any model (#7477)
|
1 년 전 |
Elaine
|
41b9260f18
convert : add Poro-34B-chat tokenizer support (#7713)
|
1 년 전 |
Clint Herron
|
ad675e1c67
Added support for . (any character) token in grammar engine. (#6467)
|
1 년 전 |
jaime-m-p
|
c90dbe026b
Fix per token atrributes bits (#7749)
|
1 년 전 |
Georgi Gerganov
|
0cd6bd3483
llama : remove beam search (#7736)
|
1 년 전 |
jaime-m-p
|
3b38d48609
Per token attributes (#7685)
|
1 년 전 |
Georgi Gerganov
|
5921b8f089
llama : cache llama_token_to_piece (#7587)
|
1 년 전 |
Georgi Gerganov
|
eaf6e03174
llama : add comments about experimental flags (#7544)
|
1 년 전 |
Bartowski
|
c429b33beb
llama : add Smaug 70B support (#7402)
|
1 년 전 |
Justine Tunney
|
00c6390793
main : don't print special tokens with --grammar (#6923)
|
1 년 전 |
Daniel Bevenius
|
3015851c5a
llama : add getters for n_threads/n_threads_batch (#7464)
|
1 년 전 |
Anas Ahouzi
|
6aade19ee7
Add StableLM2 pre-tokenizer (#7349)
|
1 년 전 |
Radoslav Gerganov
|
5e31828d3e
ggml : add RPC backend (#6829)
|
1 년 전 |
Ren Xuancheng
|
229ffff872
llama : add BPE pre-tokenization for Qwen2 (#7114)
|
1 년 전 |
DAN™
|
4cd621c26d
convert : add BPE pre-tokenization for DBRX (#7132)
|
1 년 전 |
Justine Tunney
|
3855416027
ggml : introduce bfloat16 support (#6412)
|
1 년 전 |
nopperl
|
b6aa670203
Fix OLMo HF to GGUF conversion (#6910)
|
1 년 전 |
DAN™
|
889bdd7686
command-r : add BPE pre-tokenization (#7063)
|
1 년 전 |
Georgi Gerganov
|
92139b90af
tests : add test-tokenizer-0.sh + fix some tokenizers (#7036)
|
1 년 전 |
Daniel Bevenius
|
433def286e
llama : rename ctx to user_data in progress_callback (#7045)
|
1 년 전 |
Georgi Gerganov
|
9c67c2773d
ggml : add Flash Attention (#5021)
|
1 년 전 |
Georgi Gerganov
|
f4ab2a4147
llama : fix BPE pre-tokenization (#6920)
|
1 년 전 |
Pierrick Hymbert
|
0c4d489e29
quantize: add imatrix and dataset metadata in GGUF (#6658)
|
1 년 전 |
slaren
|
017e6999b5
add basic tensor data validation function (#6884)
|
1 년 전 |
jiez
|
1966eb2615
quantize : add '--keep-split' to quantize model into shards (#6688)
|
1 년 전 |
Douglas Hanley
|
b4e4b8a935
llama : add llama_get_pooling_type function (#6862)
|
1 년 전 |
Johannes Gäßler
|
28103f4832
Server: fix seed for multiple slots (#6835)
|
1 년 전 |
Georgi Gerganov
|
40f74e4d73
llama : add option to render special/control tokens (#6807)
|
1 년 전 |