20kdc
|
ad211edef5
convert.py : --vocab-only generates false but valid params (#7027)
|
hace 1 año |
Ren Xuancheng
|
229ffff872
llama : add BPE pre-tokenization for Qwen2 (#7114)
|
hace 1 año |
Xuan Son Nguyen
|
1fd9c1741d
clean up json_value & server_log (#7142)
|
hace 1 año |
DAN™
|
4cd621c26d
convert : add BPE pre-tokenization for DBRX (#7132)
|
hace 1 año |
Georgi Gerganov
|
7e0b6a7b3b
py : also print the normalizers
|
hace 1 año |
Brian
|
acdce3cdef
compare-llama-bench.py: add missing basicConfig (#7138)
|
hace 1 año |
Justine Tunney
|
3855416027
ggml : introduce bfloat16 support (#6412)
|
hace 1 año |
Georgi Gerganov
|
c0e6fbf8c3
metal : fix unused warning
|
hace 1 año |
Jeximo
|
c780e75305
Further tidy on Android instructions README.md (#7077)
|
hace 1 año |
jukofyork
|
48b2f9c1fc
Fixed save_imatrix to match old behaviour for MoE (#7099)
|
hace 1 año |
Johannes Gäßler
|
af0a5b6163
server: fix incorrectly reported token probabilities (#7125)
|
hace 1 año |
nopperl
|
b6aa670203
Fix OLMo HF to GGUF conversion (#6910)
|
hace 1 año |
Kyle Mistele
|
260b7c6529
server : update readme with undocumented options (#7013)
|
hace 1 año |
Georgi Gerganov
|
53d6c52e22
readme : update hot topics
|
hace 1 año |
RhinoDevel
|
3af34c1d1b
main : update log text (EOS to EOG) (#7104)
|
hace 1 año |
omahs
|
04976db7a8
docs: fix typos (#7124)
|
hace 1 año |
Georgi Gerganov
|
947d3ad27d
ci : add GG_BUILD_EXTRA_TESTS_0 env (#7098)
|
hace 1 año |
William Tambellini
|
858f6b73f6
Add an option to build without CUDA VMM (#7067)
|
hace 1 año |
Georgi Gerganov
|
b3a995b416
flake.lock: Update (#7079)
|
hace 1 año |
Georgi Gerganov
|
bcdee0daa7
minor : fix trailing whitespace
|
hace 1 año |
kunnis
|
628b299106
Adding support for the --numa argument for llama-bench. (#7080)
|
hace 1 año |
Sigbjørn Skjæret
|
8f8acc8683
Disable benchmark on forked repo (#7034)
|
hace 1 año |
Lyle Dean
|
ca36326020
readme : add note that LLaMA 3 is not supported with convert.py (#7065)
|
hace 1 año |
DAN™
|
889bdd7686
command-r : add BPE pre-tokenization (#7063)
|
hace 1 año |
Brian
|
6fbd432211
py : logging and flake8 suppression refactoring (#7081)
|
hace 1 año |
Xuan Son Nguyen
|
842500144e
gguf-split: add --no-tensor-first-split (#7072)
|
hace 1 año |
Jeximo
|
cf768b7e71
Tidy Android Instructions README.md (#7016)
|
hace 1 año |
viric
|
fcd84a0f5a
Fix Linux /sys cpu path to guess number of cores (#7064)
|
hace 1 año |
maor-ps
|
03fb8a002d
If first token generated from the server is the stop word the server will crash (#7038)
|
hace 1 año |
Georgi Gerganov
|
92139b90af
tests : add test-tokenizer-0.sh + fix some tokenizers (#7036)
|
hace 1 año |