omahs
|
04976db7a8
docs: fix typos (#7124)
|
1 год назад |
Georgi Gerganov
|
947d3ad27d
ci : add GG_BUILD_EXTRA_TESTS_0 env (#7098)
|
1 год назад |
William Tambellini
|
858f6b73f6
Add an option to build without CUDA VMM (#7067)
|
1 год назад |
Georgi Gerganov
|
b3a995b416
flake.lock: Update (#7079)
|
1 год назад |
Georgi Gerganov
|
bcdee0daa7
minor : fix trailing whitespace
|
1 год назад |
kunnis
|
628b299106
Adding support for the --numa argument for llama-bench. (#7080)
|
1 год назад |
Sigbjørn Skjæret
|
8f8acc8683
Disable benchmark on forked repo (#7034)
|
1 год назад |
Lyle Dean
|
ca36326020
readme : add note that LLaMA 3 is not supported with convert.py (#7065)
|
1 год назад |
DAN™
|
889bdd7686
command-r : add BPE pre-tokenization (#7063)
|
1 год назад |
Brian
|
6fbd432211
py : logging and flake8 suppression refactoring (#7081)
|
1 год назад |
Xuan Son Nguyen
|
842500144e
gguf-split: add --no-tensor-first-split (#7072)
|
1 год назад |
Jeximo
|
cf768b7e71
Tidy Android Instructions README.md (#7016)
|
1 год назад |
viric
|
fcd84a0f5a
Fix Linux /sys cpu path to guess number of cores (#7064)
|
1 год назад |
maor-ps
|
03fb8a002d
If first token generated from the server is the stop word the server will crash (#7038)
|
1 год назад |
Georgi Gerganov
|
92139b90af
tests : add test-tokenizer-0.sh + fix some tokenizers (#7036)
|
1 год назад |
Brian
|
a2ac89d6ef
convert.py : add python logging instead of print() (#6511)
|
1 год назад |
Daniel Bevenius
|
433def286e
llama : rename ctx to user_data in progress_callback (#7045)
|
1 год назад |
Bartowski
|
60325fa56f
Remove .attention from skipped tensors to match more accurately (#7051)
|
1 год назад |
alwqx
|
6ecf3189e0
chore: fix typo in llama.cpp (#7032)
|
1 год назад |
Andrew Downing
|
b0d943de17
Update LOG_IMPL and LOG_TEE_IMPL (#7029)
|
1 год назад |
l3utterfly
|
8d608a81b7
main : fix off by one error for context shift (#6921)
|
1 год назад |
Johannes Gäßler
|
3ea0d36000
Server: add tests for batch size, different seeds (#6950)
|
1 год назад |
Johannes Gäßler
|
1613ef8d8e
CUDA: CUDART < 11.7 workaround for __hmax, __hmax2 (#7019)
|
1 год назад |
slaren
|
c4ec9c0d3d
ci : exempt confirmed bugs from being tagged as stale (#7014)
|
1 год назад |
Johannes Gäßler
|
a8f9b07631
perplexity: more statistics, added documentation (#6936)
|
1 год назад |
Kevin Gibbons
|
f364eb6fb5
switch to using localizedDescription (#7010)
|
1 год назад |
Georgi Gerganov
|
77e15bec62
metal : remove deprecated error code (#7008)
|
1 год назад |
Kevin Gibbons
|
a68a1e7ed0
metal : log more info on error (#6987)
|
1 год назад |
Georgi Gerganov
|
9c67c2773d
ggml : add Flash Attention (#5021)
|
1 год назад |
Georgi Gerganov
|
952d03dbea
convert : use utf8 encoding (#7000)
|
1 год назад |