Ahmet Zeer
|
07cd41d096
TypoFix (#7162)
|
1 год назад |
Jared Van Bortel
|
4426e2987b
cmake : fix typo (#7151)
|
1 год назад |
compilade
|
f98eb31c51
convert-hf : save memory with lazy evaluation (#7075)
|
1 год назад |
agray3
|
bc4bba364f
Introduction of CUDA Graphs to LLama.cpp (#6766)
|
1 год назад |
Johannes Gäßler
|
c12452c7ae
JSON: [key] -> .at(key), assert() -> GGML_ASSERT (#7143)
|
1 год назад |
Georgi Gerganov
|
9da243b36a
Revert "llava : add support for moondream vision language model (#6899)"
|
1 год назад |
JohnnyB
|
bd1871fa2b
server : add themes + favicon (#6848)
|
1 год назад |
Gilad S
|
26458af1d6
metal : use `vm_allocate` instead of `posix_memalign` on macOS (#7078)
|
1 год назад |
Dawid Potocki
|
83330d8cd6
main : add --conversation / -cnv flag (#7108)
|
1 год назад |
Eve
|
465263d0cf
sgemm : AVX Q4_0 and Q8_0 (#6891)
|
1 год назад |
Johan
|
911b3900dd
server : add_special option for tokenize endpoint (#7059)
|
1 год назад |
20kdc
|
ad211edef5
convert.py : --vocab-only generates false but valid params (#7027)
|
1 год назад |
Ren Xuancheng
|
229ffff872
llama : add BPE pre-tokenization for Qwen2 (#7114)
|
1 год назад |
Xuan Son Nguyen
|
1fd9c1741d
clean up json_value & server_log (#7142)
|
1 год назад |
DAN™
|
4cd621c26d
convert : add BPE pre-tokenization for DBRX (#7132)
|
1 год назад |
Georgi Gerganov
|
7e0b6a7b3b
py : also print the normalizers
|
1 год назад |
Brian
|
acdce3cdef
compare-llama-bench.py: add missing basicConfig (#7138)
|
1 год назад |
Justine Tunney
|
3855416027
ggml : introduce bfloat16 support (#6412)
|
1 год назад |
Georgi Gerganov
|
c0e6fbf8c3
metal : fix unused warning
|
1 год назад |
Jeximo
|
c780e75305
Further tidy on Android instructions README.md (#7077)
|
1 год назад |
jukofyork
|
48b2f9c1fc
Fixed save_imatrix to match old behaviour for MoE (#7099)
|
1 год назад |
Johannes Gäßler
|
af0a5b6163
server: fix incorrectly reported token probabilities (#7125)
|
1 год назад |
nopperl
|
b6aa670203
Fix OLMo HF to GGUF conversion (#6910)
|
1 год назад |
Kyle Mistele
|
260b7c6529
server : update readme with undocumented options (#7013)
|
1 год назад |
Georgi Gerganov
|
53d6c52e22
readme : update hot topics
|
1 год назад |
RhinoDevel
|
3af34c1d1b
main : update log text (EOS to EOG) (#7104)
|
1 год назад |
omahs
|
04976db7a8
docs: fix typos (#7124)
|
1 год назад |
Georgi Gerganov
|
947d3ad27d
ci : add GG_BUILD_EXTRA_TESTS_0 env (#7098)
|
1 год назад |
William Tambellini
|
858f6b73f6
Add an option to build without CUDA VMM (#7067)
|
1 год назад |
Georgi Gerganov
|
b3a995b416
flake.lock: Update (#7079)
|
1 год назад |