cturan/llama.cpp

Autor	SHA1 Mensaxe	Data
Dawid Potocki	83330d8cd6 main : add --conversation / -cnv flag (#7108)	hai 1 ano
Eve	465263d0cf sgemm : AVX Q4_0 and Q8_0 (#6891)	hai 1 ano
Johan	911b3900dd server : add_special option for tokenize endpoint (#7059)	hai 1 ano
20kdc	ad211edef5 convert.py : --vocab-only generates false but valid params (#7027)	hai 1 ano
Ren Xuancheng	229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114)	hai 1 ano
Xuan Son Nguyen	1fd9c1741d clean up json_value & server_log (#7142)	hai 1 ano
DAN™	4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132)	hai 1 ano
Georgi Gerganov	7e0b6a7b3b py : also print the normalizers	hai 1 ano
Brian	acdce3cdef compare-llama-bench.py: add missing basicConfig (#7138)	hai 1 ano
Justine Tunney	3855416027 ggml : introduce bfloat16 support (#6412)	hai 1 ano
Georgi Gerganov	c0e6fbf8c3 metal : fix unused warning	hai 1 ano
Jeximo	c780e75305 Further tidy on Android instructions README.md (#7077)	hai 1 ano
jukofyork	48b2f9c1fc Fixed save_imatrix to match old behaviour for MoE (#7099)	hai 1 ano
Johannes Gäßler	af0a5b6163 server: fix incorrectly reported token probabilities (#7125)	hai 1 ano
nopperl	b6aa670203 Fix OLMo HF to GGUF conversion (#6910)	hai 1 ano
Kyle Mistele	260b7c6529 server : update readme with undocumented options (#7013)	hai 1 ano
Georgi Gerganov	53d6c52e22 readme : update hot topics	hai 1 ano
RhinoDevel	3af34c1d1b main : update log text (EOS to EOG) (#7104)	hai 1 ano
omahs	04976db7a8 docs: fix typos (#7124)	hai 1 ano
Georgi Gerganov	947d3ad27d ci : add GG_BUILD_EXTRA_TESTS_0 env (#7098)	hai 1 ano
William Tambellini	858f6b73f6 Add an option to build without CUDA VMM (#7067)	hai 1 ano
Georgi Gerganov	b3a995b416 flake.lock: Update (#7079)	hai 1 ano
Georgi Gerganov	bcdee0daa7 minor : fix trailing whitespace	hai 1 ano
kunnis	628b299106 Adding support for the --numa argument for llama-bench. (#7080)	hai 1 ano
Sigbjørn Skjæret	8f8acc8683 Disable benchmark on forked repo (#7034)	hai 1 ano
Lyle Dean	ca36326020 readme : add note that LLaMA 3 is not supported with convert.py (#7065)	hai 1 ano
DAN™	889bdd7686 command-r : add BPE pre-tokenization (#7063)	hai 1 ano
Brian	6fbd432211 py : logging and flake8 suppression refactoring (#7081)	hai 1 ano
Xuan Son Nguyen	842500144e gguf-split: add --no-tensor-first-split (#7072)	hai 1 ano
Jeximo	cf768b7e71 Tidy Android Instructions README.md (#7016)	hai 1 ano

Posterior Anterior

Commit History Buscar

Commit History