cturan/llama.cpp

Autor	SHA1 Permisiunea de a trimite mesaje. Dacă este dezactivată, utilizatorul nu va putea trimite nici un fel de mesaj	Data
0cc4m	befddd0f15 Vulkan Bugfixes and Improvements (#7084)	1 an în urmă
Georgi Gerganov	d46dbc76f8 readme : add scheduled server workflow status badge	1 an în urmă
l3utterfly	0961d86604 readme : add app (#6371)	1 an în urmă
jaime-m-p	43248e5594 llama3 custom regex split (#6965)	1 an în urmă
Johannes Gäßler	a743d76a01 CUDA: generalize FP16 fattn vec kernel (#7061)	1 an în urmă
Galunid	f31ec120bc Add warning if token is invalid (#7173)	1 an în urmă
Daniel Bevenius	fd9f92b154 llama : update llama_timings.n_p_eval setting (#7160)	1 an în urmă
Sigbjørn Skjæret	22842164bc gguf-py : add special token modification capability (#7166)	1 an în urmă
Albert Jin	4734524882 opencl : alignment size converted from bits to bytes (#7090)	1 an în urmă
Ahmet Zeer	07cd41d096 TypoFix (#7162)	1 an în urmă
Jared Van Bortel	4426e2987b cmake : fix typo (#7151)	1 an în urmă
compilade	f98eb31c51 convert-hf : save memory with lazy evaluation (#7075)	1 an în urmă
agray3	bc4bba364f Introduction of CUDA Graphs to LLama.cpp (#6766)	1 an în urmă
Johannes Gäßler	c12452c7ae JSON: [key] -> .at(key), assert() -> GGML_ASSERT (#7143)	1 an în urmă
Georgi Gerganov	9da243b36a Revert "llava : add support for moondream vision language model (#6899)"	1 an în urmă
JohnnyB	bd1871fa2b server : add themes + favicon (#6848)	1 an în urmă
Gilad S	26458af1d6 metal : use `vm_allocate` instead of `posix_memalign` on macOS (#7078)	1 an în urmă
Dawid Potocki	83330d8cd6 main : add --conversation / -cnv flag (#7108)	1 an în urmă
Eve	465263d0cf sgemm : AVX Q4_0 and Q8_0 (#6891)	1 an în urmă
Johan	911b3900dd server : add_special option for tokenize endpoint (#7059)	1 an în urmă
20kdc	ad211edef5 convert.py : --vocab-only generates false but valid params (#7027)	1 an în urmă
Ren Xuancheng	229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114)	1 an în urmă
Xuan Son Nguyen	1fd9c1741d clean up json_value & server_log (#7142)	1 an în urmă
DAN™	4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132)	1 an în urmă
Georgi Gerganov	7e0b6a7b3b py : also print the normalizers	1 an în urmă
Brian	acdce3cdef compare-llama-bench.py: add missing basicConfig (#7138)	1 an în urmă
Justine Tunney	3855416027 ggml : introduce bfloat16 support (#6412)	1 an în urmă
Georgi Gerganov	c0e6fbf8c3 metal : fix unused warning	1 an în urmă
Jeximo	c780e75305 Further tidy on Android instructions README.md (#7077)	1 an în urmă
jukofyork	48b2f9c1fc Fixed save_imatrix to match old behaviour for MoE (#7099)	1 an în urmă

Mai nou Mai vechi

Istoricul angajamentelor Găsiți

Istoricul angajamentelor