cturan/llama.cpp

Autor	SHA1 Nachricht	Datum
Andrei	d11afd6652 llava : fix moondream support (#7163)	vor 1 Jahr
Ouadie EL FAROUKI	8c570c9496 Minor arithmetic improvement to mmvq wrapper kernel (#7172)	vor 1 Jahr
slaren	eaf4bd8b39 eval-callback : fix conversion to float (#7184)	vor 1 Jahr
0cc4m	befddd0f15 Vulkan Bugfixes and Improvements (#7084)	vor 1 Jahr
Georgi Gerganov	d46dbc76f8 readme : add scheduled server workflow status badge	vor 1 Jahr
l3utterfly	0961d86604 readme : add app (#6371)	vor 1 Jahr
jaime-m-p	43248e5594 llama3 custom regex split (#6965)	vor 1 Jahr
Johannes Gäßler	a743d76a01 CUDA: generalize FP16 fattn vec kernel (#7061)	vor 1 Jahr
Galunid	f31ec120bc Add warning if token is invalid (#7173)	vor 1 Jahr
Daniel Bevenius	fd9f92b154 llama : update llama_timings.n_p_eval setting (#7160)	vor 1 Jahr
Sigbjørn Skjæret	22842164bc gguf-py : add special token modification capability (#7166)	vor 1 Jahr
Albert Jin	4734524882 opencl : alignment size converted from bits to bytes (#7090)	vor 1 Jahr
Ahmet Zeer	07cd41d096 TypoFix (#7162)	vor 1 Jahr
Jared Van Bortel	4426e2987b cmake : fix typo (#7151)	vor 1 Jahr
compilade	f98eb31c51 convert-hf : save memory with lazy evaluation (#7075)	vor 1 Jahr
agray3	bc4bba364f Introduction of CUDA Graphs to LLama.cpp (#6766)	vor 1 Jahr
Johannes Gäßler	c12452c7ae JSON: [key] -> .at(key), assert() -> GGML_ASSERT (#7143)	vor 1 Jahr
Georgi Gerganov	9da243b36a Revert "llava : add support for moondream vision language model (#6899)"	vor 1 Jahr
JohnnyB	bd1871fa2b server : add themes + favicon (#6848)	vor 1 Jahr
Gilad S	26458af1d6 metal : use `vm_allocate` instead of `posix_memalign` on macOS (#7078)	vor 1 Jahr
Dawid Potocki	83330d8cd6 main : add --conversation / -cnv flag (#7108)	vor 1 Jahr
Eve	465263d0cf sgemm : AVX Q4_0 and Q8_0 (#6891)	vor 1 Jahr
Johan	911b3900dd server : add_special option for tokenize endpoint (#7059)	vor 1 Jahr
20kdc	ad211edef5 convert.py : --vocab-only generates false but valid params (#7027)	vor 1 Jahr
Ren Xuancheng	229ffff872 llama : add BPE pre-tokenization for Qwen2 (#7114)	vor 1 Jahr
Xuan Son Nguyen	1fd9c1741d clean up json_value & server_log (#7142)	vor 1 Jahr
DAN™	4cd621c26d convert : add BPE pre-tokenization for DBRX (#7132)	vor 1 Jahr
Georgi Gerganov	7e0b6a7b3b py : also print the normalizers	vor 1 Jahr
Brian	acdce3cdef compare-llama-bench.py: add missing basicConfig (#7138)	vor 1 Jahr
Justine Tunney	3855416027 ggml : introduce bfloat16 support (#6412)	vor 1 Jahr

Neuer Älter

Commit Verlauf Finden

Commit Verlauf