0cc4m
|
befddd0f15
Vulkan Bugfixes and Improvements (#7084)
|
1 an în urmă |
Georgi Gerganov
|
d46dbc76f8
readme : add scheduled server workflow status badge
|
1 an în urmă |
l3utterfly
|
0961d86604
readme : add app (#6371)
|
1 an în urmă |
jaime-m-p
|
43248e5594
llama3 custom regex split (#6965)
|
1 an în urmă |
Johannes Gäßler
|
a743d76a01
CUDA: generalize FP16 fattn vec kernel (#7061)
|
1 an în urmă |
Galunid
|
f31ec120bc
Add warning if token is invalid (#7173)
|
1 an în urmă |
Daniel Bevenius
|
fd9f92b154
llama : update llama_timings.n_p_eval setting (#7160)
|
1 an în urmă |
Sigbjørn Skjæret
|
22842164bc
gguf-py : add special token modification capability (#7166)
|
1 an în urmă |
Albert Jin
|
4734524882
opencl : alignment size converted from bits to bytes (#7090)
|
1 an în urmă |
Ahmet Zeer
|
07cd41d096
TypoFix (#7162)
|
1 an în urmă |
Jared Van Bortel
|
4426e2987b
cmake : fix typo (#7151)
|
1 an în urmă |
compilade
|
f98eb31c51
convert-hf : save memory with lazy evaluation (#7075)
|
1 an în urmă |
agray3
|
bc4bba364f
Introduction of CUDA Graphs to LLama.cpp (#6766)
|
1 an în urmă |
Johannes Gäßler
|
c12452c7ae
JSON: [key] -> .at(key), assert() -> GGML_ASSERT (#7143)
|
1 an în urmă |
Georgi Gerganov
|
9da243b36a
Revert "llava : add support for moondream vision language model (#6899)"
|
1 an în urmă |
JohnnyB
|
bd1871fa2b
server : add themes + favicon (#6848)
|
1 an în urmă |
Gilad S
|
26458af1d6
metal : use `vm_allocate` instead of `posix_memalign` on macOS (#7078)
|
1 an în urmă |
Dawid Potocki
|
83330d8cd6
main : add --conversation / -cnv flag (#7108)
|
1 an în urmă |
Eve
|
465263d0cf
sgemm : AVX Q4_0 and Q8_0 (#6891)
|
1 an în urmă |
Johan
|
911b3900dd
server : add_special option for tokenize endpoint (#7059)
|
1 an în urmă |
20kdc
|
ad211edef5
convert.py : --vocab-only generates false but valid params (#7027)
|
1 an în urmă |
Ren Xuancheng
|
229ffff872
llama : add BPE pre-tokenization for Qwen2 (#7114)
|
1 an în urmă |
Xuan Son Nguyen
|
1fd9c1741d
clean up json_value & server_log (#7142)
|
1 an în urmă |
DAN™
|
4cd621c26d
convert : add BPE pre-tokenization for DBRX (#7132)
|
1 an în urmă |
Georgi Gerganov
|
7e0b6a7b3b
py : also print the normalizers
|
1 an în urmă |
Brian
|
acdce3cdef
compare-llama-bench.py: add missing basicConfig (#7138)
|
1 an în urmă |
Justine Tunney
|
3855416027
ggml : introduce bfloat16 support (#6412)
|
1 an în urmă |
Georgi Gerganov
|
c0e6fbf8c3
metal : fix unused warning
|
1 an în urmă |
Jeximo
|
c780e75305
Further tidy on Android instructions README.md (#7077)
|
1 an în urmă |
jukofyork
|
48b2f9c1fc
Fixed save_imatrix to match old behaviour for MoE (#7099)
|
1 an în urmă |