coezbek
|
3ad1e3f1a1
server : documentation of JSON return value of /completion endpoint (#3632)
|
2 tahun lalu |
Georgi Gerganov
|
1142013da4
save-load-state : fix example + add ci test (#3655)
|
2 tahun lalu |
ldwang
|
5fe268a4d9
readme : add Aquila2 links (#3610)
|
2 tahun lalu |
staviq
|
1a159553f9
tokenizer : special token handling (#3538)
|
2 tahun lalu |
Georgi Gerganov
|
281ef73c25
k-quants : fix quantization ranges (#3646)
|
2 tahun lalu |
Georgi Gerganov
|
940efa95fe
llava : fix tokenization to not add bos between image embeddings and user prompt (#3645)
|
2 tahun lalu |
cebtenzzre
|
11bff29045
MPT : support GQA for replit-code-v1.5 (#3627)
|
2 tahun lalu |
M. Yusuf Sarıgöz
|
11dc1091f6
Honor -ngl option for Cuda offloading in llava (#3621)
|
2 tahun lalu |
Daniel Bevenius
|
2a4bcbacea
llama : remove n_threads from llama_decode_internal (#3614)
|
2 tahun lalu |
slaren
|
424b6381c4
ggml : add context enumeration functions (#3605)
|
2 tahun lalu |
shibe2
|
1e0e873c37
CLBlast: Fix matrix-vector multiplication (#3544)
|
2 tahun lalu |
M. Yusuf Sarıgöz
|
370359e5ba
examples: support LLaVA v1.5 (multimodal model) (#3436)
|
2 tahun lalu |
uint256_t
|
9e24cc6e2e
docs : fix typo GOMP_CPU_AFFINITY (#3597)
|
2 tahun lalu |
Georgi Gerganov
|
d28e572c02
cmake : fix add_compile_options on macOS
|
2 tahun lalu |
Ian Scrivener
|
f3040beaab
typo : it is `--n-gpu-layers` not `--gpu-layers` (#3592)
|
2 tahun lalu |
Georgi Gerganov
|
1a8c8795d6
ci : check if there is enough VRAM (#3596)
|
2 tahun lalu |
Aarni Koskela
|
b016596d90
server : add completion mode (no chat) (#3582)
|
2 tahun lalu |
Georgi Gerganov
|
6b3ae4da92
prompts : add mnemonics.txt
|
2 tahun lalu |
Georgi Gerganov
|
57dd55e2c7
server : fix kv cache management (#3588)
|
2 tahun lalu |
Georgi Gerganov
|
b8fe4b5cc9
main : fix session loading bug (#3400)
|
2 tahun lalu |
Michael Coppola
|
a8bdd65525
server : add parameter -tb N, --threads-batch N (#3584)
|
2 tahun lalu |
Kerfuffle
|
70c29da118
common : fix mirostat state when using multiple sequences (#3543)
|
2 tahun lalu |
Georgi Gerganov
|
8c70a5ff25
batched : add bench tool (#3545)
|
2 tahun lalu |
Zane Shannon
|
24ba3d829e
examples : add batched.swift + improve CI for swift (#3562)
|
2 tahun lalu |
Galunid
|
9f6ede19f3
Add MPT model to supported models in README.md (#3574)
|
2 tahun lalu |
goerch
|
233fc1c69f
Minor improvements in GPT2 tokenizer (#3567)
|
2 tahun lalu |
Xingchen Song(宋星辰)
|
c5b49360d0
readme : add bloom (#3570)
|
2 tahun lalu |
Xingchen Song(宋星辰)
|
02d2875def
llm : add bloom models (#3553)
|
2 tahun lalu |
Jhen-Jie Hong
|
0aa6595ae0
swift : improvements and fixes (#3564)
|
2 tahun lalu |
Jan Ploski
|
f5f9121de1
llm : add MPT support (#3417)
|
2 tahun lalu |