Jhen-Jie Hong
|
c67fe68e41
metal : implement q5_0 and q5_1 kernels (#3648)
|
2 년 전 |
shibe2
|
1117d06607
opencl : fix element-wise multiplication (#3656)
|
2 년 전 |
slaren
|
cb33f43a2a
fix embeddings when using CUDA (#3657)
|
2 년 전 |
Georgi Gerganov
|
e1675d133c
llama : avoid fprintf in favor of LLAMA_LOG (#3538)
|
2 년 전 |
BarfingLemurs
|
8402566a7c
readme : update hot-topics & models, detail windows release in usage (#3615)
|
2 년 전 |
shibe2
|
40e5ce054f
CLBlast: Fix temporary buffer size for f16 conversion (wsize)
|
2 년 전 |
slaren
|
a5e8c1d8c7
train-text-from-scratch : fix assert failure in ggml-alloc (#3618)
|
2 년 전 |
Georgi Gerganov
|
e74c705e15
editorconfig : remove trailing spaces
|
2 년 전 |
coezbek
|
3ad1e3f1a1
server : documentation of JSON return value of /completion endpoint (#3632)
|
2 년 전 |
Georgi Gerganov
|
1142013da4
save-load-state : fix example + add ci test (#3655)
|
2 년 전 |
ldwang
|
5fe268a4d9
readme : add Aquila2 links (#3610)
|
2 년 전 |
staviq
|
1a159553f9
tokenizer : special token handling (#3538)
|
2 년 전 |
Georgi Gerganov
|
281ef73c25
k-quants : fix quantization ranges (#3646)
|
2 년 전 |
Georgi Gerganov
|
940efa95fe
llava : fix tokenization to not add bos between image embeddings and user prompt (#3645)
|
2 년 전 |
cebtenzzre
|
11bff29045
MPT : support GQA for replit-code-v1.5 (#3627)
|
2 년 전 |
M. Yusuf Sarıgöz
|
11dc1091f6
Honor -ngl option for Cuda offloading in llava (#3621)
|
2 년 전 |
Daniel Bevenius
|
2a4bcbacea
llama : remove n_threads from llama_decode_internal (#3614)
|
2 년 전 |
slaren
|
424b6381c4
ggml : add context enumeration functions (#3605)
|
2 년 전 |
shibe2
|
1e0e873c37
CLBlast: Fix matrix-vector multiplication (#3544)
|
2 년 전 |
M. Yusuf Sarıgöz
|
370359e5ba
examples: support LLaVA v1.5 (multimodal model) (#3436)
|
2 년 전 |
uint256_t
|
9e24cc6e2e
docs : fix typo GOMP_CPU_AFFINITY (#3597)
|
2 년 전 |
Georgi Gerganov
|
d28e572c02
cmake : fix add_compile_options on macOS
|
2 년 전 |
Ian Scrivener
|
f3040beaab
typo : it is `--n-gpu-layers` not `--gpu-layers` (#3592)
|
2 년 전 |
Georgi Gerganov
|
1a8c8795d6
ci : check if there is enough VRAM (#3596)
|
2 년 전 |
Aarni Koskela
|
b016596d90
server : add completion mode (no chat) (#3582)
|
2 년 전 |
Georgi Gerganov
|
6b3ae4da92
prompts : add mnemonics.txt
|
2 년 전 |
Georgi Gerganov
|
57dd55e2c7
server : fix kv cache management (#3588)
|
2 년 전 |
Georgi Gerganov
|
b8fe4b5cc9
main : fix session loading bug (#3400)
|
2 년 전 |
Michael Coppola
|
a8bdd65525
server : add parameter -tb N, --threads-batch N (#3584)
|
2 년 전 |
Kerfuffle
|
70c29da118
common : fix mirostat state when using multiple sequences (#3543)
|
2 년 전 |