Xuan Son Nguyen
|
6c5bc0625f
server : (refactoring) do not rely on JSON internally (#10643)
|
1 tahun lalu |
Plamen Minev
|
7736837d62
fix(server) : not show alert when DONE is received (#10674)
|
1 tahun lalu |
Jeff Bolz
|
c9c6e01dae
vulkan: Add VK_NV_cooperative_matrix2 support for mul_mat and flash attention (#10206)
|
1 tahun lalu |
Riccardo Orlando
|
6fe6247831
llama : add Minerva 7B model support (#10673)
|
1 tahun lalu |
Georgi Gerganov
|
0cd182ebcc
sync : ggml
|
1 tahun lalu |
PAB
|
a8cbab201d
ggml: add `GGML_SET` Metal kernel + i32 CPU kernel (ggml/1037)
|
1 tahun lalu |
PAB
|
c2082d93a8
ggml : add `GGML_PAD_REFLECT_1D` operation (ggml/1034)
|
1 tahun lalu |
Daniel Bevenius
|
d405804be8
py : update outdated copy-paste instructions [no ci] (#10667)
|
1 tahun lalu |
aryantandon01
|
f112d198cd
Update deprecation-warning.cpp (#10619)
|
1 tahun lalu |
Georgi Gerganov
|
1da7b76569
server : fix speculative decoding with context shift (#10641)
|
1 tahun lalu |
Diego Devesa
|
59f4db1088
ggml : add predefined list of CPU backend variants to build (#10626)
|
1 tahun lalu |
Diego Devesa
|
2803540814
ggml-cpu : fix HWCAP2_I8MM value (#10646)
|
1 tahun lalu |
ltoniazzi
|
253b7fde91
Fix HF repo commit to clone lora test models (#10649)
|
1 tahun lalu |
JFLFY2255
|
8d0cfd554a
llama: Support MiniCPM-1B (with & w/o longrope) (#10559)
|
1 tahun lalu |
Jeff Bolz
|
2759916d86
vulkan: Implement "fast divide" (mul+shift) for unary ops like copy (#10642)
|
1 tahun lalu |
Nicolò Scipione
|
40c6d79fb5
SYCL : Move to compile time oneMKL interface backend selection for NVIDIA backend (#10584)
|
1 tahun lalu |
Wang Ran (汪然)
|
98036d5670
fix typo of README.md (#10605)
|
1 tahun lalu |
Frankie Robertson
|
cd2f37b304
Avoid using __fp16 on ARM with old nvcc (#10616)
|
1 tahun lalu |
Benson Wong
|
da6aac91f1
Add docs for creating a static build (#10268) (#10630)
|
1 tahun lalu |
piDack
|
01e6d9bb71
clip : add sycl support (#10574)
|
1 tahun lalu |
Jeff Bolz
|
cc98896db8
vulkan: optimize and reenable split_k (#10637)
|
1 tahun lalu |
Xuan Son Nguyen
|
91c36c269b
server : (web ui) Various improvements, now use vite as bundler (#10599)
|
1 tahun lalu |
Georgi Gerganov
|
1cd3df46bd
scripts : remove amx sync
|
1 tahun lalu |
Georgi Gerganov
|
c505471857
sync : ggml
|
1 tahun lalu |
mahorozte
|
e9e661bd59
CUDA: remove unnecessary warp reduce in FA (ggml/1032)
|
1 tahun lalu |
PAB
|
efb6ae9630
feat: add `GGML_UNARY_OP_ARGMAX` Metal kernel (ggml/1019)
|
1 tahun lalu |
PAB
|
667d70d170
metal : add `GGML_OP_CONV_TRANSPOSE_1D` kernels (ggml/1026)
|
1 tahun lalu |
Xuan Son Nguyen
|
3b4f2e33e2
llama : add missing LLAMA_API for llama_chat_builtin_templates (#10636)
|
1 tahun lalu |
Nikolaos Pothitos
|
82bca2257b
readme : add option, update default value, fix formatting (#10271)
|
1 tahun lalu |
Georgi Gerganov
|
0115df2f65
metal : small-batch mat-mul kernels (#10581)
|
1 tahun lalu |