Daniel Bevenius
|
4ed8e4fbef
llava : add explicit instructions for llava-1.6 (#5611)
|
1 an în urmă |
Xuan Son Nguyen
|
9c405c9f9a
Server: use llama_chat_apply_template (#5593)
|
1 an în urmă |
Dane Madsen
|
5207b3fbc5
readme : update UI list (#5605)
|
1 an în urmă |
Haoxiang Fei
|
8dbbd75754
metal : add build system support for embedded metal library (#5604)
|
1 an în urmă |
Pierrick Hymbert
|
c0a8c6db37
server : health endpoint configurable failure on no slot (#5594)
|
1 an în urmă |
AidanBeltonS
|
b9111bd209
Update ggml_sycl_op_mul_mat_vec_q (#5502)
|
1 an în urmă |
Mathijs de Bruin
|
633782b8d9
nix: now that we can do so, allow MacOS to build Vulkan binaries
|
1 an în urmă |
0cc4m
|
22f83f0c38
Enable Vulkan MacOS CI
|
1 an în urmă |
0cc4m
|
bb9dcd560a
Refactor validation and enumeration platform checks into functions to clean up ggml_vk_instance_init()
|
1 an în urmă |
0cc4m
|
f50db6ae0b
Add check for VK_KHR_portability_enumeration for MoltenVK support
|
1 an în urmă |
Mathijs de Bruin
|
d8c054517d
Add preprocessor checks for Apple devices.
|
1 an în urmă |
Mathijs de Bruin
|
42f664a382
Resolve ErrorIncompatibleDriver with Vulkan on MacOS.
|
1 an în urmă |
Mathijs de Bruin
|
5dde540897
Allow for Vulkan build with Accelerate.
|
1 an în urmă |
slaren
|
40c3a6c1e1
cuda : ignore peer access already enabled errors (#5597)
|
1 an în urmă |
Jared Van Bortel
|
f24ed14ee0
make : pass CPPFLAGS directly to nvcc, not via -Xcompiler (#5598)
|
1 an în urmă |
nopperl
|
9d679f0fcc
examples : support minItems/maxItems in JSON grammar converter (#5039)
|
1 an în urmă |
Georgi Gerganov
|
1387cf60f7
llava : remove extra cont (#5587)
|
1 an în urmă |
slaren
|
6fd413791a
llava : replace ggml_cpy with ggml_cont
|
1 an în urmă |
Georgi Gerganov
|
337c9cbd52
sync : ggml
|
1 an în urmă |
Georgi Gerganov
|
a3145bdc30
ggml-alloc : apply ggml/731
|
1 an în urmă |
Didzis Gosko
|
890559ab28
metal : option to embed MSL source into compiled binary (whisper/1842)
|
1 an în urmă |
Georgi Gerganov
|
d0e3ce51f4
ci : enable -Werror for CUDA builds (#5579)
|
1 an în urmă |
Georgi Gerganov
|
68a6b98b3c
make : fix CUDA build (#5580)
|
1 an în urmă |
valiray
|
70d45af0ef
readme : fix typo in README-sycl.md (#5353)
|
1 an în urmă |
Abhilash Majumder
|
13e2c771aa
cmake : remove obsolete sycl compile flags (#5581)
|
1 an în urmă |
Georgi Gerganov
|
f53119cec4
minor : fix trailing whitespace (#5538)
|
1 an în urmă |
Daniel Bevenius
|
7084755396
llava : avoid changing the original BakLLaVA model (#5577)
|
1 an în urmă |
NawafAlansari
|
4480542b22
baby-llama : allocate graphs in ggml_context (#5573)
|
1 an în urmă |
Xuan Son Nguyen
|
11b12de39b
llama : add llama_chat_apply_template() (#5538)
|
1 an în urmă |
slaren
|
3a9cb4ca64
cuda, metal : fix nans in soft_max (#5574)
|
1 an în urmă |