Gabe Goodhart
|
edc4a29eff
memory : Hybrid recurrent cache (#13979)
|
7 luni în urmă |
Georgi Gerganov
|
ed3290ab34
metal : add mean kernel (#14267)
|
7 luni în urmă |
Aaron Teo
|
8d94713654
docs: add s390x build documentation (#14264)
|
7 luni în urmă |
Aaron Teo
|
50d2227953
ggml-cpu: reduce asm calls for hsum (#14037)
|
7 luni în urmă |
Aaron Teo
|
6231c5cd6d
ggml-cpu: fix uncaught underscore terminators (#14023)
|
7 luni în urmă |
Charles Xu
|
ef035803eb
ggml: Add Apple support for GGML_CPU_ALL_VARIANTS (#14258)
|
7 luni în urmă |
Xuan-Son Nguyen
|
413977de32
mtmd : refactor llava-uhd preprocessing logic (#14247)
|
7 luni în urmă |
Xuan-Son Nguyen
|
95402553a5
llama-chat : fix multiple system message for gemma, orion (#14246)
|
7 luni în urmă |
Sigbjørn Skjæret
|
3865cff4f5
convert : fix null head_dim AutoConfig regression (#14248)
|
7 luni în urmă |
Georgi Gerganov
|
d03172cc79
sync : ggml
|
7 luni în urmă |
Daniel Bevenius
|
dd8e59f443
ggml : disable warnings for tests when using MSVC (ggml/1273)
|
7 luni în urmă |
Daniel Bevenius
|
bbe98d2784
ggml : remove unused ggml_context_container (ggml/1272)
|
7 luni în urmă |
Daniel Bevenius
|
c2056ed6d4
examples : include examples in msvc disable warn (ggml/1270)
|
7 luni în urmă |
bandoti
|
c46503014d
cmake: remove shader-gen step-targets from ggml-vulkan (#14226)
|
7 luni în urmă |
xctan
|
860a9e4eef
ggml-cpu : remove the weak alias trick (#14221)
|
7 luni în urmă |
R0CKSTAR
|
fe9d60e74a
musa: fix build warning (unused variable) (#14231)
|
7 luni în urmă |
Sigbjørn Skjæret
|
e434e69183
common : suggest --jinja when autodetection fails (#14222)
|
7 luni în urmă |
Georgi Gerganov
|
89fea80d29
server : fix incorrect usage of llama_get_embeddings() (#14225)
|
7 luni în urmă |
Diego Devesa
|
6adc3c3ebc
llama : add thread safety test (#14035)
|
7 luni în urmă |
bandoti
|
0dbcabde8c
cmake: clean up external project logic for vulkan-shaders-gen (#14179)
|
7 luni în urmă |
Đinh Trọng Huy
|
ad590be98c
model : add NeoBERT (#14164)
|
7 luni în urmă |
uvos
|
7d6d91babf
HIP: disable rocwmma on gfx12 by default until rocm 7.0 (#14202)
|
7 luni în urmă |
Georgi Gerganov
|
d3e64b9f49
llama : rework embeddings logic (#14208)
|
7 luni în urmă |
Charles Xu
|
3ba0d843c6
ggml: Add Android support for GGML_CPU_ALL_VARIANTS (#14206)
|
7 luni în urmă |
Bartowski
|
0bf49eb668
convert : remove arcee change in convert_hf_to_gguf_update.py (#14207)
|
7 luni în urmă |
Đinh Trọng Huy
|
4ad243677b
gguf-py : allow key override when adding value to GGUFWriter (#14194)
|
7 luni în urmă |
Jeff Bolz
|
c89c2d1ab9
vulkan: mutex around vkQueueSubmit (#14127)
|
7 luni în urmă |
xctan
|
3555b3004b
ggml-cpu : rework weak alias on apple targets (#14146)
|
7 luni în urmă |
Bartowski
|
d7da8dc83a
model : Add support for Arcee AI's upcoming AFM model (#14185)
|
7 luni în urmă |
Eric Curtin
|
cd355eda7d
server : When listening on a unix domain socket don't print http:// and port (#14180)
|
7 luni în urmă |