Masaya, Kato
|
faa0e6979a
ggml: aarch64: SVE kernels for q8_0_q8_0, q4_0_q8_0 vector dot (#7433)
|
hace 1 año |
Georgi Gerganov
|
e84b71c2c6
ggml : drop support for QK_K=64 (#7473)
|
hace 1 año |
k.h.lai
|
fcda1128bc
vulkan: add workaround for iterator boundary check to fix clang-cl debug build (#7426)
|
hace 1 año |
junchao-loongson
|
65c58207ec
ggml : add loongarch lsx and lasx support (#6454)
|
hace 1 año |
Srihari-mcw
|
33c8d50acc
Add provisions for windows support for BF16 code including CMake provision for enabling AVX512_BF16 (#7258)
|
hace 1 año |
slaren
|
d359f30921
llama : remove MPI backend (#7395)
|
hace 1 año |
Georgi Gerganov
|
059031b8c4
ci : re-enable sanitizer runs (#7358)
|
hace 1 año |
Engininja2
|
ef277de2ad
cmake : fix typo in AMDGPU_TARGETS (#7356)
|
hace 1 año |
Gavin Zhao
|
82ca83db3c
ROCm: use native CMake HIP support (#5966)
|
hace 1 año |
Max Krasnyansky
|
13ad16af12
Add support for properly optimized Windows ARM64 builds with LLVM and MSVC (#7191)
|
hace 1 año |
Radoslav Gerganov
|
5e31828d3e
ggml : add RPC backend (#6829)
|
hace 1 año |
Georgi Gerganov
|
6f1b63606f
cmake : fix version cmp (#7227)
|
hace 1 año |
slaren
|
b228aba91a
remove convert-lora-to-ggml.py (#7204)
|
hace 1 año |
Jared Van Bortel
|
4426e2987b
cmake : fix typo (#7151)
|
hace 1 año |
agray3
|
bc4bba364f
Introduction of CUDA Graphs to LLama.cpp (#6766)
|
hace 1 año |
William Tambellini
|
858f6b73f6
Add an option to build without CUDA VMM (#7067)
|
hace 1 año |
Georgi Gerganov
|
dba497e0c1
cmake : restore LLAMA_LLAMAFILE_DEFAULT
|
hace 1 año |
Georgi Gerganov
|
fa0b4ad252
cmake : remove obsolete ANDROID check
|
hace 1 año |
Justine Tunney
|
192090bae4
llamafile : improve sgemm.cpp (#6796)
|
hace 1 año |
Georgi Gerganov
|
3b8f1ec4b1
llamafile : tmp disable + build sgemm.o when needed (#6716)
|
hace 1 año |
Georgi Gerganov
|
666867b799
ggml : fix llamafile sgemm wdata offsets (#6710)
|
hace 1 año |
Justine Tunney
|
8cc91dc63c
ggml : add llamafile sgemm (#6414)
|
hace 1 año |
Matt Clayton
|
8093987090
cmake : add explicit metal version options (#6370)
|
hace 1 año |
Jared Van Bortel
|
32c8486e1f
wpm : portable unicode tolower (#6305)
|
hace 1 año |
Joseph Stahl
|
e190f1fca6
nix: make `xcrun` visible in Nix sandbox for precompiling Metal shaders (#6118)
|
hace 1 año |
slaren
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
hace 1 año |
slaren
|
ae1f211ce2
cuda : refactor into multiple files (#6269)
|
hace 1 año |
slaren
|
2f0e81e053
cuda : add LLAMA_CUDA_NO_PEER_COPY to workaround broken ROCm p2p copy (#6208)
|
hace 1 año |
Pierrick Hymbert
|
d01b3c4c32
common: llama_load_model_from_url using --model-url (#6098)
|
hace 1 año |
Georgi Gerganov
|
381da2d9f0
metal : build metallib + fix embed path (#6015)
|
hace 1 año |