Historial de Commits

Autor SHA1 Mensaje Fecha
  Masaya, Kato faa0e6979a ggml: aarch64: SVE kernels for q8_0_q8_0, q4_0_q8_0 vector dot (#7433) hace 1 año
  Georgi Gerganov e84b71c2c6 ggml : drop support for QK_K=64 (#7473) hace 1 año
  k.h.lai fcda1128bc vulkan: add workaround for iterator boundary check to fix clang-cl debug build (#7426) hace 1 año
  junchao-loongson 65c58207ec ggml : add loongarch lsx and lasx support (#6454) hace 1 año
  Srihari-mcw 33c8d50acc Add provisions for windows support for BF16 code including CMake provision for enabling AVX512_BF16 (#7258) hace 1 año
  slaren d359f30921 llama : remove MPI backend (#7395) hace 1 año
  Georgi Gerganov 059031b8c4 ci : re-enable sanitizer runs (#7358) hace 1 año
  Engininja2 ef277de2ad cmake : fix typo in AMDGPU_TARGETS (#7356) hace 1 año
  Gavin Zhao 82ca83db3c ROCm: use native CMake HIP support (#5966) hace 1 año
  Max Krasnyansky 13ad16af12 Add support for properly optimized Windows ARM64 builds with LLVM and MSVC (#7191) hace 1 año
  Radoslav Gerganov 5e31828d3e ggml : add RPC backend (#6829) hace 1 año
  Georgi Gerganov 6f1b63606f cmake : fix version cmp (#7227) hace 1 año
  slaren b228aba91a remove convert-lora-to-ggml.py (#7204) hace 1 año
  Jared Van Bortel 4426e2987b cmake : fix typo (#7151) hace 1 año
  agray3 bc4bba364f Introduction of CUDA Graphs to LLama.cpp (#6766) hace 1 año
  William Tambellini 858f6b73f6 Add an option to build without CUDA VMM (#7067) hace 1 año
  Georgi Gerganov dba497e0c1 cmake : restore LLAMA_LLAMAFILE_DEFAULT hace 1 año
  Georgi Gerganov fa0b4ad252 cmake : remove obsolete ANDROID check hace 1 año
  Justine Tunney 192090bae4 llamafile : improve sgemm.cpp (#6796) hace 1 año
  Georgi Gerganov 3b8f1ec4b1 llamafile : tmp disable + build sgemm.o when needed (#6716) hace 1 año
  Georgi Gerganov 666867b799 ggml : fix llamafile sgemm wdata offsets (#6710) hace 1 año
  Justine Tunney 8cc91dc63c ggml : add llamafile sgemm (#6414) hace 1 año
  Matt Clayton 8093987090 cmake : add explicit metal version options (#6370) hace 1 año
  Jared Van Bortel 32c8486e1f wpm : portable unicode tolower (#6305) hace 1 año
  Joseph Stahl e190f1fca6 nix: make `xcrun` visible in Nix sandbox for precompiling Metal shaders (#6118) hace 1 año
  slaren 280345968d cuda : rename build flag to LLAMA_CUDA (#6299) hace 1 año
  slaren ae1f211ce2 cuda : refactor into multiple files (#6269) hace 1 año
  slaren 2f0e81e053 cuda : add LLAMA_CUDA_NO_PEER_COPY to workaround broken ROCm p2p copy (#6208) hace 1 año
  Pierrick Hymbert d01b3c4c32 common: llama_load_model_from_url using --model-url (#6098) hace 1 año
  Georgi Gerganov 381da2d9f0 metal : build metallib + fix embed path (#6015) hace 1 año