Commit Verlauf

Autor SHA1 Nachricht Datum
  Djip007 19d8762ab6 ggml : refactor online repacking (#10446) vor 1 Jahr
  Xuan Son Nguyen 91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599) vor 1 Jahr
  Georgi Gerganov 8648c52101 make : deprecate (#10514) vor 1 Jahr
  Wang Qin 43957ef203 build: update Makefile comments for C++ version change (#10598) vor 1 Jahr
  Diego Devesa 7cc2d2c889 ggml : move AMX to the CPU backend (#10570) vor 1 Jahr
  Tristan Druyen be0e350c8b Fix HIP flag inconsistency & build docs (#10524) vor 1 Jahr
  R0CKSTAR 249cd93da3 mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516) vor 1 Jahr
  Eric Curtin 0cc63754b8 Introduce llama-run (#10291) vor 1 Jahr
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) vor 1 Jahr
  Georgi Gerganov d9d54e498d speculative : refactor and add a simpler example (#10362) vor 1 Jahr
  Anthony Van de Gejuchte 3952a221af Fix missing file renames in Makefile due to changes in commit ae8de6d50a (#10413) vor 1 Jahr
  Georgi Gerganov cf32a9b93a metal : refactor kernel args into structs (#10238) vor 1 Jahr
  Johannes Gäßler c3ea58aca4 CUDA: remove DMMV, consolidate F16 mult mat vec (#10318) vor 1 Jahr
  Georgi Gerganov a4200cafad make : add ggml-opt (#0) vor 1 Jahr
  Georgi Gerganov 84274a10c3 tests : remove test-grad0 vor 1 Jahr
  Georgi Gerganov 8ee0d09ae6 make : auto-determine dependencies (#0) vor 1 Jahr
  slaren 883d206fbd ggml : fix some build issues vor 1 Jahr
  Charles Xu 1607a5e5b0 backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (#9921) vor 1 Jahr
  Diego Devesa ae8de6d50a ggml : build backends as libraries (#10256) vor 1 Jahr
  Georgi Gerganov ec450d3bbf metal : opt-in compile flag for BF16 (#10218) vor 1 Jahr
  Xuan Son Nguyen a71d81cf8c server : revamp chat UI with vuejs and daisyui (#10175) vor 1 Jahr
  Diego Devesa 9f40989351 ggml : move CPU backend to a separate file (#10144) vor 1 Jahr
  Diego Devesa a6744e43e8 llama : add simple-chat example (#10124) vor 1 Jahr
  Ma Mingfei 60ce97c9d8 add amx kernel for gemm (#8998) vor 1 Jahr
  Diego Devesa c83ad6d01e ggml-backend : add device and backend reg interfaces (#9707) vor 1 Jahr
  Georgi Gerganov 148844fe97 examples : remove benchmark (#9704) vor 1 Jahr
  R0CKSTAR c35e586ea5 musa: enable building fat binaries, enable unified memory, and disable Flash Attention on QY1 (MTT S80) (#9526) vor 1 Jahr
  Georgi Gerganov 19514d632e cmake : do not hide GGML options + rename option (#9465) vor 1 Jahr
  Georgi Gerganov 6262d13e0b common : reimplement logging (#9418) vor 1 Jahr
  Xuan Son Nguyen feff4aa846 server : add loading html page while model is loading (#9468) vor 1 Jahr