Historie revizí

Autor SHA1 Zpráva Datum
  R0CKSTAR 251364549f musa: support new arch mp_31 and update doc (#12296) před 10 měsíci
  Johannes Gäßler a28e0d5eb1 CUDA: app option to compile without FlashAttention (#12025) před 10 měsíci
  Bodhi 0b3863ff95 MUSA: support ARM64 and enable dp4a .etc (#11843) před 11 měsíci
  Olivier Chafik 63e489c025 tool-call: refactor common chat / tool-call api (+ tests / fixes) (#11900) před 11 měsíci
  Georgi Gerganov 68ff663a04 repo : update links to new url (#11886) před 11 měsíci
  Johannes Gäßler 864a0b67a6 CUDA: use mma PTX instructions for FlashAttention (#11583) před 11 měsíci
  Olivier Chafik 8b576b6c55 Tool call support (generic + native for Llama, Functionary, Hermes, Mistral, Firefunction, DeepSeek) w/ lazy grammars (#9639) před 11 měsíci
  Olivier Chafik 6171c9d258 Add Jinja template support (#11016) před 1 rokem
  HimariO ba1cb19cdd llama : add Qwen2VL support + multimodal RoPE (#10361) před 1 rokem
  Djip007 19d8762ab6 ggml : refactor online repacking (#10446) před 1 rokem
  Xuan Son Nguyen 91c36c269b server : (web ui) Various improvements, now use vite as bundler (#10599) před 1 rokem
  Georgi Gerganov 8648c52101 make : deprecate (#10514) před 1 rokem
  Wang Qin 43957ef203 build: update Makefile comments for C++ version change (#10598) před 1 rokem
  Diego Devesa 7cc2d2c889 ggml : move AMX to the CPU backend (#10570) před 1 rokem
  Tristan Druyen be0e350c8b Fix HIP flag inconsistency & build docs (#10524) před 1 rokem
  R0CKSTAR 249cd93da3 mtgpu: Add MUSA_DOCKER_ARCH in Dockerfiles && update cmake and make (#10516) před 1 rokem
  Eric Curtin 0cc63754b8 Introduce llama-run (#10291) před 1 rokem
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) před 1 rokem
  Georgi Gerganov d9d54e498d speculative : refactor and add a simpler example (#10362) před 1 rokem
  Anthony Van de Gejuchte 3952a221af Fix missing file renames in Makefile due to changes in commit ae8de6d50a (#10413) před 1 rokem
  Georgi Gerganov cf32a9b93a metal : refactor kernel args into structs (#10238) před 1 rokem
  Johannes Gäßler c3ea58aca4 CUDA: remove DMMV, consolidate F16 mult mat vec (#10318) před 1 rokem
  Georgi Gerganov a4200cafad make : add ggml-opt (#0) před 1 rokem
  Georgi Gerganov 84274a10c3 tests : remove test-grad0 před 1 rokem
  Georgi Gerganov 8ee0d09ae6 make : auto-determine dependencies (#0) před 1 rokem
  slaren 883d206fbd ggml : fix some build issues před 1 rokem
  Charles Xu 1607a5e5b0 backend cpu: add online flow for aarch64 Q4_0 GEMV/GEMM kernels (#9921) před 1 rokem
  Diego Devesa ae8de6d50a ggml : build backends as libraries (#10256) před 1 rokem
  Georgi Gerganov ec450d3bbf metal : opt-in compile flag for BF16 (#10218) před 1 rokem
  Xuan Son Nguyen a71d81cf8c server : revamp chat UI with vuejs and daisyui (#10175) před 1 rokem