Историја ревизија

Аутор SHA1 Порука Датум
  Diego Devesa 360d6533db ggml-backend : add GGML_BACKEND_DEVICE_TYPE_IGPU device type (#15797) пре 4 месеци
  Diego Devesa 9777032dcc llama : separate compute buffer reserve from fattn check (#15696) пре 4 месеци
  Jeff Bolz bd9c981d72 vulkan: Add fusion support for RMS_NORM+MUL (#14366) пре 6 месеци
  David Huang 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) пре 8 месеци
  Johannes Gäßler 9070365020 CUDA: fix logic for clearing padding with -ngl 0 (#13320) пре 8 месеци
  William Tambellini 70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854) пре 10 месеци
  Radoslav Gerganov 667d72846c rpc : early register backend devices (#11262) пре 1 година
  Gilad S. 43041d2eb3 ggml: load all backends from a user-provided search path (#10699) пре 1 година
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) пре 1 година
  Johannes Gäßler 8a43e940ab ggml: new optimization interface (ggml/988) пре 1 година
  Diego Devesa ae8de6d50a ggml : build backends as libraries (#10256) пре 1 година
  Diego Devesa 9f40989351 ggml : move CPU backend to a separate file (#10144) пре 1 година
  Diego Devesa c5b0f4b5d9 llama : refactor model loader with backend registry (#10026) пре 1 година
  Diego Devesa 6374743747 ggml : add backend registry / device interfaces to BLAS backend (#9752) пре 1 година
  Georgi Gerganov d5ac8cf2f2 ggml : add metal backend registry / device (#9713) пре 1 година
  Johannes Gäßler eee39bdc96 ggml: refactor cross entropy loss CPU impl. (ggml/976) пре 1 година
  bandoti d6fe7abf04 ggml: unify backend logging mechanism (#9709) пре 1 година
  Diego Devesa c83ad6d01e ggml-backend : add device and backend reg interfaces (#9707) пре 1 година
  Johannes Gäßler 424c5d00a9 ggml/examples: add backend support for numerical optimization (ggml/949) пре 1 година
  Faisal Zaghloul 42c76d1358 Threadpool: take 2 (#8672) пре 1 година
  Georgi Gerganov 231cff5f6f sync : ggml пре 1 година
  Johannes Gäßler a15ef8f8a0 CUDA: fix partial offloading for ne0 % 256 != 0 (#8572) пре 1 година
  Georgi Gerganov f3f65429c4 llama : reorganize source code + improve CMake (#8006) пре 1 година