Histórico de Commits

Autor SHA1 Mensagem Data
  David Huang 7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386) há 8 meses atrás
  Johannes Gäßler 9070365020 CUDA: fix logic for clearing padding with -ngl 0 (#13320) há 9 meses atrás
  William Tambellini 70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854) há 11 meses atrás
  Radoslav Gerganov 667d72846c rpc : early register backend devices (#11262) há 1 ano atrás
  Gilad S. 43041d2eb3 ggml: load all backends from a user-provided search path (#10699) há 1 ano atrás
  Diego Devesa 5931c1f233 ggml : add support for dynamic loading of backends (#10469) há 1 ano atrás
  Johannes Gäßler 8a43e940ab ggml: new optimization interface (ggml/988) há 1 ano atrás
  Diego Devesa ae8de6d50a ggml : build backends as libraries (#10256) há 1 ano atrás
  Diego Devesa 9f40989351 ggml : move CPU backend to a separate file (#10144) há 1 ano atrás
  Diego Devesa c5b0f4b5d9 llama : refactor model loader with backend registry (#10026) há 1 ano atrás
  Diego Devesa 6374743747 ggml : add backend registry / device interfaces to BLAS backend (#9752) há 1 ano atrás
  Georgi Gerganov d5ac8cf2f2 ggml : add metal backend registry / device (#9713) há 1 ano atrás
  Johannes Gäßler eee39bdc96 ggml: refactor cross entropy loss CPU impl. (ggml/976) há 1 ano atrás
  bandoti d6fe7abf04 ggml: unify backend logging mechanism (#9709) há 1 ano atrás
  Diego Devesa c83ad6d01e ggml-backend : add device and backend reg interfaces (#9707) há 1 ano atrás
  Johannes Gäßler 424c5d00a9 ggml/examples: add backend support for numerical optimization (ggml/949) há 1 ano atrás
  Faisal Zaghloul 42c76d1358 Threadpool: take 2 (#8672) há 1 ano atrás
  Georgi Gerganov 231cff5f6f sync : ggml há 1 ano atrás
  Johannes Gäßler a15ef8f8a0 CUDA: fix partial offloading for ne0 % 256 != 0 (#8572) há 1 ano atrás
  Georgi Gerganov f3f65429c4 llama : reorganize source code + improve CMake (#8006) há 1 ano atrás