cturan/llama.cpp

Autor	SHA1 Mensagem	Data
David Huang	7f323a589f Add `--no-op-offload` to improve `-ot` pp perf in MoE models like llama4 400B (#13386)	há 8 meses atrás
Johannes Gäßler	9070365020 CUDA: fix logic for clearing padding with -ngl 0 (#13320)	há 9 meses atrás
William Tambellini	70680c48e5 ggml : upgrade init_tensor API to return a ggml_status (#11854)	há 11 meses atrás
Radoslav Gerganov	667d72846c rpc : early register backend devices (#11262)	há 1 ano atrás
Gilad S.	43041d2eb3 ggml: load all backends from a user-provided search path (#10699)	há 1 ano atrás
Diego Devesa	5931c1f233 ggml : add support for dynamic loading of backends (#10469)	há 1 ano atrás
Johannes Gäßler	8a43e940ab ggml: new optimization interface (ggml/988)	há 1 ano atrás
Diego Devesa	ae8de6d50a ggml : build backends as libraries (#10256)	há 1 ano atrás
Diego Devesa	9f40989351 ggml : move CPU backend to a separate file (#10144)	há 1 ano atrás
Diego Devesa	c5b0f4b5d9 llama : refactor model loader with backend registry (#10026)	há 1 ano atrás
Diego Devesa	6374743747 ggml : add backend registry / device interfaces to BLAS backend (#9752)	há 1 ano atrás
Georgi Gerganov	d5ac8cf2f2 ggml : add metal backend registry / device (#9713)	há 1 ano atrás
Johannes Gäßler	eee39bdc96 ggml: refactor cross entropy loss CPU impl. (ggml/976)	há 1 ano atrás
bandoti	d6fe7abf04 ggml: unify backend logging mechanism (#9709)	há 1 ano atrás
Diego Devesa	c83ad6d01e ggml-backend : add device and backend reg interfaces (#9707)	há 1 ano atrás
Johannes Gäßler	424c5d00a9 ggml/examples: add backend support for numerical optimization (ggml/949)	há 1 ano atrás
Faisal Zaghloul	42c76d1358 Threadpool: take 2 (#8672)	há 1 ano atrás
Georgi Gerganov	231cff5f6f sync : ggml	há 1 ano atrás
Johannes Gäßler	a15ef8f8a0 CUDA: fix partial offloading for ne0 % 256 != 0 (#8572)	há 1 ano atrás
Georgi Gerganov	f3f65429c4 llama : reorganize source code + improve CMake (#8006)	há 1 ano atrás

Histórico de Commits Pesquisar

Histórico de Commits