cturan/llama.cpp

Autor	SHA1 Permisiunea de a trimite mesaje. Dacă este dezactivată, utilizatorul nu va putea trimite nici un fel de mesaj	Data
howlger	1fc2f265ff common : fix the short form of `--grp-attn-w`, not `-gat` (#4825)	2 ani în urmă
Georgi Gerganov	a9a8c5de3d readme : add link to SOTA models	2 ani în urmă
Kawrakow	dd5ae06405 SOTA 2-bit quants (#4773)	2 ani în urmă
Georgi Gerganov	668b31fc7d swift : exclude ggml-metal.metal from the package (#4822)	2 ani în urmă
Georgi Gerganov	42ea63c5a3 llama.swiftui : update readme	2 ani în urmă
Georgi Gerganov	52531fdff8 main : add self-extend support (#4815)	2 ani în urmă
Georgi Gerganov	b0034d93ce examples : add passkey test (#3856)	2 ani în urmă
Lars Grammel	b7e7982953 readme : add lgrammel/modelfusion JS/TS client for llama.cpp (#4814)	2 ani în urmă
slaren	226460cc0d llama-bench : add no-kv-offload parameter (#4812)	2 ani în urmă
Johannes Gäßler	d5a410e855 CUDA: fixed redundant value dequantization (#4809)	2 ani în urmă
Georgi Gerganov	9dede37d81 llama : remove unused vars (#4796)	2 ani în urmă
Georgi Gerganov	3c36213df8 llama : remove redundant GQA check (#4796)	2 ani în urmă
Alex Azarov	72d8407b36 llama.swiftui : use llama.cpp as SPM package (#4804)	2 ani în urmă
Georgi Gerganov	d117d4dc5d llama : print tensor meta for debugging	2 ani în urmă
Alex Azarov	3418c03ecc llama.swiftui : add visionOS target (#4805)	2 ani în urmă
Konstantin Zhuravlyov	63ee677efd ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (#4787)	2 ani în urmă
Georgi Gerganov	67984921a7 server : fix n_predict check (#4798)	2 ani în urmă
Daniel Illescas Romero	c75ca5d96f llama.swiftui : use correct pointer for llama_token_eos (#4797)	2 ani în urmă
Georgi Gerganov	96e80dabc6 examples : improve base-translate.sh script (#4783)	2 ani în urmă
a-n-n-a-l-e-e	eec22a1c63 cmake : check for openblas64 (#4134)	2 ani în urmă
Ikko Eltociear Ashimine	be36bb946a flake.nix : fix typo (#4700)	2 ani în urmă
Georgi Gerganov	91d38876df metal : switch back to default.metallib (ggml/681)	2 ani în urmă
Georgi Gerganov	d061bf9405 ggml : fix q2_k bpw in comments (ggml/680)	2 ani în urmă
Finn Voorhees	1bf681f90e ggml : add error handling to graph_compute (whisper/1714)	2 ani în urmă
Georgi Gerganov	c1d7cb28d3 ggml : do not sched_yield when calling BLAS (#4761)	2 ani în urmă
Georgi Gerganov	3681f22443 examples : add few-shot translation example (#4783)	2 ani în urmă
Daniel Bevenius	b3a7c20b5c finetune : remove unused includes (#4756)	2 ani în urmă
Georgi Gerganov	012cf349ae server : send token probs for "stream == false" (#4714)	2 ani în urmă
Johannes Gäßler	a91928014f Print backend name on test-backend-ops failure (#4751)	2 ani în urmă
singularity	3c0b585561 llama.swiftui : support loading custom model from file picker (#4767)	2 ani în urmă

Mai nou Mai vechi

Istoricul angajamentelor Găsiți

Istoricul angajamentelor