howlger
|
1fc2f265ff
common : fix the short form of `--grp-attn-w`, not `-gat` (#4825)
|
2 ani în urmă |
Georgi Gerganov
|
a9a8c5de3d
readme : add link to SOTA models
|
2 ani în urmă |
Kawrakow
|
dd5ae06405
SOTA 2-bit quants (#4773)
|
2 ani în urmă |
Georgi Gerganov
|
668b31fc7d
swift : exclude ggml-metal.metal from the package (#4822)
|
2 ani în urmă |
Georgi Gerganov
|
42ea63c5a3
llama.swiftui : update readme
|
2 ani în urmă |
Georgi Gerganov
|
52531fdff8
main : add self-extend support (#4815)
|
2 ani în urmă |
Georgi Gerganov
|
b0034d93ce
examples : add passkey test (#3856)
|
2 ani în urmă |
Lars Grammel
|
b7e7982953
readme : add lgrammel/modelfusion JS/TS client for llama.cpp (#4814)
|
2 ani în urmă |
slaren
|
226460cc0d
llama-bench : add no-kv-offload parameter (#4812)
|
2 ani în urmă |
Johannes Gäßler
|
d5a410e855
CUDA: fixed redundant value dequantization (#4809)
|
2 ani în urmă |
Georgi Gerganov
|
9dede37d81
llama : remove unused vars (#4796)
|
2 ani în urmă |
Georgi Gerganov
|
3c36213df8
llama : remove redundant GQA check (#4796)
|
2 ani în urmă |
Alex Azarov
|
72d8407b36
llama.swiftui : use llama.cpp as SPM package (#4804)
|
2 ani în urmă |
Georgi Gerganov
|
d117d4dc5d
llama : print tensor meta for debugging
|
2 ani în urmă |
Alex Azarov
|
3418c03ecc
llama.swiftui : add visionOS target (#4805)
|
2 ani în urmă |
Konstantin Zhuravlyov
|
63ee677efd
ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (#4787)
|
2 ani în urmă |
Georgi Gerganov
|
67984921a7
server : fix n_predict check (#4798)
|
2 ani în urmă |
Daniel Illescas Romero
|
c75ca5d96f
llama.swiftui : use correct pointer for llama_token_eos (#4797)
|
2 ani în urmă |
Georgi Gerganov
|
96e80dabc6
examples : improve base-translate.sh script (#4783)
|
2 ani în urmă |
a-n-n-a-l-e-e
|
eec22a1c63
cmake : check for openblas64 (#4134)
|
2 ani în urmă |
Ikko Eltociear Ashimine
|
be36bb946a
flake.nix : fix typo (#4700)
|
2 ani în urmă |
Georgi Gerganov
|
91d38876df
metal : switch back to default.metallib (ggml/681)
|
2 ani în urmă |
Georgi Gerganov
|
d061bf9405
ggml : fix q2_k bpw in comments (ggml/680)
|
2 ani în urmă |
Finn Voorhees
|
1bf681f90e
ggml : add error handling to graph_compute (whisper/1714)
|
2 ani în urmă |
Georgi Gerganov
|
c1d7cb28d3
ggml : do not sched_yield when calling BLAS (#4761)
|
2 ani în urmă |
Georgi Gerganov
|
3681f22443
examples : add few-shot translation example (#4783)
|
2 ani în urmă |
Daniel Bevenius
|
b3a7c20b5c
finetune : remove unused includes (#4756)
|
2 ani în urmă |
Georgi Gerganov
|
012cf349ae
server : send token probs for "stream == false" (#4714)
|
2 ani în urmă |
Johannes Gäßler
|
a91928014f
Print backend name on test-backend-ops failure (#4751)
|
2 ani în urmă |
singularity
|
3c0b585561
llama.swiftui : support loading custom model from file picker (#4767)
|
2 ani în urmă |