Georgi Gerganov
|
b0034d93ce
examples : add passkey test (#3856)
|
hace 2 años |
Lars Grammel
|
b7e7982953
readme : add lgrammel/modelfusion JS/TS client for llama.cpp (#4814)
|
hace 2 años |
slaren
|
226460cc0d
llama-bench : add no-kv-offload parameter (#4812)
|
hace 2 años |
Johannes Gäßler
|
d5a410e855
CUDA: fixed redundant value dequantization (#4809)
|
hace 2 años |
Georgi Gerganov
|
9dede37d81
llama : remove unused vars (#4796)
|
hace 2 años |
Georgi Gerganov
|
3c36213df8
llama : remove redundant GQA check (#4796)
|
hace 2 años |
Alex Azarov
|
72d8407b36
llama.swiftui : use llama.cpp as SPM package (#4804)
|
hace 2 años |
Georgi Gerganov
|
d117d4dc5d
llama : print tensor meta for debugging
|
hace 2 años |
Alex Azarov
|
3418c03ecc
llama.swiftui : add visionOS target (#4805)
|
hace 2 años |
Konstantin Zhuravlyov
|
63ee677efd
ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (#4787)
|
hace 2 años |
Georgi Gerganov
|
67984921a7
server : fix n_predict check (#4798)
|
hace 2 años |
Daniel Illescas Romero
|
c75ca5d96f
llama.swiftui : use correct pointer for llama_token_eos (#4797)
|
hace 2 años |
Georgi Gerganov
|
96e80dabc6
examples : improve base-translate.sh script (#4783)
|
hace 2 años |
a-n-n-a-l-e-e
|
eec22a1c63
cmake : check for openblas64 (#4134)
|
hace 2 años |
Ikko Eltociear Ashimine
|
be36bb946a
flake.nix : fix typo (#4700)
|
hace 2 años |
Georgi Gerganov
|
91d38876df
metal : switch back to default.metallib (ggml/681)
|
hace 2 años |
Georgi Gerganov
|
d061bf9405
ggml : fix q2_k bpw in comments (ggml/680)
|
hace 2 años |
Finn Voorhees
|
1bf681f90e
ggml : add error handling to graph_compute (whisper/1714)
|
hace 2 años |
Georgi Gerganov
|
c1d7cb28d3
ggml : do not sched_yield when calling BLAS (#4761)
|
hace 2 años |
Georgi Gerganov
|
3681f22443
examples : add few-shot translation example (#4783)
|
hace 2 años |
Daniel Bevenius
|
b3a7c20b5c
finetune : remove unused includes (#4756)
|
hace 2 años |
Georgi Gerganov
|
012cf349ae
server : send token probs for "stream == false" (#4714)
|
hace 2 años |
Johannes Gäßler
|
a91928014f
Print backend name on test-backend-ops failure (#4751)
|
hace 2 años |
singularity
|
3c0b585561
llama.swiftui : support loading custom model from file picker (#4767)
|
hace 2 años |
Michael Coppola
|
e5804313a1
server : fix options in README.md (#4765)
|
hace 2 años |
Georgi Gerganov
|
dc891b7f7a
ggml : include stdlib.h before intrin.h (#4736)
|
hace 2 años |
singularity
|
46cea79e1f
llama.swiftui : fix build of ggml.metallib (#4754)
|
hace 2 años |
Daniel Bevenius
|
cb1e2818e0
train : fix typo in overlapping-samples help msg (#4758)
|
hace 2 años |
Ashraful Islam
|
ece9a45e8f
swift : update Package.swift to use ggml as dependency (#4691)
|
hace 2 años |
Georgi Gerganov
|
7bed7eba35
cuda : simplify expression
|
hace 2 años |