Alex Azarov
|
3418c03ecc
llama.swiftui : add visionOS target (#4805)
|
há 2 anos atrás |
Konstantin Zhuravlyov
|
63ee677efd
ggml : use __builtin_amdgcn_sudot4 in __dp4a for gfx11 (#4787)
|
há 2 anos atrás |
Georgi Gerganov
|
67984921a7
server : fix n_predict check (#4798)
|
há 2 anos atrás |
Daniel Illescas Romero
|
c75ca5d96f
llama.swiftui : use correct pointer for llama_token_eos (#4797)
|
há 2 anos atrás |
Georgi Gerganov
|
96e80dabc6
examples : improve base-translate.sh script (#4783)
|
há 2 anos atrás |
a-n-n-a-l-e-e
|
eec22a1c63
cmake : check for openblas64 (#4134)
|
há 2 anos atrás |
Ikko Eltociear Ashimine
|
be36bb946a
flake.nix : fix typo (#4700)
|
há 2 anos atrás |
Georgi Gerganov
|
91d38876df
metal : switch back to default.metallib (ggml/681)
|
há 2 anos atrás |
Georgi Gerganov
|
d061bf9405
ggml : fix q2_k bpw in comments (ggml/680)
|
há 2 anos atrás |
Finn Voorhees
|
1bf681f90e
ggml : add error handling to graph_compute (whisper/1714)
|
há 2 anos atrás |
Georgi Gerganov
|
c1d7cb28d3
ggml : do not sched_yield when calling BLAS (#4761)
|
há 2 anos atrás |
Georgi Gerganov
|
3681f22443
examples : add few-shot translation example (#4783)
|
há 2 anos atrás |
Daniel Bevenius
|
b3a7c20b5c
finetune : remove unused includes (#4756)
|
há 2 anos atrás |
Georgi Gerganov
|
012cf349ae
server : send token probs for "stream == false" (#4714)
|
há 2 anos atrás |
Johannes Gäßler
|
a91928014f
Print backend name on test-backend-ops failure (#4751)
|
há 2 anos atrás |
singularity
|
3c0b585561
llama.swiftui : support loading custom model from file picker (#4767)
|
há 2 anos atrás |
Michael Coppola
|
e5804313a1
server : fix options in README.md (#4765)
|
há 2 anos atrás |
Georgi Gerganov
|
dc891b7f7a
ggml : include stdlib.h before intrin.h (#4736)
|
há 2 anos atrás |
singularity
|
46cea79e1f
llama.swiftui : fix build of ggml.metallib (#4754)
|
há 2 anos atrás |
Daniel Bevenius
|
cb1e2818e0
train : fix typo in overlapping-samples help msg (#4758)
|
há 2 anos atrás |
Ashraful Islam
|
ece9a45e8f
swift : update Package.swift to use ggml as dependency (#4691)
|
há 2 anos atrás |
Georgi Gerganov
|
7bed7eba35
cuda : simplify expression
|
há 2 anos atrás |
Georgi Gerganov
|
d55356d3ba
cuda : mark I16 and I32 ops as unsupported
|
há 2 anos atrás |
Georgi Gerganov
|
75e3fd8581
sync : ggml
|
há 2 anos atrás |
Georgi Gerganov
|
289313716f
metal : add kernel_get_rows_i32
|
há 2 anos atrás |
Georgi Gerganov
|
ab62fc3e55
scripts : fix sync order + metal sed
|
há 2 anos atrás |
Guillaume Wenzek
|
5f66ebca9c
ggml : extend ggml_get_rows, ggml_repeat, ggml_concat (ggml/639)
|
há 2 anos atrás |
Justin Parker
|
f2eb19bd8b
server : throw an error when `slot unavailable` (#4741)
|
há 2 anos atrás |
Georgi Gerganov
|
f3f62f0d83
metal : optimize ggml_mul_mat_id (faster Mixtral PP) (#4725)
|
há 2 anos atrás |
Phil H
|
0ef3ca2ac6
server : add token counts to html footer (#4738)
|
há 2 anos atrás |