Jared Van Bortel
|
e8dc55d006
kompute : llama-bench support and ggml_cpu_has_kompute() (#5226)
|
1 년 전 |
Georgi Gerganov
|
e0085fdf7c
Revert "server : change deps.sh xxd files to string literals (#5221)"
|
1 년 전 |
Georgi Gerganov
|
e6f291d158
server : fix context shift (#5195)
|
1 년 전 |
JohnnyB
|
4003be0e5f
server : change deps.sh xxd files to string literals (#5221)
|
1 년 전 |
Kawrakow
|
fea4fd4ba7
ggml : fix IQ3_XXS on Metal (#5219)
|
1 년 전 |
Georgi Gerganov
|
8f8ddfcfad
sync : ggml (#0)
|
1 년 전 |
Georgi Gerganov
|
6fb50ebbf0
gguf : fix comparison (ggml/715)
|
1 년 전 |
John Balis
|
625a699b54
`ggml_cuda_cpy` support for 4d tensors and float16->float32 upcasting (ggml/686)
|
1 년 전 |
Georgi Gerganov
|
a4b07c057a
gguf : add input validation, prevent integer overflows (ggml/709)
|
1 년 전 |
Georgi Gerganov
|
549a1e6cd5
ci : fix yolo URLs + fix metal capture (ggml/712)
|
1 년 전 |
Jack Mousseau
|
5f14ee0b0c
metal : add debug capture backend function (ggml/694)
|
1 년 전 |
Kawrakow
|
8e14e3ddb3
Faster AVX2 dot product for IQ2_XS (#5187)
|
1 년 전 |
Kawrakow
|
f4d7e54974
SOTA 3-bit quants (#5196)
|
1 년 전 |
0cc4m
|
2256f36b79
Vulkan Windows APU Memory Handling (#5199)
|
1 년 전 |
Vladimir Malyutin
|
7359016c7c
quantize : fix typo (#5211)
|
1 년 전 |
divinity76
|
813416991a
main : allow empty --prompt-cache file (#5176)
|
1 년 전 |
Romain Neutron
|
5589921ef8
readme : minor (#5204)
|
1 년 전 |
Georgi Gerganov
|
49f44b5c55
readme : update hot topics
|
1 년 전 |
Wu Jian Ping
|
6685cc41c2
server : improve README (#5209)
|
1 년 전 |
Paul Tsochantaris
|
ceebbb5b21
ggml alloc: Fix for null dereference on alloc failure (#5200)
|
1 년 전 |
Jared Van Bortel
|
6daa69ee81
kompute : fix fallback to CPU (#5201)
|
1 년 전 |
Jared Van Bortel
|
fbf1ddec69
Nomic Vulkan backend (#4456)
|
1 년 전 |
divinity76
|
2aed77eb06
fix typo "RLIMIT_MLOCK" (#5175)
|
1 년 전 |
Wu Jian Ping
|
c82d18e863
server : embeddings compatibility for OpenAI (#5190)
|
1 년 전 |
Georgi Gerganov
|
14fef85e2d
py : fix except (#5194)
|
1 년 전 |
Sang-Kil Park
|
e76627bcce
py : improve BPE tokenizer support (#5189)
|
1 년 전 |
slaren
|
fbe7dfa53c
ggml : add max buffer sizes to opencl and metal backends (#5181)
|
1 년 전 |
Eve
|
172ac82629
cmake : fix Vulkan build (#5182)
|
1 년 전 |
Paul Tsochantaris
|
d2f650cb5b
metal : free metal objects (#5161)
|
1 년 전 |
Georgi Gerganov
|
35dec26cc2
sync : ggml
|
1 년 전 |