Georgi Gerganov
|
46323fa9ef
metal : hide debug messages from normal log
|
před 1 rokem |
SXX
|
5b359bb1e3
ggml: fix zero division in ‘dne’ calculation in CUDA COUNT_EQUAL operator when ‘ne’ is small (#10213)
|
před 1 rokem |
amritahs-ibm
|
e89213492d
ggml : optimize llamafile cpu matrix multiplication for ppc64le (#10156)
|
před 1 rokem |
haopeng
|
8fc393f246
scripts : fix pattern and get n_tokens in one go (#10221)
|
před 1 rokem |
Georgi Gerganov
|
ec450d3bbf
metal : opt-in compile flag for BF16 (#10218)
|
před 1 rokem |
Georgi Gerganov
|
695ad752b2
metal : improve clarity (minor) (#10171)
|
před 1 rokem |
Georgi Gerganov
|
841f27abdb
metal : optimize FA kernels (#10171)
|
před 1 rokem |
Jhen-Jie Hong
|
d05b3127bd
swift : exclude ggml-metal-embed.metal (#10211)
|
před 1 rokem |
Xuan Son Nguyen
|
76c6e7f105
server : minor UI fix (#10207)
|
před 1 rokem |
Xuan Son Nguyen
|
a71d81cf8c
server : revamp chat UI with vuejs and daisyui (#10175)
|
před 1 rokem |
Georgi Gerganov
|
eec4d71737
scripts : add amx to sync-ggml.sh [no ci]
|
před 1 rokem |
Georgi Gerganov
|
3b08828674
sync : ggml
|
před 1 rokem |
Georgi Gerganov
|
a2c6fd747c
scripts : sync update
|
před 1 rokem |
Diego Devesa
|
97404c4a03
ggml : add ggml-cpu.h to the public headers (#10204)
|
před 1 rokem |
Faisal Zaghloul
|
60e17ce23c
Remove identical wte/etw logic for jais (#10203)
|
před 1 rokem |
wwoodsTM
|
5107e8cea3
DRY: Fixes clone functionality (#10192)
|
před 1 rokem |
snadampal
|
2319126a70
fix q4_0_8_8 format for corrupted tokens issue (#10198)
|
před 1 rokem |
Zhiyuan Li
|
3bcd40b3c5
Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133)
|
před 1 rokem |
Georgi Gerganov
|
5c333e0140
metal : add BF16 support (#8439)
|
před 1 rokem |
Georgi Gerganov
|
b11f9ba9b8
server : remove hack for extra parallel slot (#10187)
|
před 1 rokem |
Diego Devesa
|
94d8cb8be1
metal : fix from ptr buffer name (#10189)
|
před 1 rokem |
Georgi Gerganov
|
1dc04b2dee
ggml : adjust is_first_call init value (#10193)
|
před 1 rokem |
Georgi Gerganov
|
a1eaf6a960
metal : add quantized FA support (#10149)
|
před 1 rokem |
Gabe Goodhart
|
b8deef0ec0
llama : add <|tool_call|> formatting to Granite template (#10177)
|
před 1 rokem |
Diego Devesa
|
a9e8a9a030
ggml : fix arch check in bf16_to_fp32 (#10164)
|
před 1 rokem |
Eve
|
3407364776
Q6_K AVX improvements (#10118)
|
před 1 rokem |
Diego Devesa
|
d5a409e57f
ggml : fix gelu tables initialization (#10172)
|
před 1 rokem |
Diego Devesa
|
401558b7ba
ggml : fix q4xx mat mul, increase ggml_aligned_malloc alignment (#10167)
|
před 1 rokem |
Xuan Son Nguyen
|
9e0ecfb697
server : clarify /slots endpoint, add is_processing (#10162)
|
před 1 rokem |
snadampal
|
6a066b9978
fix build break on arm64 linux (#10166)
|
před 1 rokem |