Georgi Gerganov
|
a2c6fd747c
scripts : sync update
|
1 an în urmă |
Diego Devesa
|
97404c4a03
ggml : add ggml-cpu.h to the public headers (#10204)
|
1 an în urmă |
Faisal Zaghloul
|
60e17ce23c
Remove identical wte/etw logic for jais (#10203)
|
1 an în urmă |
wwoodsTM
|
5107e8cea3
DRY: Fixes clone functionality (#10192)
|
1 an în urmă |
snadampal
|
2319126a70
fix q4_0_8_8 format for corrupted tokens issue (#10198)
|
1 an în urmă |
Zhiyuan Li
|
3bcd40b3c5
Optimize RWKV6 Operator Naming and Implement Multi-core CPU/ SYCL Acceleration (#10133)
|
1 an în urmă |
Georgi Gerganov
|
5c333e0140
metal : add BF16 support (#8439)
|
1 an în urmă |
Georgi Gerganov
|
b11f9ba9b8
server : remove hack for extra parallel slot (#10187)
|
1 an în urmă |
Diego Devesa
|
94d8cb8be1
metal : fix from ptr buffer name (#10189)
|
1 an în urmă |
Georgi Gerganov
|
1dc04b2dee
ggml : adjust is_first_call init value (#10193)
|
1 an în urmă |
Georgi Gerganov
|
a1eaf6a960
metal : add quantized FA support (#10149)
|
1 an în urmă |
Gabe Goodhart
|
b8deef0ec0
llama : add <|tool_call|> formatting to Granite template (#10177)
|
1 an în urmă |
Diego Devesa
|
a9e8a9a030
ggml : fix arch check in bf16_to_fp32 (#10164)
|
1 an în urmă |
Eve
|
3407364776
Q6_K AVX improvements (#10118)
|
1 an în urmă |
Diego Devesa
|
d5a409e57f
ggml : fix gelu tables initialization (#10172)
|
1 an în urmă |
Diego Devesa
|
401558b7ba
ggml : fix q4xx mat mul, increase ggml_aligned_malloc alignment (#10167)
|
1 an în urmă |
Xuan Son Nguyen
|
9e0ecfb697
server : clarify /slots endpoint, add is_processing (#10162)
|
1 an în urmă |
snadampal
|
6a066b9978
fix build break on arm64 linux (#10166)
|
1 an în urmă |
Diego Devesa
|
ea02c753eb
cuda : clear error after changing peer access (#10153)
|
1 an în urmă |
Georgi Gerganov
|
05697f670b
metal : simplify f16 and f32 dequant kernels (#0)
|
1 an în urmă |
Georgi Gerganov
|
f8e58135cf
metal : move dequantize templates to beginning of MSL source (#0)
|
1 an în urmă |
leo-pony
|
329ed914c9
CANN: adjust backend registry refactor. (#10158)
|
1 an în urmă |
Georgi Gerganov
|
ce027adfb3
sync : ggml
|
1 an în urmă |
Yuri Khrustalev
|
284e5b0275
cmake : make it possible linking ggml as external lib (ggml/1003)
|
1 an în urmă |
Plamen Minev
|
e2292aaa17
metal : fix minor string leaks (ggml/1004)
|
1 an în urmă |
Diego Devesa
|
9f40989351
ggml : move CPU backend to a separate file (#10144)
|
1 an în urmă |
Georgi Gerganov
|
08828a6d7d
metal : minor fixup in FA kernel (#10143)
|
1 an în urmă |
Georgi Gerganov
|
1839f69130
flake.lock: Update (#10146)
|
1 an în urmă |
Christian Köhnenkamp
|
9830b6923b
Add apple arm to presets (#10134)
|
1 an în urmă |
sasha0552
|
42cadc74bd
server : fix slot selection by lru (#10126)
|
1 an în urmă |