Georgi Gerganov
|
3120413ccd
vulkan : remove unused vars (#0)
|
6 месяцев назад |
Georgi Gerganov
|
215535701d
sync : ggml
|
6 месяцев назад |
Acly
|
74bb294591
vulkan : implement bilinear interpolation (ggml/1291)
|
6 месяцев назад |
Acly
|
3e303b1107
vulkan : implement ggml_roll (ggml/1290)
|
6 месяцев назад |
Douglas Hanley
|
0c1df14b5f
server : fix pooled embedding output (#14645)
|
6 месяцев назад |
Jeff Bolz
|
b3ad3a0191
vulkan: support SET_ROWS (#14587)
|
6 месяцев назад |
Jeff Bolz
|
98197e5c98
vulkan: optimizations for deepseek prompt processing (#14555)
|
6 месяцев назад |
Tarek Dakhran
|
f5e96b368f
model : support LiquidAI LFM2 hybrid family (#14620)
|
6 месяцев назад |
Slobodan Josic
|
756aa1020a
HIP : Add HIP 7.0+ compatibility for hipBLAS compute types (#14634)
|
6 месяцев назад |
Georgi Gerganov
|
aaa088d87f
readme : add hot PRs (#14636)
|
6 месяцев назад |
Georgi Gerganov
|
0d5375d54b
llama : move enum llama_vocab_pre_type to implementation (#14631)
|
6 месяцев назад |
Dowon
|
576c82eda2
vocab : add midm-2.0 model pre-tokenizer (#14626)
|
6 месяцев назад |
Gabe Goodhart
|
0aedae00e6
model : Granite Four (#13550)
|
6 месяцев назад |
rmatif
|
6bdda13981
opencl: add tiled mul_mat_f16_f32 (#14535)
|
6 месяцев назад |
lhez
|
0b8855775c
opencl: add `set_rows` for `f16` and `f32` (#14547)
|
6 месяцев назад |
Ryan Mangeno
|
4bb625b713
Smoldocling support (#14597)
|
6 месяцев назад |
Aman Gupta
|
11ee0fea2a
Docs: script to auto-generate ggml operations docs (#14598)
|
6 месяцев назад |
Eric Zhang
|
a457551332
cmake : do not search for curl libraries by ourselves (#14613)
|
6 месяцев назад |
Akarshan Biswas
|
704bb7a71c
SYCL: Initial set_rows kernel implementation (#14562)
|
6 месяцев назад |
Xuan-Son Nguyen
|
435a6d10d6
llama : minor coding style fix for smollm3 (#14605)
|
6 месяцев назад |
Eric Zhang
|
f9a867f592
cmake : bump llguidance version to v1.0.1 (#14609)
|
6 месяцев назад |
Eric Zhang
|
ac44eb6c80
cmake : llguidance build parser library only (#14608)
|
6 месяцев назад |
compilade
|
a57d1bcb3c
cuda : support Falcon-H1 state size for SSM_SCAN (#14602)
|
6 месяцев назад |
Xuan-Son Nguyen
|
cb9178f885
llama : remove llm_graph_input_one (#14603)
|
6 месяцев назад |
compilade
|
4a5686da22
llama : support Jamba hybrid Transformer-Mamba models (#7531)
|
6 месяцев назад |
Xuan-Son Nguyen
|
98bab638fb
ggml : add ggml_scale_bias (#14417)
|
6 месяцев назад |
Miaoqian Lin
|
26a48ad699
ggml : prevent integer overflow in gguf tensor size calculation (#14595)
|
6 месяцев назад |
Dowon
|
ffd59e7d18
model : add skt/A.X-4.0 model vocabulary (#14589)
|
6 месяцев назад |
Sigbjørn Skjæret
|
105554595f
llama : remove unintended whitespace (#14592)
|
6 месяцев назад |
ibrahim khadraoui
|
04655063c4
model : add support for Falcon-H1 family (#14534)
|
6 месяцев назад |