Xuan Son Nguyen
|
c8c07d658a
llama : fix empty batch causing llama_batch_allocr to crash (#9966)
|
1 ano atrás |
Daniel Bevenius
|
19d900a756
llama : rename batch to ubatch (#9950)
|
1 ano atrás |
Molly Sophia
|
11d47057a5
Rwkv chat template fix (#10001)
|
1 ano atrás |
Xuan Son Nguyen
|
c421ac072d
lora : warn user if new token is added in the adapter (#9948)
|
1 ano atrás |
Molly Sophia
|
4ff7fe1fb3
llama : add chat template for RWKV-World + fix EOT (#9968)
|
1 ano atrás |
leo-pony
|
6b8447352d
[CANN] Adapt to dynamically loadable backends mechanism (#9970)
|
1 ano atrás |
Daniel Bevenius
|
674804a996
arg : fix typo in embeddings argument help [no ci] (#9994)
|
1 ano atrás |
Georgi Gerganov
|
e94a138d64
llama.vim : fix info text display [no ci] (#9787)
|
1 ano atrás |
Georgi Gerganov
|
e01c67affe
llama.vim : move info to the right of screen [no ci] (#9787)
|
1 ano atrás |
Asghar Ghorbani
|
994cfb1acb
readme : update UI list (#9972)
|
1 ano atrás |
Daniel Bevenius
|
94008cc760
arg : fix attention non-causal arg value hint (#9985)
|
1 ano atrás |
Georgi Gerganov
|
dbd5f2f573
llama.vim : plugin for Neovim (#9787)
|
1 ano atrás |
Georgi Gerganov
|
f594bc80ba
ggml : add asserts for type conversion in fattn kernels (#9971)
|
1 ano atrás |
Radoslav Gerganov
|
d5ebd79c76
rpc : pack only RPC structs (#9959)
|
1 ano atrás |
Georgi Gerganov
|
55e47786e3
llama : default sampling changes + greedy update (#9897)
|
1 ano atrás |
Georgi Gerganov
|
bc21975084
speculative : fix handling of some input params (#9963)
|
1 ano atrás |
Neo Zhang Jianyu
|
1db8c84fc6
fix mul_mat_vec_q and *_vec_q error (#9939)
|
1 ano atrás |
Loïc Carrère
|
45f097645e
readme : update bindings list (#9951)
|
1 ano atrás |
icppWorld
|
7cab2083c7
readme : update infra list (#9942)
|
1 ano atrás |
Xuan Son Nguyen
|
cda0e4b648
llama : remove all_pos_0, all_pos_1, all_seq_id from llama_batch (#9745)
|
1 ano atrás |
Radoslav Gerganov
|
afd9909a64
rpc : backend refactoring (#9912)
|
1 ano atrás |
Ouadie EL FAROUKI
|
87421a23e8
[SYCL] Add SYCL Backend registry, device and Event Interfaces (#9705)
|
1 ano atrás |
Ma Mingfei
|
60ce97c9d8
add amx kernel for gemm (#8998)
|
1 ano atrás |
Georgi Gerganov
|
8901755ba3
server : add n_indent parameter for line indentation requirement (#9929)
|
1 ano atrás |
Daniel Bevenius
|
6f55bccbb8
llama : rename batch_all to batch (#8881)
|
1 ano atrás |
Georgi Gerganov
|
17bb928080
readme : remove --memory-f32 references (#9925)
|
1 ano atrás |
Georgi Gerganov
|
9f45fc1e99
llama : change warning to debug log
|
1 ano atrás |
Georgi Gerganov
|
99bd4ac28c
llama : infill sampling handle very long tokens (#9924)
|
1 ano atrás |
Tim Wang
|
3752217ed5
readme : update bindings list (#9918)
|
1 ano atrás |
Diego Devesa
|
f010b77a37
vulkan : add backend registry / device interfaces (#9721)
|
1 ano atrás |