Georgi Gerganov
|
07028f9d74
flake.lock: Update (#10063)
|
1 год назад |
R0CKSTAR
|
524afeec9d
musa: workaround for Guilty Lockup in cleaning src0 (#10042)
|
1 год назад |
Georgi Gerganov
|
8125e6cbfc
server : don't overfill the batch during infill (#10018)
|
1 год назад |
Georgi Gerganov
|
8841ce3f43
llama : switch KQ multiplication to F32 precision by default (#10015)
|
1 год назад |
Georgi Gerganov
|
cc2983d375
sync : ggml
|
1 год назад |
bssrdf
|
8c60a8a462
increase cuda_cpy block size (ggml/996)
|
1 год назад |
Georgi Gerganov
|
9e4a2563ea
scripts : fix amx sync [no ci]
|
1 год назад |
Georgi Gerganov
|
668750357e
metal : support permuted matrix multiplicaions (#10033)
|
1 год назад |
wwoodsTM
|
ff252ea48e
llama : add DRY sampler (#9702)
|
1 год назад |
Michael Podvitskiy
|
d80fb71f8b
llama: string_split fix (#10022)
|
1 год назад |
Srihari-mcw
|
2f8bd2b901
llamafile : extend sgemm.cpp support for Q5_0 models (#10010)
|
1 год назад |
Georgi Gerganov
|
bc5ba007b2
server : check that the prompt fits in the slot's context (#10030)
|
1 год назад |
Xuan Son Nguyen
|
958367bf53
server : refactor slot input data, move tokenizer to HTTP thread (#10023)
|
1 год назад |
Georgi Gerganov
|
40f2555797
ci : fix cmake flags for SYCL
|
1 год назад |
Johannes Gäßler
|
167a515651
CUDA: fix insufficient buffer clearing for MMQ (#10032)
|
1 год назад |
Johannes Gäßler
|
c39665f589
CUDA: fix MMQ for non-contiguous src0, add tests (#10021)
|
1 год назад |
wwoodsTM
|
0a1c750c80
server : samplers accept the prompt correctly (#10019)
|
1 год назад |
Georgi Gerganov
|
190a37d797
sync : ggml
|
1 год назад |
Georgi Gerganov
|
2d3aba9ee8
llama.vim : bump generation time limit to 3s [no ci]
|
1 год назад |
Johannes Gäßler
|
80273a306d
CUDA: fix 1D im2col, add tests (ggml/993)
|
1 год назад |
Daniel Bevenius
|
c19af0acb1
ggml : remove redundant set of contexts used field (ggml/978)
|
1 год назад |
Michael Coppola
|
ac113a0fee
llama.vim : add classic vim support (#9995)
|
1 год назад |
Jun Hee Yoo
|
4c9388fb96
metal : add POOL2D and fix IM2COL (#9943)
|
1 год назад |
github-actions[bot]
|
873279b159
flake.lock: Update
|
1 год назад |
Xuan Son Nguyen
|
c8c07d658a
llama : fix empty batch causing llama_batch_allocr to crash (#9966)
|
1 год назад |
Daniel Bevenius
|
19d900a756
llama : rename batch to ubatch (#9950)
|
1 год назад |
Molly Sophia
|
11d47057a5
Rwkv chat template fix (#10001)
|
1 год назад |
Xuan Son Nguyen
|
c421ac072d
lora : warn user if new token is added in the adapter (#9948)
|
1 год назад |
Molly Sophia
|
4ff7fe1fb3
llama : add chat template for RWKV-World + fix EOT (#9968)
|
1 год назад |
leo-pony
|
6b8447352d
[CANN] Adapt to dynamically loadable backends mechanism (#9970)
|
1 год назад |