Pierrick Hymbert
|
4bd0f93e4a
model: support arch `DbrxForCausalLM` (#6515)
|
1 vuosi sitten |
Rene Leonhardt
|
5c4d767ac0
chore: Fix markdown warnings (#6625)
|
1 vuosi sitten |
Pierrick Hymbert
|
67fac4b95f
docs : how to add a model (#6565)
|
1 vuosi sitten |
Artem Zinnatullin
|
29122d32ac
readme : fix ROCm link (#6579)
|
1 vuosi sitten |
sjxx
|
b231b37b09
readme : update UI list (#6560)
|
1 vuosi sitten |
Jiří Sejkora
|
ba5e134e07
readme: fix typo in amdgpu target name (#6573)
|
1 vuosi sitten |
Jan Boon
|
beea6e1b16
llama : save and restore kv cache for single seq id (#6341)
|
1 vuosi sitten |
Firat
|
d752327c33
Adding KodiBot to UI list (#6535)
|
1 vuosi sitten |
Mark Fairbairn
|
855f54402e
Change Windows AMD example to release build to make inference much faster. (#6525)
|
1 vuosi sitten |
DAN™
|
e0717e751e
Add GritLM as supported models. (#6513)
|
1 vuosi sitten |
Hoang Nguyen
|
d0f5deebf8
readme : update UI list (#6503)
|
1 vuosi sitten |
alexpinel
|
a307375c02
readme : add Dot to UI list (#6487)
|
1 vuosi sitten |
Jun Jie
|
b660a5729e
readme : fix typo (#6481)
|
1 vuosi sitten |
bryanSwk
|
bb43cf7e9d
llama : add SEA-LION support (#6448)
|
1 vuosi sitten |
Francisco Melo
|
154d4ee39c
readme : add feature-rich rust bindings (#6465)
|
1 vuosi sitten |
Georgi Gerganov
|
076b08649e
readme : update hot topics
|
1 vuosi sitten |
Georgi Gerganov
|
c50a82ce0f
readme : update hot topics
|
1 vuosi sitten |
0cc4m
|
ba0c7c70ab
Vulkan k-quant mmq and ggml-backend offload functionality (#6155)
|
1 vuosi sitten |
hxer7963
|
069574775c
[Model] Add support for xverse (#6301)
|
1 vuosi sitten |
zhouwg
|
b910287954
readme : add project (#6356)
|
1 vuosi sitten |
Georgi Gerganov
|
bfe7dafc9c
readme : add notice for UI list
|
1 vuosi sitten |
Mateusz Charytoniuk
|
1740d6dd4e
readme : add php api bindings (#6326)
|
1 vuosi sitten |
compilade
|
557410b8f0
llama : greatly reduce output buffer memory usage (#6122)
|
1 vuosi sitten |
slaren
|
280345968d
cuda : rename build flag to LLAMA_CUDA (#6299)
|
1 vuosi sitten |
Pierrick Hymbert
|
dba1af6129
llama_model_loader: support multiple split/shard GGUFs (#6187)
|
1 vuosi sitten |
Xiaoyi Chen
|
29ab270e65
readme : add RecurseChat to the list of UIs (#6219)
|
1 vuosi sitten |
Georgi Gerganov
|
b3e94f26ba
metal : proper assert for mat-mat memory alignment (#6225)
|
1 vuosi sitten |
Xuan Son Nguyen
|
dfbfdd60f9
readme : add wllama as a wasm binding (#6100)
|
1 vuosi sitten |
Andrew Canis
|
12247f4c69
llama : add Command-R support (#6033)
|
1 vuosi sitten |
Linwei Wang
|
19885d205e
readme : update details about running llama in Termux on Android (#6039)
|
1 vuosi sitten |