Pierrick Hymbert
|
81da18e71c
eval-callback: use ggml_op_desc to pretty print unary operator name (#6631)
|
1 год назад |
Georgi Gerganov
|
9ed2737acc
ci : disable Metal for macOS-latest-cmake-x64 (#6628)
|
1 год назад |
Clint Herron
|
04a5ac211e
Optimization: eliminate addition of redundant stacks when advancing grammar. (#6616)
|
1 год назад |
Clint Herron
|
f7001ccc5a
As suggested by @slaren, disabling Metal for test to fix CI build on OSX from #6576 (#6619)
|
1 год назад |
Nikolas
|
a474f50ebb
Refactor Error Handling for CUDA (#6575)
|
1 год назад |
Olivier Chafik
|
cbaadc9294
grammars: 1.5x faster inference w/ complex grammars (vector reserves / reuses) (#6609)
|
1 год назад |
Hugo Roussel
|
1bbdaf6ecd
ci: download artifacts to release directory (#6612)
|
1 год назад |
Daniel Bevenius
|
f4183afe6a
scripts : add --outdir option to hf.sh (#6600)
|
1 год назад |
Pierrick Hymbert
|
b804b1ef77
eval-callback: Example how to use eval callback for debugging (#6576)
|
1 год назад |
Daniel Bevenius
|
8228b66dbc
gguf : add option to not check tensor data (#6582)
|
1 год назад |
Ralph Soika
|
b3a96f27f0
minor layout improvements (#6572)
|
1 год назад |
slaren
|
4f407a0a35
llama : add model types for mixtral (#6589)
|
1 год назад |
slaren
|
65c64dc36f
convert.py : add consolidated.safetensors for mixtral 8x22b (#6587)
|
1 год назад |
Pierrick Hymbert
|
67fac4b95f
docs : how to add a model (#6565)
|
1 год назад |
Artem Zinnatullin
|
29122d32ac
readme : fix ROCm link (#6579)
|
1 год назад |
sjxx
|
b231b37b09
readme : update UI list (#6560)
|
1 год назад |
Jiří Sejkora
|
ba5e134e07
readme: fix typo in amdgpu target name (#6573)
|
1 год назад |
Jared Van Bortel
|
1b67731e18
BERT tokenizer fixes (#6498)
|
1 год назад |
Georgi Gerganov
|
c4a3a4ff47
sync : ggml
|
1 год назад |
Ed Lee
|
400d5d722d
server : detect search query to start webchat (#6554)
|
1 год назад |
Carolinabanana
|
5dc9dd7152
llama : add Command R Plus support (#6491)
|
1 год назад |
Georgi Gerganov
|
e11a8999b5
license : update copyright notice + add AUTHORS (#6405)
|
1 год назад |
Georgi Gerganov
|
cc4a95426d
llama : fix attention layer count sanity check (#6550)
|
1 год назад |
kunnis
|
cecd8d3c98
Comment explaining a decision (#6531)
|
1 год назад |
Georgi Gerganov
|
b73e564b16
quantize : fix precedence of cli args (#6541)
|
1 год назад |
Rick G
|
e3c337d87c
llama : support negative ith in llama_get_ API (#6519)
|
1 год назад |
Jan Boon
|
beea6e1b16
llama : save and restore kv cache for single seq id (#6341)
|
1 год назад |
Abhilash Majumder
|
87fb5b4234
remove row=1 cond (#6532)
|
1 год назад |
Firat
|
d752327c33
Adding KodiBot to UI list (#6535)
|
1 год назад |
Mark Fairbairn
|
855f54402e
Change Windows AMD example to release build to make inference much faster. (#6525)
|
1 год назад |