Johannes Gäßler
|
1613ef8d8e
CUDA: CUDART < 11.7 workaround for __hmax, __hmax2 (#7019)
|
1 год назад |
slaren
|
c4ec9c0d3d
ci : exempt confirmed bugs from being tagged as stale (#7014)
|
1 год назад |
Johannes Gäßler
|
a8f9b07631
perplexity: more statistics, added documentation (#6936)
|
1 год назад |
Kevin Gibbons
|
f364eb6fb5
switch to using localizedDescription (#7010)
|
1 год назад |
Georgi Gerganov
|
77e15bec62
metal : remove deprecated error code (#7008)
|
1 год назад |
Kevin Gibbons
|
a68a1e7ed0
metal : log more info on error (#6987)
|
1 год назад |
Georgi Gerganov
|
9c67c2773d
ggml : add Flash Attention (#5021)
|
1 год назад |
Georgi Gerganov
|
952d03dbea
convert : use utf8 encoding (#7000)
|
1 год назад |
Olivier Chafik
|
8843a98c2b
Improve usability of --model-url & related flags (#6930)
|
1 год назад |
Clint Herron
|
b8c1476e44
Extending grammar integration tests (#6644)
|
1 год назад |
Daniel Bevenius
|
5539e6fdd1
main : fix typo in comment in main.cpp (#6985)
|
1 год назад |
Olivier Chafik
|
b8a7a5a90f
build(cmake): simplify instructions (`cmake -B build && cmake --build build ...`) (#6964)
|
1 год назад |
Georgi Gerganov
|
d2c898f746
ci : tmp disable gguf-split (#6983)
|
1 год назад |
Georgi Gerganov
|
544f1f10ad
ggml : fix __MSC_VER -> _MSC_VER (#6977)
|
1 год назад |
cpumaxx
|
ffe666572f
llava-cli : multiple images (#6969)
|
1 год назад |
Georgi Gerganov
|
24affa7db3
readme : update hot topics
|
1 год назад |
Georgi Gerganov
|
f4ab2a4147
llama : fix BPE pre-tokenization (#6920)
|
1 год назад |
David Renshaw
|
3f167476b1
sampling : use std::random_device{}() for default random seed (#6962)
|
1 год назад |
Christian Zhou-Zheng
|
3055a41805
convert : fix conversion of some BERT embedding models (#6937)
|
1 год назад |
Przemysław Pawełczyk
|
577277ffd2
make : change GNU make default CXX from g++ to c++ (#6966)
|
1 год назад |
Przemysław Pawełczyk
|
ca7f29f568
ci : add building in MSYS2 environments (Windows) (#6967)
|
1 год назад |
Johannes Gäßler
|
c4f708a93f
llama : fix typo LAMMAFILE -> LLAMAFILE (#6974)
|
1 год назад |
DAN™
|
e00b4a8f81
Fix more int overflow during quant (PPL/CUDA). (#6563)
|
1 год назад |
Xuan Son Nguyen
|
7bb36ccf91
gguf : enforce that tensor names are unique (#6905)
|
1 год назад |
Neo Zhang
|
ce023f6f2f
add device version in device list (#6959)
|
1 год назад |
github-actions[bot]
|
6e472f58e4
flake.lock: Update
|
1 год назад |
mgroeber9110
|
4dba7e8114
Replace "alternative" boolean operator in conditional compilation directive (#6949)
|
1 год назад |
Pierrick Hymbert
|
b7368332e2
ci: server: tests python env on github container ubuntu latest / fix n_predict (#6935)
|
1 год назад |
agray3
|
928e0b7013
Reset schedule earlier to allow overlap with ggml graph computation on device (#6933)
|
1 год назад |
Pierrick Hymbert
|
0c4d489e29
quantize: add imatrix and dataset metadata in GGUF (#6658)
|
1 год назад |