Georgi Gerganov
|
827f5eda91
readme : update hot topics
|
2 vuotta sitten |
Georgi Gerganov
|
ecb217db4f
llama : Metal inference (#1642)
|
2 vuotta sitten |
Henri Vasserman
|
d8bd0013e8
Add info about CUDA_VISIBLE_DEVICES (#1682)
|
2 vuotta sitten |
Henri Vasserman
|
97c9b77c4f
Add documentation about CLBlast (#1604)
|
2 vuotta sitten |
Evan Jones
|
c31bbe934b
readme : add docs for chat-persistent.sh (#1568)
|
2 vuotta sitten |
Zenix
|
b8ee340abe
feature : support blis and other blas implementation (#1536)
|
2 vuotta sitten |
Georgi Gerganov
|
ea600071cb
Revert "feature : add blis and other BLAS implementation support (#1502)"
|
2 vuotta sitten |
Zenix
|
07e9ace0f9
feature : add blis and other BLAS implementation support (#1502)
|
2 vuotta sitten |
Georgi Gerganov
|
2d5db48371
ggml : use F16 instead of F32 in Q4_0, Q4_1, Q8_0 (#1508)
|
2 vuotta sitten |
David Kennedy
|
79e3efb0e9
readme : adds WizardLM to the list of supported models (#1485)
|
2 vuotta sitten |
Georgi Gerganov
|
cdd5350892
readme : update Q4_0 perplexities
|
2 vuotta sitten |
Rinne
|
089b1c93ba
readme : add C#/.NET bindings repo (#1409)
|
2 vuotta sitten |
Georgi Gerganov
|
b9fd7eee57
ggml : remove bit shuffling (#1405)
|
2 vuotta sitten |
Georgi Gerganov
|
56551bc11f
readme : add notice about upcoming breaking change
|
2 vuotta sitten |
AlpinDale
|
fe60904eef
readme : add TOC and Pygmalion instructions (#1359)
|
2 vuotta sitten |
Georgi Gerganov
|
f9a6364912
llama : require first token to be BOS (#1303)
|
2 vuotta sitten |
Johannes Gäßler
|
1f48b0abcf
Documented CUDA reproducibility, added warning (#1346)
|
2 vuotta sitten |
DaniAndTheWeb
|
173d0e6419
makefile: automatic Arch Linux detection (#1332)
|
2 vuotta sitten |
Pavol Rusnak
|
921dcee00a
readme: add missing info (#1324)
|
2 vuotta sitten |
44670
|
360cfe5bec
readme : add OpenBuddy link (#1321)
|
2 vuotta sitten |
Georgi Gerganov
|
bca9ad938a
minor : fix whitespaces (#1302)
|
2 vuotta sitten |
KASR
|
b0c71c7b6d
scripts : platform independent script to verify sha256 checksums (#1203)
|
2 vuotta sitten |
Stephan Walter
|
36d19a603b
Remove Q4_3 which is no better than Q5 (#1218)
|
2 vuotta sitten |
Georgi Gerganov
|
7f15c5c477
readme : update hot topics
|
2 vuotta sitten |
Folko-Ven
|
78ec543733
Correcting link to w64devkit (#1214)
|
2 vuotta sitten |
Georgi Gerganov
|
f9be42add0
readme : add quantization info
|
2 vuotta sitten |
DaniAndTheWeb
|
ea3ad7eb60
Updating build instructions to include BLAS support (#1183)
|
2 vuotta sitten |
Pavol Rusnak
|
859fee6dfb
quantize : use `map` to assign quantization type from `string` (#1191)
|
2 vuotta sitten |
mgroeber9110
|
9b0a4d4214
examples/main README improvements and some light refactoring (#1131)
|
2 vuotta sitten |
Pavol Rusnak
|
c6524f46eb
readme : update gpt4all instructions (#980)
|
2 vuotta sitten |