anzz1
|
7a87d31f4f
[main] fix infinite generation (-n == -1) (#523)
|
2 tahun lalu |
Georgi Gerganov
|
348d6926ee
Add logo to README.md
|
2 tahun lalu |
Harald Fernengel
|
33e35b8fe8
Exit from interactive mode if input stream is bad (#491)
|
2 tahun lalu |
anzz1
|
19726169b3
CI: Run other sanitizer builds even if one fails (#511)
|
2 tahun lalu |
jp-x-g
|
f732695cd5
Clarify console output in convert-pth-to-ggml.py (#512)
|
2 tahun lalu |
anzz1
|
2f7bf7dd7c
CMake / CI additions (#497)
|
2 tahun lalu |
anzz1
|
34ab526843
(Windows) Set console to UTF-8 on init (#420)
|
2 tahun lalu |
Georgi Gerganov
|
c2b25b6912
Fix colors enabling on WIN32
|
2 tahun lalu |
Georgi Gerganov
|
79b2b266db
If n_predict == -1, generate forever
|
2 tahun lalu |
Georgi Gerganov
|
e2d490dafd
Inifinite generation via context swapping (#71)
|
2 tahun lalu |
Georgi Gerganov
|
03f7e33560
Cleanup STL headers + fix embedding examples + minor stuff
|
2 tahun lalu |
Georgi Gerganov
|
55ad42af84
Move chat scripts into "./examples"
|
2 tahun lalu |
slaren
|
459e93cce0
Add AVX2 implementation of dequantize_row_q4_1 (#505)
|
2 tahun lalu |
Georgi Gerganov
|
a316a425d0
Overhaul the examples structure
|
2 tahun lalu |
Georgi Gerganov
|
ecbe466a36
Retire the ggml_mul_mat() branch for transposed src0 (#500)
|
2 tahun lalu |
Georgi Gerganov
|
502a400192
Disable prompt verbosity by default and add option to enable (#480)
|
2 tahun lalu |
slaren
|
09aecbf628
Add AVX2 implementation of dequantize_row_q4_0 (#467)
|
2 tahun lalu |
Georgi Gerganov
|
4640eff23d
Don't interefe with BLAS for large prompts by running only 1 thread
|
2 tahun lalu |
Georgi Gerganov
|
ab77d76312
Add longer DAN prompt for testing big batch numbers
|
2 tahun lalu |
slaren
|
29b7baab67
Add timings for the prompt evaluation (#478)
|
2 tahun lalu |
Georgi Gerganov
|
4a7129acd2
Remove obsolete information from README
|
2 tahun lalu |
Georgi Gerganov
|
6b6dbc8910
Remove obsolete assert and fix compiler warning
|
2 tahun lalu |
Georgi Gerganov
|
2a2e63ce05
Fix nasty bug in ggml_compute_forward_mul_mat_f32() and reenable BLAS
|
2 tahun lalu |
anzz1
|
e899bf54b2
bounds checking for input prefix (#492)
|
2 tahun lalu |
anzz1
|
fbd4d38c64
feat: '--in-prefix STRING' option (#426)
|
2 tahun lalu |
Jed Fox
|
58e6c9f36f
Add support for file load progress reporting callbacks (#434)
|
2 tahun lalu |
Doomsdayrs
|
36d07532ef
Add missing struct annotation (#483)
|
2 tahun lalu |
Chris Kuehl
|
6f1ee4b640
Fix crash for 65B model with pre-allocated memory (#485)
|
2 tahun lalu |
Georgi Gerganov
|
8520fc310e
Disable BLAS altogether - the bug is not just for qunatized mat mul
|
2 tahun lalu |
Georgi Gerganov
|
b3f460e941
Disable BLAS branch in mul_mat - seems there is a bug
|
2 tahun lalu |