beiller
|
02f0c6fe7f
Add back top_k (#56)
|
hace 2 años |
Sebastián A
|
eb062bb012
Windows fixes (#31)
|
hace 2 años |
beiller
|
129c7d1ea8
Add repetition penalty (#20)
|
hace 2 años |
Georgi Gerganov
|
7d9ed7b25f
Bump memory buffer
|
hace 2 años |
Georgi Gerganov
|
007a8f6f45
Support all LLaMA models + change Q4_0 quantization storage
|
hace 2 años |
Georgi Gerganov
|
70bc0b8b15
Fix a bug in the rope calculation
|
hace 2 años |
Georgi Gerganov
|
319cdb3e1f
Final touches
|
hace 2 años |
Georgi Gerganov
|
26c0846629
Initial release
|
hace 2 años |