Kerfuffle
|
70c29da118
common : fix mirostat state when using multiple sequences (#3543)
|
vor 2 Jahren |
Georgi Gerganov
|
8c70a5ff25
batched : add bench tool (#3545)
|
vor 2 Jahren |
Zane Shannon
|
24ba3d829e
examples : add batched.swift + improve CI for swift (#3562)
|
vor 2 Jahren |
Galunid
|
9f6ede19f3
Add MPT model to supported models in README.md (#3574)
|
vor 2 Jahren |
goerch
|
233fc1c69f
Minor improvements in GPT2 tokenizer (#3567)
|
vor 2 Jahren |
Xingchen Song(宋星辰)
|
c5b49360d0
readme : add bloom (#3570)
|
vor 2 Jahren |
Xingchen Song(宋星辰)
|
02d2875def
llm : add bloom models (#3553)
|
vor 2 Jahren |
Jhen-Jie Hong
|
0aa6595ae0
swift : improvements and fixes (#3564)
|
vor 2 Jahren |
Jan Ploski
|
f5f9121de1
llm : add MPT support (#3417)
|
vor 2 Jahren |
vvhg1
|
11ea5c7d96
infill. : fix tokenization (#3508)
|
vor 2 Jahren |
slaren
|
95bd60a0a6
ggml-alloc : fix assert in debug builds (#3555)
|
vor 2 Jahren |
Georgi Gerganov
|
fcca0a7004
refact : fix convert script + zero out KV cache to avoid nans (#3523)
|
vor 2 Jahren |
Georgi Gerganov
|
dcc09d2596
metal : do not use mul_mm kernels when ne00 < 64 (#3542)
|
vor 2 Jahren |
Georgi Gerganov
|
db3abcc114
sync : ggml (ggml-backend) (#3548)
|
vor 2 Jahren |
Matheus C. França
|
eee42c670e
ci : add Zig CI/CD and fix build (#2996)
|
vor 2 Jahren |
Ryder Wishart
|
8e6716a102
api_like_OAI.py : compat with Microsoft Guidance (#2746)
|
vor 2 Jahren |
arcrank
|
9c38d181d4
api_like_OAI.py : simplify function (#2796)
|
vor 2 Jahren |
Johannes Rudolph
|
a1202a31ed
k-quants : fix comments about block sizing (#3499)
|
vor 2 Jahren |
Georgi Gerganov
|
94e502dfb7
ci : enable on obj-c changes + fix metal build (#3540)
|
vor 2 Jahren |
Luo Tian
|
7d8b24932f
zig : fix build by introducing train.cpp (#3539)
|
vor 2 Jahren |
Georgi Gerganov
|
b0ec5218c3
metal : support MTLGPUFamily < Apple7, formatting, style (#3524)
|
vor 2 Jahren |
Kerfuffle
|
63d3b06a43
llama : fix missing break in Persimmon arch case statements (#3535)
|
vor 2 Jahren |
Kerfuffle
|
a16e89cec8
Fix trying to strip newline from empty prompt and cfg prompt file content (#3534)
|
vor 2 Jahren |
M. Yusuf Sarıgöz
|
4d03833211
gguf.py : fix CI for publishing GGUF package (#3532)
|
vor 2 Jahren |
Tom C
|
c47066d833
py : change version of numpy requirement to 1.24.4 (#3515)
|
vor 2 Jahren |
cebtenzzre
|
f1782c68de
quantize : fail fast on write errors (#3521)
|
vor 2 Jahren |
Jhen-Jie Hong
|
c26765a0a1
metal : support default.metallib load & reuse code for swift package (#3522)
|
vor 2 Jahren |
Phillip Kravtsov
|
0e797c2fc5
llm : support Adept Persimmon 8B (#3410)
|
vor 2 Jahren |
goerch
|
3a716b4dae
Fix for #3454 (#3455)
|
vor 2 Jahren |
BarfingLemurs
|
1faaae8c2b
readme : update models, cuda + ppl instructions (#3510)
|
vor 2 Jahren |