Daniel Bevenius
|
b18c66ca6e
llama : fix alignment of general.name in print meta (#4254)
|
преди 2 години |
slaren
|
f4d973cecb
convert.py : fix llama/llama2 conversion due to vocab_size=-1 (#4258)
|
преди 2 години |
tarcey
|
954e22858c
llama : fix typical sampling (#4261)
|
преди 2 години |
rhjdvsgsgks
|
e2bd725f4b
py : fix oai proxy (#3972)
|
преди 2 години |
Georgi Gerganov
|
1f5cd83275
examples : add readme files
|
преди 2 години |
Peter Sugihara
|
4fea3420ee
readme : add FreeChat (#4248)
|
преди 2 години |
Jared Van Bortel
|
64e64aa255
ggml : restore abort() in GGML_ASSERT (#4242)
|
преди 2 години |
Georgi Gerganov
|
8406b0924b
ggml : re-enable BLAS for CPU when src0 != F32 + remove redundant full offload checks in llama.cpp (#4240)
|
преди 2 години |
bandoti
|
b38a16dfcf
cmake : fix issue with version info not getting baked into LlamaConfig.cmake (#3970)
|
преди 2 години |
Kasumi
|
0dab8cd7cc
readme : add Amica to UI list (#4230)
|
преди 2 години |
Bailey Chittle
|
bb03290c17
examples : iOS example with swift ui (#4159)
|
преди 2 години |
Jared Van Bortel
|
f3b269813f
ggml : fix -Warray-bounds warning with gcc (#4231)
|
преди 2 години |
Georgi Gerganov
|
3e73d31d9c
lookahead : support `-n -1` infinite generation
|
преди 2 години |
Georgi Gerganov
|
9656026b53
readme : update hot topics
|
преди 2 години |
Georgi Gerganov
|
922754a8d6
lookahead : add example for lookahead decoding (#4207)
|
преди 2 години |
Xiao-Yong Jin
|
22da05536f
metal : fix yarn (#4220)
|
преди 2 години |
Galunid
|
1ddb52ec38
scripts : Use mmap in torch load (#4202)
|
преди 2 години |
Marcus Dunn
|
f837c3a992
llama : grammar `reserve` space in `decode_utf8` (#4210)
|
преди 2 години |
crasm
|
3014b5415d
Update docs for yarn_ext_factor <0.0 as unspecified instead of NaN (#4189)
|
преди 2 години |
Georgi Gerganov
|
04814e718e
readme : update hot topics
|
преди 2 години |
Georgi Gerganov
|
af19d35734
server : OAI API compatibility (#4198)
|
преди 2 години |
slaren
|
e9c13ff781
llama : set metal log callback correctly (#4204)
|
преди 2 години |
slaren
|
8a052c131e
ggml-cuda : support stablelm rope (#4156)
|
преди 2 години |
Galunid
|
189d68446e
convert : fix tensors using grad in some models (#4173)
|
преди 2 години |
eastriver
|
2568a4bf54
main.swift : fix eos checking (#4197)
|
преди 2 години |
Aaryaman Vasishta
|
b35f3d0def
readme : use PATH for Windows ROCm (#4195)
|
преди 2 години |
Haohui Mai
|
55978ce09b
Fix incorrect format strings and uninitialized variables. (#4133)
|
преди 2 години |
Georgi Gerganov
|
6b0a7420d0
llama : KV cache view API + better KV cache management (#4170)
|
преди 2 години |
Georgi Gerganov
|
d103d935c0
readme : update hot topics
|
преди 2 години |
Daniel Bevenius
|
9d5949f04b
examples : fix typo in parallel example doc comment (#4181)
|
преди 2 години |