bssrdf
|
afc8c19291
ggml : fix some mul mat cases + add tests for src1 F16 (ggml/669)
|
2 ani în urmă |
Georgi Gerganov
|
ca38b8d334
scripts : do not sync commits from this repo
|
2 ani în urmă |
Justine Tunney
|
65e5f6dadb
Fix OpenAI server sampling w.r.t. temp and seed (#4668)
|
2 ani în urmă |
manikbhandari
|
ea5497df5d
gpt2 : Add gpt2 architecture integration (#4555)
|
2 ani în urmă |
Nam D. Tran
|
f6793491b5
llama : add AWQ for llama, llama2, mpt, and mistral models (#4593)
|
2 ani în urmă |
Daniel Bevenius
|
879b690a9e
finetune : fix output formatting in print_params (#4653)
|
2 ani în urmă |
Georgi Gerganov
|
b47879b0dd
scripts : add sync-ggml-am.sh
|
2 ani în urmă |
Georgi Gerganov
|
951010fa53
ggml : fix dot product for ARM (#4630)
|
2 ani în urmă |
wonjun Jang
|
f56d6077d0
Add byte token type when tokenizer.model is not exists (#4641)
|
2 ani în urmă |
slaren
|
dc68f0054c
cuda : fix vmm pool with multi GPU (#4620)
|
2 ani în urmă |
WillCorticesAI
|
de8e496437
Update comment for AdamW implementation reference. (#4604)
|
2 ani în urmă |
FantasyGmm
|
77465dad48
Fix new CUDA10 compilation errors (#4635)
|
2 ani în urmă |
Paul Tsochantaris
|
a206137f92
Adding Emeltal reference to UI list (#4629)
|
2 ani în urmă |
slaren
|
b9f47952ff
simplify bug issue template (#4623)
|
2 ani în urmă |
Shintarou Okada
|
753be377b6
llama : add PLaMo model (#3557)
|
2 ani în urmă |
slaren
|
5bf3953d7e
cuda : improve cuda pool efficiency using virtual memory (#4606)
|
2 ani în urmă |
slaren
|
708e179e85
fallback to CPU buffer if host buffer alloc fails (#4610)
|
2 ani în urmă |
Samuel Maynard
|
925e5584a0
ci(docker): fix tags in "Build and push docker image (tagged)" (#4603)
|
2 ani în urmă |
Alexey Parfenov
|
6123979952
server : allow to specify custom prompt for penalty calculation (#3727)
|
2 ani în urmă |
kalomaze
|
b9ec82d262
grammar : check the full vocab only if necessary (opt) (#4306)
|
2 ani în urmă |
Johannes Gäßler
|
e0a4002273
CUDA: fixed row rounding for 0 tensor splits (#4594)
|
2 ani în urmă |
LeonEricsson
|
7082d24cec
lookup : add prompt lookup decoding example (#4484)
|
2 ani în urmă |
Georgi Gerganov
|
ba66175132
sync : ggml (fix im2col) (#4591)
|
2 ani în urmă |
FantasyGmm
|
a55876955b
cuda : fix jetson compile error (#4560)
|
2 ani în urmă |
Henrik Forstén
|
6724ef1657
Fix CudaMemcpy direction (#4599)
|
2 ani în urmă |
slaren
|
48b7ff193e
llama : fix platforms without mmap (#4578)
|
2 ani în urmă |
Herman Semenov
|
48b24b170e
ggml : add comment about backward GGML_OP_DIAG_MASK_INF (#4203)
|
2 ani în urmă |
Michael Kesper
|
28cb35a0ec
make : add LLAMA_HIP_UMA option (#4587)
|
2 ani în urmă |
rhuddleston
|
f31b984898
ci : tag docker image with build number (#4584)
|
2 ani în urmă |
Deins
|
2bb98279c5
readme : add zig bindings (#4581)
|
2 ani în urmă |