Michael Coppola
|
31e7903221
server : add `dynatemp_range` and `dynatemp_exponent` (#5352)
|
1 tahun lalu |
Niall Coates
|
4ffc7a17d4
server : various fixes for the prompt field in /completion (#5300)
|
1 tahun lalu |
Alexey Parfenov
|
a2d60c9158
server : allow to get default generation settings for completion (#5307)
|
1 tahun lalu |
Michael Klimenko
|
52bb63c708
refactor : switch to emplace_back to avoid extra object (#5291)
|
1 tahun lalu |
Georgi Gerganov
|
5cb04dbc16
llama : remove LLAMA_MAX_DEVICES and LLAMA_SUPPORTS_GPU_OFFLOAD (#5240)
|
1 tahun lalu |
Georgi Gerganov
|
e6f291d158
server : fix context shift (#5195)
|
1 tahun lalu |
Wu Jian Ping
|
c82d18e863
server : embeddings compatibility for OpenAI (#5190)
|
1 tahun lalu |
Abhilash Majumder
|
0f648573dd
ggml : add unified SYCL backend for Intel GPUs (#2690)
|
2 tahun lalu |
Michael Klimenko
|
35a2ee9143
Remove unused data and add fixes (#5154)
|
2 tahun lalu |
Maximilian Winter
|
ec903c0341
server : add self-extend support (#5104)
|
2 tahun lalu |
Xuan Son Nguyen
|
48c857aa10
server : refactored the task processing logic (#5065)
|
2 tahun lalu |
Xuan Son Nguyen
|
821f0a271e
server : defer tasks when "slot unavailable" (#5018)
|
2 tahun lalu |
Georgi Gerganov
|
0ea069b87b
server : fix prompt caching with system prompt (#4914)
|
2 tahun lalu |
Ziad Ben Hadj-Alouane
|
356327feb3
server : fix deadlock that occurs in multi-prompt scenarios (#4905)
|
2 tahun lalu |
makomk
|
ee8243adaa
server : fix crash with multimodal models without BOS token (#4904)
|
2 tahun lalu |
slaren
|
e7e4df031b
llama : ggml-backend integration (#4766)
|
2 tahun lalu |
Georgi Gerganov
|
1d118386fe
server : fix infill when prompt is empty (#4833)
|
2 tahun lalu |
Laura
|
4330bd83fe
server : implement credentialed CORS (#4514)
|
2 tahun lalu |
Michael Coppola
|
27379455c3
server : support for multiple api keys (#4864)
|
2 tahun lalu |
Behnam M
|
eab6795006
server : add `LOG_INFO` when model is successfully loaded (#4881)
|
2 tahun lalu |
Isaac McFadyen
|
2f043328e3
server : fix typo in model name (#4876)
|
2 tahun lalu |
Georgi Gerganov
|
5c1980d8d4
server : fix build + rename enums (#4870)
|
2 tahun lalu |
Behnam M
|
cd108e641d
server : add a `/health` endpoint (#4860)
|
2 tahun lalu |
Georgi Gerganov
|
67984921a7
server : fix n_predict check (#4798)
|
2 tahun lalu |
Georgi Gerganov
|
012cf349ae
server : send token probs for "stream == false" (#4714)
|
2 tahun lalu |
Georgi Gerganov
|
32866c5edd
editorconfig : fix whitespace and indentation #4710
|
2 tahun lalu |
minarchist
|
5d7002d437
server : add --override-kv parameter (#4710)
|
2 tahun lalu |
Georgi Gerganov
|
9fbda719de
clip : refactor + bug fixes (#4696)
|
2 tahun lalu |
Justine Tunney
|
db49ff8ed7
server : replace sleep with condition variables (#4673)
|
2 tahun lalu |
SakuraUmi
|
60f55e888c
server : fix OpenAI server sampling w.r.t. penalty. (#4675)
|
2 tahun lalu |