Georgi Gerganov
|
3a03541ced
minor : fix trailing whitespace (#5638)
|
před 1 rokem |
Georgi Gerganov
|
56d03d92be
readme : update hot topics
|
před 1 rokem |
Xuan Son Nguyen
|
a46f50747b
server : fallback to chatml, add AlphaMonarch chat template (#5628)
|
před 1 rokem |
Alexey Parfenov
|
c5688c6250
server : clarify some params in the docs (#5640)
|
před 1 rokem |
Dat Quoc Nguyen
|
4ef245a92a
mpt : add optional bias tensors (#5638)
|
před 1 rokem |
slaren
|
973053d8b0
llama : fix loading models with shared tok_embd and output (#5651)
|
před 1 rokem |
Xuan Son Nguyen
|
7c8bcc11dc
Add docs for llama_chat_apply_template (#5645)
|
před 1 rokem |
slaren
|
7fe4678b02
llama : fix session save/load with quantized KV (#5649)
|
před 1 rokem |
slaren
|
ba2135ccae
gemma : allow offloading the output tensor (#5646)
|
před 1 rokem |
Jared Van Bortel
|
89febfed93
examples : do not assume BOS when shifting context (#5622)
|
před 1 rokem |
Georgi Gerganov
|
5022cf242d
sync : ggml
|
před 1 rokem |
Pierrick Hymbert
|
1ecea255eb
server: health: fix race condition on slots data using tasks queue (#5634)
|
před 1 rokem |
Ettore Di Giacinto
|
a00a35cef9
readme : add LocalAI to the availables UI (#5629)
|
před 1 rokem |
Georgi Gerganov
|
eccd7a26dd
sync : ggml (#5633)
|
před 1 rokem |
Georgi Gerganov
|
c14f72db9c
readme : update hot topics
|
před 1 rokem |
Daniel Bevenius
|
cc6cac08e3
llava : add --skip-unknown to 1.6 convert.py (#5632)
|
před 1 rokem |
postmasters
|
580111d42b
llama : add `gemma` model (#5631)
|
před 1 rokem |
Meng, Hengyu
|
88c46cbdac
[SYCL] conext add name (#5624)
|
před 1 rokem |
Kawrakow
|
a14679cc30
IQ4_NL: 4-bit non-linear quants with blocks of 32 (#5590)
|
před 1 rokem |
CJ Pais
|
6560bed3f0
server : support llava 1.6 (#5553)
|
před 1 rokem |
slaren
|
06bf2cf8c4
make : fix debug build with CUDA (#5616)
|
před 1 rokem |
Daniel Bevenius
|
4ed8e4fbef
llava : add explicit instructions for llava-1.6 (#5611)
|
před 1 rokem |
Xuan Son Nguyen
|
9c405c9f9a
Server: use llama_chat_apply_template (#5593)
|
před 1 rokem |
Dane Madsen
|
5207b3fbc5
readme : update UI list (#5605)
|
před 1 rokem |
Haoxiang Fei
|
8dbbd75754
metal : add build system support for embedded metal library (#5604)
|
před 1 rokem |
Pierrick Hymbert
|
c0a8c6db37
server : health endpoint configurable failure on no slot (#5594)
|
před 1 rokem |
AidanBeltonS
|
b9111bd209
Update ggml_sycl_op_mul_mat_vec_q (#5502)
|
před 1 rokem |
Mathijs de Bruin
|
633782b8d9
nix: now that we can do so, allow MacOS to build Vulkan binaries
|
před 1 rokem |
0cc4m
|
22f83f0c38
Enable Vulkan MacOS CI
|
před 1 rokem |
0cc4m
|
bb9dcd560a
Refactor validation and enumeration platform checks into functions to clean up ggml_vk_instance_init()
|
před 1 rokem |