Georgi Gerganov
|
5cab3e4aaa
llama : minor grammar refactor (#10897)
|
1 год назад |
Georgi Gerganov
|
36319dec5d
tts : small QoL for easy model fetch (#10903)
|
1 год назад |
Xuan Son Nguyen
|
57bb2c40cd
server : fix logprobs, make it OAI-compatible (#10783)
|
1 год назад |
Adrien Gallouët
|
a3c33b1dce
ggml: fix arm build with gcc (#10895)
|
1 год назад |
Sukriti Sharma
|
2fffc52b50
llama : fix Roberta embeddings (#10856)
|
1 год назад |
fairydreaming
|
7585edbdeb
convert : Add support for Microsoft Phi-4 model (#10817)
|
1 год назад |
Johannes Gäßler
|
cd920d0ac3
tests: disable GGUF test for bad value size (#10886)
|
1 год назад |
Eric Curtin
|
7909e8588d
llama-run : improve progress bar (#10821)
|
1 год назад |
Diego Devesa
|
9177484f58
ggml : fix arm build (#10890)
|
1 год назад |
Georgi Gerganov
|
0bf2d10c55
tts : add OuteTTS support (#10784)
|
1 год назад |
Gaetan Bisson
|
7bbb5acf12
server: avoid overwriting Authorization header (#10878)
|
1 год назад |
Georgi Gerganov
|
152610eda9
server : output embeddings for all tokens when pooling = none (#10861)
|
1 год назад |
Georgi Gerganov
|
0e70ba686e
server : add "tokens" output (#10853)
|
1 год назад |
Xuan Son Nguyen
|
46828872c3
server : (embeddings) using same format for "input" and "content" (#10872)
|
1 год назад |
redbeard
|
6b064c92b4
docs: Fix HIP (née hipBLAS) in README (#10880)
|
1 год назад |
Diego Devesa
|
4da69d1abd
Revert "llama : add Falcon3 support (#10864)" (#10876)
|
1 год назад |
DAN™
|
d62b532c52
Use model->gguf_kv for loading the template instead of using the C API. (#10868)
|
1 год назад |
Johannes Gäßler
|
081b29bd2a
tests: add tests for GGUF (#10830)
|
1 год назад |
Georgi Gerganov
|
5437d4aaf5
sync : ggml
|
1 год назад |
Georgi Gerganov
|
78f766768d
cmake : fix "amd64" processor string (whisper/2638)
|
1 год назад |
gn64
|
8dd19a4812
vulkan : fix soft_max.comp division by zero (whisper/2633)
|
1 год назад |
Daniel Bevenius
|
130d0c90bd
ggml : remove return from ggml_gallocr_allocate_node (ggml/1048)
|
1 год назад |
Daniel Bevenius
|
3919da8e33
ggml : add check for grad_accs (ggml/1046)
|
1 год назад |
Georgi Gerganov
|
0006f5a74a
ggml : update ggml_backend_cpu_device_supports_op (#10867)
|
1 год назад |
krystiancha
|
05c3a444b8
server : fill usage info in embeddings and rerank responses (#10852)
|
1 год назад |
Billel Mokeddem
|
382bc7f2e8
llama : add Falcon3 support (#10864)
|
1 год назад |
Ruan
|
4f51968aca
readme : update typos (#10863)
|
1 год назад |
Xuan Son Nguyen
|
227d7c5a7f
server : (UI) fix missing async generator on safari (#10857)
|
1 год назад |
Eve
|
7b1ec53f56
vulkan: bugfixes for small subgroup size systems + llvmpipe test (#10809)
|
1 год назад |
Zhiyuan Li
|
160bc039c8
rwkv6: add wkv6 support for Vulkan backend (#10829)
|
1 год назад |