Tei Home
|
1204f97270
doc: add cuda guide for fedora (#11135)
|
před 1 rokem |
Daniel Bevenius
|
8eceb888d7
server : add tooltips to settings and themes btn (#11154)
|
před 1 rokem |
Pierrick Hymbert
|
f8feb4b01a
model: Add support for PhiMoE arch (#11003)
|
před 1 rokem |
Georgi Gerganov
|
be0e950c91
media : remove old img [no ci]
|
před 1 rokem |
Xuan Son Nguyen
|
d9feae1c06
llama-chat : add phi 4 template (#11148)
|
před 1 rokem |
hydai
|
8d59d91171
fix: add missing msg in static_assert (#11143)
|
před 1 rokem |
Vinesh Janarthanan
|
8a1d9c25fa
gguf-py : move scripts directory (#11116)
|
před 1 rokem |
Eric Curtin
|
1bf839b1e8
Enhance user input handling for llama-run (#11138)
|
před 1 rokem |
Xuan Son Nguyen
|
f7cd13301c
ci : use actions from ggml-org (#11140)
|
před 1 rokem |
Xuan Son Nguyen
|
4d2b3d8804
lora : improve compat with `mergekit-extract-lora` (#11131)
|
před 1 rokem |
Georgi Gerganov
|
c07d437bbd
llama : avoid hardcoded QK_K (#11061)
|
před 1 rokem |
Georgi Gerganov
|
99a3755a3c
sync : ggml
|
před 1 rokem |
Radoslav Gerganov
|
c792dcf488
ggml : allow loading backend with env variable (ggml/1059)
|
před 1 rokem |
Xuan Son Nguyen
|
80ccf5d725
ci : pin dependency to specific version (#11137)
|
před 1 rokem |
Georgi Gerganov
|
a3c1232c3f
arg : option to exclude arguments from specific examples (#11136)
|
před 1 rokem |
amritahs-ibm
|
8cef75c743
llamafile : ppc64le MMA INT8 implementation (#10912)
|
před 1 rokem |
Georgi Gerganov
|
0d52a69e4b
ci : fix cmake option (#11125)
|
před 1 rokem |
Mathieu Baudier
|
02f0430141
Disable GL_KHR_cooperative_matrix Vulkan extension if not available. (#11117)
|
před 1 rokem |
ag2s20150909
|
bec2183f2c
fix: Vulkan shader gen binary path when Cross-compiling (#11096)
|
před 1 rokem |
Johannes Gäßler
|
53ff6b9b9f
GGUF: C++ refactor, backend support, misc fixes (#11030)
|
před 1 rokem |
Diego Devesa
|
017cc5f446
ggml-backend : only offload from host buffers (fix) (#11124)
|
před 1 rokem |
Diego Devesa
|
a3d50bc022
ggml-backend : only offload from host buffers (#11120)
|
před 1 rokem |
Radoslav Gerganov
|
a4dd490069
rpc : code cleanup (#11107)
|
před 1 rokem |
Akarshan Biswas
|
c0d6f790d0
SYCL: Use get_multi_ptr instead of deprecated get_pointer in wkv6 (#11087)
|
před 1 rokem |
Eric Curtin
|
dc7cef9f37
llama-run : fix context size (#11094)
|
před 1 rokem |
Georgi Gerganov
|
ecebbd292d
llama : remove unused headers (#11109)
|
před 1 rokem |
Xuan Son Nguyen
|
96be8c3264
github : add cmd line field to bug report (#11090)
|
před 1 rokem |
Georgi Gerganov
|
e6e7c75d94
server : fix extra BOS in infill endpoint (#11106)
|
před 1 rokem |
Xuan Son Nguyen
|
09186fabbe
llama : remove check flash_attn with lora (#11104)
|
před 1 rokem |
Asghar Ghorbani
|
96a1dc27c3
llama : prevent system info string accumulation across calls (#11101)
|
před 1 rokem |