Xuan Son Nguyen
|
adffa6ffd5
common : improve -ctv -ctk CLI arguments (#10806)
|
hace 1 año |
Xuan Son Nguyen
|
274ec65af6
contrib : add ngxson as codeowner (#10804)
|
hace 1 año |
a3sh
|
8faa1d4dd4
CUDA: faster non-contiguous concat (#10760)
|
hace 1 año |
Diego Devesa
|
cb13ef85a4
remove CMAKE_WINDOWS_EXPORT_ALL_SYMBOLS (#10797)
|
hace 1 año |
0cc4m
|
4064c0e3b6
Vulkan: Use improved q4_k and q5_k dequant code in dequant shaders (#10798)
|
hace 1 año |
0cc4m
|
dc5301d565
Vulkan: Add VK_EXT_subgroup_size_control support to ensure full subgroups for coopmats (#10721)
|
hace 1 año |
Xuan Son Nguyen
|
9fdb124304
common : add missing env var for speculative (#10801)
|
hace 1 año |
CentricStorm
|
5555c0c1f6
docs: update server streaming mode documentation (#9519)
|
hace 1 año |
Georgi Gerganov
|
973f328b1e
Merge pull request #10788 from ggerganov/gg/gguf-py-0.11.0
|
hace 1 año |
Georgi Gerganov
|
fb18934a97
gguf-py : bump version to 0.11.0
|
hace 1 año |
Xuan Son Nguyen
|
235f6e14bf
server : (UI) add tok/s, get rid of completion.js (#10786)
|
hace 1 año |
qingy1337
|
1a31d0dc00
Update README.md (#10772)
|
hace 1 año |
Xuan Son Nguyen
|
92f77a640f
ci : pin nodejs to 22.11.0 (#10779)
|
hace 1 año |
kallewoof
|
484d2f31ae
bug-fix: snprintf prints NULL in place of the last character (#10419)
|
hace 1 año |
CentricStorm
|
4b4d92b098
docs: fix server documentation formatting (#10776)
|
hace 1 año |
Gilad S.
|
43041d2eb3
ggml: load all backends from a user-provided search path (#10699)
|
hace 1 año |
Jeff Bolz
|
b685daf386
vulkan: request round-to-even for fp16 in im2col/rope_head (#10767)
|
hace 1 año |
Eve
|
dafae66cc2
vulkan: dynamic subgroup size for the remaining k quants (#10745)
|
hace 1 año |
Bartowski
|
ae4b922614
imatrix : Add imatrix to --no-context-shift (#10766)
|
hace 1 año |
Andreas Kieslinger
|
750cb3e246
CUDA: rename macros to avoid conflicts with WinAPI (#10736)
|
hace 1 año |
Yüg
|
a86ad841f1
server : add flag to disable the web-ui (#10762) (#10751)
|
hace 1 año |
Jeff Bolz
|
a05e2afcc2
vulkan: disable spirv-opt for coopmat shaders (#10763)
|
hace 1 año |
Johannes Gäßler
|
26a8406ba9
CUDA: fix shared memory access condition for mmv (#10740)
|
hace 1 año |
Srihari-mcw
|
c37fb4cf62
Changes to CMakePresets.json to add ninja clang target on windows (#10668)
|
hace 1 año |
Jeff Bolz
|
3d98b4cb22
vulkan: fix compile warnings (#10731)
|
hace 1 año |
Borislav Stanimirov
|
1a05004743
cmake : simplify msvc charsets (#10672)
|
hace 1 año |
Xuan Son Nguyen
|
ce8784bdb1
server : fix format_infill (#10724)
|
hace 1 año |
Xuan Son Nguyen
|
e52522b869
server : bring back info of final chunk in stream mode (#10722)
|
hace 1 año |
stduhpf
|
06d70147e6
Vulkan: fix NaN in tanh.comp with AMD proprietary driver on Windows (#10723)
|
hace 1 año |
Diego Devesa
|
43ed389a3f
llama : use cmake for swift build (#10525)
|
hace 1 año |