Pavel Zloi
|
8db003a19d
py : support converting local models (#7547)
|
1 년 전 |
Xuan Son Nguyen
|
0996c5597f
llava : correct args for minicpmv-cli (#9429)
|
1 년 전 |
Xuan Son Nguyen
|
5bb2c5dbd2
files : remove accidentally added `lora_test` submodule (#9430)
|
1 년 전 |
Farbod Bijary
|
67155ab7f5
feat: Implements retrying logic for downloading models using --model-url flag (#9255)
|
1 년 전 |
Johannes Gäßler
|
5af118efda
CUDA: fix --split-mode row race condition (#9413)
|
1 년 전 |
Georgi Gerganov
|
d2b496bff4
batched-bench : remove unused code (#9305)
|
1 년 전 |
R0CKSTAR
|
b34e023480
musa: remove Clang builtins mapping (#9421)
|
1 년 전 |
Alberto Cabrera Pérez
|
51b6038636
sycl : update support conditions (#9394)
|
1 년 전 |
Georgi Gerganov
|
cb9c933eb2
flake.lock: Update (#9360)
|
1 년 전 |
Xuan Son Nguyen
|
6cd4e03444
arg : bring back missing ifdef (#9411)
|
1 년 전 |
matteo
|
8d300bd35f
enable --special arg for llama-server (#9419)
|
1 년 전 |
slaren
|
49006c67b4
llama : move random seed generation to the samplers (#9398)
|
1 년 전 |
Georgi Gerganov
|
00ba2ff781
metal : fix compile warning with GGML_METAL_NDEBUG (#0)
|
1 년 전 |
Daniel Bevenius
|
83008b7cfe
llama : update llm_build_copy_mask_state comment [no ci] (#9385)
|
1 년 전 |
Molly Sophia
|
0b4ac75772
RWKV v6: Add time_mix_decay_w1/w2 in quant exclusion list (#9387)
|
1 년 전 |
slaren
|
fb3f249815
make : do not run llama-gen-docs when building (#9399)
|
1 년 전 |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 년 전 |
Radoslav Gerganov
|
293bebe077
rpc : fix segfault with nkvo (#9389)
|
1 년 전 |
Prashant Vithule
|
5fac4d5764
ggml : vector length agnostic SVE support (#9290)
|
1 년 전 |
slaren
|
5fb5e24811
llama : minor sampling refactor (2) (#9386)
|
1 년 전 |
Georgi Gerganov
|
38ca6f644b
readme : update hot topics
|
1 년 전 |
Johannes Gäßler
|
8e6e2fbe14
CUDA: fix variable name conflict for Windows build (#9382)
|
1 년 전 |
Antonis Makropoulos
|
5ed087573e
readme : add LLMUnity to UI projects (#9381)
|
1 년 전 |
Radoslav Gerganov
|
54f376d0b9
rpc : update README [no ci] (#9320)
|
1 년 전 |
Dan Johansson
|
b2e89a3274
Arm AArch64: Documentation updates (#9321)
|
1 년 전 |
Markus Tavenrath
|
daa9623ab0
Overlap cmdbuffer creation and cmdbuffer execution in Vulkan backend by submitting smaller cmdbuffers early. (#9118)
|
1 년 전 |
Georgi Gerganov
|
e079bffb66
cuda : fix FA Q src index (1 -> 0) (#9374)
|
1 년 전 |
Xuan Son Nguyen
|
3f7ccfd649
common : bring back missing args, add env var duplication check (#9375)
|
1 년 전 |
slaren
|
a249843d89
common : restore --n-gpu-layers (#9371)
|
1 년 전 |
slaren
|
19f4a7b296
llama : refactor samplers internal implementation (#9370)
|
1 년 전 |