Neo Zhang Jianyu
|
c9c8575a1a
enhance run script to be easy to change the parameters (#9448)
|
1 год назад |
Xinpeng Dou
|
df4b7945ae
cann: Fix error when running a non-exist op (#9424)
|
1 год назад |
Faisal Zaghloul
|
449ccfb6f5
Add Jais to list of supported models (#9439)
|
1 год назад |
slaren
|
1b28061400
llama : skip token bounds check when evaluating embeddings (#9437)
|
1 год назад |
Pavel Zloi
|
8db003a19d
py : support converting local models (#7547)
|
1 год назад |
Xuan Son Nguyen
|
0996c5597f
llava : correct args for minicpmv-cli (#9429)
|
1 год назад |
Xuan Son Nguyen
|
5bb2c5dbd2
files : remove accidentally added `lora_test` submodule (#9430)
|
1 год назад |
Farbod Bijary
|
67155ab7f5
feat: Implements retrying logic for downloading models using --model-url flag (#9255)
|
1 год назад |
Johannes Gäßler
|
5af118efda
CUDA: fix --split-mode row race condition (#9413)
|
1 год назад |
Georgi Gerganov
|
d2b496bff4
batched-bench : remove unused code (#9305)
|
1 год назад |
R0CKSTAR
|
b34e023480
musa: remove Clang builtins mapping (#9421)
|
1 год назад |
Alberto Cabrera Pérez
|
51b6038636
sycl : update support conditions (#9394)
|
1 год назад |
Georgi Gerganov
|
cb9c933eb2
flake.lock: Update (#9360)
|
1 год назад |
Xuan Son Nguyen
|
6cd4e03444
arg : bring back missing ifdef (#9411)
|
1 год назад |
matteo
|
8d300bd35f
enable --special arg for llama-server (#9419)
|
1 год назад |
slaren
|
49006c67b4
llama : move random seed generation to the samplers (#9398)
|
1 год назад |
Georgi Gerganov
|
00ba2ff781
metal : fix compile warning with GGML_METAL_NDEBUG (#0)
|
1 год назад |
Daniel Bevenius
|
83008b7cfe
llama : update llm_build_copy_mask_state comment [no ci] (#9385)
|
1 год назад |
Molly Sophia
|
0b4ac75772
RWKV v6: Add time_mix_decay_w1/w2 in quant exclusion list (#9387)
|
1 год назад |
slaren
|
fb3f249815
make : do not run llama-gen-docs when building (#9399)
|
1 год назад |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 год назад |
Radoslav Gerganov
|
293bebe077
rpc : fix segfault with nkvo (#9389)
|
1 год назад |
Prashant Vithule
|
5fac4d5764
ggml : vector length agnostic SVE support (#9290)
|
1 год назад |
slaren
|
5fb5e24811
llama : minor sampling refactor (2) (#9386)
|
1 год назад |
Georgi Gerganov
|
38ca6f644b
readme : update hot topics
|
1 год назад |
Johannes Gäßler
|
8e6e2fbe14
CUDA: fix variable name conflict for Windows build (#9382)
|
1 год назад |
Antonis Makropoulos
|
5ed087573e
readme : add LLMUnity to UI projects (#9381)
|
1 год назад |
Radoslav Gerganov
|
54f376d0b9
rpc : update README [no ci] (#9320)
|
1 год назад |
Dan Johansson
|
b2e89a3274
Arm AArch64: Documentation updates (#9321)
|
1 год назад |
Markus Tavenrath
|
daa9623ab0
Overlap cmdbuffer creation and cmdbuffer execution in Vulkan backend by submitting smaller cmdbuffers early. (#9118)
|
1 год назад |