Trivikram Kamat
|
3c26a1644d
ci : bump actions/checkout to v4 (#9377)
|
1 tahun lalu |
Michael Podvitskiy
|
ff76e18516
cmake : fixed the order of linking libraries for llama-quantize (#9450)
|
1 tahun lalu |
Molly Sophia
|
39f852f440
py : add special tokens in hf_converter for RWKV v6 (#9428)
|
1 tahun lalu |
Ahmad Tameem
|
2b00fa7997
riscv : modify Makefile and add a RISCV_VECT to print log info (#9442)
|
1 tahun lalu |
Georgi Gerganov
|
d6a04f872d
ggml : hide ggml_object, ggml_cgraph, ggml_hash_set (#9408)
|
1 tahun lalu |
Neo Zhang Jianyu
|
c9c8575a1a
enhance run script to be easy to change the parameters (#9448)
|
1 tahun lalu |
Xinpeng Dou
|
df4b7945ae
cann: Fix error when running a non-exist op (#9424)
|
1 tahun lalu |
Faisal Zaghloul
|
449ccfb6f5
Add Jais to list of supported models (#9439)
|
1 tahun lalu |
slaren
|
1b28061400
llama : skip token bounds check when evaluating embeddings (#9437)
|
1 tahun lalu |
Pavel Zloi
|
8db003a19d
py : support converting local models (#7547)
|
1 tahun lalu |
Xuan Son Nguyen
|
0996c5597f
llava : correct args for minicpmv-cli (#9429)
|
1 tahun lalu |
Xuan Son Nguyen
|
5bb2c5dbd2
files : remove accidentally added `lora_test` submodule (#9430)
|
1 tahun lalu |
Farbod Bijary
|
67155ab7f5
feat: Implements retrying logic for downloading models using --model-url flag (#9255)
|
1 tahun lalu |
Johannes Gäßler
|
5af118efda
CUDA: fix --split-mode row race condition (#9413)
|
1 tahun lalu |
Georgi Gerganov
|
d2b496bff4
batched-bench : remove unused code (#9305)
|
1 tahun lalu |
R0CKSTAR
|
b34e023480
musa: remove Clang builtins mapping (#9421)
|
1 tahun lalu |
Alberto Cabrera Pérez
|
51b6038636
sycl : update support conditions (#9394)
|
1 tahun lalu |
Georgi Gerganov
|
cb9c933eb2
flake.lock: Update (#9360)
|
1 tahun lalu |
Xuan Son Nguyen
|
6cd4e03444
arg : bring back missing ifdef (#9411)
|
1 tahun lalu |
matteo
|
8d300bd35f
enable --special arg for llama-server (#9419)
|
1 tahun lalu |
slaren
|
49006c67b4
llama : move random seed generation to the samplers (#9398)
|
1 tahun lalu |
Georgi Gerganov
|
00ba2ff781
metal : fix compile warning with GGML_METAL_NDEBUG (#0)
|
1 tahun lalu |
Daniel Bevenius
|
83008b7cfe
llama : update llm_build_copy_mask_state comment [no ci] (#9385)
|
1 tahun lalu |
Molly Sophia
|
0b4ac75772
RWKV v6: Add time_mix_decay_w1/w2 in quant exclusion list (#9387)
|
1 tahun lalu |
slaren
|
fb3f249815
make : do not run llama-gen-docs when building (#9399)
|
1 tahun lalu |
Xuan Son Nguyen
|
bfe76d4a17
common : move arg parser code to `arg.cpp` (#9388)
|
1 tahun lalu |
Radoslav Gerganov
|
293bebe077
rpc : fix segfault with nkvo (#9389)
|
1 tahun lalu |
Prashant Vithule
|
5fac4d5764
ggml : vector length agnostic SVE support (#9290)
|
1 tahun lalu |
slaren
|
5fb5e24811
llama : minor sampling refactor (2) (#9386)
|
1 tahun lalu |
Georgi Gerganov
|
38ca6f644b
readme : update hot topics
|
1 tahun lalu |