Sigbjørn Skjæret
|
4b91d6f71f
convert : only check for tokenizer folder if we need it (#14704)
|
6 tháng trước cách đây |
Sigbjørn Skjæret
|
cf91f217f1
convert : add pre-computed hashes first to prevent order mishaps (#14701)
|
6 tháng trước cách đây |
Min-Hua
|
79e0b68c17
llama: add LLAMA_API to deprecated llama_kv_self_seq_div (#14708)
|
6 tháng trước cách đây |
Ed Addario
|
c81f4192f9
gguf-py : dump bpw per layer and model in markdown mode (#14703)
|
6 tháng trước cách đây |
Gabriel Larson
|
4a4f426944
model : add Kimi-K2 support (#14654)
|
6 tháng trước cách đây |
Jeff Bolz
|
ba1ceb3456
vulkan: fix noncontig check for mat_mul_id splitting (#14683)
|
6 tháng trước cách đây |
Jeff Bolz
|
10a0351a97
vulkan: add RTE variants for glu/add/sub/mul/div (#14653)
|
6 tháng trước cách đây |
Shunta Saito
|
68e37a61a7
model : add PLaMo-2 support (#14560)
|
6 tháng trước cách đây |
R0CKSTAR
|
cbc68be51d
cuda: fix build warnings in set-rows.cu (unused variable) (#14687)
|
6 tháng trước cách đây |
Anton Mitkov
|
bdca38376f
sycl: Hotfix for non dnnl codepath (#14677)
|
6 tháng trước cách đây |
shalinib-ibm
|
55c509daf5
ggml : refactor llamafile_sgemm PPC code (#14673)
|
6 tháng trước cách đây |
Aman Gupta
|
9c9e4fc635
llama-context: add ability to get logits (#14672)
|
6 tháng trước cách đây |
Johannes Gäßler
|
494c5899cb
scripts: benchmark for HTTP server throughput (#14668)
|
6 tháng trước cách đây |
Akarshan Biswas
|
0f4c6ec0f1
SYCL: use 1D kernel for set_rows (#14618)
|
6 tháng trước cách đây |
Anton Mitkov
|
65a3ebb0aa
sycl: Batched mulmat rework for oneDNN dispatch (#14617)
|
6 tháng trước cách đây |
Molly Sophia
|
0d9226763c
llama : add jinja template for rwkv-world (#14665)
|
6 tháng trước cách đây |
Ed Addario
|
982e347255
quantize : fix minor logic flaw in --tensor-type (#14572)
|
6 tháng trước cách đây |
Sigbjørn Skjæret
|
923e3ea2e3
cuda : add set rows for bf16 (#14664)
|
6 tháng trước cách đây |
Yavor Ivanov
|
e743cddb60
cuda : add ELU support (#14657)
|
6 tháng trước cách đây |
Georgi Gerganov
|
05fec5bd29
ggml : add build-time message to remind about ggml_set_rows (#14661)
|
6 tháng trước cách đây |
Yavor Ivanov
|
dcf7f2ea3c
metal : Add missing unary ops Metal support (#14660)
|
6 tháng trước cách đây |
Yavor Ivanov
|
84b396e051
cmake : Add CMake presets for Linux and GCC (#14656)
|
6 tháng trước cách đây |
Tarek Dakhran
|
c31e60647d
tests : cover lfm2 cases in test_ssm_conv (#14651)
|
6 tháng trước cách đây |
Tarek Dakhran
|
67eade1bf9
docs : add LFM2 to models section (#14650)
|
6 tháng trước cách đây |
Aman Gupta
|
7de5c7cab6
CUDA: add set rows for f32 and f16 (#14551)
|
6 tháng trước cách đây |
Georgi Gerganov
|
8eff95544e
sync : ggml
|
6 tháng trước cách đây |
Georgi Gerganov
|
3120413ccd
vulkan : remove unused vars (#0)
|
6 tháng trước cách đây |
Georgi Gerganov
|
215535701d
sync : ggml
|
6 tháng trước cách đây |
Acly
|
74bb294591
vulkan : implement bilinear interpolation (ggml/1291)
|
6 tháng trước cách đây |
Acly
|
3e303b1107
vulkan : implement ggml_roll (ggml/1290)
|
6 tháng trước cách đây |