Reese Levine
|
21c021745d
ggml: Add initial WebGPU backend (#14521)
|
6 luni în urmă |
tempstudio
|
b0f0ecc3dc
model : support output bias for qwen2 (#14711)
|
6 luni în urmă |
Georgi Gerganov
|
225e7a1438
llama : add high-throughput mode (#14363)
|
6 luni în urmă |
Aman Gupta
|
ab14019821
Support diffusion models: Add Dream 7B (#14644)
|
6 luni în urmă |
Georgi Gerganov
|
64978340b0
ggml : add asserts (#14720)
|
6 luni în urmă |
Georgi Gerganov
|
6ffd4e9c44
server : pre-calculate EOG logit biases (#14721)
|
6 luni în urmă |
Shunta Saito
|
e4841d24d3
llama : fix parallel processing for plamo2 (#14716)
|
6 luni în urmă |
Georgi Gerganov
|
538cc77f7f
server : fix handling of the ignore_eos flag (#14710)
|
6 luni în urmă |
Johannes Gäßler
|
5cae766541
scripts: synthetic prompt mode for server-bench.py (#14695)
|
6 luni în urmă |
Sigbjørn Skjæret
|
4b91d6f71f
convert : only check for tokenizer folder if we need it (#14704)
|
6 luni în urmă |
Sigbjørn Skjæret
|
cf91f217f1
convert : add pre-computed hashes first to prevent order mishaps (#14701)
|
6 luni în urmă |
Min-Hua
|
79e0b68c17
llama: add LLAMA_API to deprecated llama_kv_self_seq_div (#14708)
|
6 luni în urmă |
Ed Addario
|
c81f4192f9
gguf-py : dump bpw per layer and model in markdown mode (#14703)
|
6 luni în urmă |
Gabriel Larson
|
4a4f426944
model : add Kimi-K2 support (#14654)
|
6 luni în urmă |
Jeff Bolz
|
ba1ceb3456
vulkan: fix noncontig check for mat_mul_id splitting (#14683)
|
6 luni în urmă |
Jeff Bolz
|
10a0351a97
vulkan: add RTE variants for glu/add/sub/mul/div (#14653)
|
6 luni în urmă |
Shunta Saito
|
68e37a61a7
model : add PLaMo-2 support (#14560)
|
6 luni în urmă |
R0CKSTAR
|
cbc68be51d
cuda: fix build warnings in set-rows.cu (unused variable) (#14687)
|
6 luni în urmă |
Anton Mitkov
|
bdca38376f
sycl: Hotfix for non dnnl codepath (#14677)
|
6 luni în urmă |
shalinib-ibm
|
55c509daf5
ggml : refactor llamafile_sgemm PPC code (#14673)
|
6 luni în urmă |
Aman Gupta
|
9c9e4fc635
llama-context: add ability to get logits (#14672)
|
6 luni în urmă |
Johannes Gäßler
|
494c5899cb
scripts: benchmark for HTTP server throughput (#14668)
|
6 luni în urmă |
Akarshan Biswas
|
0f4c6ec0f1
SYCL: use 1D kernel for set_rows (#14618)
|
6 luni în urmă |
Anton Mitkov
|
65a3ebb0aa
sycl: Batched mulmat rework for oneDNN dispatch (#14617)
|
6 luni în urmă |
Molly Sophia
|
0d9226763c
llama : add jinja template for rwkv-world (#14665)
|
6 luni în urmă |
Ed Addario
|
982e347255
quantize : fix minor logic flaw in --tensor-type (#14572)
|
6 luni în urmă |
Sigbjørn Skjæret
|
923e3ea2e3
cuda : add set rows for bf16 (#14664)
|
6 luni în urmă |
Yavor Ivanov
|
e743cddb60
cuda : add ELU support (#14657)
|
6 luni în urmă |
Georgi Gerganov
|
05fec5bd29
ggml : add build-time message to remind about ggml_set_rows (#14661)
|
6 luni în urmă |
Yavor Ivanov
|
dcf7f2ea3c
metal : Add missing unary ops Metal support (#14660)
|
6 luni în urmă |