slaren
|
06abf8eeba
ggml : add view_src and view_offs to ggml_tensor for views (#2874)
|
2 ani în urmă |
xaedes
|
44c117f41e
train : mem usage and other improvements (#2439)
|
2 ani în urmă |
Georgi Gerganov
|
35feac6560
ggml : sync (mem align to header + conv_transpose_2d fixes + ggml_alloc) (#2852)
|
2 ani în urmă |
Georgi Gerganov
|
d0cee0d36d
gguf : add 64-bit support (GGUF v2) (#2821)
|
2 ani în urmă |
Przemysław Pawełczyk
|
1591e2e590
ggml : detect SSSE3 (#2825)
|
2 ani în urmă |
Georgi Gerganov
|
cf658adc83
llm : add Falcon support (#2717)
|
2 ani în urmă |
Georgi Gerganov
|
ef3f333d37
ggml : sync latest (SAM + SD operators, CUDA alibi) (#2709)
|
2 ani în urmă |
Kylin
|
1e3bc523d8
ggml : support CUDA's half type for aarch64(#1455) (#2670)
|
2 ani în urmă |
Georgi Gerganov
|
6381d4e110
gguf : new file format with flexible meta data (beta) (#2398)
|
2 ani în urmă |
slaren
|
9e232f0234
ggml : move all type info to ggml_type_traits (#2663)
|
2 ani în urmă |
Georgi Gerganov
|
99d29c0094
ggml : sync (custom ops) (#2537)
|
2 ani în urmă |
slaren
|
a113689571
ggml : add graph tensor allocator (#2411)
|
2 ani în urmă |
slaren
|
5488fb789e
ggml : allocate graphs in a context (#2392)
|
2 ani în urmă |
slaren
|
da1889834a
ggml : improve graph build time via hash table lookup (#2329)
|
2 ani în urmă |
slaren
|
41c674161f
make rms_norm_eps a parameter (#2374)
|
2 ani în urmă |
Georgi Gerganov
|
5b2b2dc6ae
ggml : sync (unary ops refactor, static-correctness) (#2370)
|
2 ani în urmă |
slaren
|
95a6c595e7
ggml: move op parameters from tensors to ggml_tensor::op_params (#2333)
|
2 ani în urmă |
Georgi Gerganov
|
513f861953
ggml : fix rope args order + assert (#2054)
|
2 ani în urmă |
Xiao-Yong Jin
|
6e7cca4047
llama : add custom RoPE (#2054)
|
2 ani în urmă |
Georgi Gerganov
|
4523d10d0c
ggml : add ggml_pool_1d and ggml_pool_2d
|
2 ani în urmă |
Georgi Gerganov
|
20d7740a9b
ggml : sync (abort callback, mul / add broadcast, fix alibi) (#2183)
|
2 ani în urmă |
Spencer Sutton
|
5bf2a27718
ggml : remove src0 and src1 from ggml_tensor and rename opt to src (#2178)
|
2 ani în urmă |
Qingyou Meng
|
1d656d6360
ggml : change ggml_graph_compute() API to not require context (#1999)
|
2 ani în urmă |
Georgi Gerganov
|
dfd9fce6d6
ggml : fix restrict usage
|
2 ani în urmă |
Stephan Walter
|
1b107b8550
ggml : generalize `quantize_fns` for simpler FP16 handling (#1237)
|
2 ani în urmă |
Georgi Gerganov
|
ed9a54e512
ggml : sync latest (new ops, macros, refactoring) (#2106)
|
2 ani în urmă |
Qingyou Meng
|
b1ca8f36a9
ggml : disable GGML_TASK_INIT and GGML_TASK_FINALIZE by default (#1995)
|
2 ani în urmă |
Georgi Gerganov
|
d9779021bd
ggml : add support for ChatGLM RoPE
|
2 ani în urmă |
David Yang
|
eaa6ca5a61
ggml : increase max tensor name + clean up compiler warnings in train-text (#1988)
|
2 ani în urmă |
zrm
|
b853d45601
ggml : add NUMA support (#1556)
|
2 ani în urmă |