Georgi Gerganov
|
fd1234cb46
llama : add gpt-oss (#15091)
|
5 luni în urmă |
Georgi Gerganov
|
bf9087f59a
metal : fuse add, mul + add tests (#14596)
|
6 luni în urmă |
Jesse Gross
|
f057808ffa
ggml: Don't assert fail when tensor data changes (#13222)
|
8 luni în urmă |
William Tambellini
|
70680c48e5
ggml : upgrade init_tensor API to return a ggml_status (#11854)
|
11 luni în urmă |
Jeff Bolz
|
1b598b3058
vulkan: use smaller combined allocations to avoid fragmentation (#11551)
|
11 luni în urmă |
Johannes Gäßler
|
9c8dcefe17
CUDA: backwards pass for misc. ops, add tests (#11257)
|
1 an în urmă |
Daniel Bevenius
|
130d0c90bd
ggml : remove return from ggml_gallocr_allocate_node (ggml/1048)
|
1 an în urmă |
Johannes Gäßler
|
8a43e940ab
ggml: new optimization interface (ggml/988)
|
1 an în urmă |
Daniel Bevenius
|
cd60b88bf7
ggml-alloc : remove buffer_id from leaf_alloc (ggml/987)
|
1 an în urmă |
Diego Devesa
|
96776405a1
ggml : move more prints to the ggml log system (#9839)
|
1 an în urmă |
slaren
|
d09770cae7
ggml-alloc : fix list of allocated tensors with GGML_ALLOCATOR_DEBUG (#9573)
|
1 an în urmă |
slaren
|
2b1f616b20
ggml : reduce hash table reset cost (#8698)
|
1 an în urmă |
Johannes Gäßler
|
a15ef8f8a0
CUDA: fix partial offloading for ne0 % 256 != 0 (#8572)
|
1 an în urmă |
Georgi Gerganov
|
f3f65429c4
llama : reorganize source code + improve CMake (#8006)
|
1 an în urmă |