cuquantum.cutensornet.contract_slices¶
- cuquantum.cutensornet.contract_slices(intptr_t handle, intptr_t plan, raw_data_in, intptr_t raw_data_out, int32_t accumulate_output, intptr_t work_desc, intptr_t slice_group, intptr_t stream)[源代码]¶
执行张量网络的实际收缩。
- 参数
handle (intptr_t) – 持有 cuTensorNet 库上下文的不透明句柄。
plan (intptr_t) – 编码张量网络收缩的执行(参见
create_contraction_plan()
和contraction_autotune()
)。一些内部元数据可能会在收缩时更新。raw_data_in (object) –
N 个指针的数组(N 是在
create_network_descriptor()
中指定的输入张量的数量):raw_data_in[i]
指向与第 i 个输入张量关联的数据(在设备内存中)。它可以是raw_data_out (intptr_t) – 指向输出张量的原始数据(在设备内存中)。
accumulate_output (int32_t) – 如果为 0,则将收缩结果写入 raw_data_out;否则将结果累加到 raw_data_out 中。
work_desc (intptr_t) – 描述工作区的不透明结构。提供的
CUTENSORNET_WORKSPACE_SCRATCH
工作区必须是valid
(工作区指针必须是设备可访问的,请参见cutensornetMemspace_t
,并且工作区大小必须大于或等于计划创建时提供的最小值和值)。请参见create_contraction_plan()
、workspace_get_memory_size()
和workspace_set_memory()
。CUTENSORNET_WORKSPACE_CACHE
工作区必须是设备可访问的,请参见cutensornetMemspace_t
;它可以是任何大小,越大越好,最大可达使用workspace_get_memory_size()
查询的大小。如果设置了设备内存处理程序,则work_desc
可以设置为 null,或者work_desc
中任一工作区类型的内存指针可以设置为 null,并且工作区大小可以设置为负值(在这种情况下,将使用“推荐”大小,请参见CUTENSORNET_WORKSIZE_PREF_RECOMMENDED
)或valid
大小。对于CUTENSORNET_WORKSPACE_SCRATCH
类型的工作区,具有指定大小的内存缓冲区将从用户的内存池中提取,并在完成后释放回内存池。对于CUTENSORNET_WORKSPACE_CACHE
类型的工作区,具有指定大小的内存缓冲区将从用户的内存池中提取,并在work_desc
被销毁后释放回内存池,如果work_desc
!= NULL,否则,一旦plan
被销毁,或者在后续的contract_slices()
调用中提供了具有不同内存地址/大小的替代work_desc
。slice_group (intptr_t) – 指定要收缩的切片的不透明对象(参见
create_slice_group_from_id_range()
和cutensornetCreateSliceGroupFromIDs()
)。如果 设置为 null, 则将收缩所有切片。
。stream (intptr_t) – 执行计算的 CUDA 流。