组调用

组原语定义了当前线程的行为以避免阻塞。 因此,它们可以从多个线程独立使用。

相关链接: 组调用

ncclGroupStart

ncclResult_t ncclGroupStart()

启动组调用。

在 ncclGroupEnd 之前对 NCCL 的所有后续调用都不会因 CPU 间同步而阻塞。

ncclGroupEnd

ncclResult_t ncclGroupEnd()

结束组调用。

当自 ncclGroupStart 以来的所有操作都已处理完毕时返回。 这意味着通信原语已排队到提供的流中,但不一定完成。

当与 ncclCommInitRank 调用一起使用时,ncclGroupEnd 调用会等待所有通信器完成初始化。

ncclGroupSimulateEnd

ncclResult_t ncclGroupSimulateEnd(ncclSimInfo_t* simInfo)

模拟 ncclGroupEnd() 调用,并在作为参数传递的结构中返回 NCCL 的模拟信息。