【功能模块】
MindSpore GPU1.8.1
Ubuntu 22.4
GPU 1080Ti
【操作步骤&问题现象】
mindspore模型在训练过程中的速度明显低于pytorch模型。
具体到代码而言,在损失函数中,使用到了一次该算子。
我根据API映射将该算子迁移过来。
#Pytorch
mask = mask.repeat(anchor_count, contrast_count)
#mindspore
mask = ms.numpy.tile(mask, (anchor_count, contrast_count))
【截图信息】
****************************************************解答*****************************************************
经过这边复现 目前确实存在tile算子速度过慢的问题。我们会在Q4阶段2.1版本对算子性能进行集中整改 感谢您的使用。