作者:愤怒的黑皮_165 | 来源:互联网 | 2023-09-10 11:31
FPN就是所谓的金字塔结构的检测器,(FeaturePyramidNetwork)把FPN融合到Fasterrcnn中能够很大程度增加检测器对全图信息的认知,步骤如图所示:1.先将图
FPN就是所谓的金字塔结构的检测器,(Feature Pyramid Network)
把FPN融合到Faster rcnn中能够很大程度增加检测器对全图信息的认知,
步骤如图所示:
1.先将图像送入底层网络中得到一个feature map,可以用resnet等 网络
2.图中的1,2,3层即为预训练网络得到的特征,之后采取的操作是对于2层进行1*1的降维操作,然后与3层的结果进行相加,得到5层,这就是FPN的操作。
3.对于6层是一样的操作,然后对于得到的4,5,6层进行RPN操作得到region proposal,之后与原始faster rcnn的操作一样,通过3*3的卷积之后连接分类层和回归层。
4.得到的结果进行roi pooling操作,即固定特征的大小。
5.最后,连接两个1024层的全连接层,然后分两个支路,连接最后对应的分类层和回归层
使用了更深网络来构造特征金字塔,能增加鲁棒信息;除此之外,将低层特征和高层特征累加,是因为低层特征可以提供更加准确的位置信息,而多次的降采样和上采样操作使得深层网络的定位信息存在误差,
浅层的网络更关注于细节信息,高层的网络更关注于语义信息,而高层的语义信息能够帮助我们准确的检测出目标。因此我们将其结合其起来使用,这样我们就构建了一个更深的特征金字塔,融合了多层特征信息,并在不同的特征进行输出。