Beyond Part Models: Person Retrieval with Refined Part Pooling
Sun Y, Zheng L, Yang Y, et al. Beyond Part Models: Person Retrieval with Refined Part Pooling[J]. 2017.
这篇是SVD-net作者的新作,也是我个人比较喜欢一篇。
主要内容是找到了一种既能精确划分部件信息而又不借助姿态估计的方法,提出了PCB+RPP的网络框架。PCB是硬划分局部学习,RPP可以理解成特征图的attention操作。
整个算法的思路清晰,PCB硬划分提取局部特征,然而简单粗暴的划分带来了不够精确的对齐,考虑添加软划分,但一般的软划分需要借助分割或者姿态估计,而分割需要昂贵的标注成本,因此提出借助PCB的RPP。
并没有过多的tricks堆砌,特别是RPP有种让人眼前一亮的感觉。
local(part) feature and global feature
行人重识别中网络最终结果就是提取有效的全局特征和局部特征
传统部件方法
1.硬划分:简单粗暴,但对齐不准确
2.软划分:对齐准确,借助人体姿态估计,代价大
contributions
Sun设想找到一种既能精确划分部件信息而又不借助姿态估计的方法,因此提出了PCB+RPP的网络框架。
PCB(Part Convolutional Baseline )
直接在特征上进行硬化分,降维之后,分别接softmaxloss
RPP(Refined Part Pooling)
属于软划分,利用部件之间的一致性,训练一个像素级别的分类器即分割。
利用部件分类器得到对应6个part的6个通道的概率密度图,每个概率密度图分别和输入整张特征做加权操作,
即可得到不同部件的精细的特征。
PCB+RPP的网络结构
训练的步骤:
1.训练PCB网络。
2.在PCB网络的基础上添加part classifier结构,然后固定PCB的backbone和最后的分类层参数,只训练part classifier。
这里利用PCB的硬划分分类器强行的让part classifie去适应,最终学到精细的划分分类器。
3.在part classifier训练收敛后,解开权值固定,一起微调。
experiments
可视化分析
Market-1501性能