hourglass
- 1.一 论文导读
- 2.二 论文精读
- 3.三 代码实现
- 4.四 问题思索
《Stacked Hourglass Network for Human Pose Estimation》
—基于hourglass的身体姿态识别
作者:Alejandro Newell,etc.
单位:密歇根大学
发表会议及时间:ECCV 2016
一 论文导读
一 背景及意义
姿态估计(pose estimation)
在计算机视觉领域是一个非常重要的方向,人类动作理解,人机互动等等应用都需要精确的姿态识别
目前,绝大多数的2d姿态识别都是识别人体的关键点
比如:给定一张普通的RGB图像,算法会给出人体的脚踝,胳膊,面部等区域的关键点
目前,基于stacked Hourglass Model 的各种变种算法,牢牢占据了姿态检测的半壁江山,所以stacked hourglass model 非常重要
姿态识别分单人和多人,本篇文章为单人识别
二 研究成果
- 理解图片或视频人类的行为,一个关键是姿态预测
- 在动画和人机交互领域起到重要作用
- 一个好的姿态预测系统需要在变形、遮挡,还有在衣服和光线变化下具有鲁棒性
- 卷积神经网络取代过去手工或者图形合成方法,有了巨大的进步
- 将过个低分辨率的模型进行结合
- 重复使用自下而上、自上而下的方式,结合中间监督来实现Human Pose Estimation
- 不同层对不同的特征容易识别,那就可以识别人体的不同部分
论文结构如下图:
使用了金字塔结构,一小一大之间可以提取很多的特征,不同层对不同的特征容易识别,那就可以识别人体的不同部分
二 论文精读
三 代码实现
四 问题思索