热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【论文阅读笔记】HowRobustis3DHumanPoseEstimationtoOcclusion?

论文地址:https:arxiv.orgabs1808.09316论文总结本文主要在生成遮挡策略的方向上进行实验,得到实验结果和对比。但由于当时的精度

论文地址:https://arxiv.org/abs/1808.09316


论文总结

  本文主要在生成遮挡策略的方向上进行实验,得到实验结果和对比。但由于当时的精度不是特别高,所以其中的一些结论现如今不一定完全适用。

  实验了几种策略,单个矩形框、多个矩形框、多个条状、多个圆形、VOC对象嵌入等方式,如下图所示。



  论文的结论是,VOC的嵌入式遮挡策略,对于多重遮挡情况的泛化能力较好。




论文介绍

  本文自己实现了一个全卷积网络,预测3D的heatmap,目标是图片空间的x,y以及相对根节点的z。遮挡的策略,是在单张RGB图像上进行的。单张RGB图像也就是网络的输入。在该网络上,使用遮挡数据增强训练的结果,不仅对受遮挡对象的鲁棒性增强了,也对没有遮挡的对象有所提升。作者认为这是由于遮挡所带来的的正则化的表现结果。
  文中使用L1损失训练3D的网络。


实验设置

  由于网络是单张图片输入的,所以需要进行去取冗余的操作:视频序列中,只有与上一个持有帧距离30mm以上的才会加入训练集;
  输入图片需要将人物居中,放大到256∗256256*256256256。将人体边界框较长的部分缩放到图片长度的80%。
  进行遮挡的数据增强,使用黑色块或者从VoC 2012中提取分割对象进行遮挡数据的生成。遮挡程度在0%∼70%0\%\sim70\%0%70%之间。训练的VoC对象和测试的VoC对象进行严格的分离,使用的random erasing为RE-0 variant。遮挡的策略都是单独进行的,用以进行对比,遮挡的概率为50%。
  骨干网络为ResNet-50v1,使用Adam优化器,mini-batch为64,训练40个epoch。


实验结果

  进行对比的论文是《Coarse-to-fine volumetric prediction for single-image 3d human pose》,其MPJPE为64.8。本文自己实现的网络MPJPE为63.3。
  各遮挡数据增强实验的结果如下:





  结论如下:


  1. 测试时,圆形遮挡导致的误差最大,原因不明
  2. 测试时,其余的遮挡策略中,矩阵是问题最小的遮挡方式;
  3. 训练时,单个矩形数据增强的情况,只能适用于单个或多个矩形的遮挡,对其他的遮挡类型泛化不行,尤其是圆形表现的最糟糕;
  4. 训练时,多个矩形数据增强的情况,比单个矩形数据增强的情况要好一些,但也难以泛化;
  5. 训练时,圆形遮挡数据增强的情况,可以泛化到简单的几何遮挡,但对相对真实的VoC对象遮挡没有帮助;
  6. 训练时,VoC对象数据增强的情况,可以泛化到简单的几何遮挡和其他的VoC对象(训练的VoC对象和测试的VoC对象是严格分开的)

推荐阅读
  • 开源Keras Faster RCNN模型介绍及代码结构解析
    本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构,包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]
  • 关于如何快速定义自己的数据集,可以参考我的前一篇文章PyTorch中快速加载自定义数据(入门)_晨曦473的博客-CSDN博客刚开始学习P ... [详细]
  • [翻译]PyCairo指南裁剪和masking
    裁剪和masking在PyCairo指南的这个部分,我么将讨论裁剪和masking操作。裁剪裁剪就是将图形的绘制限定在一定的区域内。这样做有一些效率的因素࿰ ... [详细]
  • #encodingutf-8importnumpyasnpdefmain():importmatplotlib.pyplotasplt##lesson1:画图#xnp.linsp ... [详细]
  • PHP图片截取方法及应用实例
    本文介绍了使用PHP动态切割JPEG图片的方法,并提供了应用实例,包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用,以及图片切割的具体步骤。同时,还提供了一些注意事项和优化建议。通过本文的学习,读者可以掌握PHP图片截取的技巧,实现自己的需求。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 图像因存在错误而无法显示 ... [详细]
  • 统一知识图谱学习和建议:更好地理解用户偏好
    本文介绍了一种将知识图谱纳入推荐系统的方法,以提高推荐的准确性和可解释性。与现有方法不同的是,本方法考虑了知识图谱的不完整性,并在知识图谱中传输关系信息,以更好地理解用户的偏好。通过大量实验,验证了本方法在推荐任务和知识图谱完成任务上的优势。 ... [详细]
  • STL迭代器的种类及其功能介绍
    本文介绍了标准模板库(STL)定义的五种迭代器的种类和功能。通过图表展示了这几种迭代器之间的关系,并详细描述了各个迭代器的功能和使用方法。其中,输入迭代器用于从容器中读取元素,输出迭代器用于向容器中写入元素,正向迭代器是输入迭代器和输出迭代器的组合。本文的目的是帮助读者更好地理解STL迭代器的使用方法和特点。 ... [详细]
  • 百度地图离线开发demo(热力图)
    热力图主要用了bmplib插件,initMap(){this.mapnewBMap.Map(myMap);constpointnewBMap.Point(118.13 ... [详细]
  • 全卷积网络fcn详解_全卷积神经网络原理
    全卷积网络fcn详解_全卷积神经网络原理原文链接:全卷积网络FCN详解背景CNN能够对图片进行分类,可是怎么样才能识别图片中特定部分的物体,在2015年之前还是一个世界难题。神经网 ... [详细]
  • 注意力汇聚:NadarayaWatson 核回归
    Nadaraya-Watson核回归是具有注意力机制的机器学习范例。Nadaraya-Watson核回归的注意力汇聚是对训练数据中输出的加权平均。从注意力的角度来看, ... [详细]
  • 循环发电厂电能输出预测
    前言本次项目是就某联合循环发电厂的数据,运用线性回归模型进行预测电能输出,若文中出现错误的地方,还望指正,谢谢!目录1.数据来源及背景2.数据探索分析3.相关分析4.回 ... [详细]
  • 从CornerNet到CornerNetLite再到训练自己的数据
    从CornerNet到CornerNet-Lite再到训练自己的数据相关论文与代码相关工作CornerNetCornerNet-Lite训练自己的数据一.论文论 ... [详细]
author-avatar
mobiledu2502925953
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有