热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

国际会议关于海洋,智慧海洋解决方案

点击上方“CVer”,选择加星标置顶重磅干货,第一时间送达本文转载自:网络人工智能园地作者:qxdsl、yldjj、xndwn赛事回顾2020年12月22日由中国造船工

点击上方“CVer”,选择加"星标"置顶

重磅干货,第一时间送达

本文转载自:网络人工智能园地

作者:qxdsl、yldjj、xndwn

赛事回顾

2020年12月22日由中国造船工程学会等单位主办,哈尔滨工程大学承办,武汉理工大学协办的首届“海洋目标智能感知国际挑战赛”落下帷幕。秉承 “逐梦海洋,感知智能,突破自我,创新未来”的精神,来自清华大学深圳国际研究生院的“勤奋的电话和她快乐的小伙伴”队,由qxdsl、yldjj和xndwn组成,在机灵的犀牛教授的指导下从150支参赛队伍中脱颖而出,荣获研究生组冠军。

活动官方网站:

https://www.smartship.cn

https://www.hwtelcloud.com (NAIE网站)

选手分享

1

赛题描述

本次大赛要求参赛选手通过定位图片中出现目标的位置(边界框坐标),识别每个目标示例的类别和属于该类的置信度,从而完成多类海洋船舶目标检测识别任务。为了评估算法的实用性,比赛采用COCO形式的平均精度均值mAP,不仅可以评估模型的分类能力,也能体现出模型的定位能力。

2

模型介绍

本次比赛我们以Cascade RCNN作为baseline,以Res2Net101作为Backbone;通过逐步融合如soft-NMS、可变卷积(DCN)、多尺度训练(SNIP)等提升检测效果的方法,组成了最终的模型。

1. Baseline的选取

执行目标检测任务的双阶段算法一直在各大比赛中占据着半壁江山。CascadeRCNN通过级联多个RCNN head,逐步微调候选框位置,解决了训练阶段和测试阶段候选框的质量与分布不匹配问题。所以,为了保证检测效果,我们采用该算法作为baseline。

网络结构图 图源|CascadeRCNN[1]

2. Backbone的选取

ResNet通过在每两层或三层之间增加短路机制、引入残差学习的方式解决了深度网络的退化问题。Res2Net网络则基于ResNet,在单个残差块内构造分层的残差类连接,增加了每个网络层的感受野范围,并实现了以更细粒度表示多尺度特征的功能。这种结构可以增加卷积网络学习的信息量,明显的提高模型的分类效果。在使用ResNet101做了对比实验后,我们选择Res2Net101作为backbone。

Res2Net残差结构 图源|Res2Net[2]

3

提升技巧

比赛过程中,我们通过不断增加提升技巧的方式验证各种技巧的适用性。先以CascadeRCNN+ResNet101作为baseline,在公开测试集A上的mAP=64.68%,增加所有提升技巧之后在公开测试集A上的mAP=67.09%。

1. Albu数据增强

在计算机视觉任务中,数据增强是一种常用的增加模型鲁棒性的方法。Albumentation是一种快速灵活的数据增强库,我们采用该方法后,虽然mAP值降低了0.36%,但是我们认为这对结果基本没有影响,且会增加模型的泛化性能。

2. SNIP多尺度训练和多尺度测试

通过观察数据集,我们发现一些目标船舶占据的大部分,还有一些目标船舶非常小,这种极端尺度的目标在anchor机制中很难被分到前景中。多尺度训练和多尺度测试SNIP方法可以将图片缩放至不同的分辨率,使得目标以不同的比例出现在检测器中,从而实现大目标和小目标均可被检测到的功能。开始时我们就将该技巧使用在baseline中。

3. DCN

可变卷积网络(DCN)具有适应待检测目标发生空间形变的能力,能够根据需要识别的内容进行动态调整,从而改变感受野范围。采用该技巧之后,mAP值提升接近2%。

4. soft-NMS

从数据集中分析得知,一些图片中船舶与岛屿之间存在重叠,一些小型船只与巨轮之间也存在重叠,这种重叠的目标容易出现False Positive,从而对AP值产生影响,所以我们采取soft-NMS方法。这种方法可以通过降低重叠区域候选框的得分来避免盲目删除重叠候选框。

5.HTC模型预训练

HTC模型是一种引入了语义分割模块的的混合级联网络,因为语义分割是对全图进行的像素级分类,对前景和背景有较强分辨能力,所以HTC模型学习的参数更好。我们使用该网络在COCO数据集上预训练,然后将其部分参数迁移到我们的模型上。

另外,因为Adam优化算法可以较好的适应陌生数据集,我们使用它来做优化;我们还使用了学习率热身(warm-up)来稳定训练过程。

4

总结展望

非常感谢主办方提供的参赛机会,机灵的犀牛教授的悉心指导,以及华为NAIE网络人工智能云服务提供的AI模型训练平台。本次比赛不仅提高了我们对目标检测算法的掌握程度,还增加了我们海洋船舶方面的知识。但是,我们的模型仍然存在较大的进步空间,比如在使用Albu数据增强时,也应该做一个对比实验进行验证。最后,希望智慧海洋技术快速发展,助力我国海洋强国的建设!

参考文献

[1] Cai Z, Vasconcelos N. Cascade R-CNN: delving into high quality object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 6154-6162.

[2] Gao S , Cheng M M , Zhao K , et al. Res2Net: A New Multi-scale Backbone Architecture[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2019, PP(99):1-1.

[3] Buslaev A, Iglovikov V I, Khvedchenya E, et al. Albumentations: fast and flexible image augmentations[J]. Information, 2020, 11(2): 125.

[4] Singh B, Davis L S. An analysis of scale invariance in object detection snip[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2018: 3578-3587.

[5] Dai J , Qi H , Xiong Y , et al. Deformable Convolutional Networks[J]. 2017.

[6] Bodla N, Singh B, Chellappa R, et al. Improving object detection with one line of code. CoRR (2017)[J]. arXiv preprint arXiv:1704.04503.

CV资源下载

后台回复:CVPR2020,即可下载代码开源的论文合集

后台回复:ECCV2020,即可下载代码开源的论文合集

后台回复:YOLO,即可下载YOLOv4论文和代码

后台回复:Trasnformer综述,即可下载两个最新的视觉Transformer综述PDF,肝起来!

重磅!CVer-目标检测交流群成立

扫码添加CVer助手,可申请加入CVer-目标检测方向 微信交流群,可申请加入CVer大群,细分方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、TransformerPyTorch和TensorFlow等群。

一定要备注:研究方向+地点+学校/公司+昵称(如目标检测+上海+上交+卡卡),根据格式备注,才能通过且邀请进群

▲长按加微信群

▲长按关注CVer公众号

整理不易,请给CVer点赞和在看


推荐阅读
  • 本文探讨了 TypeScript 中泛型的重要性和应用场景,通过多个实例详细解析了泛型如何提升代码的复用性和类型安全性。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 结城浩(1963年7月出生),日本资深程序员和技术作家,居住在东京武藏野市。他开发了著名的YukiWiki软件,并在杂志上发表了大量程序入门文章和技术翻译作品。结城浩著有30多本关于编程和数学的书籍,其中许多被翻译成英文和韩文。 ... [详细]
  • 不用蘑菇,不拾金币,我通过强化学习成功通关29关马里奥,创造全新纪录
    《超级马里奥兄弟》由任天堂于1985年首次发布,是一款经典的横版过关游戏,至今已在多个平台上售出超过5亿套。该游戏不仅勾起了许多玩家的童年回忆,也成为强化学习领域的热门研究对象。近日,通过先进的强化学习技术,研究人员成功让AI通关了29关,创造了新的纪录。这一成就不仅展示了强化学习在游戏领域的潜力,也为未来的人工智能应用提供了宝贵的经验。 ... [详细]
  • 5.Numpy 索引(一维索引/二维索引)
    本文内容是根据莫烦Python网站的视频整理的笔记,笔记中对代码的注释更加清晰明了,同时根据所有笔记还整理了精简版的思维导图,可在此专栏查看,想观看视频可直接去他的网 ... [详细]
  • 机器学习如何看世界 对抗机器学习诠释人工智能和人类思维的不同
    接近,计算,极限,看,世界,对抗,机器,学习,诠释,人工智能,和, ... [详细]
  • 本文整理了一份基础的嵌入式Linux工程师笔试题,涵盖填空题、编程题和简答题,旨在帮助考生更好地准备考试。 ... [详细]
  • 专业人士如何做自媒体 ... [详细]
  • MATLAB实现Sobel边缘检测算法
    图像边缘是指图像中灰度值发生显著变化的区域。Sobel算子是一种常用的边缘检测方法,通过计算图像灰度值的梯度来检测边缘。本文介绍了Sobel算子的基本原理,并提供了基于MATLAB的实现代码。 ... [详细]
  • 拼多多的崛起之路
    随着4G通信技术的发展,互联网产品从PC端转向移动端,图像传输速度更快、更清晰,智能设备的应用提升了用户体验。移动互联网的普及为拼多多的崛起提供了时代背景。 ... [详细]
  • 对于众多创业公司而言,选择小程序或小视频的发展方向至关重要。本文将深入分析小程序和小视频的特点、优势及局限,帮助创业者做出更明智的选择。 ... [详细]
  • MySQL 5.7 学习指南:SQLyog 中的主键、列属性和数据类型
    本文介绍了 MySQL 5.7 中主键(Primary Key)和自增(Auto-Increment)的概念,以及如何在 SQLyog 中设置这些属性。同时,还探讨了数据类型的分类和选择,以及列属性的设置方法。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • Presto:高效即席查询引擎的深度解析与应用
    本文深入解析了Presto这一高效的即席查询引擎,详细探讨了其架构设计及其优缺点。Presto通过内存到内存的数据处理方式,显著提升了查询性能,相比传统的MapReduce查询,不仅减少了数据传输的延迟,还提高了查询的准确性和效率。然而,Presto在大规模数据处理和容错机制方面仍存在一定的局限性。本文还介绍了Presto在实际应用中的多种场景,展示了其在大数据分析领域的强大潜力。 ... [详细]
  • 如何改善汽车中的卫星导航体验?这里有一个新方案
    雷锋网按:不论是对用户还是导航系统的设计者,目前的卫星导航系统都不尽人意。本文介绍了一种提高准确性的办法。本文作者FlorianBousquet系是瑞士Thalwil的u-blox ... [详细]
author-avatar
广东抱米花_冰月
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有