当前位置: 开发笔记 > 编程语言 > 正文

自动驾驶之夜间检测调研

作者：尚艺李波_387 | 来源：互联网 | 2023-08-31 19:54

1.ExDark第一个公开特定的提供naturallow-lightimagesforobject的数据集7363张low-lightimages,12classesLow-l

1. ExDark

第一个公开特定的提供 natural low-light images for object的数据集

7363张 low-light images,
12 classes

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VK2Wz60U-1670641306011)(:/bbcf37f6b5974f919c036fd4eee77238)]

Low-light image enhancement:

IVC database. general image enhancement而非特指low-light. 黑夜是人工合成的,可以找到原图像
See-in-the-Dark dataset (SID)&＃xff1a; 5094个短曝光(low-light)图像对应到424张长曝光图像(bright)
LOw light paired dataset (LOL): 500对图像

都含有一对图&＃xff01;&＃xff01;&＃xff01;
但是 SID和LOL都不能展示真实的夜晚灯光环境.
为了保证图像能对应上,使用特定相机并且不含有动态目标(例如cars,people等).

Low-light denoising
是low-light enhancement的一个子集, 但是这些图都是人工合成的&＃xff0c;加入Poisson或者Gaussian噪声到合成的黑夜图像中.

Low-light surveillance
热相机和红外相机一般在夜晚监控中使用. 主要集中在人脸识别、行人检测。
数据集有OTCVBS,LSI和LDHF.

ExDark数据集

对low-light condition进行细划分, 例如一天中的黄昏(twilight)还是夜晚(nighttime),位置(indoor,outdoor)、光源可见度、光源类型(太阳、人造光).

12类别: Bicycle, Boat, Bottle, Bus, Car, Cat, Chair, Cup, Dog, Motorbike, People, and Table.
数据收集&＃xff1a;网上下载&＃xff0c;关键词(dark, low-light,nighttime); 公开数据集(PADCAL VOC, ImageNet和COCO);电影中提取;手动拍摄
标注: 手动标注
十种灯光类型:
- Low: 光线最暗&＃xff0c;几乎看不清细节
- Ambient: 灯光weak, 光源没有捕捉进来
- Object: 目标较亮但是周围环境很暗&＃xff0c;光源没有捕捉进来
- Single: 只能看到一个光源
- Weak: multiple visible但是weak光源
- Strong:multiple visible但是相对亮的光源
- Screen: 户内图像&＃xff0c;可见亮的屏幕
- Window: 户内图像,以窗户为亮光源.
- Shadow:户外图像&＃xff0c;户外光源&＃xff0c;目标在阴影处
- Twilight:户外&＃xff0c;黄昏. 黎明到太阳升起; 微暗到太阳落下.

2. 增强 Survey

传统方法:
- Histogram Equalization-based methods
- Retinex model-based methods: 例如将一张图解耦为一个reflection部分和一个illumination部分, reflection部分即为增强的结果.
  缺点: 多光源时会丢失细节和颜色;噪声被忽略了;找到这样一个prior或regularization比较困难;运行时间长.
DL方法:更高精度、更加鲁棒、速度更好
- 方法包括:监督学习、强化学习、无监督学习、Zero-shot learning和半监督学习.

学习策略

监督学习&＃xff1a;分为end-to-end, deep
Retinex-based 和realistic data-driven methods.
- end-to-end: LLNet, MBLLEN,EEMEFN,LPNet,DSLR,
- Retinex-based: 利用物理可解释的Retinex理论.
  将illuminance部分和reflectance部分分开增强. 例如Retinex-Net&＃xff0c;lightweight LightenNet&＃xff0c;而DeepUPE学习从Image到illumination的映射;KinD,KinD&＃43;&＃43;
- 数据集: SID, DIV(视频),SMOID(视频),SIDGAN(视频)
强化学习&＃xff1a;DeepExposure&＃xff0c;即首先根据曝光切分为sub-image, 局部曝光是强化学习学到的&＃xff0c;奖惩函数类似于对抗学习. 再将局部曝光修整图像&＃xff0c;获取不同曝光下的图像.
无监督学习: 有监督的学习受限于泛化能力. 无监督学习EnligthenGAN,采用一个attention-guided U-Net作为生成器&＃xff0c;使用global-local discriminators来使得增强结果跟自然光线相似.
Zero-Shot Learning&＃xff1a;直接从test data中学习增强,例如ExCNet, 首先拟合测试集一个最优的S曲线&＃xff0c;然后根据S曲线,使用Guided filter划分为base layer和datail layer, 根据S曲线调整base layer,最后使用Weber contrast来融合detailed layer和调整后的base layer.&＃xff1b;还有RRDNet,将图像分为illumination, reflectance和noise&＃xff1b; RetinexDIP使用NN进行Retinex分解&＃xff0c;然后增强low-light image; Zero-DCE/zero-DCE&＃43;&＃43;将光线增强视为一个image-specific curve estimation&＃xff0c;输入一个low-light图像输出一个伪high-order曲线.
Semi-Supervised Learning&＃xff1a;DRBN&＃xff0c;首先恢复一个linear band representation,以监督的方式&＃xff0c;然后通过无监督学习到的linear transformation进行增强.

网络技巧

网络结构: 常见U-Net, pyramid network和multi-stage network.
Deep Model和Retinex Theory结合.

在这里插入图片描述

损失函数:
- Reconstruction Loss(重构损失): L2倾向于乘法较大的错误&＃xff0c;但是对较小错误容忍度高&＃xff1b;L1损失保留颜色和luminance较好但是忽略了局部结构;SSIM保留了结构和纹理
- Perceptual Loss: 和gt在feature map空间中的相似度. 特征提取网络为从一个在ImageNet训练的VGG16.
- Smoothness Loss:移除结果中的噪音或保留相邻像素点的关系
- 对抗损失:生成的图被辨别的损失
- Exposure Loss: 不需要匹配的图&＃xff0c;直接衡量曝光度的损失
- 训练集:
LOL: 500对低光照和正常光照的图
SCIE: 589个户内/户外的场景,每个场景有3-18个不同曝光的图&＃xff0c;因此有4413个多曝光的图. 选取589张高质量的图.分辨率在3000x2000和6000x4000
MIT-Adobe FiveK: 5000张图
SID&＃xff1a;5094张短曝光的图,每个有个对应的长曝光的图
VE-LOL&＃xff1a;2500对&＃xff0c;1000对是合成的&＃xff0c;1500对是真实的
DRV&＃xff1a;202个原始的视频&＃xff0c;每个对应一段长曝光的gt. 16-18fps/ 3672x5496
SMOID&＃xff1a;179对序列&＃xff0c;每个200帧
- 测试集&＃xff1a;
  BBD-100K&＃xff1a;视频&＃xff0c;10000个视频&＃xff0c;使用在晚上拍的用来做测试集
  ExDARK:
  DARK FACE: 6,000张晚上拍的人脸
作者提出新的数据集: LLIV-Phone,120视频&＃xff0c;45,148个图像&＃xff0c;18张手机类型,

在这里插入图片描述

结果展示

方法对比
在这里插入图片描述

在1080ti上测速&＃xff0c;输入1200x900x3,32张求平均
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-6lRd3DNk-1670641306018)(:/d7085b61dec34013978b36ba3901ac3c)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-QIwAr9Gl-1670641306019)(:/caa512055ab945799c41474832a3724e)]

推荐阅读

list
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
bit
伊振华作品 | 沈阳市智慧城市运行管理中心的设计与建设

本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计，并以数字赋能和创新驱动高质量发展的理念，建设了集成、智慧、高效的一体化城市综合管理平台，促进了城市的数字化转型。该中心被称为当代城市的智能心脏，为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]

蜡笔小新 2023-12-14 16:35:39
const
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
js
Express App如何提供不需要的静态文件？

本文介绍了如何使用Express App提供静态文件，同时提到了一些不需要使用的文件，如package.json和/.ssh/known_hosts，并解释了为什么app.get('*')无法捕获所有请求以及为什么app.use(express.static(__dirname))可能会提供不需要的文件。 ... [详细]

蜡笔小新 2023-12-12 14:38:07
js
Webpack5内置处理图片资源的配置方法

本文介绍了在Webpack5中处理图片资源的配置方法。在Webpack4中，我们需要使用file-loader和url-loader来处理图片资源，但是在Webpack5中，这两个Loader的功能已经被内置到Webpack中，我们只需要简单配置即可实现图片资源的处理。本文还介绍了一些常用的配置方法，如匹配不同类型的图片文件、设置输出路径等。通过本文的学习，读者可以快速掌握Webpack5处理图片资源的方法。 ... [详细]

蜡笔小新 2023-12-14 15:39:51
const
Java序列化对象传给PHP的方法及原理解析

本文介绍了Java序列化对象传给PHP的方法及原理，包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用，以及代码执行序列化所需要的权限。最后指出，序列化会将对象实例的所有字段都进行序列化，使得数据能够被表示为实例的序列化数据，但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]

蜡笔小新 2023-12-14 15:25:15
io
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
import
javascript – 概述在Firefox上无法正常工作

我试图提出一些自定义大纲,以达到一些Web可访问性建议.但我不能用Firefox制作.这就是它在Chrome上的外观：而那个图标实际上是一个锚点.在Firefox上,它只概述了整个 ... [详细]

蜡笔小新 2023-12-14 10:20:38
js
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
byte
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06
import
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
list
推荐系统遇上深度学习(十七）详解推荐系统中的常用评测指标

原创：石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值， ... [详细]

蜡笔小新 2023-12-13 19:35:25
list
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
import
android studio生成jks,android studio生成 keystore 以及获取 SHA1值等

合并列值－合并为一列问题需求：createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]

蜡笔小新 2023-12-11 12:32:55
js
使用n3-charts绘制以日期为x轴的数据

本文介绍了如何使用n3-charts绘制以日期为x轴的数据，并提供了相应的代码示例。通过设置x轴的类型为日期，可以实现对日期数据的正确显示和处理。同时，还介绍了如何设置y轴的类型和其他相关参数。通过本文的学习，读者可以掌握使用n3-charts绘制日期数据的方法。 ... [详细]

蜡笔小新 2023-12-10 00:19:21

尚艺李波_387

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章