作者:季幸静仪1255_189 | 来源:互联网 | 2023-02-07 13:10
目标定位目标分类、目标定位、目标检测的区别,目标分类与目标定位处理的图像只有一个目标,而目标检测有多个目标,目标分类输出只有一个,目标定位输出包括(目标是否存在,目标的坐标以及大小
目标定位
目标分类、目标定位、目标检测的区别 ,目标分类与目标定位处理的图像只有一个目标,而目标检测有多个目标,目标分类输出只有一个,目标定位输出包括(目标是否存在,目标的坐标以及大小),目标检测需要把图片中的目标都检测出来。
![吴恩达深度学习笔记(四)week3目标检测 吴恩达深度学习笔记(四)week3目标检测](https://img1.php1.cn/3cdc5/32ca/8fd/268f3dbdfc94648e.png)
关于目标定位的输出可以如下方式设置
![吴恩达深度学习笔记(四)week3目标检测 吴恩达深度学习笔记(四)week3目标检测](https://img1.php1.cn/3cdc5/32ca/8fd/6538fc7c1f128665.png)
特征点检测
当我们希望神经网络的输出能告诉我们图片中被检测对象的一些特征时,我们可以通过增加特征点作为神经网络的输出,如下图中识别图片人的表情 和人的动作。
![吴恩达深度学习笔记(四)week3目标检测 吴恩达深度学习笔记(四)week3目标检测](https://img1.php1.cn/3cdc5/32ca/8fd/1eeb38273565bfa2.png)
基于滑动窗口的目标检测
滑动窗口目标检测的原理很简单,如下图所示。用一个窗口遍历整张图片,之后每次遍历都可以增大窗口的大小。
![吴恩达深度学习笔记(四)week3目标检测 吴恩达深度学习笔记(四)week3目标检测](https://img1.php1.cn/3cdc5/32ca/8fd/373ddf6664e8c5b3.png)
卷积的滑动窗口实现
用卷积层代替全连接层
![吴恩达深度学习笔记(四)week3目标检测 吴恩达深度学习笔记(四)week3目标检测](https://img1.php1.cn/3cdc5/32ca/8fd/70e9d4519ae82ab5.png)
卷积的滑动窗口实现
![吴恩达深度学习笔记(四)week3目标检测 吴恩达深度学习笔记(四)week3目标检测](https://img1.php1.cn/3cdc5/32ca/8fd/74b1b2cc0f6fa204.png)
以上图中间图片为例子,若输入图片大小为16×16×3滑动窗口的大小为14×14×3,若使用全连接,则需要进行四次计算,但是,可以看到,中间许多计算是重复的,使用卷积层代替全连接层后则只需一次计算,如图所示,输出单元的左上角即为第一个滑窗的输出…右下角单元即为最后一个滑窗。对于下面图片28×28×3也是一个道理,64个输出单元对应64个滑窗的输出。