热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

CV学习笔记浅述CV方向

浅述CV方向一、浅述人工智能的一些术语1.人工智能初探人工智能是通过机器来模拟人类认知能力的技术人工智能最核心的能力就是根据给定的输入做出判断或预测关键时间节点:

浅述CV方向


一、浅述人工智能的一些术语


1. 人工智能初探


  • 人工智能是通过机器来模拟人类认知能力的技术

  • 人工智能最核心的能力就是根据给定的输入做出判断或预测

  • 关键时间节点:1956年,达特茅斯会议,人工智能元年

    ​ 1982年 提出机器学习

    ​ 2006年 提出深度学习

    ​ *图灵测试(测试员分辨不出是机器还是真人)50年提出


2. 人工智能的三大要素


  • 数据
  • 算法
  • 算力:CPU、GPU、FPGA(GPU造好了就不能改了,这种方式降低开发风险)、分布式

3. 人工智能关系圈

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-T89bcQDD-1636085734095)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211104130113934.png)]
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bD7YCFrH-1636085734097)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211104130133144.png)]


  • 机器学习:一种实现人工智能的方法。

    机器学习是计算机利用已有的数据(经验),得出了某种模型(规律),并利用此模型预测未来的一种方法。

  • 深度学习:一种实现机器学习的技术。

    深度学习是利用深度的神经网络,将模型处理的更为复杂,从而使模型对数据的理解更加深入,是机器学习中一种基于对数据的进行表征学习的方法。深度学习的实质是通过构建很多隐藏层的机器学习模型和海量的训练数据,来学习更有用的特征,从而最终提升分类或预测的准确性。

  • 人工神经网络:一种机器学习的算法。

    模拟人脑的思考过程,进行计算的模型,神经网络一般有输入层->隐藏层->输出层,一般来说隐藏层数量多于两层的神经网络就叫做深度神经网络,深度学习就是采用像深度神经网络这种深层架构的一种机器学习方法。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yH2CyEQ5-1636085734098)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211104131106598.png)]

神经网络的逻辑架构

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2dzGaQga-1636085734099)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211104131516346.png)]


蓝色层为输入层,汇点出为输出层,中间称为隐藏层



4.深度学习

概念辨析:深度神经网络和深度学习

具有多个隐藏层的神经网络被称为深度神经网络,基于深度神经网络的机器学习研究称之为深度学习


二、CV方向


1. 定义


cv即计算机视觉

概括:就是计算机拥有人能所见、人能所识、人能所思的能力,就可以称为计算机拥有计算机视觉


典型基于深度学习的计算机视觉流程
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-80dvH75z-1636085734101)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211105114546473.png)]


2. cv关系圈

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L46f6wj7-1636085734102)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211105114657182.png)]


3.cv的五大应用


<1> 图像分类

主要工具&#xff1a; 图像分类架构-卷积神经网络&#xff08;CNN&#xff09;卷积RELUPOOL 等。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RdQ4umMd-1636085734103)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211105120140390.png)]


<2> 目标检测

主要工具&#xff1a; R-CNN
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-KR07Obnh-1636085734105)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211105120156279.png)]


<3> 目标跟踪

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aA9QkbMK-1636085734106)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211105120206328.png)]


<4> 语义分割&#xff08;*&#xff09;

主要工具&#xff1a; FCN
在这里插入图片描述


<5> 实例分割

主要工具&#xff1a; Mask-R-CNN &#xff08;可以用于分析姿态&#xff09;
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yqhNDEEG-1636085734108)(C:\Users\moresweet\AppData\Roaming\Typora\typora-user-images\image-20211105120233690.png)]


4. cv方向的技能

基础技能

概率论与数理统计、线性代数、数学分析、深度学习、统计机器学习、凸优化、相机原理、3D计算机视觉、low-level视觉与图像处理、视觉神经科学

中间层技能

图像分类、图像分割、目标检测、目标跟踪、视频&#xff08;序列图像&#xff09;分析

应用层技能

OCR、图像检测、图像识别、视频内容理解&#xff08;直播鉴黄、盗版检测等&#xff09;、手势识别、人脸识别、图像/视频编辑和风格化、智能视频分析、图像与NLP结合、3D重建、工业视觉、无人驾驶、医疗影像诊断、神经网络芯片等







(个人学习笔记&#xff0c;moresweet)


推荐阅读
  • 精选10款Python框架助力并行与分布式机器学习
    随着神经网络模型的不断深化和复杂化,训练这些模型变得愈发具有挑战性,不仅需要处理大量的权重,还必须克服内存限制等问题。本文将介绍10款优秀的Python框架,帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]
  • 计算机视觉初学者指南:如何顺利入门
    本文旨在为计算机视觉领域的初学者提供一套全面的入门指南,涵盖基础知识、技术工具、学习资源等方面,帮助读者快速掌握计算机视觉的核心概念和技术。 ... [详细]
  • 本文源自 SysML 2018,由星云 Cluster 翻译,并经 InfoQ 授权发布。原文链接:http://www.sysml.cc/doc/151.pdf。文章详细介绍了 Blink 的设计理念及其在提高 GPU 间参数聚合速度方面的创新贡献。 ... [详细]
  • 《计算机视觉:算法与应用》第二版初稿上线,全面更新迎接未来
    经典计算机视觉教材《计算机视觉:算法与应用》迎来了其第二版,现已开放初稿下载。本书由Facebook研究科学家Richard Szeliski撰写,自2010年首版以来,一直是该领域的标准参考书。 ... [详细]
  • 尤洋:夸父AI系统——大规模并行训练的深度学习解决方案
    自从AlexNet等模型在计算机视觉领域取得突破以来,深度学习技术迅速发展。近年来,随着BERT等大型模型的广泛应用,AI模型的规模持续扩大,对硬件提出了更高的要求。本文介绍了新加坡国立大学尤洋教授团队开发的夸父AI系统,旨在解决大规模模型训练中的并行计算挑战。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 本周三大青年学术分享会即将开启
    由雷锋网旗下的AI研习社主办,旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享,活动致力于搭建一个连接理论与实践的平台。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • 英特尔推出第三代至强可扩展处理器及傲腾持久内存,AI性能显著提升
    英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存,全面增强AI能力和系统性能。 ... [详细]
  • 全面解读Apache Flink的核心架构与优势
    Apache Flink作为大数据处理领域的新兴力量,凭借其独特的流处理能力和高效的批处理性能,迅速获得了广泛的关注。本文旨在深入探讨Flink的关键技术特点及其应用场景,为大数据处理提供新的视角。 ... [详细]
  • 深入浅出:Hadoop架构详解
    Hadoop作为大数据处理的核心技术,包含了一系列组件如HDFS(分布式文件系统)、YARN(资源管理框架)和MapReduce(并行计算模型)。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]
  • 深度学习与神经网络课程总结
    本文档总结了神经网络和深度学习课程中的关键概念和理论,包括机器学习的基本要素、算法类型以及数据特征表示等。 ... [详细]
  • 本文源自Coursera平台吴恩达教授的深度学习课程,重点探讨了卷积神经网络(ConvNets)从二维图像处理向一维信号及三维数据处理的拓展应用。 ... [详细]
  • 机器学习(ML)三之多层感知机
    深度学习主要关注多层模型,现在以多层感知机(multilayerperceptron,MLP)为例,介绍多层神经网络的概念。隐藏层多层感知机在单层神经网络的基础上引入了一到多个隐藏 ... [详细]
author-avatar
吃碰杠和_338
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有