热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用于创建此对象的程序是visio您的计算机_5个优秀的计算机视觉应用与相关数据集...

介绍计算机视觉是数据科学世界中最热门的研究领域之一。而且,它已经成为我们个人生活的一部分。我们都知道或不知道地使用各种功能,这些功能在后端运行计算机视觉

介绍

计算机视觉是数据科学世界中最热门的研究领域之一。而且,它已经成为我们个人生活的一部分。我们都知道或不知道地使用各种功能,这些功能在后端运行计算机视觉技术。例如,我们在智能手机中使用面部解锁。下图有效地说明了人脸检测的工作原理。

c399ec6c55a72cf52132f6cf9a6268c8.png

我选择人脸检测作为本文的开头,因为我们都已经看到这是计算机视觉的一种应用。但是计算机视觉不仅限于此。在本文中,你将探索计算机视觉的更多有趣应用。

目录
  • 什么是计算机视觉?
  • 使用计算机视觉进行姿态估计
  • 使用Gans进行图像转换
  • 开发社交距离工具的计算机视觉
  • 将2D图像转换为3D模型
  • 医学图像分析

什么是计算机视觉?

在进入计算机视觉应用程序世界之前,首先,让我们了解一下计算机视觉是什么?简而言之,计算机视觉是人工智能的一个多学科分支,旨在复制人类视觉的强大功能。

如果是正式定义,

“计算机视觉是一种实用工具,可以根据感知到的图像对实际的物理对象和场景做出有用的决策”(Sockman&Shapiro,2001)

计算机视觉通过诸如图像分类,对象检测,图像分割,对象跟踪,光学字符识别,图像字幕等视觉识别技术来工作。我知道这些是很多技术术语,但理解它们并不难。只需看下面的图片,你就会了解许多这些术语。

c857dcb4931233850befcc872117dd7f.png

让我们从第一张图片开始。如果我问你图片中有什么?你的答案将是,它是一只猫。这其实是对图片进行了分类。这意味着基于图像的分类标记图像。这里的类别是“猫”。

现在你知道图像的类别了。下一个问题是对象在图像中的位置。当我们确定对象在框架中的位置并在其周围创建一个边界框时,这称为定位。在第二张图像中,我们已经确定了对象的位置并将其标记为猫。

下一项是对象检测。在前两种情况下,图像中只有一个对象,但是如果存在多个对象该怎么办。在这里,我们通过边界框确定存在的实例及其位置。

在对象检测中,我们使用形状为正方形或矩形的边界框,但是它不能告诉任何有关对象形状的信息。实例分割会在每个对象周围创建一个像素级蒙版。因此,实例分割使人们对图像有了更深入的了解。

近期发展

深度学习方法的最新发展和技术的进步极大地提高了视觉识别系统的功能。结果,计算机视觉已被公司迅速采用。可以在整个工业领域看到成功的计算机视觉用例,从而扩大了应用范围,并增加了对计算机视觉工具的需求。

现在,让我们一起来看看计算机视觉的5个令人兴奋的应用程序。

使用计算机视觉进行姿态估计

姿态估计是计算机视觉的一个很有趣的应用。你一定已经听说过Posenet,它是用于人体姿态估计的开源模型。简而言之,姿态估计是一种计算机视觉技术,可以推断图像/视频中存在的人或物体的姿势。

在讨论姿态估计的工作之前,让我们首先了解“人体姿势骨架”。它是定义一个人的姿势的一组坐标。一对坐标称为肢体。此外,通过识别,定位和跟踪图像或视频中人类姿势骨架的关键点来执行姿态估计。

ccf39afc7818f7d493c8c3ed41fc2541.png

以下是人体姿态估计的一些应用-

  • 用于实时体育分析或监视系统的活动识别。
  • 增强现实体验
  • 训练机器人
  • 动画和游戏

如果你想自己开发一个姿态估计模型,下面是一些可能用到的数据集:

  • MPII http://human-pose.mpi-inf.mpg.de/
  • COCO keypoint challenge https://cocodataset.org/#download
  • HUMANEVA http://humaneva.is.tue.mpg.de/

使用Gans进行图像转换

Faceapp是一个非常有趣和流行的应用程序。它是一种图像处理工具,可使用滤镜转换输入图像。过滤器可能包括老化或最近的一个性别交换过滤器。

e90290543730541c42a48dbfc1c7fbdd.png

看上面的图片,有趣吗?几个月前,这是互联网上的热门话题。人们在交换性别后分享图片。但是这类应用程序背后的技术是什么?是的,你猜对了,它是计算机视觉,更具体地说,它是一个深层次的卷积生成的对抗性网络。

生成对抗网络,俗称GAN,是计算机视觉领域的一项令人振奋的创新。尽管GAN是一个古老的概念,但目前的形式是由Ian Goodfello在2014年提出的。从那以后,它有了许多发展。

GAN的训练涉及两个相互竞争的神经网络,根据给定训练数据的分布生成新的数据。尽管最初提出作为一种无监督学习机制,但是GAN证明了自己是有监督学习和半监督学习的理想选择。

以下是一些数据集,可帮助你获得GANs的实践经验

  • CelebA http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
  • Flicker face dataset https://github.com/NVlabs/ffhq-dataset
  • Cartoonset https://google.github.io/cartoonset/

应用领域

使用Gans生成的图像的应用程序有很多。以下是它的一些应用程序

  • 风格迁移和照片修复中的图像到图像翻译
  • 图像超分辨率
  • 文字到图像的生成
  • 图片编辑
  • 语义图像到照片的翻译

如果你发现更有趣的内容,请留言告诉我。

开发社交距离工具的计算机视觉

在过去的几个月中,世界正遭受大流行COVID-19的困扰。发现在没有该疾病的疫苗之前,我们所有人都必须采取预防措施,使用洗手液,口罩,最重要的是保持社交距离。

在这种关键情况下,计算机视觉技术可以发挥至关重要的作用。它可用于跟踪房屋或特定区域中的人员,以了解他们是否遵守社会距离规范。

社交距离工具是对象检测和实时跟踪的应用程序。在这种情况下,为了检查社交距离违规行为,我们使用边界框检测视频中存在的每个人。稍后,我们跟踪框架中每个框的运动并计算它们之间的距离。如果它检测到任何违反社会距离规范的行为,则将突出显示那些边界框。

3fa4255e31e0f612dbe0eb1b756970b3.gif

此外,为使这些工具更先进,更准确,你可以使用迁移学习技术。各种预训练的对象检测模型(如YOLO或Mask R-CNN)也都存在。

将2D图像转换为3D模型

这是计算机视觉的另一个非常有趣的应用。它将二维图像转换为3D模型。例如,假设你有旧收藏中的一张照片,并且能够将其转换为3D模型并像在那儿一样进行检查。

77afa2226e743244588c4444f2a4b875.png

Deep Mind的研究人员提出了一个在相似的系统上工作的AI系统。它被称为Generative Query Network(生成查询网络),它可以像人类一样从不同角度感知图像。

此外,Nvidia还开发了一种AI架构,可以根据图像预测3D属性。同样,Facebook AI提供了一种类似的工具,称为3D照片功能。

以下是一些相关的数据集,可供你进行试验

  • IKEA dataset http://ikea.csail.mit.edu/
  • Opensurface dataset http://opensurfaces.cs.cornell.edu/
  • NYU Depth dataset https://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html
  • ObjectNet3D https://cvgl.stanford.edu/projects/objectnet3d/

应用领域

现在,你必须考虑该技术的用例。以下是其应用

  • 动画与游戏
  • 机器人技术
  • 自动驾驶汽车
  • 医学诊断和外科手术

医疗保健中的计算机视觉:医学图像分析

很长一段时间以来,计算机支持的医学图像被用于诊断,如CT扫描、X射线等。此外,计算机视觉技术的最新发展使医生能够通过将图像转换为三维交互式模型来更好地理解这些图像,并使其更易于解释。

如果我们看一下计算机视觉的最新使用案例,那么我们会发现它是在用胸部x光检查COVID-19病例。此外,根据武汉市放射科的一项研究,深度学习方法可以有效地区分Covid-19和社区获得性肺炎。

检查一下由Kaggle提供的COVID-19胸部x光数据集,并在实施过程中自己动手。

  • COVID-19胸部x光数据集:https://www.kaggle.com/bachrr/covid-chest-xray
4dedbf49beaba957cf4067a659a999b6.png

同时,如果你想在另一个数据集上工作,那么你也可以在Kaggle上获得CT医学图像(https://www.kaggle.com/kmader/siim-medical-images) 。

尾注

总而言之,计算机视觉是人工智能的一个引人入胜的领域。在本文中,我讨论了一些我发现很有趣的东西。但这只是冰山一角。



推荐阅读
  • 图像分割技术在人工智能领域中扮演着关键角色,其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析,探讨了它们在不同应用场景中的优缺点和适用范围,为研究人员和从业者提供了有价值的参考。 ... [详细]
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • TypeScript 实战分享:Google 工程师深度解析 TypeScript 开发经验与心得
    TypeScript 实战分享:Google 工程师深度解析 TypeScript 开发经验与心得 ... [详细]
  • 中国学者实现 CNN 全程可视化,详尽展示每次卷积、ReLU 和池化过程 ... [详细]
  • 作为140字符的开创者,Twitter看似简单却异常复杂。其简洁之处在于仅用140个字符就能实现信息的高效传播,甚至在多次全球性事件中超越传统媒体的速度。然而,为了支持2亿用户的高效使用,其背后的技术架构和系统设计则极为复杂,涉及高并发处理、数据存储和实时传输等多个技术挑战。 ... [详细]
  • REST API 时代落幕,GraphQL 持续引领未来
    尽管REST API已广泛使用多年,但在深入了解GraphQL及其解决的核心问题后,我深感其将引领未来的API设计趋势。GraphQL不仅提高了数据查询的效率,还增强了灵活性和性能,有望成为API开发的新标准。 ... [详细]
  • 近期在研究逆向工程,因此尝试了一些CTF题目。通过合天网络安全实验室的CTF实战演练平台(http://www.hetianlab.com/CTFrace.html),我对Linux逆向工程的掌握还不够深入,因此暂时跳过了RE300题目。首先从逆向100开始,将文件后缀名修改为.apk进行初步分析。这一过程不仅帮助我熟悉了基本的逆向技巧,还加深了对Android应用结构的理解。 ... [详细]
  • 当前物联网领域十大核心技术解析:涵盖哪些关键技术?
    经过近十年的技术革新,物联网已悄然渗透到日常生活中,对社会产生了深远影响。本文将详细解析当前物联网领域的十大核心关键技术,包括但不限于:1. 军事物联网技术,该技术通过先进的感知设备实现战场环境的实时监测与数据传输,提升作战效能和决策效率。其他关键技术还包括传感器网络、边缘计算、大数据分析等,这些技术共同推动了物联网的快速发展和广泛应用。 ... [详细]
  • 深入浅出解读奇异值分解,助你轻松掌握核心概念 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 理工科男女不容错过的神奇资源网站
    十一长假即将结束,你的假期学习计划进展如何?无论你是在家中、思念家乡,还是身处异国他乡,理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档,能够帮助你在假期中高效学习和提升专业技能。 ... [详细]
  • 当前,众多初创企业对全栈工程师的需求日益增长,但市场中却存在大量所谓的“伪全栈工程师”,尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值,澄清对这一角色的误解,并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]
  • 特斯拉的盈利之谜:净利润未必源自汽车销售
    近日,特斯拉因客户投诉再度成为舆论焦点。一位车主反映其购买仅6天的Model 3在使用官方超级充电桩时突然断电,引发了对特斯拉产品质量和售后服务的质疑。然而,特斯拉的盈利模式并不仅限于汽车销售,其净利润可能更多地来自其他业务板块,如能源服务、自动驾驶技术和软件订阅等。这些多元化收入来源为特斯拉的财务表现提供了更多支撑。 ... [详细]
  • $apply() 方法允许从 AngularJS 框架外部触发表达式的执行,确保其在 AngularJS 的上下文中运行。例如,当你使用 `setTimeout()` 或者集成第三方库时,可以通过调用 `$apply()` 来确保事件更新能够被 AngularJS 检测到并触发脏检查机制,从而实现数据的双向绑定。这一过程不仅保证了数据的一致性,还提升了应用的响应速度和用户体验。 ... [详细]
author-avatar
喜劲瓶
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有