热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

当你可以实时编辑你所看到的东西时

最终的结果很难说是完美的(CGI模型看起来像是从3DMovieMaker中借来的),但这个概念是引人注目的。不难想象,在未来的几十年里,这样的应用会变得很普遍。这项工作背后的团队表

最终的结果很难说是完美的(CGI模型看起来像是从3D Movie Maker中借来的),但这个概念是引人注目的。不难想象,在未来的几十年里,这样的应用会变得很普遍。

这项工作背后的团队表示,尽管他们工作中的个别元素之前已经完成,但复合系统还是非常新颖的。TansforMR可以在普通的智能手机和平板电脑上运行,但需要一个4G连接来将数据发送到云端。图像经过处理后,物体不只是被掩盖,就像Snapchat的AR镜头或苹果的Memoji一样,而是完全被编辑掉。物体被检测、分割,然后被"涂抹"(用人工智能生成的背景取代),并以CGI模型代替原始模型。显然这一系统有很多地方需要改进。在低质量的绘画中,帧率只有15fps;滞后时间为50至100毫秒;CGI替换的质量也不是最好的。但是,该系统背后的团队说,这些方面相对容易改进。

保时捷的机器学习研究员穆罕默德-卡里(Mohamed Kari)表示,主要的限制来自于大型图像的计算量非常大,所以对于绘画,目前只能用非常小的图像来做,在512 x 512的图像上操作。但带宽[使用]是可以忽略不计的。这意味着如果能做FaceTime,你就能做TransforMR。

Screen_Shot_2021_10_13_at_10.08.18_AM.webp

Kari说,该系统的关键要素之一是它对姿势检测的使用。这意味着,例如,当系统检测到一个人时,它会识别出身体的18个独立关节。这意味着CGI替换可以实时固定在目标的运动上。看看TransforMR的操作片段,不难想象这种软件被整合到AR眼镜中。用户可以为他们的一天选择一个"主题",用科幻的替代品或来自大自然的物品来取代汽车、建筑和人。但是,这将涉及一个巨大的硬件挑战。目前的增强现实眼镜只能在镜片上投射出低分辨率、半透明的覆盖物。现在,我们还没有技术来"编辑"用户在这种硬件上看到的东西。(尽管这可以通过"穿透式"VR系统来实现,在该系统中,第一人称摄像机将实时视频传输到完全遮挡住佩戴者视线的屏幕上。)

"我们在屏幕上重现完整的图像,所以我们可以删除任何我们想删除的东西,但对于增强现实眼镜来说,删除物体是困难的,因为它增加了光强度,以Hololens为例,你是透过玻璃看的,所以去除东西更困难。这个问题有待于研究。"

但为什么保时捷首先要调查这种技术呢?据该公司的人工智能架构师之一Tobias Grosse-Puppendahl说,这一切都是为了改善乘客和司机的体验。未来版本的TransforMR软件可以用来在人们被困在交通中时为他们提供娱乐。"我们的主要问题是,我们如何能够以一种有趣和娱乐的方式来修改现实,以便作出反应?这就是我们想法的起源"。

保时捷的其他研究项目也遵循类似的主题。例如,该公司还建立了一个名为SoundRide的原型系统,它使用汽车的机器视觉来检测风景的变化并提示适当的音乐。"也许,例如,你正开车穿过阿尔卑斯山,行驶在一条美丽的路线上,突然你有一个美妙的景色,也许音乐就会改变,我们正在思考如何通过技术使车内的体验更加有趣和美丽"。而这意味着对人们本来会看到和听到的东西进行修补。"


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 老牌医药收割AI红利:先投个15亿美元抢中国人才
    萧箫发自凹非寺量子位报道|公众号QbitAI没想到,一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场,能看见不少熟悉的身影, ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
  • 美DARPA利用人工智能技术识别敌国在“灰色地带”的意图
    C4ISRNET网站报道称,近日,美国国防部高级研究计划局(DARPA)启动“通过规划活动态势场景收集和监测(COMPASS)”项目,意欲利用人工智能技术打入敌人内部,在战争“灰色 ... [详细]
  • 本文介绍了C#中数据集DataSet对象的使用及相关方法详解,包括DataSet对象的概述、与数据关系对象的互联、Rows集合和Columns集合的组成,以及DataSet对象常用的方法之一——Merge方法的使用。通过本文的阅读,读者可以了解到DataSet对象在C#中的重要性和使用方法。 ... [详细]
  • 本文介绍了PhysioNet网站提供的生理信号处理工具箱WFDB Toolbox for Matlab的安装和使用方法。通过下载并添加到Matlab路径中或直接在Matlab中输入相关内容,即可完成安装。该工具箱提供了一系列函数,可以方便地处理生理信号数据。详细的安装和使用方法可以参考本文内容。 ... [详细]
  • Voicewo在线语音识别转换jQuery插件的特点和示例
    本文介绍了一款名为Voicewo的在线语音识别转换jQuery插件,该插件具有快速、架构、风格、扩展和兼容等特点,适合在互联网应用中使用。同时还提供了一个快速示例供开发人员参考。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 语义分割系列3SegNet(pytorch实现)
    SegNet手稿最早是在2015年12月投出,和FCN属于同时期作品。稍晚于FCN,既然属于后来者,又是与FCN同属于语义分割网络 ... [详细]
  • 剧情提要:[机器小伟]在[工程师阿伟]的陪同下进入了筑基中期的修炼,这次要修炼的目标是[一次函数]。正剧开始:星历2016年03月21 ... [详细]
author-avatar
13486099491_fb9570
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有