热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

GTC2016干货分享:深度学习依旧热,VR新爆点

ZD至顶网服务器频道04月06日新闻消息(文于泽):美国时间4月5日,一年一度的NVIDIAGPU技术大会2016(GTC2016)在硅谷拉开大幕。作为GPU领域规模最大的盛会,每

ZD至顶网服务器频道 04月06日 新闻消息(文/于泽):美国时间4月5日,一年一度的NVIDIA GPU技术大会2016(GTC 2016)在硅谷拉开大幕。作为GPU领域规模最大的盛会,每年的GTC上都会有最前沿GPU领域的技术、应用展示发布。去年最热的是Deep Learning(深度学习)、自动驾驶,今年它们依旧热,但又有新的内容出现——VR(虚拟现实)。NVIDIA创始人兼CEO黄仁勋的主题演讲也可以说是围绕这些热点展开的。

回顾GTC大会的发展历程,每年都会刷新一些记录。相比2012年,GTC大会的参与人数已经翻倍,CUDA的开发者数量更是提升了4倍以上。从这些数字也能看出,关注GPU计算的人越来越多。据介绍,这三年的TOP500榜单中,96%的新系统使用了NVIDIA的GPU加速器,加速型系统的数量更是达到2013年的两倍。 

GTC2016干货分享:深度学习依旧热,VR新爆点

简单的开场后,进入黄仁勋Keynote的干货阶段,总的来说有五个部分的内容:一个全新的Toolbox、VR、一款用于深度学习的全新GPU、一款用于深度学习的新平台,以及基于深度学习技术的自动驾驶汽车。 

一、面向开发者的Toolbox。NVIDIA为开发者提供了一系列先进的开发工具,包括面向游戏开发者的GameWorks、面向设计师的DesignWorks、面向VR开发者的VRWorks、面向高性能计算的ComputeWorks、面向自动驾驶汽车的DriveWorks,以及面向Jetson开发者的JetPack。 

针对每个领域,NVIDIA都有着不同程度的创新。比如在谈到游戏应用时,黄仁勋表示,人们对游戏的喜爱大大推动了技术的进步,人们喜欢更为精细的画面,这就需要更强的图像处理能力,像NVIDIA Iray(光线追踪)等技术的出现可以说为此而生。接下来这些技术的开发平台也将陆续更新,这无疑为开发者创造了更好的条件。 

再比如,黄仁勋提到的NVIDIA JetPack,它是针对Jetson嵌入式开发平台的开发者提供的工具,通过最新的GIE(GPU推断引擎),可以让Jetson TX1的处理能力达到24张图像每秒每瓦特。 

二、VR(虚拟现实)。黄仁勋表示,VR正在给我们带来全新的体验,它可以让你体验到那些梦想去的地方,即便那些地方很危险。在现场,NVIDIA展示了基于VR技术打造的两部影片——雪山与Mars 2030。它们都是基于真实的物理数据,通过GPU进行计算与加速,并最终制作成功的影片。从观影角度看,你根本分不清这是真实的场景还是电脑合成的特效,包括那些寒风吹起的雪花和火星上强烈的光影效果。 

GTC2016干货分享:深度学习依旧热,VR新爆点

当然光看热闹是不够的,在此次大会上,NVIDIA重磅发布Iray VR以及Iray VR Lite。据黄仁勋介绍,NVIDIA不仅将Iray这一最先进物理效果渲染技术应用在3ds Max等知名设计软件当中,同时还把它应用在最新的VR里面,借助Iray VR,设计师可以更好的展示其作品。在现场,通过VR头盔,提前参观了一把有着“光的艺术”之称的NVIDIA新总部。

三、深度学习。黄仁勋对去年人工智能的发展用了“An Amazing Year In AI”来形容。刚刚过去的受到全球广泛关注的AlphaGo和李世石人机大战、百度在语音识别方面获得的成绩……应该说过去一两年在人工智能方面人类取得了非常瞩目的成绩,从研究机构、大学、新兴企业,到行业领袖都开始AI的研究,而这一切的基础都离不开深度学习。 

GTC2016干货分享:深度学习依旧热,VR新爆点

黄仁勋预测10年后,深度学习将形成超过5000亿美元的市场规模,在其中NVIDIA是毫无疑问的领军者。此次大会上,NVIDIA发布了面向数据中心的、最先进的GPU产品——Tesla P100。黄仁勋甚至用了“奇迹(MIRACLES)”来形容Tesla P100带来的改变,比如Pascal架构、16nm制程、HBM2显存架构(提供高达720GB/s的超高带宽)、支持NVLink技术和全新的AI算法,支持高达21.2Teraflops的峰值FP 16运算性能。据悉,这款产品将在2017年1月正式面世,包括IBM、HPE、戴尔和克雷在内的4家厂商都会同时供货。

除了Tesla P100外,针对深度学习领域,NVIDIA还重磅发布了全球第一款款面向深度学习的专用设备——DGX-1。相比传统的双路至强平台,DGX-1在性能上提升了近60倍,节点带宽提升了10倍以上,训练时间缩短75倍。根据NVIDIA针对13.3亿照片进行训练的测试结果显示,相比去年发布的Maxwell产品在性能提升上达到了12倍。短短一年时间,提升了12倍,这样的结果几乎是不可想象的。

GTC2016干货分享:深度学习依旧热,VR新爆点

据悉,这款产品的售价为12.9万美元,价格不低,但是相比官方宣传的‘250 Server in-a-box’,这价格也还算能接受。毕竟250个Server总核算的成本可不止这个数。 

加上此次发布的一块卡、一个平台,至此,NVIDIA在深度学习领域的产品布局可以说已经比较完善。Tesla K80主要面向高端, Tesla M40和Telsa M4面向互联网云计算应用,Tesla P100面向高端互联网云计算应用,DGX-1平台面向研究人员和数据科学家。从低端到高端,从加速卡到平台,已经能够满足所有客户的应用需求。 

五、自动驾驶汽车。黄仁勋Keynote的最后一大块内容自动驾驶。应该说早在前几年,NVIDIA就已经投入了这个领域,其代表性的Tegra芯片已经有很多成熟的应用案例,包括马、兰博基尼等许多品牌都是它的合作伙伴。 

GTC2016干货分享:深度学习依旧热,VR新爆点

据黄仁勋介绍,基于NVIDIA DRIVE PX 2(Tegra是基础,它为自动驾驶汽车而生,其每一颗摄像头每秒可捕捉15000个周围环境的关键信息点,而整个平台每秒可处理最高180万个道路关键点。通过将这些宝贵的道路信息上传至云端的DGX-1平台,我们可以构建出拥有极高解析度的道路地图,并为Here、TomTom、Zenrin等地图供应商所使用,指导车辆更为安全的行驶)打造的纯电动自动驾驶赛车,将在2016/17举办的Formula E赛事正式亮相并参加比赛。 

GTC2016干货分享:深度学习依旧热,VR新爆点

至此,黄仁勋Keynote全部结束,全场演讲围绕五个方面全方位展开,但事实上可以归结为两大类。一是深度学习、二是VR,自动驾驶可以说是基于深度学习的衍生应用,而针对每个方面,NVIDIA都有新的产品、解决方案发布,这也将是未来很长一个阶段NVIDIA,乃至业界重点关注的领域。


原文发布时间为:2016-04-06

本文作者:于泽 

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。




推荐阅读
  • 本文介绍了腾讯最近开源的BERT推理模型TurboTransformers,该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想,通过简化问题和加速开发,实现了快速推理能力。同时,文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题,并提出了合并计算的解决方案。 ... [详细]
  • 本文介绍了Windows操作系统的版本及其特点,包括Windows 7系统的6个版本:Starter、Home Basic、Home Premium、Professional、Enterprise、Ultimate。Windows操作系统是微软公司研发的一套操作系统,具有人机操作性优异、支持的应用软件较多、对硬件支持良好等优点。Windows 7 Starter是功能最少的版本,缺乏Aero特效功能,没有64位支持,最初设计不能同时运行三个以上应用程序。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • Monkey《大话移动——Android与iOS应用测试指南》的预购信息发布啦!
    Monkey《大话移动——Android与iOS应用测试指南》的预购信息已经发布,可以在京东和当当网进行预购。感谢几位大牛给出的书评,并呼吁大家的支持。明天京东的链接也将发布。 ... [详细]
  • 本文详细介绍了SQL日志收缩的方法,包括截断日志和删除不需要的旧日志记录。通过备份日志和使用DBCC SHRINKFILE命令可以实现日志的收缩。同时,还介绍了截断日志的原理和注意事项,包括不能截断事务日志的活动部分和MinLSN的确定方法。通过本文的方法,可以有效减小逻辑日志的大小,提高数据库的性能。 ... [详细]
  • 本文介绍了Python高级网络编程及TCP/IP协议簇的OSI七层模型。首先简单介绍了七层模型的各层及其封装解封装过程。然后讨论了程序开发中涉及到的网络通信内容,主要包括TCP协议、UDP协议和IPV4协议。最后还介绍了socket编程、聊天socket实现、远程执行命令、上传文件、socketserver及其源码分析等相关内容。 ... [详细]
  • PHP设置MySQL字符集的方法及使用mysqli_set_charset函数
    本文介绍了PHP设置MySQL字符集的方法,详细介绍了使用mysqli_set_charset函数来规定与数据库服务器进行数据传送时要使用的字符集。通过示例代码演示了如何设置默认客户端字符集。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • 在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板
    本文介绍了在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板的方法和步骤,包括将ResourceDictionary添加到页面中以及在ResourceDictionary中实现模板的构建。通过本文的阅读,读者可以了解到在Xamarin XAML语言中构建控件模板的具体操作步骤和语法形式。 ... [详细]
author-avatar
张-苡_278
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有