热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

大数据云起现CPU运算技术面临GPU挑战

在特定的科学研究领域里面,以GPU协同CPU来强化整体运算能力的应用,越来越常见,然而,过去在商业领域中罕见实际导入使用的例子。不过,今年的情势很不同,Nvidia在GTC201

在特定的科学研究领域里面,以GPU协同CPU来强化整体运算能力的应用,越来越常见,然而,过去在商业领域中罕见实际导入使用的例子。

不过,今年的情势很不同,Nvidia在GTC 2013大会上,正式宣布了几家商用实例,他们是提供云服务和开发移动应用的公司,已经将GPU用在大数据(Big Data)的分析与升级搜索,而且他们的服务可同时涵盖到消费端与商业应用。

CRM用PC等级GPU吞下所有数据处理

首先登场的,是以提供CRM软件即服务(SaaS)而闻名的云端服务供货商Salesforce。他们之所以用GPU,是因为旗下的Marketing Cloud服务替客户提供了Social listening的功能,也就是社交网站监控与分析。而使用该服务的用户,目前有Cisco、Dell、Gatorade、美国红十字会等。

Salesforce.com在此面临的挑战之一,主要是需处理每天来自Twitter网站上的用户新增的5亿篇帖子(tweets),这些帖子中包含了不同性质的数据,同时,每天的新帖数量还在不断增长,而且速度越来越快。

除此之外,Salesforce在本身的主题档案库中,也定义了160万以上的搜索表示式(每一笔包含12个关键词),这里的数据也是随着用户数成长而持续增加中。

原本Salesforce所用的方法,是在一般的x86处理器架构下,利用Apache Lucene这套Java链接库,来获得关键词索引与搜索的布尔运算机制,以及用Twitter worker程序,针对一大批推文来建立索引,并且用它来查询所有的表示式,但这么做,数据吞吐量低,并且会产生很高的延迟。

后来,Salesforce采用新的方法,称之为Zapp,利用可提供高吞吐量的GPU来加速,也就是让关键词比对的控制由CPU执行,而需要大量运算的工作交给GPU,大幅缩短了处理的时间,于是计算成本不再随表达式数量的增加而呈线性增长。

Salesforce表示,只需要两颗Nvidia GTX 580的GPU,就足以处理尖峰负载时间的所有帖子,这足以省下大量硬件与人力上的资源。

移动App开发商用GPU架构达到省钱之道

在GTC2013大会上,另一个实际印证GPU可应用在大数据处理的案例是知名的App开发商Shazam。 他们的歌曲查询程序Shazam,在Apple App Store和Google Play的移动设备软件市场集中,受到用户青睐,是音乐类应用的Top5。

Shazam App的主要功能是提供歌曲搜索与识别服务,它可以“听”用户正在听的音乐,并告知曲目信息。目前在手机与平板电脑下载Shazam的数量,已经超过3亿,而该公司后端拥有的歌曲也在2012年达到2700万的惊人数据。

看起来,使用这项服务的人众多,同时所要比对的数据也非常庞大,并且是声纹(acoustic fingerprint)比对,系统要能从数千万首歌曲中,判断能否与用户上传的范例音乐相符,困难度可想而知。

大数据来袭 现CPU运算技术面临GPU挑战

社交网站与移动应用普及,导致需分析的数据量暴增

因成为IT主流趋势的社交网站与移动应用,这两种风潮下所激增的大量数据不容忽视。像Salesforce每天要分析5亿篇tweets,这样的成长是在3年内发生;Shazam面对的是3亿用户与2700万首歌曲的数据库,并且只花了1年,用户与歌曲数就增长1倍以上。

另一个该公司要去面对的问题,是新进用户、搜索次数与歌曲量都在极速成长——他们每天要应付1千万首歌的搜索请求,每周有2百万个新用户,而所收录的歌曲总数已2倍速度剧增。

为了加速歌曲搜寻与比对过程,以及因应倍增的用户需求,Shazam决定使用上百颗Nvidia Tesla的GPU,建设低成本的服务器基础设施,以应对上述的服务运维规模与成长需求。

Shazam公司首席技术官Jason Titus表示,同样花一块钱,GPU可让他们得以获得两倍CPU架构系统的效能,并且能达到自身的成长规模。



推荐阅读
  • 基于PgpoolII的PostgreSQL集群安装与配置教程
    本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件,提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能,可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤,并提供了相关的官方参考地址。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 一句话解决高并发的核心原则
    本文介绍了解决高并发的核心原则,即将用户访问请求尽量往前推,避免访问CDN、静态服务器、动态服务器、数据库和存储,从而实现高性能、高并发、高可扩展的网站架构。同时提到了Google的成功案例,以及适用于千万级别PV站和亿级PV网站的架构层次。 ... [详细]
  • PatchODAX8: ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • 如何用UE4制作2D游戏文档——计算篇
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了如何用UE4制作2D游戏文档——计算篇相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 嵌入式处理器的架构与内核发展历程
    本文主要介绍了嵌入式处理器的架构与内核发展历程,包括不同架构的指令集的变化,以及内核的流水线和结构。通过对ARM架构的分析,可以更好地理解嵌入式处理器的架构与内核的关系。 ... [详细]
  • Apache Shiro 身份验证绕过漏洞 (CVE202011989) 详细解析及防范措施
    本文详细解析了Apache Shiro 身份验证绕过漏洞 (CVE202011989) 的原理和影响,并提供了相应的防范措施。Apache Shiro 是一个强大且易用的Java安全框架,常用于执行身份验证、授权、密码和会话管理。在Apache Shiro 1.5.3之前的版本中,与Spring控制器一起使用时,存在特制请求可能导致身份验证绕过的漏洞。本文还介绍了该漏洞的具体细节,并给出了防范该漏洞的建议措施。 ... [详细]
  • 在win8上安装SQL2000的详细步骤(原创)
    本文详细介绍了在win8操作系统上安装SQL2000的步骤,包括找到安装文件、设置兼容性、输入序列号、选择数据库路径、选择账号模式、输入密码、处理错误提示等。适用于那些想在win8上使用SQL2000的用户。 ... [详细]
  • 本文概述了JNI的原理以及常用方法。JNI提供了一种Java字节码调用C/C++的解决方案,但引用类型不能直接在Native层使用,需要进行类型转化。多维数组(包括二维数组)都是引用类型,需要使用jobjectArray类型来存取其值。此外,由于Java支持函数重载,根据函数名无法找到对应的JNI函数,因此介绍了JNI函数签名信息的解决方案。 ... [详细]
  • 如何使用PLEX播放组播、抓取信号源以及设置路由器
    本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源,用户可以在PLEX上实现直播功能,并且可以自动匹配EPG信息和定时录制节目。同时,本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前,建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后,本文还介绍了docker版xTeve的设置方法。 ... [详细]
author-avatar
MING1981岁月
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有