热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

keras用cpu加速_NVIDIA发布《2020推荐系统加速框架白皮书》

这是一个全民互联网消费的时代,而消费互联网的本质是个人虚拟化,增强个人消费体验。今年,天猫“双11”的成交额突破了4982亿元࿰

这是一个全民互联网消费的时代,而消费互联网的本质是个人虚拟化,增强个人消费体验。今年,天猫“双11”的成交额突破了 4982 亿元,它的推荐系统实现了首页商品的个性化推荐,目标是提高转化率和点击率。如果推荐系统整体的转化率提高 1%,那么增加的成交额大约就是 49.82 亿。可以说,推荐系统的转化力就是消费互联网的生产力。

推荐系统在经历了 20 世纪末本世纪初“从 0 到 1”的基础构建后,现正朝“从 1 到 100 ”的应用优化方向不断创新。

在今天与 GTC 中国站同步上线的《2020 推荐系统加速框架白皮书》中,CCID 深入浅出地介绍了基于深度学习的推荐系统的应用,阐述了当前国内的推荐系统市场行情及发展趋势,并分析了用于构建大规模深度学习推荐系统的开放框架 NVIDIA Merlin。

4f6536244135b0e0de0ba7ebddd96c02.png

什么是基于深度学习的推荐系统?

推荐系统(Recommender System)是向用户建议有用物品(“物品”指系统向用户推荐内容的总称)的软件工具和技术。它可以通过向用户建议有用的物品,帮助用户决策,如购买什么物品、听什么音乐、在网上浏览什么新闻等。

近年来,深度学习在图像处理、自然语言理解和语音识别等领域取得了突破性进展,也为推荐系统的研究带来了新的机遇。基于深度学习的推荐系统通常将各类用户和项目相关的数据作为输入,利用深度学习模型挖掘用户和项目的隐表示,并基于这种隐含关系为用户产生项目推荐。

基于深度学习的推荐系统具有以下方面的优势:

  1. 能够直接从内容中提取特征,表征能力强
  2. 容易对噪声数据进行处理,抗噪能力强
  3. 可以使用循环神经网络对动态或者序列数据进行建模
  4. 可以更加准确地学习用户与物品的特征

尽管深度学习推荐模型得到了广泛的应用,却也带来了庞大的计算需求。考虑到海量的待处理数据以及到推荐系统训练时的模型并行性和数据并行性问题,我们需要端到端 GPU 上推荐程序框架用以提供快速功能工程和高培训吞吐量。

为什么需要推荐系统加速框架?

推荐系统加速框架是面向推荐系统的端到端解决方案。主流的推荐系统加速框架一般为针对深度学习推荐系统的端到端解决方案,能够优化深度学习推荐算法,将加速推荐算法的训练、部署等过程。

根据推荐系统加速框架对推荐系统的专用性,可将推荐系统加速框架分为通用型推荐系统加速框架与专用型推荐系统加速框架。

通用型推荐系统加速框架支持包括推荐算法在内的多种深度学习算法,未能针对深度学习推荐算法进行优化,典型框架有 TensorFlow、PyTorch、Keras 等。专用型推荐系统加速框架仅支持学习推荐算法,面向深度学习推荐算法同时针对硬件系统及软件进行了优化,并包含数据预处理、模型训练、推理及交互等完整的推荐系统结构,其典型框架是 NVIDIA Merlin。

推荐系统加速框架产业格局

推荐系统加速框架目前的格局中,以互联网公司自主研发为主。互联网头部企业由于本身体量较大,有能力自主研发推荐系统及推荐系统框架。而绝大多数互联网公司会采用主流的深度学习框架搭建系统,如采用 TensorFlow、PyTorch 等。

目前推荐系统加速框架以优化运行在 CPU 为核心的服务器为主,也支持优化以 GPU 为算力核心的服务器。NVIDIA Merlin 是专用于推荐系统的深度学习加速框架,并且仅用于优化运行在以GPU为算力核心的服务器上的推荐系统,随着 AI 对 GPU的需求逐渐提升,以 GPU 为基础算力的推荐系统将呈现快速增长趋势,NVIDIA Merlin 的竞争力也将不断加强。

中国推荐系统加速框架产业发展现状

现阶段中国互联网企业不再依靠人口红利快速扩张,而是依靠对用户精准的把握进行消费互联网布局。因而推荐系统加速框架产业市场规模呈现逐年增长的趋势,2019年中国推荐系统加速框架产业市场规模达 2.16 万亿人民币,预计到 2024 年中国推荐系统加速框架产业市场规模将超过 7.7 万亿人民币。

5aab94635153014b4b531f561599a5de.png

CCID:中国推荐系统框架市场规模

Merlin框架简介

NVIDIA Merlin 是 NVIDIA 推出的基于 GPU 的用于构建大规模深度学习推荐系统的开放框架,它提供的工具可以使开发者更加自主地构建深度学习推荐系统,从而获得比传统推荐方法更准确的预测以提高用户的点击率。Merlin 为用户提供了一个全链路解决方案,用于为推荐系统提供 GPU 加速的数据提取、模型训练和模型部署。Merlin 链路的每个环节经过优化后可支持数百 TB 的数据,所有数据都可通过易于使用的 API 访问。它可以利用基于 NVIDIA Ampere 架构的全 NVIDIA A100 GPU,帮助企业构建推荐系统。

Merlin框架优势与前景

尽管常用的深度学习框架均支持在 GPU 中训练推荐算法,但目前推荐算法仍多数运行在 CPU 上,Merlin 致力于解决 GPU 相比 CPU 加速不够显著的问题。首先 Merilin 依托 GPU 算力,可使推荐算法性能显著提升。其次,用户既可以使用 NVIDIA 提供的推荐系统,也可以自主开发推荐系统。灵活的使用方式大大降低了基于 GPU 的深度学习推荐系统开发门槛。此外使用 CUDA 编程语言的 Merilin 保证了向后兼容,这也为产品的快速迭代升级提供了保障。最后,Merlin 具有强大的生态扩展性。NVIDIA 十分重视 Merlin 体系的建设,投入了大量的研究人员持续到 Merlin 的研发、运营、产品迭代中,致力于 GPU 加速的推荐算法体系的建设,努力赋能 Merlin 框架下的推荐系统生态的建设。

Merlin 框架是当前市场上仅存的针对于深度学习推荐算法的推荐系统框架,也是当前市场上仅存的专门针对于 NVIDIA GPU 的推荐系统框架。Merlin 框架大大降低了基于 GPU 的深度学习推荐系统开发门槛,为基于 GPU 加速的推荐算法体系生态建设赋能。

点击下方"了解更多"浏览完整报告。



推荐阅读
  • 精选10款Python框架助力并行与分布式机器学习
    随着神经网络模型的不断深化和复杂化,训练这些模型变得愈发具有挑战性,不仅需要处理大量的权重,还必须克服内存限制等问题。本文将介绍10款优秀的Python框架,帮助开发者高效地实现分布式和并行化的深度学习模型训练。 ... [详细]
  • 英特尔推出第三代至强可扩展处理器及傲腾持久内存,AI性能显著提升
    英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存,全面增强AI能力和系统性能。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 深入探讨:Actor模型如何解决并发与分布式计算难题
    在现代软件开发中,高并发和分布式系统的设计面临着诸多挑战。本文基于Akka最新文档,详细探讨了Actor模型如何有效地解决这些挑战,并提供了对并发和分布式计算的新视角。 ... [详细]
  • 本文详细介绍了 Java 网站开发的相关资源和步骤,包括常用网站、开发环境和框架选择。 ... [详细]
  • 本文介绍了如何使用 Google Colab 的免费 GPU 资源进行深度学习应用开发。Google Colab 是一个无需配置即可使用的云端 Jupyter 笔记本环境,支持多种深度学习框架,并且提供免费的 GPU 计算资源。 ... [详细]
  • Python 数据可视化实战指南
    本文详细介绍如何使用 Python 进行数据可视化,涵盖从环境搭建到具体实例的全过程。 ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • 在Windows系统中安装TensorFlow GPU版的详细指南与常见问题解决
    在Windows系统中安装TensorFlow GPU版是许多深度学习初学者面临的挑战。本文详细介绍了安装过程中的每一个步骤,并针对常见的问题提供了有效的解决方案。通过本文的指导,读者可以顺利地完成安装并避免常见的陷阱。 ... [详细]
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 本文将深入探讨生成对抗网络(GAN)在计算机视觉领域的应用。作为该领域的经典模型,GAN通过生成器和判别器的对抗训练,能够高效地生成高质量的图像。本文不仅回顾了GAN的基本原理,还将介绍一些最新的进展和技术优化方法,帮助读者全面掌握这一重要工具。 ... [详细]
  • 知识图谱与图神经网络在金融科技中的应用探讨
    本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲,探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]
  • 本文介绍了实现人工智能的多种方法,并重点探讨了当前最热门的技术——通过深度学习训练神经网络。文章通过具体实例详细解释了神经网络的基本原理及其应用。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 使用TensorFlow 2.0构建VGG16神经网络:详解API应用与实现 ... [详细]
author-avatar
谢海武181_160
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有