热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

百度飞桨亮相GTC元脑生态技术论坛PipelineServing加速预测服务应用落地

点击左上方蓝字关注我们12月份,AI行业年度盛会GTC中国线上大会重磅来袭。在备受关注的GTC元脑生态技术论坛上,浪潮联合百度、中科极限元、趋动科技、睿

点击左上方蓝字关注我们

12月份,AI行业年度盛会GTC中国线上大会重磅来袭。在备受关注的GTC元脑生态技术论坛上,浪潮联合百度、中科极限元、趋动科技、睿沿科技、海克斯康等伙伴,带来了人工智能算法开发、方案、架构、实践等精彩分享。其中,百度资深工程师赵历以“如何使用飞桨 Pipeline Serving 加速预测服务在企业的搭建”为主题,对百度飞桨深度学习平台的Paddle Serving产品的异步流水线定位、发展历程和核心框架进行全面介绍。

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。目前,飞桨已凝聚超265万开发者,服务企业10万家,基于飞桨开源深度学习平台产生了34万个模型。飞桨助力开发者快速实现AI想法,快速上线AI业务。帮助越来越多的行业完成AI赋能,实现产业智能化升级。

作为飞桨的技术负责人之一,赵历对Paddle Serving在飞桨生态中的定位和作用进行了解读:“为了解决多模型组合的通用问题,Paddle Serving产品实现了一套基于有向无环图的多模型组合微服务‘Pipeline Serving’功能,旨在帮助开发者轻松实现从移动端、服务器端和和智能设备调用深度学习模型的远程预测服务。”

Paddle Serving围绕工业级深度学习模型部署场景进行设计,提供多模型管理、模型热加载、基于BRPC的高并发低延迟响应能力、在线模型A/B实验等功能。与Paddle训练框架互相配合的API可以让用户从训练到远程部署进行无缝过度,提升深度学习模型的落地效率。此外,在近期月底的v0.4.0发版中即将支持Pipeline Serving、Java客戶端API、原生支持Windows操作系统的Local Predictor功能、TensorRT的支持等功能。

赵历表示,PaddlePaddle具备完整的端到端的全流程部署方案,同时提供性能领先的底层加速库和推理引擎和服务器端的快速部署能力。部署在浪潮NF5488A5服务器上的Paddle Serving预测服务,可以充分发挥浪潮服务器高性能、高带宽和易部署等技术优势,为服务平台和AI企业提供强大的支撑力。

随着框架的不断升级和完善,Paddle Serving的易用性、高性能、灵活性、双生态的特点正在被越来越多的AI开发人员认可,框架的下载量和社区活跃度的明显提升就是最好的证明。

在后续的演示和数据分析中,赵历对Paddle Serving 的模型即服务(Model as a Service,MaaS)的理念进行了实战演示。首先,通过全面打通并自动化飞桨训练框架与 Paddle Serving 的衔接流程,让用户在使用飞桨成功完成模型训练的那一刻,收获的不再只是模型,而是同时拥有了该模型的推理服务,使用户能够在几分钟内将模型转化为一个可以在服务器端部署的远程服务。其次,为了解决单算子多模型这类通用问题,采用了高效引擎、灵活易用(进程+线程、远程+本地)等设计,基于图执行引擎的Pipeline Serving模式,使用全异步的方式大幅提升吞吐和GPU的利用率,在全面降低成本的同时,更对OP和Channel做了大量的容错处理、性能优化的工作,对用户自定义的接口也提供了简单易用的使用方式。

“Paddle Serving 作为飞桨的服务化部署框架,长期目标就是为人工智能落地的最后一公里提供越来越专业、可靠、易用的服务。Paddle Serving 将在接下来的版本中继续降低用户学习和使用门槛,提供更多语言类型的客户端支持,以及相关部署组件,开放更多开箱即用的模型。”分享的最后,赵历对Paddle Serving的未来发展做出展望。

如在使用过程中有问题,可加入飞桨官方QQ群进行交流:1108045677。

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。

·飞桨PaddlePaddle项目地址·

GitHub: 

https://github.com/PaddlePaddle/PaddlePaddle 

Gitee: 

https://Gitee.com/PaddlePaddle/PaddlePaddle 

·飞桨官网地址·

https://www.paddlepaddle.org.cn/

微信号 : PaddleOpenSource

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。


推荐阅读
  • 作为140字符的开创者,Twitter看似简单却异常复杂。其简洁之处在于仅用140个字符就能实现信息的高效传播,甚至在多次全球性事件中超越传统媒体的速度。然而,为了支持2亿用户的高效使用,其背后的技术架构和系统设计则极为复杂,涉及高并发处理、数据存储和实时传输等多个技术挑战。 ... [详细]
  • 当前,众多初创企业对全栈工程师的需求日益增长,但市场中却存在大量所谓的“伪全栈工程师”,尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值,澄清对这一角色的误解,并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • 修复一个 Bug 竟耗时两天?真的有那么复杂吗?
    修复一个 Bug 竟然耗费了两天时间?这背后究竟隐藏着怎样的复杂性?本文将深入探讨这个看似简单的 Bug 为何会如此棘手,从代码层面剖析问题根源,并分享解决过程中遇到的技术挑战和心得。 ... [详细]
  • 优化后的标题:PHP分布式高并发秒杀系统设计与实现
    PHPSeckill是一个基于PHP、Lua和Redis构建的高效分布式秒杀系统。该项目利用php_apcu扩展优化性能,实现了高并发环境下的秒杀功能。系统设计充分考虑了分布式架构的可扩展性和稳定性,适用于大规模用户同时访问的场景。项目代码已开源,可在Gitee平台上获取。 ... [详细]
  • 基于Node.js的高性能实时消息推送系统通过集成Socket.IO和Express框架,实现了高效的高并发消息转发功能。该系统能够支持大量用户同时在线,并确保消息的实时性和可靠性,适用于需要即时通信的应用场景。 ... [详细]
  • 本文推荐了六款高效的Java Web应用开发工具,并详细介绍了它们的实用功能。其中,分布式敏捷开发系统架构“zheng”项目,基于Spring、Spring MVC和MyBatis技术栈,提供了完整的分布式敏捷开发解决方案,支持快速构建高性能的企业级应用。此外,该工具还集成了多种中间件和服务,进一步提升了开发效率和系统的可维护性。 ... [详细]
  • MVVM架构~mvc,mvp,mvvm大话开篇
    返回目录百度百科的定义:MVP是从经典的模式MVC演变而来,它们的基本思想有相通的地方:ControllerPresenter负责逻辑的处理,Model提供数据,View负责显示。作为一种新的模 ... [详细]
  • 图像分割技术在人工智能领域中扮演着关键角色,其中语义分割、实例分割和全景分割是三种主要的方法。本文对这三种分割技术进行了详细的对比分析,探讨了它们在不同应用场景中的优缺点和适用范围,为研究人员和从业者提供了有价值的参考。 ... [详细]
  • 如何正确配置与使用日志组件:Log4j、SLF4J及Logback的连接与整合方法
    在当前的软件开发实践中,无论是开源项目还是日常工作中,日志框架都是不可或缺的工具之一。本文详细探讨了如何正确配置与使用Log4j、SLF4J及Logback这三个流行的日志组件,并深入解析了它们之间的连接与整合方法,旨在帮助开发者高效地管理和优化日志记录流程。 ... [详细]
  • AI TIME联合2021世界人工智能大会,共探图神经网络与认知智能前沿话题
    AI TIME携手2021世界人工智能大会,共同探讨图神经网络与认知智能的最新进展。自2018年在上海首次举办以来,WAIC已成为全球AI领域的年度盛会,吸引了众多专家学者和行业领袖参与。本次大会将聚焦图神经网络在复杂系统建模、知识图谱构建及认知智能应用等方面的技术突破和未来趋势。 ... [详细]
  • 利用Redis HyperLogLog高效统计微博日活跃和月活跃用户数
    本文探讨了如何利用Redis的HyperLogLog数据结构高效地统计微博平台的日活跃用户(DAU)和月活跃用户(MAU)数量。通过HyperLogLog的高精度和低内存消耗特性,可以实现对大规模用户数据的实时统计与分析,为平台运营提供有力的数据支持。 ... [详细]
  • 表面缺陷检测数据集综述及GitHub开源项目推荐
    本文综述了表面缺陷检测领域的数据集,并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理,为研究人员提供了全面的资源参考,有助于推动该领域的发展和技术进步。 ... [详细]
  • SpringBoot启动脚本详解:BAT文件应用与基础入门指南(SpringBoot系列第1篇)
    如果你还在为SSM框架的复杂搭建过程和繁琐的配置文件而烦恼,那么SpringBoot将是你的一大福音。作为SpringBoot系列的第一篇文章,本文详细介绍了如何使用BAT文件来启动SpringBoot应用,并提供了基础入门指南,帮助开发者快速上手,简化开发流程。 ... [详细]
  • 2018年热门趋势:轻松几步构建高效智能聊天机器人
    2018年,构建高效智能聊天机器人的简易步骤成为行业焦点。作为AI领域的关键应用,聊天机器人不仅被视为企业市场智能化转型的重要工具,也是技术变现的主要途径之一。随着自然语言处理技术的不断进步,越来越多的企业开始重视并投资于这一领域,以期通过聊天机器人提升客户服务体验和运营效率。 ... [详细]
author-avatar
lovejiao2012
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有