PaddleInference和PaddleServing

作者：霸道Q丫头 | 来源：互联网 | 2023-01-06 16:59

部署方式服务器端高性能部署：将模型部署在服务器上，利用服务器的高性能帮助用户处理推理业务。模型服务化部署：将模型以线上服务的形式部署在服务器或者云端，用户通过客户端请求发送需要推理

在这里插入图片描述

部署方式

服务器端高性能部署：将模型部署在服务器上，利用服务器的高性能帮助用户处理推理业务。
模型服务化部署：将模型以线上服务的形式部署在服务器或者云端，用户通过客户端请求发送需要推理的输入内容，服务器或者云通过响应报文将推理结果返回给用户。
移动端部署：将模型部署在移动端上，例如手机或者物联网的嵌入式端。
Web端部署：将模型部署在网页上，用户通过网页完成推理业务。

第一种方式

这种方式，是整体打包，从本地移到服务器的部署，模型没有服务化，相对调用模型的函数，是本地调用的，这种方式效率快，不存在二次调度验收，但是模型不可复用，会造成一定的空间浪费。
基于Paddle Inference的单机推理部署，即在一台机器进行推理部署。相比Paddle Serving在多机多卡下进行推理部署，单机推理部署不产生多机通信与调度的时间成本，能够最大程度地利用机器的Paddle Inference算力来提高推理部署的性能。对于拥有高算力机器，已有线上业务系统服务，期望加入模型推理作为一个子模块，且对性能要求较高的用户，采用单机推理部署能够充分利用计算资源，加速部署过程。

第二种方式

这种方式，是把模型服务化，可以给其他很多任务调用，服务化一个模型即可，无需没个应用都部署一套，缺点是存在接口访问调度时间，外部应用访问的时候相当于多经过了一个接口中专。

启动推理服务
如图4所示，Paddle Serving框架从大的方向上分为两种模式，并且为了适配工业界的实际需求衍生出了更加便携的部署方式。如果用户需要一个纯模型预测服务，通过输入Tensor和输出Tensor与服务进行交互，可以使用RPC模式。通常这种模式用于验证模型的有效性。实际的场景往往具备较为复杂的前后处理，自然语言或者图像数据直接发送到服务端之后，需要一定的前处理转换成Tensor之后做预测

如图4所示，Paddle Serving框架支持两种推理服务方式，分别是RPC服务和Web服务，用户可以任选其一：

RPC服务是CS架构，用户使用客户端来访问服务端获取推理结果，客户端和服务端之间的通信使用的是百度开源的一款RPC通信库来完成的。RPC具有高并发、低延时等特点，已经支持了包括百度在内上百万在线推理实例、上千个在线推理服务，稳定可靠，其整体性能要优于HTTP，但是只能适用于Linux操作系统，而且需要编写Client端的代码。如果用户的推理业务需要数据前后处理，例如训练图片的归一化，文本的ID化等等，这部分代码也需要包含在客户端中。
Web服务是BS架构，用户可以使用浏览器或其它Web应用通过HTTP协议访问服务端。与RPC相比其优势在于可以适用于包括Linux操作系统在内的不同系统环境。此外还省去了编写客户端代码的工作量，仅需要使用服务端设定的URL就可以发送推理请求，获取推理结果。但是如果需要做预处理操作，则需要在服务端上做二次开发，由服务段使用Paddle Serving的内置预处理模块完成数据预处理操作。
在这里插入图片描述
也可以，直接访问，但是需要内置的服务端完成预处理工作

推荐阅读

dll
优化后的标题：PHP分布式高并发秒杀系统设计与实现

PHPSeckill是一个基于PHP、Lua和Redis构建的高效分布式秒杀系统。该项目利用php_apcu扩展优化性能，实现了高并发环境下的秒杀功能。系统设计充分考虑了分布式架构的可扩展性和稳定性，适用于大规模用户同时访问的场景。项目代码已开源，可在Gitee平台上获取。 ... [详细]

蜡笔小新 2024-10-30 12:16:19
ip
Twitter架构深度解析与学习心得

作为140字符的开创者，Twitter看似简单却异常复杂。其简洁之处在于仅用140个字符就能实现信息的高效传播，甚至在多次全球性事件中超越传统媒体的速度。然而，为了支持2亿用户的高效使用，其背后的技术架构和系统设计则极为复杂，涉及高并发处理、数据存储和实时传输等多个技术挑战。 ... [详细]

蜡笔小新 2024-10-31 17:58:20
input
深入解析进程及其描述符（task_struct）

进程（Process）是指计算机中程序对特定数据集的一次运行活动，是系统资源分配与调度的核心单元，构成了操作系统架构的基础。在早期以进程为中心的计算机体系结构中，进程被视为程序的执行实例，其状态和控制信息通过任务描述符（task_struct）进行管理和维护。本文将深入探讨进程的概念及其关键数据结构task_struct，解析其在操作系统中的作用和实现机制。 ... [详细]

蜡笔小新 2024-10-31 10:54:55
ip
深入解析IO复用技术及其在C10K问题中的应用

本文深入探讨了IO复用技术的原理与实现，重点分析了其在解决C10K问题中的关键作用。IO复用技术允许单个进程同时管理多个IO对象，如文件、套接字和管道等，通过系统调用如`select`、`poll`和`epoll`，高效地处理大量并发连接。文章详细介绍了这些技术的工作机制，并结合实际案例，展示了它们在高并发场景下的应用效果。 ... [详细]

蜡笔小新 2024-10-29 18:24:19
shell
SpringBoot启动脚本详解：BAT文件应用与基础入门指南（SpringBoot系列第1篇）

如果你还在为SSM框架的复杂搭建过程和繁琐的配置文件而烦恼，那么SpringBoot将是你的一大福音。作为SpringBoot系列的第一篇文章，本文详细介绍了如何使用BAT文件来启动SpringBoot应用，并提供了基础入门指南，帮助开发者快速上手，简化开发流程。 ... [详细]

蜡笔小新 2024-10-28 18:48:35
ip
Windows环境下详细教程：如何搭建Git服务

Windows环境下详细教程：如何搭建Git服务 ... [详细]

蜡笔小新 2024-10-28 17:31:26
ip
【金阳光测试】深入解析Android自动化测试——Android自动化系列（一）——金阳光2013年4月发布

在过去的四年中，Android自动化测试框架与工具经历了显著的发展，逐渐趋于成熟。自第一代自动化架构问世以来，已历经多次迭代，本文将重点探讨从第三代到第四代自动化测试框架的演变过程及其技术特点。 ... [详细]

蜡笔小新 2024-10-28 00:37:42
ip
黄聪：MySQL主从复制配置，实现高效读写分离

大型网站为应对高并发访问，不仅需要在前端实现分布式负载均衡，还需在数据业务和访问层采取有效措施。采用传统的数据结构已无法满足需求，通过配置MySQL主从复制，可实现高效的读写分离，显著提升系统性能和稳定性。 ... [详细]

蜡笔小新 2024-10-26 20:09:09
ip
Linux系统中的目录结构详解

在Linux系统中，目录结构遵循文件系统层次标准（FHS），确保了系统的组织性和可维护性。其中，`/bin`目录是FHS要求必须存在的目录之一，主要存放了在单用户维护模式下仍可执行的基本命令和工具。这些命令不仅对root用户可用，普通用户也能使用，以确保系统在最小化运行状态下仍能进行基本的操作和管理。 ... [详细]

蜡笔小新 2024-10-31 17:23:50
ip
在Linux系统中构建51单片机开发与编程环境——基于Makefile的详细指南

本文详细介绍了如何在Linux系统中搭建51单片机的开发与编程环境，重点讲解了使用Makefile进行项目管理的方法。首先，文章指导读者安装SDCC（Small Device C Compiler），这是一个专为小型设备设计的C语言编译器，适合用于51单片机的开发。随后，通过具体的实例演示了如何配置Makefile文件，以实现代码的自动化编译与链接过程，从而提高开发效率。此外，还提供了常见问题的解决方案及优化建议，帮助开发者快速上手并解决实际开发中可能遇到的技术难题。 ... [详细]

蜡笔小新 2024-10-31 11:43:45
netty
修复一个 Bug 竟耗时两天？真的有那么复杂吗？

修复一个 Bug 竟然耗费了两天时间？这背后究竟隐藏着怎样的复杂性？本文将深入探讨这个看似简单的 Bug 为何会如此棘手，从代码层面剖析问题根源，并分享解决过程中遇到的技术挑战和心得。 ... [详细]

蜡笔小新 2024-10-30 13:58:14
netty
HDFS基础知识与数据读写机制详解

本文详细介绍了HDFS的基础知识及其数据读写机制。首先，文章阐述了HDFS的架构，包括其核心组件及其角色和功能。特别地，对NameNode进行了深入解析，指出其主要负责在内存中存储元数据、目录结构以及文件块的映射关系，并通过持久化方案确保数据的可靠性和高可用性。此外，还探讨了DataNode的角色及其在数据存储和读取过程中的关键作用。 ... [详细]

蜡笔小新 2024-10-30 11:58:25
netty
IIS 7及7.5版本中应用程序池的最佳配置策略与实践

在IIS 7及7.5版本中，优化应用程序池的配置是提升Web站点性能的关键步骤。具体操作包括：首先定位到目标Web站点的应用程序池，然后通过“应用程序池”菜单找到对应的池，右键选择“高级设置”。在一般优化方案中，建议调整以下几个关键参数：1. **基本设置**： - **队列长度**：默认值为1000，可根据实际需求调整队列长度，以提高处理请求的能力。此外，还可以进一步优化其他参数，如处理器使用限制、回收策略等，以确保应用程序池的高效运行。这些优化措施有助于提升系统的稳定性和响应速度。 ... [详细]

蜡笔小新 2024-10-28 16:09:03
netty
搜索引擎提示“服务不稳定可能导致访问异常”的原因分析与解决策略

搜索引擎提示“服务不稳定可能导致访问异常”的原因分析与解决策略 ... [详细]

蜡笔小新 2024-10-27 21:34:16
shell
内网渗透技术详解：PTH、PTT与PTK在域控环境中的应用及猫盘内网穿透配置

本文深入探讨了内网渗透技术，特别是PTH、PTT与PTK在域控环境中的应用，并详细介绍了猫盘内网穿透的配置方法。通过这些技术，安全研究人员可以更有效地进行内网渗透测试，解决常见的渗透测试难题。此外，文章还提供了实用的配置示例和操作步骤，帮助读者更好地理解和应用这些技术。 ... [详细]

蜡笔小新 2024-10-26 10:56:21

霸道Q丫头

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章