什么是Serverless架构？

作者：odile微笑头 | 来源：互联网 | 2023-05-17 15:07

什么是,ser

随着时间的推移，Serverless 架构变得越来越火热，凭借着极致弹性、按量付费、低成本运维等特性，在很多领域发挥着越来越重要的作用；机器学习领域在近些年也非常火热，并在越来越多的行业中得到应用。实际上，机器学习项目中一直存在两大难题：

资源占用率高、利用率低，尤其在流量波峰和波谷差值较大的项目中，资源浪费更为显著；
部署、更新、维护复杂度高；

而 Serverless 具有极致弹性、按量付费、低成本运维等特性，若将 Serverless 架构应用在机器学习项目中，在保证机器学习项目性能的同时，降低成本，又能提高资源利用率，是非常值得研究和探索的课题。基于此，由阿里云官方出品，来自阿里云、蚂蚁集团的 4 位专家刘宇、田初东、卢萌凯、王仁达（排名不分先后）系统梳理阿里在 Serverless 架构下的 AI 经验，联袂推出新书**《Serverless 架构下的 AI 应用开发：入门、实战与性能优化》 **。

新书将在免费在 Serverless （serverlessdevs）公众号连载，欢迎大家订阅关注！

前言

本书是一本关于 Serverless 架构下机器学习实战的技术书，通过对 Serverless 架构的基础介绍、项目开发经验总结，以及常见的机器学习算法、模型、框架的学习，对将机器学习项目应用到 Serverless 架构、不同机器学习项目与 Serverless 架构结合以及基于 Serverless 架构进行机器学习应用开发等内容进行了探索。

我们希望通过简单明了的语言、真实的案例，以及开放的源代码，为读者介绍 Serverless 架构与机器学习相关的基础知识。希望读者可以通过本书真正理解 Serverless 架构与机器学习结合的重要价值，并能顺利在 Serverless 架构下开发、上线机器学习项目，从而更加直接地获得云计算带来的技术红利。

本书不仅有基础理论知识，还有大量的经验分享，以及对最新技术点的实践应用，包括但不限于 Serverless 架构下 GPU 实例的上手、多维度的冷启动优化方案、Serverless 架构多模调试能力等。

我们希望读者通过对本书的学习，可以对 Serverless 架构有一个更加全面、直观的了解，对 Serverless 架构下的机器学习有更加深入的认识。同时，希望通过本书的抛砖引玉，帮助读者将机器学习项目在 Serverless 架构下落地，获得云计算发展的技术红利。

**第 1 章：**介绍 Serverless 架构基础，包括 Serverless 架构的发展、优势、面临的挑战等； **第 2 章：**从 Serverless 架构的开发流程、与 ServerFul 开发流程的对比、传统框架迁移等多个方面，对 Serverless 架构下的应用开发进行相关介绍； **第 3 章：**介绍机器学习相关的探索，包括对支持向量机、神经网络等算法和模型的学习与研究； **第 4 章：**介绍常见的机器学习框架以及在实战项目中的应用，便于读者了解常见的机器学习框架，以及部署到 Serverless 架构的方案等； **第 5 章：**介绍几个机器学习应用较为广泛的领域的项目实战，包括图像识别领域、情感分析领域以及对模型升级迭代相关领域的探索，涉及容器镜像、预留实例、GPU 实例等诸多 Serverless 架构的新功能和特性； **第 6 章和第 7 章：**介绍两个完整的 Serverless 架构与 AI 结合的案例，从项目背景开始到相关模块的设计、项目的开发与部署，通过完整的流程讲解 Serverless 架构下机器学习项目的上手、开发、维护全过程； **第 8 章：**针对 Serverless 架构进行相关开发经验的分享以及 Serverless 应用调优方法的总结，包括 Serverless 架构下的冷启动优化方案、开发注意事项等内容。

第一章初识 Serverless 架构

本章通过对 Serverless 架构概念的探索，对 Serverless 架构的优势与价值、挑战与困境进行分析，以及 Serverless 架构应用场景的分享，为读者介绍 Serverless 架构的基础内容。通过本章的学习，读者将对 Serverless 架构的理论基础有一定的了解和认识。

Serverless 架构的概念

随着云服务的发展，计算资源被高度抽象化，从物理机到云服务器，再到容器服务，计算资源逐渐细腻化。

2012 年，Iron.io 的副总裁 Ken Form 在 “Why The Future of Software and Apps is Serverless” 一文中首次提出了无服务器的概念，并指出 “即使云计算已经逐渐兴起，但是大家仍然在围绕着服务器转。不过，这不会持续太久，云应用正在朝着无服务器方向发展，这将对应用程序的创建和分发产生重大影响”。

2019 年，UC Berkeley 发表论文 “Cloud Programming Simplified: A Berkeley View on Serverless Computing”。在文章中，作者犀利断言 “新的 BaaS 存储服务会被发明，以扩展在 Serverless 计算上能够运行更加适配的应用程序类型。这样的存储能够与本地块存储的性能相匹配，而且具有临时和持久可供选择特性。基于 Serverless 计算的价格将低于 ServerFul 计算，至少不会高于 ServerFul 计算。Serverless 计算一旦取得技术上的突破，将会导致 ServerFul 服务的下滑。Serverless 将会成为云时代默认的计算范式，将会取代 ServerFul 计算，这也意味着服务器—客户端模式的终结”。

Serverless 架构从 2012 年首次走进大众视野到 2019 年成为 UC Berkeley 对云计算领域犀利断言的主角，完成了从一个 “新的观点” 向 “万众瞩目的架构” 转身。在这 7 年时间里，Serverless 架构从鲜为人知到被商业化应用，再到头部云厂商纷纷布局 Serverless 架构作为云计算战略，逐渐成为人尽皆知的新技术范式。

当然，在这 7 年间，Serverless 不仅仅在技术架构方面逐渐升级和完善，概念也越来越明确，发展方向也逐渐清晰、明朗。关于 Serverless 的定义，Martin Fowler 在 “Serverless Architectures” 一文中指出 Serverless 实际上是 BaaS 与 FaaS 的组合。

这个简单明了的定义为 Serverless 架构组成结构奠定了基础。如图 1-1 所示，Martin Fowler 认为，在 Serverless 架构中，应用的一部分服务器端逻辑依然由开发者完成，但是和传统架构不同，它运行在一个无状态的计算容器中，由事件驱动、生命周期很短（甚至只有一次调用）、完全由第三方管理，这种情况被称为 Functions as a Service（FaaS）。

除此之外，Serverless 架构还要有部分依赖第三方（云端）应用或服务来管理服务器端逻辑和状态的应用，这些应用通常是富客户端应用（单页应用或者移动端 App），建立在云服务生态之上，包括数据库（Parse、Firebase）、账号系统（Auth0、AWS Cognito）等，而这些服务最早被称为 Backend as a Service（BaaS）。

1-1 Serverless 架构组成结构

同样认为 Serverless 是 FaaS 与 BaaS 结合而成的 CNCF 在 CNCF WG-Serverless Whitepaper v1.0 中对 Serverless 架构的定义进行了进一步完善：Serverless 是指构建和运行不需要服务器管理的应用程序概念；它描述了一种更细粒度的部署模型，其中将应用程序打包为一个或多个功能模块，上传到平台，然后被执行、扩展和计费，以响应当时确切的需求。

与此同时，2019 年 UC Berkeley 的文章 “Cloud Programming Simplified: A Berkeley View on Serverless Computing” 中同样从 Serverless 架构特性角度，对什么是 Serverless 进行了补充描述和定义：简单地说，Serverless = FaaS + BaaS，必须具备弹性伸缩和按量付费的特点。

在中国信息通信研究院（以下简称“信通院”）云原生产业联盟所发布的《云原生发展白皮书（2020 年）》中对 Serverless 的概念也有相关的描述：无服务器（即 Serverless）是一种架构理念，其核心思想是将提供服务资源的基础设施抽象成各种服务，以 API 接口的方式供给用户按需调用，真正做到按需伸缩、按使用收费。

这种架构体系消除了对传统的海量持续在线服务器组件的需求，降低了开发和运维的复杂度，降低运营成本并缩短了业务系统的交付周期，使得用户能够专注在价值密度更高的业务逻辑开发上。

至此，Serverless 架构从结构、行为以及特性方面的定义可以总结为图 1-2。

1-2 从不同角度对 Serverless 架构进行定义

Serverless 架构的特点

众所周知，事物具有两面性。时至今日，云计算的发展已经取得了巨大的进步，但是作为云计算最新产物的 Serverless 架构，在巨大的优势背后，仍然面临着不可忽略的挑战。 优势与价值

亚马逊 AWS 首席云计算技术顾问费良宏曾说：今天大多数公司在开发应用程序并将其部署在服务器时，无论选择公有云还是私有的数据中心，都需要提前了解究竟需要多少台服务器、多大容量的存储和数据库的功能等，并需要部署、运行应用程序和依赖的软件到基础设施之上。

假设不想在这些细节上花费精力，是否有一种简单的架构能够满足这种需求？时至今日，伴随 Serverless 架构逐渐 “走进寻常百姓家”，答案已经很明显了。

在项目上线过程中，我们一般需要申请主机资源，这时候需花很多时间和精力去评估峰值最大开销，即使给某些服务按照最大消耗申请资源，也要有专人在不同时间段进行资源的扩容或缩容，以达到保障业务稳定与节约成本的平衡。

对于一些服务来说，有时候申请的资源还需要在最大开销基础上评估，即使可能出现很多流量波谷，并产生大量的资源浪费，也不得不这样做，比如数据库这种很难扩展的应用就是 “尽管浪费资源也比峰值到来时应用程序因为资源不足而无法服务好”。

正如费良宏所说，在 Serverless 架构下，这个问题得到了比较好的解决，不用计划到底需要使用多少资源，而是根据实际需要来请求资源，根据使用时间来付费，根据每次申请的计算资源来付费，且让计费的粒度更小，更有利于降低资源的开销。

Serverless 架构具有 6 个潜在优势：

按需提供无限计算资源。
消除云用户的前期承诺。
根据需要在短期内支付使用计算资源的能力。
大规模降低成本。
通过资源虚拟化简化操作并提高利用率。
通过复用来自不同组织的工作负载来提高硬件利用率。

相对于传统架构，Serverless 架构确实具备业务聚焦、弹性伸缩、按量付费等优势。这些优势往往是开发者在技术选型时的重要参考。

1.业务聚焦

所谓的业务聚焦，指的是让开发者将更多精力放在自身的业务逻辑之上，而不需要再花费更多精力关注底层资源。

众所周知，单体架构时代应用比较简单，物理服务器的资源足以支撑业务的部署。随着业务的复杂程度飙升，功能模块复杂且庞大，单体架构严重阻塞了开发部署的效率。于是，业务功能解耦，可并行开发和部署单独模块的微服务架构逐渐流行开来。业务的精细化管理不可避免地推动着基础资源利用率的提升。

如图 1-3 所示，虚拟化技术不断被完善和广泛运用之后，打通了物理资源隔阂，减轻了用户管理基础架构的负担。容器和 PaaS 平台则进一步抽象，提供了应用的依赖服务、运行环境和底层所需的计算资源。这使得应用的开发、部署和运维的整体效率再度提升。Serverless 架构则将计算抽象得更加彻底，将应用架构堆栈中的各类资源的管理全部委托给平台，免去基础设施的运维，使用户能够聚焦高价值的业务领域。

1-3 虚拟机、容器、Serverless 架构演进简图

2.弹性伸缩

所谓的弹性伸缩，指的是可以根据业务流量波动，自动进行资源的分配和销毁，以最大限度地实现平衡稳定、高性能以及提高资源利用率。

众所周知，从 IaaS 到 PaaS 再到 SaaS 的过程中，去服务器化越来越明显。到了Serverless架构，去服务器化已经上升到一个新的高度。相对于 ServerFul 而言，Serverless 对业务用户强调的是 Noserve r的心智。

所谓的 Noserver，不是说脱离了服务器或者说不需要服务器，而是去除有关对服务器运行状态的关心和担心，这也就意味着原先需要对服务器进行扩容和缩容的操作也都不再需要业务人员关注了，都交给云商场进行管理。如图 1-4所示，折线为一个网站在某天的流量走势。

1-4 传统云主机架构与Serverless架构弹性模式下流量与负载对比示意图

图 1-4a 的分析如下：

技术人员需要对网站资源用量进行评估，评估结果是这个网站最大的流量峰值为800PV/小时，所以购买了对应的云服务器。
但是在当天的10时，运维人员发现网站流量突然增加，逐渐临近800PV/小时。此时，运维人员在线上购买了一台新的云主机并进行了环境的配置，最后在Master机器上添加了对应的策略，度过了10～15时的流量峰值。
过了15时，运维人员发现流量恢复正常，对后加入策略的云主机进行停止，并将额外的资源释放。
到了18时，再次发现过载流量的到来……

从图 1-4b 可以清晰地看到，负载能力始终和流量是匹配的（当然，这个图本身存在一定问题，即真实的负载能力在一定程度上可能略高于当前流量），即并不需要像传统云主机架构那样在技术人员的干预下应对流量的波峰和波谷，其弹性能力（包括扩容和缩容）均由云厂商提供。

通过对图 1-4 的分析不难看出，Serverless 架构所具备的弹性能力在一定程度上来源于厂商的运维技术支持。

Serverless 架构所主张的 “把更专业的事情交给更专业的人，让开发者更加专注自身的业务逻辑即可”，在弹性模式上也是一个非常直观的体现。

3.按量付费

所谓的按量付费，指的是 Serverless 架构支持用户按照实际的资源使用量进行付费，可以最大限度提高用户侧资源使用效率，降低成本。

在传统云主机架构下，服务器一旦被购买和运行，就在持续消耗资源，并且持续产生费用。尽管每台服务器的可用资源是有限的，通常也是固定的，但是服务器每时每刻的负载是不同的，资源使用率也是不同的，这就导致传统云主机架构下，会比较明显地产生一定的资源浪费。

一般情况下，白天资源利用率相对较高，资源浪费少一些；夜间资源利用率较低，资源浪费会相对高一些。按照《福布斯》杂志的统计，商业和企业数据中心的典型服务器仅提供 5%～15% 平均最大处理能力的输出，这无疑证明了刚刚对传统云主机架构的资源使用率和浪费程度分析的正确性。

Serverless 架构则可以让用户委托服务提供商管理服务器、数据库和应用程序，甚至逻辑。这种做法一方面减少了用户自己维护的麻烦，另一方面用户可以根据自己实际使用的粒度进行成本的支付。

对于服务商而言，它们可以将更多的闲置资源进行处理。这从成本、“绿色” 计算角度来说，都是非常不错的。 1-5 传统云主机架构与 Serverless 架构弹性模式下流量与费用支出对比示意图

如图 1-5 所示，折线为一个网站在某天的流量走势图。

图 1-5a 是传统云主机架构下流量与费用支出示意图。通常，业务在上线之前是需要进行资源使用量评估的。工作人员在对该网站的资源使用量评估之后，购买了一台可以承受每小时最大 1300PV 的服务器。

在一整天内，这台服务器所提供的算力总量为阴影面积，所需要支出的费用也是阴影面积对应算力的费用。但是很明显可以看出，真正有效的资源使用与费用支出仅仅是流量曲线下的面积，而流量曲线上方的阴影部分则为资源损耗与额外的支出部分。

图 1-5b 是 Serverless 架构弹性模式下费用支出示意图。可以清晰地看到，费用支出和流量基本是正比关系，即当流量处于一个较低数值时，对应的资源使用量是相对较少的，对应的费用支出也是相对较少的；当流量处于一个较高数值时，资源使用量和费用支出为正相关增长。

在整个过程中，可以清晰地看出 Serverless 架构并未像传统云主机架构样产生明显的资源浪费与额外的成本支出。

通过对图 1-5 的分析，不难看出 Serverless 架构所具备的弹性伸缩能力与按量付费模型进行有机结合，可以最大限度地避免资源浪费、降低业务成本。

4.其他优势

除前面所说的业务聚焦、弹性伸缩、按量付费等优势，Serverless 架构还具备其他优势。

缩短业务创新周期：由于 Serverless 架构在一定程度上是 “云厂商努力做更多，让开发者更关注自身的业务” 的模式，因此我们可以认为开发者将会付出更少的时间、精力在 ServerFul 架构所需要关注的 OS 层面、云主机层面、系统环境层面，更专注自身的业务逻辑，这带来的直接效果就是提高项目的上线效率、降低业务的创新周期、提高研发交付速度。
系统安全性更高：虽然 Serverless 架构在一定程度上有一种 “黑盒” 即视感，但正因为如此，Serverless 架构往往不会提供登录实例的功能，也不会对外暴露系统的细节。同时，操作系统等层面的维护也都交给云厂商，这意味着在一定程度上 Serverless 架构是更加安全的：一方面表现在 Serverless 架构只对外暴露预定的，且需要暴露的服务和接口，相对云主机在一定程度上免去了被暴力破解的风险；另一方面表现在云厂商有更加专业的安全团队和服务器运维团队来帮助开发者保障整体的业务安全与服务稳定。
更平稳的业务变更：Serverless 架构是由云服务商提供的一种天然分布式架构，同时又因为 Noserver 的特性免除了开发者对服务器运行状态的关心和担心，所以在 Serverless 架构下，开发者对业务代码、配置的变更操作非常简单，只需要通过云厂商所提供的工具进行更改即可，待新的业务逻辑平稳生效后则不再需要开发者关注。所以，Serverless 架构在业务的平滑升级、变更、敏捷开发、功能迭代、灰度发布等多个层面有着极大的优势。

当然，即使上面已经举例说明了很多 Serverless 架构的优势，我们仍然没办法枚举出其全部的优势和价值。但不可否认的是，Serverless 架构正在被更多人关注，也正在被更多团队和个人所接受和应用，其价值已快速突显出来。

更多内容关注 Serverless 微信公众号（ID：serverlessdevs），汇集 Serverless 技术最全内容，定期举办 Serverless 活动、直播，用户最佳实践。

推荐阅读

io
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
io
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
io
云原生应用最佳开发实践之十二原则（12factor）

目录简介一、基准代码二、依赖三、配置四、后端配置五、构建、发布、运行六、进程七、端口绑定八、并发九、易处理十、开发与线上环境等价十一、日志十二、进程管理当 ... [详细]

蜡笔小新 2023-12-09 09:35:02
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
大数据就业前景及人才需求

近年来，大数据成为互联网世界的新宠儿，被列入阿里巴巴、谷歌等公司的战略规划中，也在政府报告中频繁提及。据《大数据人才报告》显示，目前全国大数据人才仅46万，未来3-5年将出现高达150万的人才缺口。根据领英报告，数据剖析人才供应指数最低，且跳槽速度最快。中国商业结合会数据剖析专业委员会统计显示，未来中国基础性数据剖析人才缺口将高达1400万。目前BAT企业中，60%以上的招聘职位都是针对大数据人才的。 ... [详细]

蜡笔小新 2023-12-14 16:25:20
io
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
int
C#生成随机数的三种方法及其问题分析

本文介绍了C#中生成随机数的三种方法，并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法，但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数，进一步突显了这个问题。文章指出，随机数生成在任何编程语言中都是必备的功能，但Random类生成的随机数并不可靠。最后，提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]

蜡笔小新 2023-12-14 14:15:30
jar
flowable工作流流程变量_信也科技工作流平台的技术实践

1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下：目前OA流程引擎无法满足企业特定业务流程需求，且移动端体 ... [详细]

蜡笔小新 2023-12-13 10:17:15
jar
词袋模型的通俗介绍

词,袋, ... [详细]

蜡笔小新 2023-12-12 08:20:03
io
OpenStack及其构成简介

本文介绍了OpenStack的逻辑概念以及其构成简介，包括了软件开源项目、基础设施资源管理平台、三大核心组件等内容。同时还介绍了Horizon(UI模块)等相关信息。 ... [详细]

蜡笔小新 2023-12-12 06:47:38
io
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
io
SpringBoot整合SpringSecurity+JWT实现单点登录

SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-12-11 08:21:41
int
javascript和java的关系,JavaScript和java的关系

Java和JavaScript是什么关系？java跟javaScript都是编程语言，只是java跟javaScript没有什么太大关系，一个是脚本语言（前端语言），一个是面向对象 ... [详细]

蜡笔小新 2023-12-11 04:03:31
io
如何在Azure应用服务实例上获取.NetCore 3.0+的支持？

本文介绍了如何在Azure应用服务实例上获取.NetCore 3.0+的支持。作者分享了自己在将代码升级为使用.NET Core 3.0时遇到的问题，并提供了解决方法。文章还介绍了在部署过程中使用Kudu构建的方法，并指出了可能出现的错误。此外，还介绍了开发者应用服务计划和免费产品应用服务计划在不同地区的运行情况。最后，文章指出了当前的.NET SDK不支持目标为.NET Core 3.0的问题，并提供了解决方案。 ... [详细]

蜡笔小新 2023-12-10 13:54:46
io
Sleuth+zipkin链路追踪SpringCloud微服务的解决方案

在庞大的微服务群中，随着业务扩展，微服务个数增多，系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来，实现请求链路跟踪。通过Feign调用和Request传递TraceId，将整个调用链路的服务日志归组合并，提供定位和追踪的功能。 ... [详细]

蜡笔小新 2023-12-09 19:14:50

odile微笑头

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章