当前位置: 开发笔记 > 数据库 > 正文

初识单元化架构

作者：林志岳小行克元 | 来源：互联网 | 2023-06-14 18:37

在当今的互联网业内，很多大型互联网系统，比如淘宝、支付宝、网商银行等，都已经实现了单元化架构，并从中获益匪浅，

在当今的互联网业内&＃xff0c;很多大型互联网系统&＃xff0c;比如淘宝、支付宝、网商银行等&＃xff0c;都已经实现了单元化架构&＃xff0c;并从中获益匪浅&＃xff0c;更多企业正加入其中。为什么要做单元化&＃xff0c;单元化架构能给系统带来什么样的能力。本文将从架构发展历史的角度作为切入点来了解一下单元化架构的发展历史以及一些落地方案。

单点架构

支付请求要从客户端发送到服务端&＃xff0c;服务端最终再把结果返回客户端&＃xff0c;必然会有一次异地网络往返。应用进程内部会发生很多次业务逻辑运算&＃xff0c;耗时忽略不计。应用会访问多次数据库&＃xff0c;一笔支付请求按10次数据库访问算&＃xff08;对于支付系统来说并不算多&＃xff0c;一笔业务可能涉及到各种数据校验、数据修改&＃xff09;。耗时大头在无可避免的用户到机房物理距离上&＃xff0c;系统内部处理耗时很小。

在这里插入图片描述

单机房SOA架构

到了服务化时代&＃xff0c;一个好的RPC框架追求的是让远程服务调用像调本地方法一样简单。随着服务的拆分、业务的发展&＃xff0c;原本进程内部的调用变成了网络调用。由于应用都部署在同一个机房内&＃xff0c;业务整体网络耗时仍然在可接受范围内。开发人员一般也不会特别在意这个问题&＃xff0c;RPC服务被当成几乎无开销成本地使用&＃xff0c;应用的数量在逐渐膨胀。

在这里插入图片描述

同城多机房架构

服务化拆分&＃xff0c;解决了应用层的可扩展性问题。随着业务的发展&＃xff0c;物理机房逐渐成为系统容量的瓶颈。要突破单机房的容量限制&＃xff0c;最直观的解决办法就是再建新的机房&＃xff0c;机房之间通过专线连成同一个内部网络。

在这里插入图片描述
应用可以部署一部分节点到第二个机房&＃xff0c;数据库也可以将主备库交叉部署到不同的机房。这一阶段&＃xff0c;只是解决了机房容量不足的问题&＃xff0c;两个机房逻辑上仍是一个整体。日常会存在两部分跨机房调用&＃xff0c;积少成多也很可观&＃xff1a;

服务层逻辑上是无差别的应用节点&＃xff0c;每一次RPC调用都有一半的概率跨机房
每个特定数据库的主库只能位于一个机房&＃xff0c;所以宏观上也一定有一半的数据库访问是跨机房的

两地三中架构

“距离”是一个矛盾体&＃xff1a;距离越远&＃xff0c;同时受同一灾害&＃xff08;电力故障、网络故障、自然灾害等&＃xff09;影响的可能性就越低&＃xff0c;另一方面&＃xff0c;网络访问延时就越高。同城级距离&＃xff08;几十公里&＃xff09;是一个实践临界值&＃xff0c;前述的同城多机房架构&＃xff0c;整体耗时在可接受范围内&＃xff1b;而跨城访问耗时被复杂业务链路放大后&＃xff0c;将明显影响业务。

对容灾要求不高的系统&＃xff0c;做到同城多机房的程度就足够了&＃xff0c;可以省去不少设计复杂度。但是金融行业有异地容灾的要求&＃xff0c;就不得不面对距离带来的访问延迟问题。

在这里插入图片描述

“两地三中心”是一种在金融系统中广泛应用的跨数据中心扩展与跨地区容灾部署模式&＃xff0c;但也存在一些问题。异地灾备机房距离数据库主节点距离过远、访问耗时过长&＃xff0c;所以无法直接访问主库。异地备节点数据又不是强一致的&＃xff0c;所以无法直接提供在线服务。

在扩展能力上&＃xff0c;由于跨地区的备份中心不承载核心业务&＃xff0c;不能解决核心业务跨地区扩展的问题&＃xff1b;在成本上&＃xff0c;灾备系统仅在容灾时使用&＃xff0c;资源利用率低&＃xff0c;成本较高&＃xff1b;在容灾能力上&＃xff0c;由于灾备系统冷备等待&＃xff0c;容灾时可用性低&＃xff0c;切换风险较大。

什么是单元化架构

回头来看历史的架构演进历史&＃xff0c;我们不难发现从一开始的单点架构&＃xff0c;会遇到扩展性差&＃xff0c;维护困难的问题&＃xff1b;然后升级到到SOA架构&＃xff0c;容易遇到容量受限&＃xff0c;机房级单点的问题&＃xff1b;再升级到同城多机房架构以及两地三中心架构又会带来城市级单点的问题。

多地多机房部署&＃xff0c;是互联网系统的必然发展方向&＃xff0c;一个系统要走到这一步&＃xff0c;也就必然要解决上面提到的问题&＃xff1a;流量调配、数据拆分、延时等。业界有很多技术方案可以用来解决这些问题&＃xff0c;而承载这些方案的&＃xff0c;是一个部署架构。尽管可采用的部署架构不止一个&＃xff0c;但不论是纯理论研究&＃xff0c;还是一些先行系统的架构实践&＃xff0c;都把“单元化部署”推崇为最佳方案。

单元&＃xff08;即单元化应用服务产品层的部署单元&＃xff09;&＃xff0c;是指一个能完成所有业务操作的自包含集合&＃xff0c;在这个集合中包含了所有业务所需的所有服务&＃xff0c;以及分配给这个单元的数据。单元化架构就是将单元作为部署的基本单位&＃xff0c;在全站所有机房中部署多个单元&＃xff0c;每个机房内单元数目不固定&＃xff0c;任一单元均部署系统所需的全部应用&＃xff0c;数据则是全量数据按照某种维度划分后的一部分。

传统意义上的 SOA 化&＃xff08;服务化&＃xff09;架构&＃xff0c;服务是分层的&＃xff0c;每层的节点数量不尽相同&＃xff0c;上层调用下层时&＃xff0c;随机选择节点。
在这里插入图片描述
单元化架构下&＃xff0c;服务仍然是分层的&＃xff0c;不同的是每一层中的任意一个节点都属于且仅属于某一个单元&＃xff0c;上层调用下层时&＃xff0c;仅会选择本单元内的节点。

一个单元&＃xff0c;是一个五脏俱全的缩小版整站&＃xff0c;它是全能的&＃xff0c;因为部署了所有应用&＃xff1b;但它不是全量的&＃xff0c;因为只能操作一部分数据。能够单元化的系统&＃xff0c;很容易在多机房中部署&＃xff0c;因为可以轻松将多个单元部署在一个机房内&＃xff0c;而将另外几个单元部署在其他机房内。通过在业务入口处设置一个流量调配器&＃xff0c;可以调整业务流量在单元之间的比例。
在这里插入图片描述
从上述对单元的定义和特性描述中&＃xff0c;可以推导出单元化架构要求系统必须具备的一项能力&＃xff1a;数据分区&＃xff0c;实际上正是数据分区决定了各个单元可承担的业务流量比例。数据分区&＃xff08;shard&＃xff09;&＃xff0c;即是将全局数据按照某一个维度水平划分开来&＃xff0c;每个分区的数据内容互不重叠&＃xff0c;这也就是数据库水平拆分所做的事情。

仅把数据分区了还不够&＃xff0c;单元化的另外一个必要条件是&＃xff0c;全站所有业务数据分区所用的拆分维度和拆分规则都必须一样。若是以用户分区数据&＃xff0c;那交易、收单、微贷、支付、账务等全链路业务都应该基于用户维度拆分数据&＃xff0c;并且采用一样的规则拆分出同样的分区数。比如&＃xff0c;以用户 id 末 2 位作为标识&＃xff0c;将每个业务的全量数据都划分为 100 个分区&＃xff08;00-99&＃xff09;。

有了以上两个基础&＃xff0c;单元化才可能成为现实。把一个或几个数据分区&＃xff0c;部署在某个单元内&＃xff0c;这些数据分区占总量数据的比例&＃xff0c;就是这个单元能够承担的业务流量比例。执行数据分区时一个很重要的问题是分区维度的选择&＃xff0c;一个好的维度&＃xff0c;应该&＃xff1a;

粒度合适&＃xff1a;粒度过大&＃xff0c;会丧失流量调配的灵活性和精细度&＃xff1b;粒度过小&＃xff0c;会给数据的支撑资源&＃xff0c;访问逻辑带来负担。
足够平均&＃xff1a;按这个分区维度划分后&＃xff0c;每个部署单元的数据量应该是几乎一致的。

以用户为服务主体的系统&＃xff08;很多面向用户的系统&＃xff0c;比如支付宝&＃xff09;通常可以按用户维度对数据分区&＃xff0c;这是一个最佳实践。

推荐阅读

数据库
深入解析Hadoop的核心组件与工作原理

本文详细介绍了Hadoop的三大核心组件：分布式文件系统HDFS、资源管理器YARN和分布式计算框架MapReduce。通过分析这些组件的工作机制，帮助读者更好地理解Hadoop的架构及其在大数据处理中的应用。 ... [详细]

蜡笔小新 2024-12-19 17:17:51
数据库
阿里Java面试全解析：从技术面到HR面的详细攻略

本文作者分享了在阿里巴巴获得实习offer的经历，包括五轮面试的详细内容和经验总结。其中四轮为技术面试，一轮为HR面试，涵盖了大量的Java技术和项目实践经验。 ... [详细]

蜡笔小新 2024-12-23 11:32:02
数据库
Web与游戏开发的主要差异

本文探讨了Web开发与游戏开发之间的主要区别，旨在帮助开发者更好地理解两种开发领域的特性和需求。文章基于作者的实际经验和网络资料整理而成。 ... [详细]

蜡笔小新 2024-12-18 08:26:30
数据库
智慧城市建设现状及未来趋势

随着新基建政策的推进及‘十四五’规划的实施，我国正步入以5G、人工智能等先进技术引领的智慧经济新时代。规划强调加速数字化转型，促进数字政府建设，新基建政策亦倡导城市基础设施的全面数字化。本文探讨了智慧城市的发展背景、全球及国内进展、市场规模、架构设计，以及百度、阿里、腾讯、华为等领军企业在该领域的布局策略。 ... [详细]

蜡笔小新 2024-12-16 16:43:21
数据库
阿里云ecs怎么配置php环境,阿里云ecs配置选择

阿里云ecs怎么配置php环境,阿里云ecs配置选择 ... [详细]

蜡笔小新 2024-12-23 11:12:07
数据库
Netflix利用Druid实现高效实时数据分析

本文探讨了全球领先的在线娱乐公司Netflix如何通过采用Apache Druid，实现了高效的数据采集、处理和实时分析，从而显著提升了用户体验和业务决策的准确性。文章详细介绍了Netflix在系统架构、数据摄取、管理和查询方面的实践，并展示了Druid在大规模数据处理中的卓越性能。 ... [详细]

蜡笔小新 2024-12-23 11:10:01
数据库
PostgreSQL 最新动态 —— 2022年4月6日

了解 PostgreSQL 社区的最新进展和技术分享 ... [详细]

蜡笔小新 2024-12-21 14:54:10
数据库
备战BAT面试：掌握这些MySQL核心问题

本文深入探讨了MySQL中常见的面试问题，包括事务隔离级别、存储引擎选择、索引结构及优化等关键知识点。通过详细解析，帮助读者在面对BAT等大厂面试时更加从容。 ... [详细]

蜡笔小新 2024-12-20 18:58:01
数据库
创邻科技成功举办Graph+X生态合作伙伴大会，30余家行业领军企业共聚杭州

9月22日，创邻科技在杭州举办“Graph+X”生态合作伙伴大会，汇聚了超过30家行业头部企业的50多位企业家和技术领袖，共同探讨图技术的前沿应用与发展前景。 ... [详细]

蜡笔小新 2024-12-20 16:56:32
数据库
深入解析Spring Cloud微服务架构与分布式系统实战

本文详细介绍了Spring Cloud在微服务架构和分布式系统中的应用，结合实际案例和最新技术，帮助读者全面掌握微服务的实现与优化。 ... [详细]

蜡笔小新 2024-12-19 16:02:50
数据库
分布式架构概览与实践

本文探讨了现代分布式架构的多样性，包括高并发、多活数据中心、容器化、微服务、高可用性和弹性架构等，并介绍了与这些架构相关的重要管理技术，如DevOps、应用监控和自动化运维。文章还深入分析了分布式系统的核心概念、主要用途及类型，同时对比了单体应用与分布式服务化的优缺点。 ... [详细]

蜡笔小新 2024-12-19 15:11:28
数据库
为何我选择了华为云GaussDB数据库

本文分享了作者选择华为云GaussDB数据库的理由，详细介绍了GaussDB(for MySQL)的技术特性和优势，以及它在金融和互联网行业的应用场景。 ... [详细]

蜡笔小新 2024-12-19 10:59:22
数据库
2019年前端技术趋势及职业发展路径

本文探讨了2019年前端技术的发展趋势，包括工具化、配置化和泛前端化等方面，并提供了详细的学习路线和职业规划建议。 ... [详细]

蜡笔小新 2024-12-19 10:19:35
数据库
Twisted网络编程必备（1）注：测试版本Twisted10.1.0.winxp32py2.6，对于原代码略有修改

转自：http:www.yybug.comread-htm-tid-15324.html为什么使用Twisted? 如果你并不准备使用Twisted，你可能有很多异议。为什么使用T ... [详细]

蜡笔小新 2024-12-13 14:57:51
数据库
FreeBSD的历史演进

FreeBSD作为Berkeley Software Distribution (BSD)的一个关键分支，其发展历程深刻影响了现代操作系统的设计。本文将探讨FreeBSD从早期版本到最新版本的技术进步及其对计算行业的贡献。 ... [详细]

蜡笔小新 2024-12-10 19:12:36

林志岳小行克元

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章