热门标签 | HotTags
当前位置:  开发笔记 > 运维 > 正文

企业IT架构转型之道读书笔记

2015年阿里巴巴集团启动了中台战略,目标是要构建符合互联网大数据时代的,具有创新性、灵活性的“大中台、小前台”的机制,即作为前台的一线业

2015年阿里巴巴集团启动了中台战略,目标是要构建符合互联网大数据时代的,具有创新性、灵活性的“大中台、小前台”的机制,即作为前台的一线业务能更敏捷、更快速的响应瞬息万变的市场,而中台将集合整个集团的运营能力,技术能力,对各前台业务形成强有力的支撑。

那阿里集团为什么要建立一个“大中台、小前台”的架构呢?我们从阿里共享业务事业部的发展史说起。起初,阿里只有一个淘宝事业部,后来成立了天猫事业部,此时淘宝的技术团队同时支撑着这两个事业部。当时的淘宝和天猫的电商系统像我们很多大型企业的一样是分为两套独立的烟囱式体系,两套体系中都包含的有商品、交易、支付、评价、物流等功能。因为上述原因,阿里集团又成立了共享业务事业部,其成员主要来自之前的淘宝技术团队,同时将两套电商业务做了梳理和沉淀,将两个平台中公共的、通用的业务功能沉淀到共享事业部,避免重复建设和维护。后来上线的聚划算、1688、菜鸟物流等业务,均是基于这个“大中台,小前台”思路建设的。

上面说到的烟囱式的系统架构,相信IT行业的朋友们都有过亲身经历。我们来总结一下这个模式的弊端主要有哪些:

1.重复功能建设和维护带来的重复投资。重复投资不仅消耗的是人力,财力,更重要的是时间!在目前高速发展的互联网市场大环境下,商机是稍纵即逝的。

2.打通烟囱式系统间交互的集成和协作成本高昂。各大企业不得不借助ESB构建企业服务总线,打通各系统间的交互问题。当然,我们并非是要完全否定ESB系统,它的确是能在某种程度上实现系统间的互联互通,但这种“中心化”的服务架构缺点也有不少。“中心化”架构的所有服务调用者和服务提供者之间的交互都必须通过这个中心点,而这个中心点的能力是很难进行扩展的;也许有人会说我可以通过增加中心服务总线实例的节点数量,以达到线性的扩展平台能力。但这种做法其实过于理想化了,我来举个例子,说明一下这种模式的“雪崩”隐患。假设企业的服务总线集群数量是10台,每个负载量是80%。当访问峰值来临时,有可能因为某一个应用的不规范调用或者某个服务提供者出现了异常,导致了其中1台“罢工”。此时,服务路由压力就落在了剩下9台上,每台的平均负载量就变成了88%(个别服务器会更高),出现问题的概率就增加了。此时假设又有一台不堪重负也“罢工”了,就会出现后面的8台服务器在访问峰值时会瞬间被访问洪流冲垮,这就是“雪崩效应”。

3.不利于业务沉淀和持续发展。很多企业经常上演这样的一幕:一个系统上线运行5、6年后,原先的系统升级改造已经不能满足当下的业务发展诉求,需要整体升级,而这样的升级往往意味着对原有系统推到重建,之前多年的业务服务能力没有多少被沉淀下来,造成巨大的资产流失。

那“大中台,小前台”的共享服务体系到底有什么优点呢?说到这,我先来给大家举个例子吧。

大家都知道特种部队在现代战争中是个狠角色,特种部队强大的战斗力绝不仅仅是因为他们当中每个人都身体健壮、思维敏捷、百发百中,而是因为他们拥有一群强大的后盾来支持他们。特种部队虽然人数不多,但可以调动鹰眼、武装直升机、无人机、轰炸机、火箭、导弹、甚至是航空母舰。这就是为什么他们十几人可以打败对方几百人上千人的原因。还有个简单例子,一架飞机在天上飞行,通常机舱内只有1-2名飞行员,当飞机出现故障时,仅靠飞行员自己是无法快速、准确的定位问题、解决问题的。而地面指挥中心是有非常多的专家工程师,他们可以快速的帮助飞行员定位问题,并提出解决问题的方法。上述两个例子就是“大中台,小前台”的典型应用,其中的“大中台”就是把所有与势能相关的公线资源全部收纳,组成一个“火力中枢”。

我总结共享服务平台体系的优点主要有如下几点:

1、服务可重用。通过松耦合的服务带来业务的复用,不必为不同的前端业务开发各自对应的相同或者类似的服务。例如淘宝和天猫不必各自开都开发一个评价服务。

2、服务被滋养。作者在书中提出了一个观点:服务最不需要“稳定”。一个服务如果一味追求不变,那就是固步自封,就会逼着其他系统去建同样的“轮子”。服务需要被滋养,不停的滋养,只有滋养才能最初仅提供单薄业务功能的服务逐渐成长为企业最为宝贵的IT资产,而服务所需的滋养正是来自新的业务不断的接入。

3、服务助创新。大家都知道创新不是一件容易的事情,因为有些本质上的创新按照传统的开发模式是需要从分析、设计、开发,每一个环节都从0开始的,这样一来就会导致投入成本大,开发周期长,可能等你开发完了,商机已经被别人抢占了,公司领导可能考虑到上述因素就把你这个想法PASS掉了。而共享服务平台中的诸多服务是经过清晰的沉淀,可以通过重新编排、组合,快速的响应市场,达成创新,武侠小说里不常说天下武功,唯快不破嘛。

4、服务敢试错。说到试错,其实试错和创新有着千丝万缕的关系,有时甚至可以划等号,部分试错是会变成创新的。共享服务平台由于具备快速编排、组合服务的能力,可以以较小的成本投入来构建出一个新的前端业务,即使失败了,公司损失也很小。这在传统模式构建的系统中是几乎不可能达成的。

5、服务造BD。如今BIG DATE(大数据)成为近年来互联网和IT行业最为炙手可热的名词,很多企业甚至将互联网转型的期望完全寄托到大数据上,企业纷纷上马大数据项目。但多数项目在落地实施时却很难,主要有两个问题:一是数据分布广、数据模型和标准不统一。需要进行数据层的打通、权限的控制、格式的转换、以及数据的清洗和转换等一系列复杂的工作;二是缺少“数据科学家”。也就是说人件,项目只有强大的软件和硬件支持是远远不够的。更重要的是要有能基于对业务的理解提出对大数据平台需求的专家。此类专家需要懂数据采集、懂数学算法、懂分析、懂预测、懂市场应用…这样的专家对任何企业来说都是难寻的,就算你的公司财大气粗,可以把某某公司的专家挖过来,但他来到另外一个行业,另外一个公司,遇见另外一个全新的系统,由于对你公司的业务和技术熟悉程度较低,还是很难短时间带来效益。而共享服务体系能很好的帮助企业培育出懂业务的专家,这些人员在自身拥有不错的技术功底的前提下,加上对业务熟悉度的不断提升,使之才有希望成为能发挥大数据平台价值的“数据科学专家”。

结合当前我部门主营的系统,我觉得我们完全是可以借鉴这种中台战略思想来规划和建设我们的新一代系统的。

首先把当前系统中各个业务的前端应用与后端服务解耦。将各个功能中的服务能力进行梳理、并沉淀。例如我们财务系统的生成凭证功能,据我所知,现在CBE,SSP,电子发票等都有这个功能,为何不把它独立出来一个通用的服务供大家调用?将重复、类似的服务进行整合,同时在单个服务的完善和增强的过程中注意服务的通用性,就可以避免其他相似“双胞胎”服务的出现。

最后说一点,由于服务能力的集中管控,很大程度会促进我们一体化运维的能力,但在“大中台、小前台”的模式下,每一个服务都负责对N多个前端业务应用提供支持,这就要求运维在信息安全、备份、监控等方面要有更强的能力。


推荐阅读
  • GAMETECH腾讯云游戏行业技术沙龙成都站圆满落幕
    11月13日,由腾讯云主办、游戏茶馆协办的2020年首场GAME-TECH腾讯云游戏行业技术沙龙在成都圆满落幕。本次沙龙邀请了腾讯云游戏行业解决方案总监宋永周、腾讯云游戏行业高级解决方案架构师曾梓恩、腾讯云游戏行业高级产品架构师郑晓曦、腾讯云游戏行业高级解决方案架构师温球良和天美L1(王者荣耀)服务器技术副总监杨光,为参会同行们带来了干货满满的技术建议。本文介绍了腾讯云游戏云的优势和为不同游戏研运场景提供的服务。腾讯云在中国游戏云服务市场领跑,成为众多游戏开发者的合作伙伴。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • 开发笔记:计网局域网:NAT 是如何工作的?
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了计网-局域网:NAT是如何工作的?相关的知识,希望对你有一定的参考价值。 ... [详细]
  • flowable工作流 流程变量_信也科技工作流平台的技术实践
    1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下:目前OA流程引擎无法满足企业特定业务流程需求,且移动端体 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • CentOS 7部署KVM虚拟化环境之一架构介绍
    本文介绍了CentOS 7部署KVM虚拟化环境的架构,详细解释了虚拟化技术的概念和原理,包括全虚拟化和半虚拟化。同时介绍了虚拟机的概念和虚拟化软件的作用。 ... [详细]
  • 单点登录原理及实现方案详解
    本文详细介绍了单点登录的原理及实现方案,其中包括共享Session的方式,以及基于Redis的Session共享方案。同时,还分享了作者在应用环境中所遇到的问题和经验,希望对读者有所帮助。 ... [详细]
  • 企业数据应用挑战及元数据管理的重要性
    本文主要介绍了企业在日常经营管理过程中面临的数据应用挑战,包括数据找不到、数据读不懂、数据不可信等问题。针对这些挑战,通过元数据管理可以实现数据的可见、可懂、可用,帮助业务快速获取所需数据。文章提出了“灵魂”三问——元数据是什么、有什么用、又该怎么管,强调了元数据管理在企业数据治理中的基础和前提作用。 ... [详细]
author-avatar
开心123
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有