热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

老板要建中台,这些脏活儿累活儿,都得程序员来干?

1一次聊天最近和一个搞开发的朋友聊天,他说他们公司要做数字化转型,成为一个数据驱动型的企业,还新设了一个什么首席数据官(CDO)。我附和说

1

一次聊天

最近和一个搞开发的朋友聊天,他说他们公司要做数字化转型,成为一个数据驱动型的企业,还新设了一个什么首席数据官(CDO)。

我附和说:“这很好啊,数据驱动是未来的趋势,人家福布斯统计过了,85%的企业都希望转型为数据驱动型,更好更快地决策,你们公司早就该这么干了。”

他反问道:“我们CDO也是你这个调调,好什么好啊,数据驱动,数据在哪里儿?”

我说:“你们有ERP,有CRM,有关系数据库、Kafka、Hadoop、数据仓库、S3吗,这么多数据,还不够你用的?”

他说:“就是数据太多、太杂,本地有,云端有,一团乱麻,数据资产没有梳理过,数据没有治理过,怎么做数据驱动啊?

比方说,公司想知道下一个项目应该往哪个产品投资,往往需要财务数据,产品销售数据,社交评论数据,用户数据等等,把这些数据给整合起来才能做决定。

但这些数据存在于不同的系统中,需要ETL(提取、转换、加载),有些数据(如用户数据)还需要审批以后才能使用,处理起来很麻烦。

这仅仅是一个需求而已,如果需求很多的话,即使把IT部门累个半死也满足不了业务方的需求。”

2

数据治理

我心说他真是遇到了业界的一个大问题。 

想实现数据驱动,必须得把数据治理做好。

数据治理需要梳理数字资产,以安全的方式来使用数据,从而获得更好的业务目标。

我们需要把来自不同部门,不同系统的底层数据做封装,形成公共的数据和服务,让前台的业务部门去使用。

这么说还有点抽象,不好理解,朋友曾给我说过一个做菜的例子,形象又有趣,给大家分享一下。

你厨房里(IT部门)有油、盐、酱、醋、生抽等各种调料(它们就相当于各个部门的数据),现在业务部门想吃糖醋里脊,你就需要调制糖醋汁出来,调制过程比较麻烦,比例不对味道就变了。 

所以你想了招数,事先按比例调出一大桶糖醋汁,以后业务部门想做糖醋里脊了,直接给它倒点儿就行,很方便。

其他业务部门想吃糖醋鱼、糖醋排骨,糖醋xxxx,也都可以用预先做好的糖醋汁。

这个糖醋汁就是数据治理中一个可以共享的、公共的数据产品。

除了糖醋汁,还有高汤、各种浇头、卤汁等各种“数据产品”。最近几年流行一个词“数据中台”,其实也就是这个意思。

我朋友公司遇到的问题就是他们只有调料,没有糖醋汁、高汤、卤汁......

3

谁来牵头?

大家可能要问了,那把这些东西做出来不就行了? 

这就是问题的关键所在,企业业务千变万化,各有不同,每家都需要定义属于自己的、独特的公共数据,形成数据中台,但是谁来牵头做这件事儿呢?

IT部门? 他们只负责最底层的存储和计算,管不了那么多业务。

业务部门?他们也主要关注自己的一亩三分地,给IT部门提需求,很难去定义全公司级别的公共数据。

公司可以搞一个专门的机构来做这件事,从全局出发,定义数据治理的规范、标准、策略..... 也就是说,事先把糖醋汁、高汤、卤汁等所有的公共数据统统都定义出来。

这么做最有成效,但是可以想象得到,当你做一件不能很快看到价值的事情的时候,阻力非常大,想要得到别的部门的配合都很难。导致落地成本非常大,周期也非常长。

朋友说这些都是脏活累活,他可不想干。

我给朋友说:“你们别费劲了,干脆请外边的咨询公司来做吧。”

他笑了笑:“咨询服务动辄百万起,我们老板这么抠,恐怕不会去请咨询,关键是咨询公司也不一定能做出很好的东西......”

所以有人说,数据治理治不好是常态,治好了才是奇迹。

4

敏捷破局

其实,退一步海阔天空,暂时放弃那些大而全的规范、标准、策略,从实际问题入手,数据治理还是有可能从一个较小的范围启动起来的。

换句话说,如果需要糖醋汁,我们先把糖醋汁给调出来,先别管其他的什么高汤、卤汁之类。

市场部门需要销售部门的每周的数据汇总,那就先把这个数据给提取出来,形成API,让市场部门去用。

这样就在市场部门(数据消费者)和销售部门(数据生产者)之间,建立了一条线,并且有了一个公共的数据“每周销售汇总”。

这个数据就像一个手机充电头,不但市场部门可以“充电”,别的部门将来也可以用。随着时间推移,这样的充电头就会越来越多,就会形成一个小型充电站,数据治理也就基本完成了。

这是一种需求驱动的敏捷方法,不过,敏捷的方式需要敏捷的工具。

这个工具应该支持数据生成者迅速地把自家数据形成一个Schema,定义好有哪些字段,字段的具体含义。并且定义好哪些组织,什么人可以访问,消费者看到以后,就可以直接使用。

我知道亚马逊云科技最近就推出了这样一个工具,叫做Amazon DataZone,它的架构是这样的:

a44fee45d6d93d5c50c1079791aad968.png

使用Amazon DataZone,可以轻松地创建起公司的组织结构。

bf58ceb723255df419cc0ddd88527ed3.png

前面说过,公司的数据可能来源于数据仓库、数据湖、流数据、关系数据库、第三方系统等多个地方,亚马逊云科技提供了一个叫Amazon Glue工具,可以轻松地发现、集成来自多个数据源的数据,并且可以对数据进行提取、转换、加载(ETL)。

用户可以按照自己的需求,把各个数据源的数据进行编目,形成数据目录(Data Catalog)。

e11d26cc53a79c0363d75281d2e1c9c1.jpeg

有了数据目录和组织结构做基础,每个部门就可以根据需要来创建属于自己的业务术语,元数据,从而建立自己的数据资产。

53ec9b5b036ddeaf850d3616b4eb6590.png

数据资产一旦发布出去(当然,需要设置好权限),别人就可以查询了,Amazon DataZone 专门提供了一个门户(Portal)对数据资产进行查询,非常方便。

8256a34b60d19c76ba963ee4f6cf1417.jpeg

cb8cd16ad8d27ef0c70e3e0d8828bff0.png

利用这种方式,可以迅速地对接生产者和消费者,把数据资产创建起来,马上投入使用,从而实现快速响应业务需求,应对市场变化。

沉淀下来的数据资产还可以继续被别的消费者使用,随着这样的数据资产越来越多,大家都看到了业务价值,数据治理就会走上正轨。

如果你的公司有数据治理的需求,不妨考虑一下这样敏捷的方式,利用Amazon DataZone这样敏捷的工具,先小范围启动,慢慢积累,最终修成正果,完成转型,成为真正的数据驱动的企业。

对云计算感兴趣的同学,亚马逊云科技re:Invent是必须要关注,而且要重点关注的活动,因为这里会发布的业界最前沿的新产品、新观点、新技术,每次都会突破云计算的边界,re:Invent活动非常多,12月20号,亚马逊云科技会在线上举办INNOVATE大会,对2022亚马逊云科技 re:Invent做深度解读,详解端到端的数据战略及未来基础架构。

这相当于一个精华版了,几个小时就可以领略最前沿的云计算技术,不容错过啊!

扫描下方二维码或者点击阅读原文即可参与!

b80ec99fe0b6c17caa0b199f36fda408.png


推荐阅读
  • 从高级程序员到CTO的4次能力跃迁!如何选择适合的技术负责人?
    本文讲解了从高级程序员到CTO的4次能力跃迁,以及如何选择适合的技术负责人。在初创期、发展期、成熟期的每个阶段,创业公司需要不同级别的技术负责人来实现复杂功能、解决技术难题、提高交付效率和质量。高级程序员的职责是实现复杂功能、编写核心代码、处理线上bug、解决技术难题。而技术经理则需要提高交付效率和质量。 ... [详细]
  • 本文详细介绍了云服务器API接口的概念和作用,以及如何使用API接口管理云上资源和开发应用程序。通过创建实例API、调整实例配置API、关闭实例API和退还实例API等功能,可以实现云服务器的创建、配置修改和销毁等操作。对于想要学习云服务器API接口的人来说,本文提供了详细的入门指南和使用方法。如果想进一步了解相关知识或阅读更多相关文章,请关注编程笔记行业资讯频道。 ... [详细]
  • 面试经验分享:华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试
    最近有朋友去华为面试,面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败,因为缺乏基础知识。面试问题涉及 ... [详细]
  • AstridDAO 专访:波卡稳定币黑马 BAI
    加入Pol ... [详细]
  • 我一直都有记录信息的习惯,不知是从什么时候开始,大约是在工作后不久。如今还真有点庆幸从那时开始记了点东西,当然是电子版的,写 ... [详细]
  • 智慧博物馆信息系统建设方案
    3.信息化系统建设3.1博物馆RFID藏品管理系统3.1.1系统概述博物馆藏品保管是一项十分复杂又繁琐的工作。从事保管工作除了经常、及时地进行藏品的登记、分类、编目、保养和修 ... [详细]
  • 《Spark核心技术与高级应用》——1.2节Spark的重要扩展
    本节书摘来自华章社区《Spark核心技术与高级应用》一书中的第1章,第1.2节Spark的重要扩展,作者于俊向海代其锋马海平,更多章节内容可以访问云栖社区“华章社区”公众号查看1. ... [详细]
  • 虚拟化_深度:资源虚拟化
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了深度:资源虚拟化相关的知识,希望对你有一定的参考价值。 ... [详细]
  • SpringBoot uri统一权限管理的实现方法及步骤详解
    本文详细介绍了SpringBoot中实现uri统一权限管理的方法,包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性,实现对系统任意接口的权限拦截验证。 ... [详细]
  • 本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 有没有一种方法可以在不继承UIAlertController的子类或不涉及UIAlertActions的情况下 ... [详细]
  • 如何在服务器主机上实现文件共享的方法和工具
    本文介绍了在服务器主机上实现文件共享的方法和工具,包括Linux主机和Windows主机的文件传输方式,Web运维和FTP/SFTP客户端运维两种方式,以及使用WinSCP工具将文件上传至Linux云服务器的操作方法。此外,还介绍了在迁移过程中需要安装迁移Agent并输入目的端服务器所在华为云的AK/SK,以及主机迁移服务会收集的源端服务器信息。 ... [详细]
  • TigerGraph101系列课程四直播报名及往期回顾
    报名 ... [详细]
  • PostgreSQL13.1中文手册 ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有