当前位置: 开发笔记 > 运维 > 正文

数据治理容易走进哪些误区？

作者：丶Le丨囧囧_832 | 来源：互联网 | 2023-02-12 11:04

在业界，大家都为如何做好数据治理而感到困惑。数据治理工作一定要先摸清楚数据的家底，规划好路线图，再进行决策。不然很容易走进误区中ÿ

在业界，大家都为如何做好数据治理而感到困惑。数据治理工作一定要先摸清楚数据的家底，规划好路线图，再进行决策。不然很容易走进误区中，无法自拔。下面总结了数据治理的7个常见误区，并给出一定建议，希望给予数据治理从业的同仁们一些借鉴参考。

误区一：客户需求不明确

客户既然请厂商来帮助自己做数据治理，必定是看到了自己的数据存在诸多问题。但是具体做什么，如何实施，实施范围，先后顺序，最终目标，以及各个角色如何配合做……很多客户其实并没有想清楚自已真正想解决的问题。数据治理，难在找到一个切入点。

其实客户很多时候并不是没需求，只是需求相对比较笼统，模糊不清晰，双方可以花费一定的时间和精力找到真正目标，磨刀不误砍柴工，这样才不致于后续花更多的钱来交学费。

解决办法：有必要的需求调研

如果客户需求不明确，建议先请厂商帮助自己做一个小型的咨询项目，或者实施一个数据现状的调研。通过调研数据架构、现有的数据标准和执行情况，数据质量的现状和痛点，客户目前已经具有的数据治理能力现状等，来摸清楚数据的家底。

由专业的数据治理团队帮助客户设计切实可行的数据治理路线图，双方取得一致的基础上，按照路线图来执行数据治理工作。

数据治理工作，一定要先摸清楚数据的家底，做好需求分析，规划好路线图，切忌一上来就搭平台。

误区二：数据治理是技术部门的事

在大数据时代，很多组织认识到了数据的价值，也成立了专门的团队来负责管理数据，有的叫数据管理处，大数据中心，数据应用处。这些机构往往由技术人员组成，它们的共同点是：强技术，弱业务。当数据治理项目需要实施的时候，往往就是由这些技术部门来牵头。技术部门大多是以数据中心或者大数据平台为出发点，受限于组织范围，不希望扩大到业务系统，只希望把自已负责的范围管好。

数据问题产生的原因，往往是业务>技术。可以说大部分的数据质量问题，都是来自于业务，如：数据来源渠道多，责任不明确，导致同一份数据在不同的信息系统有不同的表述；业务需求不清晰，数据填报不规范或缺失，等等。很多表面上的技术问题，如ETL过程中某代号变更导致数据加工出错，影响报表中的数据正确性等，在本质上其实还是业务管理的不规范。

解决办法：多部门协作配合

数据治理既是技术部门的事，更是业务部门的事，一定要建立多方共同参与的组织架构和制度流程，数据治理的工作才能真正落实到人，不至于浮在表面。

误区三：大而全的数据治理

出于投资回报的考虑，客户往往倾向于做一个覆盖全业务和技术域的，大而全的数据治理项目。从数据的产生，到数据的加工，应用，销毁，数据的整个生命周期他们希望都能管到。从业务系统，到数据中心，到数据应用，里面的每个数据他们希望都能被纳入到数据治理的范围中来。

但殊不知广义上的数据治理是一个很大的概念，包括很多内容，想在一个项目里就做完通常是不可能的，而是需要分期分批地实施，所以厂商如果屈从于客户的这种想法，很容易导致最后哪个也做不好，用不起来。所以，我们需要引导客户，从最核心的系统，最重要的数据开始做数据治理。

解决办法：合理应用二八原则

怎么引导客户呢？这里要引入一个众所周知的概念：二八原则。实际上，二八原则在数据治理中同样适用：80%的数据业务，其实是靠20%的数据在支撑；同样的，80%的数据质量问题，其实是由那20%的系统和人产生的。在数据治理的过程中，如果能找出这20%的数据，和这20%的系统和人，毫无疑问，将会起到事半功倍的效果。

做数据治理，不要贪大求全，而要从核心系统，重要的数据开始做起。

误区四：工具是万能的

很多客户都认为，数据治理就是花一些钱，买一些工具，认为工具就是一个过滤器，过滤器做好了，数据从中间一过，就没问题了。结果是：一方面功能越做越多，另一方面实际上线后，功能复杂，用户不愿意用。

其实上面的想法是一种简单化的思维，数据治理本身包含很多的内容，组织架构、制度流程、成熟工具、现场实施和运维，这四项缺一不可，工具只是其中一部分内容。大家在做数据治理最容易忽视的就是组织架构和人员配置，但实际上所有的活动流程、制度规范都需要人来执行、落实和推动，没有对人员的安排，后续工作很难得到保障。

一方面治理推广工作没人做，流程能否坚持执行得不到保障。另一方面没有相关的数据治理培训，导致大家对数据治理的工作不重视，认为与我无关，从而导致整个数据治理项目注定会失败。建议大家在做数据治理的时候将组织架构放在第一位，有组织的存在，就会有人去思考这方面的工作，怎么去推动，持续把事情做好，以人为中心的数据治理工作，才更容易推广落地。

解决办法：人员配置充足

现场的实施和运维也非常重要，尽管数据治理有向自动化的方向发展的趋势，但是到目前为止，数据治理更多还是一种服务工作，而不仅仅是一套产品。因此，配置足够强的实施顾问和实施人员，帮助客户逐步打造自身的数据治理能力，是一项非常重要的工作。

记住，做数据治理不是去逛逛shopping mall，选几样称心应手的工具回来就万事大吉了。开展好数据治理不能迷信工具，组织架构、制度流程、现场的实施和运维也非常重要，缺一不可。

误区五：数据标准难落地

很多客户一说到数据治理，马上就说我们有很多数据标准，但是这些标准却统统没有落地，因此，我们要先做数据标准的落地。数据标准真正落地了，数据质量自然就好了。

但这种说法其实混淆了数据标准和数据标准化。首先要明白一个道理：数据标准是一定要做的，但是数据标准化，也就是数据标准的落地，则需要分情况实施。

要做数据标准，我们首先需要全面梳理数据标准。而数据标准的全面梳理，范围很大，包括国家标准，行业标准，组织内部的标准等等，需要花费很大的精力，甚至都可以单独立一个项目来做。所以，首先需要让客户看到梳理数据标准的广度和难度。

其次，就算是花很大精力梳理，也很难看到效果，结果往往是客户只看到了一堆Word和Excel文档，时间一长，谁也不会再去关心这些陈旧的文档。这是最普遍的问题。

解决办法：分别执行不同的落地策略

当然，数据标准是否能顺利落地，还与负责数据治理的部门所获得的权限直接相关，倘若没有领导的授权和强力支持，你是无论如何无法推动“书同文车同轨”的，要做到这一点，请先确认你背后站着说一不二的秦始皇，或者你本身就是秦始皇。别抱怨，这就是每个做数据治理的团队面临的现状。

数据标准落地难是数据治理中的普遍性问题，实施过程中需要区要分遗留系统和新建系统，分别来执行不同的落地策略。

误区六：发现问题容易，解决问题难

辛辛苦苦建立起来平台，业务和技术人员通力合作，配置好了数据质量的检核规则，也找出来了一大堆的数据质量问题，然后呢？半年之后，一年之后，同样的数据质量问题依旧存在。

发生这种问题的根源在于没有形成数据质量问责的闭环。要做到数据质量问题的问责，首先需要做到数据质量问题的定责。定责的基本原则是：谁生产，谁负责。数据是从谁那里出来的，谁负责处理数据质量问题。

这种闭环不一定非要走线上流程，但是一定要做到每一个问题都有人负责，每一个问题都必须反馈处理方案，处理的效果最好是能够形成绩效评估，如通过排名的方式，来督促各责任人和责任部门处理数据质量问题。

解决办法：确定责任人的闭环机制和反馈机制

这其实还是要追溯到我们在误区二里谈到的：要建立组织架构和制度流程，否则数据治理工作中的种种事情，没有人负责，没有人去做。

数据质量问题的解决，要形成每一个环节都有确定责任人的闭环机制和反馈机制。

误区七：你们好像什么也没做？

很多数据治理的项目难验收，客户往往有疑问：你们做数据治理究竟干了些啥？看你们汇报说干了一大堆事情，我们怎么什么都看不到？发生这种情况，原因往往有前面误区一所说的客户需求不明确，误区三所说的做了大而全的数据治理而难以收尾等，但还有一个原因不容忽视，那就是没有让客户感知到数据治理的成果。用户缺乏对数据治理成果的感知，导致数据治理缺乏存在感，特别是用户方的领导决策层，自然不会痛快地对项目进行验收。

遇到这种情况，一句“宝宝心里苦，但宝宝不说”是无济于事的。一个项目从销售、售前、到组织团队实施，多少人付出了辛勤的汗水。重要的是让客户认识到项目的重要价值，最终为所有人的付出买单啊。

解决办法：数据治理的可视化呈现

在我看来，在数据治理的项目需求阶段，就应该坚持业务价值导向，把数据治理的目的定位在有效地对数据资产进行管理，确保其准确、可信、可感知、可理解、易获取，为大数据应用和领导决策提供数据支撑。并且在这个过程中，一定要重视并设计数据治理的可视化呈现效果，应用到的工具有统计表，视图表，相关报告，PPT等……

以上这些都是提升数据治理存在感的手段。除了这些之外，时常组织交流和培训，引导客户认识到数据治理的重要性，让客户真正认识到数据治理工作对他们业务的促进作用，逐步转移数据治理的能力给客户等，这些都是平时需要注意的工作。

传统的数据治理工作不重视效果的呈现，我们做数据治理工作，一定要从需求开始，就想办法让客户直观地看到成果。

在激烈的市场竞争下，大数据厂商提出来数据治理的各种理念，有的提出覆盖数据全生命周期的数据治理，有的提出以用户为中心的自服务化数据治理，有的提出减少人工干预、节省成本的基于人工智能的自动化数据治理，在面对这些概念的时候，我们一方面要对数据现状有清晰的认识，对数据治理的目标有明确的诉求，另一方面还要知道数据治理中各种常见的误区，跨越这些陷阱，才能把数据治理工作真正落到实处，项目取得成效，做到数据更准确，数据更好取，数据更好用，真正地用数据提升业务水平。

中培IT学院——一站式企业IT培训提供商！

搜索中培IT学院了解更多内容！

推荐阅读

搜索
知识图谱与图神经网络在金融科技中的应用探讨

本文详细介绍了融慧金科AI Lab负责人张凯博士在2020爱分析·中国人工智能高峰论坛上的演讲，探讨了知识图谱与图神经网络模型如何在金融科技领域发挥重要作用。 ... [详细]

蜡笔小新 2024-11-21 15:02:52
ftp
对象存储与块存储、文件存储等对比

看到一篇文档，讲对象存储，好奇，搜索文章，摘抄,学习记录！背景：传统存储在面对海量非结构化数据时，在存储、分享与容灾上面临很大的挑战，主要表现在以下几个方面：传统存储并非为非结 ... [详细]

蜡笔小新 2024-11-17 18:21:23
ftp
从财务转型为数据分析师的两年历程

本文作者小尧，曾在税务师事务所工作，后成功转型为数据分析师。本文分享了他如何确定职业方向、积累行业知识，并最终实现转型的经验。 ... [详细]

蜡笔小新 2024-11-17 12:19:41
服务器
web页面报表js下载,web报表软件

web页面报表js下载,web报表软件 ... [详细]

蜡笔小新 2024-11-16 18:37:21
服务器
全面覆盖的前端技术资源大全

本文提供了一个详尽的前端开发资源列表，涵盖了从基础入门到高级应用的各个方面，包括HTML5、CSS3、JavaScript框架及库、移动开发、API接口、工具与插件等。 ... [详细]

蜡笔小新 2024-11-23 12:05:53
服务器
本周三大青年学术分享会即将开启

由雷锋网旗下的AI研习社主办，旨在促进AI领域的知识共享和技术交流。通过邀请来自学术界和工业界的专家进行在线分享，活动致力于搭建一个连接理论与实践的平台。 ... [详细]

蜡笔小新 2024-11-21 17:13:10
服务器
区块链与IDCC大数据产业的深度融合

本文探讨了区块链技术如何与IDCC大数据产业结合，推动新型基础设施建设的发展，解决了传统数据处理中的诸多难题，并提出了具体的解决方案。 ... [详细]

蜡笔小新 2024-11-20 17:13:15
linux
Python在大数据和网络爬虫领域的应用前景

随着技术的发展，Python因其高效性和灵活性，在多个领域得到了广泛应用，特别是在大数据处理和网络爬虫开发方面。本文将探讨学习Python是否能够胜任大数据和网络爬虫工程师的工作，并分析其职业前景。 ... [详细]

蜡笔小新 2024-11-20 16:02:31
服务器
2017年软件开发领域的七大变革

随着技术的不断进步，2017年对软件开发人员而言将充满挑战与机遇。本文探讨了开发人员需要适应的七个关键变化，包括人工智能、聊天机器人、容器技术、应用程序版本控制、云测试环境、大众开发者崛起以及系统管理的云迁移。 ... [详细]

蜡笔小新 2024-11-19 20:17:20
服务器
低代码行业为何难以孕育大型企业？

探讨低代码行业发展现状，分析其未能催生大型企业的原因，包括市场需求、技术局限及商业模型等方面。 ... [详细]

蜡笔小新 2024-11-19 14:38:02
服务器
英特尔推出第三代至强可扩展处理器及傲腾持久内存，AI性能显著提升

英特尔在数据创新峰会上发布了第三代至强可扩展处理器和第二代傲腾持久内存，全面增强AI能力和系统性能。 ... [详细]

蜡笔小新 2024-11-17 13:07:14
服务器
AI人工智能学习之回归分析详解

回归分析是一种统计学方法，用于确定变量之间的定量关系。本文将详细介绍回归分析的基本概念、分类、应用及具体操作步骤。 ... [详细]

蜡笔小新 2024-11-15 11:03:56
服务器
兆芯X86 CPU架构的演进与现状（国产CPU系列）

本文详细介绍了兆芯X86 CPU架构的发展历程，从公司成立背景到关键技术授权，再到具体芯片架构的演进，全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]

蜡笔小新 2024-11-14 15:04:34
服务器
数字经济浪潮下企业人才需求变化，优质IT培训机构助力技能提升

随着云计算、大数据、人工智能、区块链和5G等技术的迅猛发展，数字经济已成为推动经济增长的重要动力。据信通院数据，2020年中国数字经济占GDP比重达38.6%，整体规模突破39.2万亿元。本文探讨了企业在数字化转型中对技术人才的需求变化，并介绍了优质IT培训机构如何助力人才培养。 ... [详细]

蜡笔小新 2024-11-14 12:12:41
服务器
Java代码分层详解及其应用场景

本文详细介绍了Java代码分层的基本概念和常见分层模式，特别是MVC模式。同时探讨了不同项目需求下的分层策略，帮助读者更好地理解和应用Java分层思想。 ... [详细]

蜡笔小新 2024-11-13 17:03:49

丶Le丨囧囧_832

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章