热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

建立成功的数据治理团队的四个步骤

英文链接:https:www.infogix.comfour-steps-to-b

英文链接:

    https://www.infogix.com/four-steps-to-building-a-successful-data-governance-team/

    翻译:年少有为


    成功的数据治理需要与清晰定义的业务需求保持一致。然而,有太多的数据治理程序未能实现目标,因为它们忽略了这一先决条件。他们也没能解决一个显而易见的问题:为什么一个组织应该在数据治理上投资?

    治理团队必须回答以下三个关于基本业务需求的问题:

    治理是实现法规遵从性所必需的吗?治理是更快实现分析洞察力的关键成功因素吗?治理如何减少业务转换/卓越运营计划的时间、成本和风险?

    对于大多数组织来说,数据治理目标是这三个目标的组合。但你的主要业务驱动力是什么呢?

    如果您能够回答为什么要投资治理,那么不仅治理团队会支持它,组织也会支持它。治理不仅仅是现代数据治理工具的特性和功能。被忽视的一点是,治理团队只有在对人员、流程和技术的公式进行微调时才会成功。当然,数据治理工具可以支持人员和流程——但首先您必须决定如何实现治理,以最大限度地提高成功的可能性,这要考虑到组织的业务驱动程序和组织文化。

    定义治理策略

    这就引出了下一个关键问题:您的数据治理方法是什么?您希望像公共图书馆一样对每个数据元素进行编目吗?这被称为“自下而上”的方法。也许您需要控制业务流程和相关数据来驱动业务结果?这就是所谓的“中间偏出”策略。也可能是您的组织希望治理来监视和管理围绕业务的目标、目标和度量的数据。这就是“自上而下”的方法。

    无论您选择哪种方法,治理团队都需要将该方法社会化,以获得组织的认可,即这是基于公司文化和目标的正确治理策略。然而,这并不意味着其他方法永远不会得到解决。例如,一个组织选择了一种“中间向外”的方法来管理一个新产品引入过程,然后将其演化为关键的KPI和度量标准,以例证“自上而下”的方法。要点是选择一个作为逻辑起点,并随着数据治理计划实现组织的接受和动力而演进。

    定义数据治理

    虽然有许多关于数据治理的定义,但我们将其定义为人员、流程和技术的正式编排,以使组织能够利用数据作为企业资产。需要注意的是,每个组织都根据其独特的文化和治理计划的业务驱动因素自定义定义。然而,同样重要的是建立一个强大的团队来开发和成熟数据治理策略。选择正确的团队可以决定一个项目的成功与否。

    数据治理团队通常负责获得预算批准、设置治理目标和优先级、构建数据治理模型、选择要采用的技术和传播计划。在许多方面,团队是创建数据驱动文化的管道,因为他们在整个公司内建立兴奋和活力,以确保围绕数据的持续利用、协作和通信。

    现在,让我们深入研究业务必须解决的四个关键步骤,以建立一个繁荣的数据治理计划:

    建立领导团队选择管理级员工指定数据所有者、管理员和用户选择现代技术

    建立数据治理领导

    成功的数据治理从领导层开始。企业通常会任命首席数据官(CDO)或其他高管来领导治理工作。CDO负责监督整个团队,并确保数据治理工作保持在正轨上,在预算范围内,产生预期的结果或ROI。CDO还负责沟通过程和监控成功。

    在CDO下工作的是来自业务各个部门(如营销、人力资源和IT)的执行级领导团队。

    作为一个统一的团队,CDO和数据治理领导团队开发并建立数据治理流程,其中包括数据策略和过程,同时监督整个项目。

    领导团队就位后,下一步是开发团队的其余部分。

    构建数据治理团队

    不同的部门出于不同的目的使用数据,因此从不同的业务部门任命数据治理倡导者非常重要。来自不同部门的代表的任务是促进整个企业的协作,以确保遵循治理过程,满足法规遵循标准,并培养数据素养。

    这些数据治理团队成员一起工作,建立通用的数据定义,实现和监控数据质量分数,制定治理指标,并将角色和职责分配给数据所有者、用户和管理员。这些治理活动促进数据理解,鼓励数据利用,并在数据资产中建立信任,以鼓励数据使用者参与数据并生成有意义的业务洞察。

    除了这个数据治理团队之外,指定的数据所有者、管理员和用户还在成功的数据治理策略中扮演关键角色。

    指定数据所有者、管理员和用户

    数据所有者、管理员和用户各有不同的数据治理角色和职责:

    数据所有者负责确保数据质量在流经业务数据供应链时不会降低,满足所有的法规要求,并根据定义的策略和过程适当地使用数据。数据专员监督数据集的分析,为业务用户生成易于理解的报告,并回答数据问题。数据用户必须遵循管理层制定的所有指导方针和策略,并将发现的任何数据异常报告给适当的数据所有者。

    为这些角色选择对组织有意义的名称也很重要。在某些情况下,人们不喜欢“数据所有者”这个术语,因为他们认为没有人拥有数据。在这种情况下,您可以将其称为“数据托管人”。

    一旦数据治理团队就位并创建了流程,组织就必须选择能够确保全面、成功的数据治理的技术。为了确保产生更好的业务决策的高质量数据,组织需要一个工具,该工具在企业范围内提供集成的数据管理功能。

    选择现代技术

    为了促进有效的数据治理计划,治理团队必须选择一个企业数据智能平台,该平台为数据治理、数据质量和分析提供广泛的集成功能。

    数据治理功能应该提供对组织的数据环境的清晰可见性,包括可用的数据、分配的所有者/管理员、数据沿袭和使用,以及相关的定义、同义词和业务属性。以“自顶向下”的治理方法为例。在此场景中,工具必须合并易于可视化的治理仪表板,以显示关键kpi和度量,以评估实现关键业务目标的进度。

    此外,该平台应鼓励通过可视化接口和工作流进行协作,以形成一个将人员和数据聚集在一起的数据社区。工作流之所以特别重要,有两个原因:首先,流程的工作流应该易于构建,例如数据访问请求、报告数据质量问题或建议新的治理术语,而不需要编写编码手册。其次,工作流程不仅仅需要由人来触发。当数据质量指标低于可接受的阈值时,应该自动触发工作流。此自动工作流事件会及时向数据所有者和管理员发出警报,提醒他们需要注意某个问题。没有人希望发现数据质量问题已经存在了几个月,只是偶然发现的。

    该平台还应使所有用户能够方便地定义、跟踪和管理其数据资产的所有方面。

    数据质量是任何数据治理策略的一个组成部分,数据管理解决方案必须确保数据在整个数据供应链中具有高层次和详细的质量度量的准确性和可靠性。例如,数据质量检查对数据分析、一致性、一致性、完整性、及时性和一致性的检查常常是“细节中的魔鬼”指标,分析用户希望在他们相信数据集适合用于某个目的之前检查这些指标。

    通过采取适当的步骤来构建一个包含数据治理团队并选择最先进的技术,企业可以在整个组织内增加企业数据资产的价值。


    专注互联网前沿技术

    数据仓库|大数据|机器学习|人工只能

    作者简介:就职于一线互联网公司

    目前主要从事flink实时流开发

    喜欢作者文章的,可以关注一波+++





    推荐阅读
    • 微软头条实习生分享深度学习自学指南
      本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
    • 云原生边缘计算之KubeEdge简介及功能特点
      本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
    • 2018年人工智能大数据的爆发,学Java还是Python?
      本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
    • 在Docker中,将主机目录挂载到容器中作为volume使用时,常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法,包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法,可以避免在使用Docker时出现无写权限的情况。 ... [详细]
    • 使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]
    • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
    • GPT-3发布,动动手指就能自动生成代码的神器来了!
      近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
    • Java 11相对于Java 8,OptaPlanner性能提升有多大?
      本文通过基准测试比较了Java 11和Java 8对OptaPlanner的性能提升。测试结果表明,在相同的硬件环境下,Java 11相对于Java 8在垃圾回收方面表现更好,从而提升了OptaPlanner的性能。 ... [详细]
    • 如何利用 Myflash 解析 binlog ?
      本文主要介绍了对Myflash的测试,从准备测试环境到利用Myflash解析binl ... [详细]
    • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
    • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
      转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
    • 人工智能推理能力与假设检验
      最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
    • 物联网、工业互联网大数据的特点-随着数据通讯成本的急剧下降,以及各种传感技术和智能设备的出现,从手环、共享出行、智能电表、环境监测设备到电梯、数控机床、挖掘机、工业生产线等都在源 ... [详细]
    • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
      事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
    • 马蜂窝数据总监分享:从数仓到数据中台,大数据演进技术选型最优解
      大家好,今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数 ... [详细]
    author-avatar
    唐瑄星
    这个家伙很懒,什么也没留下!
    PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
    Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有