热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

数据分析——如何构建数据指标体系

文章转自数据指标体系搭建实践1.什么是数据指标指标,是反映某种事物或现象,描述在一定时间和条件下的规模、程度、比例、结构等概念,通常由指标名称和指标数值组成。2.为什么要搭建指标体

文章转自 数据指标体系搭建实践

1. 什么是数据指标

指标,是反映某种事物或现象,描述在一定时间和条件下的规模、程度、比例、结构等概念,通常由指标名称和指标数值组成。

2. 为什么要搭建指标体系

例如,在实际场景中,社区业务板块是整体业务的一个较为重要的子版块,在多批次循环迭代中,由于业务方向及产品形态的变化,需要多次更新调整数据计算逻辑。并且由于埋点及业务数据的不完善,经常需要校验异常数据,为确保准确性、应对频繁的产品迭代产生的数据需求以及更好的发现问题、定位问题,故需要从整体业务的角度构造指标体系。

通过指标体系监测业务发展的状况,最大的价值就是高效利用时间,把时间花在解决问题上,而不是寻找问题上,从而提高整体的人效。

指标体系的输出结果应当是一份指标字典和对应的Dashboard展示,需要至少满足以下要求:

  • 成体系化的指标监控系统,能够从多维度了解业务发展的现状
  • 在业务发展出现问题时能够快速定位问题所在
  • 高效地为团队提供数据支持

3. 指标类型及命名

在构建指标体系的过程中,首要动作就是明确指标的分类以及约束指标命名方式,使各个指标能够做到见名知意、减少沟通成本,这里我们按照阿里对指标的划分规范指标命名:

指标分为原子指标和派生指标

原子指标是基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,是具有明确业务含义的名词 ,体现明确的业务统计口径和计算逻辑,例如支付金额。

派生指标可以理解为对原子指标业务统计范围的圈定。

原子指标 = 业务过程 + 度量

派生指标 = 时间周期 + 修饰词 + 原子指标

下图是各个基本概念之间的关系:
《数据分析——如何构建数据指标体系》

参照阿里对以上基础概念的定义:

业务板块:比数据域更高维度的业务划分方法,适用于特别庞大的业务系统。

业务过程:指企业的业务活动事件,如下单、支付、退款都是业务过程,请注意,业务过程是一个不可拆分的行为事件,通俗的讲,业务过程就是企业活动中的事件。

修饰类型:是对修饰词的一种抽象划分。修饰类型从属于某个业务域,如日志域的访问终端类型涵盖无线端、PC端等修饰词。

修饰词:指出了统计维度以外指标的业务场景限定抽象,修饰词隶属于一种修饰类型,如果在日志域的访问终端类型下,有修饰词PC端、无线端等。

时间周期:用来明确数据统计的时间范围或者时间点,如最近30天、自然周、截至当日等。

度量/原子指标:原子指标和度量含义相同,基于某一业务事件行为下的度量,是业务定义中不可再拆分的指标,具有明确业务含义的名词,通常是业务过程+度量组合而成,如支付金额。

维度:维度是度量的环境,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以成为实体对象。维度属于一个数据域,如地理纬度、时间维度。例如,在分析交易过程时,可以通过买家、卖家、商品和时间等维度描述交易发生的环境。

派生指标:派生指标 = 一个原子指标 + 多个修饰词(可选)+ 时间周期。可以理解为对原子指标业务统计范围的圈定。如原子指标:支付金额,最近一天海外买家支付金额则为派生指标(最近一天为时间周期,海外为修饰词,买家作为维度,而不作为修饰词)

依据以上基本概念,下面是电商业务中一个具体的指标实例:
《数据分析——如何构建数据指标体系》

指标分为结果性指标和过程性指标

结果性指标,比如电商场景下的 GMV(Gross Merchandise Volume,成交总额) 或订单量,它通常是业务漏斗的底部,是一个不可更改的、后验性的指标。

过程性指标,可以简单理解为我到达这个结果之前经过的路径,以及通过这个路径去衡量转化好坏的过程,它是可干预的,而且通常是“用户行为”。

如 GMV = UV * 转化率 * 客单价,GMV为结果性指标,UV、转化率、客单价为过程性指标,通常为了提高GMV去优化UV和转化率。

搭建指标体系的核心指标应当是结果性指标,然后在其基础上拆解过程性指标并纵向划分层级,在此基础上再划分层级之间的关系,通过层次划分,最终实现我们需要的效果。

4. 指标体系搭建

搭建指标体系的时候,横向使用OSM模型纵向进行三级指标分级

(一)横向选择数据指标

选取数据指标是需要有方向性的,需要针对业务现状选取最能代表业务发展状态的指标,在这方面有成熟的模型可以参考,这里我们使用OSM模型来选取指标。

OSM模型(Obejective,Strategy,Measurement)分别代表业务目标、业务策略、业务度量。

O:用户使用产品的目标是什么?产品满足了用户的什么需求?业务的核心目标是什么?

S:为了达成上述目标采取的策略是什么?

M:这些策略随之带来的数据指标变化有哪些?

我们依据核心业务目标,最终选取的关键指标如下:

《数据分析——如何构建数据指标体系》
(二)纵向划分数据指标层级

指标分级可以帮助我们更高效的去定位问题,去验证你的方法论,无需每次都要思考要去看哪些指标。

一级指标:公司战略层面指标,必须是全公司都认可的、衡量业绩的核心指标。它可以直接指引公司的战略目标,衡量公司的业务达成情况,本质上需要管理层和下级员工的双向理解、认同,且要易于沟通传达。比如公司的销售额,或者社交产品的活跃度。

二级指标:业务策略层面指标,二级指标是一级指标的路径指标,一级指标发生变化的时候,我们通过查看二级指标,能够快速定位问题的原因所在。比如uv、转化率、客单价,通过这三个指标可以快速定位销售额降低的原因。

三级指标:业务执行层面指标,三级指标是对二级指标的路径的拆解,即是二级指标的过程性指标。通过三级指标,可以高效定位二级指标波动的原因,并可以快速做出相应的动作。这一步会基于历史经验进行拆解,拆解时可以试着不断询问自己为了实现二级指标我需要做哪些事情?这些事对应的指标是什么?

根据以上原则拆分指标如下(指标都为日度汇总指标):
《数据分析——如何构建数据指标体系》
以上是依据目前业务现状搭建的基本指标体系,在当前指标体系的基础上,仍然可以针对产品中的各个业务子板块继续依照以上方法搭建业务子板块的数据体系。比如针对社区板块中的鉴定板块,按照鉴定业务组的业务目标搭建鉴定频道的业务指标体系等。


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 腾讯安全平台部招聘安全工程师和数据分析工程师
    腾讯安全平台部正在招聘安全工程师和数据分析工程师。安全工程师负责安全问题和安全事件的跟踪和分析,提供安全测试技术支持;数据分析工程师负责安全产品相关系统数据统计和分析挖掘,通过用户行为数据建模为业务决策提供参考。招聘要求包括熟悉渗透测试和常见安全工具原理,精通Web漏洞,熟练使用多门编程语言等。有相关工作经验和在安全站点发表作品的候选人优先考虑。 ... [详细]
  • python计算数据包校验和(python接口数据校验)
    本文目录一览:1、怎么用python算p值和t检验 ... [详细]
  • 通过 JFR 与日志深入探索 JVMTLAB 原理详解
    什么是TLAB?TLAB(ThreadLocalAllocationBuffer)线程本地分配缓存区,这是一个线程专用的内 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • 本文介绍了在Android设备上使用命令行来抓取log文件的方法,包括检查设备连接、清除log缓存、选择存放目录、运行程序等步骤,最后可以在桌面上生成log文件。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • PHP组合工具以及开发所需的工具
    本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件,包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境,包括推荐的AppServ等版本。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • tomcat的log文件夹下有以下几种日志:1、catalina.YYYY-MM-DD.logcatalina引擎输出的日志;catalina是tomc ... [详细]
author-avatar
手机用户2502927203
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有