热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

从0到1,一文掌握用户画像标签体系

一、标签体系概览1、什么是对象2、什么是标签?标签是人为设定的、根据业务场景需求,对目标对象运用一定的算法得到的高度精炼的特征标识。标签是对对象某个维度

一、标签体系概览

1、什么是对象

5f6fdcb12c3f7afa2164b486e80f23a3.png

2、什么是标签?

标签是人为设定的、根据业务场景需求,对目标对象运用一定的算法得到的高度精炼的特征标识。

标签是对对象某个维度特征的描述与刻画,是某一种用户特征的符号表示,每一种标签都规定了我们观察认识描述对象的一个角度,用于对象的标注、刻画、分类和特征提取。

现实世界中标签还有三种表现形态:实物标签、网络标签和电子标签。

  • 实物标签(Label)是用于标明物品的品名、重量、体积、用途等信息的简要标牌,例如:商品标签、价格标签、车检标签、服装吊牌、车票、登机牌都是实物标签;

  • 网络标签(Tag)是一种互联网内容组织方式,是相关性很强的关键字,它能帮助人们通过关键词快速建立对内容总体印象;

  • 电子标签又称RFID射频标签(Label),是一种识别效率和准确度都比较高的识别工具,通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预,可工作于各种恶劣环境。

用户画像里的标签,实际上属于网络标签(Tag)。

3、什么是标签体系?

所谓标签体系,就是对企业需要的多种标签进行归类、同时对标签属性加以定义,从而更方便的对标签进行管理维护。PPT | 标签画像体系实践。

标签体系包含两部分(标签分类体系即标签类目+标签内容信息),最好能通过标签系统来维护。也可按描述对象分类。

eef9f0c8480157d069b05f615f5ec0bc.png

4、用户标签体系

标签类目,分类方式很多,建议采用按业务场景的分类方式。

以下是电商场景的标签类目(最底层分类笔者只是象征性写了几个能说明问题就好)。个人觉得阿里达摩盘的分类更好些,因为赵宏田老师的分类违背了不丢不重的基本分类原则:

1b8de0f987a3a44ec38a1049f2d7838a.png

25ef80dd56b092660f50281544b64111.png

标签内容信息,也叫标签属性,是从多个不同角度对标签进行描述。

7467d0e478a0c1b6a6ba4f2666b6ea9c.png

5、商品标签体系

按照应用场景区分,商品标签分为基础属性、交互行为、适配场景、供应链属性、商品价值等。

7feb743f8efe628a250d8c690855321b.png

6、什么是用户画像

用户画像,即用户信息标签化,通过收集用户的社会属性、消费习惯、偏好特征等各个维度的数据,进而对用户或者产品特征属性进行刻画,并对这些特征进行分析、统计,挖掘潜在价值信息,从而抽象出用户的信息全貌。

用户画像可看作企业应用大数据的根基,是定向广告投放与个性化推荐的前置条件,为数据驱动运营奠定了基础。由此看来,如何从海量数据中挖掘出有价值的信息越发重要。

笔者觉得,用户画像就是在用户标签的基础上进行组合提炼,来刻画描述用户群体,以便更清晰的了解用户,从而投其所好。毕竟用户才是金主爸爸。

7、标签体系的应用场景

1)DMP、CDP

  • CRM应该听的比较多,就是客户关系管理系统(Customer Relationship Management)。

  • DMP就比较少的人听说了,是数据管理系统(Data Management Platform),对应的前台应用叫DSP,广告精准投放平台(Demand-Side Platform )。

  • CDP最近倒是挺火的,是客户数据平台(customer data platform)。

以下是摘要:

  • CRM,它应该是企业的核心客户的系统,是以交易ID或者Leads ID定义数据的系统,存放的主要是“井水不犯河水”时代的那些客户的静态数据。

  • DMP,它应该是以广告投放管理,尤其是程序化广告投放管理为核心目的的受众数据系统。

  • CDP,它应该是支持流量运营、用户运营、客户运营、潜在客户运营的人群细分的数据系统。

DMP的核心思想,是记录每一个个体消费者在不同营销触点上的“交互痕迹”,基于这些痕迹,区分不同消费者的特征,并对不同特征的消费者群体提供针对性营销策略或是输出这些人群作为细分受众给其他营销执行机构。

因此,它具有几个核心特征:

  • 它能够收集不同营销触点上的数据,如果有遇到不能收集的营销触点的情况,也应该能够整合别人收集的数据;

  • 它能够通过这些数据,建立不同的消费者的特征,即建立消费者特征属性的标签;

  • 它能够依据不同的消费者属性标签及消费者触点上的数据,将具有同样特征或数据的消费者筛选出来,并组合成特定受众人群;

  • 它能够分析特定人群的触点数据和属性数据,并进而判断已经执行的营销决策是否合理,或是为即将执行的营销提供策略支持;

  • 它能够将它生成的特定细分人群及相关数据输出给营销执行机构实现相关人群触达或投放。

上面的是标准意义上的DMP的意思。围绕人的数据,收集数据 - 整合数据 - 打标签 - 人群细分为群主 - 输出为策略/输出为人群包 - 投放支持。

DMP的数据源可以是第一方自己的数据、也可以是合作企业的数据、也可以是购买的公开数据源或者数据市场里面的数据。

2)推荐系统

一个推荐系统效果好与坏最基本的保障、最基础的是什么?如果让笔者来回答,一定是标签体系。这里说的标签主要是针对物料的,对于电商平台来说就是商品;对于音乐平台来说就是每一个首歌,对于新闻资讯平台来说就是每一条新闻。

下一篇要介绍的是用户画像,画像中那些用户实时变化的兴趣点大都也是来自于标签体系,依据用户长期和短期行为中对于物料搜索、点击、收藏、评论、转发等事件,将物料的标签传导到用户画像上,就构成了用户的实时画像和离线画像中的各个动态维度。

3)用户画像系统

所谓的用户画像系统,顾名思义,就是对用户进行一些画像……这句话好像啥信息量也没有。但说白了,其实就是对用户的特征进行提炼、进行复原。

功能上,其实主要分为两大系统,一部分是标签系统,一部分画像系统。用户标签是整个系统的数据基础,是链接标签系统和画像系统的桥梁。除此之外,也包括一些人群管理等外围系统功能。

所谓标签系统,就是利用企业自由数据、第三方数据、采购数据等等,对自有的用户进行打标签的处理。标签系统既可以自主生成标签,也可以对标签进行有序管理维护。

所谓画像系统,就是利用标签,进行的可视化分析及各类应用的落地。简单的,可以是一些统计分析;复杂的,可以是人群的各维度的透视。

4)数据中台

在众多的数据中台的解决方案中,一个叫做“标签中心”或“标签体系”的应用,几乎成了数据中台的“标配”。

数据中台是数据+技术+产品+组织的有机组合,是快、准、全、统、通的智能大数据体系。与数据仓库等传统数据工具相比,数据中台是一种新的理念,以“技术+业务”为双驱动,是企业开展新型运营的一个中枢系统。

因此,如果你将数据中台定位成一个存数据、管数据的技术平台,那或许有“分类体系”就可以了。如果你的数据中台定位的是企业数字化转型的运营中枢系统,要实现对前端业务的支持和赋能,那“标签体系”就是数据中台一个标配。原因前边介绍过,分类是自上而下的规划,侧重标准化,标签是自下而上的倒推,注重业务场景。

“数字转型,场景为王”,在“技术+业务”双驱模式的数据中台中,标签体系、数据萃取将助力企业运营转型升级。

二、标签体系建设方法及质量评估标准

1、标签体系构建流程

cf2fdb22729748da1578acd3a67ecac4.png

1)标签体系构建原则

① 原则一

因此最佳的处理方式是,我们应该放弃顶层的用户抽象视角,针对各业务线或部门的诉求和实际的应用场景,分别将标签聚类起来提供给相应部门。

② 原则二

  • 标签生成的自助化能够让沟通成本降最低

  • 标签生成的自助化,可重复修改的规则,降低无效标签的堆积

  • 释放数据团队人力,释放业务团队的想象力

③ 原则三

  • 规则及元信息维护

  • 调度机制及信息同步

  • 高效统一的输出接口

我们回顾标签体系构建的三原则,本质上是解决了价值、手段、可持续性三方面的问题:以业务场景倒推需求,让业务方用起来作为最终目标,让标签系统价值得以实现;标签生成的自助化,它解决的是我们用什么样的手段去实现价值;有效的标签管理机制,意味着一套标签体系能否可持续性地在一家企业里面运作下去。

总之,对企业最重要的是:一套标签系统在业务上用起来,能不能覆盖更广泛的需求,而不是一个大而全的框架。

2)标签体系实施架构

标签体系架构可以分为三个部分:数据加工层,数据服务层,数据应用层。每个层面面向用户对象不一样,处理事务有所不同。层级越往下,与业务的耦合度就越小。层级越往上,业务关联性就越强。

8eb53574c1ed81e62db2f710eb8cf053.png

3)标签体系整体设计-业务梳理

以业务需求为导向,可以按下面的思路来梳理标签体系:

  • 有哪些产品线?产品线有哪些来源渠道?一一列出

  • 每个产品线有哪些业务对象?比如用户,商品

  • 最后再根据对象聚合业务,每个对象涉及哪些业务?每个业务下哪些业务数据和用户行为?

1ebbd0d7278765ec139a14cde54d93b4.png

4)标签体系整体设计-标签分类

按业务需求梳理了业务数据后,可以继续按照业务产出对象的属性来进行分类,主要目的:

  • 方便管理标签,便于维护和扩展

  • 结构清晰,展示标签之间的关联关系

  • 为标签建模提供子集。方便独立计算某个标签下的属性偏好或者权重

梳理标签分类时,尽可能按照MECE原则,相互独立,完全穷尽。

标签层级控制在三到四个为宜。

一级标签控制中 10 个以内,太多不易于使用。

2、标签体系质量评估标准

为什么要进行标签质量评估?

想象一下,我们开发了一个“用户年龄”标签,业务想针对20-30岁的人进行精准投放。但经过筛选,才筛出来几千个人,和公司总体用户相比仅仅是九牛一毛,那这样的标签,还有价值不?

因此,对标签的质量进行科学完整地评估,有助于指导标签的管理者、开发者不断地提升标签质量。通过创建一套完整的评估体系,对于质量过差的标签,不着急上线,等达到基本的质量要求后再开放给业务使用。不然,既对业务带来不了价值,也容易让标签画像系统失去用户的信任。

回过头来,上面这个例子反映的问题,其实就是标签的质量差。准确地说,是标签的覆盖度太低了。除了覆盖度,还有很多指标可以衡量一个标签的质量,咱们在下面详细展开,主要通过数据质量、应用质量、业务质量三个方面来评价标签的质量。

数据质量评估是标签质量最基础的评价,主要分为准确度、覆盖度、稳定性 三部分。

标签覆盖度的含义,是指在一个标签中,有业务含义的人群数量与总人群数量的比例。

标签的稳定性也是影响标签质量的重要因素。

什么是稳定性呢?举个用户年龄标签的例子。昨天30岁以下的用户有200万,占比10%,今天就成了1000万,占比50%。这种标签数据,你敢用么?是数据的计算逻辑出现问题,还是其他原因导致?

因此在标签的质量评估中,标签值的相对稳定性,是重要的评估标准之一。

应用质量评估是从产品角度出发,评估标签对于产品应用的价值。

若一个标签的数据质量高,但是用户都用不起来,不好用,那么也是难以发挥出标签内在的价值。

关于应用价值的衡量,往往会用一些滞后性的指标衡量。基础假设是,业务人员用的多的标签,一定是应用质量好的;业务人员用得少的标签,一定是应用质量弱的。

具体衡量应用多少的指标,可以用【使用次数】、【使用热度】、【调用次数】等来综合衡量。

对于应用价值低的标签,可以针对性地进行分析,不断提升每个标签的应用价值。

业务质量评估是最不好衡量的,但又是最最重要的。因为相比于数据质量是从数据层出发、应用质量是从产品层出发,业务质量是从业务层出发,是离业务价值最近的。

想象一下,业务如果用了一个标签,对一群人进行了投放,ROI是日常投放的好几倍,那这个标签的价值可以说是毋庸置疑了。这时,我们可以说这个标签的业务质量很高。

什么样的标签的业务质量会比较高呢?比如:【用户购买偏好】、【用户的营销敏感度】等等。这类的标签往往都是一些复杂逻辑的算法标签,常常有比较强的业务质量。

但这里存在的一个悖论,就是业务质量是后验的。即想知道一个标签的业务质量,就一定要进行投放测试才行。而且往往不同场景的一些投放带来的结果也不太一样,就导致业务质量的评估往往很难落地。

这确实是个难点。笔者的经验是,在评估标签质量时,先重点考虑数据质量和应用质量,这两者都没问题的时候,就可以上线开放给业务使用。但对于业务使用标签后的数据进行回流,监控标签应用在业务场景的价值情况。最终可以有个比较公允的衡量。而这个衡量,将对后面标签的优化方向,带来很强的指导性意义。

图片

来源丨公众号:数仓与大数据(ID:gh_a22bddb7c58e)

强势开源一款小程序!
2021-11-07
强力推荐一个完善的物流(WMS)管理项目(附代码)
2021-10-23
推荐一个 Spring Boot + MyBatis + Vue 音乐网站
2021-10-19
分享一套家庭理财系统(附源码)
2021-09-20
推荐一个互联网企业级别的开源支付系统
2021-09-04
推荐一套开源通用后台管理系统(附源码)
2021-08-21
一款神仙接私活儿软件,吊到不行!
2021-07-31
基于 SpringBoot 的仿豆瓣平台【源码分享】
2021-07-18
干掉 Wordpress!这个开源建站神器有点吊!
2021-06-18
从朋友那里搞了 20 个实战项目,速领!
2021-06-12

1943e0d806756dd5b72a654d65731ad1.png

如有收获,点个在看,诚挚感谢6d4c354f0f6c9ede2bb509286b94b63b.png


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • Nginx使用AWStats日志分析的步骤及注意事项
    本文介绍了在Centos7操作系统上使用Nginx和AWStats进行日志分析的步骤和注意事项。通过AWStats可以统计网站的访问量、IP地址、操作系统、浏览器等信息,并提供精确到每月、每日、每小时的数据。在部署AWStats之前需要确认服务器上已经安装了Perl环境,并进行DNS解析。 ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 本文介绍了闭包的定义和运转机制,重点解释了闭包如何能够接触外部函数的作用域中的变量。通过词法作用域的查找规则,闭包可以访问外部函数的作用域。同时还提到了闭包的作用和影响。 ... [详细]
  • Google Play推出全新的应用内评价API,帮助开发者获取更多优质用户反馈。用户每天在Google Play上发表数百万条评论,这有助于开发者了解用户喜好和改进需求。开发者可以选择在适当的时间请求用户撰写评论,以获得全面而有用的反馈。全新应用内评价功能让用户无需返回应用详情页面即可发表评论,提升用户体验。 ... [详细]
  • 本文介绍了南邮ctf-web的writeup,包括签到题和md5 collision。在CTF比赛和渗透测试中,可以通过查看源代码、代码注释、页面隐藏元素、超链接和HTTP响应头部来寻找flag或提示信息。利用PHP弱类型,可以发现md5('QNKCDZO')='0e830400451993494058024219903391'和md5('240610708')='0e462097431906509019562988736854'。 ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • Html5-Canvas实现简易的抽奖转盘效果
    本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果,同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码,并展示了实现的基本效果。 ... [详细]
  • 本文记录了在vue cli 3.x中移除console的一些采坑经验,通过使用uglifyjs-webpack-plugin插件,在vue.config.js中进行相关配置,包括设置minimizer、UglifyJsPlugin和compress等参数,最终成功移除了console。同时,还包括了一些可能出现的报错情况和解决方法。 ... [详细]
  • 本文介绍了如何使用vue-awesome-swiper组件,包括在main.js中引入和使用swiper和swiperSlide组件,以及设置options和ref属性。同时还介绍了如何在模板中使用swiper和swiperSlide组件,并展示了如何通过循环渲染swipes数组中的数据,并使用picUrl属性显示图片。最后还介绍了如何添加分页器。 ... [详细]
  • Java和JavaScript是什么关系?java跟javaScript都是编程语言,只是java跟javaScript没有什么太大关系,一个是脚本语言(前端语言),一个是面向对象 ... [详细]
author-avatar
黄皮-_985
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有