热门标签 | HotTags
当前位置:  开发笔记 > 大数据 > 正文

数据分析思维之用户标签

文章目录1.什么是标签?2.用户标签有什么用?3.用户标签的制作流程4.用户标签的4大常见问题4.1没有目标,盲目打标4.2不区分时间状态


文章目录

    • 1. 什么是标签?
    • 2. 用户标签有什么用?
    • 3. 用户标签的制作流程
    • 4. 用户标签的4大常见问题
      • 4.1 没有目标,盲目打标
      • 4.2 不区分时间状态
      • 4.3 行为动机乱归因
      • 4.4 结果缺少检验


1. 什么是标签?

标签就是由原始数据,经过整理、加工、分类所得,一个抽象的符号,并且代表一类人/物的特征。


2. 用户标签有什么用?

能快速、方便地细分用户群体,锁定更有需求的人,实现更精准的营销/服务。(如下图所示)

在这里插入图片描述

可以基于过往分析成果,预先打上标签,能极大提升效率,实现更复杂、更精准的分析。

并且,还能把最后效果记录进标签库,积累分析经验。如果标签打的对,那我们按标签做的事就能起到效果,标签本身质量也被确认;如果标签打错了,那按标签做的事就会没有效果,后续就能修订标签,打新标签。

我们做用户分层和分群,做精准营销,所有结果也可以以标签形式保存。在后续多次验证,从而沉淀管用、区分度高的标签,提升用户画像的准确度与有用性。


3. 用户标签的制作流程

做标签,就是个循序渐进的过程。从原始数据直接分类得到初级标签,之后多个标签组合,生成综合标签。当多个标签一起用于评估,可能采用分类或降维算法。当标签是预测未来时,需要用预测算法。最后评价标签有没有区分度,关键看打标以后,各类标签在目标上的差异,所以清晰目标很重要

制作标签共有7步:


  1. 从单维度开始
  2. 设定区分目标
  3. 进行维度拆解
  4. 观察区分效果
  5. 总结经验
  6. 多维度交叉
  7. 不断提升效果

4. 用户标签的4大常见问题


4.1 没有目标,盲目打标

即使是同一个原始数据,在不同目标下,打标方式会完全不同。拿用户年龄举例,可能有好几种分类贴标签的方式(如下图)

在这里插入图片描述


4.2 不区分时间状态

比如打一个“高价值用户”标签,这里“高价值”指的是历史消费水平高,还是未来消费的多?很多人傻傻不分,就统计下历史消费金额,然后消费多的就是价值高。但是谁保证用户过去买的多,未来一定买的多??完全不一定。

注意:如果我们要打的标签是个未来情况,比如未来消费多,意味着我们要做一个预测:用户未来会消费多少。这里就得基于测试或者建模预测才能得到结论,不能简单基于历史数据统计。


4.3 行为动机乱归因

比如用户买了产品A,于是就打个“A产品喜爱者”标签。然而用户真的喜欢A产品吗?我们只知道用户买了A的行为,并不能直接推导出动机。如果想推倒动机,需要基于一段时间数据分析,并且综合多个维度判断。

在这里插入图片描述


4.4 结果缺少检验

打用户标签是希望区分用户,那么最后区分效果,在目标上的差异越大越好,如果差异不大,那打标意义就不大,可以取消标签,或者再做优化(如下图所示)。

在这里插入图片描述


推荐阅读
  • python计算数据包校验和(python接口数据校验)
    本文目录一览:1、怎么用python算p值和t检验 ... [详细]
  • 腾讯安全平台部招聘安全工程师和数据分析工程师
    腾讯安全平台部正在招聘安全工程师和数据分析工程师。安全工程师负责安全问题和安全事件的跟踪和分析,提供安全测试技术支持;数据分析工程师负责安全产品相关系统数据统计和分析挖掘,通过用户行为数据建模为业务决策提供参考。招聘要求包括熟悉渗透测试和常见安全工具原理,精通Web漏洞,熟练使用多门编程语言等。有相关工作经验和在安全站点发表作品的候选人优先考虑。 ... [详细]
  • 一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到,由于这个问题Google发明 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • “你永远都不知道明天和‘公司的意外’哪个先来。”疫情期间,这是我们最战战兢兢的心情。但是显然,有些人体会不了。这份行业数据,让笔者“柠檬” ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • PHP组合工具以及开发所需的工具
    本文介绍了PHP开发中常用的组合工具和开发所需的工具。对于数据分析软件,包括Excel、hihidata、SPSS、SAS、MARLAB、Eview以及各种BI与报表工具等。同时还介绍了PHP开发所需的PHP MySQL Apache集成环境,包括推荐的AppServ等版本。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 工作经验谈之-让百度地图API调用数据库内容 及详解
    这段时间,所在项目中要用到的一个模块,就是让数据库中的内容在百度地图上展现出来,如经纬度。主要实现以下几点功能:1.读取数据库中的经纬度值在百度上标注出来。2.点击标注弹出对应信息。3 ... [详细]
  • WebDAV之葫芦儿·派盘+天悦日记
    天悦日记支持webdav方式连接葫芦儿派盘。是一款清爽简约的日记记录工具,通过天悦日记app随时随地快速写日记,更有智能数据统计分析报表,多端同步多种备份,本地备份和基于Web ... [详细]
  • Shodan简单用法Shodan简介Shodan是互联网上最可怕的搜索引擎,与谷歌不同的是,Shodan不是在网上搜索网址,而是直接进入互联网的背后通道。Shodan可以说是一款“ ... [详细]
  • tomcat的log文件夹下有以下几种日志:1、catalina.YYYY-MM-DD.logcatalina引擎输出的日志;catalina是tomc ... [详细]
author-avatar
目目目目目目目目目目目目
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有