导读:互联网的商业模式,商业化变现不外乎后向收费的广告模式,以及面向最终消费者的前向收费模式。广告尤其是重头。就连淘宝天猫的模式本质上也是赚的广告的钱。那么,大数据在广告中是如何起作用的?
作者:吴俊
来源:大数据DT(ID:bigdatadt)
01 我看到的广告都跟我最近看的内容有关系,这是怎么做到的呢?
有同学曾经给我说过这么个故事:她曾在某社交APP,讨论组中,围观宝妈们,有关“婴儿护理”的讨论,其中一位宝妈,发帖询问什么纸尿布好?当她打开某购物APP时,赫然发现,婴儿纸尿布的广告,就出现在了,首页推荐上。“才几秒钟时间,我只是看了别人的帖子,就被精准推送,太可怕了。”她说。
这是怎么实现的呢?用户的个人隐私数据有被泄漏吗?
这也是作为普通用户最好奇的精准广告,是如何获取我的数据,并追着我投放广告的问题?
首先是,运用大数据技术,对用户行为、喜好、及兴趣,包括浏览的内容,进行学习分析,打上不同的标签。
然后,广告主投放广告时,会选取不同的标签,进行定向投放,并分析不同标签的广告效果差异分析,并调整不同的人群标签进行定向投放。
上面到的这个故事的技术处理的过程,就是这位女士先被打上了“母婴/纸尿布”的标签。这样自然就被投放“纸尿布”的广告了。
当然从技术细节上,标签都是被打在设备ID上的,这些设备ID,是可被用户重置,防止继续追踪的(在文末推荐的《大数据程序化广告实践》这套音频课程中我会详细介绍如何重置的方法)。这个过程并不知道具体用户在现实世界中的信息。
而且,用户行为记录的原始数据是不可被保存的,仅仅是抽象后的标签数据。
这也是我们常说的,保护用户隐私数据,原始数据不可被使用,且需匿名化处理。
02 标签是怎么打出来的?
有很多同学,行业外的新闻记者以及对互联网十分感兴趣的同学,甚至还有很多互联网从业者,媒体方负责商业化变现的同学,经常来问我标签是怎么打出来的。下面我们就快速介绍一下:
人群特性标签,即对目标受众的特性刻画,一般会从基础的人口属性、兴趣爱好、消费倾向等等,标签维度来描绘:
-
人口属性:基本的人口属性如:性别、年龄、区域、学历职业、收入水平、家庭资产状况(车、房)、人生阶段等等。这些很多是结合互联网行为大数据,并基于一定真实样本数据基础上,依据行为相似度匹配而得出的(对行为相似度,举个例子:通过样本发现男性关注跑车资讯的行为特点较为突出,就会将关注跑车资讯类行为的用户都打上男性的标签。)。相对而言真实样本数据的规模,对数据的有效性影响较大。
-
兴趣爱好:数码、户外、美食、美容、收藏、家居装修等等。这些更多的是依据用户的互联网浏览行为的大数据而得出的。
-
消费倾向:房产、汽车、金融、家电、个人护理等等。这些更多来源的是用户的线上电商及线下店的浏览、加购物车及消费行为的大数据。
这些标签也是我们经常说的人群标签。从保护用户隐私的角度来看,一般在使用用户行为数据时,尽量避免使用原始数据及个体的数据。
一般都是会对于用户行为数据进行分析后打上标签。这样对用户打标签的方式也是为了尽量保护用户隐私,在程序化广告领域是较为常见的一种做法。
例如:头条、腾讯广点通等,广告投放系统,都会提供很多人群标签,供广告主选取,投放进行筛选人群,定向投放。基本这些标签体系都会有三到四级,标签总数会有上千种之多。尤其那些偏商品品类的标签最多。
数据已经是新时代不可缺少的燃料,未来商业竞争,最重视对数据的积累的争夺。然而随着各种数据安全的事件频出,大家也都越来越重视数据安全和数据合规的问题,我们来看看到底什么是数据的合规使用?
03 大数据时代基础:人/物的唯一标识
在介绍数据合规使用问题之前,先让我们对需要使用的重要对象“数据”有个较为清晰的认识。
首先一切数据化,连接/追踪的基础是:识别唯一的“人”或“物”。
标识人及物的方式越来越丰富多样,线下场景中:图像识别 id、声纹识别 id、face id、RFID、NFC、二维码、条形码等等。
数据按权属,分为第一方、第二方、第三方数据:
-
第一方数据:数据的拥有方是广告主,简称广告主第一方数据。典型的如广告主内部数据(CRM)及广告主官网布码、线下店面安装设备收集到的数据等,在CRM系统中会有用户的注册会员的时间、会员等级、消费记录、售后记录等等。
通过这些数据都可以有效的分析不同用户对不用产品及服务的青睐度、尤其对于发现新的个体销售机会以及新的市场需求都是十分有价值的。
在广告主官网及线下店面收集到的数据会有用户的第一次到访的时间,在某些内容及产品站台前停留的时长,用户的对产品及内容的浏览轨迹,用户对某些内容及产品的关注度,以及用户的回头率等等,对这些数据进行分析,都能十分有效地发现商机及潜在购买意愿的用户。以及对于发掘对于不同人群,产品及内容展示的缺陷及优势都有重大的指导意义。
-
第二方数据:是广告投放方(媒体方、DSP方等)通过广告投放获取到用户对于该广告在媒体上的互动的数据。所以数据是广告投放方及广告主共同拥有,对广告主而言是第二方数据。
这一类数据主要是广告对用户曝光及用户点击的数据。通过广告对用户的曝光次数数据,我们可以分析广告推广的力度够不够,通过点击数据我们可以分析广告的内容对用户的吸引度够不够。如果再能结合上述的第一方的用户到店及广告后续的数据可以分析广告的效果如何,进而可以分析不同渠道的对产品的推广效用如何等等。
这些都是我们在营销活动中要花好每一分钱,对每一分钱的投入产出评估的十分重要的依据。
-
第三方数据:同广告主无任何关系,第三方数据供应商提供的数据,对广告主而言是第三方数据。
04 什么是数据合规?
个人识别信息(Personally Identifiable Information (PII))是唯一识别消费者的数据。PII是确定性的(能确定它是代表一个特定的人),而不是基于概率论推断的(它很可能是那个人)。例如,数据可包括全名、邮寄地址、电子邮件地址、手机号和出生日期等。
当消费者注册享受服务并事先许可同意共享个人资料详细信息时,个人识别信息通常会被收集。在获取、存储和使用PII进行营销和广告方面有十分严格的用户隐私保护法规,必须遵守这些法规的前提下使用数据,也称为数据合规。
随着各国各地区陆续颁布的系列个人数据保护相关法规,如欧盟的《通用数据保护条例》(General Data Protection Regulation,简称GDPR),以及中国近年来的《网络安全法》《信息安全技术 个人信息安全规范》《网络安全等级保护基本要求》《互联网个人信息安全保护指南》等系列法规,已在对用户个人信息安全保护做出了十分严格的限制。
这意味着品牌需要与其供应商和内部IT部门一起制定严格的合规要求。只有使用正确的合作伙伴来确保合规性,才可以继续规划和开展智能的、相关联的、数据驱动的智能营销活动。引用《互联网个人信息安全保护指南》的一小段作为参考:
完全依靠自动化处理的用户画像技术应用于精准营销、搜索结果排序、个性化推送新闻、定向投放广告等增值应用,可事先不经用户明确授权,但应确保用户有反对或者拒绝的权利;如应用于征信服务、行政司法决策等可能对用户带来法律后果的增值应用,或跨网络运营者使用,应经用户明确授权方可使用其数据。
对这段文字的简要解读是:用户对个人数据被采集、被存储或被用于其他第三方服务使用,首先要有在显著之处被告知的知情权,同时用户有对数据被存储及其他第三方服务使用的选择、重置和拒绝的权利,以及对不慎的误操作有及时采取紧急措施,清除数据的权利。
在做用户画像时应严格遵守相关法律法规和行业规范,守好数据获取“最少必要原则”的底线,同时应以更显著直接的方式向用户开放拒绝“被标签”和个性化广告推送的操作入口,让用户享有选择权。
在具体日常具体实操作业中,更多对用户的隐私保护声明协议、及合作伙伴的用户数据保护协议等涉及法规类的文件,还需更多借助企业法律部门的帮助和指导建议。所以相关法规及合规性的研究和专业能力,将从常被大家忽视的盲区,越来越成为企业数字化转型和大数据能力建设及人力储备中必不可少的部分和投入要点。
关于作者:吴俊,《程序化广告实战》作者,国内广告PDB(广告私有化程序购买)第一人,20多年IT/互联网行业从业经验,超过6年的大数据营销工作经验。江苏科技大学学士,美国项目管理PMP认证。
延伸学习《大数据程序化广告实践》
长按二维码进入课程
转载请联系微信:DoctorData
推荐语:这套音频课程针对为什么我们需要了解大数据程序化广告相关知识,大数据精准广告主要是为了解决什么问题、对我们的重要性,大厂们的示范,数据合规使用等等一一系列的内容进行介绍。这些内容也是对《程序化广告实战》一书精华的提取,以及与时俱进的升级,欢迎大家收听。
有话要说????
Q: 你会怎样给自己打标签?
欢迎留言与大家分享
猜你想看????
-
很火的深度学习框架PyTorch怎么用?手把手带你安装配置
-
天猫双11、12306怎样扛住流量高峰“集中轰炸”?一文全揭秘!
-
87万人已开通5G套餐!8本书,给你剧透未来科技
-
PaaS、DevOps、OpenShift与业务中台的实现
更多精彩????
在公众号对话框输入以下关键词
查看更多优质内容!
PPT | 报告 | 读书 | 书单 | 干货
大数据 | 揭秘 | Python | 可视化
AI | 人工智能 | 5G | 中台
机器学习 | 深度学习 | 神经网络
合伙人 | 1024 | 段子 | 数学
据统计,99%的大咖都完成了这个神操作
????
觉得不错,请把这篇文章分享给你的朋友
转载 / 投稿请联系:baiyu@hzbook.com
更多精彩,请在后台点击“历史文章”查看
点击阅读原文,了解更多