点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
在推荐系统和广告平台上,内容定向推广模块需要尽可能将商品、内容或者广告传递到潜在的对内容感兴趣的用户面前。扩充候选集技术(Look-alike建模)需要基于一个受众种子集合识别出更多的相似潜在用户,从而进行更有针对性的内容投放。然而,look alike建模通常面临两个挑战: (1) 一个系统每天可能需要处理成百上千个不同种类的内容定向推广实例(例如体育、政治、社会等不同领域的内容定向推广)。因此,我们很难构建一个泛化的方法,同时针对多样的定向推广任务扩充高质量的受众候选集。(2) 一个内容定向推广任务的受众种子集合可能非常小,而一个基于有限种子用户的定制化模型往往会产生严重的过拟合。为了解决以上的挑战,我们提出了一种新的两阶段框架Meta Hybrid Experts and Critics (MetaHeac)。在离线阶段,我们在不同种类的内容定向推广任务的历史行为数据上,采用元学习的方法训练一个泛化初始化模型。这个模型可以同时抓取不同任务之间的关系,从而能够快速适应新类别内容推广任务。在线上阶段,针对一个新的内容推广实例,模型能够基于给定的种子集合和高线训练得到的泛化初始化模型,快速训练出这个实例的定制化推广模型。我们通过高线实验和线上实验验证了MetaHeac的有效性。目前,该框架已部署到微信中,用于部分内容定向推广场景。
本期AI TIME PhD直播间我们邀请到中科院计算技术研究所的博士生——朱勇椿,为我们带来报告《基于元学习的内容定向推广》。
朱勇椿:
中国科学院计算技术研究所四年级在读博士生,导师为曹娟研究员和庄福振教授。主要研究方向为迁移学习、推荐系统等。在包括KDD,WWW,SIGIR等会议与期刊发表多篇论文。
01
背 景
现在互联网市场拥有上亿级别的用户,系统如何将广告、内容和产品投放到潜在的用户面前成为了一个重要任务。内容定向投放在生活中经常出现,如最近的“英雄联盟总决赛夺冠信息”,腾讯希望定向投放到对英雄联盟感兴趣的用户面前。再比如双十一时,商家购买了一定的流量,系统会针对商家的商品进行内容投放,而且内容投放的精准程度会对商家经济收益产生影响。
在推荐系统和广告平台上,内容定向推广模块负责尽可能将商品内容或者广告传递到潜在的对内容感兴趣的用户面前。内容定向推广会使用到扩充候选集技术,也称Look-alike建模。针对一个受众种子集合识别出更多相似的潜在用户,从而进行更有针对性的内容投放工作。如下图所示,通常市场营销人员给出一个种子集合,然后Look-alike系统根据这个种子集合扩充出候选集合,再通过推荐系统将推广的内容、产品、广告送到潜在用户面前。
目前已经有很多公司部署了基于Look-alike的内容定向推广技术,比如Google,领英,蚂蚁金服,微信等等。
基于Look-alike的内容定向推广技术一般面临两个挑战:
一是不同的内容定向推广任务(市场营销任务)会覆盖完全不同的内容。
比如新闻的内容定向推广中,新闻按照领域不同可分为体育新闻,娱乐新闻,政治新闻,社会新闻等,不同领域的新闻内容差异较大,因此一个公共的模型很难满足所有内容定向推广任务。
二是一个确定的内容定向推广任务(市场营销任务)可能只会给定一个很小的种子集合。
较小的种子集合涉及的用户范围小,而基于这样的种子集合进行定制化任务训练很有可能导致过拟合。特别是有的种子集合中只包含几百个用户的场景中过拟合现象往往更严重。
以往内容定向推广方法分为三大类:基于规则的方法、基于相似度量的方法、基于模型的方法。下表是现有内容定向推广方法及其局限性。
最近几年基于模型的方法对于每个内容定向投放任务都会训练一个定制化模型,取得了显著效果提升。然而针对每个内容定向推广任务都从头训练一个定制化模型,显然会导致过拟合问题产生。
针对上面的问题,出现了新的基于模型的方法。新方法将扩充候选集任务分为了两个阶段,离线阶段和在线阶段。在离线阶段,这些方法训练一个公共的embedding层。在online阶段,它们基于这个embedding层训练一个定制化的模型。
02
方 法
下面是一个简单的Look-alike系统示意图。一个内容定向推广任务系统存储着各种任务的数据,模型需要基于这些数据预训练得到一个泛化的模型,然后针对一个新来的内容定向推广任务,微调一个定制化的模型。得到这个定制化的模型后,模型从整个用户候选集中筛选出TopK个潜在的用户,向这些用户推广特定的内容。
本文提出一个新的两阶段框架Meta Hybrid Experts and Critics (MetaHeac)。两阶段同样是包含离线阶段和在线阶段。在离线阶段,基于所有已有内容定向推广任务的数据,训练一个泛化模型。训练泛化模型的两个关键点包括:①这个泛化模型应该学到扩充候选集的能力。②这个泛化模型应该能学到可迁移的知识,抓获任务间关系。在线阶段,基于特定定向推广任务以及该泛化模型,训练一个定制化的模型来查询候选集合。
MetaHeac包含两个大模块。第一个模块是基于元学习的训练方法,第二个模块是建模任务间关系的结构。
首先介绍基于元学习的训练方法,我们定义了两个二分类的模型——泛化模型和定制化模型,预测用户是否对当前任务感兴趣。
扩充候选集的流程包括如下两个阶段:(1)理解:这一阶段旨在理解种子集合中的用户特点,基于种子集合训练一个定制化的模型。(2)寻找:这一阶段旨在基于定制化的模型,从候选集中找到潜在的客户。我们希望学习一个泛化的预训练模型,这个预训练模型能学会如何扩充候选种子集。因此,我们采用如下流程来模拟这两个阶段。整个训练过程如下图所示。
然后介绍MataHeac的第二个模块——任务间关系结构的建模。为了抓取任务间的关系,我们提出了一种混合专家和评论家系统。单个专家只擅长某几个特定领域,而多样的内容定向推广任务覆盖各个领域。综合不同的专家,能够覆盖不同领域的知识。
因此,我们采用多个专家来提取用户的不同维度的表示。我们认为针对不同的内容定向推广任务,应该采纳不同专家提取的表示。基于这个假设,我们提出了一种任务驱动门(Task-driven gate),用以聚合所有专家给出的用户表示。和专家(Expert)不同,评论家(Critic)旨在给出具体评分,判断用户是否对该次内容定向推广任务推销的物品感兴趣。我们也使用多个评论家,并且使用任务驱动门来聚合多个评论家的分数。
03
实 验
数据集:
Tencent Look-alike Dataset 、WeChat Look-alike Dataset
Baseline:
评价指标:AUC, P@K%, R@K%
实验结果:
(1) 离线实验
(2) 在线实验
(3) MetaHeac各模块效果验证
提
醒
点击“阅读原文”,即可观看本场回放
整理:AI Timer
审核:朱勇椿
AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!
请将简历等信息发至min.gao@aminer.cn!
微信联系:AITIME_HY
AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。
更多资讯请扫码关注
我知道你在看哟
点击“阅读原文”查看精彩回放