热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

干货!基于元学习的内容定向推广

点击蓝字关注我们AITIME欢迎每一位AI爱好者的加入!在推荐系统和广告平台上,内容定向推广模块需要尽可能将商品、内容或者广告传递到潜在的对内容感兴趣的

点击蓝字

365ba0e28d14d59978e97e8098e5be47.png

关注我们

AI TIME欢迎每一位AI爱好者的加入!

在推荐系统和广告平台上,内容定向推广模块需要尽可能将商品、内容或者广告传递到潜在的对内容感兴趣的用户面前。扩充候选集技术(Look-alike建模)需要基于一个受众种子集合识别出更多的相似潜在用户,从而进行更有针对性的内容投放。然而,look alike建模通常面临两个挑战: (1) 一个系统每天可能需要处理成百上千个不同种类的内容定向推广实例(例如体育、政治、社会等不同领域的内容定向推广)。因此,我们很难构建一个泛化的方法,同时针对多样的定向推广任务扩充高质量的受众候选集。(2) 一个内容定向推广任务的受众种子集合可能非常小,而一个基于有限种子用户的定制化模型往往会产生严重的过拟合。为了解决以上的挑战,我们提出了一种新的两阶段框架Meta Hybrid Experts and Critics (MetaHeac)。在离线阶段,我们在不同种类的内容定向推广任务的历史行为数据上,采用元学习的方法训练一个泛化初始化模型。这个模型可以同时抓取不同任务之间的关系,从而能够快速适应新类别内容推广任务。在线上阶段,针对一个新的内容推广实例,模型能够基于给定的种子集合和高线训练得到的泛化初始化模型,快速训练出这个实例的定制化推广模型。我们通过高线实验和线上实验验证了MetaHeac的有效性。目前,该框架已部署到微信中,用于部分内容定向推广场景。

本期AI TIME PhD直播间我们邀请到中科院计算技术研究所的博士生——朱勇椿,为我们带来报告《基于元学习的内容定向推广》。

7cb7cde3eedca93d1661d5dbae174da6.png

朱勇椿:

中国科学院计算技术研究所四年级在读博士生,导师为曹娟研究员和庄福振教授。主要研究方向为迁移学习、推荐系统等。在包括KDD,WWW,SIGIR等会议与期刊发表多篇论文。

01

 背  景 

现在互联网市场拥有上亿级别的用户,系统如何将广告、内容和产品投放到潜在的用户面前成为了一个重要任务。内容定向投放在生活中经常出现,如最近的“英雄联盟总决赛夺冠信息”,腾讯希望定向投放到对英雄联盟感兴趣的用户面前。再比如双十一时,商家购买了一定的流量,系统会针对商家的商品进行内容投放,而且内容投放的精准程度会对商家经济收益产生影响。

在推荐系统和广告平台上,内容定向推广模块负责尽可能将商品内容或者广告传递到潜在的对内容感兴趣的用户面前。内容定向推广会使用到扩充候选集技术,也称Look-alike建模。针对一个受众种子集合识别出更多相似的潜在用户,从而进行更有针对性的内容投放工作。如下图所示,通常市场营销人员给出一个种子集合,然后Look-alike系统根据这个种子集合扩充出候选集合,再通过推荐系统将推广的内容、产品、广告送到潜在用户面前。

62d6b7f75c67ec7aee5380cde1354dec.png

目前已经有很多公司部署了基于Look-alike的内容定向推广技术,比如Google,领英,蚂蚁金服,微信等等。

基于Look-alike的内容定向推广技术一般面临两个挑战:

一是不同的内容定向推广任务(市场营销任务)会覆盖完全不同的内容。

比如新闻的内容定向推广中,新闻按照领域不同可分为体育新闻,娱乐新闻,政治新闻,社会新闻等,不同领域的新闻内容差异较大,因此一个公共的模型很难满足所有内容定向推广任务。

二是一个确定的内容定向推广任务(市场营销任务)可能只会给定一个很小的种子集合。

较小的种子集合涉及的用户范围小,而基于这样的种子集合进行定制化任务训练很有可能导致过拟合。特别是有的种子集合中只包含几百个用户的场景中过拟合现象往往更严重。

以往内容定向推广方法分为三大类:基于规则的方法、基于相似度量的方法、基于模型的方法。下表是现有内容定向推广方法及其局限性。

fa88423b33ef1d103ad6d4b5076931c2.png

最近几年基于模型的方法对于每个内容定向投放任务都会训练一个定制化模型,取得了显著效果提升。然而针对每个内容定向推广任务都从头训练一个定制化模型,显然会导致过拟合问题产生。

针对上面的问题,出现了新的基于模型的方法。新方法将扩充候选集任务分为了两个阶段,离线阶段和在线阶段。在离线阶段,这些方法训练一个公共的embedding层。在online阶段,它们基于这个embedding层训练一个定制化的模型。

02

 方  法 

下面是一个简单的Look-alike系统示意图。一个内容定向推广任务系统存储着各种任务的数据,模型需要基于这些数据预训练得到一个泛化的模型,然后针对一个新来的内容定向推广任务,微调一个定制化的模型。得到这个定制化的模型后,模型从整个用户候选集中筛选出TopK个潜在的用户,向这些用户推广特定的内容。

0febd76eadebd4f16ed7689933d8225b.png

本文提出一个新的两阶段框架Meta Hybrid Experts and Critics (MetaHeac)。两阶段同样是包含离线阶段和在线阶段。在离线阶段,基于所有已有内容定向推广任务的数据,训练一个泛化模型。训练泛化模型的两个关键点包括:①这个泛化模型应该学到扩充候选集的能力。②这个泛化模型应该能学到可迁移的知识,抓获任务间关系。在线阶段,基于特定定向推广任务以及该泛化模型,训练一个定制化的模型来查询候选集合。

MetaHeac包含两个大模块。第一个模块是基于元学习的训练方法,第二个模块是建模任务间关系的结构。

首先介绍基于元学习的训练方法,我们定义了两个二分类的模型——泛化模型和定制化模型,预测用户是否对当前任务感兴趣。

扩充候选集的流程包括如下两个阶段:(1)理解:这一阶段旨在理解种子集合中的用户特点,基于种子集合训练一个定制化的模型。(2)寻找:这一阶段旨在基于定制化的模型,从候选集中找到潜在的客户。我们希望学习一个泛化的预训练模型,这个预训练模型能学会如何扩充候选种子集。因此,我们采用如下流程来模拟这两个阶段。整个训练过程如下图所示。

5daf251023771f67c563f9dcee040a30.png

然后介绍MataHeac的第二个模块——任务间关系结构的建模。为了抓取任务间的关系,我们提出了一种混合专家和评论家系统。单个专家只擅长某几个特定领域,而多样的内容定向推广任务覆盖各个领域。综合不同的专家,能够覆盖不同领域的知识。

因此,我们采用多个专家来提取用户的不同维度的表示。我们认为针对不同的内容定向推广任务,应该采纳不同专家提取的表示。基于这个假设,我们提出了一种任务驱动门(Task-driven gate),用以聚合所有专家给出的用户表示。和专家(Expert)不同,评论家(Critic)旨在给出具体评分,判断用户是否对该次内容定向推广任务推销的物品感兴趣。我们也使用多个评论家,并且使用任务驱动门来聚合多个评论家的分数。

68195c04ea20080589f7ae7fdc3efd22.png

03

 实  验 

数据集:

Tencent Look-alike Dataset 、WeChat Look-alike Dataset

a7ef6ce7ae878d6fa4a07573242d85b9.png

Baseline:

f2da5508b81ef672922bc0166014a2d8.png

评价指标:AUC, P@K%, R@K%

4ee5fd2aa330f7839efd950438cf4f84.png

实验结果:

(1) 离线实验

88fd7668172e4644dcd63a7cf7bcc880.png

(2) 在线实验

30dc9f79c68d2d18265a2379e5aad273.png

(3) MetaHeac各模块效果验证

1b9a5793dbf01042bab4ce526993ac9f.png

点击“阅读原文”,即可观看本场回放

整理:AI Timer

审核:朱勇椿

AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

请将简历等信息发至min.gao@aminer.cn!

微信联系:AITIME_HY

AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

b98a16ad32db6f6995c02a8a7a42b593.png

更多资讯请扫码关注

bd587883b3d35aa1e93bd2409395133f.png

我知道你在看

9278d2af3b8bf99b8f1bf36668b473ad.png

点击“阅读原文”查看精彩回放


推荐阅读
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • Google最新推出的嵌入AI技术的便携式相机Clips现已上架,旨在通过人工智能技术自动捕捉用户生活中值得纪念的时刻,帮助人们减少照片数量过多的问题。 ... [详细]
  • 强人工智能时代,区块链的角色与前景
    随着强人工智能的崛起,区块链技术在新的技术生态中扮演着怎样的角色?本文探讨了区块链与强人工智能之间的互补关系及其在未来技术发展中的重要性。 ... [详细]
  • 在 Windows 10 中,F1 至 F12 键默认设置为快捷功能键。本文将介绍几种有效方法来禁用这些快捷键,并恢复其标准功能键的作用。请注意,部分笔记本电脑的快捷键可能无法完全关闭。 ... [详细]
  • 本文介绍如何利用动态规划算法解决经典的0-1背包问题。通过具体实例和代码实现,详细解释了在给定容量的背包中选择若干物品以最大化总价值的过程。 ... [详细]
  • 深入理解C++中的KMP算法:高效字符串匹配的利器
    本文详细介绍C++中实现KMP算法的方法,探讨其在字符串匹配问题上的优势。通过对比暴力匹配(BF)算法,展示KMP算法如何利用前缀表优化匹配过程,显著提升效率。 ... [详细]
  • 自学编程与计算机专业背景者的差异分析
    本文探讨了自学编程者和计算机专业毕业生在技能、知识结构及职业发展上的不同之处,结合实际案例分析两者的优势与劣势。 ... [详细]
  • 从零开始构建完整手机站:Vue CLI 3 实战指南(第一部分)
    本系列教程将引导您使用 Vue CLI 3 构建一个功能齐全的移动应用。我们将深入探讨项目中涉及的每一个知识点,并确保这些内容与实际工作中的需求紧密结合。 ... [详细]
  • 深入解析Java枚举及其高级特性
    本文详细介绍了Java枚举的概念、语法、使用规则和应用场景,并探讨了其在实际编程中的高级应用。所有相关内容已收录于GitHub仓库[JavaLearningmanual](https://github.com/Ziphtracks/JavaLearningmanual),欢迎Star并持续关注。 ... [详细]
  • 微信小程序:授权登录与手机号绑定
    本文详细介绍了微信小程序中用户授权登录及绑定手机号的流程,结合官方指引和实际开发经验,提供了一套完整的实现方案,帮助开发者更好地理解和应用。 ... [详细]
  • 2015款Chromebook Pixel评测:高端Chrome OS笔记本体验
    在笔记本电脑领域,Chromebook Pixel凭借其精致的铝合金外壳、细腻的显示屏和舒适的键盘,成为了外观设计的佼佼者。然而,尽管外观出众,它是否值得购买仍需考量。 ... [详细]
  • 转自:http:www.yybug.comread-htm-tid-15324.html为什么使用Twisted? 如果你并不准备使用Twisted,你可能有很多异议。为什么使用T ... [详细]
  • Web App vs Native App:未来的移动应用趋势
    随着移动互联网的发展,Web App和Native App之间的竞争日益激烈。对于开发者而言,选择哪一种技术路径更为明智?本文将深入探讨两种应用模式的特点及未来趋势。 ... [详细]
  • 本文由蕤内撰写,明亮公司出品,探讨了日本零售业在数字化转型中的现状与挑战。文章基于与两位在日本的投资人的深入对话,分析了日本零售业为何仍然依赖传统的POS机系统,以及中日两国在品牌建设和数字化营销上的差异。 ... [详细]
  • 7000字文章一键排版技巧与实践
    本文探讨了一种高效的文章排版方法,特别适合文字密集型内容,如原创公众号文章。作者通过个人经历,分享了从学习Markdown到利用mdnice实现一键排版的过程,旨在帮助更多内容创作者提升工作效率。 ... [详细]
author-avatar
讨厌上学的-彭志超-_354
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有