当前位置: 开发笔记 > 编程语言 > 正文

跨域推荐：迁移学习和推荐系统的火花碰撞

作者：可惜偏偏孤独一个小姐_448 | 来源：互联网 | 2023-07-31 18:21

作者|Chilia整理|NewBeeNLP什么是跨域推荐呢？一句话概括就是：跨域推荐（Cross-DomainRecommendation

作者 | Chilia
整理 | NewBeeNLP

什么是跨域推荐呢&＃xff1f;一句话概括就是&＃xff1a;跨域推荐&＃xff08;Cross-Domain Recommendation&＃xff09;是 迁移学习 在推荐系统中的一种应用。

跨域推荐的目的一般是下面几个&＃xff1a;

解决冷启动/数据稀疏问题 &＃xff1a;例如&＃xff0c;一个公司的两个APP业务&＃xff0c;用户群体(user)交叉很大&＃xff0c;但是item不同&＃xff0c;当A业务的用户首次来访B业务时&＃xff08;冷启动问题&＃xff09;&＃xff0c;如何做出有效的推荐、从而提升留存/转化率呢&＃xff1f;或者&＃xff0c;假如B业务的用户行为数据量很少&＃xff08;数据稀疏问题&＃xff09;&＃xff0c;训练的时候不免会过拟合&＃xff0c;怎么去获得更丰富的用户数据呢&＃xff1f;此时&＃xff0c;A业务就可以作为源域、B业务作为目标域&＃xff0c;利用好源域的丰富用户行为信息&＃xff0c;作为目标域的辅助&＃xff0c;使得在目标域甚至多个域上都能进行更好的推荐。例如&＃xff0c;豆瓣根据用户的电影评论来给用户推荐书&＃xff0c;这就是假设了同样的用户对于电影和书有着相似的品味。
跳出信息茧房 &＃xff1a;基于同业务的推荐&＃xff0c;往往会让用户的兴趣越变越窄&＃xff0c;因为都是基于用户的行为进行挖掘的&＃xff0c;当使用跨域推荐时可以跳出原先的舒适圈&＃xff0c;从而改善推荐系统的平衡性、多样性和新奇性。

域的相似性来自于哪里&＃xff1f;

域的相似性可以从如下几个方面来看&＃xff1a;

Content-level 的相似性。指的是不同域的item/user有着相似的属性。例如Amazon music 和 Netflix的业务比较相似&＃xff0c;虽然他们没有很多相同的user和item&＃xff0c;但是user和item的属性是类似的。
User 相似性。两个域有着很多相同的用户。例如抖音和西瓜视频有很多公共用户。
Item 相似性。两个域有着很多相同的商品。例如Movielens 和 Netflix有很多相同的电影。

跨域推荐的分类

Single-target &＃xff1a;一个具有丰富数据的源域&＃xff0c;和稀疏数据的目标域。需要利用源域的辅助信息&＃xff0c;提升目标域的推荐准确率。可以进行feature层面的参数共享&＃xff0c;也可以进行user/item的embedding共享&＃xff08;直接把源域的embedding拿到目标域来用&＃xff0c;或者进行某种mapping映射&＃xff09;。
Dual-target&＃xff1a;同时提升两个域&＃xff08;或者多个域&＃xff09;的推荐效果&＃xff0c;两个域的信息相辅相成。类似multi-tasking&＃xff0c;这里需要防止negative transfer&＃xff0c;即稀疏域对于源域有着负面的影响。所以&＃xff0c;不能简单的把迁移方向从rich->sparse改成sparse->rich。

下面&＃xff0c;介绍四种常见的跨域推荐解决方案。

1. 共享重合user/item的embedding表示

对于那些两个域中有重叠user/item的情况&＃xff0c;可以共享、融合不同域中相同user/item的embedding表示&＃xff0c;来使得embedding包含每个领域中的信息。如何结合不同领域中的embedding&＃xff0c;是值得仔细研究的问题。

代表论文&＃xff1a;A Graphical and Attentional Framework for Dual-Target Cross-Domain Recommendation^[1] [ijcai, 2020]

模型结构

这篇论文属于dual-target迁移&＃xff0c;即同时提升源域和目标域的准确率。亮点有两个&＃xff1a;

&＃xff08;1&＃xff09;使用图网络来建模user-item, user-user, item-item的关系

&＃xff08;2&＃xff09;更精细地合并不同域的重合user/item embedding&＃xff08;使用 attention 机制&＃xff09;

下面来详细介绍模型结构。

Input Layer: ratings就是我们熟悉的user-item评分矩阵&＃xff0c;记录的是user-item互动关系&＃xff1b;content端包括的是一些属性信息&＃xff0c;例如对于item来说&＃xff0c;可以是item detail信息&＃xff1b;对于user来说&＃xff0c;是user profile。
Graph Embedding Layer: 如果只使用collaborative filtering方法&＃xff0c;那么就只考虑了user-item交互&＃xff0c;而没有考虑user-user和item-item相似度信息。所以&＃xff0c;不妨综合 user-item交互、user-user 相似度、item-item相似度构建图网络&＃xff0c;然后利用deepwalk等node2vec方法得到user和item的embedding向量。(注&＃xff1a;因为这个是召回模型&＃xff0c;所以item embedding应该是提前线下算好存起来的&＃xff09;
⭐Feature combination layer: 之前的一些方法都是对两个域的重合embedding做一些简单的组合&＃xff0c;例如average-pooling, concat等。但是这样并不能把握不同域embedding的重要性&＃xff0c;所以本文使用了一种 element-wise注意力 机制&＃xff0c;分别对两个域赋予不同的embedding权重。&＃xff08;注&＃xff1a;本层是跨域迁移的重点&＃xff0c;因为在这里综合了两个域中相同user/item的embedding。使用注意力机制是为了解决negative transfer的问题&＃xff0c;即稀疏域因为学的没那么好&＃xff0c;会对源域有着负面的影响 -- 这里就可以自动的为稀疏域的不太好的embedding分配较小权重&＃xff0c;让它不要对源域的结果有太大影响。&＃xff09;
Neural Network layers: 因为这是个召回模型&＃xff0c;所以这里是双塔&＃xff0c;两塔之间无交互。
Output Layer: user塔和item塔输出归一化后求点积。由于召回点击日志没有负样本&＃xff0c;所以还涉及到负采样。

2. 所有领域共享一个异构图的方法

对于不同领域间有重叠user/item的情况&＃xff0c;可以以这些重叠user/item作为桥梁 &＃xff0c;链接起不同的领域。这样&＃xff0c;我们就得到了 一个所有领域共享的异构图 &＃xff0c;形如下图&＃xff1a;

代表论文&＃xff1a;HeroGRAPH: A Heterogeneous Graph Framework for Multi-Target Cross-Domain Recommendation \[recsys 2020\]^[2]

这篇文章还是为了解决协同过滤中的sparsity issue&＃xff0c;只不过针对的是多个域的共同学习。如果有n个域的话&＃xff0c;采用上文所述的pairwise迁移方法就需要构建个域之间的关系&＃xff0c;可不可以直接把所有域的关系都综合起来呢&＃xff1f;

可以构建一个所有域共享的异构图&＃xff0c;如果user对某个item有交互&＃xff0c;那么user-item之间就有边&＃xff0c;边的权重可以是正则化后的rating&＃xff1b;user-user和item-item边的权重是它们属性特征的相似度。这里&＃xff0c;重叠的用户充当着链接起多个域的“桥梁”&＃xff1a;

模型结构如下&＃xff1a;

对于每个user/item分别学习两个embedding:

within-domain embedding. 在自己的领域内根据user-item评分矩阵得到embedding
cross-domain embedding. GraphSAGE是一种通过聚合第k-1层节点自己和邻居的embedding来得到第k层节点表示的方法。在这里我们采用使用max-pooling聚合的GraphSAGE方法&＃xff0c;具体计算方法如下&＃xff1a;

之后&＃xff0c;把两个embedding用某些方法拼接/融合在一起&＃xff0c;利用双塔模型计算user-item相似度。

3. 基于域间映射的模型

适用场景&＃xff1a;存在多个数据较为充足的源域 &＃xff0c;以及数据较为稀疏的 目标域 &＃xff0c;想要提高目标域上的 冷启动 推荐性能&＃xff0c;而冷启动用户大多在源推荐领域有交互记录。

代表论文&＃xff1a;Cross-Domain Recommendation: An Embedding and Mapping Approach^[3] [ijcai 2017]

首先在每个领域对user-item的rating矩阵进行矩阵分解&＃xff0c;得到每个域内user/item的embedding&＃xff1b;之后利用 重叠实体 &＃xff08;以用户为例&＃xff09;训练一个由源领域到目标领域的 映射函数 &＃xff0c;试图使源域映射后的用户embedding接近目标域的用户embedding。这个映射函数可以是线性的( 图中step2 Linear mapping)&＃xff0c;也可以是非线性的(图中step2 MLP mapping)。训练完成后利用得到的映射函数便可以 将冷启动用户映射到目标领域 &＃xff0c;进行推荐。

4. 多领域共同训练

利用多个领域的数据同时对多个领域上的模型进行训练&＃xff0c;通过模型间的信息交互使得每个领域的模型的推荐性能得到提高&＃xff0c;类似 多任务学习 。

代表论文&＃xff1a;CoNet: Collaborative Cross Networks for Cross-Domain Recommendation^[4]

场景&＃xff1a;用户在app商店下载app&＃xff1b;同时在网上阅读新闻 -- 我们都用最简单的MLP来预估两个域上的CTR&＃xff08;注意这个任务是CTR预估&＃xff0c;属于精排而非召回&＃xff09;。

那么&＃xff0c;如何同时提高这两个域的推荐精度呢&＃xff1f;最直接的transfer learning的思想就是把一个网络的前若干层直接拷贝到另一个网络做初始化&＃xff0c;然后再在此基础上做微调。但是&＃xff0c;这引入了一个很强的假设&＃xff0c;即这两个域前几层的分布是一样的&＃xff0c;然而事实并非如此。所以&＃xff0c;我们可以用更为复杂的mapping来代替这种identical mapping。

模型结构如下&＃xff1a;

如果不看中间的红色虚线的话&＃xff0c;我们会发现这就是两个最简单的CTR预估模型&＃xff0c;即把user、item的特征拼接起来&＃xff0c;然后输入MLP中得到预测结果。此时由于利用了两个域中的共同user&＃xff0c;所以user embedding是共享的&＃xff0c;两个任务的梯度都可以反传来更新user embedding&＃xff0c;此时问题退化为shared-bottom多任务学习&＃xff0c;共享的底层参数就是user embedding。

那么&＃xff0c;能不能利用两个任务也来指导中间hidden layer的学习呢&＃xff1f;本模型使用类似 Cross-stitch 网络&＃xff0c;第L&＃43;1层隐藏层同时由本任务的第L层隐藏层和对方任务的第L层隐藏层决定&＃xff1a;

这样&＃xff0c;两个域的预测loss都可以反传来更新两个模型的 隐藏层 参数&＃xff0c;起到了正则化和增加训练集的目的。

&＃xff08;注&＃xff1a;这个模型和多任务CTR预估中的SNR比较类似&＃xff0c;都是对不同子网络的输出进行组合又输入到了下一层子网络&＃xff0c;形成子网络的组合。&＃xff09;

一起交流

想和你一起学习进步&＃xff01;『NewBeeNLP』目前已经建立了多个不同方向交流群&＃xff08;机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等&＃xff09;&＃xff0c;名额有限&＃xff0c;赶紧添加下方微信加入一起讨论交流吧&＃xff01;&＃xff08;注意一定o要备注信息才能通过&＃xff09;

本文参考资料

[1]

Graphical and Attentional Framework for Dual-Target Cross-Domain Recommendation: https://www.ijcai.org/proceedings/2020/0415.pdf

[2]

HeroGRAPH: A Heterogeneous Graph Framework for Multi-Target Cross-Domain Recommendation [recsys 2020]: https://ceur-ws.org/Vol-2715/paper6.pdf

[3]

Cross-Domain Recommendation: An Embedding and Mapping Approach: https://www.ijcai.org/proceedings/2017/0343.pdf

[4]

CoNet: Collaborative Cross Networks for Cross-Domain Recommendation: https://www.ijcai.org/proceedings/2017/0343.pdf

推荐阅读

ip
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
random
TensorFlow基础知识深化讲解

批标准化批标准化（batchnormalization,BN）是为了克服神经网络层数加深导致难以训练而诞生的。深度神经网络随着深度加深，收 ... [详细]

蜡笔小新 2024-10-22 10:19:31
ip
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
ip
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
install
第七天深入学习DGL框架：官方文档指导下的数据集下载与预处理技巧

在第七天的深度学习课程中，我们将重点探讨DGL框架的高级应用，特别是在官方文档指导下进行数据集的下载与预处理。通过详细的步骤说明和实用技巧，帮助读者高效地构建和优化图神经网络的数据管道。此外，我们还将介绍如何利用DGL提供的模块化工具，实现数据的快速加载和预处理，以提升模型训练的效率和准确性。 ... [详细]

蜡笔小新 2024-10-27 21:10:17
ip
经验总结_爬虫经验总结

关于爬虫内容的分享，我会分成两篇，六个部分来分享，分别是：我们的目的是什么内容从何而 ... [详细]

蜡笔小新 2024-10-08 10:55:17
ip
机器学习如何看世界对抗机器学习诠释人工智能和人类思维的不同

接近,计算,极限,看,世界,对抗,机器,学习,诠释,人工智能,和, ... [详细]

蜡笔小新 2024-09-29 20:35:55
ip
微信公众号推送模板40036问题

返回码错误码描述说明40001invalidcredential不合法的调用凭证40002invalidgrant_type不合法的grant_type40003invalidop ... [详细]

蜡笔小新 2024-11-12 16:31:32
nodejs
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08
ip
提升 Kubernetes 集群管理效率的七大专业工具

Kubernetes 在云原生环境中的应用日益广泛，然而集群管理的复杂性也随之增加。为了提高管理效率，本文推荐了七款专业工具，这些工具不仅能够简化日常操作，还能提升系统的稳定性和安全性。从自动化部署到监控和故障排查，这些工具覆盖了集群管理的各个方面，帮助管理员更好地应对挑战。 ... [详细]

蜡笔小新 2024-11-07 17:01:31
ip
汽车电子架构与CAN网络基础解析——鉴源实验室专业解读

汽车电子架构与CAN网络基础解析——鉴源实验室专业解读 ... [详细]

蜡笔小新 2024-11-06 14:10:48
ip
亚马逊老板杰夫·贝佐斯

本文主要介绍关于的知识点，对【亚马逊创始人或成地球首位万亿富豪，起底贝佐斯创业之路】和【亚马逊老板杰夫·贝佐斯】有兴趣的朋友可以看下由【CSDN资讯】投稿的技术文章，希望该技术和经验能帮到你解决你所遇 ... [详细]

蜡笔小新 2024-10-25 14:45:17
ip
优秀网页翻译：一个智能旋钮：DIY haptic input knob: BLDC motor + round LCD

一个智能旋钮：DIYhapticinputknob:BLDCmotorroundLCD智能旋钮硬件设计智能旋钮视图演示视频3DCAD建立一个你自己的？基 ... [详细]

蜡笔小新 2024-10-13 17:56:02
ip
当人工智能（AI）撞上供应链

了解供应链简单来说，供应链涉及一系列旨在向最终用户提供产品或服务的步骤。企业组织及其供应商之间始终存在一个网络，来生产特定产品并将其交付给最终用户。该网络包括不同的活动、人员、实体 ... [详细]

蜡笔小新 2024-10-11 18:25:31
ip
圣诞节到了，智能菌想送你一份礼物

关注网易智能，聚焦AI大事件，读懂下一个大时代！（机器学习算法地图见文末）圣诞节的赠书活动来了！ ... [详细]

蜡笔小新 2024-09-29 11:06:55

可惜偏偏孤独一个小姐_448

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章