多目标学习与MMOE

作者：笑意江湖 | 来源：互联网 | 2023-10-12 17:34

多目标模型的意义现实世界中，我们的业务目标往往不是单一的。比如购物APP中，我们不仅仅希望你浏览商品，也希望你购买商品，甚

多目标模型的意义

现实世界中&＃xff0c;我们的业务目标往往不是单一的。比如购物APP中&＃xff0c;我们不仅仅希望你浏览商品&＃xff0c;也希望你购买商品&＃xff0c;甚至分享商品&＃xff0c;评论商品。再比如短视频推荐&＃xff0c;我们不单希望你看视频&＃xff0c;也希望你点赞、评论、分享视频&＃xff0c;还希望你能关注发布的作者。因此多目标模型的出现&＃xff0c;就可以让我们的场景同时服务到这些目标。于此同时&＃xff0c;对于一些正样本稀疏的目标&＃xff0c;多目标模型甚至可以让他们的目标实现远超预期.

MMoE简介

多任务学习的目的在于用一个模型来同时学习多个目标和任务&＃xff0c;但常用的任务模型的预测质量通常对任务之间的关系很敏感&＃xff0c;因此&＃xff0c;Google 提出多门混合专家算法&＃xff08;Multi-gate Mixture-of-Experts&＃xff0c;以下简称 MMoE&＃xff09;旨在学习如何从数据中权衡任务目标&＃xff08;task-specific objectives&＃xff09;和任务之间&＃xff08;inter-task relationships&＃xff09;的关系。所有任务之间共享混合专家结构&＃xff08;MoE&＃xff09;的子模型来适应多任务学习&＃xff0c;同时还拥有可训练的门控网路&＃xff08;Gating Network&＃xff09;以优化每一个任务。MMoE 算法在任务相关性较低时能够具有更好的性能&＃xff0c;同时也可以提高模型的可训练性。

MMOE结构如下&＃xff1a;Expert是一个神经网络&＃xff0c;Expert个数根据训练和预估性能做权衡&＃xff0c;和任务数保持一致也可以。Gate是一个Softmax函数&＃xff0c;个数与任务数一致&＃xff0c;每个Gate的输出个数与Expert个数一致。

MMoE网络结构衍化图

MMoE的网络结构衍化图&＃xff0c;衍化的过程是为了更好地解决多目标问题。图( a ) 到图( c ) 反映了在解决多目标问题时模型结构的迭代过程&＃xff1a;
在这里插入图片描述
结论&＃xff1a;图&＃xff08; c &＃xff09;最好&＃xff0c;图&＃xff08; b &＃xff09;次之&＃xff0c;图&＃xff08; a &＃xff09;最差.
图&＃xff08; a &＃xff09;是最常规的共享网络的方案&＃xff0c;结构是input首先经过底层共享的DNN网络&＃xff08;Shared Bottom&＃xff09;生成vector&＃xff0c;再根据不同目标将vector经过各自的tower生成对应的output。

图&＃xff08; b &＃xff09;是将底层的一个DNN网络分解成3个专家网络&＃xff08;expert&＃xff09;&＃xff0c;通过一个共享门控&＃xff08;gate&＃xff09;来设置每个专家网络输出的权重&＃xff0c;得到门控后的vector经过各自tower生成对应的output。

图&＃xff08; c &＃xff09;跟图&＃xff08; b &＃xff09;的思路类似&＃xff0c;同样是通过门控为专家网络设置权重&＃xff0c;再通过各自tower生成对应的output。不同的点在于&＃xff0c;使用的门控不是共享门控&＃xff0c;而是每个目标有独立的门控&＃xff08;gate&＃xff09;&＃xff0c;如果有两个目标则有两个门控。

通过上文的图片&＃xff0c;MMoE的网络结构其实是比较好理解的&＃xff0c;下面说一下衍化过程&＃xff1a;

首先&＃xff0c;图&＃xff08; a &＃xff09;的Shared-Bottom方式不能很好地处理不同目标样本空间不同的差异化&＃xff0c;因此效果来看容易导致某个目标受另外一个目标影响较大。

其次&＃xff0c;图&＃xff08; b &＃xff09;引入了gate和expert的思想&＃xff0c;就是希望每个expert能学习到不同的信息&＃xff0c;更好地服务多目标不同目标的样本空间。但是gate的权重对于两个目标是共享的&＃xff0c;同样会导致差异化未被很好服务。

图&＃xff08; c &＃xff09;模型每个目标使用独立的gate权重&＃xff0c;使每个expert对每个目标贡献不同&＃xff0c;更好的处理了不同目标差异化的问题。

为什么要使用MMoE实现多目标&＃xff1f;

1、MMoE通过特殊的模型结构达到了一个模型实现多个目标的能力
2、MMoE通过模型结构的优化使各项目标都很好的实现
3、MMoE可以通过网络共享帮助正样本稀疏的目标更好地达成

参考文献

1.多目标学习与MMOE

推荐阅读

图片
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
hash
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
replace
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
replace
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
bash
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
uri
深入解析JVM垃圾收集器

本文基于《深入理解Java虚拟机：JVM高级特性与最佳实践》第二版，详细探讨了JVM中不同类型的垃圾收集器及其工作原理。通过介绍各种垃圾收集器的特性和应用场景，帮助读者更好地理解和优化JVM内存管理。 ... [详细]

蜡笔小新 2024-12-28 13:35:19
web
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
web
HDFS与Hive中的数据存储和管理机制

本文探讨了Hive中内部表和外部表的区别及其在HDFS上的路径映射，详细解释了两者的创建、加载及删除操作，并提供了查看表详细信息的方法。通过对比这两种表类型，帮助读者理解如何更好地管理和保护数据。 ... [详细]

蜡笔小新 2024-12-27 20:21:48
web
深入理解设计模式与七大原则

本文详细探讨了Java中的24种设计模式及其应用，并介绍了七大面向对象设计原则。通过创建型、结构型和行为型模式的分类，帮助开发者更好地理解和应用这些模式，提升代码质量和可维护性。 ... [详细]

蜡笔小新 2024-12-27 19:10:10
web
词根词缀解析：greg、hap、helio及其他词源故事

本文基于刘洪波老师的《英文词根词缀精讲》，深入探讨了多个重要词根词缀的起源及其相关词汇，帮助读者更好地理解和记忆英语单词。 ... [详细]

蜡笔小新 2024-12-27 18:59:50
filter
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
uri
数据管理权威指南：《DAMA-DMBOK2 数据管理知识体系》

本书提供了全面的数据管理职能、术语和最佳实践方法的标准行业解释，构建了数据管理的总体框架，为数据管理的发展奠定了坚实的理论基础。适合各类数据管理专业人士和相关领域的从业人员。 ... [详细]

蜡笔小新 2024-12-27 18:29:55
require
JQuery基础：省市联动与表单验证

本文介绍了如何使用JQuery实现省市二级联动和表单验证。首先，通过change事件监听用户选择的省份，并动态加载对应的城市列表。其次，详细讲解了使用Validation插件进行表单验证的方法，包括内置规则、自定义规则及实时验证功能。 ... [详细]

蜡笔小新 2024-12-27 17:10:48
replace
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
main
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31

笑意江湖

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章