元学习系列（九）：GradientAgreementasanOptimization

作者：mobiledu2502897083 | 来源：互联网 | 2023-08-27 11:44

MAML尝试学习模型的初始化参数，使得这些参数对各类任务的梯度都是敏感的，这样针对某一特定任务甚至新的任务只需进行少数几次的梯度下降，就能

MAML尝试学习模型的初始化参数&＃xff0c;使得这些参数对各类任务的梯度都是敏感的&＃xff0c;这样针对某一特定任务甚至新的任务只需进行少数几次的梯度下降&＃xff0c;就能取得较好的效果&＃xff0c;可是因为这个过程中使用了二阶微分计算&＃xff0c;增大了计算开销。

Reptile在MAML的原理上进行改进&＃xff0c;省略了二阶微分计算的过程&＃xff0c;同时也避免模型的性能显著下降&＃xff0c;在性能和计算开销之间都取得较好的平衡。

简单来说&＃xff0c;MAML和Reptile都是在想办法找到一个点&＃xff0c;到各类任务的最优点的距离之和最小&＃xff0c;但是其实两者都默认了各类任务对于寻求最优初始点的贡献是一样的&＃xff0c;从MAML的公式就可以明显看出这一点&＃xff1a;

$θnew&＃61;θ−β∇θ∑L(fθi′)\theta_{new} &＃61; \theta - \beta \nabla_{\theta} \sum L (f_{\theta &＃39;_i})$

上式中的损失函数只是各个任务的损失函数之和&＃xff0c;不同的损失函数拥有相同的权重。

现在有一种情况就是假如有n个任务&＃xff0c;n-1个任务都倾向于同一个梯度下降方向&＃xff0c;而还有一个任务则倾向于另一个完全相反的方向&＃xff0c;这时候这个任务就阻止了模型朝着最优方向前进了&＃xff0c;或者说&＃xff0c;在这种情况下&＃xff0c;模型更倾向于抛弃最后一个任务&＃xff0c;通过降低那个任务的性能来优化更多的任务。

以MAML为例来看看Gradient Agreement是如何进行改进的&＃xff0c;首先也是随机抽取不同任务的N个样本&＃xff0c;对每个样本进行梯度下降&＃xff1a;

$θi&＃61;θ−αinner∇Lτi(fθ)\theta_i &＃61; \theta - \alpha_{inner} \nabla L_{\tau_i} (f_\theta)$

$gi&＃61;θ−θig_i &＃61; \theta - \theta_i$

接下来就是Gradient Agreement的重点&＃xff0c;计算每个任务的权重了&＃xff1a;

$wi&＃61;∑j∈T(giTgj)∑k∈T∣∑j∈T(gkTgj)∣w_i &＃61; \frac{\sum_{j \in T} (g_i^T g_j)}{\sum_{k \in T} |\sum_{j \in T} (g_k^T g_j) |}$

上式的意思就是&＃xff0c;假如现在有五类任务&＃xff0c;每类任务有五个样本&＃xff0c;对于第一类任务的权重&＃xff0c;分子等于第一类任务五个样本和所有样本之间的乘积之和&＃xff0c;分母等于任意这二十五个样本任意两个的乘积之和的绝对值。简单来说&＃xff0c;如果某类样本的梯度更新方向和其他样本的梯度更新方向比较接近&＃xff0c;就会得到更高的权重&＃xff0c;相反就更低。

计算出每类任务的权重之后&＃xff0c;就可以继续进行分析&＃xff0c;对MAML&＃xff0c;就是&＃xff1a;

$θnew&＃61;θ−αouter∑iwi∇Lτi(fθi)\theta _{new} &＃61; \theta - \alpha_{outer} \sum_i w_i \nabla L_{\tau_i}(f_{\theta_i})$

对Reptile&＃xff1a;

$θnew&＃61;θ&＃43;αouter∑iwi(θi−θ)\theta _{new} &＃61; \theta &＃43; \alpha_{outer} \sum_i w_i (\theta_i - \theta)$

总的来说&＃xff0c;Gradient Agreement的创新点就是针对不同的任务引入不同的权重&＃xff0c;使得模型的能准确地朝着对初始参数进行优化。

在github写的自然语言处理入门教程&＃xff0c;持续更新&＃xff1a;NLPBeginner

在github写的机器学习入门教程&＃xff0c;持续更新&＃xff1a;MachineLearningModels

想浏览更多关于数学、机器学习、深度学习的内容&＃xff0c;可浏览本人博客

推荐阅读

深度学习
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
testing
利用CIFAR10数据集快速掌握Mixup数据增强技术，显著提高图像分类精度

通过使用CIFAR-10数据集，本文详细介绍了如何快速掌握Mixup数据增强技术，并展示了该方法在图像分类任务中的显著效果。实验结果表明，Mixup能够有效提高模型的泛化能力和分类精度，为图像识别领域的研究提供了有价值的参考。 ... [详细]

蜡笔小新 2024-11-05 14:24:36
testing
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
testing
中文分词_中文分词技术小结几大分词引擎的介绍与比较

篇首语：本文由编程笔记#小编为大家整理，主要介绍了中文分词技术小结几大分词引擎的介绍与比较相关的知识，希望对你有一定的参考价值。笔者想说：觉得英文与中文分词有很大的区别， ... [详细]

蜡笔小新 2024-10-13 12:29:25
uri
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
const
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46
input
基于TensorFlow的鸢尾花数据集神经网络模型深度解析

基于TensorFlow的鸢尾花数据集神经网络模型深度解析 ... [详细]

蜡笔小新 2024-10-22 11:56:51
input
第三届人工智能、网络与信息技术国际学术会议（AINIT 2022)

20223rdInternationalSeminaronArtificialIntelligence,NetworkingandInformationTechnology第三届 ... [详细]

蜡笔小新 2024-10-21 09:26:13
range
python绘制拟合回归散点图_机器学习之利用Python进行简单线性回归分析

前言：在利用机器学习方法进行数据分析时经常要了解变量的相关性，有时还需要对变量进行回归分析。本文首先对人工智能机器学习深度学习、相关分析因果分析回归分析 ... [详细]

蜡笔小新 2024-10-15 16:59:18
default
如何在jieba分词中加自定义词典_常见中文分词包比较

1jiebajieba.cut方法接受三个输入参数:需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM参数用来控制是否使用HMM模型ji ... [详细]

蜡笔小新 2024-10-11 12:27:39
default
Bidirectional LSTMCNNsCRF

上期使用LSTM做短文本分类效果不如CNN，或许有朋友会问什么场景下LSTM能体现出序列性的优势，本期使用双向LSTM-CNNs-CRF实现SequenceLabeling。CRF ... [详细]

蜡笔小新 2024-10-09 21:44:26
lua
AI 学习路线：从Python开始机器学习

AI 学习路线：从Python开始机器学习 ... [详细]

蜡笔小新 2024-09-28 14:04:30
lua
容联云亮相世界人工智能大会发布容犀机器人助力产业数字化转型

2021世界人工智能大会（“WAIC2021”）近日在上海开启，今年大会主题是“智联世界，众智成城”，容联云作 ... [详细]

蜡笔小新 2024-10-17 10:52:39
lua
高清图解：神经网络、机器学习、数据科学一网打尽

|导|读BY：AI-Beetle完全图解人工智能、NLP、机器学习、深度学习、大数据！这份备忘单涵盖了上述领域几乎全部的知识点，并使用信息图、脑图等多种可视化方式呈现，设计精美，实 ... [详细]

蜡笔小新 2024-10-09 13:33:56
lua
圣诞节到了，智能菌想送你一份礼物

关注网易智能，聚焦AI大事件，读懂下一个大时代！（机器学习算法地图见文末）圣诞节的赠书活动来了！ ... [详细]

蜡笔小新 2024-09-29 11:06:55

mobiledu2502897083

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章