当前位置: 开发笔记 > 后端 > 正文

【论文泛读200】通过适配器使用预训练语言模型进行稳健的迁移学习

作者：god | 来源：互联网 | 2023-08-21 13:03

贴一下汇总贴：论文阅读记录论文链接：《RobustTransferLearningwithPretrainedLanguageModelsthroug

贴一下汇总贴&＃xff1a;论文阅读记录

论文链接&＃xff1a;《Robust Transfer Learning with Pretrained Language Models through Adapters》

一、摘要

使用大型预训练的基于 Transformer 的语言模型&＃xff08;如 BERT&＃xff09;进行迁移学习已成为大多数 NLP 任务的主要方法。简单地在下游任务上微调这些大型语言模型或将其与特定于任务的预训练相结合通常并不可靠。特别是&＃xff0c;随着随机种子变化或预训练和/或微调迭代次数的变化&＃xff0c;性能会有很大差异&＃xff0c;并且微调模型容易受到对抗性攻击。我们提出了一种简单而有效的基于适配器的方法来缓解这些问题。具体来说&＃xff0c;我们在预训练模型的每一层中插入小的瓶颈层&＃xff08;即适配器&＃xff09;&＃xff0c;然后固定预训练层并在下游任务数据上训练适配器层&＃xff0c;使用&＃xff08;1&＃xff09;特定任务的无监督预训练&＃xff0c;然后&＃xff08;2&＃xff09;特定任务的监督训练&＃xff08;例如&＃xff0c;分类、序列标记&＃xff09;。我们的实验表明&＃xff0c;这样的训练方案可以提高向各种下游任务迁移学习的稳定性和对抗性鲁棒性。

二、结论

我们为大规模预训练语言模型提出了一个简单而有效的迁移学习方案。我们在预训练模型的每个块中插入小瓶颈层(即适配器)&＃xff0c;然后在特定任务的无监督预训练和有监督训练(即微调)中优化适配器层&＃xff0c;同时固定预训练层。大量实验表明&＃xff0c;我们的方法在特定任务的预训练和微调中提高了对不同随机种子和不同迭代次数的稳定性&＃xff0c;增强了对抗鲁棒性&＃xff0c;并提高了迁移学习任务的性能。因此&＃xff0c;我们认为所提出的训练方案是一种稳健且参数有效的迁移学习方法。

三、框架

对于每次运行&＃xff0c;我们只改变2000到20000之间的预调整迭代次数&＃xff0c;间隔为2000&＃xff0c;并将微调周期固定为10。我们清楚地观察到&＃xff0c;有适配器的BERT的大多数运行都优于没有适配器的BERT。此外&＃xff0c;适配器使BERT预处理比标准方法(没有适配器)更加稳定。

预处理的早期、中期和晚期阶段&＃xff0c;分别对应于第0次、第10000次和第20000次迭代。第0次迭代表示没有特定任务预处理的原始模型。该模型在第0次迭代中存在欠拟合&＃xff0c;在第20000次迭代中存在过拟合。

推荐阅读

nlp
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
nlp
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
nlp
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
pip
【疑难杂症】allennlp安装报错：Installing build dependencies ... error

背景：配置PURE的算法环境，安装allennlp0.9.0（pipinstallallennlp0.9.0）报错ÿ ... [详细]

蜡笔小新 2023-10-17 16:20:30
pip
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
pip
推荐：以数据驱动的方式讲故事

直觉vs数据首先，你有思考过一个问题吗？当你的直觉与你所掌握的数据矛盾的时候，你是听从于直觉还是相信你所掌握的数据呢？201 ... [详细]

蜡笔小新 2023-10-16 17:51:26
pip
numpy100例子

numpy100例子 ... [详细]

蜡笔小新 2023-10-16 16:26:34
多线程
软件测试工程师，需要达到什么水平才能顺利拿到 20k+ 无压力？

前言最近看到很多应届生晒offer,稍有名气点的公司给出的价格都是一年30多W或者月薪20几k,相比之下工作几年的自己薪资确实很寒酸.根据我自己找工作经历,二线城市一般小公司招聘 ... [详细]

蜡笔小新 2023-10-16 13:18:32
多线程
vlfilecopy(findfile(vllist>string(10811110311146103105102)))(vll的简单介绍

本文目录一览：1、一段lisp代码求解释2、运 ... [详细]

蜡笔小新 2023-10-16 12:39:45
多线程
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
多线程
NLP如何进阶？你应该先掌握四大基本任务！

“语言理解是人工智能领域皇冠上的明珠。”——比尔盖茨自然语言处理是一门综合性的学问，它远远不止机器学习算法。相比图像或语音，文本的变化更加复杂ÿ ... [详细]

蜡笔小新 2023-10-16 05:43:05
多线程
NLPIR语义智能平台指引未来文本挖掘的发展方向

　　数据挖掘作为近年来新兴的一门计算机边缘学科，其在国内外引起了越来越多的关注。并且随着数据挖掘技术的不断改进和数据挖掘工具的不断完善，数据挖掘必将在各行各业中得到广泛的应用。　　 ... [详细]

蜡笔小新 2023-10-15 21:37:37
多线程
shell脚本实战 pdf_Shell 脚本操作数据库实战

安装mariadb数据库（默认没有密码，直接mysql即可进入数据库管理控制台）yuminstallmariadbmariadb-serv ... [详细]

蜡笔小新 2023-10-15 21:32:24
多线程
Google Contacts API未返回输出 - Google Contacts API not returning output

Itwasworkingcorrectly,butyesterdayitstartedgiving401.IhavetriedwithGooglecontactsAPI ... [详细]

蜡笔小新 2023-10-15 16:40:16
多线程
bat大牛带你深度剖析android 十大开源框架_请收好！5大领域，21个必知的机器学习开源工具...

全文共3744字，预计学习时长7分钟本文将介绍21个你可能没使用过的机器学习开源工具。每个开源工具都为数据科学家处理数据库提供了不同角度。本文将重点介绍五种机器学习的 ... [详细]

蜡笔小新 2023-10-15 15:52:17

god

快出去找工作了，加油！！！

Tags | 热门标签

RankList | 热门文章