selfattention（自注意力机制）

作者：年轻的蒲山公_777 | 来源：互联网 | 2023-08-14 11:24

论文地址：https:arxiv.orgabs1706.03762notes：在transform中使用到了self-attention，

论文地址&＃xff1a;https://arxiv.org/abs/1706.03762

notes&＃xff1a;在transform中使用到了self-attention&＃xff0c;所以对其中进行简要笔记。

Q1:为什么要提出self-attention&＃xff1f;

A1:self-attention就是想让计算机和人一样有关注的重点

比如&＃xff1a;qinxin is a good gril&＃xff0c;she looks beautiful&＃xff0c;

其中这个she代表的是哪一个&＃xff0c;对于我们来说很简单&＃xff0c;对于计算机就很难&＃xff0c;所以需要让计算机的注意力&＃xff0c;集中到qinxin上去&＃xff0c;就是我们要做的部分。

Q2&＃xff1a;基本流程

A2&＃xff1a;首先我们输入4个向量&＃xff0c;然后通过self-attention全部进行接收&＃xff0c;然后进行self-attention后&＃xff0c;输出的结果就是with context的了&＃xff08;与背景或是上下文有关的了&＃xff09;&＃xff0c;之后在进行操作之后就不仅仅是只考虑在单独的输入对象&＃xff0c;而考虑的是整体&＃xff08;如在进行3D-UNet 类似&＃xff0c;进行上下文提取&＃xff09;。

如图下面 $\alpha ^{1},\alpha ^{2},\alpha ^{3},\alpha ^{4}$

$\alpha ^{1}$ https://b23.tv/gucpvt

详解Transformer中Self-Attention以及Multi-Head Attention_霹雳吧啦Wz-CSDN博客_multi-head self-attention原文名称&＃xff1a;Attention Is All You Need原文链接&＃xff1a;https://arxiv.org/abs/1706.03762最近Transformer在CV领域很火&＃xff0c;Transformer是2017年Google在Computation and Language上发表的&＃xff0c;当时主要是针对自然语言处理领域提出的&＃xff08;之前的RNN模型记忆长度有限且无法并行化&＃xff0c;只有计算完tit_iti时刻后的数据才能计算ti&＃43;1t_{i&＃43;1}ti&＃43;1时刻的数据&＃xff0c;但Transformer可以&＃xff09;。在这篇文章中作者提出了Shttps://blog.csdn.net/qq_37541097/article/details/117691873

台大李宏毅21年机器学习课程 self-attention和transformer_哔哩哔哩_bilibili

推荐阅读

process
从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展

从2019年AI顶级会议最佳论文，探索深度学习的理论根基与前沿进展 ... [详细]

蜡笔小新 2024-11-03 10:42:12
process
利用OpenCV和线性SVM实现人脸识别

本文介绍如何使用OpenCV和线性支持向量机（SVM）模型来开发一个简单的人脸识别系统，特别关注在只有一个用户数据集时的处理方法。 ... [详细]

蜡笔小新 2024-11-13 14:50:37
process
Vision Transformer (ViT) 和 DETR 深度解析

本文详细介绍了 Vision Transformer (ViT) 和 DETR 的工作原理，并提供了相关的代码实现和参考资料。通过观看教学视频和阅读博客，对 ViT 的全流程进行了详细的笔记整理，包括代码详解和关键概念的解释。 ... [详细]

蜡笔小新 2024-11-12 20:32:38
list
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
case
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
case
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
case
每日前端实战：148# 视频教程展示纯 CSS 实现按钮两侧滑入装饰元素的悬停效果

通过点击页面右侧的“预览”按钮，您可以直接在当前页面查看效果，或点击链接进入全屏预览模式。该视频教程展示了如何使用纯 CSS 实现按钮两侧滑入装饰元素的悬停效果。视频内容具有互动性，观众可以实时调整代码并观察变化。访问以下链接体验完整效果：https://codepen.io/comehope/pen/yRyOZr。 ... [详细]

蜡笔小新 2024-11-07 14:24:29
case
每日学术推荐：异质图神经网络在抽取式文档摘要中的应用研究

在抽取式文档摘要任务中，学习跨句子关系是至关重要的一步。本文探讨了利用异质图神经网络来捕捉句子间复杂关系的有效方法。通过构建包含不同类型节点和边的图结构，模型能够更准确地识别和提取关键信息，从而生成高质量的摘要。实验结果表明，该方法在多个基准数据集上显著优于传统方法。 ... [详细]

蜡笔小新 2024-11-06 13:02:39
数组
机器学习中的标准化缩放、最小-最大缩放及鲁棒缩放技术解析

机器学习中的标准化缩放、最小-最大缩放及鲁棒缩放技术解析 ... [详细]

蜡笔小新 2024-11-05 15:46:18
list
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
process
探索聚类分析中的K-Means与DBSCAN算法及其应用

聚类分析是一种用于解决样本或特征分类问题的统计分析方法，也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分，适用于球形分布的数据集；而DBSCAN算法则基于密度进行聚类，能够有效识别任意形状的簇，并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析，本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]

蜡笔小新 2024-11-04 13:20:39
process
深入浅出解读奇异值分解，助你轻松掌握核心概念

深入浅出解读奇异值分解，助你轻松掌握核心概念 ... [详细]

蜡笔小新 2024-11-03 15:12:45
filter
python绘制拟合回归散点图_机器学习之利用Python进行简单线性回归分析

前言：在利用机器学习方法进行数据分析时经常要了解变量的相关性，有时还需要对变量进行回归分析。本文首先对人工智能机器学习深度学习、相关分析因果分析回归分析 ... [详细]

蜡笔小新 2024-10-15 16:59:18
filter
中文分词_中文分词技术小结几大分词引擎的介绍与比较

篇首语：本文由编程笔记#小编为大家整理，主要介绍了中文分词技术小结几大分词引擎的介绍与比较相关的知识，希望对你有一定的参考价值。笔者想说：觉得英文与中文分词有很大的区别， ... [详细]

蜡笔小新 2024-10-13 12:29:25
filter
当人工智能（AI）撞上供应链

了解供应链简单来说，供应链涉及一系列旨在向最终用户提供产品或服务的步骤。企业组织及其供应商之间始终存在一个网络，来生产特定产品并将其交付给最终用户。该网络包括不同的活动、人员、实体 ... [详细]

蜡笔小新 2024-10-11 18:25:31

年轻的蒲山公_777

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章