当前位置: 开发笔记 > 编程语言 > 正文

Glove与Attention机制资料的整理

作者：勇于明天2015 | 来源：互联网 | 2023-08-04 10:38

1Glove:论文出处：Python迁移学习P208-209这本书讲解Gl

1 Glove:

论文出处&＃xff1a;<>

Python 迁移学习P208-209

这本书讲解Glove部分需要关注的一点是&＃xff1a;

词汇表外&＃xff08;Out-Of-Vocabulary OOV&＃xff09; 这一概念

实现步骤&＃xff1a;首先创建一个庞大的单词-上下文&＃xff08;Word-Context&＃xff09;共现矩阵

WC&＃61;WF(Word-Feature)*FC(Feature-Content)

Word2Vec模型和Glove模型在工作方式上非常相似&＃xff0c;它们的目的都是构建一个向量空间&＃xff0c;每个词的位置都基于上下文和语义并且受到其相邻词的影响。

Word2vec模型从单词共现对的本地单个事例开始&＃xff0c;而Glove模型从整个语料库中所有单词的全局汇总共现统计开始

词向量经典模型&＃xff1a;从word2vec、gove、ELMO到BERT

参考链接&＃xff1a;https://blog.csdn.net/xiayto/article/details/84730009

关注点&＃xff1a;

对于词向量模型进化的过程有一个大致的了解&＃xff0c;这对于后面深入学习有一定的帮助

word2vec

来源于2013年的论文《Efficient Estimation of Word Representation in Vector Space》&＃xff0c;它的核心思想是通过词的上下文得到词的向量化表示&＃xff0c;有两种方法&＃xff1a;CBOW&＃xff08;通过附近词预测中心词&＃xff09;、Skip-gram&＃xff08;通过中心词预测附近的词&＃xff09;&＃xff1a;

Glove:

word2vec只考虑到了词的局部信息&＃xff0c;没有考虑到词与局部窗口外词的联系&＃xff0c;glove利用共现矩阵&＃xff0c;同时考虑了局部信息和整体的信息。来自论文《Glove: Global vectors for word representation》

ELMO

ELMO来自于论文《Deep contextualized word representations》&＃xff0c;它的官网有开源的工具&＃xff1a;https://allennlp.org/elmo

word2vec和glove存在一个问题&＃xff0c;词在不同的语境下其实有不同的含义&＃xff0c;而这两个模型词在不同语境下的向量表示是相同的&＃xff0c;Elmo就是针对这一点进行了优化

BERT

BERT的工作方式跟ELMo是类似的&＃xff0c;但是ELMo存在一个问题&＃xff0c;它的语言模型使用的是LSTM&＃xff0c;而不是google在2017最新推出的Transformer&＃xff08;来自论文《Attention is all you need》&＃xff09;

理解GloVe模型&＃xff08;&＃43;总结&＃xff09;

参考链接&＃xff1a;https://blog.csdn.net/u014665013/article/details/79642083

关注点&＃xff1a;

介绍了举了窗口宽度为5的例子&＃xff0c;来讲明共现矩阵。同时对于公式进行了比较详细的梳理

使用GloVe模型训练词向量

模型公式

TensorFlow 自然语言处理P88-89

关注点&＃xff1a;

这本书还是比较推荐读的&＃xff0c;提及到了Glove提出的思路-基于全局的矩阵分解的方法或基于局部上下文窗口的方法

学习词向量的方法分为两类&＃xff1a;基于全局的矩阵分解的方法或基于局部上下文窗口的方法。LSA-全局分解-有效地利用了全局统计信息&＃xff0c;但在单词类比任务中表现不佳。

Skip-gram、CBOW-基于局部上下文窗口的方法&＃xff0c;单词类比佳&＃xff0c;但没用全局信息所以有改进的空间

Glove有效利用了全局语料库统计数据&＃xff0c;同时以类似于skip-gram或CBOW这种基于上下文上窗口的方式来优化学习模型

代码实现&＃xff1a;

https://github.com/PacktPublishing/Natural-Language-Processing-with-TensorFlow/blob/master/ch4/ch4_glove.ipynb”

2 Attention:

论文出处&＃xff1a;<>

np中的Attention注意力机制&＃43;Transformer详解

参考链接&＃xff1a;https://www.zhihu.com/question/68482809

关注点&＃xff1a;

self-attention

自注意力机制为什么如此强大; 利用注意力机制来“动态”地生成不同连接的权重&＃xff0c;从而处理变长的信息序列。

需要讲解一下&＃xff0c;Attention的计算的流程

完全图解RNN、RNN变体、Seq2Seq、Attention机制

参考链接&＃xff1a;https://www.leiphone.com/news/201709/8tDpwklrKubaecTa.html

关注点&＃xff1a;

这里补充了RNN、Seq2Seq、Attention基础

Notes:

目录就先不补上&＃xff0c;这周会继续对Attention这部分进行补充。讲解一下Attention的变体、公式推导、计算过程、Self-Attention的使用

喜欢的客观点个赞呗~

推荐阅读

stream
Python 伦理黑客技术：深入探讨后门攻击（第三部分）

在《Python 伦理黑客技术：深入探讨后门攻击（第三部分）》中，作者详细分析了后门攻击中的Socket问题。由于TCP协议基于流，难以确定消息批次的结束点，这给后门攻击的实现带来了挑战。为了解决这一问题，文章提出了一系列有效的技术方案，包括使用特定的分隔符和长度前缀，以确保数据包的准确传输和解析。这些方法不仅提高了攻击的隐蔽性和可靠性，还为安全研究人员提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 16:33:02
match
Java 15 发布，带来多项重要更新！

2020年9月15日，Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性，包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]

蜡笔小新 2024-11-14 12:11:09
get
Python基础：使用NLTK和Python构建机器学习应用

本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节，作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识，为后续的机器学习应用打下坚实的基础。 ... [详细]

蜡笔小新 2024-11-13 21:23:34
version
开机自启动的几种方式

0x01快速自启动目录快速启动目录自启动方式源于Windows中的一个目录，这个目录一般叫启动或者Startup。位于该目录下的PE文件会在开机后进行自启动 ... [详细]

蜡笔小新 2024-11-12 11:16:30
foreach
C++ 异步编程中获取线程执行结果的方法与技巧及其在前端开发中的应用探讨

本文探讨了C++异步编程中获取线程执行结果的方法与技巧，并深入分析了这些技术在前端开发中的应用。通过对比不同的异步编程模型，本文详细介绍了如何高效地处理多线程任务，确保程序的稳定性和性能。同时，文章还结合实际案例，展示了这些方法在前端异步编程中的具体实现和优化策略。 ... [详细]

蜡笔小新 2024-11-09 15:14:28
version
Cookie学习小结

Cookie学习小结 ... [详细]

蜡笔小新 2024-11-14 16:26:25
match
python模块之正则

re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求，从一段字符串中找到符合要求的内容。在 ... [详细]

蜡笔小新 2024-11-14 15:52:38
bit
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
copy
解决Bootstrap DataTable Ajax请求重复问题

在最近的一个项目中，我们使用了JQuery DataTable进行数据展示，虽然使用起来非常方便，但在测试过程中发现了一个问题：当查询条件改变时，有时查询结果的数据不正确。通过FireBug调试发现，点击搜索按钮时，会发送两次Ajax请求，一次是原条件的请求，一次是新条件的请求。 ... [详细]

蜡笔小新 2024-11-12 13:59:27
get
第二十五天接口、多态

1.java是面向对象的语言。设计模式：接口接口类是从java里衍生出来的，不是python原生支持的主要用于继承里多继承抽象类是python原生支持的主要用于继承里的单继承但是接 ... [详细]

蜡笔小新 2024-11-12 06:43:20
command
Mac上安装Jupyter Notebook的详细步骤与技巧

本文将详细介绍如何在Mac上安装Jupyter Notebook，并提供一些常见的问题解决方法。通过这些步骤，您将能够顺利地在Mac上运行Jupyter Notebook。 ... [详细]

蜡笔小新 2024-11-12 00:45:51
version
如何在Nginx服务器上轻松配置CertBot以实现SSL证书自动化管理

为了确保iOS应用能够安全地访问网站数据，本文介绍了如何在Nginx服务器上轻松配置CertBot以实现SSL证书的自动化管理。通过这一过程，可以确保应用始终使用HTTPS协议，从而提升数据传输的安全性和可靠性。文章详细阐述了配置步骤和常见问题的解决方法，帮助读者快速上手并成功部署SSL证书。 ... [详细]

蜡笔小新 2024-11-10 08:42:08
version
MATLAB字典学习工具箱SPAMS：稀疏与字典学习的详细介绍、配置及应用实例

SPAMS（Sparse Modeling Software）是一个强大的开源优化工具箱，专为解决多种稀疏估计问题而设计。该工具箱基于MATLAB，提供了丰富的算法和函数，适用于字典学习、信号处理和机器学习等领域。本文将详细介绍SPAMS的配置方法、核心功能及其在实际应用中的典型案例，帮助用户更好地理解和使用这一工具箱。 ... [详细]

蜡笔小新 2024-11-09 16:17:27
spring
Web开发框架概览：Java与JavaScript技术及框架综述

Web开发涉及服务器端和客户端的协同工作。在服务器端，Java是一种优秀的编程语言，适用于构建各种功能模块，如通过Servlet实现特定服务。客户端则主要依赖HTML进行内容展示，同时借助JavaScript增强交互性和动态效果。此外，现代Web开发还广泛使用各种框架和库，如Spring Boot、React和Vue.js，以提高开发效率和应用性能。 ... [详细]

蜡笔小新 2024-11-09 11:59:38
match
计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述（上篇）

本文介绍了计算机视觉领域的最新进展，特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点，为读者提供了全面的概述。 ... [详细]

蜡笔小新 2024-11-07 12:41:08