当前位置: 开发笔记 > 编程语言 > 正文

NLP深度学习——CS224学习笔记12

作者：妩媚舞乙 | 来源：互联网 | 2023-08-13 21:58

1.2语法松绑SU-RNN不同类别输入的最优W不同。对学习W的工作量加大，但性能提升。现在模型受输入的语法类别条件约束。我们决定类别的方法是通过一个简单的Probabili

1.2 语法松绑SU-RNN

不同类别输入的最优W不同。

对学习W的工作量加大，但性能提升。

现在模型受输入的语法类别条件约束。

我们决定类别的方法是通过一个简单的Probabilistic Context Free Grammar PCFG，通过计算Penn Tree Bank的统计摘要习得。例如The永远是DT.

我们初始化相同的W，默认是平均两个输入的向量。慢慢的模型学习到哪个向量更重要，以及旋转或缩放向量是否能提高性能。

例如DT-NP规则，会更重视名词而不是修饰它的定冠词。

SU-RNN超过此前的模型，但表达性仍然不够。

例如副词被定义为用于强调。如果我们只进行线性插值无法用一个向量来强调另一个向量，无法对其进行缩放。

1.3 MV-RNN 矩阵-向量递归神经网络

词表征不仅包括一个向量，也包括一个矩阵。

这样我们不仅能得到词的意义，也能学习它修饰另一个词的方法。

通过缩放相邻词的向量来得到修饰关系。

通过观察模型误差，一些关系仍然无法表达。

一是表示相反意思的词无法给予足够的重视，例如将most改为least应该完全改变句子的意思。

二是无法识别负负得正关系，例如加上not应该缓解原先的负面情绪。

三是转则关系，例如负面但是正面应该被视为正面意思表达。

1.4 RNTN 递归神经张量网络

我们还是将两个词向量或短语向量结合成一个向量。

我们先把它输入一个二次方程然后非线性处理，例如

注意V

我们计算

然后加上W_x输入非线性函数。

二次方程使我们可以表达词向量之间倍数类型的关系而不需要学习词矩阵。

RNTN是唯一能够解决上述问题的方法。

通过动态卷积神经网络我们可以取得超过RNTN表现的模型并不需要输入解析树。

推荐阅读

io
2019年斯坦福大学CS224n课程笔记：深度学习在自然语言处理中的应用——Word2Vec与GloVe模型解析

本文详细解析了2019年斯坦福大学CS224n课程中关于深度学习在自然语言处理（NLP）领域的应用，重点探讨了Word2Vec和GloVe两种词嵌入模型的原理与实现方法。通过具体案例分析，深入阐述了这两种模型在提升NLP任务性能方面的优势与应用场景。 ... [详细]

蜡笔小新 2024-10-29 10:37:07
list
com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例

com.sun.javadoc.PackageDoc.exceptions()方法的使用及代码示例 ... [详细]

蜡笔小新 2024-11-13 10:47:33
tree
机器学习的持续探索与进展

在机器学习领域，深入探讨了概率论与数理统计的基础知识，特别是这些理论在数据挖掘中的应用。文章重点分析了偏差（Bias）与方差（Variance）之间的平衡问题，强调了方差反映了不同训练模型之间的差异，例如在K折交叉验证中，不同模型之间的性能差异显著。此外，还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡，以提高模型的泛化能力。 ... [详细]

蜡笔小新 2024-11-11 10:27:39
io
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
list
能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察

本周科技前沿报道了多项重要进展，包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果，以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是，一款能够感知用户情绪状态的智能机器人即将问世，为未来的人机交互带来了全新的可能性。 ... [详细]

蜡笔小新 2024-11-05 20:45:31
uri
投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元

投融资周报 | Circle 达成 4 亿美元融资协议，唯一艺术平台 A 轮融资超千万美元 ... [详细]

蜡笔小新 2024-11-05 04:56:42
list
深入解析 Android TextView 中 getImeActionLabel() 方法的使用与代码示例

深入解析 Android TextView 中 getImeActionLabel() 方法的使用与代码示例 ... [详细]

蜡笔小新 2024-11-04 19:48:30
tree
表面缺陷检测数据集综述及GitHub开源项目推荐

本文综述了表面缺陷检测领域的数据集，并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理，为研究人员提供了全面的资源参考，有助于推动该领域的发展和技术进步。 ... [详细]

蜡笔小新 2024-10-29 08:22:46
uri
数据科学笔记26：深入解析随机森林分类算法及其在Python和R中的应用

### 摘要随机森林是一种在集成学习领域备受推崇的算法，被誉为“集成学习技术的典范”。该方法因其简洁性、易实现性和较低的计算成本而被广泛应用。本文将深入探讨随机森林的工作原理，特别是其在Python和R中的具体应用。随机森林通过结合多个决策树和Bagging技术，有效提高了模型的准确性和鲁棒性。我们将详细解析其核心机制，并通过实际案例展示如何在不同编程环境中高效实现这一强大的分类算法。 ... [详细]

蜡笔小新 2024-10-24 11:40:42
ip
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
list
javascript分页类支持页码格式

前端时间因为项目需要，要对一个产品下所有的附属图片进行分页显示，没考虑ajax一张张请求，所以干脆一次性全部把图片out，然 ... [详细]

蜡笔小新 2024-11-12 14:58:57
list
实验九：使用SharedPreferences存储简单数据

本实验旨在帮助学生理解和掌握使用SharedPreferences存储和读取简单数据的方法，包括程序参数和用户选项。 ... [详细]

蜡笔小新 2024-11-12 14:21:47
list
清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期）

清华大学出版社 | 杨丹：基于MATLAB机器视觉的黑色素瘤皮肤癌检测技术及源代码分析（第1689期） ... [详细]

蜡笔小新 2024-11-07 13:30:09
io
每日学术推荐：异质图神经网络在抽取式文档摘要中的应用研究

在抽取式文档摘要任务中，学习跨句子关系是至关重要的一步。本文探讨了利用异质图神经网络来捕捉句子间复杂关系的有效方法。通过构建包含不同类型节点和边的图结构，模型能够更准确地识别和提取关键信息，从而生成高质量的摘要。实验结果表明，该方法在多个基准数据集上显著优于传统方法。 ... [详细]

蜡笔小新 2024-11-06 13:02:39
tree
深入解析经典卷积神经网络及其实现代码

深入解析经典卷积神经网络及其实现代码 ... [详细]

蜡笔小新 2024-11-01 11:16:09

妩媚舞乙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章