热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

keras生成句子向量词向量_词向量评估方法

EvaluationmethodsforunsupervisedwordembeddingsTableofContents1.背景及问题描述2.已有的解决方案3.提出的解决方案4.

Evaluation methods for unsupervised word embeddings

Table of Contents
  • 1. 背景及问题描述
  • 2. 已有的解决方案
  • 3. 提出的解决方案
  • 4. 词频对词向量的影响

论文作者来源一句话概述链接源码数据词向量评估方法CornellACL 2015 https://www.aclweb.org/anthology/D15-1036.pdf

ef7d9176a1add9ccb0f2c0ac34b98811.png

Note

本文是对词向量评估的方法综述:

  • 内在评估方法,直接评估词语之间的相似性
  • 外在评估方法,通过下游任务的表现来间接评估

得出两个结论:

  • 不同下游任务,不同的词向量构造方法表现有差异。一种方法不会完美适用于所有下游任务。(这个在今天已经是常识)
  • 词向量中蕴含词频信息,是词向量的一个缺陷。(数据驱动的弊端,对于低频词表现差)

1 背景及问题描述

词向量是在大规模语料上训练出来的中间产物。本文是对如何评估word-embeding的质量的一个综述。

2 已有的解决方案

词向量提供语法、语义信息。目前评估词向量的方法可以分为两类:

  • 内在(Intrinsic):直接评估词之间的语法、语义关系。相关性: 对两个词之间的相关性进行人工评分。两个词之间的cos相似度作为基于词向量的评分。通过比较cos相似度和人工评分的相关性,来评估。类比analogy: vec(中国)-vec(北京)=vec(法国)-vec(巴黎)分类:对词打上类别标签,通过词向量来聚类,评判聚类好坏词法:确定一个名词是主语还是宾语
641883baae8182fc67488a974af98db2.png
  • 外在(Extrinsic):将训练好的词向量作为下游任务的输入特征,通过下游任务表现来评估词向量的质量高低。比如NER、情感分析等下游任务。

3 提出的解决方案

通过亚马逊劳务众包平台(Amazon MechanicalTurk)直接评估不同词向量的质量高低。

直接人工评估相关性

  • 精心人为设计100个query词(考虑了词频、词性、抽象/具体)
  • 通过6种不同构造词向量的方法,将query词最相似的前k个候选词
  • 让众包人员选出最相似的一个词

如果某种方法选出的候选词和人工评估的吻合度越高,代表效果越好。

0935a9767c6ea1b615919507c3d09d54.png

一致性(离群点检测)

通过词向量构造数据集:

  • 自动找出query word(a)两个最相似的词语b和c,
  • 和一个不相关的词语,作为离群点
  • 让众包人员从四个词语中,去找到不相关的那个词语

众包人员找到离群点的Precision作为评估指标。

a9ad79f184b094c27ca2ef2583d52a3c.png

4 词频对词向量的影响

拿词向量作为特征,通过LR来预测一个词是否高频词。对于各种方法,都能比较准确地进行分类。得出结论:词向量蕴含了词频的信息。

词向量的相似度和词频比较强的相关性。

64bd46eafa1dfaeea99dd7b948e216f8.png

Note

理论而言,考虑两个词的相关性,和词频没有任何关系。(不能说一个词越常见,就和query word越相似)

但词向量是基于大规模语料训练出来的,数据驱动,数据中高频词和低频词对词向量是有影响的。本文通过词频分类、相关性分析,指出了词向量的一个缺陷。



推荐阅读
  • 在第七天的深度学习课程中,我们将重点探讨DGL框架的高级应用,特别是在官方文档指导下进行数据集的下载与预处理。通过详细的步骤说明和实用技巧,帮助读者高效地构建和优化图神经网络的数据管道。此外,我们还将介绍如何利用DGL提供的模块化工具,实现数据的快速加载和预处理,以提升模型训练的效率和准确性。 ... [详细]
  • MongoDB高可用架构:深入解析Replica Set机制
    MongoDB的高可用架构主要依赖于其Replica Set机制。Replica Set通过多个mongod节点的协同工作,实现了数据的冗余存储和故障自动切换,确保了系统的高可用性和数据的一致性。本文将深入解析Replica Set的工作原理及其在实际应用中的配置和优化方法,帮助读者更好地理解和实施MongoDB的高可用架构。 ... [详细]
  • 计算机视觉领域介绍 | 自然语言驱动的跨模态行人重识别前沿技术综述(上篇)
    本文介绍了计算机视觉领域的最新进展,特别是自然语言驱动的跨模态行人重识别技术。上篇内容详细探讨了该领域的基础理论、关键技术及当前的研究热点,为读者提供了全面的概述。 ... [详细]
  • 最详尽的4K技术科普
    什么是4K?4K是一个分辨率的范畴,即40962160的像素分辨率,一般用于专业设备居多,目前家庭用的设备,如 ... [详细]
  • 在拉斯维加斯举行的Interop 2011大会上,Bitcurrent的Alistair Croll发表了一场主题为“如何以云计算的视角进行思考”的演讲。该演讲深入探讨了传统IT思维与云计算思维之间的差异,并提出了在云计算环境下应具备的新思维方式。Croll强调了灵活性、可扩展性和成本效益等关键要素,以及如何通过这些要素来优化企业IT架构和运营。 ... [详细]
  • 在前文探讨了Spring如何为特定的bean选择合适的通知器后,本文将进一步深入分析Spring AOP框架中代理对象的生成机制。具体而言,我们将详细解析如何通过代理技术将通知器(Advisor)中包含的通知(Advice)应用到目标bean上,以实现切面编程的核心功能。 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 包含phppdoerrorcode的词条 ... [详细]
  • Java 并发编程:RunnableScheduledFuture 接口详解
    本文深入解析了 Java 并发编程中 RunnableScheduledFuture 接口的源代码及其在标准线程池中的应用。 ... [详细]
  • 为什么多数程序员难以成为架构师?
    探讨80%的程序员为何难以晋升为架构师,涉及技术深度、经验积累和综合能力等方面。本文将详细解析Tomcat的配置和服务组件,帮助读者理解其内部机制。 ... [详细]
  • This feature automatically validates new regions using the AWS SDK, ensuring compatibility and accuracy. ... [详细]
  • 题目描述:牛客网新员工Fish每天早上都会拿着一本英文杂志,在本子上写下一些句子。他的同事Cat对这些句子非常感兴趣,但发现这些句子的单词顺序被反转了。例如,“student. a am I”实际上是“I am a student.”。Cat请求你帮助他恢复这些句子的正常顺序。 ... [详细]
  • 三角测量计算三维坐标的代码_双目三维重建——层次化重建思考
    双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记,本文从宏观的角度阐 ... [详细]
  • 基于iSCSI的SQL Server 2012群集测试(一)SQL群集安装
    一、测试需求介绍与准备公司计划服务器迁移过程计划同时上线SQLServer2012,引入SQLServer2012群集提高高可用性,需要对SQLServ ... [详细]
  • 本文介绍如何使用 Python 的 DOM 和 SAX 方法解析 XML 文件,并通过示例展示了如何动态创建数据库表和处理大量数据的实时插入。 ... [详细]
author-avatar
SP_Club
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有