热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

AIS2019见闻

作者:王狄烽、张清恒本期《自然语言处理与信息检索国际论文研讨会暨AIS2019(ACL、IJCAL、SIGIR)论文报告会》(简称AIS2019)由中文信息学会、杭州钱塘新区管委会主办,搜狗杭州研究院承办,于2019年5月25日-5月26日,在位于大创小镇的国际创博中心举办。本次研讨会邀请了将在ACL、IJCAL、SIGIR2019三大会议上进行报告的论文进行提前预讲,讨论的范围包括“对话生成”、

作者:王狄烽、张清恒

本期《自然语言处理与信息检索国际论文研讨会暨AIS2019(ACL、IJCAL、SIGIR)论文报告会》(简称AIS2019)由中文信息学会、杭州钱塘新区管委会主办,搜狗杭州研究院承办,于2019年5月25日-5月26日,在位于大创小镇的国际创博中心举办。

本次研讨会邀请了将在ACL、IJCAL、SIGIR2019三大会议上进行报告的论文进行提前预讲,讨论的范围包括“对话生成”、“阅读理解”、“检索与推荐”、“机器学习与表示”、“机器翻译”、“文本生成”、“信息抽取与情感分析”七个部分,共计59篇论文报告。报告中频繁出现的 核心词 包括: AttentionGNNBERT 等。

在正式论文报告之前,研讨会首先进行了AIS发展趋势报告,由来自清华大学的刘知远老师、北京大学的严睿老师、清华大学的马为之老师分别进行了ACL趋势综述、IJCAL趋势综述、SIGIR趋势综述,分别对这三个会议的走向进行了介绍,下面我主要介绍一下刘知远老师汇报的ACL发展趋势内容。

ACL发展趋势报告

ACL发展趋势报告内容总结起来有一下三点:

  • 1)NLP黄金时代:投稿量剧增(2019年1609长文,1085短文,1610审稿人,230AC,长文录用率25%)
  • 2)投稿热门领域基本与2018一致,前三为:Information Extraction(9%)、Machine Learning(8%)、Machine Translation(8%),同时以下领域相比2018有了明显的提升:Linguistic Theories, Cognitive Modeling and Psycholinguistics
  • 3)ACL趋势总结:预训练语言模型、低资源NLP任务、模型可解释性、更多任务&数据集

AIS2019见闻

AIS2019见闻

2018年深度学习的一个重大进展,即以ELMo、GPT、BERT为代表的预训练语言模型的重大突破,从2013年使用word2vec从大规模无监督文本中学习词向量,简单的刻画单词之间的语义关系(未考虑一词多义、无法建模复杂语境)到ELMo等通过预训练语言模型产生上下文相关的词向量。预训练语言模型仍有大量可探索的内容:多任务、多语言、复杂知识等。

AIS2019见闻

针对现有自然语言任务中缺乏标记数据的情况,通过迁移学习、元学习、半监督学习等方向探索少样本学习。

AIS2019见闻

在可解释性方向,报告主要提到了三点:1、对抗样本攻击2、如何在推理中考虑常识知识3、结合知识图谱与文本进行推理。

AIS2019见闻

更多任务,多语言自然语言推理、多语言问答、文档级别关系抽取(带推理信息)。

下面介绍一些会场报告。

DocRED: A Large-Scale Document-Level Relation Extraction Dataset

主讲人:清华大学 姚远

该篇论文针对现有关系抽取数据集只进行句子级别的关系抽取,构建了文档级别的关系抽取数据集(据统计,大约42.2%的实体关系出现在多个句子中),并且注重文档中实体关系的推理。在该DocRED数据集中,标注了实体、实体之间关系、支持该关系的证据数量、以及相应的文档。其数据构建的步骤大致分为四步:1、使用远程监督对wikipedia文档进行初始标记并筛选(保留实体数量多的文档)2、标记文档中的实体及其指代信息3、进行实体链接(link to wikidata items)4、标注实体之间的关系及相关的证据。针对文档中存在的大量实体对,为提高标记效率,其标记流程如下:1、机器自动推荐(使用现有的关系抽取模型)2、crowd-worker修正3、experienced crowd-worker修正。其数据规模及评估结果如下所示:

AIS2019见闻 AIS2019见闻

Joint Type Inference on Entities and Relations via Graph Convolutional Networks

主讲人: MSRA  孙长志

该篇论文主要做实体和关系的联合抽取,其动机如下:1、加强实体和关系之间模型的交互2、抽取更多更丰富的特征(实体-实体特征、实体-关系特征、关系-关系特征)而不是设计复杂的联合推理。其构建Entity-Relation Graph,将每一个实体和关系转为图中节点,将关系节点和相应的两个实体连边,构建了实体-关系图。在构建了实体-关系图的基础上,其框架主要流程如下:1、Entity span detection 2、Node Embedding Extractor 3、GCN based Entity type and Relation Type Inference。其最终在ACE05数据集上取得了state-of-the-art结果。 AIS2019见闻 AIS2019见闻 AIS2019见闻

Relation-Aware Entity Alignment for Heterogeneous Knowledge Graphs

主讲人:北京大学 吴雨婷

该论文旨在解决知识图谱中的实体对齐问题,为了能够捕获复杂的语义信息,作者提出了一种关系敏感式对偶图卷积网络(Relation-aware Dual-Graph Convolutional Network, RDGCN)模型。

首先,基于原始的图结构构建对偶关系图;然后,通过原始attention层和对偶attention层进行迭代;接着,通过GCN网络进一步结合结构信息;最后,得到实体的向量表示,用于实体对齐任务。

该论文的实验部分采用了JAPE[]的数据集DBP15K,主要对比方法有MTransE、JAPE、IPTransE、BootEA和GCN-Align,该论文所提出的方法RDGCN取得了相对较优的结果。

AIS2019见闻 AIS2019见闻 AIS2019见闻


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 我们


推荐阅读
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • 京东AI创新之路:周伯文解析京东AI战略的独特之处
    2018年4月15日,京东在北京举办了人工智能创新峰会,会上首次公开了京东AI的整体布局和发展方向。此次峰会不仅展示了京东在AI领域的最新成果,还标志着京东AI团队的首次集体亮相。本文将深入探讨京东AI的发展策略及其与BAT等公司的不同之处。 ... [详细]
  • Coursera ML 机器学习
    2019独角兽企业重金招聘Python工程师标准线性回归算法计算过程CostFunction梯度下降算法多变量回归![选择特征](https:static.oschina.n ... [详细]
  • 毕业设计:基于机器学习与深度学习的垃圾邮件(短信)分类算法实现
    本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程,并提供了具体的代码示例和实验结果。 ... [详细]
  • 计算机学报精选论文概览(2020-2022)
    本文汇总了2020年至2022年间《计算机学报》上发表的若干重要论文,旨在为即将投稿的研究者提供参考。 ... [详细]
  • ImmutableX Poised to Pioneer Web3 Gaming Revolution
    ImmutableX is set to spearhead the evolution of Web3 gaming, with its innovative technologies and strategic partnerships driving significant advancements in the industry. ... [详细]
  • 本文介绍了在Windows环境下使用pydoc工具的方法,并详细解释了如何通过命令行和浏览器查看Python内置函数的文档。此外,还提供了关于raw_input和open函数的具体用法和功能说明。 ... [详细]
  • 尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络(RNN)的门槛,但对于初学者来说,理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理(NLP)的RNN模型。 ... [详细]
  • 尽管深度学习带来了广泛的应用前景,其训练通常需要强大的计算资源。然而,并非所有开发者都能负担得起高性能服务器或专用硬件。本文探讨了如何在有限的硬件条件下(如ARM CPU)高效运行深度神经网络,特别是通过选择合适的工具和框架来加速模型推理。 ... [详细]
  • 在一个大型的应用系统中,往往需要多个进程相互协作,进程间通信(IPC,InterProcessCommunication)就显得比较重要了。在Linux系统中,有很多种IPC机制, ... [详细]
  • 本文详细介绍如何使用Python进行配置文件的读写操作,涵盖常见的配置文件格式(如INI、JSON、TOML和YAML),并提供具体的代码示例。 ... [详细]
  • 深入解析:手把手教你构建决策树算法
    本文详细介绍了机器学习中广泛应用的决策树算法,通过天气数据集的实例演示了ID3和CART算法的手动推导过程。文章长度约2000字,建议阅读时间5分钟。 ... [详细]
  • 机器学习中的相似度度量与模型优化
    本文探讨了机器学习中常见的相似度度量方法,包括余弦相似度、欧氏距离和马氏距离,并详细介绍了如何通过选择合适的模型复杂度和正则化来提高模型的泛化能力。此外,文章还涵盖了模型评估的各种方法和指标,以及不同分类器的工作原理和应用场景。 ... [详细]
  • 视觉Transformer综述
    本文综述了视觉Transformer在计算机视觉领域的应用,从原始Transformer出发,详细介绍了其在图像分类、目标检测和图像分割等任务中的最新进展。文章不仅涵盖了基础的Transformer架构,还深入探讨了各类增强版Transformer模型的设计思路和技术细节。 ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
author-avatar
多米音乐_34324431
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有