热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

AIS2019见闻

作者:王狄烽、张清恒本期《自然语言处理与信息检索国际论文研讨会暨AIS2019(ACL、IJCAL、SIGIR)论文报告会》(简称AIS2019)由中文信息学会、杭州钱塘新区管委会主办,搜狗杭州研究院承办,于2019年5月25日-5月26日,在位于大创小镇的国际创博中心举办。本次研讨会邀请了将在ACL、IJCAL、SIGIR2019三大会议上进行报告的论文进行提前预讲,讨论的范围包括“对话生成”、

作者:王狄烽、张清恒

本期《自然语言处理与信息检索国际论文研讨会暨AIS2019(ACL、IJCAL、SIGIR)论文报告会》(简称AIS2019)由中文信息学会、杭州钱塘新区管委会主办,搜狗杭州研究院承办,于2019年5月25日-5月26日,在位于大创小镇的国际创博中心举办。

本次研讨会邀请了将在ACL、IJCAL、SIGIR2019三大会议上进行报告的论文进行提前预讲,讨论的范围包括“对话生成”、“阅读理解”、“检索与推荐”、“机器学习与表示”、“机器翻译”、“文本生成”、“信息抽取与情感分析”七个部分,共计59篇论文报告。报告中频繁出现的 核心词 包括: AttentionGNNBERT 等。

在正式论文报告之前,研讨会首先进行了AIS发展趋势报告,由来自清华大学的刘知远老师、北京大学的严睿老师、清华大学的马为之老师分别进行了ACL趋势综述、IJCAL趋势综述、SIGIR趋势综述,分别对这三个会议的走向进行了介绍,下面我主要介绍一下刘知远老师汇报的ACL发展趋势内容。

ACL发展趋势报告

ACL发展趋势报告内容总结起来有一下三点:

  • 1)NLP黄金时代:投稿量剧增(2019年1609长文,1085短文,1610审稿人,230AC,长文录用率25%)
  • 2)投稿热门领域基本与2018一致,前三为:Information Extraction(9%)、Machine Learning(8%)、Machine Translation(8%),同时以下领域相比2018有了明显的提升:Linguistic Theories, Cognitive Modeling and Psycholinguistics
  • 3)ACL趋势总结:预训练语言模型、低资源NLP任务、模型可解释性、更多任务&数据集

AIS2019见闻

AIS2019见闻

2018年深度学习的一个重大进展,即以ELMo、GPT、BERT为代表的预训练语言模型的重大突破,从2013年使用word2vec从大规模无监督文本中学习词向量,简单的刻画单词之间的语义关系(未考虑一词多义、无法建模复杂语境)到ELMo等通过预训练语言模型产生上下文相关的词向量。预训练语言模型仍有大量可探索的内容:多任务、多语言、复杂知识等。

AIS2019见闻

针对现有自然语言任务中缺乏标记数据的情况,通过迁移学习、元学习、半监督学习等方向探索少样本学习。

AIS2019见闻

在可解释性方向,报告主要提到了三点:1、对抗样本攻击2、如何在推理中考虑常识知识3、结合知识图谱与文本进行推理。

AIS2019见闻

更多任务,多语言自然语言推理、多语言问答、文档级别关系抽取(带推理信息)。

下面介绍一些会场报告。

DocRED: A Large-Scale Document-Level Relation Extraction Dataset

主讲人:清华大学 姚远

该篇论文针对现有关系抽取数据集只进行句子级别的关系抽取,构建了文档级别的关系抽取数据集(据统计,大约42.2%的实体关系出现在多个句子中),并且注重文档中实体关系的推理。在该DocRED数据集中,标注了实体、实体之间关系、支持该关系的证据数量、以及相应的文档。其数据构建的步骤大致分为四步:1、使用远程监督对wikipedia文档进行初始标记并筛选(保留实体数量多的文档)2、标记文档中的实体及其指代信息3、进行实体链接(link to wikidata items)4、标注实体之间的关系及相关的证据。针对文档中存在的大量实体对,为提高标记效率,其标记流程如下:1、机器自动推荐(使用现有的关系抽取模型)2、crowd-worker修正3、experienced crowd-worker修正。其数据规模及评估结果如下所示:

AIS2019见闻 AIS2019见闻

Joint Type Inference on Entities and Relations via Graph Convolutional Networks

主讲人: MSRA  孙长志

该篇论文主要做实体和关系的联合抽取,其动机如下:1、加强实体和关系之间模型的交互2、抽取更多更丰富的特征(实体-实体特征、实体-关系特征、关系-关系特征)而不是设计复杂的联合推理。其构建Entity-Relation Graph,将每一个实体和关系转为图中节点,将关系节点和相应的两个实体连边,构建了实体-关系图。在构建了实体-关系图的基础上,其框架主要流程如下:1、Entity span detection 2、Node Embedding Extractor 3、GCN based Entity type and Relation Type Inference。其最终在ACE05数据集上取得了state-of-the-art结果。 AIS2019见闻 AIS2019见闻 AIS2019见闻

Relation-Aware Entity Alignment for Heterogeneous Knowledge Graphs

主讲人:北京大学 吴雨婷

该论文旨在解决知识图谱中的实体对齐问题,为了能够捕获复杂的语义信息,作者提出了一种关系敏感式对偶图卷积网络(Relation-aware Dual-Graph Convolutional Network, RDGCN)模型。

首先,基于原始的图结构构建对偶关系图;然后,通过原始attention层和对偶attention层进行迭代;接着,通过GCN网络进一步结合结构信息;最后,得到实体的向量表示,用于实体对齐任务。

该论文的实验部分采用了JAPE[]的数据集DBP15K,主要对比方法有MTransE、JAPE、IPTransE、BootEA和GCN-Align,该论文所提出的方法RDGCN取得了相对较优的结果。

AIS2019见闻 AIS2019见闻 AIS2019见闻


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 我们


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景,描述了学童们面对老先生的教导时的反应,以及上官如在这个过程中的表现。同时,文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后,文章强调了日期和时区操作在机器学习中的重要性,并指出了其在实际应用中的作用和意义。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 老牌医药收割AI红利:先投个15亿美元抢中国人才
    萧箫发自凹非寺量子位报道|公众号QbitAI没想到,一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场,能看见不少熟悉的身影, ... [详细]
  • 知识图谱表示概念:知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说,知识图谱是由一条条知识组成,每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • ElasticSearch成功安装完毕。 测试数据添加出现{  error:{    root_cause ... [详细]
  • Word2vec from scratch (Skip-gram & CBOW)
    在自然語言處理領域中,如何透過向量表達一個詞彙,是近幾年非常火熱的議題,在distributedrepresentation(densevector)尚未風行前,大多數的任務都以1-hotencoding作為詞彙的表示,其方法得到了高維度的稀疏向量,雖容易理解、簡單計算,但也帶來許多副作用;直至2013年,ThomasMikolov等人提出了word2vec,word2vec引用了一個概念,作者導 ... [详细]
  • oracle安装时找不到启动,Oracle没有开机自启是怎么回事?这一步骤很重要
    重启Oracle数据库重启Oracle数据库包括启动Oracle数据库服务进程和启动Oracle数据库两步,大家继续往下看。按照《【Oracle】什么?作为DBA&# ... [详细]
  • 推荐 :以数据驱动的方式讲故事
    直觉vs数据首先,你有思考过一个问题吗?当你的直觉与你所掌握的数据矛盾的时候,你是听从于直觉还是相信你所掌握的数据呢?201 ... [详细]
  • oracle11.2.0.4的rac集群,其中一个节点出现故障,集群无法启动,使用crsctlcheckcrs查看集群状况如下:[grid@db2client]$crsctlche ... [详细]
author-avatar
多米音乐_34324431
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有