之前写过一篇公众号,介绍在没有参考中科院专家论文情况下,我在项目中也使用了类似思路。本文就重点介绍一下这篇论文《Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme》,2017年由中科院团队发表1的论文,当时被评为年度杰出论文。
关系抽取简介
实体(Entity)的关系抽取(Relation Extraction)作为NLP领域的一项基本任务,很早就被学者关注到了。早期的实体识别通常基于概率图模型,如隐马尔可夫链(Hidden Markov model,简写 HMM),条件随机场(Conditional random field, 简写CRF),实体识别完成以后再进行实体的关系分类,这就是早期使用的Pipline方法,也称为流水线式的抽取方法。这种方法在今天仍然发挥很大的作用。
另一种方式就是Joint Model方法,一个模型完成多个任务,包括实体识别和关系分类两个任务,底层使用参数共享的方式,很好地做到了端到端(end to end)处理方式,并且取得了非常好的效果。
We design a kind of novel tags which contain the information of entities and the rela- tionships they hold. Based on this tagging scheme, the joint extraction of entities and relations can be transformed into a tagging problem
Wang, S., Zhang, Y., Che, W., & Liu, T. (2018). Joint Extraction of Entities and Relations Based on a Novel Tagging Scheme. IJCAI International Joint Conference on Artificial Intelligence, 2018-July, 4461–4467. https://doi.org/10.24963/ijcai.2018/620 ↩︎