“Joint entity and relation extraction based on a hybrid neural network ”

————-本文发表于2017年的NeuroComputing期刊上。
利用神经网络的方法实现命名实体识别(NER)和关系抽取(RE)的联合学习。
整个模型的框架和思想相对简单,框架如下图所示:
Framework
该框架首先使用一个BiLSTM对输入(句子)进行编码,然后将该编码结果分别送给NER模块和RC模块,这里的联合学习主要体现在底层的BiLSTM编码上,即两个模块共享了这个编码。(接下来,将不再对BiLSTM模块赘述,只介绍NER模块和RC模块)

NER模块:

关于NER,最简单的方式可以直接在BiLSTM编码后接一个全连接层进行tag(标签)分类,但是考虑到tag之间的联系(将另写一篇博客关于NER的,将在那里详述这个联系),同时考虑encode-decode的框架,这里再使用一个LSTM进行decode。
这个decode也是一个典型的LSTM,不过他的输入(t时刻)是ht(编码模块的输出),cell是st,输出是Tt,然后是一个全连接层和softmax层来分类。

RC模块:

RC模块使用的是CNN分类器,考虑到实体词之间的序列对于分类最有用,所以对于实体e1和e2,CNN的输入是he1,we1,we1+1,…we2,he2。其中he来自BiLSTM,是实体的编码信息,we是词嵌入。CNN的结构如下图所示(将在另一篇关于实体关系抽取的博客中详述该方法):
Framework

实验:

作者使用的ACE05数据集,分别定义了NER任务和RC任务上的损失函数。首先训练NER模块识别实体并获取实体的编码信息,然后训练RC模块根据编码信息和实体组合对关系进行分类。

相关文章
评论
分享
Please check the comment setting in config.yml of hexo-theme-Annie!