“A Hierarchical Framework for Relation Extraction with Reinforcement Learning”

—-本文发表于2019年的AAAI会议,采用两层结构来进行关系抽取。

Hierarchical Extraction Framework

整个模型首先通过一个high-level的强化学习过程检测relation indicators(关系指示器),然后利用一个低层次的强化学习过程给给出该关系涉及的两个实体。

Relation indicator

关系指示器用来指明在一个具体的位置,已经有足够的信息来识别一种语义关系了。

Relation Detection with High-level RL

对于句子S=w1w1…wL,该层次的强化学习在每个时刻考虑一个单词。在t时刻,对于强化学习有以下要素:

  • option:ot从O={NR}$\cup$R选择,其中NR表示在没有关系,R是关系集合
  • state:$s^{h}{t}$是该层在t时刻的状态,通过下式计算:$s^{h}{t}=f^{h}(W^{h}{s}[h{t};v^{r}{t};s{t-1}])$,其中,ht是来自BiLSTM,$v^{r}_{t}$是关系向量(最近一次非NR关系的嵌入),st-1是上一时刻的状态。fh是使用MLP实现的非线性函数。
  • policy:stochastic policy $\mu$为状态指定关系概率。$o_{t}$~$\mu(o_t|s^h_t)=softmax(W_{\mu}s^h_t)$
  • reward:
相关文章
评论
分享
Please check the comment setting in config.yml of hexo-theme-Annie!