博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
论文笔记:Event Detection without Triggers
阅读量:4290 次
发布时间:2019-05-27

本文共 1601 字,大约阅读时间需要 5 分钟。

姓名:崔金满

单位:燕山大学

论文地址:

代码地址:

数据集:ACE 2005

来源:NAACL 2019


Abstract:

事件检测的目标是检测事件的发生并对其进行分类。以前的工作是通过识别和分类事件触发器来解决这个问题,事件触发器被定义为最清晰地表达事件发生的单词或短语。因此,现有方法要求在训练数据中既有带标记的触发词又有事件类型。然而,事件检测的本质并不是触发器抽取,而且标注者从给定句子中,尤其是从一个长句子中抽取出“最清楚”的单词是非常耗时的。训练语料库的昂贵标注限制了现有方法的应用。为了减少手工标注,本文探索了一种在没有触发器的情况下检测事件。提出一种新的框架 TBNNAM

Introduction:

大多数现有的方法是将这一任务转化为单词分类(2016. Leveraging framenet to improve automatic event detection, 2017. Exploiting argument information to improve event detection via supervised attention mechanisms),预测给定句子中每个单词是否是触发词,以及它触发了什么类型的事件。因此这些方法需要带标注的触发器和事件类型来进行训练。但是事件检测的目的是识别和分类事件,而触发器识别可以视为该任务的一个中间结果。

本文在没有事件触发词的情况下,通过文本分类来对该任务进行建模。

面临的挑战:

  1. 多标签问题:由于文本中可能包含多个事件类型,从而导致分类困难;

  2. 触发词缺失问题:从先前的工作来看,事件触发词在事件检测过程中起到了很重要的作用,因此,在缺失触发词的情况下,很难对这些信息进行建模。

解决方法:

  1. 针对第一个问题,本文将多标签分类问题转化为多个二分类问题,即给定一段文本,判断文本中所包含的事件是否为目标事件类型,是,则标记为1,否则标记为0

  2. 针对第二个问题,本文提出基于注意力机制的类型感知偏差神经网络(TBNNAM)模型,对触发词信息进行建模。

Methodology:

任务定义:事件检测任务是指需要检测在标注数据中提及的包含了特定事件类型的事件。

模型描述:

  • 模型的输入:带有NER标签的标记化句子、目标事件类型

  •  Word/Entity Embeddings:使用skip-gram模型在NYT语料库上学习单词嵌入,并为每个实体标签随机初始化一个嵌入表。通过查询嵌入表,将所有的输入word token和entity tags转化为低维向量。

  • Event Type Embedding:一个事件类型被转换为两个嵌入向量,一个用于捕获局部信息,一个用于捕获全局信息。

  • LSTM Layer:将word embedding 和 entity embedding拼接后输入LSTM层,捕获句子特征。

  • Attention Layer:注意力向量\alpha是基于目标事件类型嵌入t_1和LSTM层产生的隐藏状态h计算得到的,计算公式如下:

在该模型中,能够表征目标事件类型的触发词将获得更高的权重。

基于此,可以得到加权句子特征S_{att}=\alpha ^TH

  • output Layer:

其中,v_{att} = S_{att}\cdot t_1^T捕获局部信息,v_{global} = h_n\cdot t_2^T,捕获全局信息

Experimental Results:

其中,第一组baseline中BC-*表示二分类(baseline),CNN,LSTM表示在句子编码阶段所使用的模型,第二组表示没有注意力模型(即公式(3)中的\lambda=1)与本文所提模型的对比结果(\lambda=0.25),第三组是与现有事件检测模型中效果较好的模型进行对比。从实验结果来看,本文所提模型取得了SOTA结果。


最后提出一个问题:现在大多数模型是将ACE中33个子事件类型视为独立事件类型进行分类,忽略了8个大事件类型与子事件类型之间的关系,我们如何应用到事件类型与子事件类型之间的关系来提升模型的性能。

转载地址:http://oqmgi.baihongyu.com/

你可能感兴趣的文章
Java易混小知识——equals方法和==的区别
查看>>
内置对象(Session、Application、ViewState)
查看>>
为什么Java有GC还需要自己来关闭某些资源?
查看>>
Android 热修复,插件式开发---基本知识
查看>>
JSP九大内置对象、四种作用域、跳转方式
查看>>
JSP 自定义标签
查看>>
JSP JavaBean
查看>>
从两个字符串中找出最大公共子字符串
查看>>
Java代码添加背景音乐
查看>>
Java面试题全集(上)
查看>>
JAVA泛型中的有界类型(extends super)
查看>>
炫酷进度条:Android 仿应用宝下载进度条
查看>>
Java程序内存的简单分析
查看>>
Javascript单例模式概念与实例
查看>>
SQL NULL 函数
查看>>
多例设计模式
查看>>
WebView的JavaScript与本地代码三种交互方式
查看>>
WebView的JavaScript与本地代码三种交互方式
查看>>
Android Studio里面配置Tesseract
查看>>
深入浅出JavaScript之this
查看>>