1.任务:
识别事件触发词及事件类型
抽取事件元素,判断角色
抽取描述事件的词组和句子
事件属性标注
事件共指消解
2. 流水线方法:
将事件抽取任务分解为一系列基于分类的子任务,每个子任务由一个机器学习分类器负责实施
分类器包括:
事件触发词分类器:判断词汇是否为事件触发词,并基于触发词信息对事件分类
元素分类器:判断词组是否为事件的元素
元素角色分类器:判断事件元素的角色类别
属性分类器:判断事件的属性
可报告性分类器:判断是否值得报告
3.联合抽取方法:
事件的所有相关信息会同个一个模型同时抽取出来,采用联合推断或者联合建模
事件抽取子任务模型--将所有模型的目标函数组合--联合推断的目标函数
动态多池化卷积神经网络模型:
词向量学习:无监督方式
词汇级特征抽取:基于词的向量表示获取事件抽取的相关词汇线索
句子级特征抽取:通过动态多池化卷积神经网络获取句子的语义组合特征
分类器:产生事件元素的角色类别