非结构化数据_事件抽取

1.任务:
识别事件触发词及事件类型
抽取事件元素,判断角色
抽取描述事件的词组和句子
事件属性标注
事件共指消解


2. 流水线方法:
将事件抽取任务分解为一系列基于分类的子任务,每个子任务由一个机器学习分类器负责实施
分类器包括:
     事件触发词分类器:判断词汇是否为事件触发词,并基于触发词信息对事件分类
     元素分类器:判断词组是否为事件的元素
     元素角色分类器:判断事件元素的角色类别
     属性分类器:判断事件的属性
     可报告性分类器:判断是否值得报告


3.联合抽取方法:
事件的所有相关信息会同个一个模型同时抽取出来,采用联合推断或者联合建模
事件抽取子任务模型--将所有模型的目标函数组合--联合推断的目标函数
动态多池化卷积神经网络模型:
            词向量学习:无监督方式
            词汇级特征抽取:基于词的向量表示获取事件抽取的相关词汇线索
            句子级特征抽取:通过动态多池化卷积神经网络获取句子的语义组合特征
            分类器:产生事件元素的角色类别

猜你喜欢

转载自www.cnblogs.com/hapyygril/p/11956514.html