第一部分 DeepDive 知识抽取实战
注意:iDeepDive 仅支持Liux或者Mac,不支持Windows。
1.1 工程组成
1.2 先验数据导入
1.3 待抽取文章导入
1.4 流程
1.5 文章数据预处理
对文章进行自然语言处理,包括分词、词性标注、命名实体识别等操作。
在app.ddlog 中利用nlp.markup.sh 这个脚本去实现NLP的处理,并将内容放入到sentences 表中。
1.6 候选实体抽取
候选实体对生成
关系特征抽取
数据标注
扫描二维码关注公众号,回复:
12718262 查看本文章
因子图构建
总结
这个项目仅仅听老师讲,很难懂这个过程。还需要自己亲自实践,才能真正理解。