王昊奋知识图谱学习笔记--第三讲知识抽取与知识挖掘(下)

第一部分 DeepDive 知识抽取实战

注意:iDeepDive 仅支持Liux或者Mac,不支持Windows。

1.1 工程组成

在这里插入图片描述

1.2 先验数据导入

在这里插入图片描述

1.3 待抽取文章导入

在这里插入图片描述

1.4 流程

在这里插入图片描述

1.5 文章数据预处理

对文章进行自然语言处理,包括分词、词性标注、命名实体识别等操作。
在app.ddlog 中利用nlp.markup.sh 这个脚本去实现NLP的处理,并将内容放入到sentences 表中。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1.6 候选实体抽取

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

候选实体对生成

在这里插入图片描述

关系特征抽取

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

数据标注

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

扫描二维码关注公众号,回复: 12718262 查看本文章

因子图构建

在这里插入图片描述
在这里插入图片描述

总结

这个项目仅仅听老师讲,很难懂这个过程。还需要自己亲自实践,才能真正理解。
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/u010414589/article/details/109169028