基于BeautifulSoup和jieba的用户投书文本知识图谱构建研究与实现

摘要

自从google公司推出旗下的产品KnowledgeGraph以来,知识图谱这个概念越来越受到学术与工业界的关注。如何以质量参差不齐的网页数据作为原始数据源,构建知识图谱已经成为了一个热门的研究课题。

互联网技术的迅速发展导致了网民数量的快速增长。愈来愈多的人热衷于在网络论坛上发表想法。在这个背景下,投诉类型论坛吸引了政府和个人的广泛关注。他们都希望能从投诉类型论坛的帖子中获取一些有价值的信息。

本文首先介绍本课题的研究背景,主要任务与目标:构建基于投诉文本的知识图谱;然后介绍本课题相关的技术背景:知识图谱以及文本情感分析;接着介绍实验的数据处理和构建知识图谱的算法设计:本文使用Beautiful Soup进行文本提取,使用jieba工具进行分词,使用流水线方法进行实体关系抽取;随后本文介绍具体的实验过程,给出实验结果和实验评估;最后本文对本课题的工作做一个总结和展望。

关键词:知识图谱;情感分析;命名实体识别;关系抽取

猜你喜欢

转载自blog.csdn.net/asdJJkk/article/details/93377144