【知识图谱学习笔记】B站课程-p5-p7知识图谱设计

B站地址:https://www.bilibili.com/video/av70702610
侵权请联系删除

首先介绍一个医用知识图谱常单靠的系统-UMLS:统一医学语言系统(Unified Medical Language System,UMLS)是美国国立医学图书馆持续开发了20多年的巨型医学术语系统,涵盖了临床、基础、药学、生物学、医学管理等医学及与医学相关学科,收录了约200万个医学概念,医学词汇更是空前,达到了500多万个。
我们之后设计的知识图谱会借鉴UMLS的相关架构。

一、知识设计方法

用两句口诀来总结就是:
1.参照与对标、适配和裁剪(借鉴已有)
2.归纳和总结,抽象和提炼(归纳自身)
在这里插入图片描述

二、设计的参考对象-UMLS语义网络

思想:高层复用,底层适配。首先完整的语义网络为:
在这里插入图片描述
抽取其高层语义类型(包括实体和事件)
在这里插入图片描述

2.1 实体

这就是从UMLS抽取的高层实体分类,下面做简要的分析:
概念实体:偏向抽象,例如某个组织,某个发明
物理实体:偏向具象,例如细胞、病毒

2.2事件

现象或过程:偏向非主动行为,例如张三感冒了
活动:偏向主动,例如医生使用设备诊断病人(双方、活动、目标)

2.3 UMLS语义关系

在这里插入图片描述

三、汽车知识图谱:

基于标准,归纳总结,居中对齐

3.1 实体抽取

底层适配的方法:爬取半结构化数据(汽车之家)
在这里插入图片描述
具体的网络组成需要自己划分,例如车身有很多属性,但是可以抽取出尺寸这一概念实体,然后长度等为尺寸的属性。

3.2 事件抽取

数据来源主要为汽车投诉网站。
在这里插入图片描述
总的实体与事件的设计如下:
在这里插入图片描述

3.3 关系抽取

根据底层实例遍历归纳(会很累,但是是必须的)对标来抽取形成总的关系网络。
在这里插入图片描述
重要的是掌握方法。

发布了20 篇原创文章 · 获赞 0 · 访问量 683

猜你喜欢

转载自blog.csdn.net/weixin_43522964/article/details/104325654