知识图谱·概念与技术--第1章学习笔记--知识图谱概述--大数据知识工程

知识图谱·概念与技术--第1章学习笔记--知识图谱概述--大数据知识工程

记录章末思考题答案

互联网与大数据应用催生了知识图谱

传统知识工程难以适应互联网时代的大规模开放性应用的需求。
互联网应用的特点如下

  • 规模巨大
    如搜索引擎
  • 精度要求相对不高
    返回相似的结果
  • 知识推理简单
    如搜索”刘德华“推荐他的歌曲和电影
    但对如”姚明老婆的婆婆的儿子有多高“这类复杂推理问题无能为力

大数据时代给知识图谱的发展带来了新机遇

  1. 数据、算力和模型的飞速发展使得大规模自动化知识获取成为可能
    数据、算力和模型三者的结合可以摆脱对专家系统的依赖。
    面向应用、数据驱动。
    由专家定义设计模式(Schema),由数据驱动的方式实现实例级别的海量知识获取。
  2. 众包技术使得知识的规模化验证成为可能
    训练知识抽取模型时可以通过众包获取标注样本,从而构建基于监督学习的抽取模型。
  3. 高质量的用户生成内容提供了高质量知识库来源
    高质量的用户生成内容(User Generated Content, UGC),包括百科、社区、论坛、问答平台等,可以作用各领域知识获取的高质量种子样本,使得构建有效的知识抽取模型成为可能,同时避免了从零开始构建一个领域知识图谱。

猜你喜欢

转载自blog.csdn.net/qq_17065591/article/details/108175319