rdf究竟是什么鬼

    最近在给公司做一个工具,实现rdf到知识图谱的导入。以前听过rdf,也稍微看过一点,不过看w3c那个文档实在是晦涩难懂,没有兴趣看下去,就没太在意,哪知道,最近老大要我开始接手这活了。

    大概花了一周时间,看了以前数据结构的图,rdf、owl、语义网、知识图谱等概念,然后大概了解这些是做什么的。但是还是不是很清楚,上周开始写rdf解析,写的过程中发现看那些概念确实没什么用,可能是我个人的偏见吧。

    个人感觉,rdf光看确实不知道是干嘛的,当具体去解析rdf文件的时候,理解的更深刻些。rdf试图使用三元组的形式描述互联网上的资源,用uri去指向这些资源,uri大家都知道,每个uri只能指向一个具体的资源,可能有多个uri指向同一个资源,但是不能一个uri指向多个资源。所谓三元组,类似语文中的主谓宾,主语就是要描述的资源,谓语就是主语的属性,宾语就是属性值,宾语可能是字符,也可能是另一个资源。比如说网上一片文章,它可能有作者、标题、发布时间等属性,而作者可能是一个人,这个人有自己的百科。要描述这样一个关系,rdf就会用这些三元组来描述这些关系,《文章,作者,小明》,《文章,标题,小明的英国生活》,《文章,发布时间,2016-010-20》《小明, 百科, 百度百科》。rdf规定,资源使用uri、谓语也是uri,宾语可以是字符或者uri。

猜你喜欢

转载自kibear.iteye.com/blog/2334315