此次分享doc来自于互联网,分享会议是2014bdtc
首先看架构图:
数据来源图:
涉及点:
1.构建实体关系知识图谱
2.基于flume做数据传输
3.基于Elastic Search 提供检索服务
4.基于hadoop的mr做分析
5.利用了xpath做解析(其实csspath会更好)
6. 交叉验证
扫描二维码关注公众号,回复:
383767 查看本文章
详情参见附件
此次分享doc来自于互联网,分享会议是2014bdtc
首先看架构图:
数据来源图:
涉及点:
1.构建实体关系知识图谱
2.基于flume做数据传输
3.基于Elastic Search 提供检索服务
4.基于hadoop的mr做分析
5.利用了xpath做解析(其实csspath会更好)
6. 交叉验证
详情参见附件