一、生生态系统



 一、生态系统
 
  1. 这一切,都起源自Web数据爆炸时代的来临
  2. 数据抓取系统 - Nutch
  3. 海量数据怎么存,当然是用分布式文件系统 - HDFS
  4. 数据怎么用呢,分析,处理
  5. MapReduce框架,让你编写代码来实现对大数据的分析工作
  6. 非结构化数据(日志)收集处理 - fuse,webdav, chukwa, flume, Scribe
  7. 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 - Hiho, sqoop
  8. MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 – Pig, Hive, Jaql
  9. 让你的数据可见 - drilldown, Intellicus
  10. 用高级语言管理你的任务流 – oozie, Cascading
  11. Hadoop当然也有自己的监控管理工具 – Hue, karmasphere, eclipse plugin, cacti, ganglia
  12. 数据序列化处理与任务调度 – Avro, Zookeeper
  13. 更多构建在Hadoop上层的服务 –Mahout, Elastic map Reduce
  14. OLTP存储系统 – Hbase



 

大数据产业可划分为六大类,共38种产品/商业模式:

1. 大数据基础设施类(NoSQL数据库、Hadoop相关产品、NewSQL数据库、MPP受苦、管理监控等)

2.大数据分析类(分析解决方案、数据可视化、统计计算、社交媒体、舆情分析、分析服务、IT分析等)

3.大数据应用类(广告优化、出版工具、市场营销、行业应用、大数据应用服务提供商)

4.大数据数据源类(数据市场、数据源)

5.跨基础设施分析(主要为传统IT巨头业务延伸)

6.开源项目(框架、查询/数据流、数据访问、协作/工作流、实时、统计工具、机器学习、云部署)



 
  Hadoop是什么?

适合大数据的分布式存储与计算平台

猜你喜欢

转载自qxf567.iteye.com/blog/1986465