《大数据挑战与NoSQL数据库技术》

    麦肯锡称: 数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。 随着互联网的高速发展,云时代的来临,越来越多的人开始接触并应用互联网来解决工作甚至于生活中所遇见的问题,互联网公司则在日常的运营中对用户的网络数据进行保存、处理,这一过程中无疑会产生大量急剧增长的数据。

 

截止到2012年数据已从TB发展到PBEB、乃至ZB的级别,这些大量增长的数据放到传统的关系型数据库分析处理时会浪费大量的时间和金钱,传统的数据库对于这方面的扩展性已经遇见了瓶颈。面对如此大量的数据,如何高效的获取、存储、分析、共享甚至于展示已被越来越多的人所关注。

 

对于数据存储效率的解决方案,之前了解过内存数据库,大家应该都知道传统的数据库数据是放置到物理硬盘上的,对于数据的存储、展示都是相对于硬盘进行操作。而内存数据库在数据的计算、存储等方面是针对系统内存进行操作的,因此效率方面肯定是要比磁盘数据库高的,不过它也面临一个问题,内存是有限的面对不断增长的数据量内存数据库也是无能为力。

 

大数据挑战与NoSQL数据库技术》就是一本讲解如何应对大数据时代的经典书籍。本书详细讲解了面对大数据的挑战,人们寻求的一些解决方案,同时这些解决方案促使新的管理系统和处理框架的产生。通过对大数据解决方案的讲解引出了四类大数据存储和管理数据库系统,并行数据库、NoSQL数据管理系统、NewSQL数据管理系统、云数据管理,并对它们各自的优缺点进行了讲解。其中NoSQL就是大数据时代背景下的产物。

 

NoSQL (“Not Only SQL”),非关系型数据库,在这个关系型数据库盛行的年代,它无疑是一项全新的数据库革命性运动,在人们对数据库高并发读写的需求、对海量数据的高效率存储和访问的需求、对数据库的高可扩展性和高可用性的需求,这几个需求的要求之下关系型数据库已经不能满足人们NoSQL应运而生。通过对本书的试读了解到了如下几个技术点:

      1. 简单灵活的数据模型。无需事先为要存储的数据建立字段,每个记录拥有唯一的键,系统只需支持单记录的原子性,不支持关系操作,从而提高了查询性能和相应的扩展性。

      2. 元数据和应用数据的分离。最初接触元数据是在Sysbase IQ数据库上,元数据代表数据库(系统)级别的数据,应用数据则代表用户的具体操作数据。

      3.  弱一致性。复制应用数据达到一致性。

       之前对于大数据量的概念有一些初步的了解,对提高他们的应用、存储效率方面也仅限于应用一些索引、试图、数据分区等数据库技术,目前开发的系统对于大数据的解决方案则是应用的Sysbase IQ(列式数据库)。对于NoSQL之前没有太多的涉及,通过对这几章的试读让我对大数据的解决方案有了一个全方位的了解对于NoSQL的应用有了浓厚的兴趣。真心的希望赶快读完这本书,充实自己,并且能够在以后的工作中真正的运用这方面的知识。   

猜你喜欢

转载自zhang--qiang.iteye.com/blog/1900316