漫谈大数据---大数据是什么

       

      14年还在感叹房价之高,15、16年却还一直上涨,甚至疯狂的17年好像涨到了一个小巅峰,没有想到18、19年又还是停滞。与之相反的是股市从5000点夭折一半回落到2500点,现在又开始缓慢发生。从14、15年到18、19年,短短5年,这个疯狂的的社会仿佛在跟我们开玩笑一样,一波又一波的骚操作,让我们叹为观止。然而,信息技术发展又何尝不是呢。正如大家所感知的世界,科学技术越来越发达。从村通电到现今的智能时代,变化太快了,快到我们猝不及防,甚至感觉跟不上时代了。

        为了文章不偏离主题,还是开始我的话题吧,其他的话题可待日后再续。

分割线--------------------------------------------------------------------------------------------------------------------

     

       当我们感受着手机从2G到3G到4G的变化同时,另一场科技正常逐渐喷涌。通信的越来越发到,数据的交互理所当然越来越多,网络速度有多块数据传输就有多大。甚至某种情况下,出现了通信系统的告诉公里路堵住了数据的传输,因此5G正在应运而生。

       鱼大了叫鲲,数据大了就叫大数据。可想而知大数据的体量有多大,那么到底什么是大数据?它能干嘛?对我们有什么影响吗?

       挪用比较一个通用的定义,大数据:是指在一定时间范围内无法使用传统数据库工具对其进行捕捉、管理、计算、分析和处理的数据集合,这个数据类型很丰富,包含我们常见的数据库里面的结构化数据和靠感知获取的非结构化的数据。另外大数据有以下四个特性:海量的数据规模(Volumn),数据类型繁多(Variety),数据流转速度极快(Velocity)以及价值密度较低(Value),也就是很多人都在说的大数据4V特性。

       首先看第一个特性:海量。什么样的数据成为大数据?大量的科学人员早已帮我们框定了一个科学定义即PB级别的数据可称为大数据。

       怎么理解PB?来个换算公式一目了然:1PB=1024TB=1024*1024GB,这仅仅是可称为大数据的门槛,运营商、相关数据部门的数据早已经到了几十、几百PB级别,而且这个数据每天都在增加,而且增加的数据越来越多,没多久就会到EB级别(1EB=1024PB)。中国电信每天处理数据200T;新浪微博上每天上传的微博数超过1 亿条;Facebook 每天处理10TB 的数据;世界气象中心积累了220TB 的Web 数据,9PB 其他类型数据。。。

        第二块是数据类型繁多(Variety)。数据的多样性字面意思很好理解。都有哪些数据呢?大概罗列一下:通信娱乐数据(手机通话、上网、各种视频资讯各行业APP等等)、交互行为(qq、微信、微博、头条、快手、抖音、直播平台等等)、位置轨迹(交通出行、车辆、监控、商场等等)另外还包括各行各业的行业数据诸如:金融、旅游、医疗、房产、农林、工业、交通物流、司法、政务、广告媒体等等。我们在形容多的时候往往会用多如牛毛,大数据的繁多,岂是多如牛毛就能描述的,也许描述成宇宙一尘土更为贴切。

        第三部分是数据流转速度极快。高速描述的是数据被创建和移动的速度。在高速网络时代,通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成为流行趋势。企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。

        第四个特性是价值(Value)。尽管大数据的数据量巨大,但是有价值的信息极少,我们要通过分析才能将大数据从数据到价值的转变,这些工作量极其庞大,所以云计算是一个很好的解决途径。以监控视频为例,一小时的视频,在不间断的监控过程中,可能有用的数据仅仅只有一两秒。大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过机器学习方法、人工智能方法或数据挖掘方法深度分析,发现新规律和新知识,并运用于农业、金融、医疗等各个领域,从而最终达到改善社会治理、提高生产效率、推进科学研究的效果。

        以上大数据介绍仅供参考

       

猜你喜欢

转载自www.cnblogs.com/yeqj/p/10675700.html