【Hadoop技术】【大数据概论】

一、大数据概念

大数据就是巨量的数据。大数据的计量单位已经超过TB级别发展到PB、EB、ZB、YB甚至BB级别。
大数据是指在一定时间内无法使用传统数据库软件工具采集、存储、管理和分析其内容的数据集合。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对于这些含有意义的数据进行专业化处理。

二、大数据5大特点

大数据具有5各方面的特点,规模性(Volume)、多样性(Variety)、高速性(Velocity)、价值性(Value)、真实性(Veracity)。
在这里插入图片描述

2.1 规模性

数据规模大
在这里插入图片描述

2.2 多样性

大数据可以分为三类:

1.结构化数据,指可以使用关系型数据库表示和存储,表现为二维形式的数据。一般特点是:数据以行为单位,一行数据表示一个实体的信息,每行数据的属性是相同的。
2.非结构化数据,指的是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二位逻辑表来表现得数据。
3.半结构化数据,是结构化数据的一种,不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,它也被称为自描述的结构。半结构化数据,属于同一类实体可以有不同的属性,即使他们被组合在一起,这些属性的顺序并不重要。

结构化数据占比比较大,但是产生价值的往往是这些非结构哈u数据。

2.3 高速性

数据的增长速度和处理速度是大数据高速性的重要体现。
海量数据的背后带来的是更大的挑战,即如何快速计算分析大数据成为当下热门的话题。

2.4 价值性

大数据的核心特征是价值。价值密度的高低和数据总量的大小是成反比的,即数据价值密度越高数据总量越小,数据价值密度越低数据总量越大。

2.5 真实性

真实性就是数据的质量。

三、大数据应用场景

3.1 电商大数据

精准营销法宝
在这里插入图片描述

3.2 金融大数据

大数据在金融行业的应用可以总结一下五个方面:精准营销、风险管控、决策支持、效率提升以及产品设计。
在这里插入图片描述

3.3 医疗大数据

在这里插入图片描述

3.4 零售大数据

了解客户消费喜好和趋势,进行商品的精准营销,降低营销成本。依据客户购买产品,为客户提供可能购买的其他产品,扩大销售额,也属于精准营销范畴。
在这里插入图片描述

3.5 交通大数据

在这里插入图片描述

3.6 舆情监控大数据

在这里插入图片描述

四、业务流程分析

1.产品人员提需求:统计总用户数、日活跃用户数、回流用户数等
2.数据部门搭建数据平台、分析数据指标
3.数据可视化(报表展示、邮件发送、Echarts)

下一篇:【Hadoop技术】【Hadoop快速入门】

猜你喜欢

转载自blog.csdn.net/qq_42893334/article/details/106569704