大数据特点和基本处理流程 - 代码天地

大数据特点和基本处理流程

其他 2018-06-07 10:17:28 阅读次数: 2

1.大数据的4V特性

中文	英文
大量化	volume
快速化	velocity
多样化	variety
价值化	value

2.大数据的基本处理步骤

数据获取
flume
数据来源:专业数据机构,国家统计局,企业内部数据,互联网数据
数据清洗
mapreduce
清除不需要,错误,无效的数据
数据存储
hdfs
性能,可用,可靠,成本等方面考量
数据处理
hive
按业务需求处理
数据分享
sqoop,kettle
可视化展示,最大化利用数据价值

3.Hadoop

apache旗下开源软件平台,广义是指Hadoop生态圈
利用分布式集群,根据具体业务,对海量数据进行分布式处理
核心组件包括COMMON,HDFS,YARN,MAPREDUCE

4.组件

组件名称	主要功能
HDFS	分布式文件系统
MAPREDUCE	分布式运算程序开发框架
HIVE	基于文件系统和运算框架的SQL数据仓库工具
ZOOKEEPER	分布式协调服务基础组件
HBASE	分布式数据库OLTP
Mahout	基于分布式运算框架的机器学习算法库
Saoop	数据的导入导出工具
Flume	日志数据采集框架

5.分布式系统

划分成多个子系统或模块,各自运行在不同机器上,通过网络通信协作实现整体功能
操作系统,程序设计语言,编译系统,文件系统,数据库

6.ETL (数据仓库技术)

中文	英文
抽取	extract
交互转换	transform
加载	load

7.BI

商业智能
将企业现有数据有效整合,快速准确提供报表提出决策依据,帮助作出业务决策
需求分析和功能实现依赖的技术组件

猜你喜欢

转载自blog.csdn.net/wxfghy/article/details/80404536

大数据特点和基本处理流程

大数据的基本处理流程

FFmpeg的基本处理流程

大数据处理的基本流程

数据挖掘的基本概念和大数据的特点

大数据的结构和特点

大数据处理的基本流程是什么？

时间的基本处理

文件的基本处理

【pandas】基本处理

图片的基本处理

大数据学习笔记(六) -- linux的文本处理

基于shell 脚本处理文本数据流程

大数据处理流程

大数据的处理流程是怎样

大数据处理的基本流程：数据抽取与集成+数据分析+数据解释

matplotlib学习——数据可视化基本处理

机器学习 - 数据集（.csv文件）的基本处理

C# 图像基本处理和OCR

什么是大数据？大数据的特点和用作？？

Go 时间基本处理

List集合基本处理

tensorflow图像基本处理

【Django学习笔记】6：Django的Admin管理工具的配置和对数据模型的基本处理

大数据处理培训：大数据处理流程

大数据平台：数据处理流程

mybatis系统学习（五）——mybatis源码之内部基本处理流程

【PM模块】维护订单基本处理流程——实际操作

大数据_Flink_Java版_数据处理_Watermark_特点和行为---Flink工作笔记0053

大数据的特点

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)