大数据学习(一)前言+初识大数据 - 代码天地

大数据学习(一)前言+初识大数据

其他 2020-01-28 11:25:03 阅读次数: 0

前言

发这篇博客的时候我本身还是一名大二的学生，本身就是计算机互联网的专业而且自己本身就对大数据非常感兴趣。不知怎么的就是想把自己的学习的东西还有些许感悟记录下来，方便其他人学习和一起交流，所有我会一直更新一个大数据的学习系列。也算是给自己学习到的东西巩固巩固了。

什么是大数据

数据现在太火了简直，新闻联播里都提过不知道多少回了，所以出现在人们生活和工作中的大数据这个词简直可以用泛滥来形容了。但是其实很多是假的大数据，或者是无意的或者是恶意的科技噱头。那什么是真正的”大数据“呢。

BIGDATA，大数据，之无法在一定时间范围内用常规软件工具进行捕捉、存储和处理的数据集合。一般来说我们可以简单地将数据量超过就1PB的数据集合叫做大数据。不过这只是用来帮助你初步定义概念的，可别到出显摆，哈哈，其实我觉得还是有些偏颇的。

大数据的特征

如果你随便在那个网站上搜索了关于大数据的东西，其实很容易看到大数据的特点：4个V。在这里我们也说一下吧。
Volume容量
Variety多样
Velocity速度
Value价值，这里指的是大数据的有很大的价值，当然还指价值密度低。

推荐阅读

在这里对一个学习大数据的人一般都会被推荐阅读三篇论文，就是Google的三篇论文。这个直接百度就可以了。当然读不读我觉得不是很重要，哈哈。

推荐电脑配置

在学习大数据的过程中肯定是需要搭建集群的，我们没有条件直接操作服务器，即使是云服务器也有很高的成本，肯定需要使用自己的虚拟机，这就对配置有一定的要求。
硬件要求：

内存（很重要，能不能带起来就看这个）8G起步
我建议安装鲁大师进行硬件的检测，当然也可以使用命令，但是鲁大师可以看到型号和具体信息，方便你购买相似参数的硬件进行扩展。
外存（也就是硬盘）我建议是1T，当然500G的话如果你不干别的也够了。

软件要求：
这个咱们边做边说。一个一个安装。

知识储备

JAVA语言
虽然不要求JAVA到很高深的程度，但是基本语法和理念要知道。当然Python也可以做大数据编程，但是我就不知道了。sorry啦
Linux基础操作
对于集群的控制都将是建立在linux操作之上的，所以linux操作一定要知道一些（可以边看边左边学）

学习路径

Hadoop（包括很多）
HDFS MapReduce Yarn Zookeeper Hive Mysql Flume Hbase Sqoop
scala语言
Spark
Flink

结语

接下来我会尽量按时更新blog，下一章我们讲Hadoop的安装、配置和基础操作（不知道能不能讲到）。

发布了31 篇原创文章 · 获赞 33 · 访问量 2865

私信关注

猜你喜欢

转载自blog.csdn.net/qq_40742298/article/details/96146532

大数据学习(一)前言+初识大数据

大数据学习前言

大数据入门学习（一）：初识大数据

大数据学习（一） | 初识 Hadoop

Hadoop学习一（初识大数据）

初识大数据（一. 什么是大数据）

大数据学习（一）

初识大数据

大数据挖掘初识

大数据——初识hadoop

大数据初识

初识大数据~

初识大数据与Hadoop

初识大数据与Hadoop

【大数据初识】

大数据学习笔记之初识Hadoop

Hadoop（一）之初识大数据与Hadoop

初识大数据——大数据技术家族

大数据学习记录，一

大数据学习笔记（一）

大数据学习笔记一

初识大数据（big data）

大数据学习（一）完整的大数据知识体系，大数据学习路线图

大数据分析：将大数据转化为巨额资金前言及第一章

2021年全网最细大数据学习笔记（一）：初识 Hadoop

大数据学习~Hadoop初识三Yarn模式

大数据入门学习笔记（贰）- 初识Hadoop

大数据入门学习之Hadoop初识篇

大数据学习笔记46：初识日志收集系统Flume

Hadoop大数据开发基础系列：一、初识Hadoop

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)