大数据技术原理与应用【笔记】

其他 2018-09-18 11:16:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/u013066244/article/details/80825088

环境

看视频：
http://study.163.com/course/courseMain.htm?courseId=1002887002

前言

个人笔记视频笔记

正文

大数据思路的转变：

全样而非抽样
效率而非精确
相关而非因果

核心技术

分布式存储和分布式处理

云计算

解决了：分布式存储、分布式处理、虚拟化和多租户；

Hadoop

YARN 简称“样” 作用是起到调度作用；因为在版本1时 MapReduce 即处理又负责调度；版本2进行拆分；
（集群资源管理）

HDFS

解决海量数据分布式存储问题
几个重要的概念：1、块（block）2、name node 和 data node

数据节点会定期发送自己存储的块的列表给主节点（名称节点）。

Fsimage

FsImage文件记录：文件的复制等级、修改和访问时间、访问权限，块大小以及组成文件的块。对于目录，则存储修改时间、权限和配额元数据。

Nosql

1、频繁的读写使用键值数据库更好些

MapReduce

其实就是分布式并行编程

Hadoop MapReduce 是其具体实现。

设计理念

计算向数据靠拢

主要组成部分

1、Client

2、JobTracker

3、TaskTracker

4、Task

工作流程概述

1、不同的Map任务之间不会进行通信
2、不同的Reduce任务之间也不会进行通信

Shuffle 洗牌

分区、排序、合并、归并

之后再分发给Reduce。

合并（Combine）和归并（Merge）的区别：
两个键值对

猜你喜欢

转载自blog.csdn.net/u013066244/article/details/80825088

大数据技术原理与应用笔记

大数据技术原理与应用【笔记】

【学习笔记】大数据技术原理与应用

大数据技术原理与应用学习笔记第1章

大数据原理及应用笔记

大数据计数原理与应用——笔记——Hadoop

网站流量日志分析系统笔记（Hadoop大数据技术原理与应用）

厦门大学林子雨开设的《大数据技术原理与应用》第五章NoSQL数据库笔记

大数据技术原理与应用

大数据原理笔记——MapReduce

厦门大学林子雨开设的《大数据技术原理与应用》第二章分布式文件系统HDFS笔记

hadoop书籍（一）—《大数据技术体系详解：原理、架构与实践》笔记

厦门大学林子雨开设的《大数据技术原理与应用》第三章分布式数据库HBase数据库笔记

大数据技术原理与应用入门（二）

大数据技术原理与应用入门（一）

大数据技术原理与应用-概述

大数据技术原理与应用实验七

大数据技术原理与应用实验五

＜大数据技术原理与应用＞期末复习

大数据｜TableStore 存储原理【学习笔记】

《大数据技术体系详解》笔记（一）

大数据学习笔记二：解析大数据使用的技术

大数据技术原理与应用——大数据概述

数据库原理及应用学习笔记

大数据原理笔记——云数据库（三）

大数据原理笔记——云数据库（二）

大数据原理笔记——云数据库（一）

大数据技术笔记之数据采集和预处理

大数据技术原理

大数据技术与应用

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)