大数据技术随笔 - 代码天地

大数据技术随笔

其他 2018-12-15 09:50:55 阅读次数: 0

先来说说大数据和云计算

云计算

在美国与技术研究院中的定义是：指一种按使用量付费的模式，这种模式提供可用的，便携的，按需的网络访问，进入可配置的计算资源共享池，这些资源能够被快速的提供，只需要投入极少的管理工作，或与服务供应商进行很少的交互。
资源共享池里资源包括网络，服务器，存储，应用软件，服务等。

大数据

指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
而IBM指出大数据的5V特点：Volume（大量）、Velocity（高速）、Variety（多样）、Value（价值）、Veracity（真实性）。

一般我们怎么来理解大数据呢？

一般先从单机和集群入手

单机：我们平常所说的单个机器，包括物理机、虚拟机、云主机等。在某些场景下也称为单个节点。
集群：多个单机所组成的多台机器，称之为集群，机器之间可以通过网络（公网或私网均可）相互通讯。
而大数据又是常规单机无法处理的大量数据，所以自然而然，我们就可以想到用集群方式来解决，多台机器自然能提供更多的计算能力，再加上合理的程序架构，在合理范围内，规模越大的机器也能处理规模更大的数据。
设计要合理：比如一个人100天盖好一个房子，但不是100个人一天就能盖好一个房子。
大数据的核心思想是集中力量一开做事，本质上必须能够并行处理数据。
大数据对数据操作也不外乎增删改查，它实际上也只是数据处理的一个方案。所以一般的架构流程如下：

大数据处理本就是一个复杂的过程。所以他依赖于了一系列的应用的支撑

而yarn怎被用来完成资源调度

猜你喜欢

转载自blog.csdn.net/weixin_43345864/article/details/84886644

大数据技术随笔

大数据学习随笔

大数据随笔

大数据随笔集

大数据架构技术

大数据相关技术

大数数据技术

大数据技术调研

大数据技术峰会

大数据存储技术

大数据技术栈

【大数据技术】Sqoop

大数据技术原理

大数据技术

大数据技术——Spark

大数据技术架构

大数据技术简介

大数据技术与应用

大数据技术概述

大数据-hdfs技术

大数据技术概览

大数据技术脉络

浅谈大数据技术

大数据：实时技术

大数据技术DataX

大数据技术趋势

初识大数据——大数据技术家族

大数据技术之大数据概论

大数据（四）主流大数据技术

大数据技术——数据获取

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)