hadoop第一天——2. 科技发展带来的挑战

二、科技发展带来的挑战

  • 网站结构的变迁:从单机迈向了高可用,从而引出了分布式概念
  • 海量数据处理的场景
       - 海量数据如何存储:分布式存储
       - 海量数据如何计算:分布式计算
2.1 分布式系统
  1. 概述
    分布式系统是一个硬件或软件组件分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统。简单来说就是一群独立计算机集合共同对外提供服务,但是对于系统的用户来说,就像是一台计算机在提供服务一样。
  2. 特征
  • 分布性:分布式系统中的多台计算机之间在空间位置上可以随意分布,系统中的多台计算机之间 没有主、从之分,即没有控制整个系统的主机,也没有受控的从机。
  • 透明性:系统资源被所有计算机共享。每台计算机不仅可以使用本机的资源,还可以使用分布式系统中其它计算机的资源(包括CPU、文件、打印机等)。
  • 同一性:系统中的若干台计算机可以互相协作来完成一个共同的任务,或者说一个程序可以分布在几台计算机上并行地运行。
  • 通信性:系统中任意两台计算机都可以通过通信来交换信息。
  1. 常用分布式方案
    分布式应用和服务:如分布式服务框架Dubbo
    分布式静态资源:如CDN
    分布式数据和存储:如Apache Hadoop HDFS
    分布式计算:如Apache Hadoop MapReduce
  2. 分布式、集群
    分布式(distributed)是指在多台不同的服务器中部署不同的服务模块,通过远程调用协同工作,对外提供服务。
    集群(cluster)是指在多台不同的服务器中部署相同应用或服务模块,构成一个集群,通过负载均衡设备对外提供服务。
2.2 海量数据处理

分布式存储
分布式计算

猜你喜欢

转载自blog.csdn.net/qq_28178795/article/details/92074870