系统集成项目管理工程师备考资料(口袋应试第二版)5

云计算与大数据

口袋应试:云计算、大数据内容在第二版的第一章和第三章都有,所以在这里单独整理一篇,这两个内容都是考试重点,建议大家都掌握一下。如果大家时间和精力有限,可以在微信中搜索“集成中级口袋应试”小程序,利用琐碎的时间进行复习,小程序中可以在分类测试中进行对应章节的试题练习。

 

1.6.2云计算

2.云计算服务的类型

按照云计算服务提供的资源层次,可以分为laaS、PaaS和SaaS等三种服务类型。

(1) laaS (基础设施即服务)

向用户提供计算机能力、存储空间等基础设施方面的 服务。这种服务模式需要较大的基础设施投入和长期运营管理经验,但laaS服务单纯出 租资源,盈利能力有限。

英文为Infrastructure as a Service,指消费者通过Internet可以从云计算中心获得完善 的计算机基础设施服务,例如虚拟主机、存储服务等,典型厂家有Amazon、阿里云等。 如果把云计算比作一台计算机,laaS就相当于计算机的主机等硬件。

(2) 平台即服务(PaaS)

向用户提供虚拟的操作系统、数据库管理系统、Web应用等平台化的服务。PaaS服务的重点不在于直接的经济效益,而更注重构建和形成紧密 的产业生态。

英文为Platform as a Service,指为云计算上各种应用软件提供服务的平台应用,其作用 类似于个人计算机的操作系统,也包括一些增强应用开发的“开发包'典型厂家有Google App Engine、Microsoft Azure、阿里 Aliyun Cloud Enginee、百度 Baidu App Enginee 等。

(3) 软件即服务(SaaS)

向用户提供应用软件(如CRM、办公软件等)、组件、 工作流等虚拟化软件的服务,SaaS 一般采用Web技术和SOA架构,通过Internet向用户提供多租户、可定制的应用能力,大大缩短了软件产业的渠道链条,减少了软件升级、 定制和运行维护的复杂程度,并使软件提供商从软件产品的生产者转变为应用服务的运者。

英文为Software as a Service,是一种通过Internet提供软件的模式,用户无需购买软件,而是向提供商租用基于Web的软件,来管理企业经营活动。类似于个人计算机中各种各样的应用软件。提供SaaS服务的厂家越来越多,典型的如国外的Salesforce、国内的淘宝等。

 

口袋应试:ACaas(门禁即服务)、DaaS(数据即服务),试题经常出,但是教材中没讲

ACaaS(Access control as a Service):

门禁即服务,是基于云技术的门禁控制,当今市场有两种典型的门禁即服务:真正的云服务与机架服务器托管。

DaaS(数据即服务)

云端公司负责建立全部的IT环境,收集用户需要的基础数据并且做数据分析,最后对分析结构或者算法提供编程接口,让数据成为服务。

第二版[email protected]

出题概率:★★★

150120、170124、190321

 


 

3.8.1 云计算

1.云计算概念

口袋应试:“云计算的概念和特点”

云计算是指基于互联网的超级计算模式,通过互联网来提供大型计算能力和动态易扩展的虚拟化资源。云是网络、互联网的一种比喻说法。云计算是一种大集中的服务模式:服务器端可以通过网格计算,将大量低端计算机和存储资源整合在一起,提供高性能的计算能力、存储服务、应用和安全管理等;客户端可以根据需要,动态申请计算、存储和应用服务,在降低硬件、开发和运维成本的同时,大大拓展了客户端的处理能力。用一句话概括云计算就是通过网络提供可动态伸缩的廉价计算能力,其通常具有下列特点:

(1)超大规模

(2)虚拟化

(3)高可靠性

(4)通用性

(5)高可扩展性

(6)按需服务

(7)极其廉价

(8)潜在的危险性

第二版[email protected]

出题概率:★★

180323、190123

 


 

3.云计算架构

从对外提供的服务能力来看,云计算的架构可以分为3个层次:基础设施即服务 (laaS)、平台即服务(PaaS)和软件即服务(SaaS)(详见本书1.6.2节)。

(1) 基础设施即服务(laaS)

英文为Infrastructure as a Service,指消费者通过Internet可以从云计算中心获得完善 的计算机基础设施服务,例如虚拟主机、存储服务等,典型厂家有Amazon、阿里云等。 如果把云计算比作一台计算机,laaS就相当于计算机的主机等硬件。

(2) 平台即服务(PaaS)

英文为Platform as a Service,指为云计算上各种应用软件提供服务的平台应用,其作用 类似于个人计算机的操作系统,也包括一些增强应用开发的“开发包'典型厂家有Google App Engine、Microsoft Azure、阿里 Aliyun Cloud Enginee、百度 Baidu App Enginee 等。

 

(3) 软件即服务(SaaS)

英文为Software as a Service,是一种通过Internet提供软件的模式,用户无需购买 软件,而是向提供商租用基于Web的软件,来管理企业经营活动。类似于个人计算机中 各种各样的应用软件。提供SaaS服务的厂家越来越多,典型的如国外的Salesforce、国内的淘宝等。

第二版[email protected]

出题概率:★★★★

160117、180109、180123、190109

 


 

4.云计算应用

(1) 从服务层次来看,如前所述,云计算的应用可分为基础设施即服务(laaS)、平 台即服务(PaaS)、软件即服务(SaaS) 3个层次。

(2) 从应用范围来看,云计算又可分为公有云、私有云和混合云。

公有云通常指第 5方提供商用户能够使使用的云,

私有云是为一个客户单独使用而构建的,因而提供对数据、安全性和服务质量 的最有效控制。

混合云就是将公有、私有两种模式结合起来,根据需要提供统一服务的模式。

(3) 从行业来看,在国内云计算应用较多的行业包括金融、政府、电子商务、游戏、 音视频网站、移动应用、门户和社区等。

第二版[email protected]

出题概率:★

170324


●其它专业的备考复习资料,可以在查看我的博客:跬步郎的博客  。已发布的专业有“信息系统项目管理师”“网络规划师”“系统架构设计师”


1.6.1大数据

1.大数据概念

......

大数据具有5V特点:Volume (大量)、Velocity (高速)、Variety (多样)、Value (价值)和Veracity (真实性)。

第二版[email protected]

出题概率:★

190307

 


 

2.大数据关键技术

(1)大数据存储管理技术。

大数据存储技术首先需要解决的是数据海量化和快速增长需求。存储的硬件架构和文件系统的性价比要大大高于传统技术,存储容量计划应可以无限制扩展,且要求有很强的容错能力和并发读写能力。目前,谷歌文件系统(GFS)和Hadoop的分布式文件系统HDFS奠定了大数据存储技术的基础。大数据存储技术第二个要解决的是处理格式多样化的数据,这要求大数据存储管理系统能够对各种非结构化数据进行高效管理,代表产品如:谷歌BigTable和HadoopHbase等非关系型数据库(NoSQL)。

(2)大数据并行分析技术。

大数据的分析挖掘是数据密集型计算,需要巨大的计算能力,对计算单元和存储单元的数据吞吐率要求极高,并要求计算系统有非常好的扩展性和性价比。谷歌的MapReduce是主要的大数据分布式并行计算技术之一,而开源的分布式并行计算技术Apache HadoopMapReduce,已经成为应用最广泛的大数据计算软件平台。

(3)大数据分析技术。

大数据分析技术的发展需要在两个方面取得突破,一是对规模非常庞大的结构化数据和半结构化数据进行高效的深度分析:二是对非结构化数据进行分析,将海量复杂多源的语音、图像和视频数据转化为机器可识别的、具有明确语义的信息,获取隐性的知识。大数据分析的技术路线主要是通过建立人工智能系统,使用大量样本数据进行训练,让机器模仿人工,获得从数据中提取知识的能力。2006年,科学家根据人脑认知过程的分层特性,提出增加人工神经网络层数和神经元节点数量,加大机器学习的规模.构建深度神经网络,可以提高训练效果,使得神经网络技术成为机器学习分析技术的热点,并在语音识别和图像识别方面取得了很好的效果。

第二版[email protected]

出题概率:★★★★★

160323、170123、170323、180122、180322、190323

 


 

3.8.4大数据

3.大数据关键技术

大数据所涉及的技术很多,主要包括数据采集、数据存储、数据管理、数据分析与挖掘四个环节。在数据采集阶段主要使用的技术是数据抽取工具 ETL。在数据存储环节主要有结构化数据、非结构化数据和半结构化数据的存储与访问。

在关系数据库,通过数据查询语言( SQL)来访问;非结构化(如图片、视频、 doc文件等)和半结构化数据一般通过分布式文件系统的 NoSQL(Not Only SQL)进行存储,比较典型的 NoSQL有 Google的 Bigtable、Amazon的 Dynamo和 Apache的 Hbase。大数据管理主要使用了分布式并行处理技术,比较常用的有 MapReduce,编程人员借助MapReduce可以在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。数据分析与挖掘是根据业务需求对大数据进行关联、聚类、分类等钻取和分析,并利用图形、表格加以展示,与 ETL一样,数据分析和挖掘是以前数据仓库的范畴,只是在大数据中得以更好的利用。

(1)HDFS

Hadoop分布式文件系统( HDFS)是适合运行在通用硬件上的分布式文件系统,是一个高度容错性的系统,适合部署在廉价的机器上。

(2)HBase

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的

Google论文“Bigtable:一个结构化数据的分布式存储系统”,HBase在 Hadoop之上提供了类似于 Bigtable的能力。利用 HBase技术可在廉价 PC Server上搭建起大规模结构化存储集群。

HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。

(3)MapReduce

MapReduce是一种编程模型,用于大规模数据集(大于 1TB)的并行运算。

(4)Chukwa

Chukwa是一个开源的用于监控大型分布式系统的数据收集系统。这是构建在 Hadoop的 HDFS和 Map/Reduce 框架之上的,继承了 Hadoop的可伸缩性和鲁棒性。

第二版[email protected]

出题概率:★★★

 


以下为第一版内容,仅供参考


 

云计算

1.云计算(cloud computing)是基于互联网的服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。

2.云计算是一种理想状态,它无需用户的电脑进行数据处理而是交给云端进行处理,因为云端处理数据能力更强一些

3.云计算的运用目前常分为四大类:云安全、云游戏、云储存、云物联

  云计算可以认为包括以下几个层次的服务:基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)。这里所谓的层次,是分层体系架构意义上的“层次”。IaaS,PaaS,SaaS分别在基础设施层,软件开放运行平台层,应用软件层实现。

出题概率:★★

150320、150317

 


 

 云计算及服务形式

1.云计算(cloud computing)是基于互联网的服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。狭义云计算指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式,指通过网络以按需、易扩展的方式获得所需服务。这种服务可以是IT和软件、互联网相关,也可是其他服务。它意味着计算能力也可作为一种商品通过互联网进行流通。云其实是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网,后来也用来表示互联网和底层基础设施的抽象。

 

2.云计算是一种理想状态,它无需用户的电脑进行数据处理而是交给云端进行处理,因为云端处理数据能力更强一些

 

3.说道云计算的运用目前常分为四大类:云安全、云游戏、云储存、云物联


发布了45 篇原创文章 · 获赞 21 · 访问量 10万+

猜你喜欢

转载自blog.csdn.net/smallstepser/article/details/103874683