培训地点 |
北京市计算中心 (北京市海淀区丰贤中路7号北科产业3号楼) |
培训时间 |
2018年7月15日-7月19日 |
课程为多期,其他时间其他地点还有相同课程安排,具体请加微信咨询。
一、培训收益
本培训课程主要从组件的架构原理、安装、配置、运维、调优等方面进行讲解。通过此次课程培训,可使学习者获得如下收益:
1、掌握大数据平台实现安装、配置、监控;
2、理解并掌握分布式存储 HDFS 上的文件操作及运维命令;
3、外部数据导入 Yarn 运行、调度Spark 任务 ;
4、 SQL on Hadoop;
5、掌握分布式下的事务操作;
6、掌握基于内存/SSD 的优化加速;
7、理解并掌握Hyperbase 数据库。
二、培训特色
1、课程注重学练结合的方法,会采取课中练习的方法,充分调动学习者思考的积极性,在做中掌握相关知识和技能;
2、专家讲师精彩内容解析、学院专题讨论、研究;
3、通过全面知识理解、技能演示和实践引导学员掌握课程内容。
三、培训人群及预备技能
1、运维实施工程师;
2、系统管理员;
3、IT项目经理。
要求熟练使用Linux、了解SQL语法及数据库基本概念。
四、培训费用
培训费6000元/人(含培训费、场地费、资料费),食宿自理。
报名咨询:
五、课程大纲
序号 |
课程大纲 |
1 |
大数据简介 |
2 |
分布式存储 HDFS HDFS 的特点 内部角色 NameNode 与 DataNode 文件的可靠性存储 解析文件读写过程 Client 操作 HDFS 的常用命令 运维管理 HDFS |
3 |
分布式资源调度 Yarn Yarn 架构与 Resource Manager、Node Manager 分布式资源封装与管理 Yarn 下的调度器策略 解析作业提交执行过程 |
4 |
分布式计算框架 MapReduce 特点 解析 Mapper—Reducer 运行机制 高性能的计算框架 Spark 弹性分布式数据集 RDD 与DAG |
5 |
NoSQL 数据库 Hyperbase Hyperbase 中的数据模型 架构与 Master、RegionServer 数据读写流程 非结构化数据存储 Object Store 简介 丰富的索引组合 SQL for Elastic Search |
6 |
SQL 执行引擎 组成架构介绍 SQL 语法介绍之 DDL SQL 语法介绍之 DML SQL 语法介绍之 DQL 存储过程介绍 大数据量下的通用优化策略 各种表的总结与应用场景选择 |
7 |
大数据平台流处理 流处理概念 SQL 定义语法 |
8 |
平台安全管控 安全协议 各组件安全下的操作 |
9 |
集群规划与运维诊断 |
10 |
总结 |