大数据开发工程师基础面试题 - 代码天地

大数据开发工程师基础面试题

其他 2021-03-28 12:22:05 阅读次数: 0

Hadoop
1.组成
2.Hdfs 文件上传
3.Hdfs 文件下载
4.MR 流程
5.MR 中combine
6.Yarn的运行流程
7.Yarn 的资源调度类型
8.Zookeeper 功能
9.Zookeeper 的主从选取机制
10.Mr 程序wordcount
11.Mr中的缓存 chickpoint

Spark
2.Spark 资源调度过程
3.Spark 运行流程
4.Shuffle
5.Spark 常用算子
6.缓存catch和chickpoint
7.Spark 程序 wordcount
8.Spark 调优
9.Spark 和 MR 的区别

Flume
1.事务
2.Source
3.Channal
4.Sink
5.项目中的配置

Linux
1.常用命令
2.脚本的编写

Kafka
1.组成
2.保证数据不丢数据
3.精确数据只消费一次
4.Kafka 快的原因

Hive
1.架构
2.Hivesql底层转换 MR 过程
3.内外部表
4.建表方式
5.导入数据
6.导出数据
7.分区
8.分桶
9.自定义函数UDF ,UDAF,UDTF
10.Order by , sort by , distribute by , cluster by区别
11.Rank() 和dense_rank() 的区别
12.字符串拼接 concat() concat_ws()
13.时间戳日期转换
14.切分字符串substr() 和 split()[]
15.Sql调优
16.数据倾斜及解决方案
17.参数调优
18.压缩格式
19.执行计划explain
20.数据倾斜定位sql位置
21.手写sql topN
22.手写sql 累加
23.手写sql 连续指标
24.手写sql 行列转换

算法
1.冒泡排序
2.快速排序
3.归并排序
4.二分查找

Redis
1.概念
2.数据类型

Scqoop
1.空值问题
2.全量增量导入及增量合并

项目
1.数据预处理做了什么
2.Idmapping
3.数仓建模流程
4.数仓分层的意义
5.拉链表
6.数据量
7.数据的生命周期
8.数据治理
9.集群
10.小组人数及分工
11.项目亮点
12.遇到的问题及解决
13.日志数据流量域的一个指标整个处理过程
14.业务数据一个指标整个处理过程
15.定时任务出现问题自动报警发送邮件

猜你喜欢

转载自blog.csdn.net/weixin_47699191/article/details/115278852

大数据开发工程师基础面试题

大数据开发工程师面试题（20.04.14）

大数据开发工程师面试题

大数据工程师面试题

大数据工程师面试题(七)

大数据工程师面试题—5

大数据工程师面试题—4

大数据工程师面试题—2

大数据工程师面试题—1

大数据工程师面试题—3

大数据工程师面试题--7

大数据开发工程师面试题(附答案)

数据开发工程师-面试题

JAVA开发工程师面试（1），java面试题，java基础笔试题，BAT

大厂面试 | 阿里巴巴大数据工程师面试题汇总

大数据运维工程师面试题目

《大数据工程师面经自己整理面试题1--》

嵌入式工程师基础面试题

AI算法工程师面试题基础精选

（转）Python后端开发工程师面试题

Java开发工程师面试题1

Java开发工程师_面试题集(一)

Java开发工程师面试题

Java高级开发工程师面试题

Java 开发工程师面试题(一)

JAVA高级开发工程师面试题2023

java工程师面试题

算法工程师面试题

Python工程师面试题

Python开发工程师面试题之爬虫面试题分享

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)