大厂面试 | 阿里巴巴大数据工程师面试题汇总 - 代码天地

大厂面试 | 阿里巴巴大数据工程师面试题汇总

其他 2021-11-20 20:22:09 阅读次数: 0

坐标城市：浙江杭州

面试公司：阿里巴巴

面试岗位：大数据工程师

面试难度：给4星吧

面试感受：还行吧，就是紧张了有点

本人学计算机的，同时也自学了Java、Python、C#、前端等，感觉都是皮毛，最后觉得还是大数据比较适合我，不过技术之间都是想通的，越来越发现自己欠缺的知识其实还有很多。

面试题

1.kafka 重启是否会导致数据丢失

2.讲一讲checkpoint

3.描述mapreduce的过程，中间有几次写磁盘

4.ORC、Parquet等列式存储的优点

5.调度系统的实现，开源调度系统Azkaban

6.zookeeper HA原理

7.二分法以及变种

8.用java实现多种排序算法

9.如何用redis实现分布式锁

10.ArraryBlockingQueue的实现

11.一个文本文件，大约有一万航，每行一个词，要求统计出其中最频繁出现的前10个词

12.上千万或上亿数据（有重复），统计其中出现最多的前n个数据

13.有10个文件，每个文件1g，每个文件的每一行存放的都是用户的query，meigewenjiandequery都有可能重复，要求你按照query的频率来排序

14.海量日志数据，提取出某日访问百度最多次数的那个IP

15.zookeeper选举机制

16.zookeeper的端口水命，作用

17.zookeeper主从服务器如何通信

18.HFile数据格式中的KeyValue介绍

19.Spark中的Work主要工作是什么

20.Spark有几种部署模式，每种模式有什么特点

21.spark的driver的功能是什么

22.Spark master HA主从切换过程不会影响到集群已有作业的运行，为什么

23.spark streaming读取kafka的两种方式

24.spark master使用zookeeper进行ha，有哪些源数据保存到Zookeeper里面

25.spark rdd如何区分宽依赖窄依赖

26.怎么解决kafka的数据丢失

27.怎么查看kafka的offset

围绕kafka、spark、Hadoop问的较多，相当有难度，本关已过~，喜欢杭州，希望能进阿里！

猜你喜欢

转载自blog.csdn.net/cz_00001/article/details/120329202

大厂面试 | 阿里巴巴大数据工程师面试题汇总

各个大厂快手、阿里巴巴、等的Java高级工程师面试题！（附上简历技能）

年薪20万的阿里巴巴Python工程师面试题

年薪50万的阿里巴巴Python工程师面试题曝光

阿里巴巴2019年前端工程师面试题和答案解析

面试快手、阿里巴巴、等大厂的Java高级工程师面试题（附上简历技能）希望可以帮到你

阿里巴巴面试题汇总

阿里巴巴最新开源：互联网Java工程师 1000 道面试题！

大厂测试工程师面试题总结

大数据工程师面试题

大数据工程师面试题(七)

大数据工程师面试题—5

大数据工程师面试题—4

大数据工程师面试题—3

大数据工程师面试题—2

大数据工程师面试题—1

大数据工程师面试题--7

大数据开发工程师面试题（20.04.14）

大数据开发工程师基础面试题

大数据开发工程师面试题

阿里巴巴常考面试题及汇总答案

【阿里巴巴】一面面试题汇总

阿里巴巴多线程面试题汇总

大厂高级测试开发工程师面试题(750道)整理汇总

大厂网络工程师面试题整理汇总

这就是阿里巴巴月薪20K+测试岗的面试题吗？让我这个3年的测试工程师看的冷汗直流.....

大厂面试

大厂面试题

this的大厂面试题

进大厂必看：阿里巴巴Android面试题集（答案解析）.pdf

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)