大数据面试总结《七》

上午第一家被虐的很惨,一直在追问项目中的一个项目,从设计架构,业务实现,为什么这样做,性能如何,等等问题,很多地方深入到项目中实现细节 ,没有答出来,
1 项目规模
2000万用户
日志数据总量在50-100TB
每日数据500GB-1TB
服务器 16GB + 8TB
数据节点20台
集群规模在30节点

2 lvs和nginx比较

浮动ip ,负载均衡
面试官说 ,实际nginx就足够了 ,不需要lvs做高可用
3 spark on yarn 和mapreduce 中yarn有什么区别

没有答出来

面试官说:看你的简历,写的太花 ,用过好多技术,但都太浅,需要找准一门技术深入学习

第二家面试:
1 spark 原理

2 hbase最主要的特点是什么
列存储?
3 给一个案例 用mapreduce去实现,,这个实现过程,会遇到什么问题,怎么解决

因为这个差点和面试官吵起来 ,我感觉自己说的很明白,面试官觉得我说的有问题,可能表述没那么清晰 由案例引申出来的问题 沟通明白问题实质是什么问题 给出解决方案 准确表述出来 很重要

4 为什么不用hive呢
我说:老大从开发转的,他这样选的
hive也用,做些简单的分析

第三家面试 :

这是个人事在面技术:所有就是我一个人在说项目,她在记录,
然后让我去复试 订在了周五

如有需要,可以添加博主微信,获取更多面试资料,或者向博主请教面试经验
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41045909/article/details/88856628