中软大数据开发工程师1、介绍一下做过哪些项目?
2、用到哪些技术?哪些技术用的比较熟悉?
3、hdfs有几种模式、例如安全模式?
4、进入安全模式的原因?
5、学习hbase参考的数据?
6、对yarn的了解?yarn里面的进程?
7、flume可以直接从数据集到hdfs上,为什么还要经过kafka?
8、怎么解决flume的消费速率问题,flume各自做什么的?
9、RDD在spark中怎么运转?spark对RDD做了哪些事情?
10、任务调度器做了哪些事情?后台调度器分布在哪里?
11、shuffer管理器有哪几种?
12、怎么选择shuffer来避免数据倾斜?
13、filemap和map的区别?
14、大数据团队有多少人?
15、对机器学习算法的了解?
16、自己如何去做技术选型?如何考虑框架技术选取?
17、使用Phoenix会不会造成性能损失?
18、hbase的读写热点造成原因?如何解决该问题?数据为什么会集中在一个Region里面?
19、要考虑技能选型优势和劣势问题?
20、hbase的缓冲策略?
面试感受:一般;面试难度:普通难度;面试来源:网络招聘