氛围很好,面试题很难14号笔试之后焦急的等了一天两天三天,看着周围的小伙伴们一个个都接着电话通知面试去了,我的电话还是迟迟不来。17号是面试最后一天,上午听同学说系统可能出了点问题有些人没通知到,我立马杀到了面试现场。还好现场小姑娘说好像对我名字有点印象,刨了半天把我的简历试卷找了出来。有惊无险的搭上了研发面试的末班车。 上午11点,现场除了测试和算法的,就剩我一个研发了。初面的是一个胖胖的小哥,对我研究的方向挺感兴趣。一面基本都是hadoop方面的,问的比较深。现在回忆下主要有这么几个问题: 1、谈一下hadoop的工作机制(主要谈了下心跳机制) 2、说一下mapreduce的详细过程(这个主要说了map如何文件写本地,如何通知master,master再通知reduce去什么地方拉取数据等,hr挺满意) 3、hadoop如何判断一个任务失败,失败了怎么做 4、作业提交之后都发生了什么 5、他们项目有500亿记录,每条记录100列,现在用Hive对某些列做groupby,但是速度太慢了问我怎么改进。(这个真是撞大运了,我说完我的想法后hr说他们也是这么解决的) 6、画了个曲线图说多线程或者mapreduce总会有那么几个拖后腿的老完不成怎么办(我脑子一抽大笔一划说拖后腿的全干死,大数据下没人会关注数据全不全,缺那么几个不影响,响应速度第一。hr很吃惊,说谷歌也是这么干的) 7、写段代码,1到1000,统计出1的个数。我写的时候我看hr在我简历后面写评语,简历上画个A,然后说推荐我进入二面。 休息五分钟后,换个地方继续二面,二面继续问hadoop的问题。 首先问了个hadoop单点登录的问题,主要是多用户权限问题 然后问了点hbase相关的查询及优化问题,主要聊了hbase的region机制以及多线程。给hr看了个图片,1700W里随机查找10000条记录时间200ms左右 mapreduce动态倒排问题 mapreduce相似连接 hadoop维护中数据恢复技术 问道维护的时候随手拿出我的诺基亚神机给演示了下hadoop的操作 然后写了两个小代码 一个二分查找,一个堆排序 剩下的就比较轻松了,问一下平时都干嘛,最后我们很愉快的聊了聊杭州的美景跟美女 吃饭回来继续三面,一个中年大叔面我。继续是hadoop,问的显然有了深度,主要是架构方面的,问我觉得hadoop最大的缺陷在哪里,可以有什么改进等,最后又写了一段小代码关于正则表达式的。 总结:自己研究的东西一定要研究透,问的都是比较有深度的。自己搞不明白的就别写简历了 熟悉的一定得回答干脆果断 实在不会的不要狡辩 写代码是必不可少的
3轮面试:笔试、电话面试、留作业
面试感受:不好;面试难度:困难;面试来源:社会招聘