面试:数据开发。感觉上还是很不错的,难度是有的,结果应该是没过。一面 面试流程:自我介绍:问我为什么想从事数据工作?(我能说只能干这个了吗?)了解的大数据计算框架有哪些?处理的数据的级别;实习经历:在滴滴主要工作中最有难度的部分?和数仓沟通确定口径;继续追问很多细节;项目相关:spark相关内容:spark实现Wordcount的伪代码;除了reduceby算子之外还有哪些算子可以实现Wordcount?(groupby,foldby,aggregateby等算子都可以)spark与flink计算框架的区别(老老实实回答不会);hive框架:hive语句执行流程,问的问题给我整不会了他也知道问的问题不太明确;hive语句优化方式(逻辑优化和物理优化,逻辑优化包括谓词下推,列裁剪等;物理优化主要针对数据块,分区裁剪、切分、合并等等)临时加问了一句,hiveonspark和sparkonhive区别(听都没听过_);数据仓库:我项目里的数仓打几分?(我回答70分给他整蚌埠住了,我很生气谢谢);数据仓库分层规范;数据库三大范式;为什么要做成数据仓库;语言基础:非科班出身有没有问题?(如果没问题的话那我为啥不去试试软件开发呢亲?肯定是比不上专业的);Linux问题:常用指令。
1轮面试:视频面试
面试感受:很好;面试难度:有难度;面试来源:BOSS直聘