直接面试,没有笔试!一共面了3轮,第一轮,介绍自己和项目,问了拉链表并手写拉链表sql;问了hive的优化及你自己遇到hive问题并说出你的优化方法;出了道sql,让你写sql。第二轮面试,问了下数仓建模理论,出了一道sql题,让你写sql。第三轮面试,问你的项目的架构和数仓的设计,从数据采集到数据分层,到数据应用。然后让你用手画出来并说出理由。
Q:说下你对数仓粒度的了解?
Q:如何保证数据的正确性,就是说你怎么判断你的统计结果是正确的?
Q:如何评价一个数仓项目做得好与不好?
Q:数仓工程师最重要的素质是什么?