1.自我介绍2.数据仓库的分层,以及为什么要做数据仓库3.数据仓库的血缘关系4.拉链表的实现5.hive的压缩格式和存储格式6.星型模型和雪花模型优缺点7.spark和hadoop的区别8.spark数据倾斜发生原因及解决方案9.spark的新特性AQE和DPP10.kafaka的特性11.kafaka为啥不能读写分离12.sql索引作用13.联合索引的使用14.窗口函数15.redis的一些内容16sparkstreaming和flink的区别17.平时怎么学习技术的18.情景题 left join on和where两个语句的区别