中科院招收的是跟短期项目的大数据分析工程师,需要良好的Linux开发经验、Hadoop经验,面试我的是一位博士 先简单的问了问简历的项目经验,然后问了问我所知道的数据分析涉及到的算法,问我无监督学习都有什么,随机森林的代码实现,又问我Linux懂多少,我介绍了相关指令,又问了我Linux指令查看文件怎么实现,mac系统里如何利用终端下载软件的指令:pip install 。然后问我最长写过多少行代码,操作系统的知识也问了,还问了Hadoop配置集群问题。
最后给我一道思考题:对于很大数据量的日志文件,我们要利用什么算法检测文件中的异常?没答上来。他发告诉我好几种方法,还给我介绍了孤立森林。还是自身知识面太窄。
...查看更多