数据挖掘工程师-实习生面试概况
基于用户贡献的69条数据挖掘工程师-实习生面试经验统计分析得出,结果仅供参考。电话面试。匿名用户
感觉没戏
电话面试,自我介绍完了以后开始问简历里做的项目。但是并没有问项目里用的那些算法的原理什么的。而是问你有没有了解其他的算法?有点懵逼,确实不了解。还问了反向传播,看过什么机器学习的书。
2 年前 发布
3 hadoop相关问得多匿名用户
未通过
1.简要描述如何安装配置一个apache开源版hadoop,描述即可,列出步骤更好
2.请列出正常工作的hadoop集群中hadoop都需要启动哪些进程,他们的作用分别是什么?
3.启动hadoop报如下错误,该如何解决?
error org.apache.hadoop.hdfs.server.namenode.NameNode
org.apache.hadoop.hdfs.server.common.inconsistentFSStateExceptio
n Directory /tmp/hadoop-root/dfs/name is in an inconsistent
state storage direction does not exist or is not accessible?
4.请写出以下执行命令
1)杀死一个job?
2)删除hdfs上的/tmp/aaa目录
3加入一个新的存储节点和删除一个计算节点需要刷新集群状态命令?
5.请列出你所知道的hadoop调度器,并简要说明其工作方法?
6.请列出在你以前工作中所使用过的开发mapreduce的语言?
7.当前日志采样格式为
a,b,c,d
b,b,f,e
a,a,c,f
复制代码
请用你最熟悉的语言编写一个mapreduce,并计算第四列每个元素出现的个数
8.你认为用Java,Streaming,pipe方式开发mapreduce,各有哪些优缺点?
9.hive有哪些方式保存元数据,各有哪些特点?
10.请简述hadoop怎么样实现二级排序?
11.简述hadoop实现join的几种方法?
12.请用Java实现非递归二分查找?...查看更多
美团数据挖掘工程师面试匿名用户
确定通过
先电话一面,问了一些hadoop相关的问题和机器学习优化相关的问题;接着第二面有两个人,先考了算法,接着问了项目,最后给了一个实例问用什么机器学习算法好,并给出建模方式。总体感觉他们对编程语言要求比较低,对算法较高,对机器学习算法和hadoop要求非常高,问题非常主流,对岗位知识构成把握非常到位。...查看更多
2 年前 发布
1 最完整的一次面试体验匿名用户
确定通过
面试的是算法实习生,一个下午面了三轮,每一轮的面试官都很耐心,主要问简历和基础知识,遇到不会的还会耐心解答。总之面试体验很棒。
2 年前 发布
21 实际上是招数据研发,岗位不匹配。匿名用户
未通过
互联网证券组,我开始以为是文本挖掘相关的,后来他说是要数据研发的,也用不到多少数据挖掘的东西。面试官挺水的,简历上算法的东西都没问,问Hadoop,让写MR程序,python数据类型。
星环科技数据挖掘算法实习生岗面试匿名用户
感觉没戏
周四上午电话面试,大约四十分钟,讲了讲自己做的项目,项目中使用的算法和思路,然后问了一些java语言的知识和linux知识。
周六onsite两轮面试,第一轮是个美女面试官,讨论做过的项目,具体的实现思路,很多细节问题。然后又问了一些机器学习算法的基本思路。
最后问了一下如何在Hadoop中实现分布式的kmeans算法,有什么技术难点?如何克服?设计思路是怎样的
第二轮面试是个可爱的胖子,人非常nice。
首先讨论了自己做过的项目,然后了解了一下性格、项目管理和人际沟通能力,比如说:是否接触过一个完整的项目流程?愿意接触客户还是在办公室做研究之类的问题?
然后开始提出若干个开放性技术问题,都是非常有难度的。包括:
海量数据处理中一个设计算法的问题。
银行卡盗刷行为检测。
用户倾向和用户肖像的问题。
中文分词的基本原理。
一个数据记录的两个属性字段值不平衡,如何处理?
......
onsite两轮大概用了两个半小时,大脑一直在不停的转,非常辛苦。多数是开放性问题,而且来自于实际的工程项目中。
面试官非常nice,整个面试过程没有很push的感觉,自己有哪个地方想不明白,面试官还会及时给出一些提示,然后你可以按照他的提示继续往下思考。
总体来说,就是通过不同的探讨、给方案、否决方案、给提示、继续探讨、给新的方案......的过程来测试应聘者的知识深度和思维灵活性。非常喜欢这种面试风格,虽然被虐了,但是面试的过程学到了很多东西。...查看更多
2 年前 发布
1 连着两个小时面了两轮,面得非常详细,题目偏难匿名用户
感觉没戏
一面是一名年轻的技术面试官,首先他让我简单介绍一下自己,然后就之前在企业实习所做的内容做一个介绍,并且必须边画流程图边解释,这个方式在以后描述自己的项目时值得借鉴。另外,他挑出我所做的Logistics项目中的Logistics回归算法的具体流程,我只记得大致原理了,忘了推导流程。然后,他又问不同的模型输出结果怎样进行融合的问题,我提到投票制方法,之前学的boosting方法没有提出来。那么他又问了不同的机器学习算法的应用场景问题,这个之前大致了解过SVM不太适合大规模数据集的训练等,但是他追问原因时回答不全。项目就问到这儿了,接着,他给我出了一道题目:“每次抛硬币出现正反两面的可能性都是1/2,那么连续出现两次正面的期望是什么”;第二个问题:有一个random()函数可以随机返回0或者1,写一个函数用于随机返回0到5之间的任意一个数。 然后他就说等下二面了。
二面面试官是一个中年技术官,也是让我自我介绍一遍(T^T),首先问了我做的机器学习相关的项目,让我挑一个向其介绍,因此我选了和机器学习相关性最强的歧义消解和命名实体识别的项目。详细介绍完了之后,他对项目的细节深入地问了很多,并且问了很多拓展性的问题,步步紧逼,非常深入。总之,这次面试考察了方方面面,总结来说主要考察了以下几点:
一面:实习和项目经历、机器学习算法、概率论、编程能力;
二面:数据挖掘各个环节处理细节、问题解决能力、学习迁移能力、编程能力。...查看更多
同花顺机器学习实习面试。匿名用户
感觉靠谱
主要问文本分类的项目,整个项目流程,中文分词、特征选择、VSM、分类算法,某个算法问的较细,重在为什么选择该算法,该算法的优势。
2 年前 发布
1 面试中关于语言方面还是感觉问的比较深入的,需要说下vector的实现。匿名用户
确定通过
关于vector的实现首先从oop的思路上说它是一个类模板,说下类模板的东西,之后关注vector的内存分配特点(连续存储),访问方式(快速随机访问[]),插入删除是与尾部的距离成正比的,大小大于容量是要重新分配内存,内存的分配是使用allocator类的,等等,一定要从vector的使用方式上一步步解析其实现原理。...查看更多
来自百度的面试语音识别面试一般,共5轮面试虾米
感觉没戏
面试粤语标注师的岗位,共两轮 第一轮HR电话面试,没难度,就问一些个人经历,为什么要选择这份工作,有无相应经历等,可能这个职位当时比较缺人吧,也没有问太难的问题。因为我面试的是粤语的标注师,后续就告诉我会有一个粤语测试发给我,分别是一个录视频的粤语回答问题,问的是为何选择这个岗位,有时间限制。另一个是粤语的文字回答,问的是曾经工作上遇到的印象比较深的事和感受,可以用繁体字,这个打字如果能提前准备好输入法的话会表现好很多,也是有时间限制的。测试都是在专门的网站上做,做之前有自己练习的机会。第二轮两位部门主管视频面试,首先是自我介绍,然后会针对你的经历问很多很比较详细的事,所以就我经验来讲最好不要说太多,很多年前的事情都问我都想直接说我不记得了。。。如果你有把握的可以说多点,他们有陷阱的问题一般留在最后,所以越到后面越不能放松警惕(我也是事后回想才发现是陷阱的)。本来计划的是45分钟,后面聊到一个多小时,感觉他们的提问方式比较死板(也可能是这个职位偏数据的原因),如果你不太理解问题建议问清楚他们再作答,回答尽量简要点,因为很大可能他们会针对你的回答再问(感觉他们提问就是想到什么问什么)。总体来说难度不大,但是怎样回答能让他们满意(契合这个比较重复性的岗位工作性质来看)是最重要的。...查看更多
语音识别面试一般,共1轮面试冯雅心
感觉靠谱
一面业务二面业务三面HR三面还没面,前两面都是专业知识面试。要准备一下语音学常识、做过的论文、项目等。也注重综合素质沟通技能。个人认为实习时间、投入程度也有权重。是我第一次参加这么正式的实习面试,可以当作是对自己的锻炼。
语音识别面试很好,共1轮面试看准63904
确定通过
一面已过,面试官超级nice,不会的东西也会有很多指点。面试的话主要是考察项目和论文的细节内容,因为面试官做的项目有时候会有交集,也会有一些深的讨论。想要面过的话项目和实习的内容需要熟练掌握。最后一道string的算法题,难度还行。
语音识别面试很好,共1轮面试0632
感觉靠谱
面试信号处理工程师,目前一轮,一对一面试。第一轮技术面,详细问简历上的项目,先介绍一下实验过程,再介绍使用过的模型,再问了一下有没有调参经历,batch size 、learning rate的使用情况,大概半小时
说明:数据挖掘工程师-实习生面试经验内容由看准用户自行上传,仅代表内容发布者个人观点。看准网对相关内容的展示并不代表认同其观点。请用户在使用相关信息或依据相关信息作出决策前自行进一步核实此类信息。