Msra 面经。 1. 自我介绍; 2. 讲一讲 mapreduce 的流程以及和 spark 的区别; 3. 讲一讲如果做一个爬虫,数据处理,大概是怎么一个框架; 4. 假如我想爬很多的网页,但有很多重复,怎么过滤,重复的网页我就不爬了; 5. HBase 的特点; 6. 假如访问HBase,但 发现内容不在内存(memStore )里,怎么去查disk(storeFile); 7. HBase 怎么唯一确定一行,假如我同时读写,怎么办。 8. HBase 的 timestamp; 9. HBase 的故障恢复机制是什么? 10. 问了一道 LIS。
北京市 · 计算机软件 · 500-999人 · 成立29年 · 火热招聘
#商务笔记本#手机#浏览器#ERP系统#输入法#云服务器#电子邮箱#高端笔记本#人工智能#电脑摄像头#世界互联网公司#电脑软件#在线办公#一体电脑#办公软件#游戏手柄#平板#游戏机#杀毒软件#云盘#超极本#电容笔#鼠标#无线鼠标#操作系统#搜索引擎
公司全称
微软(中国)有限公司
上下班时间
上午10:00-下午6:00
不加班
联系方式
18515983581
010-59179000
...更多
地址
北京市海淀区丹棱街5号
简介
-