职位描述
岗位职责:
1、负责GPU服务器的故障诊断、故障维修、运维支撑等工作
2、负责GPU服务器相关的技术方案和项目实施,以及日常GPU服务器生命周期内的系统运维工作。
3、学习和研究GPU服务器相关新技术,并将新技术与运维自动化环境的进行兼容适配。
岗位基本要求:
1、本科及以上学历,计算机相关专业。
2、关于GPU服务器的技术研究,异常处理,日常维护,具有5年以上相关经验。
3、对GPU服务器的组成结构,GPU服务器的计算链路,GPU服务器的IO链路有深入的理解,并具有很强的故障定位和问题解决能力。
4、熟悉Linux基本管理,熟练使用Shell、Go、Python中的至少一门脚本语言。
5、强烈的责任心,良好的团队协作精神,优秀的表达和沟通能力、乐于接受挑战,能承受工作压力
具备以下优先:
1、能熟练阅读英文文档
2、对GPU服务器相关软硬件技术有体系化的理论研究及技术博客等相关沉淀
3、对驱动,内核,Firmware 有较丰富的知识积累。
岗位亮点:
1、能接触到公司所有PaaS场景,体验并掌握各个PaaS的场景要素,对接PaaS的需求,加深对PaaS的理解
2、能经历业务快速发展给基础设施带来的持续挑战,不断突破自我,和团队一起成长
3、能在团队里既可以持续探索技术深度,又能不断加宽广度