职位描述
Base地:杭州/上海
职位描述:
1、作为基础设施可靠性负责人,负责基础设施架构整体高可用风险分析、健壮性检测用例设计及攻击运营,提交基础设施可靠性分析及检测报告,驱动基础设施整体可靠性架构能力提升;
2、作为基础设施可靠性负责人,抽象并设计面向基础设施架构及运行体系脆弱性的分析规则或模型,实现基础设施脆弱性的全自动化或智能化分析;
3、作为全局面向蚂蚁全局的基础设施高可用专家,承担架构职责,可给出前沿、突破性的基础设施高可用技术规划,POC并设计研发相关平台及智能分析检测平台(如ChaosMonkey/ChaosKong);
职位要求:
1、有3年以上基础设施技术开发或运维架构经验,能够独立承担云平台高可用风险分析;
2、具备良好的风险敏感度及技术视野,能够敏锐识别基础设施架构的薄弱点,并针对性设施风险防御及常态化演练方案;
3、有网络技术或k8s、容器等技术应用或SRE实践经验;
4、具备较强的技术分析及解决问题的能力,就有良好的逻辑表达、沟通及团队协同能力;
5、思维严谨,逻辑清晰,具备批判性思维能力和习惯;有很强的分析复杂问题和解决复杂问题的能力,有强烈的责任心和使命感;
6、有SRE架构或者容灾演练平台设计经验者优先;
7、或有性能分析、性能测试或健壮性测试经验者优先;