职位描述

工作职责: 1、值班人员通过座机、手机、有度、微信、工单、邮件,7*24小时响应一切紧急事件和需求。7×24小时值班,一周一次夜班。 2、时刻紧盯线上监控系统,做好异常信息、异常告警的快速响应和处理,跟进做好监控收敛 3、积极做好故障响应,执行紧急应急预案,跟进故障的处理进度,及时上升 4、提供流程内发版和紧急发版任务 5、负责运维报表、故障报告、运维公告、运营公告发布 6、负责测试环境的维护工作 7、通过工具完成网络、系统等相关工作的支持 任职资格: 1、计算机相关专业大专及以上毕业。 2、理解Linux、tomcat、mysql、apache、nginx系统的管理配置和维护 3、了解Shell/python/ansible脚本,能够编写各类服务器维护脚本 4、理解系统及网络故障分析和处理,服务器性能监控与分析 5、掌握监控系统与安全系统,如grafana、falcon、zabbix、prometheus等,有编写监控模块能力; 6、了解docker、Kubernetes、容器化技术优先; 7、注重服务意识,具有较强的责任心及良好的团队合作精神,能够在一定压力下工作;有良好自学能力和独立解决问题的能力优先 其他细节: 三班倒轮班制度:早班7:30-16:30;中班15:00-22:30 晚班22:00-8:00 四岗位轮岗制度: ①测试岗负责维护测试环境阿里云服务器,包括微服务部署,中间件集群维护,CICD平台维护,监控系统维护; ②监控岗负责生产环境所有的告警响应,包括数据库,网络,基础系统,业务系统; ③发布岗负责使用自研的发布平台负责生产环境版本发布; ④服务台负责响应日常报障和故障、业务巡检工作、故障报告编写等。