职位描述
基本要求:
1、全日制计算机、电子工程或通信相关专业,全日制本科学历,至少1年以上工作经验;
2、有Zabbix、Grafana、Prometheus等监控工具使用及维护经验;
3、有PG数据库使用及维护经验,了解主流数据库(MySQL、Oracle、SQLserver等一种或多种);
4、有ELK部署与平台维护经验,能配合业务对接日志;
5、熟悉Linux操作系统,能够熟练使用系统命令进行系统维护与问题排查;
6、熟悉LVS/Nginx/Apache,Redis,MQ等常用的中间件服务监控部署;
7、熟悉shell、python等语言,并能够运用到日常运维工作中;
8、熟悉使用python或办公软件如office进行数据分析,实现自动化运维优先考虑;
9、熟悉 docker 容器部署与使用,了解 Kubernetes,部署 K8s 集群;
10、具有热忱的工作积极性,自我管理能力,较好的沟通、协调和表达能力;
11、具有高度的责任感和敬业精神,服从工作安排,能适应夜班和节假日值班安排;
岗位职责:
1、负责7×24监控运营服务,通过监控平台实时监控相关系统(机房环境、服务器、网络和各应用系统)的运行状态、性能;
2、当发生告警或故障事件,能及时判断严重等级,并根据问题的简易复杂程度,第一时间对事件进行处理或协调相关二线工程师处理;
3、接听故障报告的电话,跟踪及管理故障处理流程,协调相关人员完成故障的处理;
4、建立和完善公司运维的监控体系和事件处理机制,确保业务的稳定运行;
5、负责平台故障处理,服务器运维;