返回查看全部岗位
招聘中

云PAAS平台及TCE管控运维(高级)

13-20K
北京3-5年大专

职位描述

1、负责编写日常运维保障计划,包括值班监控安排、日常备份计划、数据清理计划、定期巡检计划、例行维护计划、应急演练计划等;根据工作开展情况,对运维保障计划做必要的修订与更新。 2、负责制定系统监控内容,制定和优化监控指标;实施日常监控; 3、根据监控和运行情况,完善监控内容;编写运行维护手册和监控操作手册; 4、实施日常值班监控,记录监控内容;处理故障、报警事件,分析原因,跟踪解决进展;定期完成运行报告,提出监控的优化建议。 5、负责开展健康检查、日常巡检、深度巡检,编制、部署健康检查脚本,调整健康检查阈值,收集整理和分析处理健康检查结果; 6、负责如月结、季节、年结等特殊时点的应用运行状况健康检查,方案实施和问题处理;负责收集整理和分析处理健康检查结果,编写健康检查报告,提出整改建议。 7、负责制定数据、程序等的备份、归档和清理等方案和策略,编写备份、归档和清理等脚本;实施备份、归档和清理等任务;检查备份、归档和清理等结果,并编制记录; 8、负责制定例行维护计划,编写启停等执行脚本,根据例行维护计划安排启停等。 9、负责编写应急处置方案、演练方案、制定演练计划;按计划实施演练; 10、编写应急演练总结报告,对演练中出现的问题进行处理,就演练发现的问题进行分析,提出整改建议;不定期更新、修订相关文档、方案。 11、负责定期进行系统容量性能分析,收集云交易数据、业务数据、运行数据,根据业务发展和资源实用情况,分析云资源使用趋势,提交云容量性能分析报告,提出优化改进建议。 12、结合云运行情况或厂商建议,评估现有版本(固件版本、云环境、设备驱动、操作系统版本、数据库版本、云产品版本等); 13、制定变更升级计划和方案;组织进行新版本的测试和验证;变更试点上线,对变更升级后运行情况进行重点监控;按方案实施变更升级;编写变更升级总结报告。 14、按照运行管理的要求,定期完成运行周报、运行月报、年度运行报告等。 15、负责对来自系统监控、产生的事件进行响应并处理。 16、在事件处理完毕后,及时整理、完成事件分析报告;定期回顾历史事件,分析潜在风险,提出优化建议。 17、对涉及系统变更的需求(外部需求、扩容需求、上线需求等)进行分析,完成需求分析报告 18、与基础设施资源管理部室落实变更所需资源,确认涉及到的资源到位;编写变更、产品上线方案、回退方案及其他上线资料;核实或确定上线版本;填写变更申请单,提出变更申请;参加变更、上线实施工作。 19、对已处理的事件、问题等进行总结,形成知识点,提交架构师审核后,归入中心知识库。 20、定期开展系统安全性检查,以满足风险管理相关规定与要求。 21、对客户的服务请求做出响应、满足或支持客户服务请求,提供技术支持。 22、负责PaaS平台及TCE控制区建设和实施,安装、配置、产品部署、投产、交付验收等工作。

更多云PAAS平台及TCE管控运维(高级)内容