职位描述
职位描述:
1、负责人工智能平台日常资源管理,如资源开通、删除、变更、上线审批、数据导入和训练等,为客户提供产品使用指引;
2、负责人工智能平台日常运维、管理、故障排除等工作,确保系统的正常稳定运行;
3、解决平台系统运行过程中技术问题,对疑难问题进行分析并解决;
4、负责相关技术文档的编写;
任职资格:
1、学历要求:
-统招本科及以上学历,理工科专业背景。
2、工作经验:
-3年以上平台运维相关工作经验;
3、能力要求:
-有IDC机房 运维经验,熟悉服务器上下架流程;
-有服务器硬件维护经验,可以独立判断服务器硬件故障并做紧急处理;
-熟悉操作系统(Linux相关)安装部署,熟悉raid卡配置操作;
-有网络运维相关经验,可以独立判断网络故障点,进行故障修复;
-熟悉主流网络交换机设备的配置,包括不局限华为、H3C、锐捷等;
-熟悉vlan、端口汇聚等配置;
-有系统运维经验,熟悉Linux相关操作系统和常用命令的使用;
-有容器、K8S运维经验;
-熟悉Linux相关系统常用中间件(不限于nginx、keepalive、zookeeper、redis、nacos、minio、es、kafka、rocketMQ、fluentd等)、数据库(MySQL、mongodb)等安装和维护;
-熟悉常用监控系统,可以独立部署(zabbix、Prometheus等);
-有独立编写运维文档、升级文档的能力;
-有责任心,有抗压能力。