职位描述
学历范围:硕士及以上学历
经验/经历
1、精通 Python 和 Java, Scala, Golang 至少两种编程语言(必须);
2、精通 Hadoop, Spark,Dask, Ray 等主流开源分布式计算平台和框架(必
须)
3、了解容器和容器编排技术: Docker, Kubernetes(必须)
4、对开源分布式计算和分布式文件和对象存储有深刻理解和应用
5、了解 Minio 对象存储和 Alluxio 分布式内存文件系统
6、有 2 年以上的 Linux 系统上开发分布式大数据项目的软件开发经验;
7、具有良好的编程规范,例如代码规范和注释文档规范;
能力/素质/
态度要求
8 、 具 有 良 好 的 软 件 工 程 规 范 , 熟 悉 源 码 管 理 Git , 软 件 构 建 工 具
Maven(Java) ,包管理和发布工具 Conda,持续集成和开发 CI/CD,SDK 和
API 的开发;
9、有良好的产品分析、总结归纳能力,具有很好的跨团队沟通和协调能力,
抗压能力强;
10、具备优秀的沟通表达能力、具备产品创新意识及商业敏感性;
11、熟悉公有云 AWS 和阿里云,了解混合云和多云的方案并能协助部署的优
先
12、熟悉图数据库 Neo4J, NebulaGraph 等的优先
13、开源数据湖技术和分布式查询引擎,例如 DeltaLake, Iceberg,
Lakehouse, Presto, Trino 等的优先