职位薪资:20-40K·13薪
经验:3-5年
学历:本科
类型:全职
【岗位职责】
1、负责自然语言处理技术在本地化行业的研究及开发,利用开源代码模型和语料库启动机器翻译模型培训并持续优化改进;
2、维护现有机器翻译模型和语言资产,利用增量语料持续优化机器翻译引擎并提升机器翻译质量,优化机器翻译与生产流程的对接;
3、准确把握客户需求,形成快速的解决方案并进行落地,负责自然语言处理技术相关算法的开发、模型训练和推演,完成生产部署和运维;
4、开发高效的算法来清理输入数据,建立测试集追踪BLEU值及其他测评模型优化情况,对机器翻译结果进行深度分析,从引擎自身及语料层面提出优化方案;
5、跟踪自然语言处理业界最新动态,进行自然语言处理相关的其他算法调研,将前沿技术应用于本地化业务,提升公司技术实力。
【任职资格】
1、计算机、统计学、人工智能、机器学习(机器翻译)等相关专业方向的研究生及以上学历;
2、熟悉NLP算法,包括但不限于中文分词、词性标注、实体识别、问答系统、意图识别、情感分析、内容生成、对话理解等相关算法;
3、熟悉一种及以上深度学习框架,比如Tensorflow、Pytorch等,熟悉Marian 机器翻译训练框架尤佳,对深度神经网络非常熟悉,能熟练的根据现有问题进行模型建立,熟练掌握各类文本处理的方法;
4、较强的工程实现能力,熟练掌握C/C++/JAVA其中一门开发语言,熟练掌握python、perl等任意一门脚本语言;
5、熟悉数据爬取及数据挖掘技术,熟悉 Transformer, BERT / BART, 或 NLLB等模型;
6、有优秀的逻辑思维能力和新知识学习能力,善于分析和解决问题,良好的沟通能力与团队协作能力;
7、有分布式训练与机器学习基础架构搭建经验;
8、有本地化服务等领域里的NLP落地经验者优先;
9、有WMT国际机器翻译大赛机器翻译测评经验者优先。