岗位职责:
1.深入研究和开发适用于大规模模型的先进算法,包括但不限于AIGC(文生图、文/图生视频、语音转录/翻译/合成等)、机器学习(监督学习、无监督学习、强化学习)、深度学习(卷积神经网络、循环神经网络、Transformer 架构等)算法,针对不同业务场景开发创新算法,以解决图像识别、自然语言处理、语音识别等领域的复杂问题;
2.优化从数据生产、数据配比到大模型训练的全流程;
3.负责构建高质量大规模的强化学习偏好与反馈和强化学习训练数据集,研发迭代可泛化的奖励模型,目标任务包括但不限于:文本、图片、视频等数据,覆盖主观对话、指令遵循、复杂推理、代码、幻觉抑制等任务;
4.设计和执行大模型的训练计划,调整模型参数和超参数,利用分布式训练技术和优化算法提高训练速度和模型收敛性;
5.对训练后的大模型进行全面评估,使用各种评估指标(如语言模型中的困惑度、图像识别中的准确率等)分析模型性能,针对模型过拟合、欠拟合等问题提出优化方案;
6.领导交办的其他工作。
任职资格:
1.计算机科学、数学、统计学、电子工程等相关专业硕士及以上学历。中共党员优先。
2.5年以及上大模型算法研发相关工作经验,有成功的大模型项目落地经验者优先;
3.熟悉从算法设计、模型训练到实际业务应用的完整流程;
4.有自然语言处理、计算机视觉、大规模预训练模型等相关工作经验优先;
5.熟练掌握Python和PyTorch,有较强的工程能力,熟悉CUDA开发和性能调优者优先;
6.熟悉Deepspeed、Colossalai或Megatron等大模型训练框架优先;
7/深入理解机器学习和深度学习算法,特别是大模型相关算法,如 Transformer 架构及其变体、大规模神经网络训练算法等。
北京 - 西城
北京 - 朝阳
北京 - 海淀
北京 - 海淀
北京 - 昌平
北京 - 西城
上智联,你更值3.74亿+ 职场人的选择 780万+ 高新职位精准推荐