职位描述:
1、支持多模态大模型相关业务应用需求,针对真实场景的用户需求,设计/创新合理的技术方案,包括单不限于图像、视频在内的多模态内容理解,持续研发提升基础视觉算法能力。
2、探索多模态大模型的高效微调技术和推理技术,保证大模型在业务场景中的快速适配和高效调用。
3、运用大模型支持多元业务需求的快速迭代,始终以优化用户体验与提升业务价值为目标。
职位要求:
1、两年以上图像处理、计算机视觉方向算法应用和调优相关经验;
2、在多模态大模型方向有一定经验,熟悉主流多模态大模型(LLaVA等)的基本原理和训练方法,对Pre-train、SFT等技术有较深入了解;
3、具备扎实的编程功底,熟悉 Pytorch 等主流深度学习框架,熟练使用 C ++/ Python 等至少一种编程语言,熟悉 Linux 开发环境;
4、对技术有热情,有良好的沟通表达能力和团队精神,自驱力强;对大模型应用、图像识别、用户意图识别有深入了解的优先;
5、在顶级会议或期刊上发表过有影响力的学术论文或在重要算法比赛中取得过优秀名次的候选人优先。
6、有大模型相关项目经理或技术团队牵头经验的优先