岗位职责
1. 模型研究与算法验证
- 负责大语言模型技术研究,主导模型训练策略优化及性能验证,提升模型在复
杂场景下的准确性与鲁棒性。
- 推进模型微调、量化压缩、推理加速等技术落地,解决训练过程中的工程难题
(如分布式并行、内存优化)。
2. 数据与实验管理
- 构建高质量训练数据集,设计数据清洗、标注及合成方案,确保数据质量与多
样性。
- 设计实验方案并复现前沿模型,通过对比实验验证技术路线可行性。
3. 技术落地支持
- 协同团队完成模型部署与调优,优化推理延迟与吞吐量,支持端侧/云端多场景
应用。
- 输出技术文档与专利,推动研究成果在智能数据治理、知识治理、文本挖掘、
人机交互等领域的商业化落地。
任职要求
1. 教育背景
- 计算机科学、人工智能或相关专业硕士及以上学历,有扎实的数学与算法基
础。
2. 技术能力
- 精通PyTorch/TensorFlow等框架,熟悉DeepSpeed、LlamaFactory等分布式训练
工具,掌握模型并行、流水线并行等优化技术。
- 具备强化学习研究经验,有顶会论文或开源项目贡献者优先。
3. 工程实践
- 熟悉Linux系统与Docker或K8s,具备大规模数据处理与模型调优经验,能独立
解决GPU集群、网络通信等工程问题。
4. 加分项
- 有数据治理、等垂直领域模型落地经验者优先。
- 熟悉模型可解释性分析或自动化评测工具(如BLEU、ROUGE)。
公司介绍:
郑州埃文科技有限公司作为数据要素全生命周期价值建设先行者,成立于2012年8月,总部位于河南省郑州,在北京、成都、太原、南昌设有分子公司。目前团队规模约150人,其中70%为研发人员,20多人的人工智能研发团队。
埃文科技作为技术导向性公司,入选中国数字安全专精特新100强,有突出的研究成果:截止目前已发表 22 篇高质量论文,累计申请发明专利达 23 项。同时公司拥有50多张算力卡支撑人工智能研发。
论文情况:在计算机领域权威的 CCF 推荐列表中,达到 CCF A 类的有 9 篇,这类论文代表着行业内顶尖水平,对前沿技术和理论突破有着关键推动作用;CCF B 类论文 5 篇,在相关领域展现出较高的研究价值和应用前景;CCF C 类论文 1 篇,同样为行业发展贡献了专业见解;另外,还有 7 篇发表于其他等级的会议/刊物,从不同角度丰富了学术成果。