更新于 12月4日

大模型工程师

1.5万-3万·15薪
  • 北京朝阳区
  • 5-10年
  • 本科
  • 全职
  • 招1人

职位描述

PythonPyTorchTensorFlowMEGATRONDEEPSPEEDDEEPSPEED-CHATLoRaGPTP-TUNING
岗位职责:
1.负责预训练大模型的工程化落地,探索业界领先的大模型框架;
2.围绕AI大模型领域,构建从数据采集、加工标注、算法训练部署、推理的数据算法流闭环;
3.负责大模型的结构设计、训练、微调、部署和优化,提高模型的效率、稳定性和可扩展性,推动大模型在边端侧的应用;
4.跟踪国内外前沿的大模型技术动态,持续改进和优化现有模型;
岗位需求:
1.本科及以上学历,计算机相关背景,3-5年工作经验;
2.精通Python、C/C++、Go等编程语言,熟练掌握PyTorch或TensorFlow等主流深度学习框架;
3.熟悉大模型分布式训练技术和框架库,如Megatron、DeepSpeed、Deepspeed-Chat等,熟悉框架库源码,有千卡以上集群的大模型训练经验;
4.精通大模型推理优化技术、模型压缩技术,如量化、剪枝和蒸馏等,精通各种微调技术,如LoRA、p-tuning、SFT、RLHF等;
5.有GPT类大模型优化及工程应用实践经验优先。

工作地点

启明国际大厦

职位发布者

李墨/人事经理

立即沟通
公司Logo北京数道智算科技有限公司
北京数道智算科技有限公司作为一家提供智能算力服务的企业,成立于2023年9月21日,注册资金13684.2105万元人民币,由广东中关村协同智算股权投资合伙企业(有限合伙)、摩尔线程智能科技(北京)有限责任公司、北京智谱华章科技有限公司等共同持股组建。公司致力于以算力基础设施需求为驱动,为上下游企业技术与应用创新赋能,助推区域产业转型升级。业务涵盖算力建设、算力平台研发和全栈算力服务。为AI、元宇宙、数字仿真等新兴数字经济的企业提供全方位的算力支撑。
公司主页