工作内容:
1.参与设计大语言模型应用的技术方案并在交易系统中落地。典型场景包括但不限于多轮对话、DBGPT、结构化信息抽取、私有函数调用、AI Agent等:
2.负责大语言模型应用的端到端研发,包括但不限于方案设计、数据准备及处理、行业模型训练、指令精调、模型性能提升、模型效果评测等:
3.跟踪并分析业内最新研究成果和技术动态,复现相关公开研究成果。持续优化和改进相关技术方案.
任职要求
1.计算机相关专业本科及以上学历,学历要求为本科5年/研究生3年以上,有AI项目落地经验:
2.熟练掌握Java、Python等编程语言,具备良好的编码能力;
3.熟悉大模型基本原理,熟悉多种自然语言处理任务,如问答系统,序列标注,摘要生成及抽取,知识图谱运维等。有自然语言处理任务的工程经验。
4.了解NLP主流预训练语言模型(GPT/LLaMA/T5/PaLM/GLM/Bloom/BERT):
5.了解GPU集群多卡训练的基本原理,了解高性能GPU集群的部署和调试;
6.有团队意识,有良好的文档习惯和合作意识。
加分项:
1.熟悉transformers算法优先;
2.有大模型训练框架使用经验者优先;
3.熟悉Langchain或其他大模型应用开发框架优先。