工作内容:
1、采用大模型开发工具,结合向量数据库检索和提示词优化实现产品的核心功能;
2、负责大模型在垂直领域的精调/微调,负责设计大模型评估方法,通过模型精调工具提升模型性能;
3、参与大模型产品落地,满足业务场景的需求和基于反馈的算法调优、算法创新、系统评测等。
任职条件:
1、计算机科学或相关领域的本科及以上学历,具备大模型精调、应用落地的经验,有多模态开发经验的优先;
2、熟悉大语言模型的训练原理,了解常见的模型架构(如Transformer),熟悉主流开源模型并拥有较丰富的使用经验;
3、了解大模型精调方法(如LoRA、p-tuning等)和相关工具的使用方法(如accelerate、peft、deepspeed等),熟悉主流大模型应用开发工具的使用(如Langchain、LlamaIndex等)和主流向量数据库使用方法。