职位描述
1、负责大语言模型相关技术(知识注入、指令对齐、深度推理、知识围栏等)的算法研究和应用落地,具备自然语言处理、对话系统、语义理解、文本检索,强化学习等方向的研发经验。
2、参与对话意图、对话管理、对话生成、人机协同、知识检索、情感分析等场景的模型的训练和迭代,包括数据清洗、微调、测试;
3、积极探索前沿技术并结合旅游业务场景微调大模型,提高大模型在特定任务上的泛化效果。
4、开展开源大模型应用落地探索与开发部署,尤其是与旅游业务结合的应用落地。
5、参与业务知识库、大模型文本生成、智能问答、知识图谱等应用构建。
6、负责对模型进行微调与优化,包括主流大模型 Qwen、DeepSeek 等;使用 Dify、Langchain、Ollama 等 AI 开发工具,运用 LORA 等技术优化模型性能。
7、关注大模型前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。参与对业务数据进行挖掘,完成大模型训练数据集的建设等。
职位要求
1、3年及以上工作经验,硕士及博士研究生学历;
2、具有良好的深度学习/自然语言处理/自然语言生成等相关理论基础,有 AI 产品或 NLP 应用开发经验者、顶会论文发表者优先;
3、有一定的数学建模和优化能力,能根据具体业务设计调整模型,具有大模型的微调、增量预训练、对齐以及部署加速等相关经验;
4、熟悉BERT/lama/qwen-vl/intern-vl等主流大模型,熟悉Pytorch、TensorFlow等主流的深度学习训练框架,熟悉常用的大模型加速推理框架(VLLM,TensorRT-LLM)等;
5、具备AIGC、对话问答、大模型部署、多模态模型开发全流程(数据采标清洗、模型设计调优、性能评测等)、分布式训练及部署等经验者优先。
6、熟悉主流大模型(如 GPT、Gemini、LLaMA、Claude、DeepSeek 等)工作原理及应用,熟悉 Dify、Langchain、Ollama 等一种或多种主流开源 LLM/Agent 应用开发框架,有实际大模型调优 / 应用经验者(Prompt tuning、prefix tuning、LORA 等一种即可)优先。
7、具有良好的团队协作和沟通能力,能够解决复杂问题,抗压能力强。