更新于 3月6日

AI技术总监

5-5.5万
  • 北京海淀区
  • 万泉河
  • 3-5年
  • 硕士
  • 全职
  • 招1人

职位描述

AI技术总监AIGC深度学习自然语言处理自然语言生成pytorch多模态模型开发
职位描述
1、负责大语言模型相关技术(知识注入、指令对齐、深度推理、知识围栏等)的算法研究和应用落地,具备自然语言处理、对话系统、语义理解、文本检索,强化学习等方向的研发经验。
2、参与对话意图、对话管理、对话生成、人机协同、知识检索、情感分析等场景的模型的训练和迭代,包括数据清洗、微调、测试;
3、积极探索前沿技术并结合旅游业务场景微调大模型,提高大模型在特定任务上的泛化效果。
4、开展开源大模型应用落地探索与开发部署,尤其是与旅游业务结合的应用落地。
5、参与业务知识库、大模型文本生成、智能问答、知识图谱等应用构建。
6、负责对模型进行微调与优化,包括主流大模型 Qwen、DeepSeek 等;使用 Dify、Langchain、Ollama 等 AI 开发工具,运用 LORA 等技术优化模型性能。
7、关注大模型前沿技术,跟进业内最新研究进展和应用趋势,提出创新思路和方向。参与对业务数据进行挖掘,完成大模型训练数据集的建设等。
职位要求
1、3年及以上工作经验,硕士及博士研究生学历;
2、具有良好的深度学习/自然语言处理/自然语言生成等相关理论基础,有 AI 产品或 NLP 应用开发经验者、顶会论文发表者优先;
3、有一定的数学建模和优化能力,能根据具体业务设计调整模型,具有大模型的微调、增量预训练、对齐以及部署加速等相关经验;
4、熟悉BERT/lama/qwen-vl/intern-vl等主流大模型,熟悉Pytorch、TensorFlow等主流的深度学习训练框架,熟悉常用的大模型加速推理框架(VLLM,TensorRT-LLM)等;
5、具备AIGC、对话问答、大模型部署、多模态模型开发全流程(数据采标清洗、模型设计调优、性能评测等)、分布式训练及部署等经验者优先。
6、熟悉主流大模型(如 GPT、Gemini、LLaMA、Claude、DeepSeek 等)工作原理及应用,熟悉 Dify、Langchain、Ollama 等一种或多种主流开源 LLM/Agent 应用开发框架,有实际大模型调优 / 应用经验者(Prompt tuning、prefix tuning、LORA 等一种即可)优先。
7、具有良好的团队协作和沟通能力,能够解决复杂问题,抗压能力强。

工作地点

维亚大厦
以担保或任何理由索要财物,扣押证照,均涉嫌违法。一经发现,
我要招人

职位发布者

刘俊华/人事经理

刚刚活跃
立即沟通
去哪儿网(Qunar.com)
去哪儿网(Qunar.com)是中国领先的无线和在线旅游平台,其网站上线于2005年5月,公司总部位于北京。去哪儿网致力于建立一个为整个旅游业价值链服务的生态系统,并通过科技来改变人们的旅行方式。去哪儿网通过其自有技术平台有效匹配旅游业的供需,满足旅游服务供应商和中国旅行者的需求。对旅游服务供应商而言,去哪儿网通过移动客户端及在线平台为其提供技术基础设施;对旅行者而言,去哪儿网通过网站及移动客户端的全平台覆盖,随时随地为其提供国内外机票、酒店、度假、旅游团购、及旅行信息的深度搜索,帮助旅行者找到性价比最高的产品、最优质的信息和便捷的预订方式,聪明地安排旅行。
公司主页