专业要求:
计算机、大气科学、大气物理、气象学相关专业
岗位职责:
1. 研究并搭建通用专用大模型,实现气象、电力等领域的系统化预测和推演功能。
2. 研究和探索自然语言处理大模型、扩散模型等流行深度学习算法在新一代计算架构芯片上的优化算法,通过算法改进和硬件优化实现更高的算法性能。
3. 持续关注并追踪学术成果和前沿技术,尤其关注自然语言处理、图学习、时序预测等领域的算法论文,通过对业务需求的理解,推进并行计算架构在深度学习领域的应用。
4.负责AI计算集群的运维和调优,包含k8s、GPU、服务器、网络、存储等软硬件,负责运维自动监控系统的搭建,脚本的编写和报表输出。
任职要求:
1. 具备极佳的工程实现能力,熟悉C/C++、Python等常用开发语言。熟悉主流的深度学习平台,如tensorflow、pytorch、mxnet等,具备实际项目开发经验。
2. 深入了解常见的大模型算法与模型,如GPT、BERT等,能够理解其原理和优化方法,并具备相应的实践经验。
3. 具备在CPU或GPU上实现和优化高性能算子库的开发经验。
4. 具备良好的团队合作精神,能够有效地与团队成员合作,共同完成项目任务。同时,具备较强的沟通能力,能够清晰地表达自己的想法和观点。
5. 优先考虑有在AI及算法行业论坛发表过论文、在顶会上有论文发表或在行业中有一定影响力的候选人。
6.熟悉Tranformer、Diffusion等流行深度学习算法在新一代计算架构芯片( GPU、TPU、NPU 等)上的优化算法;熟悉高性能计算领域的硬件特性(如带宽瓶颈、缓存优化),能够针对具体硬件进行性能分析并设计优化方案。