更新于 12月25日

智算中心运维工程师

1万-1.5万
  • 北京海淀区
  • 3-5年
  • 本科
  • 全职
  • 招1人

职位描述

KubernetesShell
1.管理和维护智算中心的基础设施,包括服务器、存储和网络设备。
2.监控和优化智算中心的性能,确保资源的高效利用。
3.部署和配置Kubernetes集群,管理容器化应用的生命周期。
4.设计和实施算力调度策略,以满足不同的业务需求。
5.处理故障和突发事件,快速恢复服务。
6.编写和维护文档,包括操作手册和故障排除指南。
7.与开发团队合作,参与智算中心的持续改进和升级
任职要求
1.计算机科学或相关领域的学士学位。
2.至少3年以上的运维工作经验,有智算中心或GPU设备运维经验者优先。
3.熟悉Kubernetes(k8s)的部署、管理和故障排除。
4.熟悉算力调度原理和实践,有实际的调度系统开发或维护经验。
5.熟悉Linux操作系统和Shell脚本编程。
6.熟悉网络基础知识,包括TCP/IP、DNS、DHCP等。
7.熟悉监控工具,如Prometheus、Grafana等。
8.具备良好的问题解决能力,能够独立分析和解决复杂问题。
9.良好的沟通能力和团队合作精神。
10.能够适应快节奏的工作环境,具备较强的抗压能力。

工作地点

软通动力

职位发布者

宋女士/人事经理

三日内活跃
立即沟通