更新于 3月6日

linux系统运维工程师

1.5-2万
  • 北京大兴区
  • 1-3年
  • 本科
  • 全职
  • 招1人

职位描述

自动化运维ShellPythonLinux系统运维安全运维大数据运维
岗位职责:
1. 负责高性能集群的运行和日常维护、按时完成日常巡检工作;
2. 负责高性能集群的用户技术支持和集群系统管理软件的维护;
3. 管理高性能集群的计算资源和用户,部署管理策略,监控运营环境;
4. 带领团队进行故障排查和应急相应,特别是在GPU密集型应用和高性能计算场景下,确保系统快速恢复正常运行;
5. 对运维风险进行识别、评估和控制,特别关注GPU资源的稳定性和性能,确保公司信息安全和业务连续性;
6. 负责运维团队的技术培训和能力提升,培养具备云计算、GPU运维和高性能计算专业技能的运维工程师;
7. 参与公司重大项目的技术支持与决策,特别是在云计算和算力平台相关的项目中,为业务发展提供技术保障。

任职要求:
1. 本科或本科以上学历,计算机、电子信息、通信、物理等相关专业;
2. 具有1-3年相关工作经验,有大型超算中心实际运维经验者优先考虑;
3. 最好熟悉高性能计算集群中服务器、网络、存储实现原理;
4. 熟悉Ansible, Puppet, Kubernetes等基础系统软件;
5. 熟悉Linux操作系统;
6. 至少会一门语言;
7. 更够独立完成监控,报警等运维系统得搭建部署与设计;
8. 具备较强服务意识和良好的沟通能力,能够承受一定工作压力。

工作地点

光环云数据有限公司

职位发布者

史晓雯/人事经理

今日活跃
立即沟通
公司Logo光环云数据有限公司
光环云数据有限公司(以下简称“光环云”)是北京光环新网科技股份有限公司(股票代码300383)的控股子公司,是其智能算力创新业务承载主体,专注于智算网络创新业务。光环云致力于为人工智能产业发展提供智能算力网络基础设施服务,提供数据治理及数据整合服务,提供算法模型训练及应用调优服务,提供AI应用产业化等人工智能、智能算力领域的全栈服务和一站式的解决方案服务。光环云作为由光环新网和西云数据所提供的亚马逊云科技中国区域推广计划的授权增值推广商,通过区域、行业以及典型技术应用场景,为广大APN合作伙伴提供一站式、端到端的业务支撑,并加速全球APN合作伙伴应用落地,使中国客户更方便、高效、安全地享受亚马逊云科技云服务。由光环云在中国区域运营的研华WISE-PaaS工业互联网云平台,基于企业数字化转型的需求,面向工业企业提供云边端一体化、智能、高效、稳定、安全的工业互联网解决方案及赋能平台。光环云已经初步形成了覆盖全国的智能算力网络;建立了区域与行业的合作伙伴关系与客户覆盖;自主开发与运营的业务推广管理与业务支撑平台。
公司主页