岗位职责
1、负责服务器和网络设备的规划、配置、监控和故障排除;
2、负责和参与公司平台、数据库及各类中间件的配置部署、运维监控等,保障服务器稳定性和可用性。
3、负责服务器代码部署/发布/升级等工作;
4、负责处理线上故障,分析原因,设计解决方案和应急预案;
5、协助编写项目相关文档,配合项目经理完成项目管理工作,推动项目验收;
任职要求:
任职要求
1、精通 Linux 系统管理,熟悉 Windows 服务器操作,能够熟练进行服务器的安装、配置、调优以及故障排查;
2、熟练掌握网络基础知识,了解容器技术(如 Docker、Kubernetes),熟悉主流公有云及相关产品操作;
3、掌握主流的数据库(如 MySQL、PostgreSQL 等)安装、维护、调优等操作,了解数据库的备份与恢复策略;
4、熟悉至少一种自动化运维工具(Ansible、SaltStack、Puppet 等),有较强的脚本编写能力(Shell、Python 等),能够独立开发自动化运维脚本;
5、熟悉 AI 相关技术栈,包括深度学习框架(TensorFlow、PyTorch 等)的部署与运维,有 GPU 集群管理经验者更佳;
6、有相应行业证书者优先;