职位发布者
职位描述
高级运维工程师
岗位职责
负责 IM 集群的架构设计、部署与日常运维,确保高可用、高可靠
基于 Docker、Kubernetes(或其他容器编排平台)搭建和管理 IM 服务、网关、存储等组件
撰写并维护 Helm Charts、Ansible Playbook、Terraform 脚本,实现环境自动化部署与快速扩容
配置和优化消息中间件(如 RabbitMQ/Kafka)、缓存(Redis)、数据库(MongoDB/MySQL)等依赖组件
监控和告警体系建设,使用 Prometheus、Grafana、ELK/EFK 等工具采集、展示和告警集群健康状态
定期进行故障演练与性能压测,定位并优化系统瓶颈,保障 IM 服务在高并发场景下稳定运行
制定并执行备份、恢复、故障切换方案,确保关键业务数据安全与连续性
与开发团队紧密配合,推动 CI/CD 流水线搭建,实现代码、配置、运维一体化交付
撰写系统部署、运维、故障排查文档与运行手册,开展团队内部知识分享
任职要求
计算机相关专业本科及以上学历,3 年及以上 Linux 运维或 SRE 经验
熟练掌握 Linux 操作系统及网络(TCP/IP、负载均衡、VPN、VPC)
精通 Docker 容器化技术,至少 1 年以上 Kubernetes/Helm 实际运维经验
熟悉 Ansible、Terraform、Jenkins/GitLab CI 等自动化运维及持续交付工具
熟练使用 Prometheus、Grafana、ELK/EFK、Zabbix 等监控与日志收集平台
熟悉 RabbitMQ、Kafka 中间件,能够进行性能调优与故障排查
熟悉 Redis、MongoDB、MySQL 等常用数据库的部署、调优及备份恢复
具备良好的脚本能力,熟练使用 Shell、Python、Go 等语言进行运维自动化开发
良好的沟通协作能力和文档撰写能力,具备抗压能力和快速学习能力
加分项
有 IM 或其他分布式即时通讯系统(如 Tencent IM、XMPP、Signal)部署运维经验
熟悉微服务框架(gRPC、Dubbo)及服务网格(Istio、Linkerd)
有电信级大并发、大流量系统的 SRE/SRE 经验
熟悉公有云(AWS、Azure、GCP)或私有云环境的混合云部署
了解安全加固、DDoS 防护、Web 应用防火墙(WAF)等安全运维方案
特别申明:
- TG招聘严禁企业和招聘者用户做出任何损害求职者合法权益的违法违规行为,包括但不限于扣押求职者证件、收取求职者财物、向求职者集资、让求职者入股、诱导求职者异地入职、异地参加培训、违法违规使用求职者简历等。 若发布的职位存在违法等恶意内容的情况, 请立即举报
工作地址
马来西亚-吉隆坡市