1、負責公司軟件平臺的部署和服務器運行中的日常監控、報警及日常處理,能快速解決故障并輸出報告;
2、負責完善服務器的監控體系及監控維度,對監控進行優化,解決監控盲點、難點;
3、參與架構優化、容災優化、性能優化等項目,分析系統瓶頸,容量評估、完成擴容、架構改造等工程;
4、負責應用系統的生產/開發/測試/uat環境發布,包括環境的搭建、應用的部署、運維等;
5、負責應用運維突發事件和問題的跟蹤、解決和管理;
6、及時響應并處理線上故障,保障線上業務7X24小時穩定運行。
任職要求:
1、大專以上學歷,3年以上運維管理經驗;
2、熟悉阿里云的技術,熟悉Linux操作系統,centos優先,掌握Shell相關配置腳本;
3、熟悉以下平臺:Nginx、Tomcat、haproxy、ActiveMq等,有分布式、負載均衡經驗優先;
4、熟悉自動化工具和容器:Docker、Kubernetes、Jenkins;
5、熟悉Mysql高可用、容災、備份恢復、數據遷移等技術;
6、配合研發高效迭代產品,解決日志的查看和定時清理;
7、優化并改善系統架構,提高系統穩定性和安全性。