某科技公司智能監控
項目需求:
成都某科技有限公司的軟硬件設備種類繁多,設備數量較大,發生故障時,會產生海量告警信息,增加運維人員工作量,且無法快速定位故障原因。綜上該公司需要搭建自動化運維高可用平臺解決上述問題。
解決方案:
根據項目需求安裝、配置和聯調上海縱立正式生產區和開發測試區共計兩套的Zabbix高可用監控平臺,主要組建包括Zabbix、MairaDB、Agent、Check,完成監控平臺在上海縱立所有節點的網絡拓撲圖。安裝并配置OS層級的采集程序,充分協調及溝通技術難點及可行性,進行數據采集定制,數據采集后,在Zabbix界面中對所需監控的設備和指標項、告警等進行配置工作,并在Zabbix中對基礎指標進行展示,進行監控模板定制化開發,對服務器、網絡設備及存儲設備添加,完成設備信息錄入,關聯模板及測試模板獲取數據是否正常,完善設備信息。基于Zabbix標準功能,對流量、丟包率、狀態、響應時間等實施網絡鏈路監控,針對網絡設備配置變更告警、備份功能,部署監控告警(聲音、短信、郵件、微信),與縱立系統對接,完成整個平臺的部署。后期對管理員進行培訓。
|
項目管理對象
|
|
服務器:HP、DELL、IBM、Lenovo
存儲:HP、IBM、Horeb、
交易中間件:Tibco RV、Tomcat
數據庫:Oracle
網絡:IBM、HP、HW、Fortinet、Sangfor、SG1200
虛擬機:Redhat、WindowsWin Server 2012、 WindowsWin-7、Suse
攝像頭:HoneyWell
|
實現效果:
1、
服務器及進程管理:通過對通用服務器的監控管理(主要為windows、Linux、HP-UNIX、HANA一體機等系統監控),自動發現網絡中服務器設備的信息,實時采集服務器的狀態和性能等信息,實時采集服務器中當前運行的進程信息。
2、
網絡設備管理:通用網絡設備的監控管理,主要是交換機、防火墻、負載均衡、路由器等設備監控,自動發現網絡中的設備,采集設備相關信息(基本信息,接口信息,連接狀態等),可動態展示實時網絡負載、流量分布、運行時間等。
3、
中間件管理:實時采集并顯示中間件的服務狀態、會話狀態、消息隊列狀態。
4、存儲設備管理:通用存儲設備的監控管理,主要是設備的硬件狀態,邏輯狀態及日志的管理。
5、數據庫管理:實時監聽和分析數據庫的連通狀態、性能狀態、表空間狀態、鎖狀態等,可分析sql語句的執行性能和執行結果。
6、虛擬化管理:實時采集虛擬化系統的性能、可用性、配置等信息。直觀展示虛擬化系統的狀態以及虛機的可用性。
7、監控系統管理:實時采集監控平臺數據,可實時查看監控畫面,實時報警提醒。
截圖展示:
樹形圖展示