

項目需求:
某投資公司是一家大型印刷類公司,屬于高科技公司。在中國的辦公總部設立在深圳,其中在上海,北京,蘇州,廣州,成都等地都設有分部或辦事處。公司擁有的軟硬件設備種類繁多,機房環(huán)境復雜,同時擁有多條業(yè)務系統(tǒng),機房環(huán)境、業(yè)務系統(tǒng)的安全、穩(wěn)定運行對印刷生產(chǎn)線起到至關重要的作用,自動化運維系統(tǒng)業(yè)務成為企業(yè)當前的重要問題。次公司存在運維服務路徑不統(tǒng)一,無法形成首問責任制,難以做到統(tǒng)一調度、統(tǒng)一監(jiān)管;服務報告、知識管理體系不完善,經(jīng)驗難傳承;沒有形成標準化運維體系,且沒有信息化系統(tǒng)為支撐,運維過程無法標準化;服務成果難以量化,服務價值難以體現(xiàn);沒有形成系統(tǒng)規(guī)范的運維商服務過程監(jiān)督體系、手段、服務質量量化考核標準;故障響應/處理不及時、過程不合規(guī)、操作不規(guī)范、服務報告不完善;各種例行類服務沒有按計劃執(zhí)行,沒有提供服務報告。綜上自動化運維管理系統(tǒng)業(yè)務是網(wǎng)絡工程部門急需解決的問題。
解決方案:
完成主中心監(jiān)控平臺(主要組件包括:Zabbix、Grafana、influxDB)的安裝、配置和聯(lián)調,實施監(jiān)控平臺在上海與深圳兩地互備的高可用架構,其中MySQL數(shù)據(jù)庫將通過binlog實現(xiàn)遠程數(shù)據(jù)復制,Zabbix Server將通過keepalive實現(xiàn)雙機集群,信息采集手段包括:部署agent、通過SNMP協(xié)議、和ping命令采集源、Zabbix Server和MySQL數(shù)據(jù)庫之間都通過浮動IP通信。對上海(蘭生、青浦、金山、災備數(shù)據(jù)中心)及深圳管理對象進行接入以及配置工作,包括OS層級的采集程序安裝和配置,進行數(shù)據(jù)采集,采集后,在Zabbix界面中對所需監(jiān)控的設備和指標項、告警等進行配置工作,并在zabbix中對基礎指標進行第一層基礎展示。基于Grafana界面中展示接入設備指標經(jīng)行抽象提取定制化進行第二和第三層上次展示。告警信息以文本的格式轉發(fā)至由最終用戶提供的郵件正文或微信公眾號正文。后期對管理員進行培訓,內容包括Zabbix開源軟件介紹、Grafana開源軟件介紹、influxDB開源軟件介紹,以及日常維護操作培訓。
此次部署運維監(jiān)控平臺中涉及此投資公司分布共計1908臺設備,覆蓋到思科安全、無線、交換機等產(chǎn)品
實現(xiàn)效果:
1、通過對公司的自動化運維平臺的搭建和高可用主從模式的部署,加強了全國各區(qū)域工廠之間的聯(lián)系反饋和數(shù)據(jù)信息安全;
2、大屏展示系統(tǒng)和業(yè)務數(shù)據(jù)報表的定制化開發(fā),既做到細節(jié)展示,又做到實時更新,讓客戶了解到各個設備的實時狀態(tài),掌控業(yè)務數(shù)據(jù)的整體發(fā)展進度;
3、通過郵件或者微信告警信息的及時發(fā)送,縮短了運維工作人員準確排查故障時間,提高了工作效率,有效節(jié)省運維人員工作時間且降低了其中的人力成本。達到降低對公司業(yè)務和應用系統(tǒng)的損失,同時還為公司的安全化生產(chǎn)加上保障。
截圖展示:
定制化首頁展示頁面