

項目需求:
? ? ??現(xiàn)有監(jiān)控系統(tǒng)不能滿足運維需求,沒有網(wǎng)絡鏈路監(jiān)測,人工巡查無法及時發(fā)現(xiàn)故障,通常只有使用者反饋后才得知故障發(fā)生,且并沒有主動告警,無法快速定位故障原因,沒有報表系統(tǒng),無法對設備的運行狀態(tài)進行直觀展示。
解決方案:
? ? ??根據(jù)項目需求安裝、配置和聯(lián)調(diào)航空公司監(jiān)控平臺,主要組建包括Zabbix、Mariad,完成監(jiān)控平臺在此航空公司分部所有節(jié)點物理機房位置拓撲圖,網(wǎng)絡拓撲圖,物理鏈路狀態(tài)圖,形成子母拓撲圖的樣式。信息采集手段包括SNMP協(xié)議、和ICMP命令采集源、Zabbix Server和MariaDB數(shù)據(jù)庫之間通信。根據(jù)航空公司分部各節(jié)點網(wǎng)絡設備管理對象進行接入,涉及到添加監(jiān)控項(監(jiān)控的核心設備的CPU、內(nèi)存、存活、板卡、電源、風扇、溫度、帶寬,接口流量,端口狀態(tài)),對接入層網(wǎng)絡設備和攝像頭,無線AP進行每天2次存活監(jiān)測。為方便日后運維和擴容,將監(jiān)控的網(wǎng)絡設備的監(jiān)控項做成模板,進行數(shù)據(jù)采集,采集后,在Zabbix界面中對所需監(jiān)控的設備和指標項、告警等進行配置工作,并在zabbix中對基礎指標進行第一層基礎展示。根據(jù)需求,進行相關個性化定制和開發(fā),包括大屏展示、樹形圖、物理鏈路專線和互聯(lián)網(wǎng)鏈路模塊、機房展示模塊框架、事件日志記錄。后期對管理員進行培訓。
? ? ??此次部署運維監(jiān)控平臺涉及航空公司信息分布共計559臺設備,覆蓋華為、Cisco、H3C三個廠家網(wǎng)絡設備。
實現(xiàn)效果:
1、對各公司、各營業(yè)部、各機庫實現(xiàn)統(tǒng)一平臺管理,提高管理效率,降低成本;
2、對服務器、網(wǎng)絡設備進行統(tǒng)一資產(chǎn)管理,解決了純?nèi)斯す芾碣Y產(chǎn)混亂的現(xiàn)狀;
3、對網(wǎng)路設備進行統(tǒng)一配置管理,發(fā)生設備配置變更、丟失等情況,可快速對網(wǎng)絡故障進行自動定位且發(fā)出告警通知工程師,工程師可根據(jù)用過系統(tǒng)自動備份的配置對設備進行配置的快速修復;
4、實現(xiàn)對端到端網(wǎng)絡鏈路的流量、狀態(tài)監(jiān)控,發(fā)生問題及時發(fā)出告警通知,管理員進行故障修復,保障鏈路通暢。

