一、項目現(xiàn)狀和需求分析
在信息化越來越發(fā)達的今天,互聯(lián)網(wǎng)的信息交互量每刻都相當?shù)捏@人,因此對電信公司的壓力也很巨大,能否保證業(yè)務(wù)系統(tǒng)、基礎(chǔ)設(shè)施的穩(wěn)定運行,也越來越考驗著這行業(yè)。
在網(wǎng)絡(luò)監(jiān)控產(chǎn)品出現(xiàn)以前,所有的設(shè)備故障、業(yè)務(wù)系統(tǒng)故障,都停留在一個“后知后覺”的狀態(tài),基本的設(shè)備異常處理狀態(tài)都是下行用戶反映設(shè)備及系統(tǒng)故障,相應(yīng)的運維人員才會去查看、檢查設(shè)備故障。在市場化的今天,這種運行模式已經(jīng)從起步就被動了。面對日益復(fù)雜的網(wǎng)絡(luò)、海量的報警數(shù)據(jù)、惡意事件的艱難追查等,技術(shù)人員在維護工作呈現(xiàn)出了各種各樣的疲態(tài),因此急需一種產(chǎn)品能夠?qū)⑺械木W(wǎng)絡(luò)基礎(chǔ)設(shè)施監(jiān)控起來,并且在設(shè)備發(fā)生故障時能及時將相應(yīng)的告警發(fā)給運維人員。也只有這種網(wǎng)絡(luò)監(jiān)控平臺才能將技術(shù)運維人員真正解脫出來。監(jiān)控平臺的適時的出現(xiàn),是網(wǎng)絡(luò)安全發(fā)展到這個階段一個必然的產(chǎn)物。因此網(wǎng)絡(luò)監(jiān)控平臺的建設(shè)不僅是安全技術(shù)手段的快速提升,同時也是管理體系上的高效改進。
二、解決方案概述
網(wǎng)絡(luò)監(jiān)控平臺系統(tǒng)以各種IT硬件設(shè)備的監(jiān)控信息作為數(shù)據(jù)來源,以各類數(shù)據(jù)的流轉(zhuǎn)和處理為功能劃分依據(jù),其體系結(jié)構(gòu)分為IT基礎(chǔ)架構(gòu)層、數(shù)據(jù)采集層、基礎(chǔ)支撐層、應(yīng)用展現(xiàn)層和外部接口五大部分,詳細描述如下:
IT基礎(chǔ)架構(gòu)層:網(wǎng)絡(luò)、主機、數(shù)據(jù)庫、中間件、存儲設(shè)備、虛擬化平臺,應(yīng)用服務(wù)作為監(jiān)控系統(tǒng)的監(jiān)控對象;支持分布式管理;可實現(xiàn)異地部署監(jiān)控;
數(shù)據(jù)采集層:針對被監(jiān)控對象,通過使用不同監(jiān)控工具將采集上來的事件數(shù)據(jù)和性能數(shù)據(jù)上報至相關(guān)功能進行處理、展現(xiàn);
基礎(chǔ)支撐層:主要針對監(jiān)控資源管理、性能和事件管理,以及用于統(tǒng)計分析的報表管理和支持系統(tǒng)運行的系統(tǒng)管理和策略管理;
應(yīng)用展現(xiàn)層:以功能層各項功能為支撐,提供統(tǒng)一的展示界面顯示個人視圖、應(yīng)用視圖、網(wǎng)絡(luò)視圖、統(tǒng)一事件及報表分析等內(nèi)容;全中文界面,純 B/S 架構(gòu),支持 https 配置;
外部接口:
- 與郵件系統(tǒng)、短信平臺的集成,能夠有效支撐短信/郵件的通知;
- 與運維流程管理系統(tǒng)的集成,實現(xiàn)事件處理快速集成,從而支撐管理平臺的構(gòu)建;
三、解決方案優(yōu)勢與特色
- (一)*的云技術(shù)架構(gòu)
網(wǎng)絡(luò)監(jiān)控平臺的架構(gòu)設(shè)計采用了*的云計算架構(gòu),將數(shù)據(jù)收集、數(shù)據(jù)集成、數(shù)據(jù)分析等任務(wù)逐層下發(fā)到云端,實現(xiàn)了海量異構(gòu)數(shù)據(jù)集成、數(shù)據(jù)歸并、數(shù)據(jù)分析的多層次處理,對于整個平臺提供了一種正向積極的反饋。因為對于一個孤立系統(tǒng)而言,單類數(shù)據(jù)的分析并不具備代表性,對于態(tài)勢分析更加力不從心,而基于云的系統(tǒng)則能夠同時匯聚超大規(guī)模的數(shù)據(jù)信息,并擴大其監(jiān)控的范圍,從而提高了分析的有效性。
- (二)多視角展示體驗
網(wǎng)絡(luò)監(jiān)控平臺系統(tǒng)突破傳統(tǒng)產(chǎn)品的鼠標鍵盤的操作模式,將觸摸屏操作機制兼容到系統(tǒng)平臺操作中,使得圖形化的人機交互界面變得更為直觀易用。為了保證觸摸屏操作時手指點擊、滑動、拖動時的有效點,同時還要兼顧系統(tǒng)展示的美觀度,由專業(yè)人員針對系統(tǒng)的圖標形狀、文字大小、展示區(qū)域比例、導(dǎo)航伸縮等方面均進行了合理設(shè)計。
業(yè)務(wù)部門更關(guān)系IT架構(gòu)支撐起來的業(yè)務(wù)系統(tǒng)的運行狀況。平臺要告訴業(yè)務(wù)管理人員的是直觀的系統(tǒng)運維情況。
將性能、故障、流量、配置與業(yè)務(wù)統(tǒng)計數(shù)據(jù)進行深度關(guān)聯(lián),打破傳統(tǒng)各自為政的管理模式,將多角度的監(jiān)控業(yè)務(wù)數(shù)據(jù)實時在平臺共享。
- (三)形象化比擬安全狀態(tài)
以往安全狀況多采用數(shù)字、文字、圖表等方式進行描述,這種形式所表達出來的安全狀況內(nèi)容晦澀、美觀度較差、不支撐宏觀決策分析。仁和誠信監(jiān)控運維平臺系統(tǒng)試圖以一種全新的視角來詮釋安全,因此在系統(tǒng)中,我們創(chuàng)新的采用了以晴雨表、溫度計等方式形象化比擬被監(jiān)控對象的安全狀況。在原有技術(shù)支撐的基礎(chǔ)上,用晴雨表、溫度計這種自然的形態(tài)來看待安全,使得運維監(jiān)控平臺系統(tǒng)的宏觀展示效果更為美觀和直觀。
- (四)監(jiān)控整體資源 全面數(shù)據(jù)采集
網(wǎng)絡(luò)監(jiān)控平臺不再單純以監(jiān)控告警作為關(guān)注點,而是將監(jiān)控落實到整體IT資源中的CIA三個層面上(CIA即信息安全系統(tǒng)的保密性、完整性和可用性)。仁和誠信監(jiān)控運維平臺數(shù)據(jù)采集范圍可覆蓋IT系統(tǒng)中的安全設(shè)備、網(wǎng)絡(luò)設(shè)備、服務(wù)器系統(tǒng)、應(yīng)用軟件和數(shù)據(jù)庫的性能告警、配置變更及故障報警等。仁和誠信監(jiān)控運維平臺打破了傳統(tǒng)監(jiān)控類平臺因采集到的數(shù)據(jù)無法互相溝通、彼此關(guān)聯(lián)所造成的各司其職的尷尬狀況,站在運維人員關(guān)注資產(chǎn)風險變化的視角,將所有采集的數(shù)據(jù)統(tǒng)一整合并建立科學的時間軸前后關(guān)聯(lián)分析,將監(jiān)控與IT系統(tǒng)各種細微變化聯(lián)系在一起,以至于將風險監(jiān)控深入到每個細節(jié)。
- (五)海量異構(gòu)數(shù)據(jù)收集、智能分析
面對今天動輒數(shù)萬條的告警信息,傳統(tǒng)的、單純的監(jiān)控告警集中展現(xiàn)令運維人員很難找到后續(xù)處理的工作重點。網(wǎng)絡(luò)監(jiān)控平臺可實現(xiàn)從資產(chǎn)管理角度出發(fā)進行關(guān)聯(lián)風險,以運維監(jiān)控平臺高速關(guān)聯(lián)計算取代傳統(tǒng)人員的經(jīng)驗分析,將重要資產(chǎn)告警事件進行優(yōu)先處理,使運維管理者對關(guān)鍵事件與重要風險的把握更精準,處理更高效。網(wǎng)絡(luò)監(jiān)控平臺會自動針對該系統(tǒng)的配置、性能、故障、流量及實時監(jiān)控數(shù)據(jù)等多個角度進行分析,自動顯示將該事件對服務(wù)器風險變化的影響,同時結(jié)合資產(chǎn)重要度,進入相應(yīng)處理階段。協(xié)助信息安全管理者每天高效精準的關(guān)注資產(chǎn)風險的告警事件即可,避免逐條查看,減少無用的重復(fù)性工作,提高整體工作效率。
- (六)平臺支撐設(shè)備的運維細致到位
網(wǎng)絡(luò)監(jiān)控平臺系統(tǒng)的建設(shè),與信息系統(tǒng)中的網(wǎng)絡(luò)設(shè)備、安全設(shè)備、服務(wù)器、業(yè)務(wù)系統(tǒng)等緊密結(jié)合的,這些設(shè)備基本都是運維監(jiān)控平臺系統(tǒng)的數(shù)據(jù)來源,成為支撐運維監(jiān)控平臺系統(tǒng)運轉(zhuǎn)的IT基礎(chǔ)設(shè)施,尤其是當網(wǎng)絡(luò)監(jiān)控平臺系統(tǒng)采用分布式部署時,其所涉及到的眾多服務(wù)器更需要進行統(tǒng)一的運維服務(wù),而針對這些設(shè)備的運維也是技術(shù)人員的日常工作。為此,網(wǎng)絡(luò)監(jiān)控平臺系統(tǒng)專門設(shè)計了一個功能模塊來協(xié)助運維人員針對IT支撐設(shè)施進行日常的運維、管理。
四、解決方案收益
網(wǎng)絡(luò)監(jiān)控平臺的搭建,可以為電信行業(yè)公司提供一個完善的系統(tǒng)、設(shè)備故障維護體系,提高和規(guī)范運維水平,提升運維能力。逐步實現(xiàn)運維模式由被動式轉(zhuǎn)為主動式服務(wù)。綜合反應(yīng)管理系統(tǒng)運行狀況和運維服務(wù)管理情況,有效的展示設(shè)備、系統(tǒng)的運行狀況、性能狀況等,使運維人員和管理人員能迅速了解所負責區(qū)域的情況。平臺還可以為數(shù)據(jù)中心設(shè)備的更新?lián)Q代提供準確的事實數(shù)據(jù)。