1 引言
近年來,我國電力通信網絡的發(fā)展迅速。但是,與此相對應的監(jiān)視、控制、維護能力卻較落后.電力通信網絡的運行存在維護難度大,響應速度慢,服務質量差,人力成本和管理成本高,維護工作不透明,不量化,不主動等問題,使之無法適應現(xiàn)代化和自動化的總體需求。為徹底解決上述問題,需要開發(fā)和建設綜合化、集中化、智能化的網管系統(tǒng),以提升電力通信網的綜合化集中維護水平,變被動維護為主動維護,變面向設備為面向客戶、面向業(yè)務,從而有效提高客戶服務質量、業(yè)務響應能力和網絡管控能力嘲。為了有效防止因采集和處理來自交換、傳輸、數據、動力環(huán)境等專業(yè)網的海量告警數據,保證關注告警,確??焖侔l(fā)現(xiàn)、定位和處理故障,必須設計和實施有效的告警過濾機制。為此,通過詳細分析告警數據,提出了一種新的告警過濾模型和策略。將告警過濾規(guī)則以知識庫的形式存儲,使網管人員直接參與規(guī)則的定制和維護,大大減少了綜合化集中維護系統(tǒng)的成本,提高系統(tǒng)的靈活性。
2 告警相關性
2.1 告警相關性分析
告警相關性分析是指合并和轉化告警,即將多個告警合并成一條具有更多信息量的告警,以確定能否反應故障根本原因的告警,并準確定位故障。告警事件關聯(lián)可形式化定義為告警事件a與告警事件集合{a1,a2,…,ak}關聯(lián),表示為:a=>a{a1,a2,…,ak}。
告警事件關聯(lián)的類型可形式化定義為:①告警壓縮;②告警過濾;③告警抑制;④告警記數;⑤告警泛化;⑥告警特化;⑦告警時序關系。其具體定義形式參見參考文獻。
2.2 告警相關性方法
傳統(tǒng)的告警相關性分析方法主要有:一是通過實驗,人為制造一些故障并記錄導致的告警信息;二是充分利用電信領域專家平時維護通信網積累的經驗和知識。為了克服傳統(tǒng)方法人為因素不確定性的缺陷,目前采用的告警關聯(lián)方法有范例推理法、模糊邏輯法、貝葉斯網絡法、神經網絡法、規(guī)則法、關聯(lián)規(guī)則挖掘法等。
2.3 知識庫
知識的獲取源自知識工程師、智能編輯程序和歸納學習程序。其一,領域專家通過與知識工程師的反復接觸、交談,把自己擁有的知識告訴給知識工程師,由知識工程師和專家一起將這些知識歸納整理成專家系統(tǒng)知識。其二,通過智能編輯程序將專家的經驗知識送到專家系統(tǒng)知識庫中。該程序應具備靈活的人機對話能力和有關知識庫結構方面的知識。其三,通過歸納和總結大量的實驗數據,得到一些新的規(guī)律和知識。利用歸納學程序,模擬人類思維過程,以便從有關知識庫中發(fā)現(xiàn)新知識,然后將這些新知識添加到知識庫中,供專家系統(tǒng)使用。在此,基于歸納學習和知識工程師編寫智能程序,自動形成關聯(lián)規(guī)則,將其寫入知識庫。
3 告警過濾機制設計
3.1 告警過濾功能和目標
告警過濾的主要功能有支持告警收斂功能、支持告警次數的閾值越界告警功能、支持告警延時功能、支持制定網元和時間段進行忽略性過濾功能、支持屏蔽衍生告警功能及支持告警呈現(xiàn)過濾功能。
告警過濾機制的目標是:①設計合理的告警過濾機制,以實現(xiàn)快速、準確的過濾瞬斷告警、無效告警和次要告警,從而有效防止告警風暴,保證關注告警,降低故障時延,提高系統(tǒng)的穩(wěn)定性、適應性和軟件質量,增強客戶滿意度;②能快速地確定故障位置,快速地進行故障處理和故障恢復;③改善網絡性能和網絡管理員工作。
3.2 告警過濾模型
為保證告警過濾的正確性、有效性和靈活性,系統(tǒng)采用多層過濾機制。圖l給出多層過濾模型。其中,采集層的過濾策略主要是抑制和忽略。它依據設定的過濾規(guī)則,對原始告警數據實施預過濾,屏蔽無用或無需關心的告警數據,以減輕數據處理負荷。處理層過濾是整個過濾機制中的重點。主要用于建立高度收斂的告警過濾模型。其基本流程是:原始告警數據經過采集層過濾后開始分流,并進行延時、閉值、歸并、壓縮等處理.以對濾掉不關心的告警數據。過濾策略是可修正的,經過修正后的策略進行前轉,對此后的告警數據實施新的策略。表現(xiàn)層過濾按照告警屬性域設定組合條件,過濾出關心的告警類型。發(fā)布層過濾根據設定的過濾規(guī)則,從而決定相關信息的發(fā)布形式、時間及內容等。
4 實驗與分析
告警壓縮率=(系統(tǒng)采集的告警總數一系統(tǒng)呈現(xiàn)的告警總數)/系統(tǒng)采集的告警總數。采用告警壓縮率體現(xiàn)告警過濾效果。對某本地電力通信網網管綜合化集中維護系統(tǒng)的用戶提供的統(tǒng)計數據進行測試,測試時間為10 h,測試規(guī)則滿足瞬斷告警不入庫,重復告警歸并,較低級別告警不呈現(xiàn)的原則。表1給出測試結果。需說明的是,在計算告警壓縮率時,關聯(lián)告警中只計算了根告警數量,而系統(tǒng)呈現(xiàn)的告警數量中沒有計入衍生告警數量。
由實驗結果可見,經過模型過濾后,電力通信網發(fā)布的告警數量明顯降低,這說明了該方法的有效性。另外,由此還可見,告警主要來源于交換告警和數據方面,因此應關注這兩個方面告警數據的關聯(lián)性研究。
5 結語
采用數據挖掘技術獲取告警關聯(lián)規(guī)則,構建了告警規(guī)則知識庫,形成了用于實際系統(tǒng)的較完整的告警過濾機制及實現(xiàn)方案。該過濾機制能依據告警的重要程度不同,分別從采集層、處理層、呈現(xiàn)層、發(fā)布層對告警逐層收斂,從而實現(xiàn)快速、準確地過濾瞬斷告警、無效告警和次要告警,以防止告警風暴,保證關注告警,并快速發(fā)現(xiàn)、定位和處理故障,降低故障時延,提高客戶響應速度,改進服務質量。實驗證明了該告警過濾機制的實用性和有效性。