專利名稱:一種通過性能數據監測網絡異常情況的方法
技術領域:
本發明涉及3G通信系統中的網管系統,具體地說涉及一種網管系統 中通過建立性能監測模型進行實時分析及時發現網絡中可能存在的異常 情況,通過告警或其他方式通知維護人員進行及時排查和解決的方法。該 監測適用于網絡中所有的測量對象類型,例如RNC、小區、CPU、 NodeB、 鄰接小區等等。
背景技術:
3G通信系統的網管系統,遵循TMN (電信管理網絡模塊, Telecommunications Management Network Model) 、 3GPP(第三代合作伙 伴計劃,The 3rd Generation Partnership Project)等規范,包括告警管理、 配置管理、性能管理、安全管理等功能。性能管理功能主要包括數據采集、 數據分析等功能。在網管系統實際運行中發現,當運行的網絡中出現一些 特殊問題時,維護人員很難及時觀測到并進行排查和解決,嚴重影響到網 絡的正常運行。由此可見,如何及時發現這些異常情況成為網絡正常運行 的關鍵一環。
目前普遍采用以下兩種方法來發現網絡是否存在異常
第一種方法是選擇相應的指標創建QoS (網絡服務質量,Quality of Service)任務進行監測,當所監測指標超過指定的門限時產生QoS告警, 用戶根據QoS告警進行異常情況定位;
采用這種方法可以監測到網絡中異常情況,但這種方式會產生大量無 關告警,千擾維護人員進行正常分析,主要體現在監測的指標一般需要符 合一定的條件,例如話務量X).lErl的小區才需要監測,并且不同的指標 之間存在 一 定的關聯性。
第二種方法是網元監測并產生告警,網元根據設備出現各種異常情況
分別分析并產生相應告警,用于維護人員進行定位分析;
采用這種方法因為網元設備可能出現的異常情況太多,無法監測到每 種可能性,同時網元產生的大量告警缺乏關聯性,不方便維護人員進行定 位分析和排查問題。
發明內容
本發明所解決的技術問題在于提供一種通過性能數據監測網絡異常 情況的方法,以及時發現網絡中可能存在的異常情況,及時通知維護人員
進行排查,提供有效的信息方便用戶進行定位;同時采用集中告警的方式, 降低系統中告警的數量,從而提高網絡維護的效率。
為了解決上述問題,本發明提供了一種通過性能數據監測網絡異常情 況的方法,應用于網管系統中,其特征在于,包括以下步驟
(1) 在所述網管系統中設置性能監測模型,所述網管系統啟動該才莫 型并進行加載;
(2) 所述網管系統正確加載該模型后,該網管系統對每個監測對象 的性能數據帶入所述模型中進行相應審核,如果每個性能數據審核都能滿 足,則網管系統產生告警恢復消息;否則網管系統產生告警上報消息;
(3) 所述網管系統判斷所有監測對象是否都處理完,如果沒有處理 完,則繼續執行步驟(2)。
本發明所述的方法,其中,所述性能監測模型是標準的XML配置文 件,包括監測對象的門限、監測對象的監測時間段或監測條件。
本發明所述的方法,其中,所述步驟(2)進一步包括
如果該監測對象的每個性能數據審核都能滿足,則網管系統產生該監 測對象的告警恢復消息,通過告警接口上報到告警系統,如果當前告警系 統中存在該監測對象的告警恢復消息,則該告警系統自動進行恢復處理; 如果當前告警系統中不存在該監測對象的告警恢復消息,則網管系統忽略處理。
其中,所述步驟(2)進一步包括
如果該監測對象有一個或多個性能數據審核沒有滿足,則網管系統將 未通過的監測對象的門限值、異常描述和實際值作為異常監測告警上報消 息,通過告警接口上報到告警系統。
本發明所述的方法,其中,所述步驟(2)的該網管系統對每個監測 對象的性能數據帶入所述模型中進行相應審核,為該網管系統的監聽器對 每個監測對象的性能數據帶入所述模型中進行相應審核。
本發明所述的方法,其中,所述步驟(2)進一步包括
所述網管系統正確加載該模型后,該網管系統對每個監測對象的性能 數據帶入所述模型中進行相應審核,當沒有監測對象的時候,則網管系統 上報信息使系統處于休眠狀態。
本發明所述的方法,其中,所述步驟(1 )進一步包括
當性能監測模型的配置文件發生變化時,所述網管系統根據配置文件 的最后修改時間進行判斷,如果配置文件時間發生變化,該網管系統自動 重新加載,不用重新啟動網管系統。
其中,所述步驟(2)包括
所述網管系統正確加載該模型后,該網管系統先判斷是否在模型的監 測對象的監測時間段上,如果不屬于需要監測時間段,則網管系統不處理 繼續監聽;如果在需要監測時間段上,該網管系統對該模型的監測條件自 動識別,將監測條件轉換為具體的計數器,同時解析出需要監測的對象, 網管系統對每個監測對象的性能數據帶入所述模型中進行相應審核,如果 每個性能數據審核都能滿足,則網管系統產生告警恢復消息;如果其中有 一條性能數據審核不通過,則網管系統產生告警上報消息。
本發明所述的方法,其中,所述步驟(3)進一步包括
所述網管系統判斷所有監測對象是否都處理完,如果沒有處理完,則 繼續執行步驟(2);如果處理完則該網管系統監聽,并使系統處于休眠狀
態,當有新的數據上報后,繼續執行步驟(2)。
本發明的核心思想是通過設計性能監測模型,建立預警系統,及時檢 測出系統中可能存在異常情況,采用告警的機制通知維護人員進行排查和 解決。性能監測模型是根據系統的各項運行指標,進行運算、比較、歸納 而形成,可以在具體使用場景中不斷完善和調整,達到較為準確的效果, 提高預警的準確率,提高網絡運維效率,降低網絡運維成本,將大大提高 網絡的穩定性。
圖1是本發明實施例所述的一種通過性能數據監測網絡異常情況的 方法流程示意圖。
具體實施例方式
本發明在這里提供了 一種通過性能數據監測網絡異常情況的方法,及 時發現網絡中可能存在的異常情況,及時通知維護人員進行排查,提供有
效的信息方便用戶進行定位;同時釆用集中告警的方式,降低系統中告警 的數量,從而提高網絡維護的效率。以下對具體實施方式
進行詳細描述, 但不作為對本發明的限定。
本發明的核心思想是通過設計性能監測模型,建立預警系統,及時檢 測出系統中可能存在異常情況,采用告警的機制通知維護人員進行排查和 解決。性能監測模型是根據系統的各項運行指標,進行運算、比較、歸納 而形成,可以在具體使用場景中不斷完善和調整,達到較為準確的效果, 提高預警的準確率,提高網絡運維效率,降低網絡運維成本,將大大提高 網絡的穩定性。
本發明的主要特點和重點實現方法如下
(1)性能監測模型具有開放性,有變化時系統自動更新;系統提供 的監測模型是標準的XML配置文件,監測模型簡潔明晰,具有很強的可 擴展性。用戶可根據需要進行調整和完善,可以修改監測對象、監測門限、
監測時間段或增加監測條件等;當監測模型發生變化,系統根據文件的最 后修改日期,如果有更新自動重新加載,采用新的監測條件進行審核,不 用重新啟動網管,保證系統穩定性。
(2)采用條件和集中告警的方式,降低告警數量,方便用戶分析;
監測模型釆用關聯條件的方式,對不需要關注的監測對象進行有效過濾, 降低告警數量。同時針對單一監測對象可以進行多種條件組合審核,將不 滿足的條件合并作為告警的詳細信息,保證系統中 一個監測對象最多有一
條告警,大大降低告警數量;告警詳細信息中包含了審核條件、異常描述、 門限值和實際指標值,用戶查看告警詳細信息就很清楚該監測對象哪些指 標存在問題。
下面結合附圖對本發明作進一步的詳細說明。如圖l所示,本發明提 出通過性能數據監測網絡異常情況的方法,包括以下步驟
步驟IOI,設置性能監測模型;抽取網絡中具有能夠反映出監測對象 情況的計數器或指標,根據網絡實際運營情況設定相應的門限,作為監測 對象是否存在異常的審核條件;這里監測模型可以在具體使用場景中不斷 完善和調整,達到較為準確的效果,提高預警的準確率。采用模型示例
RNC/小區監測模型示例
1:用戶無法發起RRC連接建立 RAB建立嘗試次數< 10
2:用戶可以建立RRC連4妄,^旦RAB建立成功率不高。 RRC連接建立成功次數〉10,但RAB建立成功率〈200/0 3: RAB建立成功但服務量很小
電路域業務建立成功次數(電路域成功建立的RAB數目)>10,但話 務量O.lErl;
分組域業務建立成功次數(電路域成功建立的RAB數目)>10,但分 組i或流量〈lK;
4: RAB建立成功但掉話率比較高
業務建立成功次數(成功建立的RAB數目)>10,但掉話率>20%;
5:臨近監測對象比較,出現明顯偏差
RAB建立成功率 < 平均值><30%;
掉話率 > 平均值x3000/。
6:連續監控出現指標抖動
RAB建立成功率 < 前5個時間—敬平均值><50%;
掉話率 > 前5個時間段平均值x200。/0
CPU監測;漠型示例
1: CPU持續保持很高利用率
步驟102,網管啟動后自動加載監測模型,當模型配置文件發生變化 時,系統根據文件的最后修改時間進行判斷,如果文件時間發生變化,系 統自動重新加載,不用重新啟動網管服務器。加載完;f莫型后,系統進行審 核條件和審核公式自動識別,將審核公式轉換為具體的計數器,同時解析 出需要監測的對象等信息,為下一步處理做好準備。
步驟103,系統正確加載檢測模型后,系統將啟動性能數據上報監聽 器,當監聽到監測對象的性能數據上報時,系統會進行相應的數據審核, 在沒有監測對象數據上報處于休眠狀態;
在收到監測對象的性能數據后,系統先判斷是否在監測的時間點,如 果不屬于需要監測時間點,則不處理,繼續監聽;如杲是在監測時間,則 解析出每個監測對象的所有相關計數器的值,順序將每個監測對象的計數 器和計數器的值代入到性能監測模型進行規則運算,如果每個審核關系都 能滿足,則產生告警恢復消息;如果其中有一條審核關系不通過,則產生 告警上報消息;
如果該監測對象的所有審核關系都滿足,則系統產生該監測對象的告 警恢復消息,通過告警接口上報到告警系統,如果當前告警存在該監測對 象的告警,則系統自動進行恢復;如果沒有該監測對象的告警,則系統會 忽略處理;
如果該監測對象有一個或多個審核關系沒有滿足,系統將產生異常監
測告警。系統通過計算每個審核條件的實際值,將未通過的審核條件、門 限值、異常描述和監測對象實際值作為告警的詳細信息,通過告警接口上 報到告警系統。
步驟104,判斷當前粒度的所有監測對象是否處理完成,沒有處理完,
則繼續步驟103的將采集數據帶入模型進行審核處理;處理完,則監聽器 休眠,等待下一個粒度性能數據上報。
步驟105,如果有的新的數據上報,則繼續步驟103的將采集數據帶 入模型進行審核處理;否則繼續監聽。
用戶在告警系統中過濾出異常監測告警,就可以比較清晰哪些監測對 象存在異常情況,通過查看告警詳細信息就可以清楚該監測對象出現哪些 異常,及時進行具體問題排查和解決。
本發明實施例是通過設計性能監測模型,建立預警系統,及時檢測出 系統中可能存在異常情況,采用告警的機制通知維護人員進行排查和解 決。性能監測模型是根據系統的各項運行指標,進行運算、比較、歸納而 形成,可以在具體使用場景中不斷完善和調整,達到較為準確的效果,提 高預警的準確率,提高網絡運維效率,降低網絡運維成本,將大大提高網 絡的穩定性。
當然,本發明還可有其他多種實施例,在不背離本發明精神及其實質
形,但這些相應的改變和變形都應屬于本發明所附的權利要求的保護范圍。
權利要求
1、一種通過性能數據監測網絡異常情況的方法,應用于網管系統中,其特征在于,包括以下步驟:(1)在所述網管系統中設置性能監測模型,所述網管系統啟動該模型并進行加載;(2)所述網管系統正確加載該模型后,該網管系統對每個監測對象的性能數據帶入所述模型中進行相應審核,如果每個性能數據審核都能滿足,則網管系統產生告警恢復消息;否則網管系統產生告警上報消息;(3)所述網管系統判斷所有監測對象是否都處理完,如果沒有處理完,則繼續執行步驟(2)。
2、 如權利要求1所述的方法,其特征在于,所述性能監測模型是標 準的XML配置文件,包括監測對象的門限、監測對象的監測時間段或 監測條件。
3、 如權利要求l所述的方法,其特征在于,所述步驟(2)進一步包括如果該監測對象的每個性能數據審核都能滿足,則網管系統產生該監 測對象的告警恢復消息,通過告警接口上報到告警系統,如果當前告警系 統中存在該監測對象的告警恢復消息,則該告警系統自動進行恢復處理; 如果當前告警系統中不存在該監測對象的告警恢復消息,則網管系統忽略 處理。
4、 如權利要求l所述的方法,其特征在于,所述步驟(2)進一步包括如果該監測對象有 一個或多個性能數據審核沒有滿足,則網管系統將 未通過的監測對象的門限值、異常描述和實際值作為異常監測告警上報消 息,通過告警接口上報到告警系統。
5、 如權利要求l所述的方法,其特征在于,所述步驟(2)的該網管系統對每個監測對象的性能數據帶入所述模型中進行相應審核,為該網管 系統的監聽器對每個監測對象的性能數據帶入所述模型中進行相應審核。
6、 如權利要求l所述的方法,其特征在于,所述步驟(2)進一步包括所述網管系統正確加載該模型后,該網管系統對每個監測對象的性能 數據帶入所述模型中進行相應審核,當沒有監測對象的時候,則網管系統 上報信息使系統處于休眠狀態。
7、 如權利要求1所述的方法,其特征在于,所述步驟(1 )進一步包括當性能監測模型的配置文件發生變化時,所述網管系統根據配置文件 的最后修改時間進行判斷,如果配置文件時間發生變化,該網管系統自動 重新加載,不用重新啟動網管系統。
8、 如權利要求2所述的方法,其特征在于,所述步驟(2)包括所述網管系統正確加載該模型后,該網管系統先判斷是否在模型的監 測對象的監測時間段上,如果不屬于需要監測時間段,則網管系統不處理 繼續監聽;如果在需要監測時間段上,該網管系統對該模型的監測條件自 動識別,將監測條件轉換為具體的計數器,同時解析出需要監測的對象, 網管系統對每個監測對象的性能數據帶入所述^t型中進行相應審核,如果 每個性能數據審核都能滿足,則網管系統產生告警恢復消息;如果其中有 一條性能數據審核不通過,則網管系統產生告警上報消息。
9、 如權利要求l所述的方法,其特征在于,所述步驟(3)進一步包括所述網管系統判斷所有監測對象是否都處理完,如果沒有處理完,則 繼續執行步驟(2);如果處理完則該網管系統監聽,并使系統處于休眠狀 態,當有新的數據上報后,繼續執行步驟(2)。
全文摘要
本發明公開了一種通過性能數據監測網絡異常情況的方法,應用于網管系統中,包括(1)在所述網管系統中設置性能監測模型,所述網管系統啟動該模型并進行加載;(2)所述網管系統正確加載該模型后,該網管系統對每個監測對象的性能數據帶入所述模型中進行相應審核,如果每個性能數據審核都能滿足,則網管系統產生告警恢復消息;否則網管系統產生告警上報消息;(3)所述網管系統判斷所有監測對象是否都處理完,如果沒有處理完,則繼續執行步驟(2)。本發明的核心思想是通過設計性能監測模型,建立預警系統,及時檢測出系統中可能存在異常情況,采用告警的機制通知維護人員進行排查和解決。
文檔編號H04L12/26GK101384054SQ200710145889
公開日2009年3月11日 申請日期2007年9月4日 優先權日2007年9月4日
發明者林華永 申請人:中興通訊股份有限公司