專利名稱:用于監測具有分布部件的系統狀態(尤其是具有分布部件的網絡的狀態)和具有分布部件 ...的制作方法
本申請涉及具有分布部件的系統的系統狀態的監測和/或檢驗,在下文中也簡單稱其為監測。
在這樣一種被簡稱為分布系統,例如移動或者固定的無線和/或通信網絡中,通常要求所述分布系統的所有部件了解(監測)該系統中每個其它部件的狀態。
如果一個分布系統中的一個部件失靈,例如由于一個部件的功能失效和/或離線,那么最好由該系統的每個其它部件獲得該信息。
在現有技術中公知有各種監測分布系統的方案,在這些方案中,所述監測借助于一個利用所謂乒乓消息的所謂乒乓機制(Ping-Pong-Mechanismus)來實現。
在此,就是說在這樣一種基于乒乓消息的機制中,一個系統部件周期地向一個受到監測的部件發送關于所述分布系統的乒消息,而所述受到監測的部件用一個乓應答對上述的乒消息進行回應,這是一種所謂的乓確認。
如果缺少受檢驗部件的乓應答,一般就由發送乒消息的部件把該受檢驗的部件列為離線,或者一般列為功能失效。
一個分布系統的一部件利用所述乒乓機制來詢問所有部件,從而該部件能夠發現或者檢驗所述分布系統的每個其它部件的狀態。
一個在此公知的(第一個)基于乒乓機制的監測分布系統的系統狀態的方案規定一個分布系統中的每個部件監測該系統的每個其它的部件并且詢問關于各自其它部件狀態的相應信息。
為此所述分布系統中的每個部件向該系統的每個其它部件發送一個乒消息,并且在各自其它部件功能有效或者在線的狀態下獲得相應的乓應答(返回)。
圖3示出了這種公知的第一方案。
從而在圖3中示出一個公布的通信系統300,亦即一種HiPath-IP電話系統300,其具有多個處于通信連接狀態的通信服務器301至306。每個這樣的通信服務器301至306需要獲知系統300中每個其它的通信服務器301至306的失效。
為此,在HiPath-IP電話系統300中每個這樣的通信服務器301至306向每個其它的通信服務器301至306發送一個乒消息310,并且在各自的其它通信服務器301至306功能正常或者說在線狀態的情況下獲得相應的乓應答311。
該公知的第一方案的缺陷在于在監測一個分布系統的系統狀態的下產生一種數量級為0(n2)(n系統部件數)的龐大的信息量,這可能會限制系統的功效或者容量和/或故障識別能力/故障識別速度。
從而例如在如圖3所示的HiPath-IP電話系統300的情況下,每隔60秒發送乒乓消息(310、311)。在此在圖中所示的情況,6個通信服務器301至306出現(6*6*2)/60秒=每秒1個消息,或者30個通信服務器301至306出現(30*29*2)/60秒=每秒29個消息。
另一個基于乒乓機制的公知的對一個分布系統的系統狀態的監測方案規定一個中央協調器檢驗一個分布系統的部件,寄存該分布系統的功能失效的部件或者失靈的部件,并且向系統中的所有部件傳描對應的信息。
在此產生的信息量為數量級0(n)。
該另一個公知方案的缺點在于因為必須保持所述分布系統的中央協調器冗余,所以難于牢靠地實現所述方案。
因此本發明的技術問題在于規定一種實現或者說使得能夠簡單地和/或以較低的開銷來監測一個分布系統的系統狀態的方法。
該技術問題通過所述用于監測具有分布部件的系統的系統狀態的方法、具有程序代碼裝置的計算機程序、計算機程序產品、以及通過具有根據相應的從屬權利要求所述特征的部件的網絡完成。
在監測一個具有分布部件的系統的系統狀態的方法中,所述分布系統的部件被布置成一種邏輯環形結構。
在此(系統部件的)“邏輯的”環形結構應當毫無局限地一般性地理解為一般不是在物理上具體地把所述系統部件構成為一種環形結構,而是把所述系統部件想像地(也就是說作為想像模型)虛擬地布置在一種環形結構中或者說如此地構成為一種環形結構。
于是該系統的每個部件只監測其在邏輯環形結構中各自的相鄰部件,確定所述各自的相鄰部件的狀態。
如果一個部件確定了其相鄰部件的對應于一個可預先規定狀態的一個狀態,那么該部件就向所述系統的其它部件告知其相鄰部件的所述確定的、預先規定的狀態。
本發明所述方法的一個優點在于綜合了以上說明的從現有技術中公知方案的優點。
根據本發明,在分布系統中監測全部(分布的)部件的狀態只需要數量級(On)的消息。其中不存在任何應當可靠保特的中央設施,亦即中央協調器。
從而本發明所述的方案完全基于其中布置有所述分布系統部件的一種邏輯環形結構。
在此所述系統的每個部件只在所述環中監測其各自的鄰居,亦即其各自的相鄰部件。當所述鄰居失靈時,譬如在功能失效和/或離線狀態下,該部件把這樣的情況告知所有其它的部件。
在具有分布部件的網絡中,所述分布部件被布置在一個邏輯環形結構中。把布置在所述環形結構中的部件設置成使得-一個部件只監測其在所述邏輯環形結構中各自的相鄰部件,其中可以確定所述各自相鄰部件的狀態,并且-一個部件在確定了其相鄰部件的狀態對應于一個預先規定狀態之后,就向所述系統的其它部件告知其相鄰部件的該所確定的、預先規定的狀態。
所述具有程序代碼裝置的計算機程序被配置用于當該程序在計算機上運行時執行如本發明所述的方法的所有步驟。
所述具有存儲在一個機器可讀的數據載體上的程序代碼裝置的計算機程序產品被配置成當所述程序在一個計算機上運行時執行如本發明所述的方法的所有步驟。
設置用于當所述程序在一個計算機上運行時執行如本發明所述的方法的所有步驟的所述裝置以及具有程序代碼裝置的計算機程序,以及設置用于當所述程序在一個計算機上運行時執行如本發明所述的方法的所有步驟的所述具有存儲在一個計算機可讀的數據載體上的程序代碼裝置的計算機程序產品,尤其適用于執行如本發明所述的方法或者一個下面說明的擴展方案。
本發明優選的擴展方案在從屬權利要求中說明。
下面進一步的說明既涉及方法也涉及網絡。
本發明以及進一步說明的擴展方案既可以用軟件實現,也可以用硬件實現,例如利用一種專用電子電路實現。
此外本發明或者進一步說明的擴展方案的實現可以是一種計算機可讀的存儲介質,在所述存儲介質上存儲有實施本發明或者擴展的具有程序代碼裝置的計算機程序。
本發明或者進一步說明的擴展方案還可以通過一種計算機程序產品實現,所述計算機程序產品具有一種存儲介質,在所述存儲介質上存儲有實施本發明或者擴展方案的具有程序代碼裝置的計算機程序。
在一個優選的擴展方案中規定所述可預先規定的狀態是一種功能失效、尤其是一種離線狀態,或者是一種功能有效、尤其是一種在線狀態。在所屬技術領域內功能有效的概念是“運行中”(存活)。
監測各自的相鄰部件和/或確定一個部件的狀態可以優選地使用一種基于租用方法的方法進行。
這就是說,在如本發明所述的方法中,當采用基于一個租用方法(Leasing-Verfahren)的方法時,可以從所述相鄰部件向該部件傳輸一種“運行中”信息,尤其是一種“運行中”消息。
在此,尤其是在關于系統的當前信息方面,最好周期地傳輸所述“運行中”的信息。
基于這種可能的,但卻不是必需的,周期的“運行中”信息,于是在相鄰部件不(再)傳輸“運行中”信息時確定相鄰部件的功能失效。顯然這意味著相反只要傳輸“運行中信息”就可以從各自相鄰部件的“在線”狀態著手。
此外適宜的是在采用一種基于“全體告知”的方法的條件下,向其它的部件告知一個相鄰部件的預先規定狀態。
在此,也就是說在如本發明所述的基于“全體告知”方法的方法條件下,對系統中的每個其它部件執行一種確認方法,其中當各自其它部件獲得關于相鄰部件的預先規定狀態的信息時,該部件就確認獲得了該信息,尤其是在采用一種“確認”信息的條件,特別是一種“確認”消息,“確認”在所屬領域中確認采取“acknowledgement”的概念。
在此一般針對確定了相鄰部件的預先規定狀態的部件(獲得信息的)尤其通過向該部件傳輸一個“acknowledgement”消息的方式進行確認。
此外還可以規定對于沒有確認獲得關于所述相鄰部件所確定的一定狀態的信息的一個其它部件,也確定所述預先規定的狀態。
在此還可以向所有其它部件告知該信息。這可以采用對應的確認方法也可以不采用對應的確認方法進行。
在另一個優選的實施方式中規定每個部件存儲關于其它部件狀態的信息,尤其是存儲在一個局域的列表中。由此每個部件都(總是)具有關于對所述分布系統的全局的狀態的局域了解。
借助于這種了解,于是可以發送有針對性的“租用”消息和/或把所述環形結構保持在一種“閉合”的狀態。
此外在所述環形結構中,與一個部件的相鄰部件可以是所述邏輯環形結構中的一個前置的部件也可以是一個后置的部件。
在另一個優選的實施方式中規定監測一個具有分布部件的固定的通信網絡,例如一個固定電話網絡。在這種情況下,所述的部件通常是通信服務器。
然而,如本發明所述的監測對應地還可以實施在移動的分布系統中,譬如移動無線電網絡中。
下面參照附圖借助于一個實施例詳細地說明本發明的其它優點、特征和細節。在附圖中
圖1示出一個具有布置在一個邏輯環形結構中的(分布的)部件的一個分布系統,其中根據一個實施例,每個部件只監測其在所述環中各自的相鄰部件;圖2示出一個具有安排在一個邏輯環形結構中的(分布的)部件的一個分布系統,其中根據一個實施例,每個部件只監測其在所述環中各自相鄰的部件,圖中有一個部件失靈;圖3示出一個具有(分布的)部件的一個分布系統,其中根據現有技術實例中,每個部件都監測該系統中每一個其它部件。
圖1和圖2示出一個分布的通信系統100,即一個根據本發明進一步開發的HiPath-IP電話系統100,具有多個處于通信連接狀態的通信服務器101至106,在下文中還簡稱為“部件”101至106。
在所述系統100中,每個這種部件101至106都需要知道每個其它的通信服務器101至106的一個失靈(參見圖2),這是通過下面說明的監測機制實現的。
為此一個根據本發明進一步開發的HiPath-IP電話系統100的通信服務器101至106被布置在一個邏輯環形結構120中(104接著102、101接著102、106接著101、105接著106、104接著105、103接著104)。
每個通信服務器101至106從而只監測其在環形結構120中各自的后置者(102監測后置者101;103監測后置者102)。
在一個后置者(參見圖2中失靈情況下的102)失靈200的情況下,相應的(在環120中的)通信服務器(參見圖2,103)把該信息告知所有的其它通信服務器(參見圖2,211)。
在此,也就是就在一個根據本發明進一步開發的HiPath-IP電話系統100中,通過一種“租用”方法來監測在環形結構120中后置的通信服務器101至106。
在此一個后置者,例如部件102向各自處于環中的通信服務器,例如部件103,周期發送一個“運行中”消息101。
如果在一個通信服務器(在圖2中的102)處沒有從其后置者(圖2中的102)獲得該“運行中”消息(發出“出借”),就把所述后置者(圖2中的102)列為“離線”。
監測該“離線的”通信服務器102的通信服務器103借助于對應的信息消息211向系統100中的每個其它的通信服務器101、104至106告知此事,就是說告知其后置者102的失靈200。
系統100中的每一個其它通信服務器101、104至106都必須通過一種“確認”消息來確認獲得該信息。
如果沒有獲得從所述其它部件101、104至106發出的確認,就把通信服務器也列為“離線”。
再由通信服務器103向所有的其它的通信服務器告知該另一個失靈。
在這一級上,所述通信服務器103卻不再等待確認。
這種機制稱為“全體告知”(“Inform All”)。
每個部件101至106都把其關于系統100中的其它的部件101到106的狀態的了解存儲在一個局域的列表中。由此每個部件101至106都總是擁有關于系統100的全局狀態的局域了解。
借助于該了解,每個部件101至106都向下一個其知道的“在線”后置者發送一個“租用”消息。由此保證環120總是處于一種閉合的狀態。
同時每個部件101至106向在環中處于所述下一個已知的“在線前置者與它本身之間的所有“離線”前置者發送一個“租用”消息。
利用所述方法保證把重新“在線“的部件101至106重新組合進所述環120中。
如果一個部件101到106通過獲得一個租用消息而獲知另一個部件重新“在線”,它就利用“全體告知”機制把它告知給所有的其它部件101至106。
需要考慮前述由現有技術公知的系統或者其監測機制(參見圖3)每秒需要或者說發送29個消息,從而如所說明的,在每秒相同數量消息的情況下,可以每秒鐘一次地發送一個個監測(每秒30/29個消息)。
由此可以在相同的網絡負荷的情況下60倍地快速監測一個有30個服務器的系統并且識別出故障。系統包含的服務器越多,該因素表現就越佳。
權利要求
1.用于監測具有分布部件的系統,尤其是具有分布部件的網絡的方法,其中-所述分布系統部件被布置在一種邏輯環形結構中,-該系統的每個部件只監測在所述邏輯環形結構中其各自的相鄰部件,其中確定所述各自相鄰部件的狀態,并且-一個部件在確定了其相鄰部件的狀態對應于一個預先規定狀態之后,就向所述系統的其它部件告知其相鄰部件的該所確定的、預先規定的狀態。
2.如權利要求1所述的方法,其中,所述預先規定的狀態是一種功能失效的狀態、尤其是一種離線狀態;或者是一種具有功能的狀態、尤其是一種在線狀態。
3.如以上權利要求至少之一所述的方法,其中,采用一種基于租用方法(Leasing-Verfahren)的方法來實施各自相鄰部件的監測和/或一個部件狀態的確定。
4.如以上權利要求至少之一所述的方法,其中,在基于一種租用方法的方法的情況下,從相鄰部件向所述部件傳輸一種“運行中”信息,尤其是一種“運行中”消息。
5.如以上權利要求至少之一所述的方法,其中,周期地傳輸所述“運行中”信息。
6.如以上權利要求至少之一所述的方法,其中,如果所述相鄰部件沒有傳輸“運行中”信息,則確定該相鄰部件的功能失效。
7.如以上權利要求至少之一所述的方法,其中,采用一種基于“全體告知”方法的方法來向其它的部件告知一個相鄰部件的預先規定的狀態。
8.如以上權利要求至少之一所述的方法,其中,在基于“全體告知”方法的方法中,為每一個其它的部件實施一種確認方法,其中如果該每一個其它部件已經獲得關于一個相鄰的部件的預先規定狀態的信息,那么各其它部件就確認獲得所述信息,尤其是采用一種“確認信息、特別是采用一種“確認消息”進行確認。
9.如以上權利要求至少之一所述的方法,其中,對已經確定了所述相鄰部件的所述預先規定狀態的部件實施確認,尤其是通過向所述部件傳輸一種“確認”消息來實施確認。
10.如以上權利要求至少之一所述的方法,其中,為一個沒有被確認收到關于該相鄰部件的所確定的一定狀態的信息的部件,也確定該預先規定的狀態。
11.如以上權利要求至少之一所述的方法,其中,每個部件存儲關于其它部件的狀態的信息、尤其是存儲在一個局域列表中的信息。
12.如以上權利要求至少之一所述的方法,其中,所述相鄰部件是所述邏輯環形結構中的一個部件的一個前置的部件或者一個后置的部件。
13.如以上權利要求至少之一所述的方法,其中,監測一種具有分布部件的通信網絡、尤其是一個固定的通信網絡和/或電話網絡,其中所述部件是通信服務器。
14.具有程序代碼裝置的計算機程序,當所述程序在計算機上運行時執行如權利要求1所述的所有步驟。
15.如權利要求14所述的具有程序代碼裝置的計算機程序,其中,所述計算機程序存儲在計算機可讀的數據載體上。
16.具有存儲在機器可讀載體上的程序代碼裝置的計算機程序產品,用于當所述程序在計算機上運行時執行如權利要求1所述的所有步驟。
17.具有分布部件的網絡,具有-網絡,其中所述分布部件被布置在一個邏輯環形結構中,-被布置在所述環形結構中的部件,把每一個所述的部件設置成使得-一個部件只監測其所述邏輯環形結構中各自的相鄰部件,其中可以確定所述各自的相鄰部件的一種狀態,-一個部件在確定了其相鄰部件的狀態對應于一個預先規定狀態之后,就向所述系統的其它部件告知其相鄰部件的該所確定的、預先規定的狀態。
全文摘要
根據本發明,所述分布系統部件被布置在一種邏輯環形結構中。所述系統中的每個部件只監測其在所述結構中各自的相鄰部件并且確定所述相鄰部件的狀態。如果一個部件在確定了其相鄰部件的狀態對應于一個預先規定狀態之后,就向所述系統的其它部件告知其相鄰部件的該所確定的、預先規定的狀態。
文檔編號H04L12/56GK101023624SQ200580031191
公開日2007年8月22日 申請日期2005年6月17日 優先權日2004年9月16日
發明者S·伯恩德特, T·漢納, T·勞克斯, S·魯西特施卡, C·希林, A·索薩爾 申請人:西門子公司