計算機備份綜合控制管理系統的制作方法
【技術領域】
[0001]本發明涉及一種計算機備份綜合控制管理系統,屬于服務備份容錯領域。
【背景技術】
[0002]目前,對于可靠性和穩定性要求較高的系統的備份容錯方案大多采用這樣的方案,即一臺主機配置一臺備機,且要求兩者安裝相同的服務程序,兩者之間的切換條件是通過特定的消息進行檢測,若判斷主機發生故障,則備機切換成主機,以提供持續的服務。這樣的備份機制在很多應用中存在這樣問題:
(I)成本高。一臺主機需要配置一臺備機,在硬件成本上為原來的兩倍。另外,對于機房來說,一臺機器便需要一個安放位置,對于機房空間也有很大的壓力。對于維護來說,一臺機器也就意味著多一份維護工作量。
[0003](2)備份服務的保護有限。一臺備機僅僅只能對一臺主機進行備份,若備份后機器出現故障,則無法進行備份了。
[0004]( 3 )只能相同應用服務備份。主機與備機兩者是對稱的,備機要求安裝與主機相同的應用,在啟動時進行主備設置。
[0005](4)切換條件是通過特定的消息進行檢測。這些消息一般是這些應用系統自己獨有的,不具有通用性。
[0006](5)調度機制復雜且需要單獨的調度設備。在對多臺設備設置多臺備機的情形下,一般采用單獨的調度設備且包含有復雜的調度機制,這樣單獨的調度設備本身出現故障則會造成整個備份機制失效,且增加了成本。
【發明內容】
[0007]本發明的目的,是為了有效地解決上述問題,提供一種可以達到M重備份的效果,且根據需要可以一臺備份多臺,備份機制靈活,在經濟性和可靠性上的配置上具有良好可伸縮性的計算機備份綜合控制管理系統。
[0008]本發明的實現總體思路為:一臺或者若干臺備用服務器(稱為備機)實現對若干臺主用服務器服務(稱為主機)的監聽與備份,主要采用IP地址切換的方法來實現。備機對所有主機進行偵聽,檢查主機是否處于網絡中,如果檢查到主機一定時間內不在網絡中,則認為該主機發生故障,此時將備機的IP改為故障主機的IP,并啟動相應的服務,代替其提供服務。當故障主機修復重新接入網絡后,替代的備機停止當前服務,將IP改回為原來的IP,原主機繼續提供服務。
[0009]為了實現多臺備機對多臺主機進行監聽和多重備份,采用調度和檢測機制為:首先對每臺備機進行編號,每臺備機只檢測編號在其前面的備機,如果該備機為編號最前面(也稱為首號備機),則需要對所有主機進行檢測。檢測的原則是只要找到編號在其前面的一臺備機,便停止檢測,記下該機的信息,后續優先檢測此備機。若找不到編號在其前面的備機(首號備機),則檢測所有主機。若已經切換為主機的編號為i (i〈N)的機器切換回備機,則該備機對編號其前面的備機進行檢測,若該備機為排在最前面的備機,且若編號從i+Ι至M存在對所有N臺主機進行檢測的備機(即切換前編號為排在最前面的備機),則將該機器(編號為i+Ι至N之間的機器)的檢測機器改為編號為i的備機。
[0010]針對主機恢復后,解決IP沖突的思路為:在一臺主機上配置兩個IP地址,兩個地址都能在網絡中使用。當切換后備機占用其一個IP地址,主機恢復后,會提示IP沖突,但是另外一個IP地址仍然能訪問網絡,這樣就能通過此IP進行通信,使主備服務器恢復到原來狀態。對于主機的兩個IP地址:一個稱為服務IP,主要以該IP對外提供服務,另外一個稱為偵控IP,主要用來提供對備機進行通信使用。
【附圖說明】
[0011]圖1是主機服務流程TJK意圖;
圖2是備機服務流程示意圖。
【具體實施方式】
[0012]如圖1和圖2所示,有~臺主機與1臺備機,主機編號為六1^2,...^1備機編號為BI,B2,..., BM0 BI排在最前面,是存在的備機中編號最小,為首號備機,它負責檢查所有主機,備機B2只需要檢測到BI存在就可以,其他備機只需檢測到存在有比自己編號小的備機就可以了。若有主機發生故障,則備機BI進行IP切換,并啟動相應服務,代替主機工作,備機B2則成為編號最小的備機,即首號備機,負責檢測所有主機,其他備機只需要檢測到存在著比自己編號小的備機即可。
[0013]在主機與備機兩者在功能上雖然存在差異,但都設計成一套程序,通過配置文件來識別該機器的身份,確定其提供的服務。
[0014]配置說明:機器類型包括有主機與備機兩個,需要在配置文件中進行配置,相同的機器類型之間用ID進行識別其身份。主機中必須配置2個IP,一個為服務IP,另外一個為偵控IP。服務IP是提供服務時采用的IP地址,偵控IP用來偵聽其他服務器發送過來的消肩、O
[0015]主機側提供的功能:
I)對本地進程進行管理,對主機服務的啟動和關閉,對服務掛死或異常退出時重啟進程。
[0016]2)通過偵控IP,偵聽其他服務器發送過來的消息。如果收到重新啟動網絡服務的命令(切換命令),則重新設置服務IP,然后重啟相應的服務。
[0017]備機側提供的功能:
I)管理本地進程,按照需要啟動與關閉相應的服務程序。
[0018]2)偵測其他備機是否在網絡中。(需要指定偵聽的備機列表)
3)偵測服務器是否處于網絡中,偵測服務器中某服務是否提供服務。(需要指定偵聽服務器的列表)
4)進行IP地址切換,并且按照需要啟動相應服務。
[0019]5)將IP地址切換回原來的備機,并且關閉服務。通知已經恢復正常的服務器修改IP地址(發送切換命令)。
[0020]以上所述的本發明實施方式,并不構成對本發明保護范圍的限定。任何在本發明的精神和原則之內所作的修改、等同替換和改進等,均應包含在本發明的權利要求保護范圍之內。
【主權項】
1.一種計算機備份綜合控制管理系統,其特征在于: 1)配置N臺主機和M臺備機,其中N^ 1,M ^ I ; 2)對M臺備機進行編號,編號在最前面的備機稱為首號備機; 3)首號備機對N臺主機進行檢測,其余M-1臺備機通過檢測編號在前面的備機以證明自己不是首號備機; 4)通過PING命令發送ICMP回應請求消息并記錄收到ICMP回應回復消息,通過這些消息來對網絡或主機的故障進行判斷,進行IP切換,服務替代,達到M重備份的效果。2.根據權利要求1所述的計算機備份綜合控制管理系統,其特征在于:IP切換與恢復的狀況如下: 1)若首號發生主機和備機切換,則緊臨其后的備機成為首號備機,其他所有與這原首號機有檢測關系的備機需要重新進行檢測以證明自己不是首號備機; 2)若發生主機恢復服務,備機切換回來,則切換回來的備機需要檢測自己是否為首號備機,若是首號備機,則需要對N臺主機進行檢測,而原首號備機改為對此備機進行檢測以證明自己不是首號備機。3.根據權利要求1或2所述的計算機備份綜合控制管理系統,其特征在于:處理IP沖突問題的方式為:在主機上需要配置兩個IP地址,一個稱為服務IP,該服務器以該IP對外提供服務,另一個稱為偵控IP,主要用來處理與備機之間的通信;當主機恢復后,發現服務IP存在,提示IP沖突,但是由于存在偵控IP,故仍然能夠訪問網絡,通過此偵控IP,備機就能夠正確返回切換到自己原來的狀態,讓主機恢復后繼續提供服務。4.根據權利要求1或2或3所述的計算機備份綜合控制管理系統,其特征在于:在每一臺備機(M臺)上安裝好有N臺主機的所有要備份的服務程序,在切換時根據需要備份的主機服務進行選擇和服務替換。5.這樣,不僅可支持N臺主機N種不同服務,且可支持一臺主機中的多種服務備份。
【專利摘要】本發明涉及一種計算機備份綜合控制管理系統,包括M臺備機對N臺主機采用IP切換的方式代替主機提供服務的多重備份機制;本發明的優點是:部署簡單靈活,可擴展性好;支持多重備份,穩定性高;支持N臺服務器不同服務,適用好;多重備份調度簡單,易用性好;服務器互相檢測量少,網絡開銷少等。
【IPC分類】H04L12/24, H04L1/22, H04L12/26
【公開號】CN105099747
【申請號】CN201410222017
【發明人】王能武
【申請人】王能武
【公開日】2015年11月25日
【申請日】2014年5月23日