專利名稱:一種用于監控業務服務器的方法和裝置的制作方法
技術領域:
本發明涉及監控領域,尤其涉及一種用于監控業務服務器的方法和裝置。
背景技術:
隨著企業規模的不斷壯大,越來越多的企業著手在更多的區域發展公司業務,因此企業的網絡也就出現了跨區域分布的情況。這就需要設計的監控系統能夠支持對跨區域網絡的統一監控。然而傳統的監控系統只專注于如何對設備做很好的監控和展現而沒有對跨區域監控做很好的設計或者沒有一個成形的架構。這就導致對于傳統監控系統來言,要支持對跨區域的統一監控需要花費很大的力氣來實現,并且即使跨區域的統一監控建立成功,需根據每個區域的變化情況逐一采取對應的監控指令進行維護,后期的維護成本也很聞。
發明內容
本發明實施例提供一種用于監控業務服務器的方法和裝置,使得監控系統對跨區域的支持變得簡單,同時也通過預測的方式自動發送監控指令,降低了監控系統的維護成本。為達到上述目的,采用如下技術方案一種用于監控業務服務器的方法,包括在預定的時間間隔時,各區域對應的數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據,由所述數據匯總組件將所接收的業務監控數據生成監控信息;所述業務監控數據以預定格式指示各區域中的業務數據和監控點名稱;業務服務器將所生成的監控信息發送到監控服務器;所述監控服務器存儲所接收的監控信息,并按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。優選的,所述由所述數據匯總組件將所接收的業務監控數據生成監控信息,包括所述數據匯總組件對接收的業務監控數據進行分析;在不存在與所述業務監控數據相對應的心跳信息數據的情況下,生成心跳信息數據;在區域中不存在與所述業務監控數據相對應的監控點數據的情況下,生成監控點數據;在區域中存在與所述業務監控數據相對應的監控點數據的情況下,更新監控點數據;當達到預定時間間隔時,基于所述心跳信息數據和所述監控點數據生成所述監控信息。優選的,所生成的監控信息包括監控點信息、調用次數信息、響應次數和響應時間信息中的至少一個。優選的,所述生成匯總數據后,將匯總數據發送至業務服務器中的控制組件,控制組件對匯總數據進行分析預測,調用對應的監控指令發送至數據匯總組件,進而對各區域對應的數據采集組件進行控制。優選的,所述控制組件對匯總數據進行分析預測時,將匯總數據在基于歷史記錄中的監控數據和監控指令的建立的預測模型中進行匹配,得到匯總數據對應的監控指令。本發明還公開了一種用于監控業務服務器的裝置,包括采集模塊,用于在預定的時間間隔時,各區域對應的數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據,由所述數據匯總組件將所接收的業務監控數據生成監控信息;所述業務監控數據以預定格式指示各區域中的業務數據和監控點名稱;通信模塊,用于使業務服務器將所生成的監控信息發送到監控服務器; 展現模塊,用于所述監控服務器存儲所接收的監控信息,并按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。優選的,所述采集模塊配置為對接收的業務監控數據進行分析;在不存在與所述業務監控數據相對應的心跳信息數據的情況下,生成心跳信息數據;在區域中不存在與所述業務監控數據相對應的監控點數據的情況下,生成監控點數據;在區域中存在與所述業務監控數據相對應的監控點數據的情況下,更新監控點數據;所述采集模塊進一步配置為當達到預定時間間隔時,基于所述心跳信息數據和所述監控點數據生成所述監控信息。優選的,所生成的監控信息包括監控點信息、調用次數信息、響應次數和響應時間信息中的至少一個。優選的,所述裝置還包括,預測模塊,用于將匯總數據發送至業務服務器中的控制組件,控制組件對匯總數據進行分析預測,調用對應的監控指令發送至數據匯總組件,進而對各區域對應的數據采集組件進行控制。優選的,所述預測模塊對匯總數據進行分析預測時,將匯總數據在基于歷史記錄中的監控數據和監控指令的建立的預測模型中進行匹配,得到匯總數據對應的監控指令。本發明實施例提供的一種用于監控業務服務器的方法和裝置,將監控系統的各采集模組分別部署在各區域中統一進行數據采集,并根據分級統計、匯總之后的監控數據進行分析統計,并通過對匯總數據自動預測對應的監控指令,從而再次對各采集模組的監控策略進行調整,形成自適應的監控體系。
圖I為本發明提供的一種用于監控業務服務器的方法的步驟流程圖;圖2為本發明提供的一種用于監控業務服務器的裝置的結構模塊圖。
具體實施例方式下面結合附圖對本發明實施例一種用于監控業務服務器的方法及裝置進行詳細描述。隨著計算機的廣泛應用,企業中需要對許多業務系統進行監控。然而,現在的監控系統僅限于對硬件系統的監控。在現實中,需要對業務處理功能或方法進行監控。現在的分布式部署,不能保證每個業務都獨占一臺服務器,當一個業務系統被部署到多個系統上時,難免會受其它業務系統影響。在一些情況下,服務器可能需要監控數以百計的業務系統,而一個業務系統可能有數十個業務處理功能或方法。對于如此之多的監控內容,需要一個好的內容界定方法來區分不同的業務系統、業務功能、硬件系統等的監控信息;并為監控數據的采集、存儲、實時分析、報告、報警的邏輯精簡提供數據基礎。本發明公開了一種用于監控業務服務器的方法,如圖I所示,包括
步驟101 :在預定的時間間隔時,各區域對應的mysql數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據以及采集組件自身的一些性能數據,由mysql服務器的所述數據匯總組件將所接收的業務監控數據和采集組件自身數據生成監控信息;所述業務監控數據以預定格式指示各區域中的業務數據和監控點名稱;所述由所述數據匯總組件將所接收的業務監控數據生成監控信息,包括如下步驟步驟a :數據匯總組件對接收的業務監控數據進行分析;業務服務器上的數據匯總組件接收到各區域上傳的業務監控數據后,對業務監控數據按對應的數據類型進行統計,并結合設定的閾值將統計結果擬合為性能曲線,從而分析各數據指標的變化情況。如某區域數據采集組件上傳的響應時間發生范圍過大,超過設定的閾值,則該區域對應的鏈路故障的概率偏高,數據匯總組件觸發對應的事件對該區域進行提示。步驟b :在不存在與所述業務監控數據相對應的心跳信息數據的情況下,生成心跳信息數據;實際情況中,如果不存在對應的心跳信息數據,則說明心跳信息數據由于某種原因沒有發送,但該區域數據采集組件對應的線程依然正常存在,則生成心跳信息數據。步驟c :在區域中不存在與所述業務監控數據相對應的監控點數據的情況下,生成監控點數據;每個區域對應的數據采集組件對應的監控點數據一旦沒有生成,則生成監控點數據,并保存在區域對應的子數據庫中。步驟d :在區域中存在與所述業務監控數據相對應的監控點數據的情況下,更新監控點數據;同理,每個區域對應的數據采集組件對應的監控點數據已經生成時,則該監控點數據記錄的為上一時刻的區域狀態,因此更新對應的監控點數據,并保存在區域對應的子數據庫中。步驟e :當達到預定時間間隔時,基于所述心跳信息數據和所述監控點數據生成所述監控信息。
當各區域中的數據采集組件無法連接至業務服務器時,數據采集組件可將監控信息保存在各區域的子數據庫中,當連接恢復正常后再把監控數據發送到業務服務器。優選的,所生成的監控信息包括監控點信息、調用次數信息、響應次數和響應時間信息中的至少一個。步驟102 :業務服務器將所生成的監控信息發送到監控服務器;業務服務器采用同步的方式將監控信息發送到監控服務器,也可采用異步的方式,在設定的既定時間段內將監控信息發送到監控服務器。步驟103 :監控服務器存儲所接收的監控信息,并基于監控信息進行業務處理,mysql服務器按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。mysql服務器具體分級統計的匯總過程如下
I.監控服務器啟動時,按不同的匯總粒度定時匯總任務,匯總粒度包括30分鐘匯總,I小時匯總,6小時匯總,I天匯總。2.每個粒度的匯總任務從存儲的歷史監控數據中獲取該匯總任務需要的監控數據,然后通過預定義的匯總算法進行監控數據的匯總。3.匯總的算法包括了對一段時間內的數據求平均值,最大值,最小值等算法。4.監控服務器對各個匯總任務匯總后的匯總數據進行存儲,并提供給展現模塊進行展現。基于分級的思想進行監控信息的分級統計,可使用戶按不同的時段查看監控數據,從而判斷各區域對應的工作狀態,滿足了用戶的不同需要。本實施例中,基于監控信息進行業務處理時,監控設定的預警閾值,一旦匯總數據達到了預警閾值,則觸發郵件、短信等告警通知。具體過程如下I.監控服務器啟動用于進行告警計算的告警模塊。2.用戶通過展現平臺將監控信息的預警閾值發送到監控服務器的告警模塊。預警閾值包括(I).用來界定監控信息是否超過該預警閾值的計算符號,如大于、小于、包含等符號;(2).預警閾值的計算符號所需要的操作數。3.告警模塊用接收到監控信息和設定的預警閾值進行此對得出是否違反了預警閾值的結論。4.如果監控信息超過了設定的預警閾值,則觸發郵件、短信等事件通知用戶。步驟104 mysql服務器將匯總數據發送至業務服務器中的控制組件,控制組件對匯總數據進行分析預測,調用對應的監控指令發送至mysql服務器的數據匯總組件,進而對各區域對應的數據采集組件進行控制。所述控制組件對匯總數據進行分析預測時,包括對mysql采集組件自身性能情況的分析預測和監控數據走勢的分析預測。將匯總數據在基于歷史記錄中的監控數據和監控指令的建立的預測模型中進行匹配,得到匯總數據對應的監控指令。對mysql采集組件性能的分析預測是通過分析mysql采集組件的性能數據來預測組件未來一段時間是否會出現性能問題,并通過匯總組件對各區域的數據采集組件進行控制,具體過程如下
I.接收到匯總的采集組件自身的性能數據形成原始監控數據,原始監控數據中包括采集組件監控的資源數量,CPU消耗情況,內存占用消耗情況,進程內線程使用情況等信息;2.將原始監控數據進行訓練,將于通過對監控資源的數量線程使用情況和造成的CPU、內存消耗情況來推算出監控資源的數量、線程情況與CPU、內存消耗的此例,從而得到監控資源對應的預測模型;3.當監控資源的數量增加時,根據預測模型預測采集組件增加的CPU、內存消耗情況;4.如果預測到采集組件的CPU、內存消耗情況超過了采集組件當前分配的CPU、內存。通過匯總組件發送的監控指令來調整采集組件的CPU、內存分配情況。預測模型建立時,需要連續穩定運行一段時間,這樣可根據積累的原始監控數據進行計算或訓練。所述預測模型中,監控資源的數量、使用的線程數分別對應計算出的消耗負載(CPU、內存)的平衡值。當監控資源的數量增加或使用的線程數變化的時候,根據預測模型中存儲出的平衡值,動態調整消耗的負載(分配的CPU、內存);或者根據當前的消耗負載(cpu、內存的實際消耗值)計算出的平衡值,來動態調整使用的線程數和/或監控資源的數量。對數據走勢的分析預測是基于采集到的歷史數據的分析總結出數據的規律以及走勢,預測數據可能到某個時間點會超過設定的告警閾值,并將預測結果發送告警通知以便用戶可以及時處理,防患于未然。具體分析過程如下I.接收到匯總的監控信息,通過對歷史時段范圍內的監控信息進行統計,得到原始監控數據,對原始監控數據進行分析,得到預測模型,根據預測模型分析推斷出監控信息對應的增長速率。下面以按周為周期的預測模型如下
時間第一周_______第二周___
__筒一周二周三周四周五周六周日周一周二周三 ...
0-1 點 X11 X120 X130 X140 X150 X160 X170X210X220X230_ O
8-9 點 X11 X128 X138 X148 X158 X168 X178X218X228X238__8______
23-24 點 X1123 X122 X132 X142 X152 X162 X172X212X222X232___3__3_ 3 3 3 3333其中,Xl 10代表,第一個I代表是第一周,第二個I代表周一,第三個數O代表是O點的數據,則XllO代表第一周周一 O點的匯總數據。X210代表,第二周周一 O點的匯總數據,依次類推,則X2323代表第2周周三23點的匯總數據。當系統獲取到了各個小時的原始監控數據,則可對原始監控數據進行多個角度的分析和預測,得到預測模型在某一實施例中,按照每周的相同時段的數據進行分析,獲取每周一 8點的原始監控數據進行比較,按照線性回歸預測方法進行預測,在系統運行平穩并且業務相對固定的情況下,則可此較準確的預測到下周一同一時間點的數據是什么,同理,可準確預測下個月同一天的數據情況。2.根據預測模型對當前采集到的原始監控數據按照一定的預測算法進行預測,可較準確推斷出下一個時間點監控信息的值,以及何時監控信息的值將超過設定的閾值;結合具體業務情況選對需要分析的原始監控數據,有些業務是每月的最后幾天會很忙,有的業務是每周的周一會集中處理,結合這些業務特點,選取對應的數據源進行分 析,可預估到下一次業務集中處理時,預測模型即可推測出準確的監控信息。3.在臨近所述時間點時,如果預測到的監控數據大于設定的閾值,則通過郵件、短信等方式觸發對應的事件,將預測結果發送給用戶,提前通知用戶做好相應的處理和準備。如果某項業務是每周一上午8點集中處理,已經連續兩周的周一 8點,監控數據顯示系統負載穩步增長,通過預測模型進行線性回歸預測,下周一負載將創新高,則需要提前通知管理員,或者升級系統,或者增加負載,提前預防下周一的負載高峰。同時,如果負載連續增長,則從另外一個方面反映系統的負載出現問題或者系統容量不足,或者業務系統出現負載方面的問題,為提前診斷及預防提供了依據。同樣,對于業務月度某一天集中處理的業務亦然。本發明還公開了一種用于監控業務服務器的裝置,如圖2所示,包括采集模塊201,用于在預定的時間間隔時,各區域對應的mysql數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據,由mysql服務器的所述數據匯總組件將所接收的業務監控數據生成監控信息;所述業務監控數據以預定格式指示各區域中的業務數據和監控點名稱;通信模塊202,用于使業務服務器將所生成的監控信息發送到監控服務器;展現模塊203,用于所述監控服務器存儲所接收的監控信息,并由mysql服務器按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。優選的,所述采集模塊配置為對接收的業務監控數據進行分析;在不存在與所述業務監控數據相對應的心跳信息數據的情況下,生成心跳信息數據;在區域中不存在與所述業務監控數據相對應的監控點數據的情況下,生成監控點數據;在區域中存在與所述業務監控數據相對應的監控點數據的情況下,更新監控點數據;所述采集模塊進一步配置為當達到預定時間間隔時,基于所述心跳信息數據和所述監控點數據生成所述監控信息。優選的,所生成的監控信息包括監控點信息、調用次數信息、響應次數和響應時間信息中的至少一個。優選的,所述裝置還包括,預測模塊204,用于將匯總數據發送至業務服務器中的控制組件,控制組件對匯總數據進行分析預測,調用對應的監控指令發送至數據匯總組件,進而對各區域對應的數據采集組件進行控制。優選的,所述預測模塊對匯總數據進行分析預測時,將匯總數據在基于歷史記錄中的監控數據和監控指令的建立的預測模型中進行匹配,得到匯總數據對應的監控指令。本發明實施例提供的一種用于監控業務服務器的方法和裝置,將監控系統的各采集模組分別部署在各區域中統一進行數據采集,并根據分級統計、匯總之后的監控數據進行分析統計,并通過對匯總數據自動預測對應的監控指令,從而再次對各采集模組的監控策略進行調整,形成自適應的監控體系。以上所述,僅為本發明的具體實施方式
,但本發明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發明揭露的技術范圍內,可輕易想到變化或替換,都應涵 蓋在本發明的保護范圍之內。因此,本發明的保護范圍應所述以權利要求的保護范圍為準。
權利要求
1.一種用于監控業務服務器的方法,其特征在于,包括 在預定的時間間隔時,各區域對應的數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據,由所述數據匯總組件將所接收的業務監控數據生成監控信息;所述業務監控數據以預定格式指示各區域中的業務數據和監控點名稱; 業務服務器將所生成的監控信息發送到監控服務器; 所述監控服務器存儲所接收的監控信息,并按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。
2.根據權利要求I所述的方法,其特征在于所述由所述數據匯總組件將所接收的業務監控數據生成監控信息,包括 所述數據匯總組件對接收的業務監控數據進行分析; 在不存在與所述業務監控數據相對應的心跳信息數據的情況下,生成心跳信息數據; 在區域中不存在與所述業務監控數據相對應的監控點數據的情況下,生成監控點數據; 在區域中存在與所述業務監控數據相對應的監控點數據的情況下,更新監控點數據; 當達到預定時間間隔時,基于所述心跳信息數據和所述監控點數據生成所述監控信息。
3.根據權利要求I所述的方法,其特征在于所生成的監控信息包括監控點信息、調用次數信息、響應次數和響應時間信息中的至少一個。
4.根據權利要求I所述的方法,其特征在于所述生成匯總數據后,將匯總數據發送至業務服務器中的控制組件,控制組件對匯總數據進行分析預測,調用對應的監控指令發送至數據匯總組件,進而對各區域對應的數據采集組件進行控制。
5.根據權利要求4所述的方法,其特征在于所述控制組件對匯總數據進行分析預測時,將匯總數據在基于歷史記錄中的監控數據和監控指令的建立的預測模型中進行匹配,得到匯總數據對應的監控指令。
6.一種用于監控業務服務器的裝置,其特征在于,包括 采集模塊,用于在預定的時間間隔時,各區域對應的數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據,由所述數據匯總組件將所接收的業務監控數據生成監控信息;所述業務監控數據以預定格式指示各區域中的業務數據和監控點名稱; 通信模塊,用于使業務服務器將所生成的監控信息發送到監控服務器; 展現模塊,用于所述監控服務器存儲所接收的監控信息,并按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。
7.根據權利要求6所述的裝置,其特征在于所述采集模塊配置為對接收的業務監控數據進行分析; 在不存在與所述業務監控數據相對應的心跳信息數據的情況下,生成心跳信息數據; 在區域中不存在與所述業務監控數據相對應的監控點數據的情況下,生成監控點數據; 在區域中存在與所述業務監控數據相對應的監控點數據的情況下,更新監控點數據;所述采集模塊進一步配置為當達到預定時間間隔時,基于所述心跳信息數據和所述監控點數據生成所述監控信息。
8.根據權利要求6所述的裝置,其特征在于所生成的監控信息包括監控點信息、調用次數信息、響應次數和響應時間信息中的至少一個。
9.根據權利要求6所述的裝置,其特征在于所述裝置還包括,預測模塊,用于將匯總數據發送至業務服務器中的控制組件,控制組件對匯總數據進行分析預測,調用對應的監控指令發送至數據匯總組件,進而對各區域對應的數據采集組件進行控制。
10.根據權利要求9所述的裝置,其特征在于所述預測模塊對匯總數據進行分析預測時,將匯總數據在基于歷史記錄中的監控數據和監控指令的建立的預測模型中進行匹配,得到匯總數據對應的監控指令。
全文摘要
本發明實施例公開了一種用于監控業務服務器的方法和裝置,屬于監控領域。方法包括各區域對應的數據采集組件向所位于的業務服務器上的數據匯總組件發送業務監控數據,由所述數據匯總組件將所接收的業務監控數據生成監控信息;業務服務器將所生成的監控信息發送到監控服務器;所述監控服務器存儲所接收的監控信息,并按照統計時間間隔基于所存儲的監控信息分級統計,生成匯總數據進行展現。本發明將監控系統的各采集模組分別部署在各區域中統一進行數據采集,并根據分級統計、匯總之后的監控數據進行分析統計,并通過對匯總數據自動預測對應的監控指令,從而再次對各采集模組的監控策略進行調整,形成自適應的監控體系。
文檔編號H04L12/26GK102882745SQ20121037126
公開日2013年1月16日 申請日期2012年9月29日 優先權日2012年9月29日
發明者何宇 申請人:摩卡軟件(天津)有限公司