一種實現應用故障診斷的方法及裝置的制造方法
【技術領域】
[0001]本發明涉及計算機應用領域,尤指一種實現應用故障診斷的方法及裝置。
【背景技術】
[0002]隨著IT技術應用的不斷發展,企業的各種業務進行過程已經越來越緊密地與互聯網技術結合在一起,由服務器、數據庫、中間件等組成的應用信息系統也變得越來越復雜。即使對技術人員的水平要求逐步提高,卻依舊存在進行故障排除越來越困難的問題。業務應用的運行質量(完成業務的能力、速度和穩定性)直接關系企業可以提供給用戶的業務水平。對關鍵業務應用的性能進行監控管理,及時有效的針對性能監管中存在的問題進行分析和診斷,是提高用戶業務應用可用性的迫切要求。
[0003]目前,對業務應用的性能進行監控管理主要包含以下幾個方面:1、對應用的訪問情況進行監控;2、當業務應用發生性能異常時,判斷是否由于網絡系統性能出現異常造成;
3、當業務應用發生訪問異常時,判斷是否由于網絡或應用遭受到攻擊造成。通過對業務應用故障的診斷,可以有效的幫助技術人員進行業務應用的即時恢復。
[0004]現有的業務應用的故障診斷主要從流量數據或監控數據(例如,應用日志)等單一的數據進行故障分析;由于進行故障診斷分析的數據單一,容易導致獲得的故障診斷結果存在片面或不足,這就需要借助更多人工參與來完成故障診斷。
【發明內容】
[0005]為了解決上述技術問題,本發明提供一種實現應用故障診斷的方法及裝置,能夠根據多維的數據,對業務故障進行全面診斷,減少人為參與。
[0006]為了達到上述發明目的,本發明公開了一種實現應用故障診斷的方法,包括:
[0007]采集多維應用數據;
[0008]當業務應用發生異常時,對采集到的多維應用數據從業務異常的時間和空間關聯關系中、根據業務異常類型獲取業務異常涉及到的關聯診斷數據;
[0009]將獲取的業務異常涉及到的關聯診斷數據,分別與各關聯診斷數據的歷史診斷數據進行比較,確定應用故障類型。
[0010]進一步地,多維應用數據包括:根據業務應用服務器IP提取的監控數據、業務應用服務器IP和目的地址提取的流量數據、和業務應用服務器IP和目的地址提取的應用性能數據。
[0011]進一步地,監控數據至少包括:IP地址、和/或監控時間、和/或CPU利用率、和/或磁盤利用率、和/或磁盤輸入輸出1、和/或內存相關信息、和/或交換空間相關信息、和/或網絡接口相關信息、和/或數據庫響應時間、和/或從磁盤調入內存的交換內存使用s1、和/或從內存調入磁盤的交換內存使用so、和/或從內存寫入磁盤的大小bo、和/或從磁盤寫入內存的大小b1、和/或服務狀態。
[0012]進一步地,流量數據為由相同五元組所唯一標識的一個會話,至少包括:采集時間、和/或源/目的地址、和/或源/目的端口、和/或協議、和/或發送TCP/IP建立連接時使用的握手信號SYN包數、和/或發送TCP報頭的碼位字段FIN包數、和/或TCP相關信息、和/或發送RST次數、和/或單位時間內訪問指定服務的總流量異常。
[0013]進一步地,應用性能數據至少包括:源/目的地址、和/或目的端口、和/或請求時間、和/或服務器響應時間、和/或載入時間、和/或頁面相關信息、和/或Http相關信息、和/或tomcat全局訪問速度異常、和/或單位時間內數據庫訪問量異常、和/或Weblogic當前會話數異常;
[0014]所述應用性能數據采集于HTTP協議的性能數據、和/或ORACLE數據庫服務的性能數據、和/或MYSQL數據庫服務器的性能數據。
[0015]進一步地,將獲取的業務異常涉及到的關聯診斷數據,分別與各關聯診斷數據的歷史診斷數據進行比較,確定應用故障類型具體包括:
[0016]將獲取的業務異常涉及到的關聯診斷數據,分別與各關聯診斷數據的歷史診斷數據通過周期性基線或移動窗口基線進行比較,根據預先設定的各關聯診斷數據的閾值范圍,確定應用故障類型。
[0017]進一步地,所述歷史診斷數據為:第一預設時長內的監控數據;第二預設時長內的流量數據、及實時的應用性能數據。
[0018]進一步地,當故障診斷未分析出結果時,該方法還包括:將涉及異常的多維數據進行存儲,在歷史數據更新后再進一步確定應用故障類型。
[0019]進一步地,該方法還包括:根據確定應用故障類型,從歷史診斷數據中提供故障恢復建議。
[0020]另一方面,本申請還提供一種實現應用故障診斷的裝置,包括:采集單元、獲取單元和故障診斷單元;其中,
[0021]采集單元,用于采集多維應用數據;
[0022]獲取單元,用于當業務應用發生異常時,對采集到的多維應用數據從業務異常的時間和空間關聯關系中、根據業務異常類型獲取業務異常涉及到的關聯診斷數據;
[0023]故障診斷單元,用于將獲取的業務異常涉及到的關聯診斷數據,分別與各關聯診斷數據的歷史診斷數據進行比較,確定應用故障類型。
[0024]進一步地,多維應用數據包括:根據業務應用服務器IP提取的監控數據、業務應用服務器IP和目的地址提取的流量數據、和業務應用服務器IP和目的地址提取的應用性能數據。
[0025]進一步地,監控數據至少包括:IP地址、和/或監控時間、和/或CPU利用率、和/或磁盤利用率、和/或磁盤輸入輸出1、和/或內存相關信息、和/或交換空間相關信息、和/或網絡接口相關信息、和/或數據庫響應時間、和/或從磁盤調入內存的交換內存使用s1、和/或從內存調入磁盤的交換內存使用so、和/或從內存寫入磁盤的大小bo、和/或從磁盤寫入內存的大小b1、和/或服務狀態。
[0026]進一步地,流量數據為由相同五元組所唯一標識的一個會話,至少包括:采集時間、和/或源/目的地址、和/或源/目的端口、和/或協議、和/或發送TCP/IP建立連接時使用的握手信號SYN包數、和/或發送TCP報頭的碼位字段FIN包數、和/或TCP相關信息、和/或發送RST次數、和/或單位時間內訪問指定服務的總流量異常。
[0027]進一步地,應用性能數據至少包括:源/目的地址、和/或目的端口、和/或請求時間、和/或服務器響應時間、和/或載入時間、和/或頁面相關信息、和/或Http相關信息、和/或tomcat全局訪問速度異常、和/或單位時間內數據庫訪問量異常、和/或Weblogic當前會話數異常;
[0028]所述應用性能數據采集于HTTP協議的性能數據、和/或ORACLE數據庫服務的性能數據、和/或MYSQL數據庫服務器的性能數據。
[0029]進一步地,故障診斷單元具體用于,將獲取的業務異常涉及到的關聯診斷數據,分別與各關聯診斷數據的歷史診斷數據通過周期性基線或移動窗口基線進行比較,根據預先設定的各關聯診斷數據的閾值范圍,確定應用故障類型。
[0030]進一步地,歷史診斷數據為:第一預設時長內的監控數據;第二預設時長內的流量數據、及實時的應用性能數據。
[0031]進一步地,該裝置還包括后續診斷單元,用于當故障診斷未分析出結果時將涉及異常的多維數據進行存儲,在歷史數據更新后再進一步確定應用故障類型。
[0032]進一步地,該裝置還包括恢復建議單元,用于根據確定應用故障類型,從歷史診斷數據中提供故障恢復建議。
[0033]本申請技術方案包括:采集多維應用數據;當業務應用發生異常時,對采集到的多維應用數據從業務異常的時間和空間關聯關系中、根據業務異常類型獲取業務異常涉及到的關聯診斷數