一種融合類別屬性的深度網絡地下目標識別方法及系統的制作方法
【技術領域】
[0001] 本發明涉及探地雷達技術領域,特別是一種融合類別屬性的深度網絡地下目標識 別方法及系統。
【背景技術】
[0002] 探地雷達(ground penetrating radar,GPR)是20世紀80年代新興起的一種利用 電磁波反射原理,來探測地下目標物以及地質結構與分布的淺地層無損探測技術。它根據 電磁波在介質中傳播時,其傳播路徑、強度、波形隨介質的電磁性質和幾何結構而發生變化 的性質,推斷介質的結構和目標的位置、形狀等,已經成為淺層地下探測的有效手段。由于 地下物質成分的多樣和復雜,介質損耗造成電磁波在有損耗介質中傳播發生較大衰減;構 成大地物質的物理成份、密度、濕度等參數因地質環境的不同而差異很大,以及地上地下各 種雜波干擾等諸多因素,造成探地雷達系統在數據處理、數據分析與解譯上的困難。
[0003] 探地雷達地下目標識別主要包括目標特征提取和識別,目標特征提取與選擇己經 有較成熟的方法。由于地下環境復雜,目標體形狀各異,難以得到完備的樣本集,這使得地 下目標識別方法研究方面仍面臨許多技術上的難點,導致GPR在實際應用中難以達到預期 的性能。
[0004] 目前,常用的地下目標識別方法主要有以下幾類:基于時域參數的識別方法,基于 統計學的識別方法和神經網絡識別方法。
[0005] (1)采用時域參數進行識別。時域特征參數,能在一定程度上反映著信號的形狀及 位置信息,但對于復雜地質環境中的目標信號,直接在時域上識別正確率較低。
[0006] (2)統計學識別方法主要是基于隱馬爾可夫模型HMM(Hidden Markov Model)的檢 測方法,以及HMM與神經網絡結合的方法。這一類方法都以回波信號中雙曲線目標的形狀特 征為基礎,并未涉及地下目標回波信號中豐富的時頻聯合信息,識別的精度有待于提高。
[0007] (3)神經網絡識別方法,比較常用的有BP網絡(Back Propagation)、RBF網絡 (Radical Bas is Function)、支撐向量機SVM(Support Vector Machine)和小波網絡WNN (Wavelet Neural Network)等。
[0008] BP神經網絡具有一般神經網絡的優點,如學習規則簡單,較強的非線性映射能力 和容錯能力等。BP神經網絡的缺點在于隨著網絡層數的增加,模型訓練易陷入局部極值以 及算法的收斂速度慢,從而降低特征提取分類的效果和效率。
[0009] 與BP網絡相比,RBF網絡具有唯一最佳逼近的特性,且無局部極小問題存在;具有 較強的輸入和輸出映射功能;網絡連接權值與輸出呈線性關系;學習過程收斂速度快;具有 很強的聚類分析能力。RBF網絡的不足:它不能解釋本身的推理過程和推理依據;不能向用 戶提出必要的詢問,而且當數據不充分的時候,神經網絡就無法進行工作;它把一切問題的 特征都變為數字,把一切推理都變為數值計算,易導致信息丟失。
[0010] SVM是一種以統計學理論為基礎的,以結構風險最小化的學習機學習方法,在解決 小樣本、非線性及高維模式識別問題中表現出特有的優勢。從理論上說,SVM算法得到的將 是全局最優解,解決了 BP網絡中無法避免的局部極值問題。SVM方法的兩個不足:對大規模 訓練樣本難以實施,用于解決多分類問題存在困難。
[0011 ] 小波神經網絡WNN(Wavelet Neural Network)是由大量非線性處理單元廣泛互連 而成的網絡,具有逼近能力強、收劍速度快、網絡結構明確、網絡參數(隱層結點數和權重) 的選取有理論依據、有效避免了局部最小值等優點,并且能大規模并行處理、分布式信息存 儲,具有較強的函數學習能力和容錯能力。相比多層感知器MLP (mul t i-lay er perc印tron)網絡和RBF網絡,小波神經網絡的構造比較復雜,其運算復雜度增加;在多維輸 入的情況下,隨著網絡的輸入維數的增加,網絡所需訓練樣本呈指數增長,網絡結果也將隨 之變得龐大,導致收斂速度下降;隱含層結點數確定困難;無法根據實際情況自適應選擇合 適的小波基函數。
[0012] 淺層學習 (shal low learning)雖然理論模型簡單,但對復雜函數的表示能力弱, 并且淺層模型提取出來的淺層特征對復雜問題分類的效率不高。傳統的神經網絡結構通過 增加隱含層的結點個數,在一定程度上能夠克服淺層網絡的特征學習能力不足的缺點,但 是傳統神經網絡反向傳播算法參數隨機初始化,收斂速度慢,而且在參數初始化不當的情 況下會引起網絡學習局部收斂,嚴重過擬合。
[0013] 為解決傳統的神經網絡隨機初始化網絡中的權值,容易導致網絡收斂到局部最小 值問題,2006年,Hinton G和他的團隊提出了一種深度置信網絡(deep belief network, DBN),提出多隱層的人工神經網絡具有優異的特征學習能力,可以學習得到更深刻更本質 的特征,從而更有利于可視化或分類;深度神經網絡可以通過"逐層初始化"(layer-wise pre-training)的方法克服傳統神經網絡學習速度慢的缺點。逐層初始化是通過無監督學 習實現的。深度學習的本質是通過構建含有多個隱層的機器學習模型和海量的訓練數據, 來學習和得到大量更具代表性的特征信息,從而提高分類和預測的準確性。此后,多種深度 學習模型被陸續提出,并在各個領域得到應用。
[0014] 深度學習與淺層學習的本質區別是網絡層次和訓練方式不同。淺層學習一般只含 有一個隱含層,而深度學習往往含有多個隱含層,可以將復雜的問題分層次研究和表達,層 次之間非線性,對于復雜函數表達能力強;但網絡層次過多會使得訓練時間變長,而且訓練 層次的增多也并不能確保算法精度得到提升。為此,深度學習引進了新的訓練方法一一即 "分層訓練",以提高學習效率和分類效果。
[0015] 研究表明,目標識別與分類性能與訓練樣本的數量、算法迭代次數有密切關系。當 運用大量(如5萬個以上)訓練樣本進行訓練時,隨著迭代次數的增加,識別率從88.59%上 升到97.27%。當降低訓練樣本數量時,算法對測試樣本的識別率會急速下降,尤其當訓練 所使用的樣本不足2萬個時,識別率僅為59.21 %,識別效果下降明顯。這對于GPR目標數據 的分析與識別是不能滿足需要的。因此,需要提出一種當樣本量不足或訓練迭代次數不多 時可有效地提高GPR目標的識別率的識別方法。
【發明內容】
[0016] 本發明提供一種融合類別屬性的深度網絡地下目標識別方法及系統,以解決現有 的技術問題,當樣本量不足或訓練迭代次數不多時可有效地提高GPR目標的識別率。
[0017] -方面,本發明實施例提供一種融合類別屬性的深度網絡地下目標識別方法,包 括以下步驟:
[0018] 對接收到的多個地下目標物返回的探地雷達回波信號進行預處理,提取分別表征 所述多個目標物的多個目標信號;
[0019] 根據所述多個目標信號建立樣本數據集,所述樣本數據集包括所述多個目標信號 和目標信號所屬的多個類別信息;
[0020] 深度網絡分類器對所述樣本數據集內的數據進行深度網絡訓練迭代計算,尋找使 得所述樣本數據集的代價函數值最小的參數;
[0021] 在所述深度網絡訓練迭代計算過程中,利用softmax回歸方式進行分類識別以確 定所述多個目標物。
[0022] 所述對接收到的多個地下目標物返回的探地雷達回波信號進行預處理,具體包 括:
[0023]對多個所述GPR回波信號分別進行背景噪聲去除、濾波處理、道間信號能量均衡、 子波相干加強和深部弱信號增強處理。
[0024]在一個實施例中,設接收到的所述探地雷達回波信號即GPR回波信號共有m個,根 據所述多個目標信號建立數據樣本集,具體為:
[0025]從所述m個GPR回波信號中提取目標信號A-scan數據組合成目標信號矩陣X=[x (1)],其中,x(1)(i = l,2,···,m)表示第i個A-scan樣本數據,每個A-scan數據為矩陣X中的一 列,對應的樣本類別矩陣為& (1)}4 = 1,2,一,!11,7(1)是樣本數據^1)對應的類別信息標簽, 111 個樣本數據構成的樣本數據集為{(X(1),y(1)),…,(X (m),y(m))},其分別屬于k個類別。
[0026] 在一個實施例中,進一步的,深度網絡分類器對所述樣本數據集內的數據進行深 度網絡訓練迭代計算,尋找使得所述樣本數據集的代價函數值最小的參數,具體為:
[0027] A、把Χ=[Χ(1)](? = 1,2,···,π〇作為深層稀疏編碼模型的輸入數據,通過下式計算 所述深度網絡的第i隱層的狀態:
[0028]
[0029] 其中,W為各隱層之間的連接參數,即權值向量,b為偏置項;
[0030] B、通過BP算法計算得到使所述樣本數據集的代價函數值最小的全局最優權值向 量W,b,其中所述樣本數據集的代價函數J (W,b)為:
[0031]
[0032] 其中,m,si分別表示深度網絡層數和1層單元數,|y^.)為稀疏性約束項;
[0