基于局部空間信息的封裝式高光譜波段選擇方法
【專利摘要】本發明提出一種基于局部空間信息的封裝式高光譜波段選擇方法,其步驟如下:1)輸入待波段選擇的高光譜圖像,將其轉換為矩陣形式的高光譜數據并作歸一化處理;2)使用支撐向量機SVM作為分類器,采用交叉驗證的方法選擇M個初始波段;3)將M個波段與剩余波段逐一組合,計算出各組合波段的能量函數E(f);4)使用現有圖切方法對組合波段的能量函數E(f)進行能量最小化;5)根據各組合波段能量函數值的大小進行波段選擇。本發明對高光譜圖像中的光譜信息和局部空間信息進行了有效融合,相對于只利用光譜維信息的方法,選擇波段的識別性能有了很大提升,可用于高光譜圖像的數據降維。
【專利說明】
基于局部空間信息的封裝式高光譜波段選擇方法
技術領域
[0001] 本發明屬于圖像處理技術領域,更進一步涉及高光譜影像波段選擇領域中的封裝 式高光譜波段選擇方法,可用于高光譜圖像處理中的數據降維。
【背景技術】
[0002] 遙感技術經過20世紀后半葉的發展,在理論上、技術上以及應用上都有重大進步, 而其中高光譜圖像技術尤為突出。高光譜圖像通過搭載在空間平臺上的高光譜傳感器,即 成像光譜儀,在電磁波譜的紫外、可見光、近紅外和中紅外區域,以數十乃至數百個連續且 細分的光譜波段對目標區域同時成像。高光譜圖像技術使得圖像的譜分辨率有了很大的提 高,是遙感發展的一個重大突破。一個高光譜圖像數據集包含數百個具有極高光譜分辨率 的光譜波段,運用高光譜圖像中豐富的光譜信息可以達到精確的目標識別。但是其龐大的 數據量、高維的數據形式、信息的高度冗余也給后續的數據處理帶來巨大挑戰。因此,如何 最大程度地保留高光譜數據豐富的光譜信息,同時又降低數據維度成為了高光譜圖像處理 的重要技術問題之一。
[0003] 高光譜圖像常用的降維方法有兩種,分別是特征提取和波段選擇。特征提取法通 過結合原始波段集合來生成新的波段集合,一般是通過線性或非線性的方法將高維波段空 間映射至低維波段空間,新生成的波段集合維數小于原始波段集合維數,從而達到降維的 目的。常用方法有PCA主成分分析法,FLD線性判別法等等。特征提取法新生成的波段是原始 波段經過變換組合后得到的,改變了原始的數據,破壞了原始數據中包含的內在物理意義。 波段選擇法是通過在原始波段集合中挑選出部分波段組成新的波段集合,并沒有對其做任 何改變,保持了數據的完整性,同時也保留了波段所對應的物理含義,并且達到縮小數據 量、消除噪聲波段等目的。
[0004] 根據波段選擇步驟與分類器模型的不同結合方式,波段選擇可以分為三種類型, 分別是過濾式、封裝式和嵌入式,其中:
[0005] 過濾式波段選擇,其步驟完全獨立于分類器模型,通過數據自身的性質來獲取波 段的相關性。該方法會對每個波段計算出一個相關性值,根據相關性值來挑選波段,通常選 擇相關性值大的波段,剔除掉相關性值小的波段,在波段選擇完成之后,將波段選擇子集對 應的數據輸入到分類器中。過濾式波段選擇忽略了波段選擇與分類器之間的聯系,選擇的 波段子集不能很好地匹配學習算法,因此在后續分類應用上性能并不好。
[0006]封裝式波段選擇,其步驟與分類器模型完全結合在一起。具體的實現方式是:在每 一步的波段選擇過程中,將待選波段與已選波段組合起來輸入到分類器,使用分類器的分 類精度作為指標,挑選出使分類器性能達到最優的波段,直到達到結束條件為止,所以封裝 式方法所選擇的波段子集的分類性能較過濾式和嵌入式更好。封裝式完全由分類器來指導 波段選擇的過程,與所選分類器關系密切,然而現有的分類器,只利用了高光譜數據的譜信 息,未能將空間信息與譜信息進行有機結合。
[0007]嵌入式波段選擇,其結合了學習算法和波段選擇機制去評價學習過程中被考慮的 波段,學習訓練和波段選擇同時進行,互相結合,構造分類模型的過程就是選擇波段的過 程,重復循環迭代,當分類模型構造結束時,波段選擇的最后結果即為分類模型中包括的波 段。這種嵌入式波段選擇方法由于同時結合了過濾式和封裝式,因此處理過程更為復雜。
【發明內容】
[0008] 本發明的目的在于針對以上現有技術的不足,提出一種基于局部空間信息的封裝 式高光譜波段選擇方法,以提高分類精度。
[0009] 本發明的技術思路是:同時利用高光譜數據的光譜信息和圖像的空間信息,將建 立在能量函數最小化基礎上的graph-cut作為評價波段性能的標準,從而得到性能較好的 波段,達到高光譜數據降維的目的。其實現方案包括如下:
[0010] (1)輸入待波段選擇的高光譜圖像,假設圖像的原始波段數目為P,并將該高光譜 圖像轉換為矩陣形式的高光譜數據;
[0011] (2)對高光譜數據進行歸一化處理,將其光譜值歸一化到0-1之間;
[0012] (3)使用支撐向量機SVM作為分類器,采用交叉驗證的方法從歸一化后的高光譜圖 像中選擇出M個初始波段;
[0013] (4)將已選的M個波段分別與原始波段集合中剩余的未選波段逐一結合成組合波 段,利用支撐向量機得出每個組合波段中的像素樣本的初始標簽集f和像素樣本分別屬于 高光譜圖像某個類別的估計概率P;
[0014] (5)根據每一個像素的類別估計概率p計算出像素本身的光譜能量項,將所有像素 的光譜能量項相加得到光譜項Ed;
[0015] (6)根據波特模型計算出每個像素與其空間上相鄰像素之間的空間能量項,將所 有像素的空間能量項相加得到空間項E s;
[0016] (7)由光譜項Ed和空間項Es相加得到各個組合波段的能量函數E(f);
[0017] (8)利用graph-cut圖切方法對各組合波段的能量函數進行能量最小化,得到各組 合波段的最終標簽集7和能量£'(y);
[0018] (9)對比所有組合波段的能量玢;?),選擇其中五(乃最小的組合波段,該組合波段 中的第M+1個波段即為所需波段。
[0019] 本發明與現有技術相比具有以下優點:
[0020] 1.現有的波段選擇方法大多只利用了高光譜數據的光譜維信息,而忽略了其空間 信息,本發明將高光譜的空間信息加入到評價波段性能的標準中,所選擇出的波段能同時 反映光譜信息與空間信息,表達能力更強。
[0021] 2.本發明將現有波段選擇方法所忽略的空間信息結合到光譜信息中,利用了高光 譜數據的更多信息,所以其分類精度更高。
【附圖說明】
[0022]圖1是本發明的實現流程圖;
[0023] 圖2是在印第安納州高光譜圖像上本發明與已有技術的選擇效果對比曲線圖;
[0024] 圖3是在博茨瓦納高光譜圖像上本發明與已有技術的選擇效果對比曲線圖;
[0025] 圖4是在肯尼迪航天中心高光譜圖像上本發明與已有技術的選擇效果對比曲線 圖。
【具體實施方式】
[0026] 參照附圖1,本發明的實現步驟如下:
[0027] 步驟1、輸入數據。
[0028] 輸入待波段選擇的高光譜圖像,假設圖像的原始波段數目為P,將圖像轉換為矩陣 形式的高光譜數據。
[0029]步驟2、對高光譜數據作歸一化處理。
[0030]為方便后續數據處理,對高光譜數據作歸一化處理,將高光譜圖像的光譜值歸一 化到0-1之間。
[0031] 步驟3、選取標記樣本。
[0032] 從高光譜圖像中選具有類別信息的像素點作為樣本點,再從樣本點中隨機選取百 分之十作為標記樣本,參與后續運算。
[0033]步驟4、基于交叉驗證方法使用支撐向量機SVM在原始波段中進行波段選擇。
[0034] (4a)設已經選擇的波段集合為S,起始時S為空,即S=[];
[0035] (4b)選擇第一個波段
[0036] (4b. 1)使用5折交叉驗證的方法,將已知標記樣本平均分為五等份,交替使用其中 一份作為訓練樣本,其余的四份作為測試樣本,用支撐向量機SVM對標記樣本進行分類,本 例中SVM分類器使用I ibsvm-3.20實現,參數為c = 1024,g = 2_7,其余參數為默認值,得到P個 原始波段的分類準確度;
[0037] (4b. 2)從P個原始波段的分類準確度中選擇分類準確度最高的波段,將該波段記 為si;
[0038] (4b. 3)在原始波段集合中去掉波段S1,將波段81加入已選波段集合S,則已選波段 集合S=[si];
[0039] (4c)選擇第二個波段:
[0040] (4c. 1)使用5折交叉驗證的方法,進行第二個波段的選擇,即將已經被選擇的波段 S1分別與剩余未選波段組合,得到P-I個組合波段,用支撐向量機SVM對標記樣本進行分類, 得到P-I個組合波段的分類準確度;
[0041] (4c. 2)從P-I個組合波段的分類準確度中選擇準確度最高的組合波段,將該組合 波段中的第二個波段記作S2 ;
[0042] (4c. 3)在原始波段集合中去掉波段S2,將波段82加入已選波段集合S,則已選波段 集合S=[S1,S2];
[0043] (4d)選擇第m+1個波段:
[0044] (4d.l)使用5折交叉驗證的方法,即將P-m個剩余原始波段中的任意一個波段記作 b,此時已選波段S=[ S1,S2...Sm],將已選波段S與b組合得到P-m個組合波段,記作Q=[… s m,b],用支撐向量機SVM對標記樣本進行分類,得到P-m個組合波段的分類準確度;
[0045] (4d. 2)從P-m個組合波段的分類準確度中選擇準確度最高的組合波段,將該組合 波段中的波段b記作sm+1;
[0046] (4d.3)在剩余原始波段中去掉波段sm+1,將sm+1加入已選波段集合S,則此時已選波 段集合S - [ SI,S2 · · · Sm,Sm+1 ];
[0047] (4e)重復執行步驟(4d),直至選擇波段達到所需的波段數目,此時已選集合S即為 所需波段,本例中共選擇了 M個波段。
[0048] 步驟5、計算光譜項Ed。
[0049] (5a)選擇P-M個波段中的一個波段記為b,將波段b與已選波段集合S結合為一個組 合波段,記為G=[S b];
[0050] (5b)使用支撐向量機SVM得到組合波段G中樣本點的類別估計概率P(L1Ix 1),其中 ^表示高光譜圖像中的樣本點,1^表示高光譜圖像的類標,計算衡量給樣本^賦以類標1^的 誤差:
[0051] Vi(Li) =_ln(p(Li I Xi))
[0052] 其中,I < i <n,n表示高光譜圖像中樣本點的個數;
[005"π 、'一一…光譜項Ed:
[005
[0055] 步驟6、計算空間項Es。
[0056] (6a)選擇P-M個波段中的一個波段記為b,將波段b與已選波段集合S結合為一個組 合波段,記為G=[S b];
[0057] (6b)使用支撐向量機SVM得到G的樣本點的初始標簽集f,將f表示為[L1, T ? 2 · · · T ? 1T ? j · · · ] I
[0058] (6b)計算空間上兩個樣本Xi和Xj的差異性:
[0059] 1
[0060]
[0061]
[0062]
[0063]
[0064]其中,i~j表示空間上相鄰的一對樣本。
[0065] 步驟7、計算組合波段G的能量函數E(f)。
[0066] E(f)=Ed+Es
[0067] 其中,Ed表示波段集合的光譜項,Es表示波段集合的空間項。
[0068]步驟8、使用graph-cut圖切方法對組合波段進行能量最小化。
[0069] (8a)隨機將初始標簽集f中的部分標簽Li換成標簽α,其中α為高光譜圖像的類標 之一,得到調整后的標簽集f' ;
[0070] (8b)根據調整后的標簽集f',利用argmin尋參函數計算使組合波段G的能量函數 最小的候選標簽集:/ = arg min \其中,E(f ')表示調整后的標簽集f '的能量函數;
[0071] (8c)計算最終標簽集7":
[0072]
[0073] 其中,表示調整后的標簽集/的能量函數;
[0074] (8d)反復迭代步驟(Sa)-(Sc),直到標簽集7不再變化為止,則該標簽集;?對應的 能量函數MY)即為組合波段G的能量值。
[0075]步驟9、進行波段選擇。
[0076]比較所有組合波段的能量函數選擇其中哥:?最小的組合波段G,將G中的波 段b作為已選波段加入波段集合S,同時從未選波段集中去掉該波段;
[0077]重復執行步驟5至步驟8,直至選擇波段達到所需的波段數目,此時已選集合S即為 所需波段。
[0078]以下結合仿真圖對本發明的效果做進一步的說明。
[0079] 1.仿真條件:
[0080] 硬件平臺為:處理器為Inter Core i7-5557U,主頻為3 .IOGHz,內存為4GB;
[0081 ] 軟件平臺為:Windows 10家庭版64位操作系統,MatlabR2015b。
[0082] 2.仿真數據:
[0083]本例中采用的是通過機載可見光及紅外成像光譜儀AVIRIS獲取的印第安納州高 光譜圖像,由NASA EO-I獲取的博茨瓦納高光譜圖像,以及NASA AVIRIS獲取的肯尼迪航天 中心高光譜圖像進行分類算法仿真;將印第安納州高光譜圖像記為Indian pines,將博茨 瓦納高光譜圖像記為Botswana,將肯尼迪航天中心高光譜圖像記為KSC。
[0084] 三幅圖像的高光譜數據以及對應的ground truth圖來自于:
[0085] //www.ehu.es/ccwintco/index.php?titIe = Hyperspectral_Remote_ Sensing_Sce nes.
[0086] 3.仿真內容:
[0087] 為了驗證波段選擇的有效性,一般在進行波段選擇以后,會以ground truth圖中 的類別作為標簽,進行高光譜圖像分類實驗,以分類準確度作為波段選擇性能的判斷標準。
[0088] (3.1)仿真一:
[0089] 實驗選擇現有四個具有代表性的波段選擇方法與本發明進行比較,這四種方法分 別是基于相似度的無監督高光譜波段選擇方法SBBS、基于交叉驗證精度的支撐向量機波段 選擇方法SVMCV、代表分量分析法ECA、最大相關最小冗余法MRMR;
[0090] 用本發明與現有四種波段選擇方法對Indian pines圖像作波段選擇,共選取100 個波段,對高光譜圖像的所有樣本提取所選波段組成新的樣本集合X,根據新的樣本集合對 高光譜數據進行分類,從X中隨機選擇10%的樣本作為訓練樣本,剩余樣本作為測試樣本, 使用支撐向量機SVM分類器做分類實驗,分別得到五種方法的分類準確度;本實驗中SVM分 類器使用libsvm-3.20實現,SVM采用徑向基函數核,參數為c = 1024,g = 2-7,其余參數為默 認值;結果如附圖2;
[0091] 附圖2中呈現了五種方法分別挑選出10至100個波段后用于分類得到的準確度。從 圖2中可以看出,本發明的效果優于現有四種方法,尤其是本發明挑選出20個波段所取得的 效果就已經優于現有四種方法獲取50個波段時候的性能,說明本發明的波段選擇性能更優 秀。
[0092] (3.2)仿真二:
[0093]用本發明與上述現有四種波段選擇方法對Botswana圖像作波段選擇,共選取50個 波段,對高光譜圖像的所有樣本提取所選波段組成新的樣本集合Y,根據新的樣本集合對高 光譜數據進行分類,從Y中隨機選擇10 %的樣本作為訓練樣本,剩余樣本作為測試樣本,使 用支撐向量機SVM分類器做分類實驗,分別得到五種方法的分類準確度;本實驗中SVM分類 器使用Iibsvm-3.20實現,SVM采用徑向基函數核,參數為c = 1024,g = 2-7,其余參數為默認 值;結果如附圖3;
[0094] 附圖3中呈現了五種方法分別挑選出5至50個波段后用于分類得到的準確度。從圖 3中可以看出,本發明的效果優于現有四種方法,尤其是本發明挑選出15個波段所取得的效 果就已經優于現有四種方法獲取50個波段時候的性能,說明本發明的波段選擇性能更優 秀。
[0095] (3.3)仿真三:
[0096] 用本發明與上述現有四種波段選擇方法對KSC圖像作波段選擇,共選取100個波 段,對高光譜圖像的所有樣本提取所選波段組成新的樣本集合Z,根據新的樣本集合對高光 譜數據進行分類,從Z中隨機選擇10%的樣本作為訓練樣本,剩余樣本作為測試樣本,使用 支撐向量機SVM分類器做分類實驗,分別得到五種方法的分類準確度;本實驗中SVM分類器 使用I ibsvm-3.20實現,SVM采用徑向基函數核,參數為c = 1024,g = 2_7,其余參數為默認值; 結果如附圖4;
[0097] 附圖4中呈現了五種方法分別挑選出10至100個波段后用于分類得到的準確度。從 圖4中可以看出,本發明的效果優于現有四種方法,尤其是本發明挑選出20個波段所取得的 效果就已經優于現有四種方法獲取100個波段時候的性能,說明本發明的波段選擇性能更 優秀。
[0098] 綜上,本發明的效果明顯優于其它幾種方法,在不同波段數目的情況下,相對其他 方法性能都有了明顯提升,表明本發明是十分有效的。
【主權項】
1. 一種基于局部空間信息的封裝式高光譜波段選擇方法,包括: (1) 輸入待波段選擇的高光譜圖像,假設圖像的原始波段數目為P,并將該高光譜圖像 轉換為矩陣形式的高光譜數據; (2) 對高光譜數據進行歸一化處理,將其光譜值歸一化到0-1之間; (3) 使用支撐向量機SVM作為分類器,采用交叉驗證的方法從歸一化后的高光譜圖像中 選擇出Μ個初始波段; (4) 將已選的Μ個波段分別與原始波段集合中剩余的未選波段逐一結合成組合波段,利 用支撐向量機得出每個組合波段中的像素樣本的初始標簽集f和像素樣本分別屬于高光譜 圖像某個類別的估計概率P; (5) 根據每一個像素的類別估計概率P計算出像素本身的光譜能量項,將所有像素的光 譜能量項相加得到光譜項Ed; (6) 根據波特模型計算出每個像素與其空間上相鄰像素之間的空間能量項,將所有像 素的空間能量項相加得到空間項Es; (7) 由光譜項Ed和空間項Es相加得到各個組合波段的能量函數E(f); (8) 利用graph-cut圖切方法對各組合波段的能量函數進行能量最小化,得到各組合波 段的最終標簽集/和能量巧7); (9) 對比所有組合波段的能量巧.不),選擇其中巧y)最小的組合波段,該組合波段中的第 M+1個波段即為所需波段。2. 根據權利要求1中所述的基于局部空間信息的封裝式高光譜波段選擇方法,其特征 在于,步驟(3)中使用支撐向量機SVM進行波段選擇,按如下步驟進行: (3a)選擇高光譜圖像中具有類別信息的像素點作為樣本點,并在樣本點中隨機選取 10 %作為標記樣本; (3b)設已經選擇的波段集合為S,起始時S為空,即S=[]; (3c)使用5折交叉驗證的方法,進行第一個波段的選擇,即將已知標記樣本平均分為五 等份,交替使用其中一份作為訓練樣本,其余的四份作為測試樣本,用支撐向量機SVM對標 記樣本進行分類,得到P個原始波段的分類準確度,選擇其中準確度最高的波段,將該波段 記為S1,并在原始波段集合中去掉波段S1,將波段S1加入已選波段集合S,則已選波段集合S =[S1]; (3d)使用5折交叉驗證的方法,進行第二個波段的選擇,即將已經被選擇的波段S1分別 與剩余未選波段組合,得到P-1個組合波段;用支撐向量機SVM對標記樣本進行分類,得到P- 1個組合波段的分類準確度,選擇其中準確度最高的組合波段中的未選波段,將該波段記作 S2,并在原始波段集合中去掉波段S2,將S2加入已選波段集合S,則已選波段集合S=[S1,S2]; (3e)使用5折交叉驗證的方法,進行第m+1個波段的選擇,即將P-m個剩余原始波段中的 任意一個波段記作b,此時已選波段S= ,S2. . . Sm],將已選波段S與b組合得到p-m個組合 波段,記作Q=[S1. . .Sm,b],用支撐向量機SVM對標記樣本進行分類,得到P-m個組合波段的 分類準確度,選擇其中準確度最高的組合波段中的未選波段,將該未選波段記作Sm+l,并在 剩余原始波段中去除掉該波段,將Sm+1加入已選波段集合S,則此時已選波段集合S=[S1, S2 . . . S皿 J S皿+1 ]; (3f)重復執行步驟(3e),選擇波段直至達到所需的波段數目,此時已選集合S即為所需 波段。3. 根據權利要求1中所述的基于局部信息的封裝式高光譜波段選擇方法,其特征在于, 步驟(5)中計算光譜項Ed,按如下步驟進行: (5a)選擇未選波段中的一個波段記為b,將波段b與已選波段集合S結合為一個組合波 段,記為G=[S b]; (5b)使用支撐向量機SVM得到G中樣本點的類別估計概率p ai I xi),其中xi表示高光譜 圖像中的樣本點,L康示高光譜圖像的類標,計算衡量給樣本xi賦W類標k的誤差: Vi(Xi) = -ln(p(Xi|xi)) 其中,1 < i <n,n表示高光譜圖像中樣本點的個數; 巧C)計算組合波段G的光譜項Ed:4. 根據權利要求1中所述的基于局部信息的封裝式高光譜波段選擇方法,其特征在于, 步驟(6)中計算空間項Es,按如下步驟進行: (6a)選擇未選波段中的一個波段記為b,將波段b與已選波段集合S結合為一個組合波 段,記為G = [S b]; (6b)使用支撐向量機SVM得到G的樣本點的初始標簽集f,將f表示為[Li, L/2 · · · LiLj] S (6b)計算空間上兩個樣本義1和^的差異性: Wi.jai,Lj)=iKi-sai,Lj))其中,β是控制空間平滑性重要程度的參數,取值為β=1; (6c)計算組合波段G的空間項Es:其中,i~j表示空間上相鄰的一對樣本。5. 根據權利要求1中所述的基于局部信息的封裝式高光譜波段選擇方法,其特征在于, 步驟(8)中使用graph-cut圖切方法對組合波段進行能量最小化,按如下步驟進行: (8a)隨機將初始標簽集f中的部分標簽以換成標簽α,其中α為高光譜圖像的類標之一, 得到調整后的標簽集f'; (8b)根據調整后的標簽集f',利用argmin尋參函數計算使組合波段G的能量函數最小 的候選標簽集/./ = argmin£(/')其中,E(f')表示調整后的標簽集f'的能量函數; (8c)計算最終標簽集7;其中,表示調整后的標簽集/的能量函數; (8d)反復迭代步驟(8a)-(8c),直到標簽集7不再變化為止,則該標簽集7對應的能量 函數幻'y')即為組合波段G的能量值。
【文檔編號】G06K9/00GK105844297SQ201610164988
【公開日】2016年8月10日
【申請日】2016年3月22日
【發明人】曹向海, 梁甜, 李澤瀚, 李星華, 焦李成
【申請人】西安電子科技大學