一種自適應特征權重合成的lidar數據地物精確分類方法
【技術領域】
[0001 ]本發明屬于遙感數據地物分類領域,具體為一種自適應特征權重合成的LIDAR數 據地物精確分類方法。
【背景技術】
[0002] 利用機載LIDAR系統獲得的遙感數據實現地物的精確分類能夠應用數字城市建 設、城區管理、自然災害調查等領域,具有廣闊的應用前景。LIDAR系統可以快速、主動地獲 取大范圍地物密集采樣點的三維信息,通過處理分析點云高度,強度及波形等信息,能夠得 到高精度數字高程模型。同時,光譜相機獲取的相同場景的多光譜圖像具備豐富的光譜和 紋理信息,彌補了傳統攝影測量技術獲取地物信息單一的缺陷。與被動遙感技術相比,基于 LIDAR的地物分類很大程度上排除了大氣分子和氣溶膠的影響,三維點云和多光譜圖像數 據從不同的側面表達了地物豐富的信息,將兩者包含的地物特征信息融合進行地物分類, 增強了對地物目標的識別和解譯能力,明顯提高單一數據源遙感地物分類的精度,為行業 具體應用決策提供更真實可靠的基礎信息,如城市違建處置過程的證據快速、可靠獲取等。
[0003] 基于機載LIDAR系統的地物分類通常包括樣本采集、特征提取與選擇、模型選擇、 分類器訓練與結果評估等過程。其中特征提取與選擇是關鍵一環,與分類器有著緊密的聯 系。目前,一般是將描述地物高程的三維LIDAR點云與表面材質的強度信息轉化為圖像,結 合光譜信息利用監督學習算法完成LIDAR地物分類。常用的分類算法主要包括人工神經網 絡(ANN)、支持向量機(SVM)、最大似然(ML)、決策樹(DT)與隨機森林(RF)等。Li Guo等利用 隨機森林初步討論了特征重要性,用對分類結果影響較大的特征替代原有的特征參與分 類,一定程度上提升了算法的運行效率,但簡單替代特征的做法否認了某些特征對分類的 貢獻,損失了部分地物信息。吳軍等利用SVM估計單個特征對分類精度影響程度并計算不同 特征的權重,然后組合差異特征進行SVM訓練和分類,但僅考慮了不同特征在分類中的重要 性差異,沒有考慮不同特征分類結果的沖突所包含的信息。以上的兩個研究代表了機載 LIDAR系統數據地物分類的重要研究內容,但其分類結果的精度有待進一步提高。在實際工 程中,不同類型特征不僅對分類精度影響程度不同,而且不可避免地存在沖突。由于某個或 少數證據間的完全沖突或嚴重沖突,而傳統證據合成規則一般不考慮沖突證據的信息,可 能導致推理結果出現較嚴重悖論,從而影響分類精度。實際上即使證據之間存在著沖突,其 包含的信息也是部分可用的。在不改變規則的前提下修改證據源模型方面的研究中, Murphy提出了一種處理沖突的方法,但是其沒有考慮到各個證據間的相關性,只是簡單的 平均,對提高分類精度具有一定的局限。
【發明內容】
[0004] 本發明綜合研究機載LIDAR系統數據不同類型特征在遙感地物分類中的重要性差 異與證據合成中的沖突證據信息,提出了一種自適應特征權重合成的LIDAR數據地物精確 分類方法。首先對實驗圖像進行充分特征信息提取,根據特征的物理意義與包含地物信息 的差異,構建高程、光譜、強度與紋理特征子集;其次在隨機森林框架下分析不同特征子集 在地物分類過程中的重要性差異,計算各特征子集的重要性測度,獲得每個像元對各類地 物的類別隸屬度;然后綜合利用特征子集重要性測度與基于證據沖突計算的權重系數,對 各個特征子集構成的多證據源合成;最后根據合成結果采用投票決策規則實現地物精確分 類,并采用有效的空間限制策略優化初分類結果。
[0005] 本發明一種自適應特征權重合成的LIDAR數據地物精確分類方法包括以下具體步 驟:
[0006] S1:獲得LIDAR系統的點云數據和光譜相機拍攝的多光譜數據,并進行中值濾波預 處理;
[0007] S2:提取LIDAR系統數據特征,根據物理意義和地物信息區別構建高程特征子集 Ti、光譜特征子集T 2、強度特征子集T3和紋理特征子集T4;
[0008] S3:隨機選擇樣本進行訓練,基于隨機森林框架計算各個特征子集的重要性測度 Fj,計算各像元對各類地物的類別隸屬度mj (Αι);
[0009] S4:基于特征重要性測度與證據沖突權重的隨機森林自適應權重合成方法實現特 征子集證據合成;
[0010] S5:根據證據合成結果,采用最大投票決策規則決策,確定各像元的類別屬性,獲 得初分類結果;
[0011] S6:對初分類結果中易被錯分或漏分的混淆像元(包括樹冠中心與墻面點)采用空 間鄰域限制策略實現分類結果的優化;
[0012] S7:輸出分類結果及分類性能指標。
[0013] 其中步驟S3所述的基于隨機森林框架計算各個特征子集的重要性測度匕,計算各 像元對各類地物的類別隸屬度叫(M ),主要包括以下步驟:
[0014] S32:計算各個特征子集的重要性測度,
[0015] 6 = 1/(/) Π)
[0016]其中Tj表示j特征子集,j = l,2,. . .,Μ,本例中Μ=4;
[0017] S33:根據各個特征子集計算各個像元對各個地物類別的隸屬程度
[0018]⑷
/
[0019] 其中Μ為將某像元判定為1類的焦元,ntrew為特征子集j隨機森林的決策樹數目, treeij為根據特征子集j像元屬于1類的決策樹數目。
[0020] 步驟S4所述的基于特征重要性測度與證據沖突權重的隨機森林自適應權重合成 方法實現特征子集證據合成,按以下步驟進行:
[0021] S43:計算證據Ei的沖突權重系數
[0022]
[0023] S44:根據^和特征子集重要性測度構造總權重系數并進行歸一化
[0024] 。
[0025] 本發明與現有技術相比具有以下優點:
[0026] 1、本發明提取LIDAR系統數據的特征構建四個特征子集,隨機選擇樣本構建隨機 森林框架,獲得了各個特征子集的重要性測度,減少了隨機森林根據單個特征重要性程度 簡單替代的特征信息損失,充分利用了不同類型的地物信息,同時也作為后續證據合成的 多個證據源。
[0027] 2、本發明在進行證據合成時,根據證據間的沖突程度適時調整描述證據的權重系 數,綜合研究特征重要測度與基于沖突信息的證據權重兩個不同層面自適應計算不同證據 的權重系數,能夠在某特征重要測度較高但分類結果與其它特征存在較大沖突的情況下, 全面地利用不同類型的特征子集以及沖突證據包含的地物信息,反之亦然,提高了機載 LIDAR數據地物的分類精度。
【附圖說明】
[0028]圖1為本發明的流程圖;
[0029] 圖2為實驗特征圖像,(a)強度;(b)高度差;(c)近紅外波段;(d)偽彩色圖;
[0030] 圖3為不同特征集實現的分類結果,(a)高程特征子集;(b)光譜特征子集;(c)強度 特征子集;(d)紋理特征子集;
[0031] 圖4為證據合成前后分類結果,(a)全特征集隨機森林;(b)本發明合成方法;
[0032] 圖5為初分類結果優化后分類結果(a)優化后;(b)地面真值。
【具體實施方式】
[0033]本發明實驗數據由TopoSys公司采用光纖掃描方式的Falcon Π傳感器采集,航高 約600m,平均激光腳點密度和點間距分別為4點/m2和0.5m,被配準為0.5m空間分辨率。光譜 數據包括藍、綠、紅和近紅外等四個波段,高程數據包括首末次回波高程。被測區域具有典 型的城市地貌,真實數據由人工獲取,作為地面真值。具體實施步驟如下:
[0034]如圖1所示,S1:獲得LIDAR系統的點云數據和光譜相機拍攝的多光譜數據,并進行 中值濾波預處理;
[0035] S2:提取LIDAR系統數據特征,根據物理意義和地物信息區別構建高程特征子集 Ti、光譜特征子集T2、強度特征子集T3和紋理特征子集T4,具體步驟如下:
[0036] S21:提取高程特征子集h,包括3種特征,分別為LIDAR首次回波、末次回波與高程 差。首次歸一化數字表面模型(nDSMk)反映去除地形影響的地物絕對高度,由DSM與DEM衍生 而來,數字表面模型(DSM)表達了地表所有地物(如植被、建筑物)的高度信息,數字高程模 型(DEM)只包含地球自然表面的高程值(即裸地數字高程模型),高程差(HD)用于區分激光 可穿透地物與不可穿透地物,由首次回波nDSMf e與末次回波nDSMie相差來實現。
[0037] S22:提取光譜特征子集T2,包括6種特征,分別為多光譜圖像的紅、綠、藍、近紅外4 個波段灰度值口^口^^^口~^以及通過波段間的運算生成的衍生光譜特征歸一化植被指數 (NDVI)和修正型土壤調節植被指數(MSAVI)。
[0038] S23:提取激光回波強度特征子集Τ3,包含1種特征一激光回波強度(IN)描述地物 材質以及地物表面不規則程度,當激光落在不同的物體表面時,其反射的強度值會有很大 的差別,其受多種因素的影響,包括物體表面材料的性質,回波數、激光發射點到入射點的 距離以及入射角等。
[0039] S24:提取紋理特征子集T4,包括6種特征,分別為3種高程紋理與3種光譜紋理特 征,高程紋理特征基于高程信息獲取其灰度共生矩陣(GLCM)局部紋理測度角二階矩 (ASM1)、熵(ΕΝΤ1)與慣性矩(Η1),