基于src-dp與lda相結合的圖像特征提取方法
【技術領域】
[0001] 本發明屬于圖像處理技術領域,特別涉及圖像識別中的特征提取方法,可用于警 務系統中人物身份的判別或者影像拍攝等領域中物體的查找。
【背景技術】
[0002] 圖像識別是機器學習、模式識別和計算機視覺領域既熱門又具有挑戰性的研宄方 向之一。圖像識別技術因具有簡單、高效、安全、低成本等優勢現在已經廣泛應用在智能交 通、公安、生物醫學、電子商務、遙感技術、軍事和多媒體網絡通信等領域。圖像往往會受到 視角、光照、遮擋等成像因素的影響,這給圖像的分類帶來了很大的挑戰。圖像識別屬于高 維空間下的模式識別問題。因此在對圖像進行識別時其首先要對圖像進行特征提取,然后 在低維的子空間進行分類判別。到目前為止,各種特征提取的方法在圖像識別領域得到了 廣泛的應用。
[0003] 2009年,Wright等人提出一種基于信號稀疏表示的分類方法SRC,成功地將壓縮 感知理論應用到圖像識別中。該方法基于采樣稀疏信號表示理論,將圖像識別看作多個線 性回歸模型的分類問題,測試樣本可以用訓練樣本庫中同類樣本的線性組合來表示。因此 從整個樣本集的角度來看,線性加權的系數自然是稀疏的,于是就可將稀疏重構問題轉化 為L1范數優化問題。2010年,喬立山等人提出了稀疏保持投影SPP,它是在流形稀疏表示 的框架下,構建數據集的緊鄰權重矩陣。最近,楊健等人基于SRC理論提出了基于判別投影 的稀疏表示分類器方法SRC-DP,該方法主要基于殘差準則進行類別重建,從而實現特征提 取的目的。但是該SRC-DP方法存在有以下兩方面的缺陷:
[0004] 一是由于僅僅考慮了數據的局部重構問題,忽略了數據的全局判別信息,從而使 得整體分類結果不理想。
[0005] 二是由于僅考慮重構殘差,不能更好地描述判別結構,特別是在類別數較大的情 況下,SRC-DP方法不能進行有效的識別。
[0006] 線性判別分析LDA主要考慮樣本整體判別信息,其基本思想是:通過尋找一個投 影方向,即線性變換,線性組合,將高維空間的原始樣本降到低維空間來解決,并且要求降 維后的數據具有如下性質:同類樣本盡可能聚集在一起,不同類的樣本盡可能地遠。例如對 于C分類問題,它能找到個C-1投影方向,從而把維數壓縮到C-1,因此,該方法雖然具有突 出的數據壓縮能力,能夠有效的降低后續處理的數據量,能有效地融合訓練樣本的類別信 息,但是用這種方法在進行圖像識別時,由于只考慮樣本的整體判別信息,而沒有從重構的 角度對樣本進行分析,從而導致分類的結果也不理想。
【發明內容】
[0007] 本發明的目的在于克服上述已有技術的不足,提出一種基于SRC-DP與LDA相結合 的特征提取方法SRC-FDC,以在圖像類別數較多的情況下,提高圖像的識別率。
[0008] 本發明的技術關鍵是:在考慮對數據重構問題的同時,加上了對數據整體判別結 構的分析,其實現步驟包括如下:
[0009] (1)將所選圖像庫中的每一幅圖片轉化為向量進行存儲,并分別抽取圖像庫中每 類圖像的一部分構成訓練樣本集乂 = |>丨,...乂1,...乂,...乂,]£尺1;><'其中1?表示實數域,(1表 示原始空間中訓練樣本的維度,C表示訓練樣本的類別數,Ni表示第i類的訓練樣本數, 表示所有訓練樣本的總數;
[0010] (2)利用線性判別分析方法LDA分別計算原始訓練樣本的類間離散度矩陣Sb和類 內離散度矩陣Sw;
[0011] ⑶給定權重系數e,用來調節判別結構與重構結構的比例關系,e取值范圍為 [0, 1],設定最大迭代步數m,最大迭代步數m由收斂效果決定,為了求解投影到低維空間中 訓練樣本的稀疏系數,初始化投影矩陣P = PiE Rdxp,其中p為低維空間中訓練樣本的維 度,p << d,假設當前迭代次數k = 1 ;
[0012] (4)將訓練樣本集X中的每一個訓練樣本投影到p維空間上,即K ,i = 1,. . .,C,j = 1. . .,Ni,X)表示原始空間中第i類的第j個訓練樣本,匕表示p維空間中第 i類的第j個訓練樣本;
[0013] (5)通過計算下式求解%對應的稀疏表示系數向量<?,且保證所求的4的li范數 最小:
[0014]
【主權項】
1. 一種基于SRC-DP與LDA相結合的圖像特征提取方法,包括如下步驟: (1) 將所選圖像庫中的每一幅圖片轉化為向量進行存儲,并分別抽取圖像庫中每類 圖像的一部分構成訓練樣本集1 =[虼...,1^,....,<...^^]£#><'其中1?表示實數域,(1表 示原始空間中訓練樣本的維度,C表示訓練樣本的類別數,Ni表示第i類的訓練樣本數,, W= 表示所有訓練樣本的總數; (2) 利用線性判別分析方法LDA分別計算原始訓練樣本的類間離散度矩陣Sb和類內離 散度矩陣Sw; (3) 給定權重系數0,用來調節判別結構與重構結構的比例關系,0取值范圍為 [〇, 1],設定最大迭代步數m,最大迭代步數m由收斂效果決定,為了求解投影到低維空間中 訓練樣本的稀疏系數,初始化投影矩陣P=P1ERdxp,其中p為低維空間中訓練樣本的維 度,p<<d,假設當前迭代次數k= 1 ; (4) 將訓練樣本集X中的每一個訓練樣本投影到p維空間上,即y', = ,i= 1,. . .,C,j=I. . .,Ni,X;表示原始空間中第i類的第j個訓練樣本,y;表示p維空間中第i類的第j個訓練樣本; (5) 通過計算下式求解為對應的稀疏表示系數向量<,且保證所求的<的I1范數最 小:
(6) 由第(5)步中求解所得的訓練樣本的稀疏表示向量s),并利用基于判別投影的稀 疏表示分類器方法SRC-DP分別計算原始訓練樣本的類間重構離散度矩陣Eb和類內重構離 散度矩陣Ew; (7) 根據⑵和(7)計算出的離散度矩陣^^^匕^^^構建如下廣義特征方程 (Eb+ 0Sb)aj=Aj(Ew+ 0Sw)aji=I, ,P; (8) 求解(7)中廣義特征方程中A,對應的特征向量ap且滿足 入 > …彡入i…彡入p,得到入i對應特征向量ai的投影矩陣P= [a…ai,…ap]; (9) 令k=k+1,當k<m時,返回步驟(4),直至k>m時,輸出最終的投景多矩陣P'。
2. 根據權利要求1所述的方法,其中步驟⑵所述的利用線性判別分析方法LDA分別 計算原始訓練樣本的類間離散度矩陣Sb和類內離散度矩陣Sw,通過如下公式計算:
其中Hii是第i類訓練樣本的均值,m是所有訓練樣本的均值,T表示對矩陣進行轉置。
3. 根據權利要求1所述的方法,其中步驟(6)所述的利用基于判別投影的稀疏表示分 類器方法SRC-DP分別計算原始訓練樣本的類間重構離散度矩陣Eb和類內重構離散度矩陣 Ew,通過如下公式計算:
其中,表示不同類之間的重構系數向量,該向量中只保留第k類相關的值,其他 的置0,第k類對樣本Xij的重構表示為:X4(<.),k= 1,2,. . .,C且k乒i; 4(<)表示同 類間的重構系數向量,該向量中只保留第i類相關的值,其他的置0,第i類對樣本&.的重 構表亦為(s:_)。
【專利摘要】本發明公開了一種基于SRC-DP與LDA相結合的圖像特征提取方法,主要解決現有特征提取方法因為僅考慮重構關系或判別關系,導致無法更加準確描述樣本信息從而使得圖片分類結果不理想的問題。其實現步驟是:1.輸入訓練樣本,計算樣本的類內、類間離散度矩陣,初始化投影矩陣,2.對訓練樣本進行投影,并依次求解投影樣本的稀疏表示系數;3.分別計算投影樣本的類內、類間重構離散度矩陣;4.構造目標函數求解新的投影矩陣;5.對步驟2-4進行迭代,直至循環次數大于給定初始值,輸出最終投影矩陣。本發明增強了圖像分類的準確性,提高了分類識別率,可用于警務系統中人物身份的判別或影像拍攝中物體的查找。
【IPC分類】G06K9-46, G06K9-66
【公開號】CN104715266
【申請號】CN201510109065
【發明人】劉陽, 高全學, 王勇, 王前前
【申請人】西安電子科技大學
【公開日】2015年6月17日
【申請日】2015年3月12日