一種基于深度費舍爾網絡的車型識別方法
【技術領域】
[0001] 本發明屬于模式分類技術領域,特別涉及一種基于深度費舍爾網絡的車型識別方 法。
[0002] 發明背景
[0003] 交通信息采集是構建智能交通系統動態交通信息平臺的基礎,而車型是交通信息 的重要組成部分。路橋、停車場收費系統、路橋管理和監控系統等都需要進行車型識別。在 智能交通管理系統中,車型識別系統能夠自動、實時地檢測經過車輛并識別汽車的車型、車 牌、車標的交通管理系統,可以被廣泛應用于道路通行車輛信息記錄、高速公路自動收費、 電子警察監控、停車場安全管理、肇事、嫌疑、被盜車輛的追蹤、定位等。
[0004] 在車型識別中應用較多的方法有:(1)基于感應線圈的車型識別,該方法僅能對 車型進行粗粒度的分類,且對車輛的速度較為敏感,當車輛的速度突然改變時,會造成誤 判;(2)基于波頻感應的車型識別,該技術發展的較為成熟,但也僅能進行粗粒度分類,且 受外界環境的影響較大,需事先斷定車輛的行駛速度才能準確計算車輛的外形;(3)基于 圖像的車型識別,通過對攝像機采集的車輛圖像進行分析獲得車輛的類型信息,與其他方 法相比,該技術一方面可以從圖像中獲得更加豐富的車輛信息,另一方面又可以直接利用 現有的城市卡口系統提供的圖像數據,建設和使用成本低。
[0005] 基于圖像的車型識別涉及圖像處理、模式識別、計算機視覺等相關技術領域,目前 國內外對于該技術的研究可以分為三個方向:(1)基于牌照的車型識別,該方法僅從圖像 中識別出牌照信息,并沒有直接分析獲得車輛的類型,分類粒度粗,且對于套牌車輛更是無 法辨別;(2)基于車標的車型識別,在實際應用中,由于車標過小、光線、遮擋等客觀因素的 存在,無法達到理想的效果;(3)基于外觀特征的車型識別,該技術相比前兩種方法具有較 好的魯棒性,識別的類型也更加的細化,可以精確到車輛的品牌、系列、型號、年款等。
[0006] 目前在車型識別中應用較多的方法是模糊神經網絡和BP網絡等方法,神經網絡 是一種模擬動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。但這些方 法難以解決模式識別中存在的復雜性和推廣性的矛盾,神經網絡雖然有強大的建模能力, 但對大規模圖像進行分類,其巨大的參數空間使尋找優良的優化初始值較為困難。
[0007] 在圖像分類領域,對數量龐大的圖像分類主要有兩種方法:一種為提取每張照片 的局部特征,將提取的特征進行聚類和編碼得到一個高維向量,然后將其用分類器分類。其 中編碼的方法有視覺詞袋模型編碼,稀疏編碼和費舍爾向量編碼等,而費舍爾向量編碼的 性能較其他幾種編碼方式要好。另一種應用很廣的圖像分類方法是深度神經網絡,深度學 習是神經網絡研究中的一個新的熱點,其目的在于通過非監督的預訓練為神經網絡提供優 良的參數初始值,通過貪婪的方式,一層一層的訓練,對大規模圖像分類取得非常好的效 果。
[0008] 在此基礎之上,本專利結合費舍爾向量編碼和深度網絡結構的優點,提出一種基 于深度費舍爾網絡的車型識別方法來解決上述問題。本專利能夠實現大規模車輛圖像的車 型識別,且識別準確率較高,具有較高的適用性和魯棒性。
【發明內容】
[0009] 本發明中所述方法是為了克服上述現有技術的缺點,主要針對已經提取的車輛特 征對車型進行細分識別的問題,提出了一種基于深度費舍爾網絡算法的車型識別方法。具 體的技術方案如下所述。
[0010] 一種基于深度費舍爾網絡的車型識別方法,包括以下步驟:
[0011] 步驟1 :對車型數據庫的圖像進行SIFT特征提取,作為費舍爾網絡的第0層;
[0012] 步驟2 :構建費舍爾網絡的第1層,將提取到的SIFT特征進行費舍爾向量編碼,將 編碼后的向量在空間進行堆疊,進行L2歸一化和PCA降維;
[0013] 步驟3 :將第1層得到的特征向量表示進行費舍爾向量編碼,通過符號平方根和L2 歸一化處理,形成費舍爾網絡的第2層;
[0014] 步驟4:將費舍爾網絡第2層得到的輸出特征表示進行onevsrest線性支持向 量機訓練,得到一個具有K種車型類別的車型識別系統;
[0015] 步驟5 :對待識別車型的車輛圖像,通過費舍爾網絡得到測試特征向量;
[0016] 步驟6:將得到的測試特征向量導入車型識別系統進行識別,識別出測試車輛車 型。
[0017] 上述技術方案中,所述步驟1對車型數據庫的圖像進行SIFT特征提取包括以下步 驟:
[0018] 步驟1. 1 :尺度空間極值檢測:針對構建的高斯金字塔圖像,利用差分函數在所有 尺度上檢測候選極值點。
[0019] 步驟1. 2 :關鍵點定位:通過函數擬合來定位極值點的準確位置和尺度,同時過濾 掉候選極值點集合中的邊緣點。
[0020] 步驟1. 3 :方向確定:結合關鍵點鄰域像素的梯度信息,給每個關鍵點賦予一個主 方向。
[0021] 步驟1. 4 :特征描述子生成:對關鍵點鄰域像素的梯度幅值和方向進行統計,得到 關鍵點的特征描述。
[0022] 上述技術方案中,所述步驟2中構建費舍爾網絡的第1層,將提取到的SIFT特征 進行費舍爾向量編碼,將編碼后的向量在空間進行堆疊,進行L2歸一化和PCA降維,包括以 下幾個步驟:
[0023] 步驟2. 1 :對步驟1中獲取的SIFT特征,進行費舍爾向量編碼;
[0024] 步驟2. 2 :對步驟2. 1中編碼后的向量在空間進行堆疊;
[0025] 步驟2. 3 :將步驟2. 2中堆疊后的向量進行L2歸一化和PCA降維,得到的向量作 為費舍爾網絡的第2層的輸入。
[0026] 上述技術方案中,所述步驟2中構建費舍爾網絡第1層的具體過程是:費舍爾網 絡第1層分成3個子層,第1個子層為從上層接收到山維,d10 2的特征,進行費舍爾向 量編碼,費舍爾向量編碼使用I個高斯混合模型組成,編碼后的每個費舍爾向量的維數為 2KA,使用判別式訓練的線性映射%e 將其降到匕維,其中R為實數域,W為實數域 上的hX2KA維的映射矩陣,形成第1個子層;在第2個子層中,對上個子層得到的結果進 行以步長為h個像素的疊加抽取,形成大小為qiXqi的半局部區域,空間中相鄰的半局部 區域特征被堆疊在一個2X2的窗口,最終形成了一個4b維的密集特征表示;最后,在第3 個子層中,將這些特征進行L2歸一化和PCA降維至d1+1維,作為費舍爾網絡下一層的輸入 特征表示。
[0027] 上述技術方案中,所述步驟4中的onevsrest線性支持向量機訓練的具體過程 是:在原始訓練時有K種車型類別需要劃分,在抽取訓練集時,分別抽取每一個單獨類作為 訓練集的正樣本集,余下所有樣本作為負樣本集,通過訓練得到K個二分類的線性支持向 量機分類器,測試時,將對應的測試向量分別用這K個訓練結果文件進行測試,每一個測試 都有一個評分(Si,…,SK),最終的識別結果就是得分值最高的那個類別,也即將待識別車型 分類為具有最大分類函數值的那一類。
[0028] 本專利基于費舍爾向量構建深度網絡來建立模型,并將該模型運用到車型識別當 中。
[0029] 因為本發明采用上述技術方案,因此具備以下有益效果:
[0030] 本發明的目的在于公開一種基于費舍爾向量和深度網絡的車型識別方法,費舍爾 向量編碼能夠降低車輛圖像的特征向量的維數,可以加快識別速度,減少內存消耗,而使用 深度網絡結構,可以更全面地提取車輛圖像的特征,大大提高識別率。
【附圖說明】
[0031] 圖1為費舍爾向量構建深度網絡算法的示意圖;
[0032] 圖2為費舍爾網絡示意圖;
[0033] 圖3為構建費舍爾網絡第一層示意圖;
[0034] 圖4為空間堆疊示意圖。
【具體實施方式】
[0035] 為詳細說明本發明的技術內容、構造特征、所實現目的及效果,以下結合實施方式 并配合附圖詳予說明。
[0036] 本專利提出了一種基于深度費舍爾網絡的車型識別方法,在車輛車型識別上取得 良好的效果。整個算法實現示意圖如圖1所示,包括步驟:
[0037] 步驟1 :對車型數據庫的圖像進行SIFT特征提取,作為費舍爾網絡的第0層,示意 圖如圖2(0)所示;
[0038] SIFT是DavidLowe提出的局部特征描述子,得到了快速發展和廣泛應用。由于 SIFT特征點是在尺度空間通過極值檢測提取出來的,所以具有平移尺度不變性;同時給每 個特征點賦予了一個主方向,所以在一定范圍內保持旋轉不變性;另外最后對提取的特征 向量進行了歸一化處理,所以也具有良好的光照不變性。提取SIFT特征描述子可以由以下 步驟完成:
[0039] 步驟1. 1 :尺度空間極值檢測:針對構建的高斯金字塔圖像,利用差分函數在所有 尺度上檢測候選極值點。
[0040] 步驟1. 2 :關鍵點定位:通過函數擬合來定位極值點的準確位置和尺度,同時過濾 掉候選極值點集合中的邊緣點。
[0041] 步驟1. 3 :方向確定:結合關鍵點鄰域像素的梯度信息,給每個關鍵點賦予一個主 方向。
[0042] 步驟1. 4 :特征描述子生