目標檢測方法及裝置的制造方法
【技術領域】
[0001] 本發明涉及圖像檢測領域,尤其涉及一種目標檢測方法及裝置。
【背景技術】
[0002] 從照片、視頻等圖像中檢測室外環境中的行人的技術具有廣泛的應用前景,可以 應用在安全監控領域長時間監視一個場合中的人,還可以應用于機器人技術、汽車自動駕 駛(或輔助駕駛)技術、無人機技術等中。
[0003] 現有的室外行人檢測技術主要分為兩類:生成模型方法和判別模型方法。
[0004] 其中,生成模型方法的基本思想是:首先建立識別對象的概率密度模型,然后在 模型的基礎上進行后驗概率的計算,得出樣本出現的概率值以判斷對象是否出現。這種方 法從統計的角度表示數據的分布情況,能夠反映同類數據本身的相似度,并且建立在貝葉 斯理論的基礎之上,理論基礎很強,模型適用面廣。這種方法主要通過設定一系列參數表 示行人各種狀態下的特征,然后由訓練樣本得到形狀空間等多個空間的描述,再通過KDE (Gaussian Kernel Density Estimation,高斯核密度估計法)等方法得到生成模型。在處 理測試樣本的時候,用得到的生成模型和樣本的擬合得出測試樣本里面某個區域有人的概 率,同時還能得出如果有人,這個人保持了何種姿態等。但是這類方法用很多參數去描述人 體模型,比較復雜,實現困難。同時,這種方法訓練過程難度大,要求樣本盡可能多,所以通 常在室外環境下檢測效果不是很好。
[0005] 基于判別模型的目標檢測方法是指,在圖像檢測過程中不需要詳細地去描述檢測 目標,而只需要判別出圖像中是否存在檢測目標。該方法通常是將從圖像中提取的視覺特 征輸入至串聯的多個或單個濾波器、判別器中,依次經過多次濾波、判別處理后,判別出圖 像中是否存在檢測目標,不能有效地傳遞和利用圖像中檢測窗口區域及其周邊領域的信息 做出判別,所以檢測精確度較低。并且這類方法對數據依賴性高,訓練出來的模型過擬合 的風險大,不易訓練。
【發明內容】
[0006] 摶術問是頁
[0007] 本發明提供一種目標檢測方法及裝置,用以解決如何提高對圖像中的檢測目標的 檢測精確。
[0008] 解決方案
[0009] 為了解決上述技術問題,根據本發明的一實施例,第一方面,提供了一種目標檢測 方法,具體包括:
[0010] 將圖像劃分為N個窗口,N為大于或等于1的正整數;
[0011] 分別提取所述N個窗口對應的視覺特征矩陣,所述視覺特征矩陣是由多個視覺特 征組成的矩陣;
[0012] 采用第一濾波器對選定窗口對應的視覺特征矩陣進行濾波處理,得到濾波后的第 一矩陣;
[0013] 采用至少一個第二濾波器對所述選定窗口對應的視覺特征矩陣進行濾波處理,得 到至少一個第二矩陣,每采用一個所述第二濾波器對所述選定窗口對應的一個視覺特征矩 陣進行濾波處理,得到一個所述第二矩陣;
[0014] 根據所述第一矩陣及其對應的第一權值矩陣、以及每個所述第二矩陣及其對應的 第二權值矩陣,計算出至少一個判別矩陣;
[0015] 根據所述至少一個判別矩陣,確定所述圖像中在所述選定窗口內是否存在檢測目 標。
[0016] 結合第一方面,在第一種可能的實現方式中,根據所述至少一個判別矩陣,確定所 述圖像中在所述選定窗口內是否存在檢測目標,包括:
[0017] 根據所述至少一個判別矩陣,得到輸出判別值;
[0018] 根據所述輸出判別值,確定所述圖像中在所述選定窗口內是否存在檢測目標。
[0019] 結合第一方面或第一方面的第一種可能的實現方式,在第二種可能的實現方式 中,所述采用第一濾波器對選定窗口對應的視覺特征矩陣進行濾波處理,得到濾波后的第 一矩陣,包括:
[0020] 采用公式= 1+eX〇m,得到第一矩陣,其中,Iitl為所述第一矩陣,F tl表示所述 第一濾波器,f表示所述視覺特征矩陣,?表示濾波運算符;
[0021] 所述采用至少一個第二濾波器對同一個所述選定窗口對應的視覺特征矩陣進行 濾波處理,得到至少一個第二矩陣,包括:
[0022] 采用公式Si+1 = i+e_A+i^/,確定至少一個所述第二矩陣;其中,si+1為第i + 1個 所述第二矩陣;Fi+1表示第i+Ι個所述第二濾波器,i為大于或等于0的整數;
[0023] 所述根據所述第一矩陣及其對應的第一權值矩陣、以及每個所述第二矩陣及其對 應的第二權值矩陣,計算出至少一個判別矩陣,包括:
[0024] 米用公式h+i = i+g-CW/^+A+Wy+A+i;),確定所述判別矩陣;其中,hi+1表不第 i+Ι個所述判別矩陣;Whii+1為第i+Ι個所述第一權值矩陣;WM+1為第i+Ι個所述第二權值 矩陣。
[0025] 結合第一方面、第一方面的第一種可能的實現方式或第一方面的第二種可能的實 現方式,在第三種可能的實現方式中,所述分別提取所述N個窗口對應的視覺特征矩陣,所 述視覺特征矩陣是由多個視覺特征組成的矩陣,包括:
[0026] 將所述圖像按照多個尺寸進行縮放,得到多個縮放圖像;
[0027] 采用預設大小的窗口,從每個所述縮放圖像的選定位置按照設定順序進行滑動, 每次滑動設定數量個像素,將每個所述縮放圖像分別劃分成N個窗口;以及
[0028] 每次在每個所述縮放圖像上滑動一次窗口后,將每個所述縮放圖像上的對應窗口 中的視覺特征合并到一起,形成一個視覺特征矩陣;或者將每個所述縮放圖像上的對應窗 口中不同種類的視覺特征形成多個視覺特征矩陣。
[0029] 結合第一方面、第一方面的第一種可能的實現方式、第一方面的第二種可能的實 現方式或第一方面的第三種可能的實現方式中,在第四種可能的實現方式中,分別提取所 述N個窗口對應的視覺特征矩陣之前,包括:
[0030] 從預先選擇的訓練圖像的窗口區域,提取多個視覺特征矩陣作為訓練樣本;
[0031] 使用所述訓練樣本,使用支持向量機SVM訓練方法,得到所述第一濾波器;
[0032] 通過已經訓練得到的所述第一濾波器和預設初始值的第一權值矩陣,利用所述訓 練樣本進行非監督預訓練和后向傳遞BP訓練,得到所有的所述第一權值矩陣的參數。
[0033] 結合第一方面的第四種可能的實現方式中,在第五種可能的實現方式中,得到所 有的所述第一權值矩陣的參數之后,還包括:
[0034] 根據已訓練得到的所述第一濾波器和所述第一權值矩陣篩選所述訓練樣本,保留 未正確計算出判別結果的樣本;
[0035] 每次添加一個預設初始值的第二濾波器及其對應的第二權值矩陣,并使用已經訓 練得到的所述第一濾波器和所述第一權值矩陣,利用保留的所述訓練樣本進行BP訓練,確 定添加的所述第二濾波器和第二權值矩陣的參數,并更新所述第一權值矩陣的參數;其中, 篩選和添加次數由預設的第二濾波器的個數確定。
[0036] 結合第一方面的第四種可能的實現方式中,在第六種可能的實現方式中,得到所 有的所述第一權值矩陣的參數之后,還包括:
[0037] 根據已訓練得到的所述第一濾波器、所述第一權值矩陣和每次添加的預設初始值 的第二濾波器及其對應的第二權值矩陣,篩選所述訓練樣本,