用于在圖像中檢測物體的方法、裝置以及電子設備的制造方法
【技術領域】
[0001] 本發明實施方式涉及計算機視覺領域,具體而言,涉及一種用于在圖像中檢測物 體的方法、裝置W及電子設備。
【背景技術】
[0002] 隨著移動設備的普及,移動交互和服務正在促進移動解決方案和移動用戶界面的 計算機視覺的更廣泛使用。例如,手勢跟蹤與識別正在成為可穿戴設備的重要交互推動者。
[0003] 然而,與人類視覺相比,計算機視覺的效率仍然很低,其還不能滿足許多實際移動 使用情況的需要。其原因主要在于W下兩個方面:
[0004] (1)物體檢測非常耗時。與人類視覺總是可WW并行方式搜索視野中的物體不同, 大多數現有計算機視覺是W遍歷方式搜索物體。該遍歷方式因為待檢測物體的大小和方向 都是未知的所W常采用窮舉搜索。
[0005] (2)目標識別是不穩定的并且識別錯誤經常發生。因為待檢測物體的大小和方向 通常都是未知的,所W如果該物體的模型剛好將物體漏檢則不能正確識別物體。
[0006] 由此可見,一方面,大量窮舉搜索中很多計算是兀余的,采用窮舉搜索非常耗時。 另一方面,雖然用不同尺度和方向訓練了很多模型,但是總有一些尺度和方向不能被覆蓋, 送使得在窮舉搜索中將一些物體漏檢。
【發明內容】
[0007] 為了克服現有技術中的上述問題,本發明實施方式旨在提供一種用于在圖像中檢 測物體的方法、裝置W及電子設備。
[0008] 根據本發明的一個方面,提供一種用于在圖像中檢測物體的方法。所述方法包括: 將第一滑動窗口定位到所述圖像中的起始采樣點處;重復W下步驟;根據所述第一滑動窗 口中的像素點對所述物體的預定特征的匹配程度,計算響應值;依賴于所述響應值,按照預 定滑動方向確定所述圖像中的下一采樣點的位置;將所述第一滑動窗口定位到所述下一采 樣點處;直至完成對所述圖像的遍歷,從而獲得包括所述第一滑動窗口定位過的采樣點的 第一組采樣點;W及根據所述第一組采樣點及其相應的響應值,檢測所述物體的位置。根據 本發明的送一方面的實施方式還包括相應的計算機程序產品和電子設備。
[0009] 根據本發明的另一個方面,提供一種用于在圖像中檢測物體的裝置。所述裝置包 括:起始采樣點定位單元,用于將第一滑動窗口定位到所述圖像中的起始采樣點處;重復 執行單元,用于重復執行W下單元:響應值計算單元,用于根據所述第一滑動窗口中的像素 點對所述物體的預定特征的匹配程度,計算響應值;下一采樣點位置確定單元,用于依賴于 所述響應值,按照預定滑動方向確定所述圖像中的下一采樣點的位置;下一采樣點定位單 元,用于將所述第一滑動窗口定位到所述下一采樣點處;直至完成對所述圖像的遍歷,從而 獲得包括所述第一滑動窗口定位過的采樣點的第一組采樣點;W及物體位置確定單元,用 于根據所述第一組采樣點及其相應的響應值,檢測所述物體的位置。
[0010] 通過下文描述將會理解,根據本發明實施方式,通過引入自適應搜索,即,依賴于 響應值從而確定該圖像中的下一采樣點的位置,能夠聚焦于較大概率存在物體的區域,避 免對不存在該物體的區域的兀余計算,從而能夠有效縮短圖像搜索的時間,提高計算機視 覺的效率。
【附圖說明】
[0011] 通過參考附圖閱讀下文的詳細描述,本發明實施方式的上述W及其他目的、特征 和優點將變得易于理解。在附圖中,W示例性而非限制性的方式示出了本發明的若干實施 方式,其中:
[0012] 圖1是本發明實施方式可實現于其中的電子設備的示意圖;
[0013] 圖2是根據本發明實施方式的用于在圖像中檢測物體的方法的流程圖;
[0014] 圖3是根據本發明實施方式的依賴于響應值從而確定該圖像中的下一采樣點的 位置的示意圖;
[0015] 圖4是根據本發明實施方式的通過不同數目的滑動窗口來覆蓋物體的預定尺度 范圍的第一示意圖;
[0016] 圖5是根據本發明實施方式的通過不同數目的滑動窗口來覆蓋物體的預定尺度 范圍的第二示意圖;
[0017] 圖6是根據本發明實施方式的通過不同數目的滑動窗口來覆蓋物體的預定尺度 范圍的第H示意圖;
[0018] 圖7是根據本發明實施方式的對于給定響應值VO的通過最少數目的滑動窗口來 覆蓋物體的預定尺度范圍的示意圖;
[0019] 圖8是根據本發明實施方式的對于給定響應值VO=0. 5的具有9個滑動窗口的 具體實例的示意圖;
[0020] 圖9是根據本發明實施方式的在80X80像素點的滑動窗口接近相同大小的物體 時響應值等于0. 5的位置分布的示意圖;
[0021] 圖10是根據本發明實施方式的插入中間滑動窗口的示意圖;
[0022] 圖11是根據本發明實施方式的用于在圖像中檢測物體的裝置的示意圖。
[0023] 在各個附圖中,相同或對應的標號表示相同或對應的部分。
【具體實施方式】
[0024] 下面將參考附圖中示出的若干示例性實施方式來描述本發明的原理和精神。應當 理解,描述送些實施方式僅僅是為了使本領域技術人員能夠更好地理解進而實現本發明, 而并非W任何方式限制本發明的范圍。
[00巧]正如上文概述W及下面將要詳細討論的,本發明實施方式提供了一種用于在圖像 中檢測物體的方法。其中,所使用的術語"圖像"既包括例如照片的靜態圖像,也包括例如照 相機取景框中的動態圖像。并且其中,所使用的術語"物體"既可W包括例如汽車的具有特 定顏色、特定形狀的物體,也可W包括例如人臉的具有非特定顏色、非特定形狀的物體。W 及其中,該物體(如果有)可W位于該圖像中的任何位置。
[0026] 首先參考圖1,其示出了本發明實施方式可實現于其中的電子設備100的示意圖。 根據本發明實施方式,電子設備100可W是移動電話之類的便攜式電子設備。然而,應當理 解,送僅僅是示例性和非限制性的。其他的用戶設備類型也可W容易地采取本發明實施方 式,諸如個人數字助理(PDA)、尋呼機、移動計算機、移動TV、游戲裝置、膝上式計算機、照相 機、視頻照相機、GI^設備和其他類型的語音和文本通信系統。
[0027] 電子設備100可W具有通信功能。為此,如圖1所示,電子設備100可W包括一個 或多個可操作與發射器114和接收器116通信的天線112。電子設備100還包括至少一個處 理器控制器120。應當理解,控制器120包括實現電子設備100的所有功能所需要的電路。 例如,控制器120可W包括數字信號處理器設備、微處理器設備、A/D轉換器、D/A轉換器W 及其他支持電路。電子設備100的控制和信號處理功能根據送些設備各自的能力分配。電 子設備100還可W包括用戶接口,例如可W包括振鈴器122、揚聲器124、擴音器126、顯示器 或取景器128W及小鍵盤130,所有W上設備都禪合至控制器120。
[0028] 特別地,電子設備100包括用于捕獲靜態圖像和/或動態圖像的相機136、攝像頭 或類似的圖像獲取裝置。電子設備也可W只有另外一個相機、攝像頭或類似的圖像獲取裝 置。
[002引另夕F,電子設備100還包括電池134,諸如振動電池組,用于向操作電子設備100所 需要的各種電路供電,并且備選地提供機械振動作為可檢測的輸出。電子設備100還包括 用戶識別模塊扣IM) 138。UIM138通常是具有內置的處理器的存儲器設備。UIM138可W 例如包括訂戶識別模塊(SIM)、通用集成電路卡扣ICC)、通用用戶識別模塊扣SIM)或可移 動用戶識別模塊(R-UIM)等等。UIM138可W包括根據本發明實施方式的卡連接檢測裝置。
[0030] 電子設備100還包括存儲設備。例如,電子設備100可W包括易失性存儲器140, 例如,包括高速緩存區域中的用于臨時存儲數據的易失性隨機存取存儲器(RAM)。電子設 備100還可W包括其他的可W是嵌入的或可移動的非易失性存儲器142。非易失性存儲器 142可W附加地或備選地例如包括EEPROM和閃存等。存儲器可W存儲多個信息片段中的任 意項和電子設備100使用的數據程序等,W便實現電子設備100的功能,例如后文參照圖2 至圖11中的一個或多個來舉例說明的功能。
[0031] 應當理解,圖1中的結構框圖僅僅示出用于說明目的,并非旨在限制本發明的范 圍。在某些情況下,某些組件可W按照具體需要而增加或者減少。
[0032] 圖2是根據本發明實施方式的用于在圖像中檢測物體的方法200的流程圖。可W 理解,方法200可W由上文參考圖1描述的電子設備100執行,例如由控制器120來執行。 為討論方便,在下文描述中將參考圖1所示的電子設備1