專利名稱:失焦狀況下的對象檢測和識別的制作方法
技術領域:
本發明涉及失焦狀況下的對象(例如臉部)檢測和識別。
背景技術:
數碼相機中的臉部檢測涉及標識出圖像內對應于臉部的子窗口或區域或像素群組。Viola-Jones在US2002/0102024中提出了用于在諸如數碼靜態相機、相機電話或視頻錄影機之類的數字圖像獲取設備內實施臉部檢測的最早的可行技術之一。Viola-Jones是基于由一系列順序特征檢測器所構成的分類器鏈。該分類器鏈拒絕并不表示臉部的圖像模式而接受表示臉部的圖像模式。其它方面的臉部識別涉及標識出圖像內候選子穿孔中的個體。臉部識別過程中的問題在于,具有相似對焦狀況的臉部趨向于在“臉部空間”中被聚集在一起。例如,甚至不同個體的失焦臉部的屬性在臉部空間內也趨于具有比良好對焦的臉部更為相似的值/特征。這樣,就難以對相同人員的圖像進行正確聚類。期望能夠檢測并識別臉部,以及實際上在圖像內失焦的其它對象。還期望擁有一種方法來對臉部或其它對象上的焦點進行歸一化(normalize),例如以便在臉部/對象識別和/或其它應用中使用。假設對象與數碼相機或相機電話、視頻相機或者其它支持相機的設備或圖像獲取設備處于不同距離,則對焦在數字攝像行業是一個眾所周知的問題。諸如擴展場深度之類的解決方案確實解決了該問題,但是僅是部分地確保了接近的對象在相機對焦至無限遠(深焦)仍然清晰。期望擁有一種有效的技術來對原本具有失焦對象的數字圖像進行處理。
發明內容
根據本發明的方法和裝置在所附權利要求中進行限定。本發明的實施例使用用于多對象對焦的分類器鏈和MEMS而提供了快速的自動對焦。
現在將參考附圖通過示例對本發明的實施例進行描述,其中圖1A-圖1B圖示了依據本發明實施例的方法。圖2圖示了依據本發明備選實施例的方法。圖3A-圖3E圖示了依據某些實施例的另外的技術。
具體實施例方式本發明的實施例在包括MEMS (或類似)技術的數字圖像獲取設備中實施,該技術允許對焦點進行快速改變。MEMS技術可以如美國專利7,769,281,7,747,155,7,729,603, 7,729,601,7,702,226,7,697,834,7,697,831,7,697,829,7,693,408,7,663,817,7,663,289,7,660,056,7,646,969,7,640,803,7,583,006,7,565,070,7,560,679,7,555,210,7,545,591,7,515,362,7,495,852,7,477,842,7,477,400,7,403,344,7,359,131,7,359,130,7,345,827,7,266,272,7,113,688 和 / 或 6,934,087 中任一項所闡述。這樣的系統能夠捕獲和/或存儲在相對短的時間量中所捕獲的圖像的有限序列。本發明的特定實施例被實施為提供臉部(或其它感興趣對象)檢測(和/或追蹤)信息的數字圖像獲取設備中的嵌入式組件。如介紹中所提到的,特別地通過對臉部分類器進行訓練所進行的臉部檢測已經得到了本申請專利權人和他人的廣泛研究和開發,并且因此并不在這里進一步討論。在某些實施例中,系統捕獲圖像序列,該圖像序列以最初的一個開始隨后為與視場中所檢測的感興趣對象(臉部)的數目相等的多個圖像。最初的基準、預覽或后期查看圖像的捕獲可以包括利用圖像獲取設備的缺省設置所捕獲的初始圖像,例如對焦在主要要素(例如,背景、某個對象、某個臉部)上的圖像。可以執行感興趣對象的圖像序列捕獲。對于隨后的圖像而言,從所檢測臉部(或對象)集合的特征確定焦點,并且這將在下文中更為詳細地進行描述。在不同對焦位置所捕獲的多個圖像可以被保存在一起,這為用戶或編程設備提供了在后期在它們之間進行選擇或融合或者在設備中進一步進行處理以提供單個多對焦(mult1-focused)圖像的可能性。W02008108112公開了一種包括獲取數字圖像的臉部照明歸一化方法,該數字圖像包括顯現為被不均衡照明的臉部。一個或多個不均衡照明分類器程序被應用于臉部數據以確定臉部在數字圖像內的呈現和/或臉部的不均衡照明狀況。該不均勻照明狀況可以被校正以由此生成經校正的臉部圖像,其顯現為具有更為統一的照明例如以增強臉部識別。W02008107112的方法可以被應用于對焦狀況。在對焦狀況的情況下,例如可以將分類器用于(I)清晰對焦的對象(臉部),(ii)稍有失焦的對象(臉部),和(iii)嚴重失焦的對象(臉部)。圖1A-圖1B圖示了示例性的詳細工作流程。在已經獲取了包括景象中的感興趣目標的給定景象圖像和所標識出的一個或多個子窗口的情況下,該工作流程從步驟802進行。該子窗口例如可以通過運行第一作為一般對象檢測器的分量而使用較高級、較簡單或松散的分類器在圖像內從頭開始確定。這些分類器無法與感興趣對象內較為精細的特征相匹配,并且因此它們對對焦和未對焦對象都提供良好匹配。在一個優選實施例中,這些分類器為Haar分類器。備選地,可能已經從之前所獲取的圖像對子窗口進行了追蹤。在802,利用準確對焦分類器集合(例如,使用3-5個分類器)對包含諸如臉部之類的對象的給定子窗口進行測試。如果在804確定了累積概率高于第一閾值,則在806確定諸如臉部的對象是準確對焦的,并且該過程利用該完整分類器鏈繼續進行。如果確定了累積概率低于第二閾值(其甚至低于第一閾值),則在812確定子窗口不包含臉部,并且該過程經由864返回至802,在那里對下一個感興趣對象(臉部)進行測試。如果在808確定了累積概率高于第二閾值,但是低于804的第一閾值,則在810認為子窗口仍然可能是臉部,但是并不是準確對焦的臉部。因此,在814應用下一個失焦的具體部分分類器集合。雖然在步驟814利用稍有失焦的分類器集合(例如,使用3-5個分類器)對子窗口進行測試,但是分類器可以以任意順序加以應用。如果在816確定了累積概率高于第一閾值,則在818確定臉部稍有失焦,并且該處理利用該完整的分類器鏈繼續進行。如果在820認為累積概率處于第一閾值和較低的第二閾值之間,則在822確定該子窗口仍然可能包含臉部,但是是稍有失焦的臉部,并且因此該過程移動至826以便應用下一個失焦的具體部分分類器集合。如果認為累積概率小于第二閾值,則在824確定子窗口不包含臉部,并且該過程通過864回到下一個子窗口和802。在826,利用明顯失焦的部分分類器集合(例如,使用3-5個分類器)執行子窗口的測試。如果在828確定了累積概率高于第一閾值,則確定臉部為明顯失焦并且在830利用該完整分類器鏈繼續該過程。如果在832累積概率低于第一閾值但是高于較低的第二閾值,則在834確定子窗口仍然可能包含臉部,雖然不是明顯失焦的臉部,并且該過程因此移動至838和圖1B以在存在的情況下應用下一個失焦的具體部分分類器集合。如果在832認為累積概率高于第二閾值低于828所指示的第一閾值,則在858仍然認為子窗口可能包含臉部,雖然不是清晰對焦的臉部也不是稍有失焦的臉部也不是明顯失焦的臉部,并且因此現在在862應用具體部分分類器集合配對。這是因為此時窗口還沒有在其第一閾值通過任何對焦狀況的具體分類器,而是已經被拒絕作為臉部。因此,可能的情形是子窗口包含有對焦狀況類型的組合所表示的臉部。因此,可以首先應用兩個最高概率的閾值來確定其是否處于清晰對焦和稍有失焦之間,或者處于稍有失焦和明顯失焦之間,或者可能比明顯失焦更為嚴重地失焦,或者可能比清晰對焦更好地對焦,隨后應用多個完整分類器集合來確定其是否作為臉部區域而留存。如果在832認為累積概率低于第二閾值,則在860,認為子窗口不包含臉部并且過程通過864移動至802來到下一個圖像子窗口。在分類器到達步驟806并且隨后確認臉部準確對焦的情況下,圖像或圖像子窗口可以被存儲。在分類器到達步驟818或者步驟830并且因此確定臉部嚴重或稍有失焦的情況下,則對焦系統可以被調整以獲取包括感興趣對象更好對焦版本的后續圖像。可以采用任意數量的方案來確定能夠以哪個方向進行對焦調節以及進行到什么程度。例如,可以對系統分類器進行訓練以檢測景象中各種其它對象的深度,并且因此還能夠檢測失焦狀況是因為對焦平面處于臉部或其它感興趣對象之前還是之后。例如,如果背景對象被準確對焦,則臉部或其它感興趣對象處于焦點平面之前,而如果已知處于臉部或其它感興趣對象之前的對象被準確對焦,則焦點平面處于臉部或其它感興趣對象之前。在諸如這樣的實現中,圖1A和圖1B的工作流程可以被調整并擴展以包括前部和后部稍有失焦的分類器和/或前部和后部明顯失焦的分類器。在任何情況下,這使得系統能夠確定對焦調整。來自后續圖像的相對應子窗口可以在對焦調整令人滿意的前提下被存儲,或者可以使用圖1A和IB的工作流程對該子窗口進行再次測試以確定是否需要可能需要進一步調節。現在參考圖2,在備選實施例中,可以使用分離分類器鏈來執行在步驟20所獲取圖像內的個體臉部區域上的快速對焦。在這樣的實施例中,對象分類被劃分為用來檢測一般臉部的第一階段(步驟22)。這可以包含應用檢測器,使用更高級別、松散或更為簡單的分類器。同樣,這樣的分類器無法與臉部區域內更為精細的特征相匹配并且因此它們對對焦和未對焦臉部提供了良好匹配。在一個優選實施例中,這些分類器是Haar分類器。備選地,可以使用來自臉部追蹤模塊的數據;或者實際上可以對來自第一階段檢測器和臉部追蹤器的信息進行組合。
隨后,如以上所解釋的對每個包含感興趣對象的子窗口選擇性地應用附加分類器分量的集合。在優選實施例中,提供了至少三個附加分類器分量。所有這些附加分類器分量組成了更為復雜的分類器鏈。在一個優選實施例中,這些分類器是人口普查分類器。在備選實施例中,這些可以與其它復雜分類器進行組合。第一附加分類器鏈被選擇性地進行訓練而與清晰對焦的臉部區域相匹配并且主動拒絕明顯失焦的臉部,其對于稍有失焦的臉部區域而言將是中立的。第二附加分類器鏈被選擇性地進行訓練而與稍有失焦的臉部區域最優地進行匹配并且拒絕明顯失焦的臉部區域,其對于清晰對焦的臉部是中立的。第三附加分類器鏈被選擇性地進行訓練而與明顯失焦的臉部最優地進行匹配并且主動拒絕清晰對焦的臉部,其對于略微未對焦的臉部是中立的。在優選實施例中,這些分量中的每一個為所確認的臉部區域提供I和0之間的分數,所述分數相對大型數據集進行歸一化以提供所確認的臉部區域與每個標準匹配的如何的實質上準確的指示。實施例的操作因此如下(i)子窗口具有以上所概述的每個所應用的附加分量,它們依次被應用以確定臉部對焦的程度;(ii )MEMS透鏡被快速調節(步驟26),并且三個分量的第二應用得以被進行(步驟28)。來自步驟28的測試的分數隨后與之前分量應用的分數進行比較(步驟30)。如果臉部實質上未對焦并且保持實質上未對焦,則透鏡移動處于錯誤方向并且該透鏡再次在相反方向進行移動(步驟26),或者可以減小移動的增量;(iii)一旦通過略微為對焦的分量實現了更好的匹配,則進一步減小透鏡移動的增量并且進行調節直至清晰對焦分量的分數大于略微未對焦分量的分數,隨后確定臉部區域被準確對焦,步驟32。如圖3A-圖3E所概括的,由于MEMS透鏡組件能夠快速改變其焦距,所以可能在單個景象內的多個臉部上重復該序列并且確定每個臉部區域的最優焦距。在某些實施例中,可以捕獲相同景象的多于一個的圖像并且將其融合/混合為單個復合圖像以提供多個最優對焦的臉部。在備選實施例中,可以從圖像內所有臉部區域的焦距設置來確定全局焦距。在其它實施例中,對面部特征采用具體的分類器鏈。例如,可以對一個分類器集合進行訓練以使得最優焦距處于人的眼睛上;可以對第二集合進行訓練以使得最優焦距處于他們的下巴和嘴部區域;可以針對他們的發線/前額區域對第三集合進行訓練;可以針對他們的耳朵以及臉的側面對第四集合進行訓練。將這樣的分類器進行組合使得能夠針對肖像攝影而在單個臉部上進行更為準確的對焦,因此根據肖像攝影師的要求而使得臉部的個體區域被保持在清晰對焦或者稍有失焦或實質上失焦。以上所描述的概括對焦過程可以采用更為復雜且精良的算法。此外,雖然以上所概括的三個級別對于本發明的大多數實施例而言是足夠的,但是可以采用比以上所描述的三個對焦級別更多的級別。在某些實施例中,也可能消除清晰對焦分量并且通過將透鏡焦點在臉部之前和之后的略微未對焦位置之間進行快速移動來確定最優面部距離。如例如在以上所引用的參考文獻中所描述的以及如可被本領域技術人員以其它方式所理解的,本發明的實施例采用了諸如臉部檢測和追蹤以及MEMS技術之類的成熟解決方案。可以在各種實施例中提供圖像注冊和增強以便獲得良好對焦的系統。只要系統中存在自動對象檢測和/或追蹤,該方法就可以被用于臉部以及諸如寵物、汽車、房屋、個人屬性、自然景觀、頭像和其他游戲對象以及許多其它可標識對象之類的非臉部對象。依據某些實施例的系統能夠提供利用任意的f編號(f-number)所拍攝的照片和數字圖像(而無論它們到相機的距離如何)連同用戶所選擇或自動選擇的諸如臉部的感興趣對象一起都被保持為準確對焦。實施例涉及MEMS功能以在圖像已經被捕獲之后快捷、迅速、即時或者幾乎即刻地移動焦點。對象檢測和追蹤功能實時確定對象的位置和大小,同時創建預覽信息。提供圖像注冊功能以便對準(align)圖像序列以使得能夠當場將它們組合,或者隨后在圖像已經被捕獲之后進行組合。還可以包括圖像混合和/或變形功能,例如使得來自一個圖像的清晰臉部可以在另一圖像中利用不同焦點進行調換。對于具有人群的照片而言,該解決方案不僅針對深焦而且針對具有淺焦距的透鏡解決了問題。至于選擇性對焦,則可以允許查看者在不同焦點之間進行手工切換。可以照常獲取數字圖像,而隨后在嵌入式設備或計算機上選擇焦點。至于多個臉部對焦,可以創建單個圖像以使得所有臉部(或其它感興趣對象)中的兩個或更多被清晰對焦。多個臉部對焦的圖像可以具有比來自序列中的每個個體圖像更高的分辨率,由此為諸如臉部識別之類的安全應用提供最佳的可能輸入數據。這些多個臉部的實施例提供了適用于實時嵌入式實施例的先進的定性解決方案。在先進的使用情形中,圖像對準可能涉及光學、數字和/或機械穩定化以使得能夠將它們組合在一起。在備選實施例中,可以使用美國專利7,660,478,7,639,889,7,636,486,7,639,888,7,697,778 和 / 或 USP7, 773,118 和 7,676,108,和 / 或美國專利申請序列號 12/330,719,11/856,721,12/485,316,12/901,577,12/820,002,12/820,034,12/820,086,12/336,416,USSNl 1/753, 098,和 / 或 USSN12/137, 113 中任一項中所描述的特征。諸如圖3A-圖3E針對多重對焦功能所圖示的,圖像混合和變形也是可能的。多個圖像以準確對焦的感興趣區域比失焦區域獲得更高優先級的方式而被混合在一起。在感興趣對象/臉部已經從一個圖像移動至另一圖像的情況下,可以使用變形以便進行現實且沒有假象的組合。此外,在可以根據這里的優選實施例所執行并且已經在上文中進行了描述的方法中,已經以所選擇的印刷順序對操作進行了描述。然而,除非在明確給出特定順序或者本領域技術人員可能認為特定順序有必要的情況下,否則已經選擇了順序并且這樣排序是為了便于印刷而并非意在暗示用于執行操作的任何特定順序。
權利要求
1.一種數字圖像處理方法,包括利用包括數字圖像獲取設備獲取包括多個特征的景象;標識出對應于所述景象內的第一特征的第一像素群組;使用MEMS組件將光學器件實時調節至第一對焦位置以將所述設備對焦在所述第一特征上;在所述第一對焦位置捕獲第一數字圖像;標識出對應于近似相同景象內的第二特征的第二像素群組;使用所述MEMS組件將所述光學器件實時調節至第二對焦位置以將所述設備對焦在所述第二特征上;在所述第二對焦位置處捕獲第二數字圖像;注冊包括所述第一特征和所述第二特征的所述第一數字圖像和所述第二數字圖像;以及將所述第一數字圖像和所述第二數字圖像一起進行存儲、傳送、組合、捕獲或顯示,或者其組合。
2.根據權利要求1的方法,進一步包括確定所述第一特征在所述第二數字圖像中顯現為模糊、或者所述第二特征在所述第一圖像中顯現為模糊、或者這二者,并且其中將所述第一數字圖像和所述第二數字圖像一起進行存儲、傳送、或顯示,或者其組合包括生成復合圖像,所述復合圖像包括來自所述第一數字圖像的所述第一特征以及來自所述第二數字圖像的所述第二特征,從而得所述第一特征和所述第二特征這二者在所述復合圖像中都顯現為清晰。
3.根據權利要求2的方法,其中所述生成復合圖像包括將所述第一圖像和所述第二圖像進行混合。
4.根據權利要求2的方法,其中所述生成復合圖像包括將所述第一圖像和所述第二圖像進行變形。
5.根據權利要求1的方法,還包括其中將所述第一數字圖像和所述第二數字圖像一起進行所述存儲、傳送、或顯示,或者其組合包括提供切換特征以一起調用所述第一數字圖像和所述第二數字圖像并且在它們之間進行切換。
6.根據權利要求5的方法,進一步包括接收對所述第一數字圖像和所述第二數字圖像中的一個的選擇用于進一步進行存儲、傳送、顯示或進一步處理,或者其組合。
7.根據權利要求5的方法,其中所述切換特征允許顯示器得以顯現,以證明在相同圖像中在所述第一對焦位置和所述第二對焦位置之間進行切換。
8.根據權利要求1的方法,其中所述注冊包括通過應用數字或機械圖像穩定化或者這二者來對所述第一數字圖像和所述第二數字圖像進行對準。
9.根據權利要求1的方法,其中標識出所述第一像素群組或所述第二像素群組分別包括對所獲取的景象應用臉部檢測,并且標識出對應于第一臉部或第二臉部的所述第一特征或所述第二特征。
10.根據權利要求9的方法,進一步包括對所述第一像素群組或所述第二像素群組或這二者應用臉部追蹤,以用于在后續圖像中繼續分別標識出對應于所述第一臉部或第二臉部的所述第一像素群組或所述第二像素群組。
11.一種在景象中的所檢測臉部區域上進行智能對焦的方法,包括a)使用包括透鏡、圖像傳感器、存儲器和處理器的支持相機的設備來獲取所述景象的數字圖像;b)在所述數字圖像內標識出包含臉部的一個或多個像素群組;c)對所標識出的像素群組應用多個特定于對焦的分類器鏈,所述分類器鏈包括被訓練為與實質性失焦的臉部相匹配的第一分類器鏈,和被訓練為與略有失焦的臉部相匹配的第二分類器鏈;以及d)響應于所述像素群組明顯匹配于所述第一特定于對焦的分類器鏈或第二特定于對焦的分類器鏈中的一個或這二者,確定所述臉部沒有被清晰對焦;并且e)響應于所述臉部沒有被清晰對焦,基于在一個或多個在前對焦位置處所確定的對焦程度而使用MEMS組件調節對焦位置一次或多次,以在所述臉部上進行對焦。
12.根據權利要求11的方法,其中所述標識步驟b)包括應用被訓練為與對焦和未對焦臉部相匹配的對焦通用分類器鏈;接受來自臉部追蹤模塊的數據,或者這二者。
13.根據權利要求11的方法,其中所述調節步驟e)包括響應于所述臉部與所述第一特定于對焦的分類器鏈最佳匹配,粗略調節至第二對焦位置并且重復應用多個對焦通用分類器鏈。
14.根據權利要求13的方法,其中所述調節步驟e)進一步包括響應于確定所述臉部在所述第二對焦位置實質上未對焦,與到所述第二對焦位置相反地將焦點粗略調節至第三對焦位置和/或相對于調節至所述第二對焦位置以減少或增加的量將焦點粗略調節至第三對焦位置。
15.根據權利要求13的方法,其中所述多個特定于對焦的分類器鏈進一步包括第三特定于對焦的分類器鏈,所述第三特定于對焦的分類器鏈被訓練為與清晰對焦的臉部相匹配,并且其中所述調節步驟e)包括響應于所述臉部與所述第二特定于對焦的分類器鏈最佳匹配,精細調節至第二對焦位置,并且重復應用至少三個特定于對焦的分類器鏈一次或多次,直至利用所述第三特定于對焦的分類器鏈實現了最佳匹配。
16.根據權利要求13的方法,其中所述調節步驟e)包括響應于所述臉部與所述第二特定于對焦的分類器鏈最佳匹配,精細調節至第二對焦位置,并且重復應用所述第二特定于對焦的分類器鏈,直至在臉部之前和之后的兩個略微未對焦位置之間達到對焦位置。
17.根據權利要求11的方法,其中所述多個特定于對焦的分類器鏈進一步包括第三特定于對焦的分類器鏈,所述第三特定于對焦的分類器鏈被訓練為與清晰對焦的臉部相匹配,并且其中所述調節步驟e)包括響應于所述臉部與所述第二特定于對焦的分類器鏈最佳匹配,精細調節至第二對焦位置并且重復應用所述多個特定于對焦的分類器鏈一次或多次,直至利用所述第三特定于對焦的分類器鏈實現了最佳匹配。
18.根據權利要求11的方法,其中所述調節步驟e)包括響應于所述臉部與所述第二特定于對焦的分類器鏈最佳匹配,精細調節至第二對焦位置,并且重復應用所述第二特定于對焦的分類器鏈直至在臉部之前和之后的兩個略微未對焦位置之間達到對焦位置。
19.根據權利要求11的方法,進一步包括應用一個或多個具體面部特征分類器鏈,每個所述具體面部特征分類器鏈被訓練為使得能夠在所檢測到的臉部的特征上最優對焦,所述特征包括一只或兩只眼睛、嘴部、下巴、鼻子、一個或兩個耳朵、發線、前額、側面或其它部分臉部區域或者其組合。
20.根據權利要求19的方法,進一步包括調節對焦位置以獲得所檢測臉部的所選擇的具體面部特征上的最優對焦。
21.根據權利要求11的方法,進一步包括在每個像素群組處重復應用所述多個特定于對焦的分類器鏈中的至少一個。
22.—種基于對象的自動對焦方法,包括Ca)獲取包括對應于顯現為失焦的一個或多個感興趣對象的對象數據的數字圖像;(b)對所述對象數據應用一個或多個對焦狀況分類器程序;(C)將所述對象數據標識為對應于所述數字圖像內的所述對象;(d)還作為應用所述一個或多個對焦狀況分類器程序的結果來為所述對象確定失焦狀況;(e)基于所述確定來校正所述對象的所述失焦狀況,以由此生成顯現為清晰對焦的經校正的對象圖像;以及(f)對經校正的對象圖像進行電捕獲、與另一圖像相組合、存儲、傳送、對其應用對象識別程序、編輯、或顯示,或者其組合。
23.根據權利要求22的方法,進一步包括對所述經校正的對象圖像應用對象識別程序。
24.根據權利要求22的方法,其中對所述對象的檢測以及對所述對象的失焦狀況的確定同時執行。
25.根據權利要求22的方法,進一步包括應用特征檢測器程序集合以拒絕非對象數據被標識為對象數據。
26.根據權利要求22的方法,進一步包括對所述對象數據應用清晰對焦分類器程序。
27.根據權利要求26的方法,進一步包括基于所述分類器程序中的一個對所述對象數據的接受而確定對焦狀況。
28.根據權利要求27的方法,其中所述數字圖像是包括所述對象的一系列多個圖像中的一個,并且其中所述校正被應用于所述系列中不同于其中確定了所述對焦狀況的所述數字圖像的圖像。
29.根據權利要求22的方法,其中所述失焦分類器程序包括一個或多個略微失焦分類器以及一個或多個明顯失焦分類器。
30.根據權利要求29的方法,進一步包括對所述對象數據應用清晰對焦分類器程序。
31.根據權利要求22的方法,其中所述應用包括在確定沒有應用單個對焦狀況并且所述對象數據沒有被拒絕作為具體對象之后應用至少兩個完整分類器集合。
32.一種對象檢測方法,包括(a)獲取數字圖像;(b)從所述圖像提取子窗口;(C)向所述子窗口應用兩個或更多縮短的對象檢測分類器層級,其被訓練為有選擇地對一個或多個感興趣對象的對焦狀況敏感;Cd)基于所述應用,確定具有某個對焦狀況的對象出現于所述子窗口內的概率;(e)基于所述確定,應用被訓練為對所述某個對焦狀況敏感的擴展對象檢測分類器層級;(f)提供具體對象存在于所述圖像子窗口內的最終確定;以及(g)針對來自于所述圖像的一個或多個另外的子窗口或者一個或多個另外的對焦狀況或者這二者重復步驟(b)至(e)—次至多次。
33.根據權利要求32的方法,進一步包括通過應用一個或多個失焦分類器層級來確定對焦狀況。
34.根據權利要求33的方法,進一步包括應用清晰對焦分類器層級。
35.根據權利要求34的方法,進一步包括基于所述分類器層級中的一個的接受而確定所述具體對象在子窗口內的對焦狀況。
36.根據權利要求35的方法,其中所述數字圖像是包括所述具體對象的一系列多個圖像中的一個,并且所述方法進一步包括校正所述系列中不同于其中確定了所述對焦狀況的所述數字圖像的圖像內的所述具體對象的失焦狀況。
37.根據權利要求33的方法,其中所述失焦分類器層級包括一個或多個略微失焦分類器以及一個或多個明顯失焦分類器。
38.根據權利要求31或32的方法,其中所述對象包括臉部。
39.一個或多個非瞬態處理器可讀介質,其具有嵌入其中的用于對處理器進行編程以執行根據權利要求1至38中任一項的數字圖像處理方法的代碼。
40.一種數字圖像獲取設備,包括用于獲取數字圖像的透鏡和圖像傳感器;處理器;以及一個或多個非瞬態處理器可讀介質,其具有嵌入其中的用于對處理器進行編程以執行包括權利要求1至38中任一項的步驟的數字圖像處理方法的代碼。
全文摘要
一種智能對焦技術包括識別數字圖像中諸如臉部之類的感興趣對象。應用被訓練以將對焦和未對焦的臉部進行匹配的對焦通用分類器鏈和/或接受來自于臉部追蹤模塊的數據。多個對焦特定分類器鏈得以被應用,包括被訓練以對實質上失焦的臉部進行匹配的第一鏈,以及被訓練為對略微失焦的臉部進行匹配的第二鏈。使用MEMS分量對焦點位置進行快速調節。
文檔編號G06K9/00GK103052960SQ201180038838
公開日2013年4月17日 申請日期2011年11月11日 優先權日2010年11月11日
發明者A·卡帕塔, S·佩特雷斯酷, P·比焦伊, P·科科倫 申請人:數字光學歐洲有限公司