專利名稱:一種網絡色情視頻實時檢測方法和系統的制作方法
技術領域:
本發明涉及網絡色情視頻檢測技術領域,特別是涉及一種網絡色情視頻實時檢測 方法和系統。
背景技術:
隨著網絡帶寬和視頻技術的飛速發展,網絡視頻的數量以及用戶規模都呈現巨大 增長。隨之而來,網絡上色情視頻泛濫的問題也日趨嚴重,并已嚴重干擾、污染現有網絡環 境。為了凈化網絡空間,遏制網絡上色情視頻的肆意泛濫,一個非常重要的技術手段就是應 用針對網絡視頻的色情內容檢測技術,對網絡視頻進行有效監管。現有的色情視頻檢測方法都是針對傳統視頻節目的檢測方法,并沒有專門針對網 絡視頻的檢測方法。現有色情視頻檢測方法首先要對視頻進行結構化處理,即把視頻節目 分割成鏡頭,后續的檢測將以鏡頭作為單元進行判定。在對一個鏡頭的判定中,目前主要 采用的是基于學習模型的判定方法,即通過機器學習得到一個色情內容判定的模型,依據 該模型對鏡頭是否包含色情內容做出判定。其中,模型判定的性能主要依賴于所提取的特 征。目前,所采用的特征主要來源于三方面,其一是幀級特征,即從鏡頭里抽取關鍵幀,在關 鍵幀上提取特征,這些特征通常是基于人臉檢測,膚色檢測,軀干檢測等的檢測結果構造而 成;其二是時序特征,即從鏡頭里提取運動信息來構造特征,這些特征反映的是鏡頭內容的 變化;其三是音頻特征,即從鏡頭片段里提取音頻信息來構造特征。但是,由于網絡視頻數據量巨大且傳播非常迅速,因而網絡色情視頻檢測技術必 須是高效率的檢測,否則將沒有應用前景。而現有方法由于針對的是傳統視頻節目,其應用 多是離線處理,因而對檢測效率并不看重。具體來說,把現有方法直接應用在網絡色情視頻 檢測上,主要存在如下三個問題嚴重影響網絡色情視頻的檢測效率和檢測性能(1)鏡頭分割耗時且冗余。傳統視頻節目(電視節目,電影)通常時間長度較長, 并具有完整的視頻結構(場景,鏡頭),因而在檢測之前,對視頻進行鏡頭分割是必要的。但 是,網絡視頻通常時間長度較短,內容較為單一,并且所含鏡頭也相對較少。此時,耗時的鏡 頭分割處理就顯得沒有必要。(2)基于模型的檢測方法在線計算量大。基于模型的檢測方法在判定時通常要進 行復雜的計算,并且計算量是隨著訓練樣本的增多而增加的。這大大影響了檢測程序在線 運行的效率。(3)特征攜帶大量噪聲。由于網絡視頻的視覺質量參差不齊,傳統方法中所提取的 精細特征(例如軀干檢測,皮膚紋理分析,音頻特征)在網絡視頻上性能波動較大,這些特 征會給檢測過程帶來噪聲干擾。
發明內容
本發明的目的在于提供一種網絡色情視頻實時檢測方法和系統。其結合網絡視頻 數據的特點,制定高效的抽幀和多幀結果融合策略,有效地提高了檢測效率。
為實現本發明的目的而提供的一種網絡色情視頻實時檢測方法,包括下列步驟步驟100.根據網絡視頻的長度,建立關鍵幀預抽取幀號隊列KFN = In1, n2,…, %},其中 Ii1 < n2 <...< nN ;步驟200.根據步驟100確定的關鍵幀預抽取幀號隊列,按順序抽取一幀關鍵幀并
解碼;步驟300.對步驟200得到解碼后的關鍵幀進行色情內容檢測,判斷該關鍵幀是否 包含色情內容;步驟400.根據步驟300得到的對單個關鍵幀色情內容的檢測結果,連同之前得 到的其他關鍵幀的檢測結果,進行決策融合判定如果判定“是”,則認為該視頻包含色情內 容,結束檢測;如果判定“否”,則認為該視頻不包含色情內容,結束檢測;如果判定“不定”, 則返回步驟200,繼續進行單個關鍵幀的檢測。所述步驟100,包括下列步驟步驟110.如果視頻長度小于或等于L秒,則將根據公式⑴等間隔抽取N1幀關
鍵幀作為預抽取策略
權利要求
1.一種網絡色情視頻實時檢測方法,其特征在于,所述方法,包括下列步驟步驟100.根據網絡視頻的長度,建立關鍵幀預抽取幀號隊列KFN= In1, n2,···,%}, 其中 Ii1 < n2 <丨< nN ;步驟200.根據步驟100確定的關鍵幀預抽取幀號隊列,按順序抽取一幀關鍵幀并解碼;步驟300.對步驟200得到解碼后的關鍵幀進行色情內容檢測,判斷該關鍵幀是否包含 色情內容;步驟400.根據步驟300得到的對單個關鍵幀色情內容的檢測結果,連同之前得到的其 他關鍵幀的檢測結果,進行決策融合判定如果判定“是”,則認為該視頻包含色情內容,結 束檢測;如果判定“否”,則認為該視頻不包含色情內容,結束檢測;如果判定“不定”,則返 回步驟200,繼續進行單個關鍵幀的檢測。
2.根據權利要求1所述的網絡色情視頻實時檢測方法,其特征在于,所述步驟100,包 括下列步驟步驟110.如果視頻長度小于或等于L秒,則將根據公式(1)等間隔抽取N1幀關鍵幀作為預抽取策略^^ ⑴! #!+1 1其中,Hi是第i個關鍵幀的幀號,W是視頻的總幀數,L取值5到10之間,N1取值5到 20之間;步驟120.如果視頻長度大于L秒,則將根據公式(2)對視頻中間的視頻段等間隔 抽取隊幀關鍵幀作為預抽取策略Tii =Nr+l~^~, i = \,2”..,N2, Nr =JVx(l-r%)/2(2)N2 + 1其中,Iii是第i個關鍵幀的幀號,W是視頻的總幀數,所述r取值50到90之間,隊取值 20到100之間。
3.根據權利要求1所述的網絡色情視頻實時檢測方法,其特征在于,所述步驟200,包 括下列步驟步驟210.根據所述關鍵幀預抽取幀號隊列,從視頻中抽取一幀關鍵幀,該幀的幀號為 當前KFN中的最小幀號;步驟220.解碼抽取的所述關鍵幀抽;步驟230.從KFN中刪去所述幀號,返回步驟210。
4.根據權利要求1所述的網絡色情視頻實時檢測方法,其特征在于,所述步驟300,包 括下列步驟步驟310.對所述關鍵幀進行多角度正面人臉檢測,并根據檢測結果計算“正面人 臉-圖像比”表示關鍵幀所有像素點中正面人臉像素點所占的比例;步驟320.對關鍵幀進行多角度側面人臉檢測,并根據檢測結果計算“側面人臉-圖像 比”表示關鍵幀所有像素點中側面人臉像素點所占的比例;步驟330.對關鍵幀進行多角度半身人體檢測,并根據檢測結果計算“半身人體-圖像 比”表示關鍵幀所有像素點中半身人體像素點所占的比例;步驟340.采用貝葉斯方法,根據公式C3)所示的比較結果,對關鍵幀進行皮膚區域檢 測,并根據檢測結果計算“皮膚-圖像比”表示關鍵幀所有像素點中皮膚像素點所占的比例P(p/skin)/P(p/non-skin)彡 T8(3)其中,P表示關鍵幀中任一個像素點,P(p/skin)表示膚色高斯模型下產生ρ的概率, P(p/non-skin)表示非膚色高斯模型下產生ρ的概率,如果公式(;3)成立,則判斷ρ為皮膚 像素點,否則判斷P為非皮膚像素點,T8取值在1到10之間,該閾值控制單幀色情內容檢測 的精度。步驟350.基于步驟310-340得到的檢測結果,計算“身體皮膚-正面人臉比”表示關 鍵幀中身體皮膚像素點與正面人臉像素點的個數之比;以及“身體皮膚-側面人臉比”表示 關鍵幀中身體皮膚像素點與側面人臉像素點的個數之比;步驟360.根據步驟310-350得到的計算結果,判斷所述關鍵幀是否包含色情內容,判 定規則如下如果Ttl彡半身人體-圖像比彡T1且T2彡皮膚-圖像比彡T3且正面人臉-圖 像比< T4且側面人臉-圖像比< T5且身體皮膚-正面人臉比彡T6且身體皮膚-側面人臉 比》T7,則判定關鍵幀包含色情內容,否則判斷不包含色情內容,其中1\、T2, T3, T4, T5取值 都在0到1之間,T6和T7取值都在1到10之間。
5.根據權利要求1所述的網絡色情視頻實時檢測方法,其特征在于,所述步驟400,包 括下列步驟步驟410.統計已檢測的N。幀關鍵幀中,判定為包含色情內容的關鍵幀數目Np;步驟420.令N為步驟100確定的所需抽取關鍵幀的數目,如果Np/N ^ Tp,判定為“是”; 如果(Ν。_ΝΡ) /N彡(I-Tp),判定為“否”;否則判定為“不定”;其中Tp取值在0到1之間,該 閾值控制色情視頻檢測的精度。
6.一種網絡色情視頻實時檢測系統,其特征在于,所述系統,包括關鍵幀預抽取隊列構建單元,用于根據網絡視頻的長度,建立關鍵幀預抽取幀號隊列 KFN= Inpn2,…,ηΝ},其中 Ii1 < η2 <".< ηΝ ;關鍵幀抽取單元,用于根據所述關鍵幀預抽取幀號隊列,按順序抽取一幀關鍵幀并解碼;關鍵幀檢測單元,用于對解碼后的關鍵幀進行色情內容檢測,判斷該關鍵幀是否包含 色情內容;視頻內容檢測單元,用于根據得到的對單個關鍵幀色情內容的檢測結果,連同之前得 到的其他關鍵幀的檢測結果,進行決策融合判定如果判定“是”,則認為該視頻包含色情內 容,結束檢測;如果判定“否”,則認為該視頻不包含色情內容,結束檢測;如果判定“不定”, 則觸發關鍵幀抽取單元,繼續進行單個關鍵幀的檢測。
7.根據權利要求6所述的網絡色情視頻實時檢測系統,其特征在于,所述關鍵幀預抽 取隊列構建單元,包括抽取策略模塊,根據視頻的長度提供相應抽取策略如果視頻長度小于或等于L秒,則將根據公式(1)等間隔抽取N1幀關鍵幀作為預抽取 策略U1 = = \,2”..,Νλ(1)TV1 +1其中,Hi是第i個關鍵幀的幀號,W是視頻的總幀數,L取值5到10之間,N1取值5到 20之間;如果視頻長度大于L秒,則將根據公式(2)對視頻中間的視頻段等間隔抽取N2幀 關鍵幀作為預抽取策略
8.根據權利要求6所述的網絡色情視頻實時檢測系統,其特征在于,所述關鍵幀抽取 單元,包括解碼模塊,用于解碼抽取的關鍵幀抽。
9.根據權利要求6所述的網絡色情視頻實時檢測系統,其特征在于,所述關鍵幀檢測 單元,包括正面人臉檢測模塊,用于對所述關鍵幀進行多角度正面人臉檢測,并根據檢測結果計 算“正面人臉-圖像比”表示關鍵幀所有像素點中正面人臉像素點所占的比例;側面人臉檢測模塊,用于對關鍵幀進行多角度側面人臉檢測,并根據檢測結果計算“側 面人臉-圖像比”表示關鍵幀所有像素點中側面人臉像素點所占的比例;半身人體檢測模塊,用于對關鍵幀進行多角度半身人體檢測,并根據檢測結果計算“半 身人體-圖像比”表示關鍵幀所有像素點中半身人體像素點所占的比例;皮膚區域檢測模塊,用于采用貝葉斯方法,根據公式C3)所示的比較結果,對關鍵幀進 行皮膚區域檢測,并根據檢測結果計算“皮膚-圖像比”表示關鍵幀所有像素點中皮膚像素 點所占的比例P(p/skin)/P(p/non-skin)彡 T8(3)其中,P表示關鍵幀中任一個像素點,P(p/skin)表示膚色高斯模型下產生ρ的概率, P(p/non-skin)表示非膚色高斯模型下產生ρ的概率,如果公式(;3)成立,則判斷ρ為皮膚 像素點,否則判斷P為非皮膚像素點,T8取值在1到10之間,該閾值控制單幀色情內容檢測 的精度。比例計算模塊,用于根據檢測結果,計算“身體皮膚-正面人臉比”表示關鍵幀中身體 皮膚像素點與正面人臉像素點的個數之比;以及“身體皮膚-側面人臉比”表示關鍵幀中身 體皮膚像素點與側面人臉像素點的個數之比;判定模塊,用于根據計算結果,判斷所述關鍵幀是否包含色情內容,判定規則如下如 果Ttl彡半身人體-圖像比彡T1且T2彡皮膚-圖像比彡T3且正面人臉-圖像比彡T4且側 面人臉-圖像比彡T5且身體皮膚-正面人臉比彡T6且身體皮膚-側面人臉比彡T7,則判 定關鍵幀包含色情內容,否則判斷不包含色情內容,其中Ι\、Τ2、Τ3、Τ4、Τ5取值都在0到1之 間,T6和T7取值都在1到10之間。
10.根據權利要求6所述的網絡色情視頻實時檢測系統,其特征在于,視頻內容檢測單 元,包括統計模塊,用于統計已檢測的N。幀關鍵幀中,判定為包含色情內容的關鍵幀數目Np ;色情視頻判定模塊,令N為所述關鍵幀預抽取隊列中關鍵幀的數目,如果Np/N ^ Τρ,判定為“是”;如果(N。_NP) /N≥(I-Tp),判定為“否”;否則判定為“不定”;其中Tp取值在0到 1之間,該閾值控制色情視頻檢測的精度。
全文摘要
本發明公開了一種網絡色情視頻實時檢測方法和系統。所述方法包括下列步驟根據網絡視頻的長度,建立關鍵幀預抽取幀號隊列KFN={n1,n2,…,nN},其中n1<n2<…<nN;根據所述關鍵幀預抽取幀號隊列,按順序抽取一幀關鍵幀并解碼;對解碼后的關鍵幀進行色情內容檢測,判斷該關鍵幀是否包含色情內容;根據對單個關鍵幀色情內容的檢測結果,連同之前得到的其他關鍵幀的檢測結果,進行決策融合判定如果判定“是”,則認為該視頻包含色情內容,結束檢測;如果判定“否”,則認為該視頻不包含色情內容,結束檢測;如果判定“不定”,則繼續進行單個關鍵幀的檢測。
文檔編號G06F17/30GK102073676SQ20101056830
公開日2011年5月25日 申請日期2010年11月30日 優先權日2010年11月30日
發明者萬吉, 劉武, 夏添, 張勇東, 李錦濤, 黃磊 申請人:中國科學院計算技術研究所