專利名稱::一種基于內容的視頻拷貝監測的方法及系統的制作方法
技術領域:
:本發明屬于多媒體領域,特別涉及一種基于內容的視頻拷貝監測的方法及系統。
背景技術:
:基于內容的視頻拷貝監測(CBCD:Content-basedCopyDetection)是近年來發展起來的一項重要技術,它被廣泛地應用于基于內容的盜版監測、廣告監測等領域。CBCD方法包括兩個步驟(1)根據計算得到的敏感視頻的各關鍵幀的特征向量,生成敏感視頻的指紋,建立纟見頻指紋庫;(2)獲取待監測視頻,根據計算得到的待監測視頻關鍵幀的特征向量,生成待監測視頻的指紋,在視頻指紋庫中進行查詢匹配,以判斷是否有和待監測視頻內容相同的拷貝;CBCD的核心技術包括視頻指紋的生成和指紋的匹配查詢。這里視頻指紋指根據視頻內容生成的用于唯一標識該視頻的特征數據,是包括多個關鍵幀的特征相量的一個向量序列。關^l建幀為代表一段視頻多個圖1^象幀的一個圖像幀,如代表一個鏡頭(一個視頻由多個鏡頭組成,一個鏡頭是同一個攝像機連續拍攝下的一組圖像幀)中所有圖像幀的一個圖像幀,特征向量可以由一個特征點的描述數據組成,也可以由一陣圖像中各個分塊的統計特征組成,關鍵幀的特征向量是指,由一個關鍵幀抽取出的一個表示其特征的高維向量。簡單來說,向量就是若干數字。我們日常生活中用到的向量一般都是二位或者三維,即二位空間中的點p氣x,y)或者三維空間中的點p=(x,y,z)。圖像處理中一個圖像的特征向量則可能有幾千維。一般認為低于20維的是低維,高于這個維度被認為是高維。在現有的CBCD系統實現中遇到的問題是一個待監測視頻是一個指紋庫中敏感視頻的完整拷貝,實際情況往往是一個待監測視頻由多個視頻片段剪輯而成,而指紋庫中的敏感視頻也可能是由多個視頻片段剪輯而成,如圖1所示。所以可能一個待監測視頻的某個視頻片段是指紋庫中的視頻1片段的拷貝,但待監測視頻的另外一段是指紋庫中另外一個敏感視頻2的片段的拷貝,現有技術僅能判斷一個待監測視頻是否為指紋庫中一個敏感視頻的完整拷貝,無法確定,待監測視頻的一個片段中的內容(多個圖像幀)是否為視頻指紋庫中的敏感視頻的拷貝內容,可見現有技術對于相同拷貝的查詢匹配能力較弱。
發明內容為了解決現有技術對于相同拷貝的查詢匹配能力較弱的問題,本發明實施例提供了一種基于內容的視頻拷貝監測方法,包括抽取待監測視頻中代表多個圖像幀的關鍵幀,獲取抽取的關鍵幀的特征向量;在視頻指紋庫敏感視頻的關鍵幀特征相量中,若查找到與獲取的特征向量屬于同一拷貝的特征相量;則確定待監測視頻關鍵幀代表的多個圖像幀屬于視頻指紋庫敏感視頻。同時本發明實施例還提供一種基于內容的視頻拷貝監測的系統,包括獲取模塊用于抽取待監測視頻中的關鍵幀,獲取抽取的關鍵幀的特征向量,所述關鍵幀為代表一組圖像幀的一個圖像幀;匹配模塊用于在視頻指紋庫敏感視頻的關鍵幀特征相量中,查找到與獲取的特征向量之間的距離小于預設定閾值的特征相量;確定模塊用于確定在視頻指紋庫的敏感視頻中有和待監測視頻內容相同的拷貝內容。由上述本發明提供的具體實施方案可以看出,正是由于在指紋庫的特征相量中,查找與待監測視頻中抽取的特征向量屬于同一拷貝的特征相量,進而可以確定待監測視頻關鍵幀代表的多個圖像幀屬于視頻指紋庫敏感視,提高了相同拷貝的查詢匹配能力。圖1為現有技術中待監測視頻由多個視頻片段剪輯示意圖;圖2為本發明提供的第一實施例方法流程圖;圖3為本發明提供的第二實施例系統結構圖。具體實施例方式為了確定待監測視頻的一個片段中的內容(多個圖像幀)是否屬于視頻指紋庫中的敏感視頻,本發明實施例公開的方案的基本思想是從待監測視頻中抽取代表一組圖像幀中多個圖像幀的關鍵幀,獲取該關鍵幀的特征向量,通過用戶上傳的敏感視頻計算各關鍵幀對應的特征向量,組織敏感視頻的視頻指紋庫,在視頻指紋庫敏感視頻的關鍵幀特征相量中,查找與獲取的特征向量屬于同一拷貝的特征相量,確定在視頻指紋庫敏感視頻中有和待監測視頻內容(關鍵幀代表的一組圖像幀)相同的拷貝。相對于傳統的視頻拷貝監測方法,該方法可以確定待監測視頻關鍵幀代表的多個圖像幀組成的視頻片段屬于視頻指紋庫敏感纟見頻。本發明提供的第一實施例是一種基于內容的視頻拷貝監測方法,方法流程如圖2所示,包括步驟102:抽取待監測視頻中代表一個鏡頭Cl的所有圖像幀的關鍵幀A,獲取關鍵幀A的特征向量一。步驟104:在視頻指紋庫(具體是視頻指紋庫中的視頻指紋特征向量索引庫)敏感視頻的關鍵幀特征相量k......5"中,查找到和;之間的距離D(a,—)<R,5l和^屬于同一拷貝。其中/7為正整^:,R為預i殳定閾值。步驟106:確定在視頻指紋庫中存儲的敏感視頻中,有和待監測視頻鏡頭Cl內容相同的拷貝內容。至此,可以確定待監測視頻的鏡頭C1為視頻指紋庫中的敏感視頻的拷貝,提高了相同拷貝的查詢匹配能力。進一步,為了提供與鏡頭C1相接近的鏡頭C,所屬敏感視頻C,的詳細描述信息,及鏡頭C,在敏感視頻C,中的起止時間,本實施例通過下面的步驟進行說明。<table>tableseeoriginaldocumentpage7</column></row><table>)<table>tableseeoriginaldocumentpage7</column></row><table>確定視頻C,的詳細描述信息。該詳細描述信息為名稱test、長度1小時、分辨率1024*768、碼率500KBPS、格式RMVB、來源用戶甲和發生拷貝匹配時的操作碼1A2B,中的一個或多個。在-見頻信息庫中的編號詳細描述信息1000名稱test、長度l小時、分辨率1024*768、碼率500KBPS、格式RMVB、來源用戶曱和發生拷貝匹配時的操作碼1A2B1001.......1010...表3作為優選方案,步驟i02中關鍵幀A代表一個鏡頭Cl的所有圖像幀,也可以是關鍵幀A代表圖像幀,不以每個鏡頭中的圖像幀為集合,也可以是關鍵幀A代表鏡頭Cl和鏡頭C2兩個鏡頭中的所有圖像幀,或者,鏡頭Cl中的圖像幀前半部分的關鍵幀為關鍵幀A,后半部分分的關鍵幀為關鍵幀B。或者連續的圖像幀的特征向量的差值在一定范圍內的圖像幀,由一個關鍵幀代表。步驟104中視頻指紋特征向量索引庫由用戶上傳的敏感視頻的關鍵幀特征向量按照空間分割、數據分割或者哈希方式組織。具體采用什么組織方法跟向量維度相關。之所以要給指紋的特征向量建索引庫是為了快速查找,比如從1億個特征向量中找出和手頭待監測的特征向量最接近的特征向量,需要進行分類以加快搜索速度。空間分割、數據分割就是分類的方法,即先找到與待監測的向量接近的分類,然后在這個分類中進行一一比對,這樣其他類的向量就不用做比對了。但分類的方法只適用于小于20維的向量,對于更高的維度,則需要使用PCA(PrincipalComponentsAnalysis,主成分分析)、HilbertCurve(希爾伯特曲線)等方法降維,或者使用VA-File(向量近似文件)、LSH(LocalitySensitiveHashing,位置敏感哈希)等近似搜索算法。步驟104中預設定閾值的R可以根據下面的步驟得到,在將敏感視頻的關鍵幀特征向量加入視頻指紋庫時,對敏感視頻的關鍵幀進行變換,然后計算變換后的特征向量,以變換前關鍵幀的特征向量和關鍵幀變換后的特征向量兩兩之間距離的最大值作為預設定閾值R。因為預設定閾值R是指各特征向量兩兩之間距離的最大值,因此如有一個特征向量和此處的敏感—見頻的關鍵幀進行變換是指縮放、才莫糊、旋轉、增減字幕和增減臺標變換中的部分或全部變換。本發明提供的第二實施例是一種基于內容的視頻拷貝監測系統,其結構如圖3所示,包括獲取模塊202:用于抽取待監測視頻中的關鍵幀,獲取抽取的關鍵幀的特征向量,所述關鍵幀為代表一組圖像幀的一個圖像幀;匹配模塊204:用于在視頻指紋庫敏感視頻的關鍵幀特征相量中,查找到與獲取的特征向量之間的距離小于預設定閾值的特征相量;確定模塊206:用于確定在視頻指紋庫的敏感視頻中有和待監測視頻內容相同的拷貝內容。進一步,該系統還包括變換模塊208:用于對待加入視頻指紋庫的敏感視頻的關鍵幀進行變換,然后計算變換后的特征向量,以變換前關鍵幀的特征向量和關鍵幀變換后的特征向量兩兩之間距離的最大值作為預設定閾值。進一步,獲取模塊202:還用于抽取待監測視頻中代表一個視頻鏡頭所有圖像幀的關鍵幀,獲取抽取的關鍵幀的特征向量。進一步,確定模塊206:還用于根據查找到的特征相量,以及敏感視頻的關鍵幀特征相量和敏感視頻的關鍵幀所屬視頻鏡頭描述信息的對應關系,確定查找到的特征相量對應的視頻鏡頭描述信息,所述描述信息包括視頻鏡頭所屬的視頻的編號和視頻鏡頭在所屬視頻的起止時間,根據確定的視頻鏡頭所屬的視頻的編號,確定該視頻鏡頭所屬視頻的詳細描述信息。明的精神和范圍。這樣,倘若本發明的這些修改和變型屬于本發明權利要求及其等同技術的范圍之內,則本發明也意圖包含這些改動和變型在內。權利要求1、一種基于內容的視頻拷貝監測的方法,其特征在于,包括抽取待監測視頻中的關鍵幀,獲取抽取的關鍵幀的特征向量;在視頻指紋庫敏感視頻的關鍵幀特征相量中,若查找到與獲取的特征向量之間的距離小于預設定閾值的特征相量;則確定在視頻指紋庫的敏感視頻中有和待監測視頻內容相同的拷貝內容。2、如權利要求1所述的方法,其特征在于,查找與獲取的特征向量之間的距離小于預設定閾值的特征相量前包括對待加入視頻指紋庫的敏感視頻的關鍵幀進行變換,計算變換后的特征向量;以變換前關鍵幀的特征向量和變換后關鍵幀的特征向量兩兩之間距離的最大值作為預設定閾值。3、如權利要求2所述的方法,其特征在于,所述對敏感視頻的關鍵幀進行變換包括對敏感視頻的關鍵幀進行縮放、模糊、旋轉、增減字幕和增減臺標變換中的部分或全部變換。4、如權利要求1所述的方法,其特征在于,抽取待監測視頻中代表多個圖像幀的關鍵幀,獲取抽取的關鍵幀的特征向量具體為抽取待監測視頻中代表一個視頻鏡頭所有圖像幀的關鍵幀,獲取抽取的關鍵幀的特征向量。5、如權利要求4所述的方法,其特征在于,根據查找到的特征相量,以及敏感視頻的關鍵幀特征相量和敏感視頻的關鍵幀所屬視頻鏡頭描述信息的對應關系,確定查找到的特征相量對應的視頻鏡頭描述信息,所述描述信息包括視頻鏡頭所屬的視頻的編號和視頻鏡頭在所屬視頻的起止時間;根據確定的^L頻鏡頭所屬的視頻的編號,確定該^L頻鏡頭所屬視頻的詳細描述信息。6、如權利要求5所述的方法,其特征在于,所述^L頻的詳細描述信息包括編號、名稱、長度、分辨率、碼率、格式和來源任意之一或組合。7、一種基于內容的視頻拷貝監測的系統,其特征在于,包括獲取模塊用于抽取待監測視頻中的關鍵幀,獲取抽取的關鍵幀的特征向量,所述關鍵幀為代表一組圖像幀的一個圖像幀;匹配模塊用于在視頻指紋庫敏感視頻的關鍵幀特征相量中,查找到與獲取的特征向量之間的距離小于預設定閾值的特征相量;確定模塊用于確定在視頻指紋庫的敏感視頻中有和待監測視頻內容相同的拷貝內容。8、如權利要求7所述的系統,其特征在于,還包括變換模塊用于對待加入視頻指故庫的敏感視頻的關鍵幀進行變換,然后計算變換后的特征向量,以變換前關鍵幀的特征向量和關鍵幀變換后的特征向量兩兩之間距離的最大值作為預設定閾值。9、如權利要求7所迷的系統,其特征在于,獲取^莫塊還用于抽取待監測視頻中代表一個視頻鏡頭所有圖像幀的關鍵幀,獲取抽取的關鍵幀的特征向量。10、如權利要求9所述的系統,其特征在于,確定模塊還用于根據查找到的特征相量,以及敏感視頻的關鍵幀特征相量和敏感視頻的關鍵幀所屬視頻鏡頭描述信息的對應關系,確定查找到的特征相量對應的視頻鏡頭描述信息,所述描述信息包括^L頻鏡頭所屬的視頻的編號和—見頻鏡頭在所屬視頻的起止時間,根據確定的視頻鏡頭所屬的視頻的編號,確定該視頻鏡頭所屬視頻的詳細描述信息。全文摘要本發明公開了一種基于內容的視頻拷貝監測方法及系統,為了解決現有技術對于相同拷貝的查詢匹配能力較弱的問題,該方法包括抽取待監測視頻中的關鍵幀,獲取抽取的關鍵幀的特征向量,所述關鍵幀為代表一組圖像幀的一個圖像幀;在視頻指紋庫敏感視頻的關鍵幀特征相量中,查找到與獲取的特征向量之間的距離小于預設定閾值的特征相量;確定在視頻指紋庫的敏感視頻中有和待監測視頻內容相同的拷貝內容,由于在指紋庫的特征相量中,查找與待監測視頻中抽取的特征向量屬于同一拷貝的特征相量,進而可以確定待監測視頻關鍵幀代表的多個圖像幀屬于視頻指紋庫敏感視頻,提高了相同拷貝的查詢匹配能力。文檔編號H04N5/913GK101442641SQ20081022710公開日2009年5月27日申請日期2008年11月21日優先權日2008年11月21日發明者浩尹,張煥強,雯惠,錚李,陳文濤,東黃申請人:清華大學;北京藍汛通信技術有限責任公司