臺標識別方法及裝置的制造方法
【專利摘要】本發明公開了一種臺標識別方法及裝置,涉及信息識別技術領域,所述方法包括:判斷臺標區域中的待識別臺標是否為央視臺標;在所述待識別臺標為央視臺標時,按照第一預設策略對所述待識別臺標進行識別;在所述待識別臺標為非央視臺標時,按照第二預設策略對所述待識別臺標進行識別。本發明提供的臺標識別方法及裝置,不再對各臺標均采用相同方式進行識別,而是先判斷臺標區域中的待識別臺標是否為央視臺標,再對央視臺標和非央視臺標采用不同策略進行識別,能夠有效地針對央視臺標和非央視臺標的特征對待識別臺標進行識別,提高了識別效率和識別準確率。
【專利說明】
臺標識別方法及裝置
技術領域
[0001] 本發明涉及信息識別技術領域,特別涉及一種臺標識別方法及裝置。
【背景技術】
[0002] 智能電視正順應"高清化"、"網絡化"、"智能化"的趨勢迅速發展,具備從因特網、 視頻設備、計算機等多種渠道獲得節目內容、通過信息融合的方式將消費者最需要的內容 在大屏幕上清晰展現的功能。與傳統電視相比,智能電視為用戶提供了更加快捷、智能、人 性化的應用服務。
[0003] 智能電視包含大量點播視頻、直播節目,絕大多數的電視節目保留了節目出品方 的臺標。臺標是區分電視臺的重要標志,包含了電視臺臺名、節目來源、節目取向等重要的 語義信息,是實現視頻分析、理解和檢索的重要語義源。臺標識別技術的實現,將有效實現 節目單功能,并對理解用戶喜好、投放增值服務具有十分重要的意義。
[0004] 現有技術中在對臺標進行識別時,通常采用以下兩種方案:
[0005] 第一種方案:基于單幀圖像的臺標識別方案。該種方法以邊緣距離變換矩陣作為 特征,均采用模板匹配的方式,包括全局邊緣匹配(滑動窗口遍歷整個臺標區域)、分塊匹配 (采用人工方式過濾非邊緣)、顏色形狀匹配(顏色和形狀特征同時匹配,為節目搜索進行分 類排序)等。
[0006] 第二種方案:基于多幀圖像的臺標識別方法。該種方案通常可采用以下三種方法: 一、利用連續多幀視頻幀序列的敏感區域(即臺標區域)像素點的特征值變化來分割圖像, 并進行邊緣檢測,采用滑動窗口和分塊方法進行匹配識別。二、綜合利用顏色和形狀特征, 根據時空不變性在幀序列中分割臺標,利用空間分布直方圖結合HSV彩色直方圖對特征進 行有效描述,最后利用SUV完成臺標識別。方法三:計算相鄰幀圖像的變化,提取臺標及其Hu 不變矩,并根據候選集合和預設準則得到識別結果等。
[0007] 但現有技術中,對央視臺標、衛視臺標和地方臺標等采用相同方式進行識別,導致 識別效率和識別準確率過低。
【發明內容】
[0008] 本發明實施例提供一種臺標識別方法及裝置,用以解決現有技術中識別效率和識 別準確率過低的缺陷。
[0009 ]本發明實施例提供一種臺標識別方法,所述方法包括:
[0 010 ]判斷臺標區域中的待識別臺標是否為央視臺標;
[0011]在所述待識別臺標為央視臺標時,按照第一預設策略對所述待識別臺標進行識 別;
[0012] 在所述待識別臺標為非央視臺標時,按照第二預設策略對所述待識別臺標進行識 別。
[0013] 本發明實施例提供一種臺標識別裝置,所述裝置包括:
[0014] 臺標判斷單元,用于判斷臺標區域中的待識別臺標是否為央視臺標;
[0015] 第一識別單元,用于在所述待識別臺標為央視臺標時,按照第一預設策略對所述 待識別臺標進行識別;
[0016] 第二識別單元,用于在所述待識別臺標為非央視臺標時,按照第二預設策略對所 述待識別臺標進行識別。
[0017] 本發明實施例提供的臺標識別方法及裝置,不再對各臺標均采用相同方式進行識 另IJ,而是先判斷臺標區域中的待識別臺標是否為央視臺標,再對央視臺標和非央視臺標采 用不同策略進行識別,能夠有效地針對央視臺標和非央視臺標的特征對待識別臺標進行識 另IJ,提高了識別效率和識別準確率。
【附圖說明】
[0018] 為了更清楚地說明本發明實施例或現有技術中的技術方案,下面將對實施例或現 有技術描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發 明的一些實施例,對于本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根 據這些附圖獲得其他的附圖。
[0019] 圖1是本發明一種實施方式的臺標識別方法的流程圖;
[0020]圖2是本發明一種實施方式中區域分割前的視頻幀圖像的示意圖;
[0021 ]圖3是本發明一種實施方式中區域分割后的視頻幀圖像的示意圖;
[0022] 圖4是以CCTV5為例,將各視頻幀圖像的邊緣進行合成的整體效果圖;
[0023] 圖5是本發明一種實施方式的臺標識別方法的流程圖;
[0024]圖6是本發明一種實施方式的臺標識別裝置的結構框圖。
【具體實施方式】
[0025]為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例 中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是 本發明一部分實施例,而不是全部的實施例。基于本發明中的實施例,本領域普通技術人員 在沒有作出創造性勞動前提下所獲得的所有其他實施例,都屬于本發明保護的范圍。
[0026] 應理解的是,雖然【背景技術】中主要針對智能電視中電視節目的臺標識別,但本公 開的實施方式并不限于此,其還可適用于其他對象(諸如,平板電腦、手機、PC機等設備)中 電視節目的臺標識別,也就是說,凡是涉及到電視節目的臺標識別的場景均包括在本實施 方式的應用范圍內。
[0027] 圖1是本發明一種實施方式的臺標識別方法的流程圖;參照圖1,所述方法包括:
[0028] S101:判斷臺標區域中的待識別臺標是否為央視臺標;
[0029] 需要說明的是,所述臺標區域即為僅包括待識別臺標的區域。
[0030] 可理解的是,所述臺標區域可通過多種方式進行提取,為了防止隨機噪聲、畫面噪 聲等噪聲對臺標識別的影響,本實施方式中,通過以下步驟獲取包括待識別臺標的臺標區 域:
[0031] (1)從包括待識別臺標的視頻的預設區域內獲取視頻幀圖像序列;
[0032] 根據先驗知識,電視臺臺標基本全部位于視頻幀圖像的左上角(當然,若處于其他 位置,也可根據需要進行適應性調整即可),因此臺標檢測時,只需提取固定的左上角區域 (即預設區域)作為臺標檢測區域即可。現有的臺標識別方法一般按照最優區域規則(GSR) 獲取臺標區域,本實施方式與現有的臺標識別方法不同之處在于:(1)計算所有臺標在各視 頻幀圖像中有效識別的比例位置;(2)計算所有比例位置的最大范圍作為臺標區域分割的 區域。以1920*1080的視頻為例,臺標分割區域為--行開始位置80(1/24),列開始位置40 (1/27),行寬450(15/64),列寬180(1/6),區域分割效果如圖2和圖3所示,當然,所述比例位 置可根據需要進行適當調整,本實施方式對此不加以限制。
[0033]為消除圖像中無關的信息、恢復或增強有用的相關信息,提高特征的可檢測性,最 大限度地簡化數據,以確保識別的可靠性,本實施方式中,可對各視頻幀圖像進行預處理, 所述預處理包括:區域分割、灰度化和圖像增強中的至少一種,當然,還可包括其他處理過 程,本實施方式對此不加以限制。
[0034] 所述預處理可采用公式Gray = 0.33R+0.59G+0.11B進行灰度化,當然,也可通過三 通道平均值法或三通道最大值法等方式替代,其中,Gray為像素的灰度值,R為像素的紅色 分量,G為像素的綠色分量,B為像素的藍色分量。
[0035]所述圖像增強的目的是突出臺標區域有效信息,如圖標、文字、數字等,圖像增強 采用0~255灰度級的灰度拉伸,也可用直方圖變換法替代。
[0036] (2)對各視頻幀圖像進行邊緣提取;
[0037]可理解的是,邊緣是圖像灰度變化劇烈之處,邊緣提取是臺標識別的關鍵,邊緣的 完整程度直接影響臺標識別結果,當然,邊緣提取的方法有很多,如0&111^、11?、5〇1^1、拉普 拉斯算子法等。綜合考慮去噪、邊緣完整性、邊緣定位精度等要求,本實施方式中采用Canny 邊緣檢測方法。
[0038]在具體實現中,Canny邊緣檢測方法的參數設置為:弱邊緣閾值50,強邊緣閾值 200,當然,也可根據需要進行適當浮動,例如,閾值在±10的范圍內進行浮動。
[0039] (3)將各視頻幀圖像的邊緣進行合成;
[0040]在具體實現中,可根據所述視頻幀圖像的數量來確定對應的預設圖像閾值,再根 據所述各邊緣點在視頻幀圖像的數量是否低于所述預設圖像閾值來判斷是否保留該邊緣 點。
[0041] 也就是說,預先建立視頻幀圖像的數量與預設圖像閾值之間的對應關系,根據所 述視頻幀圖像的數量查找對應關系,以確定對應的預設圖像閾值,在具有各邊緣點在視頻 幀圖像的數量低于所述預設圖像閾值時,不保留該邊緣點,在各邊緣點在視頻幀圖像的數 量高于等于所述預設圖像閾值時,保留該邊緣點。
[0042] 下面以一個具體的實施例來說明將各視頻幀圖像的邊緣進行合成,但不限定本發 明的保護范圍:設N為視頻幀圖像的數量,X為預設圖像閾值。
[0043] 當N = 6時,相應地,X = 4,也就是說,只有邊緣點在4個以上(包括4)的視頻幀圖像 中存在時才保留,若邊緣點在3個以下(包括3)的視頻幀圖像中存在時則舍棄;
[0044] 當6>N>3時,相應地,X = 3,也就是說,只有邊緣點在3個以上(包括3)的視頻幀圖像 中存在時才保留,若邊緣點在2個以下(包括2)的視頻幀圖像中存在時則舍棄;
[0045] 當3時,相應地,X = N,也就是說,只有邊緣點在所有視頻幀圖像中存在時才保 留,其他情況均舍棄。
[0046]當然,所述對應關系中的參數可根據圖像的分辨率進行調整,本實施方式對此不 加以限制。
[0047]以CCTV5為例,圖4展示了合成的整體效果。
[0048] 由于邊緣噪聲、黑邊和非必要文字等均會對識別準確率造成影響,為進一步提高 識別準確率,可合成的邊緣進行優化處理,本實施方式中,所述優化處理包括:邊緣噪聲刪 除、黑邊去除和非必要文字刪除中的至少一種。
[0049] (4)獲取合成的邊緣的最小外接矩陣;
[0050] (5)按照所述最小外接矩陣分別對各視頻幀圖像進行分割,并將分割出的圖像通 過加權平均的方式進行合成,以獲得包括待識別臺標的臺標區域。
[0051] S102:在所述待識別臺標為央視臺標時,按照第一預設策略對所述待識別臺標進 行識別;
[0052] 在具體實現中,由于央視臺標的差別僅在于數字和文字不同,故而,可針對央視臺 標的特征,按照第一預設策略對所述待識別臺標進行識別。
[0053] S103:在所述待識別臺標為非央視臺標時,按照第二預設策略對所述待識別臺標 進行識別。
[0054]可理解的是,可針對非央視臺標的特征,按照第二預設策略對所述待識別臺標進 行識別。
[0055] 本實施方式不再對各臺標均采用相同方式進行識別,而是先判斷臺標區域中的待 識別臺標是否為央視臺標,再對央視臺標和非央視臺標采用不同策略進行識別,能夠有效 地針對央視臺標和非央視臺標的特征對待識別臺標進行識別,提高了識別效率和識別準確 率。
[0056] 圖5是本發明一種實施方式的臺標識別方法的流程圖;參照圖2,所述方法包括:
[0057] S501:判斷臺標區域中的待識別臺標是否為央視臺標;
[0058]可理解的是,判斷臺標區域中的待識別臺標是否為央視臺標時,可采用多種方式, 為保證判斷的準確率,本實施方式中,根據臺標區域的長寬比、灰度和顏色判斷臺標區域中 的待識別臺標是否為央視臺標。
[0059]研究發現,央視臺標相對衛視臺標、地方臺標的特點和差異發現:(1)長寬比差異, 央視臺標的長寬比(長:豎直方向長度;寬:水平方向寬度)普遍明顯小于其他臺標;(2)央視 臺標的彩色圖有廣泛的白色像素特征,尤其表現在左側2/3處;(3)央視臺標的灰度圖分塊 后,子塊之間滿足灰度接近的相關約束,如均值、方差等。
[0060] 故而,可通過所述臺標區域的長寬比、灰度和顏色的不同來對所述臺標區域進行 分類。
[0061] 由于長寬比是臺標最直接的特征之一。故而,可先對所述臺標區域通過長寬比進 行初步判斷,也就是說,先計算各臺標區域的長寬比,計算長寬比的方法為:計算臺標區域 的長度Η和寬度W,長寬比ratio=W/H。
[0062] 央視臺標的ratio通常在0.3以下,故而,可構建的初步判斷條件為:ratio〈0.3。但 是,內蒙古衛視、重慶衛視、北京衛視等衛視臺(包括這些衛視的地方臺)臺標的ratio均在 0.3以下,故而,可通過長寬比篩選后,再通過灰度和顏色進行再次篩選。
[0063] 通過灰度和顏色進行再次篩選時,可根據以下判斷條件進行分類,也就是說,設置 以下用于進一步判斷的條件:
[0064] (1)所述臺標區域左上角的第一預設范圍內的紅色分量和所述臺標區域右下角的 第二預設范圍內的紅色分量的均值小于預設紅色分量。
[0065]也就是說,可將臺標區域按行*列分為5*3子塊(當然,也可通過6*3或4*3等方式進 行分塊),提取左上角的第一個子塊areal(即第一預設范圍)和右下角的第一個子塊area2 (即第二預設范圍)。央視臺標和重慶衛視臺標、北京衛視臺標等在這兩個區域的紅色分布 截然不同。
[0066] 綜合干擾臺標和央視臺標的顏色特征,可構建條件1 (即Condi t i on 1)--area 1和 area2的紅色均值小于150。
[0067] (2)所述臺標區域左側第三預設范圍內的灰度均值小于預設灰度值。
[0068] 考慮Conditionl的容錯性和央視臺標半透明的特點,取子塊area3。可以臺標區域 的寬度方向50個像素為標準,取臺標區域最左8列像素(即寬的4/25)構成area3(即第三預 設范圍)。
[0069] 分析干擾臺標和CCTV臺標在area3的灰度差異,構建條件2(Condition2)-- area3的灰度均值小于100。
[0070] 可理解的是,可通過三通道經典合成法Gray = 0.33R+0.59G+0.11B來獲得灰度圖 像,也可通過三通道最大值法、三通道平均值法等,本實施方式對此不加以限制。
[0071] (3)將所述臺標區域分割為至少4個部分,分割后的預設部分之間的像素均值的絕 對差不超過預設絕對差;
[0072] 由于Conditionl和Condition2只包含了各子塊的自身信息,需將約束擴展至子塊 間的關系。分析發現,臺標區域中的文字、數字像素主要位于臺標區域的后1/3列。為此,將 臺標區域按照行*列分為2*3子塊(當然,也可通過3*3等方式進行分塊),取前2*2子塊(即分 割后的預設部分)分別表不為
[0073] 多樣本嚴格計算發現,CCTV臺標在這4個子塊處基本如下條件:
[0074] 條件 3(Condition3)--area4、area5、area6 和 area7 的均值之絕對差不超過 100〇
[0075] (4)分割后的預設部分之間的像素均值的方差不超過預設方差。
[0076] 也就是說,以上4個子塊的像素均值的方差均有不同,故而,CCTV臺標在這4個子塊 處滿足如下條件:
[0077] 條件4(Condition4)--&代&4、&代&5、&代&6和&代&7的均值序列之方差不超過 1600〇
[0078] 某臺標樣本同時滿足以上Conditionl~Condition4時,可將其判斷為央視臺標, 否則判斷為非央視臺標。上述條件同時判斷時,準確率最高,實驗證明,缺少任意一項條件 均會提高多樣本分類的錯誤率。
[0079] S502:在所述待識別臺標為央視臺標時,提取所述臺標區域中的數字區域,對提取 的數字區域進行位數判別,根據位數判別結果識別所述數字區域中的數字,將央視臺標的 標志和識別的數字之間的組合作為所述待識別臺標的識別結果;
[0080]需要說明的是,所述央視臺標包含標志(即CCTV)、文字和數字,常見央視臺標的差 異在于文字和數字。模式識別領域中,數字識別比文字識別容易、穩定、快速。同時,央視臺 標的數字可單獨描述具體頻道,從而本實施方式將去除臺標區域中的文字(如"綜合"、"財 經"等),提取臺標區域中的數字(即1、2等)。其中,文字處于臺標下方并與標志有明顯的像 素間隔,可設置預設像素間隔,通過所述提取的邊緣中與標志之間的像素間隔是否超過預 設像素間隔,在超過預設像素間隔時,則確認為文字,對其進行刪除,故而,下述臺標區域即 為僅包括數字和標志的區域。
[0081] 可理解的是,所述數字區域位于所述臺標區域內,并且存在一定的位置關系,因 此,可預先建立所述臺標區域和數字區域之間的位置關系,再根據所述數字區域的位置信 息對所述圖像進行分割處理,以獲得所述數字區域。
[0082] 對于臺標區域而言,數字區域和標志區域(即CCTV所在區域)之間存在如下對應關 系:
[0083] (1)數字區域位于標志區域右側,所占寬度大約等于標志區域的1/4;
[0084] (2)數字區域和標志區域中的字母等高,約占央視臺標整體高度的0.8。
[0085] 故而,可根據所述臺標區域和數字區域之間的位置關系提取所述臺標區域中的數 字區域。
[0086] 另外,為了便于對數字區域中的數字進行識別,可對所述數字區域中的數字部分 和背景部分進行二值化處理,設數字部分設為白色,背景部分設為黑色。
[0087] 由于所述數字區域四個角的位置容易產生白色像素塊/點,并且所述數字區域中 還存在噪聲點,這些干擾信息會對數字識別造成影響,本實施方式中,可對二值化后的數字 區域進行干擾信息刪除。
[0088] 在具體實現中,可根據以下方式刪除所述數字區域四個角的白色像素塊/點:設所 述數字區域的水平寬度為W(等于0.25Wa,Wa為所述臺標區域的寬度)、豎直長度為Η(等于Ha, Ha為所述臺標區域的高度),各像素點灰度值為gray(i,j),i為像素點豎直行坐標,j為像素 點水平列坐標,變換后的灰度值為Gray (i,j),
[0090] 對于所述數字區域中的噪聲點,則可進行噪聲濾波,進一步削弱和減少噪聲點影 響。
[0091] 為進一步提高數字識別的準確率,本實施方式中,先對提取的數字區域進行位數 判別,再根據位數判別結果識別所述數字區域中的數字。
[0092] 可理解的是,對提取的數字區域進行判別可通過多種方式,本實施方式中,按列對 所述數字區域中各像素的灰度值進行投影,以構成長度為所述數字區域水平寬度的投影向 量,在一列投影向量中具有超過預設數量的屬于數字部分的像素時,將該列投影向量進行 標識,若存在相鄰兩個被標識的投影向量之間的最小距離大于預設距離,則將所述數字判 別結果設為兩位,否則將所述數字判別結果設為一位。
[0093] 為進一步提高數字識別的效率,本實施方式中,可通過以下3個步驟根據位數判別 結果識別所述數字區域中的數字:
[0094] (1)獲取數字區域中的白色像素區域A,并計算A的水平寬度w和豎直行寬h。如果h/ w>2,則該臺標為CCTV-1的臺標。否則進入(2)。
[0095] (2)對所述數字區域進行邊緣提取,如果按行*列分塊為m*n個子塊,具體如表1所 示。構建邊緣點概率空間分布直方圖,與標準ο、2~9的數字圖像邊緣點概率空間分布直方 圖計算匹配概率。
[0096] 表1分塊參數
[0098] (3)根據數字判別結果識別所述數字區域中的數字。如果數字判別結果為一位,則 臺標為CCTV-1、CCTV-10~CCTV15的概率為0,如果數字判別結果為兩位,則臺標為CCTV1~ CCTV9的概率均為0,從而完成所述數字區域中的數字識別。
[0099] 考慮識別是否準確的問題,本實施方式中,根據所述位數判別結果將所述數字區 域與標準數字進行匹配,在最高匹配率和次高匹配率不相等時,按照所述最高匹配率對應 的標準數字作為所述數字區域中的數字。
[0100] 當然,在最高匹配率和次高匹配率相等時,不予唯一識別。
[0101 ] S503:在所述待識別臺標為非央視臺標時,計算所述臺標區域的邊緣與各標準臺 標的匹配率;
[0102] 可理解的是,由于非央視臺標通常包括:衛視臺標和地方臺標,本實施方式中,考 慮到衛視臺標的特征和差異,可分為無文字臺標(如東方衛視)、有可分離文字臺標(如東南 衛視,也就是上述的"非必要文字")和有不可完全分離文字臺標(如河北衛視,也就是上述 的"必要文字"),故而,在標準庫中將依據三種不同衛視臺臺標類型進行相應類型標準臺標 的構建。
[0103] 為便于計算所述臺標區域的邊緣與各標準臺標的匹配率,本實施方式中,對所述 臺標區域中的邊緣通過空間分布直方圖與標準臺標進行匹配,以計算所述臺標區域的邊緣 與各標準臺標的匹配率。
[0104] 由于江蘇衛視、東方衛視等臺標只剩下圓形、橢圓形臺標(該類臺標定義為短臺 標),長寬比較小,內蒙古衛視、新疆衛視等電視臺臺標(這類臺標定義為長臺標)的長寬比 明顯大于這些衛視臺標的長寬比。所以,可將長寬比作為分類條件。長臺標的ratio在1.5以 上,識別層次之長寬比比較條件即為:ratio 2 1.5,在分類后,進行匹配時,則可直接按照相 同長寬比類型的標準臺標進行匹配,而無需和所有標準臺標均進行匹配,進一步縮短了匹 配時長。
[0105] 本實施方式中,將臺標區域的邊緣Edge劃分為數量相同的子塊A1、A2、A3…Am,其 中m為子塊的個數。對每個子塊,統計其中的邊緣點概率,即得到空間分布直方圖。例如:短 臺標的Edge分為5*5個子塊,即25個子塊;長臺標的Edge分為5*10 (行*列)個子塊,即50個子 塊。標準圖庫中的各標準臺標也按照短、長進行空間分布直方圖計算,所述臺標區域的空間 分布直方圖與標準臺標逐子塊進行匹配。計匹配的子塊數為n(初值為0),總子塊數為N,如 果某子塊的概率十分接近(例如:概率差〈〇. 05),則n = n+l;匹配結束,計算匹配率為p = n/ N。由此得到遍歷所有標準臺標的匹配率數組P。
[0106]也就是說,參數Δ p用于判斷是否需要進行像素信息匹配。Δ p定義為:Δ p = Pmax-ρ·-,其中,pmax為匹配率數組P的最大值(即最高匹配率為匹配率數組P中除最大 值之外的次大值(即次高匹配率)。
[0107] S504:在最高匹配率與次高匹配率之差大于第一預設差值時,將最高匹配率對應 的標準臺標作為所述待識別臺標的識別結果;
[0108] 考慮到匹配識別有一定的容錯性,設定判斷條件ΔΡ2 0.25(即第一預設差值,當 然,還可為其他值),如果判斷條件A p 2 0.25成立,則將?_對應的標準臺標為作為所述待 識別臺標的識別結果。
[0109] S505:在最高匹配率與次高匹配率之差小于等于第一預設差值時,判斷所述最高 匹配率或次高匹配率對應的標準臺標是否屬于地方臺標;
[0110] 在判斷條件0.25不成立時,則需要確定所述待識別臺標是否為地方臺標,本 實施方式中,需要判斷所述最高匹配率或次高匹配率對應的標準臺標是否屬于地方臺標。
[0111] S506:若所述最高匹配率或次高匹配率對應的標準臺標均不屬于地方臺標,則將 所述最高匹配率和次高匹配率對應的標準臺標作為待匹配標準臺標,將所述臺標區域的彩 色信息與所述待匹配標準臺標進行匹配,以更新所述待匹配標準臺標的匹配率,將匹配率 較高的待匹配標準作為所述待識別臺標的識別結果。
[0112] 由于所述最高匹配率或次高匹配率對應的標準臺標均不屬于地方臺標,故而,所 述待識別臺標也不會屬于地方臺標,屬于衛視臺標的可能性非常高。
[0113] 本實施方式中,通過臺標區域的彩色信息與所述待匹配標準臺標進行匹配,以更 新所述待匹配標準臺標的匹配率,可通過以下步驟:
[0114] (1)提取臺標區域1?8彩色三通道灰度矩陣施、1(;、1&。
[0115] (2)提取所述臺標區域中三通道灰度區域矩陣MQ.5R、M Q.5G、M().5B,三者的寬、高分別 為Mr、Mg、Mb的一半,三者的像素原點坐標如式(1)所示。其中,gray分別代表R、G、B,x為行坐 標,y為列坐標,Η為矩陣行數(即高度),W為矩陣列數(即寬度)。
[0117]提取半寬半高區域的目的是,消除臺標區域四角處的背景顏色干擾,以便于后續 匹配。
[0118] (3)矩陣分塊。將亂51?、]/[().5^().58分別進行分塊。由于區域尺寸縮小,從而分塊方案 修正為:短臺標的Edge分為3*3個子塊,即9個區域;長臺標的Edge分為3*6(行*列)個子塊, 即18個區域。
[0119] (4)RGB三通道空間分布直方圖構建。按步驟(3)的分塊方案,計算各子塊區域的平 均紅色灰度值mRl、平均綠色灰度值mGl、平均藍色灰度值mBl,標準庫中的標準臺標進行同理 的分塊均值計算,并進行三通道均值匹配。計匹配的區域數為nrgb,總區域數位Nrgb,如果三 個通道的匹配差(同一子塊區域中樣本灰度均值和標準灰度均值的差值)都小于50,則n rgb = nrgb+l。匹配結束,計算匹配率為prgb = nrgb/Nrgb。由此得到遍歷所有標準臺標的RGB匹配率 數組Prgb,其中相近臺標的匹配率為p rgb,非相近臺標的匹配率為0。
[0120] (5)匹配率更新。綜合匹配率數組P和Prgb的結果,更新匹配率數組P new=P+Prgb。
[0121] S507:若所述最高匹配率或次高匹配率對應的標準臺標屬于地方臺標,則根據所 述臺標區域的邊緣與各標準臺標的匹配率來確定所述待識別臺標所屬的地區,分割出所述 臺標區域中的文字區域,分離所述文字區域中的單字部分,對分離出的單字部分進行識別, 將單字部分識別結果與所述地區對應的標準臺標進行文字匹配,將匹配的標準臺標作為所 述待識別臺標的識別結果。
[0122] 可理解的是,所述地區對應的標準臺標可理解為所述地區的所有標準臺標。
[0123] 由于所述最高匹配率或次高匹配率對應的標準臺標屬于地方臺標,此時,所述待 識別臺標屬于地方臺標的可能性非常高,通常會與多個相同地區的標準臺標均具有較高的 匹配率,在此情況下,可根據這些匹配率來確定所述待識別臺標所屬的地區。
[0124] 本實施方式中,在根據獲取的標準臺標中各地區的標準臺標數量和各地區的標準 臺標總數確定所述待識別臺標所屬的地區,可通過以下標準:
[0125] 獲取匹配率與最高匹配率之差小于第一預設差值的標準臺標(包括最高匹配率對 應的標準臺標),根據獲取的各標準臺標所屬的地區確定最多標準臺標所屬的目標地區,判 斷獲取的各標準臺標中目標區域的標準臺標數量和所述目標區域對應的標準臺標的總數 之間的比例是否超過預設比例,若是,則將所述目標區域作為所述待識別臺標所屬的地區。
[0126] 例如:匹配率與最高匹配率之差小于第一預設差值的標準臺標為10個,并且10個 標準臺標中8個屬于北京電視臺,1個屬于四川電視臺,1個屬于新疆電視臺,設北京電視臺 一共有12個,四川電視臺一共有6個,新疆電視臺一共有5個,預設比例為50%,可確定目標 區域為北京,獲取的各標準臺標中北京的標準臺標數量(即8個)和北京對應的標準臺標的 總數(即12個)之間的比例為72.7%,超過了預設比例(50%),此時,將北京作為所述待識別 臺標所屬的地區。
[0127] 需要說明的是,提取所述臺標區域中的文字區域具有多種方式,為提高文字區域 的提取效率和準確率,本實施方式,根據臺標區域和文字區域之間的位置關系以及所述臺 標區域的位置信息確定所述文字區域的位置信息,并根據所述文字區域的位置信息從所述 臺標區域中提取文字區域,當然,還可通過其他方式,本實施方式對此不加以限制。
[0128] 以所述待識別臺標為北京電視臺臺標為例,文字區域與北京電視臺中的標志 "BTV"等高,故而,可切割標志"BTV"右側兩倍于所述臺標區域高度的區域作為文字區域,也 就是說,文字區域的高度與標志"BTV"的高度相同,文字區域的長度為所述臺標區域高度的 兩倍;
[0129] 為進一步提高識別準確率,本實施方式中,對所述文字區域進行Ostu二值化處理, 并采用連通域方式去除噪聲干擾。
[0130] 可理解的是,對于有些地方臺標,例如北京電視臺臺標,其差異在于文字,如"北京 衛視"、"體育"、"生活"等。該差異可由文字區域中第一個文字唯一描述,為了提高識別效 率,本實施方式中,分離出的單字部分為所述文字區域中的第一個文字所在的單字部分,可 通過以下流程實現分離:
[0131] (1)去除文字區域中橫向、縱向的干擾直線(段);
[0132] (2)獲取所述文字區域中單字部分之間的像素間隔;
[0133] (3)根據所述像素間隔提取出完整的單字部分,如:文(文藝)、影(影視);
[0134] (4)對單字部分進行閾值分割,分割過程中取左上角5*5子域,計算黑色比例r,如 果r小于0.5,交換單字部分的黑白像素。
[0135] 當然,還可將全部單字部分均分離出來,再分別進行識別,本實施方式對此不加以 限制。
[0136] 在現有技術中存在多種對分離出的單字部分進行識別的方法,但為了提高識別準 確率和穩定性,參照圖2,所述對分離出的單字部分進行識別包括:
[0137] A1:對所述單字部分進行細化處理;
[0138] 本實施方式中,對所述單字部分進行細化處理,以獲得所述單字部分的細化邊緣 圖,細化處理的過程可參照由呂岳和施鵬飛編寫的《一種實用并行細化算法及其實現》,本 實施方式在此不再贅述。
[0139] 為了便于后續處理,還可對單字集中的標準單字也進行細化處理,以獲得各標準 單字的細化邊緣圖;
[0140] 為使所述單字部分的細化邊緣圖及各標準單字的細化邊緣圖的大小保持一致,例 如:可將所述單字部分的細化邊緣圖及各標準單字的細化邊緣圖變換為50*50像素大小。
[0141] A2:根據細化處理后的單字部分的細化邊緣計算所述單字部分和標準單字之間的 邊緣匹配率;
[0142] 細化文字的邊緣特征包含了刻畫了文字的筆畫,可縮小匹配標準數據的范圍,而 區域特征是細化文字的內容,豐富了區域描述,可修正確定匹配文字,由于細化的數據量小 于區域特征,本實施方式中,先通過邊緣特征匹配,再通過區域特征修正,從而減少運算量。
[0143] 本實施方式中,根據細化處理后的單字部分的細化邊緣計算所述單字部分和標準 單字之間的邊緣匹配率時,可通過以下流程:
[0144] (1)遍歷標準單字的細化邊緣圖si,將si分成10*10的100個子圖;
[0145] (2)計算各子圖細化邊緣比例pi_j,組成細化邊緣比例矩陣Mi,同理計算得到單字 部分的細化邊緣比例矩陣Μ;
[0146] (3)比較Μ和Mi中相同位置元素的近似度,進而計算邊緣矩陣匹配度Pe_i ;
[0147] (4)根據Ps_i+ = Pe_i(Ps_iSPs的第i個元素),組成新的概率數組Ps;
[0148] A3:判斷最高邊緣匹配率和次高邊緣匹配率的匹配率差值是否高于第二預設差 值;
[0149] 也就是說,判斷Ps的最高值Ps_ml與次高值Ps_m2滿足條件:
[0150] Ps_ml-Ps_m2g0.25(0.25可設為其它值),
[0151] A4:在所述匹配率差值高于第二預設差值時,將所述最高邊緣匹配率對應的標準 單字作為所述單字區域的單字識別結果;
[0152] 也就是說,在滿足Ps_ml-Ps_m2g0.25時,識別為Ps_ml對應的文字并更新匹配率。
[0153] A5:在所述匹配率差值不高于第二預設差值時,根據細化處理后的單字部分的區 域特征和標準單字進行匹配,對所述邊緣匹配率進行更新;
[0154] 也就是說,在不滿足Ps_ml-PS_m2^0.25時,可根據區域特征通過以下流程進行修 正:
[0155] 將細化處理后的單字部分逐區域像素確定細化處理后的標準單字相同位置的像 素是否為區域像素,計算整圖匹配率pi_ds ;
[0156] 將細化處理后的標準單字逐區域像素確定細化處理后的單字部分相同位置的像 素是否為區域像素,計算整圖匹配率pi_sd;
[ΟΙ57] 根據Ps_i+= (pi_ds+2*pi_sd)/3(Ps_iSPs的第i個元素),組成新的概率數組Ps;
[0158] A6:將最高邊緣匹配率對應的標準單字作為所述單字區域的單字識別結果。
[0159] 也就是說,將Ps的最大值Ps_m對應的文字作為識別文字,并修正匹配率。
[0160] 表1給出了采用本實施方式的方法對幾個典型臺標的平均識別時間。遍歷識別時 間較短且差異不大,均在2s左右。
[0161] 表1典型電視臺臺標的平均識別時間
[0163] 表2給出了采用本實施方式的方法對幾個典型臺標的平均匹配率及識別率。表2證 明了本實施方式的方法的有效性、穩定性和可靠性。
[0164] 表2典型電視臺的平均匹配率及識別率
[0166] 本實施方式的方法適合央視臺、衛視臺及地方臺的匹配識別,實現95%以上的高 識別率正確識別,并將遍歷識別時間控制在3s以內。
[0167] 對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域 技術人員應該知悉,本發明實施例并不受所描述的動作順序的限制,因為依據本發明實施 例,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書 中所描述的實施例均屬于優選實施例,所涉及的動作并不一定是本發明實施例所必須的。
[0168] 圖6是本發明一種實施方式的臺標識別裝置的結構框圖;參照圖6,所述裝置包括: [0169 ]臺標判斷單元601,用于判斷臺標區域中的待識別臺標是否為央視臺標;
[0170] 第一識別單元602,用于在所述待識別臺標為央視臺標時,按照第一預設策略對所 述待識別臺標進行識別;
[0171] 第二識別單元603,用于在所述待識別臺標為非央視臺標時,按照第二預設策略對 所述待識別臺標進行識別。
[0172] 在本發明的一種可選實施例中,所述臺標判斷單元,進一步用于根據臺標區域的 長寬比、灰度和顏色判斷臺標區域中的待識別臺標是否為央視臺標。
[0173] 在本發明的一種可選實施例中,所述第一識別單元,進一步用于提取所述臺標區 域中的數字區域,對提取的數字區域進行位數判別,根據位數判別結果識別所述數字區域 中的數字,將央視臺標的標志和識別的數字之間的組合作為所述待識別臺標的識別結果。
[0174] 在本發明的一種可選實施例中,所述第一識別單元,進一步用于根據所述臺標區 域和數字區域之間的位置關系提取所述臺標區域中的數字區域,并對所述數字區域中的數 字部分和背景部分進行二值化處理。
[0175] 在本發明的一種可選實施例中,所述第一識別單元,進一步用于按列對所述數字 區域中各像素的灰度值進行投影,以構成長度為所述數字區域水平寬度的投影向量,在一 列投影向量中具有超過預設數量的屬于數字部分的像素時,將該列投影向量進行標識,若 存在相鄰兩個被標識的投影向量之間的最小距離大于預設距離,則將所述數字判別結果設 為兩位,否則將所述數字判別結果設為一位。
[0176] 在本發明的一種可選實施例中,所述第二識別單元,進一步用于計算所述臺標區 域的邊緣與各標準臺標的匹配率;在最高匹配率與次高匹配率之差大于第一預設差值時, 將最高匹配率對應的標準臺標作為所述待識別臺標的識別結果;在最高匹配率與次高匹配 率之差小于等于第一預設差值時,判斷所述最高匹配率或次高匹配率對應的標準臺標是否 屬于地方臺標;在所述最高匹配率或次高匹配率對應的標準臺標均不屬于地方臺標時,將 所述最高匹配率和次高匹配率對應的標準臺標作為待匹配標準臺標,將所述臺標區域的彩 色信息與所述待匹配標準臺標進行匹配,以更新所述待匹配標準臺標的匹配率,將匹配率 較高的待匹配標準作為所述待識別臺標的識別結果。
[0177] 在本發明的一種可選實施例中,所述第二識別單元,進一步用于對所述臺標區域 中的邊緣通過空間分布直方圖與標準臺標進行匹配,以計算所述臺標區域的邊緣與各標準 臺標的匹配率。
[0178] 在本發明的一種可選實施例中,所述第二識別單元,進一步用于在所述最高匹配 率或次高匹配率對應的標準臺標屬于地方臺標時,根據所述臺標區域的邊緣與各標準臺標 的匹配率來確定所述待識別臺標所屬的地區,分割出所述臺標區域中的文字區域,分離所 述文字區域中的單字部分,對分離出的單字部分進行識別,將單字部分識別結果與所述地 區對應的標準臺標進行文字匹配,將匹配的標準臺標作為所述待識別臺標的識別結果。
[0179] 在本發明的一種可選實施例中,所述第二識別單元,進一步用于對所述單字部分 進行細化處理;根據細化處理后的單字部分的細化邊緣計算所述單字部分和標準單字之間 的邊緣匹配率;判斷最高邊緣匹配率和次高邊緣匹配率的匹配率差值是否高于第二預設差 值;在所述匹配率差值高于第二預設差值時,將所述最高邊緣匹配率對應的標準單字作為 所述單字區域的單字識別結果;在所述匹配率差值不高于第二預設差值時,根據細化處理 后的單字部分的區域特征和標準單字進行匹配,對所述邊緣匹配率進行更新;將最高邊緣 匹配率對應的標準單字作為所述單字區域的單字識別結果。
[0180] 在本發明的一種可選實施例中,所述裝置還包括:
[0181] 區域獲取單元,用于從包括待識別臺標的視頻的預設區域內獲取視頻幀圖像序 列,對各視頻幀圖像進行邊緣提取,將各視頻幀圖像的邊緣進行合成,獲取合成的邊緣的最 小外接矩陣,按照所述最小外接矩陣分別對各視頻幀圖像進行分割,并將分割出的圖像通 過加權平均的方式進行合成,以獲得包括待識別臺標的臺標區域。
[0182] 對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關 之處參見方法實施例的部分說明即可。
[0183] 以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可 以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單 元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其 中的部分或者全部模塊來實現本實施例方案的目的。本領域普通技術人員在不付出創造性 的勞動的情況下,即可以理解并實施。
[0184] 通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到各實施方式可 借助軟件加必需的通用硬件平臺的方式來實現,當然也可以通過硬件。基于這樣的理解,上 述技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該 計算機軟件產品可以存儲在計算機可讀存儲介質中,如R0M/RAM、磁碟、光盤等,包括若干指 令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行各個實施 例或者實施例的某些部分所述的方法。
[0185] 最后應說明的是:以上實施例僅用以說明本發明的技術方案,而非對其限制;盡管 參照前述實施例對本發明進行了詳細的說明,本領域的普通技術人員應當理解:其依然可 以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換; 而這些修改或者替換,并不使相應技術方案的本質脫離本發明各實施例技術方案的精神和 范圍。
【主權項】
1. 一種臺標識別方法,其特征在于,所述方法包括: 判斷臺標區域中的待識別臺標是否為央視臺標; 在所述待識別臺標為央視臺標時,按照第一預設策略對所述待識別臺標進行識別; 在所述待識別臺標為非央視臺標時,按照第二預設策略對所述待識別臺標進行識別。2. 根據權利要求1所述的方法,其特征在于,所述判斷臺標區域中的待識別臺標是否為 央視臺標,進一步包括: 根據臺標區域的長寬比、灰度和顏色判斷臺標區域中的待識別臺標是否為央視臺標。3. 根據權利要求1所述的方法,其特征在于,所述按照第一預設策略對所述待識別臺標 進行識別,進一步包括: 提取所述臺標區域中的數字區域,對提取的數字區域進行位數判別,根據位數判別結 果識別所述數字區域中的數字,將央視臺標的標志和識別的數字之間的組合作為所述待識 別臺標的識別結果。4. 根據權利要求3所述的方法,其特征在于,所述提取所述臺標區域中的數字區域,進 一步包括: 根據所述臺標區域和數字區域之間的位置關系提取所述臺標區域中的數字區域,并對 所述數字區域中的數字部分和背景部分進行二值化處理。5. 根據權利要求4所述的方法,其特征在于,所述對提取的數字區域進行位數判別,進 一步包括: 按列對所述數字區域中各像素的灰度值進行投影,以構成長度為所述數字區域水平寬 度的投影向量,在一列投影向量中具有超過預設數量的屬于數字部分的像素時,將該列投 影向量進行標識,若存在相鄰兩個被標識的投影向量之間的最小距離大于預設距離,則將 所述數字判別結果設為兩位,否則將所述數字判別結果設為一位。6. 根據權利要求1所述的方法,其特征在于,所述按照第二預設策略對所述待識別臺標 進行識別,進一步包括: 計算所述臺標區域的邊緣與各標準臺標的匹配率; 在最高匹配率與次高匹配率之差大于第一預設差值時,將最高匹配率對應的標準臺標 作為所述待識別臺標的識別結果; 在最高匹配率與次高匹配率之差小于等于第一預設差值時,判斷所述最高匹配率或次 高匹配率對應的標準臺標是否屬于地方臺標; 若所述最高匹配率或次高匹配率對應的標準臺標均不屬于地方臺標,則將所述最高匹 配率和次高匹配率對應的標準臺標作為待匹配標準臺標,將所述臺標區域的彩色信息與所 述待匹配標準臺標進行匹配,以更新所述待匹配標準臺標的匹配率,將匹配率較高的待匹 配標準作為所述待識別臺標的識別結果。7. 根據權利要求6所述的方法,其特征在于,所述計算所述臺標區域的邊緣與各標準臺 標的匹配率,進一步包括: 對所述臺標區域中的邊緣通過空間分布直方圖與標準臺標進行匹配,以計算所述臺標 區域的邊緣與各標準臺標的匹配率。8. 根據權利要求6所述的方法,其特征在于,所述判斷所述最高匹配率或次高匹配率對 應的標準臺標是否屬于地方臺標之后,所述方法還包括: 若所述最高匹配率或次高匹配率對應的標準臺標屬于地方臺標,則根據所述臺標區域 的邊緣與各標準臺標的匹配率來確定所述待識別臺標所屬的地區,分割出所述臺標區域中 的文字區域,分離所述文字區域中的單字部分,對分離出的單字部分進行識別,將單字部分 識別結果與所述地區對應的標準臺標進行文字匹配,將匹配的標準臺標作為所述待識別臺 標的識別結果。9. 根據權利要求8所述的方法,其特征在于,所述對分離出的單字部分進行識別,進一 步包括: 對所述單字部分進行細化處理; 根據細化處理后的單字部分的細化邊緣計算所述單字部分和標準單字之間的邊緣匹 配率; 判斷最高邊緣匹配率和次高邊緣匹配率的邊緣匹配率差值是否高于第二預設差值; 在所述邊緣匹配率差值高于第二預設差值時,將所述最高邊緣匹配率對應的標準單字 作為所述單字區域的單字識別結果; 在所述邊緣匹配率差值不高于第二預設差值時,根據細化處理后的單字部分的區域特 征和標準單字進行匹配,對所述邊緣匹配率進行更新; 將最高邊緣匹配率對應的標準單字作為所述單字區域的單字識別結果。10. 根據權利要求1~9中任一項所述的方法,其特征在于,所述判斷臺標區域中的待識 別臺標是否為央視臺標之前,所述方法還包括: 從包括待識別臺標的視頻的預設區域內獲取視頻幀圖像序列,對各視頻幀圖像進行邊 緣提取,將各視頻幀圖像的邊緣進行合成,獲取合成的邊緣的最小外接矩陣,按照所述最小 外接矩陣分別對各視頻幀圖像進行分割,并將分割出的圖像通過加權平均的方式進行合 成,以獲得包括待識別臺標的臺標區域。11. 一種臺標識別裝置,其特征在于,所述裝置包括: 臺標判斷單元,用于判斷臺標區域中的待識別臺標是否為央視臺標; 第一識別單元,用于在所述待識別臺標為央視臺標時,按照第一預設策略對所述待識 別臺標進行識別; 第二識別單元,用于在所述待識別臺標為非央視臺標時,按照第二預設策略對所述待 識別臺標進行識別。12. 根據權利要求11所述的裝置,其特征在于,所述臺標判斷單元,進一步用于根據臺 標區域的長寬比、灰度和顏色判斷臺標區域中的待識別臺標是否為央視臺標。13. 根據權利要求11所述的裝置,其特征在于,所述第一識別單元,進一步用于提取所 述臺標區域中的數字區域,對提取的數字區域進行位數判別,根據位數判別結果識別所述 數字區域中的數字,將央視臺標的標志和識別的數字之間的組合作為所述待識別臺標的識 別結果。14. 根據權利要求13所述的裝置,其特征在于,所述第一識別單元,進一步用于根據所 述臺標區域和數字區域之間的位置關系提取所述臺標區域中的數字區域,并對所述數字區 域中的數字部分和背景部分進行二值化處理。15. 根據權利要求14所述的裝置,其特征在于,所述第一識別單元,進一步用于按列對 所述數字區域中各像素的灰度值進行投影,以構成長度為所述數字區域水平寬度的投影向 量,在一列投影向量中具有超過預設數量的屬于數字部分的像素時,將該列投影向量進行 標識,若存在相鄰兩個被標識的投影向量之間的最小距離大于預設距離,則將所述數字判 別結果設為兩位,否則將所述數字判別結果設為一位。16. 根據權利要求11所述的裝置,其特征在于,所述第二識別單元,進一步用于計算所 述臺標區域的邊緣與各標準臺標的匹配率;在最高匹配率與次高匹配率之差大于第一預設 差值時,將最高匹配率對應的標準臺標作為所述待識別臺標的識別結果;在最高匹配率與 次高匹配率之差小于等于第一預設差值時,判斷所述最高匹配率或次高匹配率對應的標準 臺標是否屬于地方臺標;在所述最高匹配率或次高匹配率對應的標準臺標均不屬于地方臺 標時,將所述最高匹配率和次高匹配率對應的標準臺標作為待匹配標準臺標,將所述臺標 區域的彩色信息與所述待匹配標準臺標進行匹配,以更新所述待匹配標準臺標的匹配率, 將匹配率較高的待匹配標準作為所述待識別臺標的識別結果。17. 根據權利要求16所述的裝置,其特征在于,所述第二識別單元,進一步用于對所述 臺標區域中的邊緣通過空間分布直方圖與標準臺標進行匹配,以計算所述臺標區域的邊緣 與各標準臺標的匹配率。18. 根據權利要求16所述的裝置,其特征在于,所述第二識別單元,進一步用于在所述 最高匹配率或次高匹配率對應的標準臺標屬于地方臺標時,根據所述臺標區域的邊緣與各 標準臺標的匹配率來確定所述待識別臺標所屬的地區,分割出所述臺標區域中的文字區 域,分離所述文字區域中的單字部分,對分離出的單字部分進行識別,將單字部分識別結果 與所述地區對應的標準臺標進行文字匹配,將匹配的標準臺標作為所述待識別臺標的識別 結果。19. 根據權利要求18所述的裝置,其特征在于,所述第二識別單元,進一步用于對所述 單字部分進行細化處理;根據細化處理后的單字部分的細化邊緣計算所述單字部分和標準 單字之間的邊緣匹配率;判斷最高邊緣匹配率和次高邊緣匹配率的匹配率差值是否高于第 二預設差值;在所述匹配率差值高于第二預設差值時,將所述最高邊緣匹配率對應的標準 單字作為所述單字區域的單字識別結果;在所述匹配率差值不高于第二預設差值時,根據 細化處理后的單字部分的區域特征和標準單字進行匹配,對所述邊緣匹配率進行更新;將 最高邊緣匹配率對應的標準單字作為所述單字區域的單字識別結果。20. 根據權利要求11~19中任一項所述的裝置,其特征在于,所述裝置還包括: 區域獲取單元,用于從包括待識別臺標的視頻的預設區域內獲取視頻幀圖像序列,對 各視頻幀圖像進行邊緣提取,將各視頻幀圖像的邊緣進行合成,獲取合成的邊緣的最小外 接矩陣,按照所述最小外接矩陣分別對各視頻幀圖像進行分割,并將分割出的圖像通過加 權平均的方式進行合成,以獲得包括待識別臺標的臺標區域。
【文檔編號】G06T7/00GK105868683SQ201510824167
【公開日】2016年8月17日
【申請日】2015年11月24日
【發明人】何小坤
【申請人】樂視致新電子科技(天津)有限公司