專利名稱:視頻菜單翻譯系統及其方法
技術領域:
本發明涉及一種翻譯系統及其方法,特別指一種視頻菜單翻譯系統及其方法。
背景技術:
近年來,現代人越來越重視知識交流與休閑活動,觀看電影或進行游戲成為許 多人休閑生活中不可或缺的一環。但是隨著國際化的發展趨勢,信息的傳播比以往更廣 闊,常會在播放的視頻上出現許多不同語言,例如英文的電影或日文的游戲等,接收不 同語言的機會大幅的增加。目前當使用者觀看影片時,一開始都會出現視頻菜單可以供使用者利用選項進 行設定,選項例如是“播放影片”、“字幕選擇”、“場景選擇”,出現不同語言的選 項時,只能利用字典或用其它翻譯軟件進行翻譯,造成觀看上的不方便。一般的影片可以供使用者設定語言模式,但是通常一開始出現的視頻菜單都是 預先設定好的語言模式,縱使影片提供可轉換語言模式的功能,使用者若看不懂,仍無 法進一步設定,造成使用者無法設定適合觀看影片的模式,因此具有視頻菜單為外語時 無法進行翻譯的問題。綜上所述,可知現有技術中長期以來一直存在視頻菜單為外語時無法進行翻譯 的問題,因此有必要提出改進的技術手段,來解決此一問題。
發明內容
有鑒于現有技術存在視頻菜單為外語時無法進行翻譯的問題,本發明遂提供一 種視頻菜單翻譯系統及方法,其中本發明所提供的視頻菜單翻譯系統,至少包含判斷模塊、擷取模塊、辨識模 塊、翻譯模塊及顯示模塊,判斷模塊是判斷視頻菜單中被選擇的選項區域;擷取模塊是 將選項區域進行影像擷取,以得到影像數據;辨識模塊是對影像數據進行文字影像辨 識,以得到文字數據;翻譯模塊是將文字數據進行翻譯,以得到翻譯數據;顯示模塊是 顯示翻譯數據。本發明所提供的視頻菜單翻譯方法,其步驟至少包括判斷視頻菜單中被選擇的 選項區域;將選項區域進行影像擷取,以得到影像數據;對影像數據進行文字影像辨 識,以得到文字數據;將文字數據進行翻譯,以得到翻譯數據;顯示該翻譯數據。本發明所提供的視頻菜單翻譯系統,至少包含判斷模塊、擷取模塊、辨識定位 模塊、翻譯模塊及顯示模塊,判斷模塊是判斷播放視頻菜單;擷取模塊是將視頻菜單進 行影像擷取,以得到影像數據;辨識定位模塊是對影像數據進行文字影像辨識以及定位 至少一文字區塊,以得到各自具有文字區塊位置的至少一文字數據;翻譯模塊是將文字 數據進行翻譯,以得到對應文字數據的至少一翻譯數據;顯示模塊是依據文字數據各自 的文字區塊位置來顯示翻譯數據。本發明所提供的視頻菜單翻譯方法,其步驟至少包括判斷播放視頻菜單;將視頻菜單進行影像擷取,以得到影像數據;對影像數據進行文字影像辨識以及定位至少一 文字區塊,以得到各自具有文字區塊位置的至少一文字數據;將文字數據進行翻譯,以 得到對應文字數據的至少一翻譯數據;依據文字數據各自的文字區塊位置來顯示翻譯數 據。本發明所提供的系統與方法如上,與現有技術之間的差異在于本發明借由判斷 視頻菜單中被選擇的選項區塊,經擷取影像數據進行文字影像辨識與翻譯,最后將翻譯 數據進行顯示;或是由判斷播放視頻菜單并進行擷取影像數據,經由文字影像辨識與定 位得到具有文字區塊位置的文字數據并進行翻譯,最后依據文字區塊位置來顯示翻譯數 據。通過上述的技術手段,本發明可以達成將視頻菜單進行實時翻譯的技術功效。
[0013:
圖1為本發明視頻菜單翻譯系統第一實施態樣系統方塊圖。 圖2為本發明視頻菜單翻譯系統第二實施態樣系統方塊圖。 圖3為本發明視頻菜單翻譯方法第一實施態樣方法流程圖。 圖4至圖6為本發明視頻菜單翻譯系統于第一實施態樣下的實施例示意圖。 圖7為本發明視頻菜單翻譯方法第二實施態樣方法流程圖。 圖8至圖10為本發明視頻菜單翻譯系統于第二實施態樣下的實施例示意圖(主要組件符號說明
100視頻菜單翻譯系統 110判斷模塊 120擷取模塊 130辨識模塊 140翻譯模塊 150顯示模塊 200視頻菜單翻譯系統 210判斷模塊 220擷取模塊 230辨識定位模塊 240翻譯模塊 250 顯示模塊 400視頻菜單 410 選項 420 選項區域 430翻譯數據顯示窗口 800視頻菜單 810 選項 820影像數據 830文字區塊具體實 施方式以下將配合圖式及實施例來詳細說明本發明的實施方式,借此對本發明如何應 用技術手段來解決技術問題并達成技術功效的實現過程能充分理解并據以實施。請參閱圖1,圖1為本發明視頻菜單翻譯第一實施態樣系統方塊圖,視頻菜單翻 譯系統100至少包含判斷模塊110、擷取模塊120、辨識模塊130、翻譯模塊140及顯 示模塊150。視頻菜單翻譯系統100適用于視頻影片中的視頻菜單,視頻影片可以是以 DVD、VCD等的形式儲存。判斷模塊110負責判斷視頻菜單中被選擇的選項區域,由于視頻菜單中具有多 個選項,例如是但不限定為“播放影片”、“字幕選擇”、“場景選擇”等。使用者可 以借由視頻菜單選擇播放視頻所需要的設定,而視頻菜單可以是以第一語言表示選項, 第一語言例如是但不限定為“英文”、“日文”、“中文”等。當使用者利用指向裝置 例如是但不限定為鼠標或鍵盤方向鍵來選擇視頻菜單中的選項后,判斷模塊110負責判 斷視頻菜單中被選擇的選項區域。值得注意的是,判斷模塊110判斷視頻菜單中被選擇的選項區域是以影像辨識 前后動作的視頻畫面具有差異的區塊作為被選擇的選項區域。一般來說,視頻菜單的 表現方式可以是將使用者選擇的選項以字體的放大、字體顏色改變或背景顏色改變的方 式表示該選項是使用者選擇的選項,因此判斷模塊110會以影像辨識持續辨識視頻畫面 是否前后畫面的動作具有差異,若有,將具有差異的區塊進行定義作為被選擇的選項區 域。因為當使用者借由指向裝置進行選擇視頻菜單中的選項時,經由影像辨識可以判斷 第一個動作的視頻畫面與下一個動作的視頻畫面具有差異,并且可以得到具有差異的區 塊。值得注意的是,判斷模塊110判斷視頻菜單中被選擇的選項區域是以影像辨識 前后動作的視頻畫面具有差異的一點,并以該點為中心擴大辨識范圍,以確認具有文字 時作為被選擇的選項區域。一般來說,除了上述的視頻菜單表現方式外,另外一種是將 使用者選擇的選項前以一小圖標代表該選項是使用者選擇的選項,因此判斷模塊110會 以影像辨識視頻畫面前后畫面的動作具有差異的一點,并且依據該點為中心,擴大辨識 的范圍,以得到具有文字的選項區域。擷取模塊120負責將該選項區域進行擷取,以得到影像數據。也就是當判斷模 塊110判斷得到被選擇的選項區域后,會將選項區域進行影像擷取,并且將擷取得到的 影像作為影像數據,影像數據例如是但不限定為圖文件形式的數據。值得注意的是,判 斷模塊110判斷得到被選擇的選項區域后,當擷取模塊120偵測到快捷鍵或鼠標操控鍵啟 動時,將該選項區域進行影像擷取。也就是使用者必須啟動快捷鍵或是鼠標操控鍵時, 擷取模塊120才會對該選項區域進行影像擷取。辨識模塊130負責對影像數據進行文字影像辨識,以得到文字數據,也就是辨 識模塊130會將由擷取模塊120擷取得到的影像數據進行文字影像辨識,以得到文字數 據。辨識模塊130通過例如是但不限定為字體修整、分割單字、單字細線化、萃取特征 點、比對等步驟對影像數據進行文字影像辨識得到文字數據。由于視頻菜單可以是以第 一語言表示選項,第一語言例如是但不限定為“英文”、“日文”、“中文”等,因此經辨識模塊130辨識后得到的文字數據也會是由第一語言表示。翻譯模塊140負責將文字數據進行翻譯,以得到翻譯數據,也就是翻譯模塊140 會將辨識模塊130辨識得到的文字數據進行翻譯處理,翻譯后得到翻譯數據。由于文字 數據是以第一語言表示,因此經翻譯模塊140翻譯后的翻譯數據是以第二語言表示,第 二語言例如是但不限定為“英文”、“日文”、“中文”等,但文字數據與翻譯數據必 須互為不同語言,翻譯模塊140進行翻譯是將第一語言的文字數據翻譯為第二語言的翻 譯數據,第一語言與第二語言互為不同語言。值得注意的是,翻譯模塊140翻譯為第 二語言的翻譯數據,其中第二語言可以是由使用者自行設定的,也可以是由系統預先設 定,本發明不予以限定。 顯示模塊150負責顯示翻譯數據,也就是當翻譯模塊140翻譯得到翻譯數據后, 顯示模塊150會將翻譯數據進行顯示。值得注意的是,顯示模塊150顯示翻譯數據可以 是以開啟顯示窗口,或是將翻譯數據嵌入選項區域內的方式來顯示翻譯數據。也就是顯 示模塊150利用視頻菜單外的顯示窗口進行顯示翻譯數據,或者是將翻譯數據嵌入至視 頻菜單中的選項區域內。值得注意的是,若顯示模塊150是利用開啟顯示窗口的方式進 行顯示翻譯數據的話,顯示窗口的位置可以是落在選項區域周圍處,可以讓使用者方便 觀看。通過視頻菜單翻譯系統第一實施態樣的運作,借由判斷視頻菜單中被選擇的選 項區塊,經擷取影像數據進行文字影像辨識與翻譯,最后將翻譯數據進行顯示,可解決 視頻菜單為外語時無法進行翻譯的問題。請參閱圖2,圖2為本發明視頻菜單翻譯第二實施態樣系統方塊圖,視頻菜單翻 譯系統200至少包含判斷模塊210、擷取模塊220、辨識定位模塊230、翻譯模塊240及 顯示模塊250。視頻菜單翻譯系統200適用于視頻影片中的視頻菜單,視頻影片可以是以 DVD、VCD等的形式儲存。判斷模塊210負責判斷播放視頻菜單,視頻菜單中具有多個選項,例如是但不 限定為“播放影片”、“字幕選擇”、“場景選擇”等。視頻菜單可以是以第一語言表 示選項,第一語言例如是但不限定為“英文”、“日文”、“中文”等。值得注意的 是,判斷模塊210判斷播放視頻菜單是依據播放中的視頻自動為靜止狀態時,判斷為播 放視頻菜單,也就是一般我們播放視頻影片時,當播放到視頻菜單后,視頻會呈現靜止 狀態,當然此時的靜止狀態不是系統接收到暫停指令或停止指令造成的,是屬于自動為 靜止狀態,因此當依據播放中的視頻自動為靜止狀態時,判斷模塊210可以判斷為播放 視頻菜單。擷取模塊220負責將視頻菜單進行擷取,以得到影像數據。也就是當判斷模塊 210判斷播放視頻菜單后,會將視頻菜單進行影像擷取,并且將擷取得到的影像作為影像 數據,影像數據例如是但不限定為圖文件形式的數據。辨識定位模塊230負責對影像數據進行文字影像辨識以及定位文字區塊,以得 到各自具有文字區塊位置的文字數據,也就是辨識定位模塊230將擷取模塊220擷取的 影像數據先進行文字影像辨識,再將辨識結果進行文字區塊的位置定位,定位的方式是 將影像數據進行文字影像辨識時,判斷得到文字區塊,并且記錄文字區塊于影像數據上 的位置,最后由文字區塊的辨識結果即可得到具有文字區塊位置的文字數據。值得注意的是, 文字區塊位置是指文字區塊位于影像數據的位置,由于視頻菜單可以具有多個選 項,因此具有文字區塊位置的文字數據可以是多筆的。辨識定位模塊230通過例如是但 不限定為字體修整、分割單字、單字細線化、萃取特征點、比對等步驟對影像數據進行 文字影像辨識即得到文字數據。由于視頻菜單可以是以第一語言表示選項,第一語言例 如是但不限定為“英文”、“日文”、“中文”等,因此經辨識定位模塊230辨識定位 得到具有文字區塊位置的文字數據也會是由第一語言表示。翻譯模塊240負責將文字數據進行翻譯,以得到對應文字數據的翻譯數據,也 就是翻譯模塊240會將辨識定位模塊230辨識得到的文字數據進行翻譯得到對應文字數據 的翻譯數據。由于文字數據是以第一語言表示,因此經翻譯模塊240翻譯后的翻譯數據 是以第二語言表示,第二語言例如是但不限定為“英文”、“日文”、“中文”等,但 文字數據與翻譯數據必須互為不同語言,翻譯模塊240進行翻譯是將第一語言的文字數 據翻譯為第二語言的翻譯數據,第一語言與第二語言互為不同語言。值得注意的是,翻 譯模塊240翻譯為第二語言的翻譯數據,其中第二語言可以是由使用者自行設定的,也 可以是由系統預先設定,本發明不予以限定。顯示模塊250負責依據文字數據各自的文字區塊位置來顯示翻譯數據,也就是 當翻譯模塊240翻譯得到對應文字數據的翻譯數據后,顯示模塊250會依據文字數據各自 的文字區塊將對應文字數據的翻譯數據進行顯示。值得注意的是,顯示模塊250顯示翻 譯數據是依據文字數據各自的文字區塊位置將翻譯數據嵌入文字區塊內的方式來顯示翻 譯數據。也就是顯示模塊250將翻譯數據嵌入至視頻菜單中的文字區塊內。通過視頻菜單翻譯系統第二實施態樣的運作,借由判斷播放視頻菜單并進行擷 取影像數據,經由文字影像辨識與定位得到具有文字區塊位置的文字數據并進行翻譯, 最后依據文字區塊位置來顯示翻譯數據,可解決視頻菜單為外語時無法進行翻譯的問 題。以下將舉實施例具體說明本發明,然其并非用以限定本發明,熟悉本領域的技 術人員可依照本發明的精神對下述實施例稍做修飾,惟其仍屬于本發明的范圍。圖3所示為本發明視頻菜單翻譯方法其第一實施態樣方法流程圖,圖4至圖6為 本發明視頻菜單翻譯系統于第一實施態樣下的實施例示意圖。以下將同時配合圖3至圖 6說明本發明視頻菜單翻譯在第一實施態樣下的運作步驟和實施例。請先參閱圖4與圖5,視頻菜單400包括選項410,選項410例如是“play movie,,、 "subtitles selections,,、 “scene selections,,、 “special features,,。 當使用者 觀看視頻菜單400欲選擇視頻菜單400中的選項410時,使用者可以利用指向裝置例如是 鍵盤方向鍵進行選擇。當使用者移到選項410例如是“play movie”,選項410 "play movie"會如圖5所示產生突顯的顯示效果,視頻菜單翻譯系統100會判斷視頻菜單400 中被選擇的選項區域420 (步驟301)。判斷選項區域420 "play movie"可以是視頻菜 單翻譯系統100以影像辨識前一個動作的視頻畫面(如圖4所示)與下一個動作的視頻畫 面(如圖5所示)進行影像辨識,可以辨識得到具有差異的區塊也就是被選擇的選項區域 420 “play movie”。當得到被選擇的選項區域420 “play movie”后,并且視頻菜單翻譯系統100偵 測到快捷鍵啟動時,視頻菜單翻譯系統100會將選項區域420 "playmovie"進行影像擷取,得到影像數據“play movie”(步驟302)。接著,視頻菜單翻譯系統100將影像數 據“playmovie”進行文字影像辨識,可以得到文字數據“playmovie”(步驟303)。請參閱圖6,當得到文字數據“playmovie”后,視頻菜單翻譯系統100將文字 數據“playmovie”進行翻譯,得到翻譯數據為“播放影片”(步驟304)。當得到翻譯 數據“播放影片”后,視頻菜單翻譯系統100將翻譯數據“播放影片”在視頻菜單400 上的翻譯數據顯示窗口 430中進行顯示(步驟305)。圖7所示為本發明視頻菜單翻譯方法其第二實施態樣方法流程圖,圖8至圖10 為本發明視頻菜單翻譯系統于第二實施態樣下的實施例示意圖。以下將同時配合圖7至 圖10說明本發明視頻菜單翻譯在第二實施態樣下的運作步驟和實施例。請先參閱圖8,視頻菜單800包括選項810,選項810例如是"play movie”、 "subtitles selections"、 “scene selections"、 "special features"。播方文視頻影片時,當
播放到視頻菜單800后,視頻會呈現靜止狀態,當然此時的靜止狀態不是系統接收到暫 停指令或停止指令造成的,是屬于播放中自動為靜止狀態,因此當播放中的視頻自動為 靜止狀態時,視頻菜單翻譯系統200判斷為播放視頻菜單800 (步驟701)。當判斷為播放 視頻菜單800后,視頻菜單翻譯系統200會將視頻菜單800進行影像擷取,得到影像數據 820 (步驟 702)。請參閱圖9,視頻菜單翻譯系統200對影像數據820進行文字影像辨識以及定 位文字區塊830,也就是將影像數據820進行文字影像辨識時,判斷得到文字區塊, 并且記錄文字區塊于影像數據上的位置,因此,可以分別得到具有文字區塊位置例如 是(50,20)的文字數據“playmovie”、具有文字區塊位置例如是(50,30)的文字 數據“subtitles selections”、具有文字區塊位置例如是(50,40)的文字數據“scene selections”、具有文字區塊位置例如是(50,50)的文字數據“special features”(步驟 703)。值得注意的是,文字區塊位置可以是文字區塊820的中心位置,也就是每一個文 字區塊830位于影像數據820的位置。請參閱圖10,當得到文字數據 “playmovie”、“subtitles selections”、"scene selections”、“special features” 后,視頻菜單翻譯系統 200 將文字數據 “playmovie”、
“subtitles selections”、 “scene selections”、 “special features” 進行翻譯,得到對應文 字數據“playmovie”的翻譯數據為“播放影片”、對應文字數據“subtitles selections”
的翻譯數據為“字幕選擇”、對應文字數據“scene selections”的翻譯數據為“場景選 擇”、對應文字數據“special features”的翻譯數據為“特殊功能”(步驟704)。當得 到翻譯數據“播放影片”、“字幕選擇”、“場景選擇”、“特殊功能”后,視頻菜單 翻譯系統200將翻譯數據“播放影片”、“字幕選擇”、“場景選擇”、“特殊功能” 依據文字數據 “playmovie”、 “subtitles selections”、 “scene selections”、 “special features”各自的文字區塊位置(50,20)、(50,30)、(50,40)、(50,50)進行顯示(步 驟705),也就是視頻菜單翻譯系統200將翻譯數據“播放影片”、“字幕選擇”、“場 景選擇”、“特殊功能”嵌入到視頻菜單800的文字區塊830內進行顯示。綜上所述,本發明通過兩 種實施態樣達到技術功效,第一實施態樣是借由判斷 視頻菜單中被選擇的選項區塊,經擷取影像數據進行文字影像辨識與翻譯,最后將翻譯 數據進行顯示;第二實施態樣是借由判斷播放視頻菜單并進行擷取影像數據,經由文字影像辨識與定位得到具有文字區塊位置的文字數據并進行翻譯,最后依據文字區塊位置 來顯示翻譯數據。以上兩種實施態樣皆可解決視頻菜單為外語時無法進行翻譯的問題, 進而達成將視頻菜單進行實時翻譯的技術功效。 雖然本發明所提供的實施方式如上,然而所述的內容并非用以直接限定本發明 的專利保護范圍。任何本發明所屬技術領域的技術人員,在不脫離本發明所提供的精 神和范圍的前提下,可以在實施的形式上及細節上作些許的更動。本發明的專利保護范 圍,仍須以所附的權利要求所界定者為準。
權利要求
1.一種視頻菜單翻譯系統,其至少包含一判斷模塊,用以判斷一視頻菜單中被選擇的一選項區域; 一擷取模塊,用以將該選項區域進行影像擷取,以得到一影像數據; 一辨識模塊,用以對該影像數據進行文字影像辨識,以得到一文字數據; 一翻譯模塊,用以將該文字數據進行翻譯,以得到一翻譯數據;及 一顯示模塊,用以顯示該翻譯數據。
2.如權利要求1所述的視頻菜單翻譯系統,其中該判斷模塊判斷該視頻菜單中被選 擇的該選項區域以影像辨識前后動作的視頻畫面具有差異的區塊作為被選擇的該選項區 域。
3.如權利要求1所述的視頻菜單翻譯系統,其中該顯示模塊以開啟一顯示窗口的方式 或是將該翻譯數據嵌入至該選項區域內的方式。
4.一種視頻菜單翻譯方法,其至少包含下列步驟 判斷一視頻菜單中被選擇的一選項區域;將該選項區域進行影像擷取,以得到一影像數據; 對該影像數據進行文字影像辨識,以得到一文字數據; 將該文字數據進行翻譯,以得到一翻譯數據;及 顯示該翻譯數據。
5.如權利要求4所述的視頻菜單翻譯方法,其中該判斷該視頻菜單中被選擇的該選項 區域的步驟以影像辨識前后動作的視頻畫面具有差異的區塊作為被選擇的該選項區域。
6.如權利要求4所述的視頻菜單翻譯方法,其中該顯示翻譯數據的步驟以開啟一顯示 窗口的方式或是將該翻譯資料嵌入的方式。
7.一種視頻菜單翻譯系統,其至少包含 一判斷模塊,用以判斷播放一視頻菜單;一擷取模塊,用以將該視頻菜單進行影像擷取,以得到一影像數據; 一辨識定位模塊,用以對該影像數據進行文字影像辨識以及定位至少一文字區塊, 以得到各自具有一文字區塊位置的至少一文字數據;一翻譯模塊,用以將該些文字數據進行翻譯,以得到對應該些文字數據的至少一翻 譯數據;及一顯示模塊,用以依據該些文字數據各自的該文字區塊位置來顯示該些翻譯數據。
8.如權利要求7所述的視頻菜單翻譯系統,其中該判斷模塊判斷播放視頻菜單依據播 放中的視頻自動為靜止狀態時,判斷為播放視頻菜單。
9.如權利要求7所述的視頻菜單翻譯系統,其中該文字區塊位置指該文字區塊位于該 影像數據的位置。
10.一種視頻菜單翻譯方法,其至少包含下列步驟 判斷播放一視頻菜單;將該視頻菜單進行影像擷取,以得到一影像數據;對該影像數據進行文字影像辨識以及定位至少一文字區塊,以得到各自具有一文字 區塊位置的至少一文字數據;將該些文字數據進行翻譯,以得到對應該些文字數據的至少一翻譯數據;及依據該些文字數據各自的該文字區塊位置來顯示該些翻譯數據。
全文摘要
一種視頻菜單翻譯系統及其方法,其通過借由判斷視頻菜單中被選擇的選項區塊,經擷取影像數據進行文字影像辨識與翻譯,最后將翻譯數據進行顯示;或是由判斷播放視頻菜單并進行擷取影像數據,經由文字影像辨識與定位得到具有文字區塊位置的文字數據并進行翻譯,最后依據文字區塊位置來顯示翻譯數據,借此可以達成將視頻菜單進行實時翻譯的技術功效。
文檔編號G06F17/28GK102014257SQ20091016991
公開日2011年4月13日 申請日期2009年9月8日 優先權日2009年9月8日
發明者沈晨, 邱全成 申請人:英業達股份有限公司