專利名稱:一種整合語音輸入和手寫輸入功能的漢字輸入系統的制作方法
技術領域:
本發明屬于計算機識別技術領域,是一種整合語音輸入和手寫輸入功能的漢字輸入系統,該系統可以提高輸入漢字的識別率,幫助消費者更加方便地使用手機、電腦等輸入系統進行漢字輸入。
背景技術:
隨著移動通信技術的迅速發展,手機、電腦用戶的數量也在快速增長,應用在手機、電腦上的輸入方法也越來越重要。由于手機、電腦上的按鍵數量有限,在有限的按鍵上輸入信息往往費時費力,通常需不斷地在屏幕選單中上下搜尋才能取得想要輸入的信息,使得傳統的文字的手動錄入比較煩瑣。且手機、電腦上的按鍵大小通常都比較小,許多老年人由于視力的原因看不清楚按鍵上的字母或者不會熟練使用拼音/筆劃輸入法,使得手動輸入漢字相當不方便。針對以上問題,有人就提出了語音輸入方法以及手寫輸入方法在手機以及電腦等輸入系統上的應用。
語音與手寫輸入識別的技術發展上,其相關技術已見諸于各類技術文件中,例如以語音識別而言,公開號為CN1373406A的專利文獻中提出了一種語音識別漢字輸入法、公開號為CN1494299A的專利文獻中提出了一種手機上語音輸入轉換成文字的裝置與方法。另一方面,手寫識別則如公開號為CN1335703A的專利文獻中提供了一種具有手寫字符的輸入、顯示和傳輸功能的手機,或者如公開號為CN1350390A的專利文獻中提出了一種手機字符手寫輸入的方法及相應的系統,足見語音與手寫輸入的識別技術皆已逐漸成熟。
然而,雖然上述各專利技術皆在算法的改進、手寫/語音輸入的特征提取,或是改進語音或手寫模型的建立準則等等方面做了很多的工作,然其識別率的提高依然有限,由于手寫輸入的識別技術的某些局限性,使得對于結構極其相似的漢字,如“巳”、“已”和“己”以及“日”和“曰”,甚至“四”和“皿”、“江”和“紅”等均無法識別或者無法很好地識別;對于語音輸入而言,這種局限性表現的更加明顯,因為同一個音對應的漢字往往有很多個,那么到底是哪一個呢?上述方法同樣無法解決這一問題。
鑒于上述方法在識別率提高方面很有限,有人提出整合手寫與語音輸入信號以提高識別率的概念。
其中,公開號為CN1549244A的專利文獻《整合語音與手寫輸入的識別方法及系統》提出了一種整合語音與手寫輸入的識別方法,該方法是先接收一具有一字符的語音/手寫輸入后,識別該語音/手寫輸入而產生一字列,且該字列具有多個與該字符相對應的識別字符,然后接收一描繪該字符之一特征的手寫/語音輸入,最后依據該特征由該字符列中擷取與該字符最相符合的識別字符,因此可以有效地整合語音與手寫輸入,并藉此提高識別率。
然而,雖然上述方法在識別率的提高上確能達到其效果,卻依然存在許多待解決的問題。如(1)上述方法提出的必須區分第一輸入以及第二輸入,即第一輸入是一語音輸入與一手寫輸入其中之一,第二輸入是該語音輸入與手寫輸入其中另一,其識別字符的方法是,根據第一輸入產生一字列,然后接收第二輸入,并根據第二輸入由第一輸入產生的字列中擷取與第二輸入最相符合的識別字符,這樣存在的問題是若第一輸入為手寫輸入時,用戶碰到不會寫的字時就無法完成第一輸入而產生一字列;若第一輸入為語音輸入時,用戶碰到不會讀的字時也無法完成第一輸入而產生一字列;這樣,無法根據第一輸入產生一字列,也就無法根據第二輸入由第一輸入產生的字列中擷取與第二輸入最相符合的識別字符,從而無法達到正確輸入的目的;(2)上述方法提出的手寫/語音模型訓練器只在訓練模式下才工作,即在使用該系統之前由用戶事先專門對其進行訓練,這樣才能達到建立個人的手寫/語音模型并存儲在手寫/語音數據庫中的目的,而在使用過程中,該手寫/語音數據庫是保持不變的,這種靜態的訓練方式比較單一,同時也不符合用戶的使用習慣。
發明內容
本發明的目的在于提供一種整合語音輸入和手寫輸入功能的漢字輸入系統,該系統可以幫助消費者更加方便地使用手機、電腦等輸入系統進行漢字的輸入,同時較好地解決了前面提到的已有方法存在的問題。
本發明提供的一種整合語音輸入和手寫輸入功能的漢字輸入系統,包括手寫模型訓練模塊、手寫數據庫、手寫輸入模塊、手寫信號特征生成模塊和手寫體候選漢字字列生成模塊;手寫輸入模塊用于接收漢字的手寫輸入,轉化為數字信號后分別傳送給手寫模型訓練模塊和手寫信號特征生成模塊;手寫模型訓練模塊用于調整手寫數據庫中的參數,并將其存儲至手寫數據庫;手寫數據庫用于存儲有手寫體漢字與漢字的匹配數據以及相關的匹配規則,接收并處理手寫體候選漢字字列生成模塊發送的請求;手寫信號特征生成模塊用于從數字信號中提取有效的手寫信號特征,并將其送入手寫體候選漢字字列生成模塊;手寫體候選漢字字列生成模塊接收到手寫信號特征生成模塊生成的待識別手寫體的手寫信號特征后,向手寫數據庫發送請求,要求手寫數據庫提供其已存儲的所有漢字的手寫信號特征,接收到手寫數據庫提供的其已存儲的所有漢字的手寫信號特征后,計算待識別手寫體的手寫信號特征與手寫數據庫提供的其已存儲的所有漢字的手寫信號特征之間的相似度大小,產生一手寫體候選漢字字列;其特征在于該系統還包括語音輸入模塊、語音信號特征生成模塊、語音候選漢字字列生成模塊、語音數據庫、語音模型訓練模塊、整合模塊和漢字識別及顯示模塊;語音輸入模塊用于接收最多一個漢字的語音輸入,并將該語音輸入裝置的輸出轉化為數字信號,分別傳送給語音信號特征生成模塊和語音模型訓練模塊;語音信號特征生成模塊用于提取有效的語音信號特征,并發送至語音候選漢字字列生成模塊;語音候選漢字字列生成模塊接收到語音信號特征生成模塊生成的待識別語音的語音信號特征后,向語音數據庫發送請求,接收其反饋的語音信號特征后,計算待識別語音的語音信號特征與語音數據庫提供的其已存儲的所有漢字的語音信號特征之間的相似度大小,用于產生一語音候選漢字字列,傳送至整合模塊;語音數據庫用于存儲有語音與漢字的匹配數據以及相關的匹配規則等,用于接收并處理語音候選漢字字列生成模塊發送的請求;語音模型訓練模塊用于調整語音數據庫中的參數,并存儲至語音數據庫;整合模塊接收手寫體候選漢字字列生成模塊和語音候選漢字字列生成模塊發送來的手寫體候選漢字字列和語音候選漢字字列,對二者進行組合,產生整體候選漢字字列,將其傳送給漢字識別及顯示模塊;漢字識別及顯示模塊用于從整合模塊產生的整體候選漢字字列中選擇權重最大的漢字,并將該漢字顯示,若整體候選漢字字列為空,則提示重新輸入。
本發明系統使用時,接收一個漢字的手寫輸入的同時輔以語音輸入,在提高了漢字識別率的同時,解決了上述的由于先根據第一輸入信號顯示一頻率最高的漢字,再輸入第二信號用于修正而帶來的麻煩,也解決了手寫輸入作為第一輸入時漢字不會寫或者語音輸入作為第一輸入時拼音拼不準而無法完成輸入的問題以及單獨的只使用手寫輸入或者語音輸入時,對結構相似或者發音相同的漢字無法識別或無法正確識別的問題;同時,利用手寫/語音模型訓練模塊,在個人使用該輸入系統的過程中,建立個人的手寫/語音模型,并儲存在手寫/語音數據庫中,加速了識別步驟的進行、提高了識別率,而其在使用的過程中動態更新手寫/語音數據庫,不必人為事先專門對其進行訓練,符合人們的使用習慣,對于高重復率的漢字的識別尤其快速有效。
圖1為本發明系統的結構示意圖;圖2為本發明漢字識別及顯示模塊按照手寫體候選漢字字列和語音候選漢字字列的組合狀態進行相應的漢字顯示或者提示重新輸入的組合狀態圖;圖3為本發明實施例的工作流程圖。
具體實施例方式
如圖1所示,本發明一種整合語音輸入和手寫輸入功能的漢字輸入系統包括手寫模型訓練模塊1、手寫數據庫2、手寫輸入模塊3、手寫信號特征生成模塊4、手寫體候選漢字字列生成模塊5、整合模塊6、漢字識別及顯示模塊7、語音輸入模塊8、語音信號特征生成模塊9、語音候選漢字字列生成模塊10、語音數據庫11、語音模型訓練模塊12。
手寫模型訓練模塊1用于在個人使用該漢字輸入系統的過程中,不斷調整手寫數據庫中的參數,使得手寫模型的性能不斷向某種最佳狀態(如對手寫數據庫中的所有漢字有最好的識別率)逼近,從而建立個人的手寫模型,個人手寫模型可以通過活動輪廓模型、基于筆劃的可變形彈性匹配模板以及SVM(支持向量)等來建立。
手寫數據庫2存儲有手寫體漢字與漢字的匹配數據以及相關的匹配規則等(如手寫信號特征等),用于接收并處理手寫體候選漢字字列生成模塊5發送的請求,且手寫數據庫中的參數在手寫模型訓練的過程中動態調整,使得系統模型的性能不斷向某種最佳狀態(如對手寫數據庫中的所有漢字有最好的識別率)逼近;手寫輸入模塊3用于接收一個漢字的手寫輸入,包括一個手寫輸入裝置(如手寫板),通過該手寫輸入裝置記錄相應的著力點的位置,并將其轉化為數字信號;手寫信號特征生成模塊4用于從數字信號中提取有效的手寫信號特征,并將其送入手寫體候選漢字字列生成模塊5,這里提取的有效的手寫信號特征是在經過預處理的基礎上得到的可以區別該漢字與其他漢字的特征(結構特征或統計特征),如可以是基于整字的筆畫特征,也可以是字根特征,還可以是漢字的筆跡分布統計特征等,根據具體問題,預處理可以包括二值化、平滑去噪、傾斜校正、曲線擬合、筆段優化、刪除無效筆段、筆段歸一化、非線性歸一化等步驟;手寫體候選漢字字列生成模塊5接收到手寫信號特征生成模塊4生成的待識別手寫體的手寫信號特征后,向手寫數據庫2發送請求,要求手寫數據庫2提供其已存儲的所有漢字的手寫信號特征,接收到手寫數據庫2提供的其已存儲的所有漢字的手寫信號特征后,計算待識別手寫體的手寫信號特征與手寫數據庫2提供的其已存儲的所有漢字的手寫信號特征之間的相似度大小,用于產生一手寫體候選漢字字列(即實現漢字匹配),該手寫體候選漢字字列具有多個與該待識別手寫體相對應的識別漢字,每個識別漢字按照其相似度大小賦以權重,該字列按照識別漢字的權重從大到小排列,根據提取的手寫信號特征的不同(結構特征或統計特征),實現漢字匹配的方法也不同,其中,基于結構特征的漢字匹配方法有基于筆段、筆劃的模板整字匹配法,松弛匹配、結構分析法,、屬性關系圖(ARG)方法、可變形的彈性筆劃匹配模型等等;基于統計特征的漢字匹配方法有神經網絡、FCM粗分類、以及SVM(支持向量機)等;整合模塊6根據產生的手寫體候選漢字字列以及語音候選漢字字列的組合狀態產生整體候選漢字字列,整合方法為當手寫體候選漢字字列與語音候選漢字字列同時為空時,整體候選漢字字列為空,將整體候選漢字字列傳送給漢字識別及顯示模塊7;當手寫體候選漢字字列非空,語音候選漢字字列為空時,將手寫體候選漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊7;當手寫體候選漢字字列為空,語音候選漢字字列非空時,將語音候選漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊7;當手寫體候選漢字字列與語音候選漢字字列同時非空,且兩個候選字列中有相同漢字時,將所有相同的漢字按手寫體權重從大到小排列,將排序后的漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊7;當手寫體候選漢字字列與語音候選漢字字列同時非空,且兩個候選字列中沒有相同漢字時,按照手寫體優先的原則將手寫體候選漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊7,其中,手寫/語音輸入在漢字識別中所占的權重是指各個候選漢字與該用戶輸入的手寫體/語音相對于彼此為符合的可能性程度(概率、相似度大小);漢字識別及顯示模塊7用于從整合模塊6產生的整體候選漢字字列中選擇權重最大的漢字,并將該漢字顯示,若整體候選漢字字列為空,則提示重新輸入;語音輸入模塊8用于接收不多于一個漢字的語音輸入,包括一個語音輸入裝置(如麥克風),并將該語音輸入裝置的輸出轉化為數字信號;語音信號特征生成模塊9用于去除語音中對識別無關緊要的冗余信息,提取有效的語音信號特征,這里提取的有效的語音信號特征是在經過預處理的基礎上得到的漢字的音節特征,也可以是漢字的聲調特征等,常用的語音信號特征有MFCC(Mel頻率倒譜系數)、LPCC(線性預測倒譜系數)等等,根據具體問題,預處理可以包括分幀、端點檢測、預加重、分段、加窗等步驟;語音候選漢字字列生成模塊10接收到語音信號特征生成模塊9生成的待識別語音的語音信號特征后,向語音數據庫11發送請求,要求語音數據庫11提供其已存儲的所有漢字的語音信號特征,接收到語音數據庫11提供的其已存儲的所有漢字的語音信號特征后,計算待識別語音的語音信號特征與語音數據庫11提供的其已存儲的所有漢字的語音信號特征之間的相似度大小,用于產生一語音候選漢字字列(即實現語音識別),該語音候選漢字字列具有多個與該待識別語音相對應的識別漢字,每個識別漢字按照其相似度大小賦以權重,該字列按照識別漢字的權重從大到小排列,用于實現語音識別的方法主要有動態時間歸整技術(DTW)、矢量量化技術(VQ)、隱馬爾可夫模型(HMM)、人工神經元網絡(ANN)等;語音數據庫11存儲有語音與漢字的匹配數據以及相關的匹配規則等(如語音信號特征以及同一個音對應的所有漢字的使用頻率等),用于接收并處理語音候選漢字字列生成模塊10發送的請求,且語音數據庫中的參數在語音模型訓練的過程中動態調整,使得系統模型的性能不斷向某種最佳狀態(如對語音數據庫中的所有漢字的語音有最好的識別率)逼近;語音模型訓練模塊12用于在個人使用該漢字輸入系統的過程中,不斷調整語音數據庫11中的參數,使得語音模型的性能不斷向某種最佳狀態(如對語音數據庫11中的所有漢字的語音有最好的識別率)逼近,從而建立個人的語音模型,個人語音模型可以通過多種方式建立,如動態時間歸整技術(DTW)、隱馬爾可夫模型(HMM)和人工神經元網絡(ANN)等等。
本發明系統使用時,通過手寫/語音輸入模塊接收一個漢字的手寫輸入以及不多于一個漢字的語音輸入(語音輸入可以為空),手寫/語音特征提取模塊則分別對上述輸入進行預處理,并從中提取相應的有效特征,手寫/語音候選漢字字列生成模塊接收到手寫/語音特征提取模塊所提取的待識別手寫體/語音的有效特征后,向手寫/語音數據庫發送請求,要求手寫/語音數據庫提供其已存儲的所有漢字的手寫/語音信號特征,手寫/語音數據庫接收手寫/語音候選漢字字列生成模塊的請求后對其進行處理,將手寫/語音數據庫提供的其已存儲的所有漢字的手寫/語音信號特征傳送給手寫/語音候選漢字字列生成模塊,手寫/語音候選漢字字列生成模塊計算待識別手寫體的手寫信號特征/待識別語音的語音信號特征與手寫/語音數據庫提供的其已存儲的所有漢字的手寫/語音信號特征之間的相似度大小,對應產生一手寫體/語音候選漢字字列,并將兩個字列傳送到整合模塊,整合模塊則根據兩個候選漢字字列的組合狀態產生一個按照權重從大到小排序的整體候選漢字字列,最后,漢字識別及顯示模塊提取整體候選漢字字列中權重最大的漢字并將其顯示。
由于漢字具有以下特性字型(部首以及筆劃)相似或者相同的漢字的讀音往往不同,讀音相同的漢字的字型往往差別較大。因此,整合手寫輸入和語音輸入的漢字輸入方法,使得在輸入手寫體漢字的同時輔以語音的輸入,結合兩者互補的特性即能夠有效地提高漢字的識別率,也解決了在第一輸入限定時,用戶由于字不會寫或者拼音拼不準而無法完成輸入的問題以及單獨地只使用手寫輸入或者語音輸入時,對結構相似或者發音相同的漢字無法識別或無法正確識別的問題,同時,這兩種自然的輸入方式相比較編碼等其他輸入方式而言,更加地人性化、便捷。
實施例下面以一位用戶現欲輸入一“四”字的實例來對本發明的實施作進一步具體的說明,該實施例中,對于手寫輸入的漢字采用筆劃-筆段-字根-整字的識別方式,以漢字的結構特征——字根特征作為手寫信號特征,以漢字的音節特征作為語音信號特征。
如圖3所示,該漢字輸入系統的工作過程為(1)用戶通過手寫板輸入漢字“ ”,同時(在允許的時限內),通過麥克風輸入語音“shi”,并將“ ”送入手寫模型訓練模塊,將“shi”送入語音模型訓練模塊;(2)手寫信號特征生成模塊以及語音信號特征生成模塊提取有效的手寫信號特征以及語音信號特征,其具體步驟包括
(2.1)手寫信號特征提取的具體步驟如下(2.1.1)手寫預處理,經過預處理得到漢字的筆段信息,預處理包括筆跡平滑、筆跡歸一化、筆劃逼近等步驟(2.1.1.1)筆跡平滑去除一些孤立點、噪聲點,排除干擾因素,并通過差值將缺少的點補上;(2.1.1.2)筆跡歸一化 將手寫筆跡映射到一個固定的方框當中,對其進行尺度,角度等方面的操作;(2.1.1.3)筆劃逼近用折線段去擬合曲線段;(2.1.2)字根提取,采用FCM模糊聚類算法對筆段進行自動聚類以及采用其他方法來達到準確提取字根的目的;(2.1.3)手寫信號特征提取(即字根特征的提取),通過對提取出來的字根采用統計的方式獲得字根的特征;(2.2)語音信號特征提取的具體步驟如下(2.2.1)語音預處理分幀、端點檢測,幀長可以選取20ms,端點檢測算法采用基于短時能量和過零率的雙門限法;(2.2.2)提取語音信號特征,特征選用12維MFCC(Mel頻率倒譜系數);(3)用松弛匹配將步驟(2.1)提取的“ ”的字根特征與數據庫中的各個漢字的字根特征進行一一匹配,計算他們之間的相似度,從而產生一個按權重從大到小排序的手寫體候選漢字字列皿60%、四30%、同10%(若只有手寫輸入,則按照手寫識別權重識別結果為“皿”(不正確));用隱馬爾可夫模型(HMM)將步驟(2.2)提取的“shi”的音節特征與語音數據庫中的各個漢字的音節特征進行一一匹配,計算他們之間的相似度,從而產生一個按權重從大到小排序的語音候選漢字字列是40%、使30%、十12%、四10%、死8%(由于該用戶發音不準,若只有語音輸入,則按照語音識別權重識別結果為“是”(不正確)),將兩個字列傳送到整合模塊;(4)整合從步驟(3)得出的手寫體候選漢字字列“皿 60%、四30%、同10%”與語音候選漢字字列“是40%、使30%、十12%、四10%、死8%”同時非空,且兩個候選字列中有相同漢字“四”,按照圖2,則將所有相同的漢字按手寫體權重從大到小排列,將排序后的漢字字列“四100%”作為整體候選漢字字列傳送到漢字識別及顯示模塊;(5)從步驟(4)得出的整體候選漢字字列“四100%”中選取權重最大的漢字“四”,并將其顯示(即,若在手寫體輸入的同時輔以語音輸入“shi”(該音不準),則按照兩者整合識別結果為其相同的漢字“四”,識別結果與用戶期望輸入的漢字一致,識別正確);(6)訓練采用基于筆劃的可變形彈性匹配模板建立手寫訓練模型,并對漢字字根進行訓練,根據步驟(1)輸入的手寫體“ ”和語音“shi”以及步驟(5)識別出的漢字“四”更改手寫數據庫中漢字“四”的字根特征,使得其與“ ”的字根特征更加相近,則使得用戶再次輸入“ ”時,“ ”的字根特征與數據庫中“四”的字根特征的相似度更大(如可以更改如下皿50%、四40%、同10%),同時,采用隱馬爾可夫模型(HMM)建立語音訓練模型,并對漢字音節進行訓練,更改語音數據庫中漢字“四”的音節特征(如更改音節特征后使得按相似度計算的候選漢字字列如下四45%、死30%、絲12%、是10%、使3%)。
權利要求
1.一種整合語音輸入和手寫輸入功能的漢字輸入系統,包括手寫模型訓練模塊(1)、手寫數據庫(2)、手寫輸入模塊(3)、手寫信號特征生成模塊(4)和手寫體候選漢字字列生成模塊(5);手寫輸入模塊(3)用于接收漢字的手寫輸入,轉化為數字信號后分別傳送給手寫模型訓練模塊(1)和手寫信號特征生成模塊(4);手寫模型訓練模塊(1)用于調整手寫數據庫(2)中的參數,并將其存儲至手寫數據庫(2);手寫數據庫(2)用于存儲有手寫體漢字與漢字的匹配數據以及相關的匹配規則,接收并處理手寫體候選漢字字列生成模塊(5)發送的請求;手寫信號特征生成模塊(4)用于從數字信號中提取有效的手寫信號特征,并將其送入手寫體候選漢字字列生成模塊(5);手寫體候選漢字字列生成模塊(5)接收到手寫信號特征生成模塊(4)生成的待識別手寫體的手寫信號特征后,向手寫數據庫(2)發送請求,要求手寫數據庫(2)提供其已存儲的所有漢字的手寫信號特征,接收到手寫數據庫(2)提供的其已存儲的所有漢字的手寫信號特征后,計算待識別手寫體的手寫信號特征與手寫數據庫(2)提供的其已存儲的所有漢字的手寫信號特征之間的相似度大小,產生一手寫體候選漢字字列;其特征在于該系統還包括語音輸入模塊(8)、語音信號特征生成模塊(9)、語音候選漢字字列生成模塊(10)、語音數據庫(11)、語音模型訓練模塊(12)、整合模塊(6)和漢字識別及顯示模塊(7);語音輸入模塊(8)用于接收最多一個漢字的語音輸入,并將該語音輸入裝置的輸出轉化為數字信號,分別傳送給語音信號特征生成模塊(9)和語音模型訓練模塊(12);語音信號特征生成模塊(9)用于提取有效的語音信號特征,并發送至語音候選漢字字列生成模塊(10);語音候選漢字字列生成模塊(10)接收到語音信號特征生成模塊(9)生成的待識別語音的語音信號特征后,向語音數據庫(11)發送請求,接收其反饋的語音信號特征后,計算待識別語音的語音信號特征與語音數據庫(11)提供的其已存儲的所有漢字的語音信號特征之間的相似度大小,用于產生一語音候選漢字字列,傳送至整合模塊(6);語音數據庫(11)用于存儲有語音與漢字的匹配數據以及相關的匹配規則等,用于接收并處理語音候選漢字字列生成模塊(10)發送的請求;語音模型訓練模塊(12)用于調整語音數據庫(11)中的參數,并存儲至語音數據庫(11);整合模塊(6)接收手寫體候選漢字字列生成模塊(5)和語音候選漢字字列生成模塊(10)發送來的手寫體候選漢字字列和語音候選漢字字列,對二者進行組合,產生整體候選漢字字列,將其傳送給漢字識別及顯示模塊(7);漢字識別及顯示模塊(7)用于從整合模塊(6)產生的整體候選漢字字列中選擇權重最大的漢字,并將該漢字顯示,若整體候選漢字字列為空,則提示重新輸入。
2.根據權利要求1所述的漢字輸入系統,其特征在于整合模塊(6)按照下述方法進行組合當手寫體候選漢字字列與語音候選漢字字列同時為空時,整體候選漢字字列為空,將整體候選漢字字列傳送給漢字識別及顯示模塊(7);當手寫體候選漢字字列非空,語音候選漢字字列為空時,將手寫體候選漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊(7);當手寫體候選漢字字列為空,語音候選漢字字列非空時,將語音候選漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊(7);當手寫體候選漢字字列與語音候選漢字字列同時非空,且兩個候選字列中有相同漢字時,將所有相同的漢字按手寫體權重從大到小排列,將排序后的漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊(7);當手寫體候選漢字字列與語音候選漢字字列同時非空,且兩個候選字列中沒有相同漢字時,按照手寫體優先的原則將手寫體候選漢字字列作為整體候選漢字字列傳送給漢字識別及顯示模塊(7)。
全文摘要
本發明公開了一種整合語音輸入和手寫輸入功能的漢字輸入系統,屬于漢字輸入方法的應用技術領域。該系統包括手寫/語音輸入模塊、手寫/語音信號特征生成模塊、手寫體/語音候選漢字字列生成模塊、整合模塊、漢字識別及顯示模塊、手寫/語音模型訓練模塊及手寫/語音數據庫。本發明在手寫輸入時輔以語音輸入,可提高漢字的識別率,解決了只使用手寫/語音輸入存在的問題有不會寫/讀的漢字而無法完成輸入及對結構相似或發音相同的漢字無法識別或無法正確識別,同時,使用該系統的過程中進行手寫/語音模型訓練,建立個人的手寫/語音數據庫,在不改變用戶使用習慣的同時可加速識別步驟的進行,對高重復率的漢字的識別尤其快速有效。
文檔編號G06F3/041GK101082836SQ200710052608
公開日2007年12月5日 申請日期2007年6月29日 優先權日2007年6月29日
發明者劉宏, 宋恩民, 呂新橋, 代四廣 申請人:華中科技大學