一種漢字書寫字形識別方法及裝置的制造方法
【技術領域】
[0001] 本發明涉及計算機領域,具體涉及一種漢字書寫字形識別方法及裝置。
【背景技術】
[0002] 漢字廣泛應用于人們的日常生活工作當中,在現有技術中,利用計算機自動識別 字符的技術已經比較成熟,例如OCR的ptical化aracter Reco即ition,光學字符識別)是 利用電子設備,如掃描儀或數碼相機,檢查紙上打印的字符,通過檢測暗、亮的模式確定其 形狀,然后用字符識別方法將形狀翻譯成計算機文字。
[0003] 在上述應用中對文字的識別是W文字為單位,W判斷出輸入的是什么字符為識別 目標,但是,在一些領域中,漢字的書寫過程也需要被關注,例如漢字字形、筆畫位置等方面 是否正確,而在現有技術中,尚不存在對文字書寫過程中字形是否正確進行識別的技術。
【發明內容】
[0004] 有鑒于此,本發明提供一種漢字書寫字形識別方法及裝置,W解決現有技術中無 法對漢字書寫字形進行識別的技術問題。
[0005] 為解決上述問題,本發明提供的技術方案如下:
[0006] -種漢字書寫字形識別方法,預先保存標準漢字的標準筆畫數據,所述標準筆畫 數據包括組成標準筆畫的點的坐標,所述方法包括:
[0007] 采集獲得用戶通過筆畫方式輸入的實時漢字的第一實時筆畫數據,所述第一實時 筆畫數據包括組成實時筆畫的點的坐標;
[0008] 根據所述標準筆畫數據計算所述標準漢字的重必,根據所述第一實時筆畫數據計 算所述實時漢字的重必;
[0009] 對所述實時漢字進行偏移,偏移量為所述實時漢字的重必與所述標準漢字的重必 的差值,獲得偏移后實時漢字的第二實時筆畫數據,所述第二實時筆畫數據包括組成偏移 后實時筆畫的點的坐標;
[0010] 根據所述組成偏移后實時筆畫的點的坐標W及所述組成標準筆畫的點的坐標,計 算每個所述偏移后實時筆畫與對應的標準筆畫的距離。
[0011] 相應的,所述方法還包括:
[0012] 通過增加或刪除所述標準筆畫中的點,使所述組成標準筆畫的點的個數達到預設 個數;
[0013] 通過增加或刪除所述實時筆畫中的點,使所述組成實時筆畫的點的個數達到所述 預設個數。
[0014] 相應的,所述根據所述標準筆畫數據計算所述標準漢字的重必,根據所述第一實 時筆畫數據計算所述實時漢字的重必,包括:
[0015] 將所述標準漢字中全部點的坐標進行求和,除W所述標準漢字中全部點的總數, 獲得所述標準漢字的重必;
[0016] 將所述實時漢字中全部點的坐標進行求和,除W所述實時漢字中全部點的總數, 獲得所述實時漢字的重必。
[0017] 相應的,所述根據所述組成偏移后實時筆畫的點的坐標W及所述組成標準筆畫的 點的坐標,計算每個所述偏移后實時筆畫與對應的標準筆畫的距離,包括:
[0018] 計算所述偏移后實時筆畫中第m個實時筆畫點的坐標與對應的標準筆畫中第m個 標準筆畫點的坐標之間的距離,并將計算獲得的m個距離之和作為所述偏移后實時筆畫與 對應的標準筆畫的距離,m的取值范圍為1到所述標準筆畫的點的個數。
[0019] 相應的,所述方法還包括:
[0020] 根據預先保存的部件結構信息,計算組成部件的偏移后實時筆畫與對應的標準筆 畫的距離之和;
[0021] 和/或計算組成所述實時漢字的偏移后實時筆畫與對應的標準筆畫的距離之和。
[0022] -種漢字書寫字形識別裝置,所述裝置包括:
[0023] 保存單元,用于根據預先保存的部件信息,計算預先保存標準漢字的標準筆畫數 據,所述標準筆畫數據包括組成標準筆畫的點的坐標;
[0024] 采集單元,用于采集獲得用戶通過筆畫方式輸入的實時漢字的第一實時筆畫數 據,所述第一實時筆畫數據包括組成實時筆畫的點的坐標;
[0025] 第一計算單元,用于根據所述標準筆畫數據計算所述標準漢字的重必,根據所述 第一實時筆畫數據計算所述實時漢字的重必;
[0026] 偏移單元,用于對所述實時漢字進行偏移,偏移量為所述實時漢字的重必與所述 標準漢字的重必的差值;
[0027] 獲得單元,用于獲得偏移后實時漢字的第二實時筆畫數據,所述第二實時筆畫數 據包括組成偏移后實時筆畫的點的坐標;
[0028] 第二計算單元,用于根據所述組成偏移后實時筆畫的點的坐標W及所述組成標準 筆畫的點的坐標,計算每個所述偏移后實時筆畫與對應的標準筆畫的距離。
[0029] 相應的,所述裝置還包括:
[0030] 調整單元,用于通過增加或刪除所述標準筆畫中的點,使所述組成標準筆畫的點 的個數達到預設個數;通過增加或刪除所述實時筆畫中的點,使所述組成實時筆畫的點的 個數達到所述預設個數。
[0031] 相應的,所述第一計算單元包括:
[0032] 第一計算子單元,用于將所述標準漢字中全部點的坐標進行求和,除W所述標準 漢字中全部點的總數,獲得所述標準漢字的重必;
[0033] 第二計算子單元,用于將所述實時漢字中全部點的坐標進行求和,除W所述實時 漢字中全部點的總數,獲得所述實時漢字的重必。
[0034] 相應的,所述第二計算單元具體用于:
[0035] 計算所述偏移后實時筆畫中第m個實時筆畫點的坐標與對應的標準筆畫中第m個 標準筆畫點的坐標之間的距離,并將計算獲得的m個距離之和作為所述偏移后實時筆畫與 對應的標準筆畫的距離,m的取值范圍為1到所述標準筆畫的點的個數。
[0036] 相應的,所述裝置還包括:
[0037] 第H計算單元,用于根據預先保存的部件結構信息,計算組成部件的偏移后實時 筆畫與對應的標準筆畫的距離之和;
[0038] 和/或計算組成所述實時漢字的偏移后實時筆畫與對應的標準筆畫的距離之和。
[0039] 由此可見,本發明實施例具有如下有益效果:
[0040] 本發明實施例通過將采集得到的實時漢字平移到與標準漢字重必重疊位置,獲得 偏移后實時漢字每個實時筆畫的實時筆畫數據,再通過計算每個實時筆畫與對應的標準筆 畫的距離,獲得各筆畫形態的識別結果,進一步也可W由每個實時筆畫與對應的標準筆畫 的距離獲得漢字各部件字形W及整字字形的識別結果,從而實現對漢字書寫字形的識別。
【附圖說明】
[0041] 圖1為本發明實施例提供的漢字書寫字形識別方法實施例一的流程圖;
[0042] 圖2為本發明實施例提供的漢字書寫字形識別方法實施例二的流程圖;
[0043] 圖3為本發明實施例提供的漢字書寫字形識別裝置實施例的示意圖。
【具體實施方式】
[0044] 為使本發明的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖和具體實 施方式對本發明實施例作進一步詳細的說明。
[0045] 每個漢字是由一組固定的筆畫組成的,對應漢字字形書寫的優劣是W呈現在紙面 上的位置分布相關,也就是漢字字形的結構分布。在現有技術中尚沒有對漢字書寫字形的 識別,針對送個問題,本發明實施例中提供一種漢字書寫字形識別方法及裝置,通過把實時 漢字的坐標平面映射到標準漢字的坐標平面,使實時漢字與標準漢字的中必重疊,