專利名稱:漢字檢索碼-三碼字形輸入法及鍵盤的制作方法
技術領域:
本發明涉及一種漢字編碼技術及其鍵盤設計。
漢字編碼是實現中文信息的傳遞和處理的關鍵,可廣泛應用于辦公自動化、文字處理系統、印刷排版系統以及計算機網絡通訊系統,近幾年來國內外提出了數十種漢字編碼方案及其配套技術,有些編碼技術產品已被用戶所接受,現有編碼方案有音形、筆形、字形等類型。音形編碼法編碼簡便,但重碼多、輸入速度慢,而且要懂其普通話讀音,筆形編碼法和字形編碼法,規則過多、記憶量大,涉及鍵碼多,操作者必須要經過專門訓練,否則難以勝任。從擊鍵次數來分,有全二碼、全三碼、全四碼,若采用26個符號編碼的全二碼為262,最大容量只能區分676個字,其他就得通過提示行查找,再擊對應的數字鍵,如此不僅難以通過兩擊鍵完成,而且會使整個編碼方案缺乏規律性,造成欲速不達的結果,采用全四碼則為264,最大容量可達456976,但國標一、二級漢字一共才6763個字,重碼概率雖少,但擊鍵次數較之全三碼多了四分一、選擇反映也得增加一次。本發明人曾提出了一種以筆劃順序和筆劃結構編排的個全三碼漢字編碼方法,其優點是只要懂得筆劃順序就能進行健盤操作,然而其缺點是筆順本身較難規范,掌握書寫筆順需要較長時期的漢字學習過程,另外一些讓過規則等說明較復雜。
鑒于各類編碼方法各有優缺點,本發明目的是提供一種以筆形結構編排的全三碼漢字編碼方法及鍵盤設計,只要具有對漢字圖形的理解能力,就能通過看取碼規則進行鍵盤操作。
本發明的編碼方法為以標準鍵盤上的26個英文字母作為代碼,相應分10個區,它們分別為點區Q、A、Z撇區W、S、X斜區E、D、C雙區R、F、V架區T、G、B豎區Y、H、N橫區U、J、M框區I、K蓋區O、L反區P這26個英文字母分別作表示字形特征筆形的代碼,相應設計了鍵碼表(見附表1)。
其相應的編碼規則為按照漢字上下左右結構形狀,分別按鍵碼表的筆形提取相應一、二、三碼,每個漢字最多為三碼,其編碼方法主要是“先上后下,從左至右,右下占角,返上取留”,并運用“越過”、“回取”等規則,減少了表示字形特征筆形的代表元的設置,具體編碼細則為1、編碼程序分一、二、三碼第一碼取漢字左部結構最上筆形,以多筆為優,同為多筆,上部組合為優。
如桔--木(G)輝--
(F)
前--(D)第二碼取一碼被取筆形右邊結構最上筆形,若向右無結構,則沿下左起取最上筆形。
如桔--木(G)士(T) 輝--(F)冖(O)前--(D)冂(O)第三碼,取單字右下角筆形,以占角為優,無明顯占角的,以下部為優,有斜筆的,以斜筆為優。
如桔--木(G)士(T)口(K)輝--(F)冖(O)丨(y)啼--口(K)亠(D)丨(y)拆--J(N)
(P)丶(Q)編碼程序中所述的筆形是指鍵碼表列出的筆劃形狀和部分概念所包含的筆劃形狀,本發明中是只取筆形,不計筆順,凡漢字筆劃始端接觸的作連貫取形。凡兩個筆劃的離散筆形,不能有它筆間隔,帶斜筆的,底部須平行,縱橫筆的,不能有一筆交叉,否則,不能組成一個筆形,不同筆形其有相應的碼來表示,如代碼“Q”,其相應的筆形為“丶”,代碼“U”其相應的筆形為“一”;代碼
“其相應的筆形為“土”,代碼“R”,其相應的概念為“雙斜上靠,其所包函的筆形有”八、人、入,本發明不計筆順,只取筆形,凡漢字筆劃始端接觸的,作連貫取形,如“凵”不作
不作“丿、“丨”、“”、“一”。
編碼程序中所指的結構是指最大筆形左右兩端垂線的中筆形間部分。如“因”字,其結構為“口”左右兩端垂線,“告”其結構為“”左右兩端垂線的中間部分為“” “丨”,“土”最上筆形是“丨”和“土”,“歸”字其結構為“丿”和“”兩個結構,也是最上的兩個筆形。
編碼程序中所指的筆形組合是指以多筆為優,同為多筆,一、二碼以上部組合為優,三碼以占角為優。
如“桔”,第一碼左部最上筆形有“丨”(y)、“木”(G),因“木”的筆劃多于“十”和“丨”,故應取“木”的代碼“G”。但如“精”字,第一碼左部最上筆形有“丨”(y)、“土”(T)、“木”(G),
(F),因
是最上部筆劃組合,故應取
的代碼“F”。又如鑒,第一碼取
的筆形代碼“H”,第二碼向右取“”筆形代碼“S”,第三碼有“土”的筆形代碼“T”和“”的筆形代碼“D”,因“”較“土”更靠右下角,故第三碼應取“”的代碼“D”。
2、越過規則在上下取碼時,處于一碼被取筆形交叉、正上部的筆劃應越過,凡越過筆劃在沿下取碼時,不作筆形組合。
(1)交叉越過如“有”,一碼取“丿”,二碼應越過與之交叉的“一”,取筆形“冂”,再如“各”,一碼取“ク”二碼應越過與之交叉的“”,取筆形“口”。
(2)正上越過如“慝”,一碼取“”,二碼應越過上部的“若”,取筆形“心”,再如
,一碼取“ク”,二碼應越過上部的“丶”取筆形“宀”。
3、回取規則(1)凡一碼被取筆形已占據單字右下角的,二碼返回上部,按第一碼、第二碼取碼規劃,依次復取留剩筆形。
如“匾”字,一碼取筆形“”,二碼應返回上部留剩的“戶”,三碼再取“冂”,則匾字的碼為PEO,如“颼”字,一碼取筆形“幾”,二碼應返回上部左起取筆形“X”,三碼再向左取上筆形“丨”,則按鍵碼表“颼”字代碼為OVY。再如“閣”字,一碼取筆形“門”,二碼應返回上部,復取留剩的“ク”,三碼再越過交叉的“”,取筆形“口”,則“閣”字代碼為ZXK。
(2)凡二碼被取筆形占據右下角的三碼返回上部再取留剩筆形若是左右結構以右上為優。
如“胃”字,一碼取筆形
,二碼越過
中的“十”,沿下取筆形“冂”,三碼返回上部再取留剩筆形“丨”,如“拒”,一碼取筆形“亅”,二碼向右取筆形“”,三碼應回取占據右下角結構的留剩筆形“”。再如“郡”字,一碼取筆形“”,二碼取筆形“阝”,三碼因右部結構無留剩筆形,故應回取左部最上留剩筆形“丿”。
4、重碼處理規則a.設一碼提示行每一代碼設10個以該代碼為首碼的高頻字編成1、2、3擊代碼鍵顯示屏提示行即顯示1、2、3……0共10個高頻字,再擊數字鍵,單字就會自動進入編輯位置,高頻字共有260個;例擊代碼健A則顯示屏顯示1法、2流、3洗、4游、5注、6洋、7波、8液、9潮、0滾、這樣擊相應數字鍵則“洋”字會自動進入編輯位置(見附表2 26×26漢字編碼檢索表);b.設首位重碼漢字為唯一代碼在同組重碼漢字中,選擇使用頻率高的重碼漢字放在首位,根據本編碼方法,如AJU的重碼漢字為“江、汪、汗、洱”4個,這4個重碼漢字中,“江”字使用頻率最高,即將“江”放在首位,其代碼為AJU,是唯一代碼。
c.設二碼提示行將首碼、次碼代碼相同的漢字編成1、2、3…設二碼提示行、用按首碼鍵加按次碼鍵再加按數字鍵,單字就會自動進入編輯位置,按本方案的編碼規則,如AR為前兩碼的ARD淦滏,ARH渝湓ARQ冷澮,ARV溆瀲,其中滏、湓、澮、瀲不在首位,按三碼不能自動進入編輯位置,現用兩碼提示行,即鍵入AR兩個碼時,就將事先編入的滏、湓、澮、瀲顯示出來,并有相數字號,如1滏、2湓、3澮、4瀲因此只要擊ARI三鍵,則完成滏的取碼。
d、設一碼翻頁提示行,編成1、2、3……0共10個漢字后,剩余的漢字,則用首碼鍵加>鍵加數字鍵的方法,單字會自動進入編輯位置。
下面結合附圖,附表對本發明作進一步說明。
圖1為鍵盤與手指布置示意圖;附表1鍵碼表附表2 26×26漢字編碼檢索表附表3取碼參考表本發明所用鍵盤與手指按排見附圖1,QAZ三個左小指操作鍵為“點”區,WSX三個左環指操作鍵為“撇”區,EDC三個左中指操作鍵為“斜”區,RFV三個左食指操作鍵為“雙”區,TGB三個左食指前移操作鍵為“架”區,YHN三個右食指前移操作鍵為“豎”區,UJM三個右食指操作鍵為“橫”區,IK二個右中指操作鍵為“框”區,OL二個右環指操作鍵為“蓋”區,P一個右小指操作鍵為“反”區,這樣左手四指為上斜,右手四指為上平,兩食指前移為上豎本發明對幾個離散筆形碼加以規定,如“八”、
“氵”,凡左右離散的筆劃所到底部,應在同一水平線,如“八”代碼“R,”而
則不能取代碼“R”,縱橫離散的如果交叉也不能組合成離散筆劃,只能一筆一筆按鍵碼表規定取碼,如“杜”首碼應取“木”的代碼“G”而不能取
的代碼,若離散筆劃中間有間隔筆劃存在,也只能一筆筆取碼,臺“州”字兩個豎筆不能拼在一起算
,則州之首碼不能取“H”,應為“W”,“州”的代碼應為WYY。
據上所述的編碼規則,采用全三碼的編碼方案,編碼容量為17576字,對于上述方案,編了26×26漢字編碼檢索表如表2所示,以及取碼參考見附表3,把這些表在計算機內建立漢字字庫制成漢字軟盤供操作者使用。
同現有編碼方法相比,發明具有以下優點1、以字形編碼。不知讀音也不用翻查字典,亦可根據需要擴充字庫,能將所有漢字納入編碼范疇。
2、記憶量小。本方案10個筆形區,以26個英文字母作為代碼來編碼,是同類形碼代表元和規則設置最簡單的方案。
3、輸入速度快。采用 長碼較之一般長短碼要減少一次單字結束鍵,采用全三碼共17576字容量,由于國際一、二級漢字一共才6763字,因此采用全三碼足以進行編碼。采用全四碼,寫編碼容量達456976字,出鍵次數部較之全三碼多了四分之一,選擇反映也得增加一次,而全二碼的容量只有262即676字的容量,其他待通過提示行查找對應的數字鍵,反而使編碼方案缺乏規律性,再則,全三碼由于編碼分配要求均衡,故在詞匯輸入時,采用首碼拼組的方法重碼概率反而小,因而容易達到快速目的。
4、編碼規則嚴密。本發明采取“先上后下,從左至右、右下占角,返上取留”的編碼方法,尤其是筆形概念和拼組規則,使漢字編碼更具規律性和系統化。
5、易學性,本發明編碼方法無任何編外體系,也不需要任何專業知識,從習慣的漢字結構入手,配置簡單的筆形,分一、二、三碼取碼,易學,易掌握。
6、簡繁漢字為同一碼表。字典、辭海,以及中外對澤字典等文字檢索都能廣泛使用,尤其是辭書上一些筆順,部首較難辯識的僻字,本方案亦可以解決。
7、鍵盤設計合理。本方案根據標準計算機鍵盤的擊鍵指法,分10個區的筆形組合用26個英文字母作為代碼,形成左平、右斜、中間直的輻射布局,從而省略了對西文字符,漢字讀音,書寫筆順之類的轉換媒介。
8、適用范圍廣。本發明可廣泛用于辦公自動化管理、文字處理,企事業單位事務管理,印刷排版,計算機網絡通訊等場合,尤其是辭書檢索方面有十分廣泛的應用前景。由于本方案是以圖形分解方法設計筆形,并且在取碼程序上既克服了漢字復雜的結構概念,又理順了先后秩序,尤其在筆形上將始端有觸點的筆劃作連貫取形,大大改變了令外國人難以掌握的筆順概念,從而使漢字編碼達到國際化的程度。
表1 鍵碼表
注離散筆形不可間隔組合;縱橫離散無交叉方可組合;兩斜筆離散組合底部須平行。
表2 漢字編碼檢索表
表3 取碼參考
權利要求
1.一種漢字檢索碼--三碼字形輸入法及鍵盤,其特征在于,以標準鍵盤上的26個上英文字母作為代碼,相應分成10個區,們分別為點區Q、A、Z撇區W、S、X斜區E、D、C雙區R、F、V架區T、G、B豎區Y、H、N橫區I、K蓋區O、L反區P這26個英文字母分別作表示字形特征筆形的代碼,相應設計了鍵碼表鍵碼表
注離散筆形不可間隔組合;縱橫離散無交叉方可組合;兩斜筆離散組合底部須平行。其相應的編碼規則為按照漢字上下左右結構形狀,分別按鍵碼表的筆形提取相應一、二、三碼,每個漢字最多為三碼,其編碼方法以“先上后下、從左至右、右下占角、返上取留”及“運用越過”、“回取”規則,具體編碼細則為(1)編碼程序分一、二、三碼;第一碼,左起取單字結構最上筆形,以多筆為優,同為多筆,上部組合為優;第二碼,取一碼被取筆形右邊結構最上筆形,若向右無結構,則沿下左起取最上筆形;第三碼取單字右下角筆形,以占角為優,無明顯占角的,發下部筆形為優有斜筆的,以斜筆為優;(2)越過規則在上下取碼時,處于一碼被取筆形交叉、正上部分筆劃應越過,凡越過筆劃在沿下取碼時不可作筆形組合;(3)回取規則a.一碼被取筆形已占據單字右下角的,二碼返回上部,按第一、第二碼規則,依次復取留剩形;b.二碼被取筆形占據右下角的,三碼返回上部再取留剩筆形,正上無留剩,取左部留剩,若是右右結構,以右上為先;(4)重碼處理規則a.設一碼提示行每一代碼設10個以該代碼為首碼的高頻字編成1、2、3……,擊該代碼鍵,顯示屏揭示行即顯示1、2、3……0共10個高頻字;再擊數字鍵,單字就會自動進入編輯位置,高頻字共有260個;b.設首位重碼漢字為唯一代碼在同組重碼漢字中,選擇使用頻率高的重碼漢字放在首位,c.設二碼提示行將首碼、次碼代碼相同的漢字,編成1、2、3……設二碼提示行、用首碼+次碼+數字鍵,單字就會自動進入編輯位置;d.設一碼翻頁提示行二碼提示行編編成1、2、3……0共10個漢字后,剩余的漢字,則用首碼鍵加>鍵加數字鍵的方法,單字會自動進入編輯位置。
2.根據權利要求1所述的漢字檢索碼--三碼字形輸入法及鍵盤,所述的鍵盤分QAZ三個左小指操作鍵為“點”區,WSX三個左環指操作鍵為“撇”區、EDC三個左中指操作鍵為“斜”區,PFV三個左食指操作鍵為“雙”區,TGB三個左食指前移操作鍵為“架”區,YHN三個右食指前移操作鍵為“豎”區,UJM三個右食指操作鍵為“橫”區,IK二個右中指操作鍵為“框”區,OL二個右環指操作鍵為蓋區,P一個右小指操作鍵為“反”區。
全文摘要
本發明涉及一種漢字檢索碼-三碼字形輸入法及鍵盤,特點是以鍵盤的26個英文字母作為表示字形特征筆形的代碼,相應分成點、撇、斜、架、豎、橫、框、蓋、反10個區,相應設計了鍵碼表,運用筆形先上后下、從左至右、右下占角、返上取留及“越過”、“回取”等規則,分別按鍵碼表的筆形提取一、二、三等長碼。本發明優點以形取碼方便、易學、輸入速度快,記憶量較少,編碼規則嚴,檢索功能好,鍵盤布局合理,可廣泛應用于辦公自動化、文字處理、企事業單位事務管理,印刷排版、計算機網絡通訊等場合。
文檔編號G06F3/023GK1167293SQ9611637
公開日1997年12月10日 申請日期1996年5月30日 優先權日1996年5月30日
發明者彭太旅, 彭志堅 申請人:彭志堅