專利名稱:正字法漢字編碼的制作方法
技術領域:
本發明涉及漢字信息處理技術,特別是一種漢字字形書寫標準化規范化的漢字編碼方法。
現在,漢字編碼方法已有許多種,有的也已應用于計算機輸入系統,但在這些諸多漢字編碼方法中,往往要求使用者去死記硬背一些繁鎖的、難于理解的、學了易忘的、人為定義的規則,或者,要求使用者去死記硬背大量的字根、字元、部件、部首等等,而這些用字根、字元、部件、部首來組成的漢字往往不符合漢字的字形規范和人們書寫的筆順規則,有的甚至將漢字拆分得令人莫名其妙。例如“丁”加“口”不是“可”字,“一”加“四”加“小”不是“柬”字,違反了字形規范,又比如“冉”字的筆順為“門”加“丨”加“二”,而不是“冂”加“土”,“戒”字的筆順為“一”加“ ”加“ ”,而不是“戈 ”加“廾”,違反了筆順規則。諸多例子數不勝數,對比在西文中,如英文單詞在輸入計算機時,人們不會將re-、-ty、-tion、-nal等構詞結構用一些字母來代替,并不按英語的詞形規范和書寫規則來進行計算機輸入,這等于要人們去接受一種莫名其妙的東西。
另外,漢語拼音是漢字的發音根本,但中國幅員遼闊,地方語音眾多,每個人的發音不一定很標準,如果漢語走向世界,發音不準的問題就更容易使人們在使用拼音法、音形法等這類漢字編碼方法時,在鍵盤上一試再試地進行猜測式操作。西文單詞都可以用國際音標來發音,但人們不會用輸入國際音標的方式來達到輸入西文的目的。
眾所周知,文字必須規范化,文字的規范化水平反映一個國家的文化水平,世界各國都很重視本國文字的規范化,我國也很重視漢字的規范化,先后發布了《印刷通用漢字字形表》、《現代漢語常用字表》、《現代漢語通用字表》等漢字標準,在這些字表當中,規定了漢字的筆畫數目、筆畫形狀、筆畫順序和構件部位,它們是正確書寫漢字的依據。1986年,國務院提出“逐步消除社會用字混亂的不正常現象”的要求,同樣適用于諸多漢字編碼方法中那些違反漢字規范化的現象。所以全體使用和學習漢語的人,都要用上述標準來指導識字和寫字、規范漢字寫法。規范的標準一經確立和公布,是要求全社會都認可和恪守的,具有強制人們遵循的含義,任何一個社會成員都無權發布變動或廢除這種標準。
中華文化燦爛、悠久,漢語詞句嚴謹、表達力豐富,層次分明、邏輯性強。漢字結構嚴明、單字組詞能力強。現在世界上已有越來越多的人使用和學習漢語,在當今的計算機時代,要使方塊形的漢字被計算機接受,就必須對漢字進行編碼,使字數繁多、字形復雜、不易檢索的漢字,在保持中華文字傳統的前提下,使之能夠既符合漢字書寫的規范,又接近世界上大多數文字的形態,成為易于并喜歡被人們接受的、合乎全世界人民打字和檢索習慣的編碼形式。本發明的目的就在于向所有使用和學習漢語的人,從人人皆知的漢字書寫規則和習慣出發,提供一種以漢字書寫規范化的,不需死記硬背的,以最少記憶量的,無需任何口訣的,能在很短時間內學會(一般人,包括小學生能在15分種內學會并可上機操作)的漢字編碼。使所有使用和學習漢語的人,能用世界上最流通的打字輸入方式和字典檢索方式來使用漢字,從而使中華文字真正地走向世界,與世界上大多數文字相接軌。
西文是以單詞為基本單位的,而西文字母是組成西文單詞的根本元素,比如,英文流通于全世界,其寫法不是因地而異,而是全世界各地的英文寫法都是一致的,不會出現面目各異的英文,達到了高度的規范化。書寫英文字母以構成英文單詞,同樣在計算機上輸入英文字母,以達到輸入英文單詞的目的。
中文是以單字為基本單位的,而漢字筆畫形狀是構成漢字的根本元素,只有按漢字筆順規則書寫筆畫形狀,才能組成字形標準化的漢字。因此,在計算機上,只有按筆順規則輸入漢字筆畫形狀代碼,才能達到正確輸入漢字的目的,不會強制人們去接受另一種莫名其妙的所謂“漢字”。
本發明的漢字編碼更具體地說是將漢字筆畫形狀集分成八類,并用八個英文小寫字母a、b、c、d、c、f、g、h分別表示,簡稱筆形字母代碼,將漢字分解成筆畫形狀,按照漢字筆順規則順序排列,用筆形字母代碼來編碼的一種漢字編碼。具體說明如下1.技術方案本發明歸納出組成漢字的基本筆畫形狀有32種,如下所示 如果用上表所示的32個筆畫形狀來定義計算機鍵盤當中的32個鍵,按漢字筆順規則,用鍵入定義的筆畫鍵來“一筆一畫”地在鍵盤上書寫漢字,就可達到輸入漢字的目的。又因為漢字的筆畫結構不同,所組成的漢字就不同,所以上述方案不會出現重碼現象。對比在西文中,字母數超過26個的也為數不少,如德文、俄文、匈牙利文等等。因此,上述方案是可行的。但是,人們還是要記憶多達32個筆畫形狀鍵,或是其代碼鍵,以及其在鍵盤上所處的位置。
另外人們的漢字書寫習慣在書寫漢字時,有些筆畫形狀不會被很明顯的區分,比如“茶”字可能寫成“茶”,“朝”字的第二筆畫是撇還是豎,容易造成輸入錯誤。又如“有”字的“ ”部首與“月”部首形狀不同,可人們往往在使用時 與“月”不分.從而編錯碼。這類例子很多,因此限制了輸入速度的提高,一般人難于實現盲打,但是,上述種種問題,都可用簡單易學的正字法漢字編碼來解決。
2.用英文小寫字母a、b、c、d、c、f、g、h表示的八類筆畫形狀一筆形字母代碼本發明將32種筆畫形狀,根據人們的書寫習慣和運筆方向分成八類,分別用英文小寫字母a、b、c、d、e、f、g、h表示1).a— (橫、提);2).b丨亅丿 (豎、豎鉤、撇、左向點);3).c丶(右向點、捺);4).d 乙(橫折提、橫折折、橫折彎、橫斜鉤、橫折彎鉤);5).e く(豎鉤、斜提、豎彎鉤、撇折、豎折、撇點);6).f (橫撇彎鉤、橫折折折鉤、橫折折撇、橫折折折);7).g (彎鉤、橫折鉤、橫鉤、橫折、橫豎、橫撇);8).h (豎折折鉤、豎折撇、豎折折)。
a類表示運筆向右和向右上方書寫的二個筆畫形狀;b類表示運筆向下和向左下方書寫的三個筆畫形狀以及一個“豎鉤”筆畫形狀;(根據人們的書寫習慣,將“豎鉤”歸納入b類,這是一特殊情況)c類表示運筆向右下方向書寫的二個筆畫形狀;d類表示這五個運筆方向基本相似的筆畫形狀,其記憶特征是這類筆畫形狀的小尾巴與英文小寫字母d的小尾巴相似;c類表示開口向右和右上方的六個筆畫形狀,其記憶特征是與英文小寫字母e的開口方向相似;f類表示這四個運筆方向基本相似的筆畫形狀,其記憶特征是這類筆畫形狀與阿拉伯數字“3”的形狀相似;g類表示開口向左和向左下方的六個筆畫形狀,其記憶特征是與英文小寫字母g的開口方向相似;h類表示這三個運筆方向基本相似的筆畫形狀,其記憶特征是這類筆畫形狀的向上一豎與英文小寫字母h的向上一豎相似。
3.漢字筆順規則本發明無任何人為定義的規則,但要求使用者嚴格執行漢字筆順規則。
1).先橫后豎;十(一、十)2).先撇后捺;人(丿、人)3).先上后下;三(一、二、三)4).先左后右;仁(亻、仁)5).先外后里問(門、問)6).先外后里再封口;國(冂、 國)7).先中間后兩邊;小(、小)8).點在上邊或左上的先寫;為( 為)六( 六)9).點在右上或字里的后寫;叉( 又、叉)我( 我)10).兩面包圍結構的字(1)上右和上左包圍結構先外后里;司( 司)廳(廠、廳)(2)左下包圍結構先里后外;遠(元、遠)11).三面包圍結構的字(1)缺口朝上的先里后外; 兇(乂、兇)(2)缺口朝下的先外后里;同(冂、同)(3)缺口朝右的,先上后里再左下。區(一、 區)漢字筆順規則,是所有學習和使用漢字的人在初學階段就必須牢牢掌握的,從識字乃至一生中,隨時隨地、經常不斷地使用,是永遠不會被忘記的一種規則。如遇到一些難以確定筆畫順序的字,可查閱1965年1月文化部和中國文字改革委員會發布的《印刷通用漢字字形表》或費錦昌先生編寫的,由上海辭書出版發行的《漢字寫法規范字典》。使人能一經查閱,受益匪淺、難于忘卻,比如火( 火),垂( 千 垂),重( 重),爽( 爽),兆(丿 兆),脊( 脊),兜( 兜),丑( 丑),長( 長),官(宀 官),瑕( 瑕),兔(ク 免兔)。
4.編碼實例本發明用筆形字母代碼,嚴格要求以漢字筆順規則來進行漢字編碼。
例如“國”字,按漢字筆順規則,是先后由(丨一一丨一、一)八個筆畫形狀組成的八劃漢字,用筆形字母代碼來分別表示這八個筆畫形狀,即為(bgaabaca),因此,“國”字的漢字編碼就是這八個字母組成的字母串bgaabaca,并且是一個八劃漢字,同理可以對任何漢字進行編碼。
例如“漢字編碼”這四個字的編碼為漢(ccagc)字(cbggba)編(eeacgabbgabb)碼(abbgagha)
用上述編碼方法對漢字進行編碼的過程,就是在計算機鍵盤上用八個英文字母鍵規范地、一筆一畫地、擊鍵書寫的過程。這是個很自然的行為過程,非常簡便,而且非常合乎人們的生活習慣,操作熟練后,可以很自然地實現盲打,相信就是小學生也能很容易地掌握這種取代式的編碼方法,從而對任何漢字進行漢字編碼。盡管這種漢字編碼的碼數長短不一,但沒有哪一個國家要求對自己的文字先編成碼數相同的代碼后,再進行計算機輸入。英文單詞是由不同字母串組合而成的,其單詞中的字母數有多有少,試想如果將10個字母組成的英文單詞(motherland祖國)編為四位代碼,這是不可思議的多此一舉的事,如果將所有英文單詞全部都編成所謂的四位代碼,那么,英文將是另一種東西了。當然,構成漢字的筆畫數是因單字而異,有的單字筆畫數較多,是對計算機的輸入速度有所影響,但縱觀西文,由十個以上字母組成的西文單詞也并不是少數,因此由字母組成的西文單詞可以實現盲打,相信由筆畫形狀組成的漢字,用本發明的筆形字母代碼也必然能實現盲打。因為用本發明在鍵入字母鍵的同時,就是一個書寫漢字的過程,沒有任何拆分、歸類、拼接、猜測等思維過程,而這種思維過程所需要的思維時間,正是影響計算機輸入速度提高的主要因素。
5,重碼問題本發明的筆形字母代碼,因為在每一類筆畫形狀中含有數個筆畫形狀,所以有極少量的重碼現象存在,其離散度為Σn=1m8n]]>(其中n為筆畫數,m為漢字集中單字的最多筆畫數。)由公式可計算出漢字筆畫數一畫字二畫字三畫字四畫字五畫字六畫字七畫字…離散度8 64 512 4096 32768 262144 2097152由此可見,本發明的總離散度和總容量很大,漢字的筆畫數越多,離散度越大,重碼率越低,甚至無重碼現象。對筆畫數較少的漢字來說,因其數量不多,所以重碼率也很低,因此,本發明的漢字編碼具有重碼率低的優點。
出現重碼字時,重碼字以字頻為序顯示在提示行中,用數字鍵來選字,如被選字恰是處在顯示行的第一個位置的常用字,則可直接繼續下文輸入。
6.本發明的漢字檢索(1).在計算機上檢索漢字1°.漢字的單字輸入用本發明的八個筆形字母代碼,按漢字筆順規則來一筆一畫地輸入漢字是本發明在計算機上檢索漢字的根本方法和前提,也是非常容易學習、記憶和使用的,但為了提高輸入速度,減少擊鍵次數和充分利用鍵盤上其余的鍵,本發明按漢字筆順規則,歸納出了由數個筆畫形狀組成的84種漢字構字部件,并用計算機鍵盤上的46個鍵的上下擋鍵名,分別對其一一定義,組成84個部件鍵名,如附表所示鍵名 構字部件 筆形字母代碼 例字i讠 cd計j扌土工 士 aba 打堅地貢鞏志k ebc 良伐龍l 厶ec既去式m門宀 cbg 門穴n冂ク 勹冖bg國奧奐爾用勻冥鼎水o口 bga 品p阝 fb陌g尸 gab 戶霞r丷 cb摘州s氵 cca 汁t才艸廾 丌 abb 豺莫奔在鼻其耳u凵丩 cb兇糾鄉堯v cba 益w廣 丬 cab 應壯x又 gc 叉勁甬登蔡y夕夊久 bgc 多各灸緩z孑子 gba 孩子A bbg 船射奧B日月 bgaa 晶朋顯衰C幺 eec 幻D田由 bgaba男寅E王aaba 全責瑣F钅baaae鋼G心becc 芯H目且旦 bgaaa眼宜是助直I禾babbc稅J 魚 bgbgabaa 鮮鲞Kbebc 農派L辶cfc 遠M四皿 bgbba罷益釁N貝內岡辦 bgbc 貢肉綱辦梁O石古 abbga磊摘Pbbcaaaba 淮Q車acba 輪R蟲bgabac 虹S弓gah 夷T木 abbc 橋茶U山 beb 崗嶺V立 cacba妾端W纟eea 級X攵babc 政Y bcb 黨敝Z止baba齒此牧告0十丁丆 廠ナab 卑訂不左隔顧南凸面1小 忄bbc 孫尖怕耕2二aa 貳3三 aaa 身耳4 ba 乖旅占禹鼎片5力刀 卩 gb 歷忍方皮部報也韋予6大 寸 abc 奪杖封益其7七ac 毛傾東切舜氏亡虐越8八人入 乂卜 bc 分個氽黃文外水暴以甫9九幾 幾 bd 旭肌船風丶 cg 母貫椽-彐 gaa 雪錄建= 干于亍aab 桿字行肆那[ 兒 be 樂迎祝輝輪華臣] ga 民候; cc 舟滷, 亻 bb 作丘后喬勿州爪弟監 刂リ 才師副業.亠冫 ca 高冶/女 eba 要好aabba 寒!雨 abgbcccc雨雷@ 臼bbagaa 鼠# abba革巷$ 豐 aaab契邦%彳 彡 bbb 衍悠步彩卅帶聚^火 cbbc滅燈& 鳥bgcha 鴿* 米cbabbc 粒( bacbac 筆) 羽 gcagca 翻謬- abgbba 賈鹿+ bcabc 綠犀( 酉abgbcaa 醒) gbb 貌灬 bccc 黑"ccb舉< 饣 bge飲> cgb禮襯?馬 gha罵駛’ 巾犭bgb帆獨因為這84個部件鍵名所代表的每個構字部件,都可用數個筆形字母代碼來表示,所以用一個部件鍵名來一次輸入數個筆形字母代碼,以達到減少擊鍵次數的目的。
在這84種構字部件中的每一種,是分別由一個或數個筆形字母代碼相同的構字部件組成的,本發明利用了部件重碼現象和漢字書寫的筆畫連續性以及人們所熟悉的漢字部首和部件,對于部件鍵名不需作特別記憶。使用者可在操作當中按漢字筆順規則,在計算機鍵盤上以查尋方式鍵入相應的漢字構字部件鍵名,在鍵盤上規范化地書寫漢字,逐步熟練直至達到快速盲打的目的。初學者可先使用本發明的漢字輸入根本方法來達到漢字計算機輸入的目的,然后為加快輸入速度,用筆形字母代碼與部件鍵名結合使用,按漢字筆順規則來拼寫漢字,以取大優先為原則,盡量取筆畫數多的構字部件,以減少擊鍵次數,提高輸入速度。例如曹可分解為(一冂 日)即(an#B)我可分解為(丿扌 )即(bjk)象 可分解為(ク)即(nob)8)禺可分解為(日冂 丶)即(Bn4c)亥可分解為(亠 人)即(.u8)丑可分解為( 二)即(52)牛可分解為(十)即(40)車可分解為( 十)即(70)注牛、車與部首牛、車的筆畫順序不同。韋 可分解為(二 )即 25)龍 可分解為( )即 (0k)以 可分解為( 人)即 (18)鄉 可分解為( ) 即(eu)必 可分解為( 丶) 即([rc)矗 可分解為(ナ — — 一)即(0Ha0Ha0Ha)虹 可分解為(蟲工)即(Rj)在GB2312--80國家標準漢字集中的6763個漢字中,用本發明的筆形字母代碼和84個部件鍵名結合使用的漢字輸入擊鍵數如下表所示擊鍵次數 12 3 4 56 7 8 9組成字數 70 518 1258 1041 602 174 61 8 1因此,本發明的單字平均擊鍵次數(加空格鍵)為(3733+6763)÷6763=1.55鍵。
本發明歸納出的84種漢字構字部件,可根據不同漢字集的用字量作適量的增減。增加構字部件可使擊鍵次數減少,反之,則會增加擊鍵次數。
2°.漢語詞匯輸入1).普通詞匯輸入用本發明的漢字編碼來進行詞語輸入,同樣按照漢字筆順規則,可以用筆形字母代碼來輸入,也可以用部件鍵名來輸入。無論是對二字詞、三字詞、四字詞還是多字詞,均取組成每個字的第一個構字部件,按字數逐個輸入,并要求取部件筆畫數最多的構字部件。如果遇到某字的第一個構字部件不在本發明歸納的84種部件之中,則取第一個筆畫形狀,用筆形字母代碼輸入。例如非常(bY) 電腦(nB)科學(A″) 共青團(#En)天安門(2mm)正字法(0ms)漢字編碼(smWO) 人民政府(8]0w)軍事委員會(naAo8)2).專用名詞輸入對組成專用名詞的每一個漢字,取各漢字的第一個筆形字母代碼來輸入,其形式類似于西文中的專用名詞字母縮寫形式。例如中國共產黨(bbacb)中華人民共和國(bbbgabb)中國人民解放軍(bbbgbcb)(2).在字典中檢索漢字千百年來,人們創造了許多漢字檢索方法,其中漢字筆畫檢字法是比較受歡迎的,它要求首先確定漢字單字的筆畫數,然后在與其筆畫數相同的一大群漢字中逐個查找被檢索的漢字,它比漢字部首檢字法省去了一個漢字部首的歸屬過程。在這些檢字法中,包括漢語拼音檢字法,都需經過一個在檢字表內檢索漢字的過程,有時甚至還需在難檢字表中檢索漢字的過程,才能最后在字典內檢索到漢字。因此,這些檢字法都是間接的和比較繁鎖的檢字方法。
用本發明的漢字檢索方法,首先對需要被檢索的漢字進行編碼,根據構成該字的筆畫形狀編成按漢字筆順規則順序排列的,用筆形字母代碼來表示的字母串編碼,然后按照英文字母的排列順序在字典上直接檢索漢字。英文字母的排列順序是人所皆知的,用英文字母的排列順序來檢索漢字,不需任何漢字檢索表。與世界上大多數文字的檢索方法相同,達到了非常快速、簡便、直接地檢索漢字的目的。
7.本發明的優點及用途綜上所述,顯然,本發明具有符合漢字寫法規范,易學難忘,記憶量少,規則簡明,操作直觀,擊鍵與寫字方式相同,容易推廣且普及面大,擊鍵次數少,便于實現盲打等優點。
本發明的用途廣泛,不僅能用于漢字計算機輸入系統,漢字排版,編輯系統及電腦打字機和中外文翻譯機等方面。如將本發明的八類筆畫形狀用數碼來表示,則可用于電報碼的傳輸,而且還可用于圖書資料和科技情報的目錄索引及其檢索等方面。
用本發明的漢字編碼來編碼漢語字典或詞典,可用世界上多數文字字典的檢索方法來檢索漢字,能被世界上大多數人所接受和歡迎。
用本發明的漢字編碼來進行漢字打字,符合世界上大多數文字的打字習慣,從而為我們帶來一個真正的漢字打字機時代,使漢字更容易被全世界人民所接受,并使漢語能更快地走向世界。
權利要求
1.一種正字法漢字編碼,其特征在于所述的漢字編碼是用構成漢字的根本元素--漢字筆畫形狀的八種分類,以漢字字形寫法標準--漢字筆順規則為規范的編碼。
2.根據權利要求1所述的正字法漢字編碼,其特征在于所述的漢字筆畫形狀的八種分類,是將32個漢字筆畫形狀,根據其運筆方向分成八類,每一類分別用英文小寫字母a、b、c、d、e、f、g、h來表示的代碼(簡稱筆形字母代碼)進行編碼,它們是1).a— (橫、提);2).b丨亅丿 (豎、豎鉤、撇、左向點);3).c丶 (右向點、捺);4).d (橫折提、橫折折、橫折彎、橫斜鉤、橫折彎鉤);5).c ∠く(豎鉤、斜提、豎彎鉤、撇折、豎折、撇點);6).f ㄋ (橫撇彎鉤、橫折折折鉤、橫折折撇、橫折折折);7).g (彎鉤、橫折鉤、橫鉤、橫折、橫豎、橫撇);8).h (豎折折鉤、豎折撇、豎折折)。
3.根據權利要求1所述的正字法漢字編碼,其特征在于按照所述的漢字筆順規則,將漢字分解成漢字筆畫形狀來進行編碼,規則是1).先橫后豎;2).先撇后捺;3).先上后下;4).先左后右;5).先外后里6).先外后里再封口;7).先中間后兩邊;8).點在上邊或左上的先寫;9).點在右上或字里的后寫;10).兩面包圍結構的字(1)上右和上左包圍結構先外后里,(2)左下包圍結構先里后外;11).三面包圍結構的字(1)缺口朝上的先里后外,(2)缺口朝下的先外后里,(3)缺口朝右的,先上后里再左下。
4.根據權利要求1或2或3所述的正字法漢字編碼,其特征在于所述的漢字編碼是將組成漢字單字的筆畫形狀,按漢字筆順規則順序排列,用筆形字母代碼表示的字母串編碼。
5.根據權利要求4所述的正字法漢字編碼,其特征在于用84種由數個筆形字母代碼,按筆順規則組成的構字部件來定義計算機鍵盤上46個鍵的上下檔鍵名,所構成的部件鍵名與筆形字母代碼結合使用,以較少的擊鍵次數進行漢字的計算機輸入,具體是鍵名 構字部件筆形字母代碼 例字i 讠 cd計j 扌土工 士 aba 打堅地貢鞏志k ebc 良伐龍l 厶 ec既去式m 門宀cbg 門穴n 冂ク勹 bg國奧奐爾用勻冥鼎水O 口 bga 品p 阝 fb陌g 尸gab 戶霞r 丷cb摘州s 氵 cca 汁t 才艸廾 丌abb 豺莫奔在 其耳u 凵 丩 cb兇糾鄉堯V cba 益w 廣丬cab 應壯x 又マ gc 叉勁甬登蔡y 夕夂久bgc 多各灸緩Z 孑子gba 孩子A bbg 船射奧B日月曰bgaa 晶朋顯衰C幺eec 幻D田由 bgaba男寅E王aaba 全責瑣F钅baaae鋼G心becc 芯H目且旦 bgaaa眼宜是助直I禾babbc稅J 魚 bgbgabaa 鮮鲞K bcbc 農派L辶cfc 遠M四皿bgbba罷益釁N貝內岡辦bgbc 貢肉綱辦梁O石古 abbga磊摘P bbcaaaba 淮Q車 acba 輪R蟲 bgabac 虹S弓 gah 夷T木 abbc 橋茶U山 beb 崗嶺V立 cacba妾端W纟 eea 級X 攵 babc政Y bcb 黨敝Z 止baba齒此牧告O 十丁丆 廠 ab 卑訂不左隔顧南凸面1 小 忄 bbc 孫尖怕耕2 二 aa 貳3 三 aaa 身耳4 ba 乖旅占禹鼎片5 力刀 卩 gb 歷忍方皮部報也韋丑予6 大 寸 abc 奪杖封益其7 七 ac 毛傾東切舜氏亡虐越8八人入 卜bc 分個氽黃文外水暴以甫9九幾 bd 旭肌船風 cg 母貫椽-彐 gaa 雪錄建= 干于亍 aab 桿宇行肆那[ 兒 be 樂迎祝輝輪華臣] ga 民候 ; cc 舟滷, 亻 bb 作丘后喬勿州爪弟監 刂 才師副業. 亠冫 ca 高冶/ 女 eba 要好aabba 寒!雨abgbcccc雨雷@ 臼 bbagaa 鼠# abba革巷$ 豐aaab契邦%彳 彡川 bbb 衍悠步彩卅帶聚^火 cbbc滅燈& 鳥 bgcha 鴿* 米 cbabbc 粒( bacbac 筆) 羽gcagca 翻謬 abgbba 賈鹿+bcabc 綠犀( 酉 abgbeaa 醒gbb 貌 灬 bccc黑ccb 舉< 饣 bge 飲> cgb禮襯?馬 gha罵駛' 巾 犭bgb帆獨
6.根據權利要求4所述的正字法漢字編碼,其特征在于對漢語詞匯無論是由幾個漢字組成的詞語,都分別取每個漢字的筆畫數最多的第一構字部件進行計算機輸入。
7.根據權利要求5所述的正字法漢字編碼,其特征在于若某字的第一構字部件不屬于84種構字部件中的,則取該字的第一筆畫形狀,用筆形字母代碼及部件鍵名進行計算機輸入。
8.根據權利要求4所述的正字法漢字編碼,其特征在于對專用名詞分別取每個字的第一筆畫形狀,用筆形字母代碼進行計算機輸入。
9.根據權利要求4所述的正字法漢字編碼,其特征在于根據其字母串編碼的字母排列,按英文字母的排列順序編寫字典和詞典的檢索方法。
全文摘要
正字法漢字編碼,是以漢字字形寫法的標準—漢字筆順規則為規范的,用漢字筆畫形狀的八種分類的字母代碼組成的漢字編碼。構成漢字的筆畫形狀有32個,根據各筆畫形狀的運筆方向,將32個筆畫形狀分為八類,分別由英文小寫字母abcdefgh表示,定義為筆形字母代碼,將漢字分解成筆畫形狀,并按漢字筆順規則順序排列,用筆形字母代碼來表示的字母串,即為正字法漢字編碼。
文檔編號G06F3/023GK1146572SQ9511179
公開日1997年4月2日 申請日期1995年10月6日 優先權日1995年10月6日
發明者方濤, 章斐 申請人:方濤, 章斐