專利名稱:新型電腦的制作方法
技術領域:
混合計算裝置本發明的目的建立新型電腦,能成數量級的提高信息在電腦中的輸入、輸出、傳輸速度,壓縮信息在電腦中處理的存儲容量。
本發明的優點系統研究計算機的發展,可以發現當前計算機技術的突出矛盾是外圍設備與主機速度不匹配,尤其1972年大規模集成電路出現以后,例如美國TRW公司正在研制的超級芯片,能集成三千五百萬個晶體管。這種芯片的計算功能相當于一臺超級計算機。該公司在芯片上設置了一些備用電路,并利用一種專用軟件程序使芯片上的損壞元件能自動轉到備用電路上。又如日本電公社最近宣布該公司已研制成功十六兆位動態隨機存取存儲器(DRAM)這種存儲器是在一塊一平方厘米左右的硅片上,集成了約三千五百萬個電子元件,電路線線寬為零點五至零點八微米。超大規模集成電路的出現成數量級縮小了體積;成幾個數量級的提高了速度,對一般中、小型機運算速度可達每秒幾十萬次左右,巨型機的速度可達每秒一億次以上,例如美國在1973年已制成了一臺每秒運算速度為一億五千萬次的巨型機,由于信息與光學技術的結合產生的光盤機成幾個數量級的擴大存儲量,如臺灣光速公司與美國光速公司合作,已經開發出世界第一部五十英寸的光盤機,可讀可寫,容量400兆字節,一張單面的直徑四點七二英寸的光盤,其存儲量約等于一千五百張直徑五點二英寸的軟磁盤,或可儲存十六開圖形10000張,然而信息的捕捉獲(如輸入)速度與之相比太懸殊了,尤其是漢字的輸入就更明顯了,商品化的實用輸入設備雖有各種鍵盤都要幾秒鐘才能鍵入一個字,所以“諾曼”型計算機速度再快,容量再大,體積再小也只是解決信息爆炸危機的一種潛在條件而不能充分發揮作用,正象一個很聰明的人,耳聾眼瞎,聽不到看不見任何課題,也解決不了任何課題,所以外設的改革與智能化使外設與主機協調工作可能是第五代計算機主攻方向之一。也是本發明的突出優點,“非諾曼”型計算機有各種方式,但目前世界上正在開發的是數據流型。這種計算機的工作方式是把程序中表示計算內容的命令和數據作為一束流來控制,并列起來加以處理。
在“非諾曼”型計算機的基礎上,筆者從漢字識別開始探討了一般信息的捕獲,加工、處理問題,發明了一種“全息復蓋分類”技術,是用軟、硬件結合的辦法,實現了一種以“全息復蓋分類”模塊為主的奇特構思與設計,分以下幾部分1、信息接收面分路模塊,如圖7所示,它是根據信息的基本單元為單位(如漢字是一篇文章的一個基本單元)對信息接收面上的信息輸出接點進行分路而構成的模塊。
2、“全息復蓋分類”硬模塊將接受信息的分路模塊全體輸出接點按判別信息的處理要求進行“復蓋分類”以達到并列捕捉信息的目的,現舉漢字識別為例說明該硬模塊優于傳統識別之處,傳統識別如
圖1所示,有許多種不同的方法,但不論何種方法,歸納起來,其模式均為在計算機內建立標準文字的辭書用適當的識別準則,將輸入的未知文字與辭書中的標準文字一個個地串聯配比,最后根據識別準則判斷未知文字為何字,為克服串聯匹配中識別速度隨字數的增加明顯降低之不足而設計的,“全息復蓋分類”硬模塊可達到未知文字與全部辭書中的標準文字同時并聯匹配的目的,將接受信息的變換元件(如光電元件)全體輸出接點,按漢字的基本筆劃復蓋分類,即在筆劃附近的空白點(ai)也分在該筆劃類A,(aieA),而另一筆劃附近的空白點也分在B類(aieB),這樣在某些空點處就出現多次復蓋現象,故稱“復蓋分類”然后將同類接點接到一塊模板上,有多少基本筆劃就有多少復蓋分類硬模塊,由于光電元件輸出接點接了全體漢字集合的基本筆劃,而這些基本筆劃又可組成基本構件和全體漢字集,其匹配是并聯的。全體標準文字辭書構成模板通道、并聯接在攝象管點陣的輸出線上,當一未知文字被信息接收面接受后馬上走自己的通道,即可達到漢字識別字數與速度無關的目的。
3、線路組合模塊“全息復蓋分類”模塊,在文(如漢)字識別系統中相當于疊放了許多傳統標準文字辭書模板,每塊模板與信息接受面相接,形成很多個并聯的接收信息通道當一未知文字經光電元件轉換成電信號集后,就有很多與辭書模板相聯通道將未知電信號集信息接受,在傳統識別中識別準則是判明未知文字歸屬的依據如相似度準則、距離準則等,基本上是軟件實現。我的識別準則是各級組合模塊及其相應軟件,例如在漢字識別中一級組合模塊是信息接收面分路模塊,組合原則是將接受面的n個字的點陣壓縮到一個字的點陣位置上,二級組合模塊是將一個字的點陣坐標按漢字集的基本筆劃復蓋分類,分為K類,每類點陣接點均接到一區,形成K個組合(模塊)區,經預處理,統計決策,模糊處理(數據處理)后即可判斷未知文字的筆劃,三級組合,根據每個漢字的基本筆劃組成基本構件,經數據處理模塊可判斷未知文字的基本構件,四級組合,根據每個漢字的基本構件組成漢字集,經數據處理模塊可判斷未知文(漢)字。五級組合,根據單個文(漢)字組合詞,經數據處理軟件、編碼模塊后可輸出詞的編碼,組合模塊網絡示意如圖7所示,不難看出,示意圖的數學模型,每級點與邊的關系都構成笛卡爾乘積的一個子集,其特征涉及到K層點集合及邊集合的序偶關系,一般圖論中所述集合A到集合B上的一個二元關系遠遠不能滿足要求,該網絡須用集合A到集合B上的一個K元關系描述,并建立K級階矩陣、度矩陣及接點矩陣等概念。
定義1、若笛卡爾積的一個子集稱集合A1到集合A2的一個二元關系,記為B1,則B1到集合A3的一個二元關系定義為A1到A3的三元關系。
定義2、若笛卡爾積的一個子集B2為集合A1到集合A3的一個三元關系,則B2到集合A4的一個二元關系定義為A1到A4的四元關系,依此類推……。
定義3、笛卡爾積的一個子集Bn-2為A1到An-1的一個n-1元關系,則Bn-2到An的一個二元關系為A1到An的一個n元關系。(n可以是任何自然數)。
定義4、拓樸圖;一個圖定義為一個偶對(U、F),記作W=(U、F),其中(1)U是一個集合,它的元素仍為集合。
(2)F是無序積U&U的一個子集合,其元素為邊的集合。
我們分別用U(W)和F(W)表示拓樸圖的頂點集合與邊集合,如果U(W)和F(W)都是有限集合,則W稱為有限拓樸圖;否則稱為無限拓樸圖,在我們的新型電腦組合網絡中只涉及有限拓樸圖。
在我們建立了笛卡爾積的(K層)子集合、集合A1到集合Ak的一個K元關系、及拓樸圖的定義后可對組合網絡的特征用矩陣(K級階矩陣、度矩陣及接點矩陣等)來描述(詳細材料見分案專利C11),并記A為網絡矩陣,對組合網絡矩陣A有如下優點1、A可視為未知文字與標準(可為辭書)模板并聯匹配的結構模型(框圖)在文(如漢)字識別中是解決識別速度與漢字字數無關的技術關鍵之一。
2、該模型A可成數量級壓縮門電路的數量,(詳細計算見分案專利C11)。
3、該模型A中的門電路可賦命題如1(基本筆劃等)而與之相應的邊做為載體,經過高一級組合(可以是邏輯運算、數值計算等)后的門電路自動賦有命題2(如漢字中的基本構件集)與之相通的邊做為載體經過再一級組合后的門電路自動賦有命題3(漢字集),對一般識別(包括聲音識別,圖象識別等)據須要而設置K后,經K級組合后的門電路就自動賦有命題K的意義,這樣對一個信息集合的識別,就不必把全部信息(包括結構信息)都送到計算中去處理,而是只送識別信息的基元信息(如漢字的基本筆劃信息)用組合網絡流判斷基元間的結構特征(如漢字結構特征)可成數量級提高單個漢字的識別速度,加上基本筆劃存儲模塊,可成幾個數量級壓縮漢字庫的容量與提高輸出速度。
以上三部分為新型電腦的硬件主要組成部分,該技術還涉及到各種數學模型如模糊數字處理技術,決策理論方法,句法分析方法等,和各種處理軟件、系統軟件等,組成所謂“全息復蓋分類”技術,由于該電腦與傳統外圍設備的主要區別是數據流的并聯處理是通過“全息復蓋分類”來實現的,從信息的捕獲開始就是智能化的。直到信息的處理,一種門電路賦命題的辦法用組合網絡做抽象的信息載體而判別全息的結構來壓縮信息量的,具有較強的信息壓縮能力,有較快的輸入、輸出速度,有豐富的智能處理能力,根據這種構思和設計不久會有以下幾種分案專利Cij,其中i=1、2、……K1,j=1、2、……K2,K1、K2均為自然數。
本發明其特征之一,根據85109039號專利的總體構思,是光學系統光接收部分(微光攝象,光分路技術光纖型分路,CRT型分路技術)另一“全息復蓋分類”技術裝置。
圖1、信息流輸入裝置系統框圖1、各種換能器,2、放大電路,3、時間序列分路模塊,4、全息復蓋分類模塊,5、3→i,6、i級組合模塊,7、數據處理模塊,
8、門電路賦命題模塊,9、i=K?,10、i+l→i,11、編碼模塊,12、CPU。
圖2、信息流輸出系統框圖1、CPU,2、編碼模塊,3、K→i,4、與i級組合模塊并行的獨立線路,5、i=l?,6、K-1→i,7、與全息復蓋分類相應的基本元點陣存貯器,8、基本元點陣重排模塊,9、各種輸出。
圖3、圖形識別系統框圖1、被識圖形,2、光電轉換器如CCD等,3、放大,4、時間序列分路模板,5、1→i,6、i級組合模塊,7、數據處理模塊,8、數塊并聯的被識圖形i級子圖輸出,9、i=K?10、i+l→i,
11、數據處理模塊,12、編碼模塊。
圖4、1.傳統漢字識別框圖,原則上是經分類串聯配比,(1)漢字原稿,(2)檢測,(3)分類,(4)判別,圖4、2.新型識別框圖原則上是不分類,并聯配比,(1)漢字原稿,(2)檢測,(3)判別。
圖4、3.漢字識別系統框圖,(1)被識文章,(2)檢測,(3)未知漢字影象信息點陣二值輸出,(4)放大,(5)時間序列分路模塊,(6)全息復蓋分類模塊,(7)數據處理模塊,(8)基本筆劃判斷輸出,門電路賦命題,(9)構件(偏旁字首)組合模塊,(10)數據處理模塊,(11)漢字構件判斷輸出,門電路賦命題,(12)漢字集組合模塊,(13)數據處理模塊,
(14)漢字集判斷輸出,門電路賦命題,(15)漢字集組合模塊,(16)數據處理模塊,(17)漢詞判斷輸出門電路賦命題,(18)漢詞編碼模塊,(19)CPD。
圖5、漢字識別及輸出裝置框圖1、未知文字點陣信息二值輸出如圖5.1,(1)被識別文章,(2)CCD轉換器,(3)信息流二值輸出,(4)燈泡,(5)光線,(6)支架。
2、被識別文(漢)字信息放大(圖5.2)(1)時間程序開關,(2)電流放大器,M存貯器,N時序控制器,A地址總線、B數據總線、C控制總線,aii=1、2……24080經放大的信號輸出。
3、多體漢字開關。
4、多種外文、數字開關。
5、全息點陣分路模塊如圖5.3。
該模塊功能是將100個漢字點陣的輸出接點都接到一個漢字點陣的位置上,如每個字的第1點均接分路模塊的第1點……。
(1)表示第1區,(2)表示第11區一第81,(3)表示第91區,(4)表示第10區。
(5)表示第20區一第90區,(6)表示100區,(7)表示分路模板,ai表示輸入線,i=1、2、…K1,bi輸出線。
6、多體漢字集全息復蓋分類模塊如圖5.4,b1…bk2來自圖5.3的輸出線,當i=K時,可能在圖5.4的模板中bk重復(或稱復蓋)多次,所以圖5.4的接點數遠大于圖5.3的接點數。
(1)表示第一區,E數據處理模塊,(2)表示第2-19區,(3)表示第20區……,(6)表示第240區,每區的接點數由基本筆劃決定。
A、B、C為三總線。
7、多體漢字數據處理模塊,判斷后輸出基本筆劃C1、C2、…Ck3,8、多體外文數據處理模塊判斷后輸出外文。
9、多體數字數據處理模塊判斷后輸出數字。
10、基本構件組合模塊如圖5.5對來自賦基本筆劃的門電路信號C1,C2…Ck3根據基本構件特征組合成新的模板,分為240個區,A、B、C為三總線。E數據處理模塊。
11、數據處理模塊判斷后輸出漢字構件d1、d2、…dk4,(1)表示第一區,……(6)表示240區。該模板有輸入、輸出兩種線。
12、基本構件組合模塊如圖5.6,
來自賦有基本構件命題的門電路,根據漢字基本構件組字的特征組合成若干區(根據須要而定)每區都與數據處理模塊相接。
A、B、C為三總線。
13、數據處理模塊判斷后輸出漢字集,e1、e2、…ek5。
14、賦有漢字命題的門電路。
15、字編碼模塊。
16、詞編碼模塊,(將f1、f2…fk6編碼詞組合模塊見圖5.7)17、鍵盤。
18、詞碼傳輸控制。
19、詞碼傳輸線。
20、詞輸入控制21、CPU。
22、字輸出控制。
23、詞輸出控制。A、地址總線B、數據總線C、控制總線24、字輸入控制。
28、與各級組合網絡并行獨立的線路。
29、多體漢字基本筆劃存儲器。
30、重排模塊,是將基本筆劃的點陣坐標、按行、列次序從小到大排列。
31、打印機控制。
32、CRT控制。
33、激光打印控制。
圖6、多體漢字輸出系統框圖(1)與賦有基本筆劃命題的門電路相應之獨立并行線路,M為與之相應筆劃存儲器。
(2)與賦有基本構件命題的門電路相應之獨立并行線路,
(3)與賦有漢字命題的門電路相應獨立并行之線路,(4)字編碼模塊,(5)基本筆劃點陣坐標,(6)重排模塊,將構成漢字的基本筆劃點陣坐標按行列從小到大依次排列,(7)打字機控制,(8)CRT控制,(9)激光輸出控制,(10)數據總線,(11)控制總線,(12)地址總線。
圖7、多體漢字各級門電路賦命題及組合網絡示意圖a1……ak1表示光電元件輸出接點,(1)表示一級組合網絡,其目標函數為多體字點陣分路壓縮在一個字的點陣(b1……bk2)模板上。
(2)為二級組合網絡,將分路模板b1……bk2點陣接點按漢字集的基本筆劃進行復蓋分類,每類接點均接到一區,C1……Ck3個區,經數據處理即可輸出基本筆劃,C1……Ck3個。
(3)為三級組合網絡,將賦基本筆劃的門電路組合為基本構件d1……dk4,(4)為四級組合網絡,將賦基本構件的門電路組合為漢字集e1……ek5經數據處理即輸出漢字集e1……ek5,(5)為五級組合網絡,將賦漢字集的門電路組合為漢詞集f1……fk6,經數據處理即打開賦有漢詞命題f1……fk6的門電路到(6)所示的編碼模塊輸出漢詞編碼(7)或傳輸編碼均可。“門電路賦命題”技術可擴大到廣泛的計算機軟硬件系統。
圖8、新型電腦傳輸系統框圖,分發送、傳輸、接收三部分。
1、鍵盤,2、編碼轉換裝置如圖11所示,3、鍵入編碼模塊,4、用戶級上的CPU,5、外設(CRT等),6、CCU,7、發送裝置(或接收裝置),8、傳輸裝置,9、接收裝置(或發送裝置),10、控制字輸入編碼生成如圖9其中(1)表示輸入詞字頭編碼,26個十進位數表示的字母均用5位二進制數表示。
(2)輸入詞字尾字母編碼,26個十進位數表示的字母均用5位二進制數表示。
(3)輸入詞特征字母編碼,26個十進位數表示的字母均用5位二進制數表示。
(4)表示輸入詞字(節)數編碼,32個(十進位)數用5位二進制數表示。
(5)表示輸入詞序號編碼,15個(十進位)數用4位二進制數表示。
(6)表示輸入詞代有(1)(2)(3)(4)特征的漢(文)詞集合。
4字節編碼32位分配如下從高位算起,1-5位放輸入詞拼音字母頭一個字母編碼(其中a對應十進位數1,b對應十進位數2,……Z對應十進位數26,其中十進位數又均用五位二進制數表示)5-10位放輸入詞拼音字母尾字母編碼,10-15位放輸入詞特征字母(位置在詞中漢字數(或拼音字母數)乘0.618處的字母或(漢)(文)字拼音的頭一個字母)編碼,15-20位放輸入詞字母(或字)數編碼,20-24位放詞匯序號(指具有同字頭,同字尾,同特征字母,同字數的詞匯集中元素的(十進位)順號)編碼。
(7)文字控制字由一字節8位組成31個控制字,如1可表示中國漢字,…等這種字、詞、句特征編碼四字節可傳輸261500880個中西文字、詞、句,由于電腦自動對文字信息流分段編碼,所以可提高輸入、輸出、處理速度,壓縮信息存儲量、提高傳輸效率。
圖11、編碼生成模塊M編碼寄存器A、B、C三總線。e1,e2,…ek5為賦有漢字命題的門電路D3字節編碼輸入10如圖8所示,圖10、鍵入編碼模塊系統框圖1、鍵盤,2、寄存器,3、詞組編碼子模塊,(取出M中有(1)(2)(3)(4)特征的編碼,)4、符合電路,5、CPU,6、漢詞序號(5)輸出,7、CRT,8、詞編碼(1)(2)(3)(4)(5),D3字節編碼輸出。
9、輸出系統。
圖12、數據通訊系統的組成1、數據終端,2、終端子系統,3、交換機,4、交換線路,
5、專用線路,6、線路子系統,7、CPU,8、計算機主機,9、計算機子系統10、CCU。
圖13、新型電腦通信控制器CCU功能1、業務處理2、報文編輯管理3、報文傳輸控制4、通信處理5、詞符處理控制6、詞符裝配控制7、通信處理8、計算機9、通信線路。
參考文獻(1)(1)上海交通大學唐保興、國新以及清華大學陸中等所使用的“結構分析法”、“句法分析法”。
(2)M·Yoshide等1973年提出的a-b-s法(Analysis-by-syn-thesis)主要是抽取筆劃序列、查劃筆字典來識別。
(3)K·Yannamoto,1980年提出的識別法。
(4)P·Biswas1981年提出的模糊判定法。
(5)A·K·Ray1981年提出的識別法。
(6)M·shiono1981年提出的識別方法。
(7)隆1983年提出的識別法。
(8)獲田博1983年提出的識別法。
(9)中野等1973年提出的識別法Tou和Gonzalez1974年著的“決策理論方法”(包括確定性的方法和統計的方法)。
權利要求
1.一種新型電腦,包括計算機,外圍設備、傳輸系統三部分。其特征在于“全息復蓋分類”技術在終端上能實現對信息流的智能捕獲、并聯處理。可成數量級的提高輸入、輸出速度,并能壓縮信息流在機內處理時時存儲量,使主機能與外圍設備協調工作,還可提高信息流在計算機網絡中的傳輸效率。
2.根據權利要求1所述的系統,“全息復蓋分類”技術在輸入方面如圖1,3所示,其特征在于,信息流接收面輸出接點(按時序分路)構成的模板再按信息流基本元(如漢字筆劃等)特征進行復蓋分類,若分為K類,則分路模板又派生出K個子模板,對信息流一段中的基本元進行并聯匹配、接數據處理模塊(可為傳統識別法等)后給門電路賦命題,根據信息流的不同特征而設計了各級組合模塊及相應軟件可達到在用戶級的終端上智能捕獲、并聯處理信息流的目的。綜合各級組合模塊的模型構成接點網絡,每級點(門電路)和邊(線路)的關系都構成笛卡爾乘積的一個子集,可用一個集合到另一個集合上的一個K元關系描述如圖7所示,或用拓樸圖的接點矩陣描述(見分案專利C11)。在輸出方面,只存基本元,用門電路(賦命題)網絡判斷基本元間的結構關系,接重排模塊,即可用各種方法輸出信息流而取代傳統信息庫(如漢字庫)即可提高輸出速度又可壓縮信息流在機內的存儲量如圖2所示。在傳輸方面,由于信息流是經過時序分路和K級組合模塊而成串編碼,所以不但可以壓縮信息流在機內存儲量,還可提高傳輸效率(詳見分案C11)以“全息復蓋分類”技術為基礎可建立分案專利Cij,其中i=1、2、……K1,j=1、2、……K2,K1、K2均為自然數。
3.根據權利要求2所述的系統“全息復蓋分類”技術在漢字識別方面系統框圖如圖4.2,4.3所示,多體漢字識別裝置系統框圖如圖5,5.1-5.7多體漢字輸出裝置系統框圖如圖6所示。
4.根據權利要求3所述的系統,新型電腦漢字處理部分(包括輸入、輸出、傳輸)的技術指標、工藝流程圖、傳輸部分框圖等請見分案專利C11。
5.根據權利要求4所述的系統新型電腦是以詞碼為單位進行傳輸的如圖8、9、10、11、12、13。根據權利要求1所述的新型電腦傳輸系統,其特征在于編碼的革新,如圖9所示,4字節編碼32位分配如下從高位算起,1-5位放輸入詞拼音字母頭一個字母編碼(其中a對應十進位數1,b對應十進位數2,…z對應十進位數26,其中十進位數又均用五位二進制數表示)5-10位放輸入詞拼音字母尾字母編碼,10-15位放輸入詞特征字母〔位置在詞中漢字數(或拼音字母數)×0.618處的漢(文)字拼音的頭一個字母〕編碼,15-20位放輸入詞字數編碼,20-24位放詞匯序號(序號指具有同字頭,同字尾,同特征字母,同字數的詞匯集合中元素的(十進位)順序號)編碼,文字控制字由一字節8位組成31個控制字如1可表示中國漢字…等這種字、詞、句特征編碼四字節可傳輸261500880個中西文字、詞、句,由于電腦自動對文字信息流分段編碼,所以可提高輸入、輸出、處理速度壓縮信息存儲量、提高傳輸效率。
6.“門電路賦命題”技術可擴大到廣泛的計算機硬軟件系統。
全文摘要
一種以第五代計算機為基礎的新型電腦、能在用戶級終端上對信息流智能捕獲、并聯處理,該功能是通過對信息流的系統優化,建立信息網絡拓樸圖的數學模型和“全息覆蓋分類”技術來實現的,不但或數量級的提高信息流的輸入、輸出速度,提高傳輸效率,還可壓縮信息流在機內處理的存儲量,使外設速度向主機速度不斷靠近。漢字識別可達以下技術指標速度至少100字/秒,字鐘7000漢字(多字體)誤識、拒識率不低于傳統指標。
文檔編號G06F15/00GK1030655SQ8710218
公開日1989年1月25日 申請日期1987年3月24日 優先權日1987年3月24日
發明者許素蘭, 宋仁駿, 許志恒, 許華武, 許慧蘭, 王健瑋, 王瀾, 許尚武 申請人:許素蘭