中文字幕无码日韩视频无码三区

基于神經網絡的信息識別處理方法

文檔序號:6330697閱讀(du):273來源(yuan):國(guo)知局(ju)
專利名稱:基于神經網絡的信息識別處理方法
技術領域
本發明涉及信息處理中的一種信息識別處理方法,具體涉及一種利用了神經網絡技術的信息識別處理方法。本發明還涉及該信息識別處理方法在語音識別和圖像識別上的應用。
現已開發出諸如自適應諧振理論(ART)、反向傳播(BP)網絡、對流傳播網絡(CPN)、Hopfield網、認知機(Neocogntion)、自組織映射器(SOM)等多種結構的神經網絡,應用于復雜信息的判斷和識別處理。上述各種神經網絡結構各有長處,又存在著各自不同的缺陷。
語音識別技術是當今計算機技術研究的熱門課題,它最初起源于50年代初期的Audry語音識別系統,可以識別10個英文數字。隨著計算機技術的飛速發展,語音識別技術也在不斷地創新發展,相斷出現了動態規劃技術(DP)、線性預測分析技術(LP)、動態時間歸整技術(DTW)等語音識別技術和矢量量化(VQ)、隱含馬爾可夫模型(HMM)等語音識別理論。
基于動態時間歸整技術的語音識別技術具有系統小,識別速度快的特點,對于小詞匯量的語音識別來說非常高效,但是針對大詞匯量的語音識別時則顯的識別率較低,效率低下。
基于統計的隱含馬爾可夫模型語音識別可能是目前最成功的語音識別方法,也被許多產品化的軟件所采用作為系統內核,該模型對于大詞匯量具有很高的識別率,能夠達到95%以上。但是該語音識別方法系統龐大,計算方法復雜,特別是該方法需要建立一個較大的語音庫,僅對特定人的特定語音具有較高的識別率,而且還需有一個較長的適應周期,目前仍然存在著對非特定人的適配性差,魯棒性能差的問題需要解決。
以上種種因素,極大地制約了語音識別技術的發展應用。而從理論上講,也只有基于神經網絡的語音識別技術,配合基于神經網絡的人工智能系統,才能真正做到聽懂、并理解人類語言,做到100%的識別率,從而實現真正意義上的語音識別。
提供該神經網絡信息識別處理方法在語音識別上的應用,是本發明的又一發明目的。
本發明的另一發明目的是提供該神經網絡信息識別處理方法在圖像識別上的應用。
本發明的神經網絡系統由輸入神經元、若干層中間興奮類神經元與抑制類神經元、輸出神經元及其之間的鏈路共同組成,并儲存在存貯器中。神經網絡信息識別處理的具體方法是信息采集器采集的信息被轉換成電平表后,輸入到神經網絡系統的輸入神經元中,該輸入神經元將輸入的高電平信號等同于神經元的傳遞信號,一方面通過興奮類神經元下延傳遞給一個或多個興奮類神經元,經過若干層次興奮類神經元之間的傳遞,直至傳遞到輸出神經元,形成自輸入神經元經中間神經元到輸出神經元的鏈路通道,另一方面,輸入神經元還通過抑制類神經元下延傳遞給一個或多個抑制類神經元,也經過若干層次抑制類神經元之間的傳遞,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,從而得到一個與輸入的信息相對應的正確輸出結果。
神經網絡系統中的每一個神經元都是由以下結構構成神經元類型+傳遞計數器+下延連接區+處理標志。
其中,神經元的類型包括輸入接口類、中間興奮類、中間抑制類和輸出接口類四類。輸入接口類的神經元被定義為單輸入多輸出的神經元,該類神經元只接受兩態輸入,并將輸入信號下延連接傳遞給一個或多個興奮類或抑制類的神經元;中間類的神經元為多輸入多輸出的神經元,它起到連接輸入和輸出神經元的橋梁作用,并承擔信息的傳遞、阻斷以及延時;輸出接口類神經元被定義為多輸入單輸出的特殊神經元,每一個此類的神經元都表示一個相應的信息輸出,也就是經過神經網絡處理之后,與輸入信息做對應關系的結果輸出。
在每個神經元的傳遞計數器上都設定有一個確定值;神經元的下延連接區上記錄著每一個向下延連接的對方神經元的地址;處理標志是指示系統對神經元進行掃描處理的標志,當神經元處于傳遞態時,處理標志設定為真,等待系統前來處理。
神經元鏈路通道的形成與斷開是在傳遞過程中,由上延神經元來決定神經元傳遞計數器數值的改變,當傳遞計數器從小于零變為大于零時,該神經元表現為傳遞態,按自身的屬性將興奮或抑制信號傳遞給下延神經元,如果與下延神經元的類型相同,則下延神經元的傳遞計數器加一,否則減一;如果傳遞計數器從大于零變為小于零時,該神經元也表現為傳遞態,只是如果與下延神經元的類型相同,則下延神經元的傳遞計數器減一,否則加一;當傳遞計數器沒有通過零值,該神經元表現為常態;系統對所有處于傳遞態的神經元進行掃描處理,處理完的神經元由傳遞態變為常態,系統對處于常態的神經元不進行處理,如此重復,直至傳遞到的某個輸出神經元的傳遞計數器從小于零變為大于零,即該輸出神經元變為傳遞態時,得到一個結果輸出。
對于組成神經網絡的神經元而言,其中間興奮類和抑制類神經元的具體層數是在建立時根據網絡規模大小來確定的,而且層與層之間也沒有相互承接關系,信息可以跨位、跨層傳遞,并且對于單個神經元的信息傳遞方向由建立時確定,既可以正向傳遞,也可以逆向作為反饋,同時,不同類型的神經元之間也可以進行信息傳遞。
神經網絡系統是采用隔位跳行跳層的掃描方式掃描所有需要處理的神經元,采用這種掃描方式,可以使除邊緣以外的每個神經元向任何方向延伸的趨勢都是基本相同的,從而做到輸入信號的延時傳遞,得以同步到達輸出神經元。例如,對于一個4×4×4的神經網絡,1 2 3 417 18 19 2033 34 35 3649 50 51 525 6 7 821 22 23 2437 38 39 4053 54 55 569 10 11 1225 26 27 2841 42 43 4457 58 59 6013 14 15 1629 30 31 3245 46 47 4861 62 63 64一層二層 三層 四層系統掃描的順序應為1 3 4 2 9 11 12 10 13 15 16 145 7 8 6 33 35 36 34 41 43 44 42 45 47 48 46 3739 40 38 49 51 52 50 57 59 60 58 61 63 64 62 5355 56 54 17 19 20 18 25 27 28 26 29 31 32 30 2123 24 22 1……如此反復。
經過上述方式掃描,使輸入神經元上傳遞的不同時間維的信號中,先收到的信號經過較多的傳遞神經元進行延時,后收到的信號經過較少的傳遞神經元,所有信號能夠基本同時傳遞到輸出神經元,從而達到延時同步的目的。
由于神經網絡是一個由若干個神經元構成的并行處理系統,每一個神經元都相當于一個單機,神經元與神經元之間的運算不存在先后處理的關系,只要做好同步及數據交換,神經網絡內部就可以任意切分,而不影響整體的運行。因此,如果需要設計的神經網絡過于龐大的話,就可以使用多臺計算機組成并行網絡,同時對神經網絡進行處理,以解決計算中的瓶頸問題,使各種規模的神經網絡都能擁有一個合適的硬件運行環境。
對于由多臺計算機組成的并行網絡,可以選擇一臺計算機作為主控計算機,其它計算機作為輔助計算機,同時運行進行信息識別處理。它的作用在于能夠提供一個適合可以進行大規模的復雜數據庫查找、修改、增加、刪除操作,特別是能夠并行處理操作的運行環境。該并行網絡可以在單CPU的微機如個人電腦、商用微機中提供一個模擬的并行處理環境,也可以將若干個微型單片機組成一個超大型的計算機系統,更可以將若干個處理單元集成到一個集成電路中,制作專用處理器,使其計算能力無限擴展。
上述的神經網絡信息識別處理方法可以在語音識別方面得到很好的應用,具體應用步驟為a、根據語音聽覺模型將聲音頻譜作非對稱分段,每一小段計算出一個中心頻率,以該中心頻率為固有頻率制作理想狀態彈簧震子模型,并將所有彈簧震子按照響應頻率的高低順序進行排序;彈簧震子的倔強系數K為可變參數,當輸出頻率處在相鄰彈簧震子中心頻率的邊界之內時,彈簧震子會自動調整K值,使彈簧震子的固有頻率等于輸出頻率,始終保持共振幅度最大,若輸出頻率不在相鄰彈簧震子中心頻率之間,則固有頻率等于初始值。
b、采用音頻脈沖編碼方式輸入語音,將聲波信號量化為音頻數據流,由系統進行讀取。
c、當讀取的輸入音頻數據流量化值與某一個彈簧震子模型的固有頻率相同時,該彈簧震子會產生強烈的共振現象,記錄彈簧震子的共振位移量,組成輸入語音的動態頻譜電平表。
d、將頻譜電平表輸入神經網絡系統的輸入神經元,輸入神經元將輸入的高電平信號等同于神經元的傳遞信號,一方面通過興奮類神經元下延傳遞給一個或多個興奮類神經元,經過若干層次興奮類神經元之間的傳遞,直至傳遞到輸出神經元,形成自輸入神經元經中間神經元到輸出神經元的鏈路通道,另一方面,輸入神經元還通過抑制類神經元下延傳遞給一個或多個抑制類神經元,也經過若干層次抑制類神經元之間的傳遞,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,從而得到一個與輸入語音相對應的發音概率隊列。
e、將每一個發音的概率隊列與前后發音的概率隊列進行組合篩選,組成句子輸出。
f、對前端輸出的句子可能的錯誤進行語音糾錯識別,得到完全正確的句子輸出。
關于語音糾錯識別的具體過程是a、在內存中建立輸出循環映射隊列,用于部分容納前端輸出句子的文字與發音,并與用戶界面的輸出同步。
b、當映射隊列接收到一個由語音糾錯系統確定的關鍵字詞的發音時,判斷其之前緊跟的是否為一個詞組,并判斷其后接收的下一個文字的發音是否為該詞組中的某一個文字的發音。
c、如果條件滿足,根據改錯特定語法,從詞組向前搜索并定位該同發音的文字,用詞組中的文字替換搜索到的同發音文字。
d、如果條件不滿足,結束語音糾錯識別,繼續進行語音識別。
利用神經網絡抗干擾能力強、識別準確性好的特性,還可以將神經網絡信息識別處理方法應用到圖像或影像的識別中。圖像、影像的識別就是通過圖像輸入設備采集到數字圖像,再由訓練好的神經網絡處理得到一個相應的結果輸出的過程。
其中,數字圖像可以由數碼照相機、數碼攝像機、數字探頭或具有模/數轉換功能的模擬信息采集設備轉換所得到。由于神經網絡的輸入窗口只接收2值輸入,所以任何的數字圖像都要預先進行2值轉換。圖像轉化時,先將圖像分解成一個個像素,每個像素再分解成多種單色,每個單色具有不同的灰度,根據灰度的色階,制定出相應的輸入神經元,一個像素對應的輸入神經元個數為色階數×配色個數,將擬識別的圖像轉換為2值圖像。
將轉換后的2值圖像直接輸入到神經網絡的輸入神經元,該輸入神經元將輸入的高電平信號等同于神經元的傳遞信號,一方面通過興奮類神經元下延傳遞給一個或多個興奮類神經元,經過若干層次興奮類神經元之間的傳遞,直至傳遞到輸出神經元,形成自輸入神經元經中間神經元到輸出神經元的鏈路通道,另一方面,輸入神經元還通過抑制類神經元下延傳遞給一個或多個抑制類神經元,也經過若干層次抑制類神經元之間的傳遞,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,經過興奮類與抑制類神經網絡的相互作用,最終產生一個與曾經訓練過的輸入信息相對應的輸出結果,并將其轉化為其他系統的控制量。
圖像、影像的識別處理是對處在時間維上的一系列圖片當作一個整體來進行的識別,由于本發明的神經網絡具有延時處理能力,可以根據識別目標的時間長短預先設計相應的神經網絡中間層層數,輸入的圖像經過延時后與隨后輸入的圖像同時作用于輸出神經元,得到相應的輸出結果,因此,通過本發明可以識別動態影像。當然,神經網絡的這種“延時”處理方法還能夠對任意多維的數據具有很好的處理能力,例如,可以識別三維立體動態影像等等。
本發明的神經網絡信息識別處理方法還可以應用在身份識別(指紋、頭像、聲紋、視網膜等)、圖片檢索、文字識別、目標跟蹤、目標鎖定、智能控制等諸多領域。
本發明的神經網絡信息識別處理方法具有以下幾方面的優點1、識別處理速度快。
本發明的神經網絡是通過傳遞來處理信息,處理速度就相當于傳遞速度,從理論上講該傳遞速度可以達到信號處理的極限速度。
2、適配性強。
本發明的神經網絡系統有標準的輸入、輸出神經元接口規范,可以適用于任何信息處理領域,并可以根據用戶的需求確定不同規模的神經網絡處理系統,而且結果輸出既可以作為其他系統的控制源,也可以直接當作信息輸出給用戶。
3、可擴充性強。
本發明的神經網絡在實際使用時,如果處理的信息復雜度增加,則可以在原有的神經網絡基礎上擴大網絡規模,并通過擴容性訓練,重新生成新的神經處理網絡,使訓練量大大減少。
4、組網靈活。
本發明神經網絡中的神經元之間連接方式多樣,可以實現各種各樣的功能,如反射、反饋、振蕩、中斷、激活、抑制、篩選、聯想、推理、頓悟等等。此外,硬件運行平臺的搭建也可以多種多樣,可以用單機,也可以將不同類型的單片機、個人機、商業機等機型組織到一起作為計算存儲的運行平臺,甚至可以制成專用處理芯片。
5、容錯性更好。
由于引入了抑制類神經元,對系統的錯誤輸出具有了更好的可操作性,通過前期的訓練工作,確定下來的神經網絡抗干擾能力將更強,能使信息處理獲得更好的準確性。
6、訓練相對簡單容易。
由于本發明的神經網絡具有良好的可擴充性,訓練時只需訓練新增內容就行,新生成的系統具有良好的向下兼容性,所以使訓練工作大大減少。
7、能處理動態信息。
傳統的神經網絡模型在處理動態信息時較為困難,本發明卻能夠實時地進行處理,相當于具有了“時間記憶”功能,對于處在時間片段內的信息具有很好的認知處理能力。
特別是在語音識別處理方面,本發明具有更多的優越性。
一般語音識別處理方法的識別率是針對專人專項測試記錄后得到的,可以在95~98%之間,而對于非特定人的測試,根本達不到上述標準,大部分人的識別率僅處在60~90%之間,對于非特定人的適配性差。本發明應用神經網絡語音識別方法,解決了這個問題,通過普適性的一般訓練后,就能夠將不同方言,不同語音語調的發音給出唯一的輸出,不必再對系統進行適應性訓練,也不需要用戶再進行訓練,對于非特定人的識別適配性大大增強,識別率大大提高。
本發明的語音識別方法能夠自動適應陌生環境,使用者無需進行訓練,就可以直接使用,具有其它語音識別方法無法比擬的優勢。
噪音一直是語音識別的大敵,處理不好,會導致系統的魯棒性(Robust)變差。本發明直接對聲音的采集進行降噪,系統采用動態網絡調整技術自動生成對抗信號來抵制輸入噪聲,不再需要添加額外設備,沒有特定場合限制,就有效地降低了噪聲,提高了信噪比,產生了非常好的識別效果。同時,還利用了神經網絡的容錯特性,來進一步“消化”噪音,降低噪音對系統輸出的影響。
系統始終以動態調整運行參數,使每一部分時時運行在最佳狀態,獲得最好的輸出結果,提高識別率。
具體實施例方式
本實施例是關于神經網絡信息識別處理方法應用于語音識別的一個具體描述,其識別過程為1、語音輸入采用音頻脈沖編碼方式,直接將語音的聲波量化為音頻數據流輸入系統。
高精度、高采樣頻率能使采樣后的編碼在還原時更加逼真,使采樣生成的編碼也隨之成倍增加,處理所需要的運算資源更是成倍增加。一般語音識別方法都采用10KHz或16KHz的采樣頻率,我們發現,低的采樣頻率和采樣精度會將語音信號中許多的有用信息丟失,使識別的準確度降低,本發明為能更完全地提取語音效果中的有效成分,首次采用了22KHz高采樣頻率,遠高于其他識別方法,為后續識別的精確度、準確度提供了很好的保證。
2、音頻數據緩沖區由于神經網絡內部的每個系統的運行處理所花費的時間會根據內容、狀態等因素而發生改變,有可能在某一時刻未能及時的對輸入的數據進行處理,而在另一時刻又可能比較閑暇,所以需要將時時產生的音頻數據流先存入緩沖區隊列,再由時鐘同步單元控制讀取。
緩沖區為一個環狀隊列,定義有寫入指針與讀出指針,整個環遵循著先寫入再讀出的原則進行工作,如果讀出的過慢,寫入的指針沿環一周后追上讀出指針時,則申請更多的內存來擴大緩沖區,但如果寫入的相對較慢,讀出指針緊隨寫入指針之后,則探測寫入指針之前的內存是否有大量空閑,如有則部分釋放,使操作系統能使用更多的內存。
3、濾波器陣列目前一般的語音識別方法是將數字信號直接使用傅立葉變換(FFT)方式來做時域與頻域的分析,再將分析結果提供給識別模型進行識別。其優點是分析準確,詳細,但缺點是需要對時域和頻域進行逐個幀的處理,計算方法復雜,計算量龐大,處理速度相對較慢,而且對系統和硬件的要求較高,抗干擾能力差。本發明采用濾波器陣列將量化的數據流轉化為動態的頻譜電平表,其濾波系統基本模擬了人耳耳蝸的生物物理過程,結合人耳的聽覺特性,并采用動態彈簧振子模型算法,使濾波器陣列的運算更加簡化,結構更加簡單,處理速度更快,又能方便地與神經網絡進行連接,保證了系統對語音有效成分提取的準確與高效。其具體過程為a、根據語音的聽覺模型將頻譜作非對稱分段,每一個小段計算出一個中心頻率,再以中心頻率為固有頻率制成理想狀態的震子模型。
b、所有的彈簧震子按響應頻率的高低順序排序,以音頻數據流的量化值作為推動彈簧震子的外力,當某個彈簧震子的固有頻率與輸入音頻數據流量化值相同時,就會產生強烈的共振現象。
c、記錄所有彈簧震子的位移量,生成一個頻譜電平表,完成頻譜的輸出。
濾波器陣列可以根據不同的需要,確定不同的分段精度,分段越精細,彈簧震子就越多,輸出也就越準確,但計算量也會相應增大。
為了能在較少彈簧震子的情況下系統也能有較好的響應輸出,本發明將每個彈簧震子的倔強系數K值制成了可變參數,輸出頻率處在相鄰震子中心頻率邊界之內,自動調整K值,使震子固有頻率等于輸出頻率,使共振幅度最大,輸出頻率不在相鄰震子中心頻率邊界之間,調整K值,使震子固有頻率等于初始值。
因為每個彈簧震子的輸出波形振幅差異較大,干攏信號也較多,為了使每個彈簧震子的輸出都在一個有限的、統一的范圍之內,需要根據神經處理系統的輸出,動態生成一個頻譜電平表。
電平表取值范圍的確定為當電平表的最小值對應的接口神經始終處于興奮態時,則將該彈簧震子對應的最小振幅值升高,如長時間處于抑制態時,則將最小振幅值降低,當電平表的最大值對應的接口神經處于興奮態時,則比較彈簧震子的振幅與最大振幅,將大的值當作最大振幅,并且該值會隨時間緩慢降低,然后在最小振幅值與最大振幅值之間做n份的指數切分,每一份對應一個電平值。
作為神經網絡的輸入接口,濾波器陣列還具備了自我調節的功能,可以根據來自神經網絡的反饋信號自動升高或降低某一頻帶的響應靈敏度,使系統拋棄復雜的降噪系統,提高惡劣環境下的區別能力。
4、神經網絡識別處理系統神經網絡處理系統是以人工神經網絡為基礎,神經網絡的運算處理是通過神經元之間的信息傳遞與阻斷操作來完成的,每一組鏈路通道都代表一個相應的信息處理過程。
由濾波器陣列輸送的信號接入輸入神經元,經若干次中間神經元的下延傳遞后,建立一個由輸入神經元到輸出神經元的鏈路通道,最終在某個輸出神經元產生一個與輸入信號相對應的結果輸出,其中只有在該神經元處于傳遞態時系統才對中間神經元進行掃描處理,在該神經元處于常態時神經元與以下的神經元之間保持原來的鏈連關系。如此重復處理,直至建立一個正確的鏈路通道。
神經網絡系統是一個復雜的信息并行處理系統,由于是用普通計算機成為一個由若干個神經元組成的并行神經網絡計算機,神經網絡內部的每個系統的運行處理時間會根據計算內容、狀態等原因而發生改變,但作為一個神經網絡整體必須協同動作,因此在組成神經元的神經網絡處理單元中設置時鐘同步單元,時鐘同步單元每次整體掃描處理的最后一個處理單元處理完畢后,為一個掃描周期,并且與緩沖區中的數據同步作用于讀取指針的控制。
5、語音詞匯辨別系統輸入的語音信號經過神經網絡識別處理系統處理后,得到的是一個與輸入的語音相對應的發音概率隊列,例如一個發音經神經網絡處理之后,可能得到一個正確的拼音,但還可能有其它的聲調,或是相似的拼音,因此需要將這些發音的概率隊列接入到語法詞匯分析系統中,利用這一常規的處理辦法,對發音的概率隊列及其前后發音的概率隊列進行語法和詞法的組合篩選,最終選擇出正確的輸出。
經過語法詞法分析之后的輸出,雖然能滿足大部分的識別,但是仍然有一些詞組,它們的結構、詞性、發音都相同,只是代表的意思不同(例如他們、它們、她們),這時就需要進入語義網系統中進行挑選。語義網的建立是將系統無法區分的詞匯進行匯總,記錄詞與詞之間的用途差異,并描述使用環境,使最終能獲得一個正確的輸出。
在語義網不夠完善的情況下,仍然需要用戶來進行糾錯,但是傳統的糾錯方法是用鍵盤等外部設備輸入正確的字詞,糾錯很不方便。本發明的語音詞匯辨別系統支持利用語音糾錯,其原理是系統保留有歷史記錄,當聽到的字詞發音為先前輸出中的一個字詞的重復發音時,自動檢測后續發音是否為糾錯內容,如果是糾錯內容,則改正錯的字詞并對錯處之后的發音重新進行詞法、語法分析。例如“大家全部(全不)同意”的語音序列為dà jiāquán bu tóng yì,在語義網難以判斷該語音的準確輸出時,系統將根據頻度或隨機地給出一個輸出結果,這時可以讀入下邊的拼音序列dà jiā quánbùtóng yìbùshì dēbù,或者讀入下邊的拼音序列quán bùdē bùshìbu shì dēbù,這樣就能夠得出一個完全正確的語句,使系統通過這種語音糾錯方法達到100%的正確識別率,從而使僅僅通過語音識別就能解決輸入問題的理想得以實現。
具體的語音糾錯識別步驟如下1、在內存中建立輸出循環映射隊列,用于容納有限的文字與發音。將前端程序確定的文字輸出給用戶交互界面,并且同時在映射隊列中記錄該文字及其發音。
2、當映射隊列接收到一個由語音糾錯系統確定的關鍵字詞如“的”字的發音時,則啟動語音糾錯系統判斷其之前緊跟的是否為一個詞組,如果是則等待接收下一個發音是否是該詞組中某個文字的發音。如果條件滿足,根據改錯特定語法,從詞組向前搜索并定位該同發音的文字,用詞組中的文字替換搜索到的同發音文字,同時刪除糾錯所用到的文字。
3、如果條件不滿足,結束語音糾錯識別,繼續進行語音識別。
權利要求
1.基于神經網絡的信息識別處理方法,其特征在于神經網絡系統由儲存在存貯器中的輸入神經元、若干層中間興奮類神經元與抑制類神經元、輸出神經元及其之間的鏈路共同組成,信息采集器采集的信息被轉換成電平表后,輸入到神經網絡系統的輸入神經元中,輸入神經元將輸入的高電平信號等同于神經元的傳遞信號,一方面通過興奮類神經元下延傳遞給一個或多個興奮類神經元,經過若干層次興奮類神經元之間的傳遞,直至傳遞到輸出神經元,形成自輸入神經元經中間神經元到輸出神經元的鏈路通道,另一方面,輸入神經元還通過抑制類神經元下延傳遞給一個或多個抑制類神經元,也經過若干層次抑制類神經元之間的傳遞,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,從而得到一個與輸入的信息相對應的正確輸出結果。
2.根據權利要求1所述的信息識別處理方法,其特征在于神經鏈路通道的形成與阻斷是以下述方式實現的每個神經元都帶有一個設定了確定值的傳遞計數器,該傳遞計數器數值的改變由上延神經元決定,當傳遞計數器從小于零變為大于零時,該神經元表現為傳遞態,并等待系統掃描處理,當得到掃描處理時,該神經元按自身的屬性將興奮或抑制信號傳遞給下延神經元,如果與下延神經元的類型相同,則下延神經元的傳遞計數器加一,否則減一;當傳遞計數器從大于零變為小于零時,該神經元也表現為傳遞態,只是當系統處理時,如果與下延神經元的類型相同,則下延神經元的傳遞計數器減一,否則加一;當傳遞計數器沒有通過零值,該神經元表現為常態;系統對所有處于傳遞態的神經元進行掃描處理,處理完的神經元由傳遞態變為常態,系統對處于常態的神經元不進行處理,如此重復,直至傳遞到的某個輸出神經元的傳遞計數器從小于零變為大于零,即該輸出神經元變為傳遞態時,得到一個結果輸出。
3.根據權利要求1所述的信息識別處理方法,其特征在于中間興奮類和抑制類神經元的層數是在建立時根據網絡規模大小來確定,而且層與層之間無相互承接關系,信息可以跨位、跨層傳遞,并且對于單個神經元的信息傳遞方向由建立時確定,既可以正向傳遞,也可以逆向作為反饋,同時不同類型的神經元之間也可以進行信息傳遞。
4.根據權利要求1所述的信息識別處理方法,其特征在于系統對所有需掃描處理的神經元的掃描是采取隔位跳行跳層的掃描方法。
5.根據權利要求1所述的信息識別處理方法,其特征在于可以由多個運算單元組成并行網絡,同時對輸入信息進行識別處理。
6.根據權利要求5所述的信息識別處理方法,其特征在于所述的運算單元可以是由個人電腦、商用微機或單片機構成。
7.權利要求1所述神經網絡信息識別處理方法在語音識別上的應用,其特征在于包括如下步驟a、根據語音聽覺模型將聲音頻譜作非對稱分段,每一小段計算出一個中心頻率,以該中心頻率為固有頻率制作理想狀態彈簧震子模型,并將所有彈簧震子按照響應頻率的高低順序進行排序;b、采用音頻脈沖編碼方式輸入語音,將聲波信號量化為音頻數據流,由系統進行讀取;c、當讀取的輸入音頻數據流量化值與某一個彈簧震子模型的固有頻率相同時,該彈簧震子會產生強烈的共振現象,記錄彈簧震子的共振位移量,組成輸入語音的動態頻譜電平表;d、將頻譜電平表輸入神經網絡系統的輸入神經元,輸入神經元將輸入的高電平信號等同于神經元傳遞信號,一方面通過興奮類神經元下延傳遞給一個或多個興奮類神經元,經過若干層次興奮類神經元之間的傳遞,直至傳遞到輸出神經元,形成自輸入神經元經中間神經元到輸出神經元的鏈路通道,另一方面,輸入神經元還通過抑制類神經元下延傳遞給一個或多個抑制類神經元,也經過若干層次抑制類神經元之間的傳遞,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,從而得到一個與輸入語音相對應的發音概率隊列;e、將每一個發音的概率隊列與前后發音的概率隊列進行組合篩選,組成句子輸出;f、對前端輸出的句子可能的錯誤進行語音糾錯識別,得到完全正確的句子輸出。
8.權利要求7所述的神經網絡信息識別處理方法在語音識別上的應用,其特征在于所述的語音糾錯識別是a、在內存中建立輸出循環映射隊列,用于部分容納前端輸出句子的文字與發音,并與用戶界面的輸出同步;b、當映射隊列接收到一個由語音糾錯系統確定的關鍵字詞的發音時,判斷其之前緊跟的是否為一個詞組,并判斷其后接收的下一個文字的發音是否為該詞組中的某一個文字的發音;c、如果條件滿足,根據改錯特定語法從詞組向前搜索并定位該同發音的文字,用詞組中的文字替換搜索到的同發音文字;d、如果條件不滿足,結束語音糾錯識別,繼續進行語音識別。
9.權利要求7所述的神經網絡信息識別處理方法在語音識別上的應用,其特征在于彈簧震子的倔強系數K為可變參數,輸出頻率處在相鄰彈簧震子中心頻率的邊界之內,彈簧震子會自動調整K值,使彈簧震子的固有頻率等于輸出頻率,始終保持共振幅度最大,輸出頻率不在相鄰彈簧震子中心頻率之間,固有頻率等于初始值。
10.權利要求1所述神經網絡信息識別處理方法在圖像識別上的應用,其特征在于包括如下步驟a、先將圖像分解成一個個像素,每個像素再分解成多種單色,每個單色具有不同的灰度,根據灰度的色階,制定出相應的輸入神經元,一個像素對應的輸入神經元個數為色階數×配色個數,將擬識別的圖像轉換為2值圖像;b、將轉換后的2值圖像直接輸入到神經網絡的輸入神經元,該輸入神經元將輸入的高電平信號等同于神經元傳遞信號,一方面通過興奮類神經元下延傳遞給一個或多個興奮類神經元,經過若干層次興奮類神經元之間的傳遞,直至傳遞到輸出神經元,形成自輸入神經元經中間神經元到輸出神經元的鏈路通道,另一方面,輸入神經元還通過抑制類神經元下延傳遞給一個或多個抑制類神經元,也經過若干層次抑制類神經元之間的傳遞,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,從而得到一個與輸入圖像相對應的圖像輸出。
全文摘要
本發明涉及神經網絡信息識別處理方法。系統由輸入神經元、中間興奮類與抑制類神經元、輸出神經元及其之間的鏈路組成,信息轉換成電平表,輸入到神經元中,通過興奮類神經元下延傳遞給一個或多個興奮類神經元,直至輸出神經元,形成自輸入到輸出的鏈路通道,通過抑制類神經元下延傳遞給一個或多個抑制類神經元,將抑制信號傳遞到興奮類神經元或輸出神經元上,阻斷在興奮類神經鏈路中的錯誤傳遞,得到一個正確輸出結果。
文檔編號G06N3/00GK1457021SQ03137640
公開日2003年11月19日 申請日期2003年6月9日 優先權日2003年6月9日
發明者王慧東 申請人:王慧東
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1