一種面向pc的嵌入式非特定語音溝通系統的制作方法

文檔序號(hao)：8339353閱讀(du)：406來源(yuan)：國知局

一種面向pc的嵌入式非特定語音溝通系統的制作方法
【技術領域】
[0001] 本發明涉及一種非特定語音信號識別電路，具體地說是涉及一種通過嵌入式非特定語音信號和電腦溝通的電路系統。
【背景技術】
[0002] 嵌入式技術作為21世紀智能時代的核心技術，越來越多的在科技和生活領域發揮了支柱性作用。目前，計算機的控制是通過鍵盤和鼠標來完成，隨著科技的不斷發展，人們需要一種更方便、更自然、更加人性化的方式與計算機進行交互。語音識別技術是信息
技術領域十大重要的科技發展技術之一，它是一門交叉學科，正逐步成為信息技術中人機交互的關鍵技術，它的應用已經成為一個具有競爭性的新興高技術產業。目前主流的語音識別技術是基于統計模式識別的基本理論，而統計模型訓練由于算法復雜，運算量大，功耗高，成本高等缺點，在實際應用中限制了它的運用。而嵌入式語音人機交互由于其實時性好，穩定性高等許多優點已成為目前研宄的熱門課題，但尚無比較成熟，設計復雜程度低、功耗較小的可實施性方案問世。

【發明內容】

[0003] 鑒于上述現有技術的不足，本發明的目的是提出一種面向PC的嵌入式非特定語音溝通系統，以簡單的電路設計、識別率高、實時性高、穩定性好等特點提出PC語音交互的技術解決方案。
[0004] 本發明的上述目的，其得以實現的技術解決方案是：一種面向PC的嵌入式非特定語音溝通系統，其特征在于：所述溝通系統由微處理器、語音識別芯片LD3320、USB電纜和輔配電路組成，其中所述微處理器為Cortex-M4內核的STM32F407VG主控芯片且移植有 yC/OS-III操作系統，所述語音識別芯片LD3320外接設有音頻播放器和音頻采集器且與微處理器SPI通信相連，所述USB電纜連接微處理器至PC機，且語音溝通包括步驟： I、通用初始化，通用初始化就是語音識別以及語音播放都適用的初始化。LD3320內部集成PLL，根據時鐘頻率正確配置PLL是語音識別ADC采樣和語音播放.DA輸出的保證，只需要修改代碼中的CLK_IN這個宏定義即可； II、初始化語音識別一些參數，這參數主要包括設置語音檢測的靈敏度、起始語音的時間、背景噪音時間，靈敏度并不是越高越好，靈敏度越高誤觸發的可能性越大，因此要根據實際環境設置一個合適的值。起始語音時間為當芯片檢測到多長的語音時決策為一次真正的語音開始，背景噪音時間為當芯片檢測到語音多久沒有輸入之后判斷為語音的結束。
[0005] III、面向微處理器通過拼音直接寫入非特定的識別短語，每一個識別短語都包含一個短語ID且對應一項PC動作指令，對應在PC機上虛擬成為一個人機接口鍵盤； IV、啟動語音識別，音頻采集器接收外部的非特定語音，由語音識別芯片LD3320識別語音并將識別結果向微處理器申請中斷，微控制器中斷讀取出識別結果并選定與短語ID 相對應的PC動作指令、通過USB電纜向PC機輸出動作指令并由PC機響應動作。
[0006] 進一步地，所述微處理器為最高工作頻率達168MHz的MCU。
[0007] 進一步地，所述語音識別芯片LD3320為內置有非特定語音識別DSP算法的語音識別器。
[0008] 應用本發明的非特定語音溝通系統，其顯著優點體現為：無需通過鍵盤和鼠標來完成計算機的控制和操作，只需通過人發出聲音命令來控制和操作計算機，該電路具有穩定性好、語音識別率高、抗噪聲干擾能力強、結構簡單和使用方便等優點，可以有效降低成本，并可廣泛應用于服務機器人智能空間、智能家居和消費電子產品等多個領域。
【附圖說明】
[0009] 圖1是本發明的電路總框圖。
[0010] 圖2是本發明溝通系統中語音識別芯片LD3320的電路連接示意圖。
【具體實施方式】
[0011] 以下便結合實施例附圖，對本發明技術方案作進一步的詳細說明，以使本發明創新性、實用性更易于理解。
[0012] 本發明創新提出一種通過嵌入式非特定語音信號和電腦交互的溝通電路，該電路主要包括主控和語音識別兩大部分。如圖1所示從具體的結構來看：其結構由微處理器 STM32F407VG、語音識別芯片LD3320、USB電纜及其它看門狗等輔配電路組成，其中微處理器為CortexHM內核的STM32F407VG主控芯片（下稱MCU)，并且移植μ COS-III操作系統作為任務管理，移植了 USB作為HID標準設備，MCU選擇SPI與語音識別芯片LD3320通信。該MCU的最高工作頻率達168MHz，處理速度快；μ COS-III是micrium公司的第三代微控制器系統，它是一個全新的操作系統，在國內外被廣泛應用于各類產品，在主控芯片上移植 μ COS-III操作系統，作為任務的管理和調度。
[0013] 如圖2本發明溝通系統中語音識別芯片LD3320的電路連接示意圖所示，LD3320采用并行方式直接與MCU相接，一般采用IkQ電阻上拉，復位信號以及中斷返回信號與MCU 直接相連并采用3. 3kΩ的上拉電阻，輔助系統穩定工作，LD3320和處理器采用同一個外部時鐘，圖下方為有源晶振，右上方為麥克風和耳機的接口，右下方排針引出來連接到相應管腳上。對LD3320來說，復位信號由MCU發出，而中斷信號由LD3320發出，MCU負責接收。語音識別芯片LD3320外接設有音頻播放器和音頻采集器且與微處理器SPI通信相連，USB電纜連接微處理器至PC機，語音識別芯片LD3320內置有非特定語音識別的DSP算法，可以動態編輯識別條目列表，無需外掛其它輔助器件，單一芯片即可完成語音識別，并且直接支持 mp3數據的語音播放，語音識別芯片檢測語音輸入并對語音進行識別，識別結果向MCU申請中斷，MCU中斷讀取出識別結果，并啟動相應的識別任務，對PC機進行相關的操作。
[0014] 上述語音溝通包括步驟： I、通用初始化，通用初始化就是語音識別以及語音播放都適用的初始化。LD3320內部集成PLL，根據時鐘頻率正確配置PLL是語音識別ADC采樣和語音播放.DA輸出的保證，我們只需要修改代碼中的CLK_IN這個宏定義即可。
[0015] II、初始化語音識別一些參數，這參數主要包括設置語音檢測的靈敏度、起始語音的時間、背景噪音時間，靈敏度并不是越高越好，靈敏度越高誤觸發的可能性越大，因此要根據實際環境設置一個合適的值。起始語音時間為當芯片檢測到多長的語音時決策為一次真正的語音開始，背景噪音時間為當芯片檢測到語音多久沒有輸入之后判斷為語音的結束。
[0016] III、面向微處理器通過拼音直接寫入非特定的識別短語，每一個識別短語都包含一個短語ID且對應一項PC動作指令，對應在PC機上虛擬成為一個人機接口鍵盤。
[0017] IV、啟動語音識別，音頻采集器接收外部的非特定語音，由語音識別芯片LD3320 識別語音并將識別結果向微處理器申請中斷，微控制器中斷讀取出識別結果并選定與短語 ID相對應的PC動作指令、通過USB電纜向PC機輸出動作指令并由PC機響應動作。
[0018] 通常情況下，每次識別只要重復步驟I至IV即可；如果系統持續工作在語音識別功能且沒有復位，那么只需要每次啟動識別時只執行一次步驟IV即可，從而可以節省時間，提高語音識別的響應速度。
[0019] 以下從本發明溝通系統在實際各種場合下的溝通實驗來進一步了解本技術方案的實際優異效果。在家庭(安靜環境）和商場(吵鬧環境）等兩個不同噪音背景的環境下，通過按以上方案架構連接而成的溝通電路，并對該溝通電路在步驟II中設置合理的語音檢測靈敏度、語音起始時間、背景噪音時間等參數后，即可進行面向PC機的嵌入式非特定語音溝通。讓大人和小孩根據預設的語音指令對該溝通電路發出聲控，觀察并記錄PC機的實際運作情況（這邊次數設為15次），結果整理如下表所示(識別率為識別次數與總次數之比)：
【主權項】
1. 一種面向PC的嵌入式非特定語音溝通系統，其特征在于：所述溝通系統由微處理器、語音識別芯片LD3320、USB電纜和輔配電路組成，其中所述微處理器為Cortex-M4內核的STM32F407VG主控芯片且移植有y C/OS-III操作系統，所述語音識別芯片LD3320外接設有音頻播放器和音頻采集器且與微處理器SPI通信相連，所述USB電纜連接微處理器至 PC機，且語音溝通包括步驟：
1. 對語音識別芯片LD3320進行語音識別及語音播放的通用初始化，語音識別芯片 LD3320內部集成PLL，根據時鐘頻率通過修改代碼中的CLK_IN這個宏定義正確配置PLL以保證語音識別ADC采樣和語音播放.DA輸出； II、初始化語音識別的參數，所述參數包括語音檢測的靈敏度、判斷語音開始的起始語音時間和判斷語音結束的背景噪音時間； III、面向微處理器通過拼音直接寫入非特定的識別短語，每一個識別短語都包含一個短語ID且對應一項PC動作指令，對應在PC機上虛擬成為一個人機接口鍵盤； IV、啟動語音識別，音頻采集器接收外部的非特定語音，由語音識別芯片LD3320識別語音并將識別結果向微處理器申請中斷，微控制器中斷讀取出識別結果并選定與短語ID 相對應的PC動作指令、通過USB電纜向PC機輸出動作指令并由PC機響應動作。
2. 根據權利要求1所述面向PC的嵌入式非特定語音溝通系統，其特征在于：所述微處理器為最高工作頻率達168MHz的MCU。
3. 根據權利要求1所述面向PC的嵌入式非特定語音溝通系統，其特征在于：所述語音識別芯片LD3320為內置有非特定語音識別DSP算法的語音識別器。
【專利摘要】本發明揭示了一種嵌入式非特定語音信號和電腦溝通電路的設計，其組成包括微處理器STM32F407VG，語音識別芯片LD3320，USB電纜等。整個系統使用的是Cortex-M4內核的STM32F407VG作為主控芯片，并且移植μC/OS-III操作系統作為任務管理，移植了USB電纜作為人機接口標準設備，語音識別芯片外接設有音頻播放器和音頻采集器且與微處理器SPI通信相連，且USB電纜連接微處理器至PC機。本發明方案的提出，無需通過鍵盤和鼠標來完成計算機的控制和操作，只需通過人發出聲音命令來控制和操作計算機，該電路具有穩定性好、語音識別率高、抗噪聲干擾能力強、結構簡單和使用方便等優點，可以有效降低成本，并可廣泛應用于服務機器人智能空間、智能家居和消費電子產品等多個領域。
【IPC分類】G10L15-22, G06F3-16
【公開號】CN104657104
【申請號】CN201510030838
【發明人】吳振英
【申請人】蘇州工業職業技術學院
【公開日】2015年5月27日
【申請日】2015年1月22日

完整全部詳細技術(shu)資料下載

該技術已申請專利。僅(jin)供學習(xi)研(yan)究，如用(yong)于商業用(yong)途(tu)，請聯系技術所(suo)有人。
技術研發人員(yuan)：吳振英(ying);
技(ji)術(shu)(shu)所有人：蘇州工業職(zhi)業技(ji)術(shu)(shu)學院;
我是此專利的發明人

上一篇：一種開啟終端的語音輸入功能的方法和裝置的制造方法
上一篇：基于深度攝像機的手持cave投影系統的制作方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、李老師：1.計算力學 2.無損檢測
2、畢老師：機構動力學與控制
3、袁老師：1.計算機視覺 2.無線網絡及物聯網
4、王老師：1.計算機網絡安全 2.計算機仿真技術
5、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態勢感知、輿情分析和控制 3.區塊鏈及應用
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術(shu)

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

中文字幕无码日韩视频无码三区

一種面向pc的嵌入式非特定語音溝通系統的制作方法