語音信息轉換方法及語音轉換網關的制作方法

文檔序號：10473969閱讀：512來源：國知局

語音信息轉換方法及語音轉換網關的制作方法
【專利摘要】本發明實施例公開了一種語音信息轉換方法及語音轉換網關，所述方法包括：所述語音轉換網關接收所述接入網側轉發的Web消息，確定所述Web消息包含語音內容時，獲取所述語音內容中語音的類別；根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器，并將所述語音內容向所選取的語音轉換服務器發送；接收語音轉換服務器反饋的語音轉換結果，將所述語音轉換結果封裝為Web消息，將封裝后的Web消息向所述互聯網側發送。
【專利說明】
語音信息轉換方法及語音轉換網關
技術領域
[0001]本發明涉及語音轉換技術，尤其涉及一種基于Web應用的語音信息轉換方法及語首轉換網關。
【背景技術】
[0002]目前，語音識別技術發展非常迅猛，已應用于各技術領域，如用于個人電腦或手機終端中作身份識別用。更多的語音識別應用，是識別用戶輸入的語音，將其轉換為字符作為文字信息輸出，或作為指令發送給處理器。目前，語音識別技術多用于單電子終端中，而隨著互聯網技術的不斷成熟，為進一步方便用戶對互聯網進行訪問，語音識別應用于Web網頁將會有相當廣闊的前景。目前，如果在用戶終端側對語音進行識別，鑒于用戶終端的處理能力有限，很難達到較高的識別精度，而設置于互聯網網絡側時，鑒于用戶終端與互聯網通信的不穩定性，識別效果也不會特別好，并且，語音文件一般比較大，在用戶終端與互聯網之間傳輸的穩定性也不佳。

【發明內容】

[0003]本發明實施例為解決上述技術問題，提供一種語音信息轉換方法及語音轉換網關，能快捷準確地識別出語音信息，識別準確度及穩定性較高。
[0004]本發明實施例的技術方案是這樣實現的:
[0005]—種語音信息轉換方法，在接入網與互聯網之間設置語音轉換網關，所述語音轉換網關與一個以上的語音轉換服務器連接；所述方法包括:
[0006]所述語音轉換網關接收所述接入網側轉發的Web消息，確定所述Web消息包含語音內容時，獲取所述語音內容中語音的類別；
[0007]根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器，并將所述語音內容向所選取的語音轉換服務器發送；
[0008]接收語音轉換服務器反饋的語音轉換結果，將所述語音轉換結果封裝為Web消息，將封裝后的Web消息向所述互聯網側發送。
[0009]優選地，所述方法還包括:
[0010]所述語音轉換網關向所述一個以上的語音轉換服務器發送狀態查詢消息，
[0011]在設定時長內接收到語音轉換服務器的響應消息時，確定語音轉換服務器正常運行；
[0012]在設定時長內未接收到語音轉換服務器的響應消息或在設定時長內未接收到語音轉換服務器的響應消息超過設定次數時，確定語音轉換服務器非正常運行。
[0013]優選地，所述方法還包括:
[0014]所述語音轉換網關根據語音轉換服務器的當前狀態及所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。
[0015]優選地，所述方法還包括:
[0016]所述語音轉換網關未接收到語音轉換服務器反饋的語音轉換結果，而確定語音轉換網關故障時，根據所述語音的類別重新在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。
[0017]優選地，為所述語音轉換網關設置至少一個冗余語音轉換網關；所述方法還包括:
[0018]所述接入網確定當前工作的語音轉換網關故障時，在所述至少一個冗余語音轉換網關中選取一個代替當前的語音轉換網關。
[0019]優選地，所述語音轉換結果為字符信息。
[0020]一種語音轉換網關，所述語音轉換網關設置于接入網與互聯網之間，所述語音轉換網關與一個以上的語音轉換服務器連接；所述語音轉換網關包括:第一接收單元、第一確定單元、獲取單元、選取單元、第一發送單元、第二接收單元、封裝單元和第二發送單元，其中:
[0021]第一接收單元，用于接收所述接入網側轉發的Web消息；
[0022]第一確定單元，用于確定所述Web消息是否包含語音內容，包含語音內容時觸發所述獲取單元；
[0023]獲取單元，用于獲取所述語音內容中語音的類別；
[0024]選取單元，用于根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器；
[0025]第一發送單元，用于將所述語音內容向所選取的語音轉換服務器發送；
[0026]第二接收單元，用于接收語音轉換服務器反饋的語音轉換結果；
[0027]封裝單元，用于將所述語音轉換結果封裝為Web消息；
[0028]第二發送單元，用于將封裝后的Web消息向所述互聯網側發送。
[0029]優選地，所述語音轉換網關還包括:第三發送單元、第三接收單元、第二確定單元和第三確定單元，其中:
[0030]第三發送單元，用于向所述一個以上的語音轉換服務器發送狀態查詢消息；
[0031]第三接收單元，用于接收語音轉換服務器的響應消息；
[0032]第二確定單元，用于在所述第三接收單元在設定時長內接收到語音轉換服務器的響應消息時，確定語音轉換服務器正常運行；
[0033]第三確定單元，用于在所述第三接收單元在設定時長內未接收到語音轉換服務器的響應消息或在設定時長內未接收到語音轉換服務器的響應消息超過設定次數時，確定語音轉換服務器非正常運行。
[0034]優選地，所述選取單元，還用于根據語音轉換服務器的當前狀態及所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。
[0035]優選地，所述語音轉換網關還包括:第四確定單元，用于在所述第二接收單元未接收到語音轉換服務器反饋的語音轉換結果時，確定語音轉換網關故障，觸發所述選取單元根據所述語音的類別重新在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。
[0036]優選地，所述語音轉換結果為字符信息。
[0037]本發明實施例中，通過在接入網與互聯網之間設置語音轉換網關，對用戶終端發往互聯網的Web消息進行識別，確認Web消息中承載的信息為語音信息時，將其發送至語音轉換服務器，經語音轉換服務器識別為字符信息后，再由語音轉換網關將轉換后的字符信息重新封裝為Web消息而發送至互聯網側。本發明實施例中，通過設置不同類型的語音轉換服務器，能識別不同類型的語音，識別準確度高；由于語音轉換網關與語音轉換服務器之間的連接穩定度高而識別可靠，而語音轉換服務器對用戶不可見，提升了用戶體驗。
【附圖說明】
[0038]圖1為本發明實施例的網絡結構示意圖；
[0039]圖2為本發明實施例一的語音信息轉換方法的流程圖；
[0040]圖3為本發明實施例二的語音信息轉換方法的流程圖；
[0041]圖4為本發明實施例的語音轉換網關的組成結構示意圖。
【具體實施方式】
[0042]為使本發明的目的、技術方案和優點更加清楚明白，以下舉實施例并參照附圖，對本發明進一步詳細說明。
[0043]圖1為本發明實施例的網絡結構示意圖，如圖1所示，本發明實施例中，
[0044]在接入網的網絡側如移動網絡側部署Web應用網關；由該Web應用網關維護語言種類與Web語音轉換服務器之間的對應關系；該Web應用網關截獲包括語音內容的Web消息，將根據Web消息中語音內容的語言種類將語音內容轉發到對應的Web語音轉換服務器，Web語音轉換服務器將其轉換成字符，然后該Web應用網關將Web語音轉換服務器的返回字符重新封裝為新的Web消息，并將重新封裝的Web消息發送至互聯網側。
[0045]本發明實施例中，當Web應用網關探測各Web語音轉換服務器的可用性，必要時，為語音Web消息選取可用的Web語音轉換服務器。
[0046]本發明實施例的技術方案，對于Web應用開發者而言，無需了解Web應用網關的地址信息；也無需了解Web語音轉換服務器支持的語言種類，降低了開發者使用語音轉換功能的門檻；同時有助于匯聚、動態組合業界優秀的語音轉換資源。
[0047]圖2為本發明實施例一的語音信息轉換方法的流程圖，結合圖1，本發明實施例中，在接入網如移動網絡與互聯網之間設置語音轉換網關，所述語音轉換網關與一個以上的語音轉換服務器連接；如圖2所示，本示例的語音信息轉換方法包括以下步驟:
[0048]步驟201，語音轉換網關接收所述接入網側轉發的Web消息，確定所述Web消息包含語音內容時，獲取所述語音內容中語音的類別。
[0049]作為一種實現方式，本發明實施例中，語音轉換網關可以通過Web消息中的特定標簽，來識別Web消息為語音Web消息還是字符Web消息。例如，可通過Web應用識別出待Web封裝的內容為語音內容還是字符內容，從而在所封裝后的Web消息中插入不同的標簽，由語音轉換網關對所接收的Web消息進行識別。
[0050]需要說明的是，本發明實施例中，由用戶終端側發送的Web消息，需要經語音轉換網關處理，再發送至互聯網側。
[0051]步驟202，根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器，并將所述語音內容向所選取的語音轉換服務器發送。
[0052]本發明實施例中，當語音轉換網關確定當前的Web消息中承載的內容為語音內容時，將會識別該語音內容的語言類別，如識別出語音內容為英文、日文、還是中文等，或者，當識別出語音內容為中文時，再進一步識別其為普通話還是方言，識別出后，為該語音內容選取能識別該語音內容的語音轉換服務器，以便將語音內容準確識別為字符內容。
[0053]選取出語音轉換服務器后，將所述語音內容向所選取的語音轉換服務器發送。
[0054]步驟203，接收語音轉換服務器反饋的語音轉換結果，將所述語音轉換結果封裝為Web消息，將封裝后的Web消息向所述互聯網側發送。
[0055]本發明實施例中，當語音轉換服務器將語音內容識別為字符信息后，將該字符信息發送給語音轉換網關，語音轉換網關將轉換后的字符信息重新封裝為Web消息，將封裝后的Web消息向所述互聯網側發送。
[0056]以下通過具體示例，進一步闡明本發明實施例的技術方案的實質。
[0057]圖3為本發明實施例二的語音信息轉換方法的流程圖，如圖3所示，本示例的語音信息轉換方法包括以下步驟:
[0058]步驟301，Web應用錄制語音，并將錄制的語音內容封裝為Web消息。
[0059]Web應用可以為安裝于用戶終端中的瀏覽器。語音內容可以通過設置于用戶終端上的麥克輸入。例如用戶可以通過麥克輸入語音信息，由Web應用采集該語音內容并封裝。
[0060]步驟302，Web應用將封裝好的語音Web消息向Web應用網關(語音轉換網關)發送。
[0061]步驟303，Web應用網關對多接收的所有Web消息進行處理，分揀出語音Web消息，并提取Web消息中的語音內容，對該語音內容進行識別，識別出語音內容的語言類型，確定其是中文，還是其他種類的外語，或者是中文中的哪種方言。
[0062]步驟304，Web應用網關將識別出語言類別的語音內容發送至對應的語音轉換Web服務器(語音轉換服務器)，對該語音內容進行識別，將其轉換為字符內容。本發明實施例中，與Web應用網關連接的語音轉換Web服務器有多個，且每個語音轉換Web服務器由不同的運營商維護，能識別出不同語言類型的語音，本發明實施例通過對語音內容進行分類，提升了語音內容識別的準確性。
[0063]步驟305，語音轉換Web服務器將語音內容轉換為字符信息。
[0064]步驟306，語音轉換Web服務器將識別出的字符信息發送給Web應用網關。
[0065]步驟307，Web應用網關對所接收的字符信息重新封裝，并根據之前語音Web消息的目的地址及源地址，重新封裝給識別的字符信息為Web字符消息。
[0066]步驟308，Web應用網關將該重新封裝后的Web字符消息發送至對應的Web應用服務器(互聯網側)。
[0067]本發明實施例中，通過在接入網與互聯網之間設置語音轉換網關，對用戶終端發往互聯網的Web消息進行識別，確認Web消息中承載的信息為語音信息時，將其發送至語音轉換服務器，經語音轉換服務器識別為字符信息后，再由語音轉換網關將轉換后的字符信息重新封裝為Web消息而發送至互聯網側。本發明實施例中，通過設置不同類型的語音轉換服務器，能識別不同類型的語音，識別準確度高；由于語音轉換網關與語音轉換服務器之間的連接穩定度高而識別可靠，而語音轉換服務器對用戶不可見，這樣，對于Web應用開發者而言，無需了解Web應用網關的地址信息；也無需了解Web語音轉換服務器支持的語言種類，降低了開發者使用語音轉換功能的門檻；同時有助于匯聚、動態組合業界優秀的語音轉換資源。
[0068]如圖1所示，本發明實施例的語音轉換網關設置于接入網與互聯網之間，所述語音轉換網關與一個以上的語音轉換服務器連接；接入網可以為移動網絡；圖4為本發明實施例的語音轉換網關的組成結構示意圖，如圖4所示，所述語音轉換網關包括:第一接收單元40、第一確定單元41、獲取單元42、選取單元43、第一發送單元44、第二接收單元45、封裝單元46和第二發送單元47，其中:
[0069]第一接收單元40，用于接收所述接入網側轉發的Web消息；
[0070]第一確定單元41，用于確定所述Web消息是否包含語音內容，包含語音內容時觸發所述獲取單元42 ;
[0071]獲取單元42，用于獲取所述語音內容中語音的類別；
[0072]選取單元43，用于根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器；
[0073]第一發送單元44，用于將所述語音內容向所選取的語音轉換服務器發送；
[0074]第二接收單元45，用于接收語音轉換服務器反饋的語音轉換結果；
[0075]封裝單元46，用于將所述語音轉換結果封裝為Web消息；
[0076]第一發送單元47，用于將封裝后的Web消息向所述互聯網側發送。
[0077]在圖4所示的語音轉換網關的基礎上，本發明實施例的語音轉換網關還包括:第三發送單元(圖4中未示出)、第三接收單元(圖4中未示出)、第二確定單元(圖4中未示出)和第三確定單元(圖4中未示出)，其中:
[0078]第三發送單元，用于向所述一個以上的語音轉換服務器發送狀態查詢消息；
[0079]第三接收單元，用于接收語音轉換服務器的響應消息；
[0080]第二確定單元，用于在所述第三接收單元在設定時長內接收到語音轉換服務器的響應消息時，確定語音轉換服務器正常運行；
[0081]第三確定單元，用于在所述第三接收單元在設定時長內未接收到語音轉換服務器的響應消息或在設定時長內未接收到語音轉換服務器的響應消息超過設定次數時，確定語音轉換服務器非正常運行。
[0082]本發明實施例，所述選取單元42，還用于根據語音轉換服務器的當前狀態及所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。
[0083]在圖4所示的語音轉換網關的基礎上，本發明實施例的語音轉換網關還包括:第四確定單元(圖4中未示出)，用于在所述第二接收單元未接收到語音轉換服務器反饋的語音轉換結果時，確定語音轉換網關故障，觸發所述選取單元根據所述語音的類別重新在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。
[0084]本發明實施例中，所述語音轉換結果為字符信息。
[0085]本領域技術人員應當理解，圖4中所示的語音轉換網關中的各處理單元的實現功能可參照前述語音信息轉換方法及其實施例的相關描述而理解。本領域技術人員應當理解，圖4示的語音轉換網關中各處理單元的功能可通過運行于處理器上的程序而實現，也可通過具體的邏輯電路而實現。
[0086]本發明實施例中，通過在接入網與互聯網之間設置語音轉換網關，對用戶終端發往互聯網的Web消息進行識別，確認Web消息中承載的信息為語音信息時，將其發送至語音轉換服務器，經語音轉換服務器識別為字符信息后，再由語音轉換網關將轉換后的字符信息重新封裝為Web消息而發送至互聯網側。本發明實施例中，通過設置不同類型的語音轉換服務器，能識別不同類型的語音，識別準確度高；由于語音轉換網關與語音轉換服務器之間的連接穩定度高而識別可靠，而語音轉換服務器對用戶不可見，這樣，對于Web應用開發者而言，無需了解Web應用網關的地址信息；也無需了解Web語音轉換服務器支持的語言種類，降低了開發者使用語音轉換功能的門檻；同時有助于匯聚、動態組合業界優秀的語音轉換資源。
[0087]本發明實施例所記載的技術方案之間，在不沖突的情況下，可以任意組合。
[0088]在本發明所提供的幾個實施例中，應該理解到，所揭露的方法、裝置和電子設備，可以通過其它的方式實現。以上所描述的設備實施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現時可以有另外的劃分方式，如:多個單元或組件可以結合，或可以集成到另一個系統，或一些特征可以忽略，或不執行。另外，所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口，設備或單元的間接耦合或通信連接，可以是電性的、機械的或其它形式的。
[0089]上述作為分離部件說明的單元可以是、或也可以不是物理上分開的，作為單元顯示的部件可以是、或也可以不是物理單元，即可以位于一個地方，也可以分布到多個網絡單元上；可以根據實際的需要選擇其中的部分或全部單元來實現本實施例方案的目的。
[0090]另外，在本發明各實施例中的各功能單元可以全部集成在一個處理單元中，也可以是各單元分別單獨作為一個單元，也可以兩個或兩個以上單元集成在一個單元中；上述集成的單元既可以采用硬件的形式實現，也可以采用硬件加應用功能單元的形式實現。
[0091 ] 本領域普通技術人員可以理解:實現上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成，前述的程序可以存儲于一計算機可讀取存儲介質中，該程序在執行時，執行包括上述方法實施例的步驟；而前述的存儲介質包括:移動存儲設備、只讀存儲器(ROM，Read-Only Memory)、隨機存取存儲器(RAM，Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0092]或者，本發明實施例上述集成的單元如果以應用功能模塊的形式實現并作為獨立的產品銷售或使用時，也可以存儲在一個計算機可讀取存儲介質中。基于這樣的理解，本發明實施例的技術方案本質上或者說對現有技術做出貢獻的部分可以以應用產品的形式體現出來，該計算機應用產品存儲在一個存儲介質中，包括若干指令用以使得一臺計算機設備(可以是個人計算機、服務器、或者網絡設備等)執行本發明各個實施例所述方法的全部或部分。而前述的存儲介質包括:移動存儲設備、只讀存儲器(ROM，Read-Only Memory)、隨機存取存儲器(RAM，Random Access Memory)、磁碟或者光盤等各種可以存儲程序代碼的介質。
[0093]本發明的保護范圍并不局限于此，熟悉本技術領域的技術人員在本發明揭露的技術范圍內，可輕易想到變化或替換，都應涵蓋在本發明的保護范圍之內。
【主權項】
1.一種語音信息轉換方法，其特征在于，在接入網與互聯網之間設置語音轉換網關，所述語音轉換網關與一個以上的語音轉換服務器連接；所述方法包括: 所述語音轉換網關接收所述接入網側轉發的Web消息，確定所述Web消息包含語音內容時，獲取所述語音內容中語音的類別；根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器，并將所述語音內容向所選取的語音轉換服務器發送；接收語音轉換服務器反饋的語音轉換結果，將所述語音轉換結果封裝為Web消息，將封裝后的Web消息向所述互聯網側發送。2.根據權利要求1所述的方法，其特征在于，所述方法還包括: 所述語音轉換網關向所述一個以上的語音轉換服務器發送狀態查詢消息，在設定時長內接收到語音轉換服務器的響應消息時，確定語音轉換服務器正常運行；在設定時長內未接收到語音轉換服務器的響應消息或在設定時長內未接收到語音轉換服務器的響應消息超過設定次數時，確定語音轉換服務器非正常運行。3.根據權利要求2所述的方法，其特征在于，所述方法還包括: 所述語音轉換網關根據語音轉換服務器的當前狀態及所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。4.根據權利要求1所述的方法，其特征在于，所述方法還包括: 所述語音轉換網關未接收到語音轉換服務器反饋的語音轉換結果，而確定語音轉換網關故障時，根據所述語音的類別重新在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。5.根據權利要求1所述的方法，其特征在于，為所述語音轉換網關設置至少一個冗余語音轉換網關；所述方法還包括: 所述接入網確定當前工作的語音轉換網關故障時，在所述至少一個冗余語音轉換網關中選取一個代替當前的語音轉換網關。6.根據權利要求1至5任一項所述的方法，其特征在于，所述語音轉換結果為字符信息。7.一種語音轉換網關，其特征在于，所述語音轉換網關設置于接入網與互聯網之間，所述語音轉換網關與一個以上的語音轉換服務器連接；所述語音轉換網關包括:第一接收單元、第一確定單元、獲取單元、選取單元、第一發送單元、第二接收單元、封裝單元和第二發送單元，其中: 第一接收單元，用于接收所述接入網側轉發的Web消息；第一確定單元，用于確定所述Web消息是否包含語音內容，包含語音內容時觸發所述獲取單元；獲取單元，用于獲取所述語音內容中語音的類別；選取單元，用于根據所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器；第一發送單元，用于將所述語音內容向所選取的語音轉換服務器發送；第二接收單元，用于接收語音轉換服務器反饋的語音轉換結果；封裝單元，用于將所述語音轉換結果封裝為Web消息；第二發送單元，用于將封裝后的Web消息向所述互聯網側發送。8.根據權利要求7所述的語音轉換網關，其特征在于，所述語音轉換網關還包括:第三發送單元、第三接收單元、第二確定單元和第三確定單元，其中: 第三發送單元，用于向所述一個以上的語音轉換服務器發送狀態查詢消息；第三接收單元，用于接收語音轉換服務器的響應消息；第二確定單元，用于在所述第三接收單元在設定時長內接收到語音轉換服務器的響應消息時，確定語音轉換服務器正常運行；第三確定單元，用于在所述第三接收單元在設定時長內未接收到語音轉換服務器的響應消息或在設定時長內未接收到語音轉換服務器的響應消息超過設定次數時，確定語音轉換服務器非正常運行。9.根據權利要求8所述的語音轉換網關，其特征在于，所述選取單元，還用于根據語音轉換服務器的當前狀態及所述語音的類別在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。10.根據權利要求7所述的語音轉換網關，其特征在于，所述語音轉換網關還包括:第四確定單元，用于在所述第二接收單元未接收到語音轉換服務器反饋的語音轉換結果時，確定語音轉換網關故障，觸發所述選取單元根據所述語音的類別重新在所述一個以上的語音轉換服務器中選取能識別所述類別語音的語音轉換服務器。11.根據權利要求7至10任一項所述的語音轉換網關，其特征在于，所述語音轉換結果為字符信息。
【文檔編號】H04L29/08GK105827878SQ201510002321
【公開日】2016年8月3日
【申請日】2015年1月4日
【發明人】董文宇
【申請人】中國移動通信集團公司

完整全部詳細技術資料下載