基于語音交互的富媒體展示方法及系統的制作方法

文(wen)檔序號：10660824閱(yue)讀(du)：585來源(yuan)：國知(zhi)局

基于語音交互的富媒體展示方法及系統的制作方法
【專利摘要】本發明公開了一種基于語音交互的富媒體展示方法，包括：獲取用戶輸入的語音數據；對語音數據進行頻域變換處理，得到語音數據的頻譜特征，根據頻譜特征查找預設的用戶屬性列表，得到用戶的屬性；將語音數據進行語義識別，獲得語音數據的語義信息，根據語義信息查找并獲取與語義信息相關的富媒體信息；按照預設的與用戶屬性對應的展示規則進行富媒體信息的展示。本發明還公開了一種基于語音交互的富媒體展示系統。所述基于語音交互的富媒體展示方法及系統，通過對語音數據進行頻域變換處理，得到用戶屬性，使得能夠根據用戶屬性實現語音交互的差異化處理，使富媒體的展示更具有針對性。通過獲取語音相關的富媒體信息，提高語音交互的效率。
【專利說明】
基于語音交互的富媒體展示方法及系統
技術領域
[0001]本發明涉及語音處理及富媒體的展示技術領域，特別是指一種基于語音交互的富媒體展示方法及系統。【背景技術】
[0002]隨著信息技術的不斷發展，用戶交互技術得到了廣泛的應用。而語音交互作為繼鍵盤交互、鼠標交互及觸摸屏交互后的新一代用戶交互模式，以其方便快捷的特點，逐漸被廣大用戶認可且有被大規模推廣的潛在前景，而在這些相關的應用中，智慧語音業務及其相關功能相當具有吸引力。比如，智能移動終端上與語音相關的應用越來越多，而智能電視廠商也通過引用語音交互技術替換掉傳統的手持遙控器。現有技術中語音交互基于語音識別技術，也即，語音交互系統在接收到一段語音后，首先對語音數據進行內容識別，得到內容識別結果，并根據該內容識別結果獲知用戶意圖。之后，語音交互系統根據用戶意圖進行與該語音相對應的操作，或向終端用戶返回與該語音相對應的信息。
[0003]但是，現有的語音交互系統，一方面只能夠識別語音數據中包含語義的差別，不能夠實現對不同用戶的差異化處理，另一方面，現有的語音交互系統其交互顯示的效果非常單一，只有語音或者只有文字的交互，這對于那些想要獲取更多信息資源的用戶來說，功能和效果都不是特別理想。尤其針對于兒童的培養或教育方面，現有的交互系統無法滿足兒童用戶的使用需求。
【發明內容】

[0004]有鑒于此，本發明的目的在于提出一種基于語音交互的富媒體展示方法及系統，使富媒體的展示更具有針對性，提高語音交互展示的效果。
[0005]基于上述目的本發明提供的一種基于語音交互的富媒體展示方法，包括:
[0006]獲取用戶輸入的語音數據；
[0007]對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性；
[0008]將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息；
[0009]按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示。
[0010]優選的，所述獲得所述語音數據的語義信息的步驟之后還包括:
[0011]將所述語音數據轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面中。
[0012]優選的，所述對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征的步驟之前還包括:
[0013]根據所述語音數據判斷當前用戶是否為系統用戶，
[0014]若為系統用戶，則獲取與當前用戶對應的預設用戶信息;將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息;按照預設的與所述用戶信息對應的展示規則進行富媒體信息的展示；
[0015]若當前用戶不是系統用戶，則執行對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征的步驟。
[0016]優選的，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息展示的步驟包括:
[0017]按照富媒體信息中的展示規則進行富媒體文件的展示，其中，所述富媒體信息中包含富媒體文件信息和相應的展示規則信息，所述展示規則包括富媒體文件展示的順序和展示的方式。
[0018]優選的，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示的步驟之后還包括:
[0019]根據所述富媒體信息，播放預設的語音引導信息；
[0020]獲取用戶輸入的新的語音數據；[0021 ]根據所述新的語音數據，展示所述新的語音數據對應的富媒體信息。
[0022]優選的，所述根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息的步驟還包括:
[0023]根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征；[〇〇24]按照富媒體信息的屬性特征以及用戶的屬性，查找并判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息；[〇〇25]若是，則過濾掉所述富媒體信息。[〇〇26]本發明還提供了一種基于語音交互的富媒體展示系統，包括:
[0027]數據獲取模塊，用于獲取用戶輸入的語音數據;將獲得得到的語音數據發送給屬性查找模塊和信息獲取模塊；
[0028]屬性查找模塊，用于接收所述數據獲取模塊發送的語音數據，對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性;將得到的用戶屬性信息發送給信息展示模塊；[〇〇29]信息獲取模塊，用于接收所述數據獲取模塊發送的語音數據，將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息;將獲取的富媒體信息發送給信息展示模塊；
[0030]信息展示模塊，用于接收所述屬性查找模塊發送的用戶屬性信息以及所述信息獲取模塊發送的富媒體信息，按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示。[0031 ]優選的，所述系統還包括文字展示模塊；
[0032]所述數據獲取模塊還用于，將得到的語音數據發送給所述文字展示模塊；
[0033]所述文字展示模塊用于，接收所述數據獲取模塊發送的語音數據并將所述語音數據轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面中。[〇〇34]優選的，還包括:用戶判斷模塊，
[0035]所述數據獲取模塊還用于，將得到的語音數據發送給所述用戶判斷模塊；
[0036]所述用戶判斷模塊用于，接收所述數據獲取模塊發送的語音數據，根據所述語音數據判斷當前用戶是否為系統用戶，若為系統用戶，則獲取與當前用戶對應的預設用戶信息;將所述預設用戶信息發送給信息展示模塊;若當前用戶不是系統用戶，則將所述語音數據發送給屬性查找模塊；
[0037]所述信息展示模塊還用于，接收所述用戶判斷模塊發送的預設用戶信息，按照預設的與所述預設用戶信息對應的展示規則進行富媒體信息的展示。
[0038]優選的，所述信息展示模塊還用于，[〇〇39]按照富媒體信息中的展示規則進行富媒體文件的展示，其中，所述富媒體信息中包含富媒體文件信息和相應的展示規則信息，所述展示規則包括富媒體文件展示的順序和展示的方式。
[0040]優選的，還包括:引導模塊；[〇〇41]所述信息展示模塊還用于，根據所述富媒體信息向引導模塊發送引導指令；
[0042]所述引導模塊用于，接收信息展示模塊發送的引導指令，播放預設的語音引導信息；
[0043]所述數據獲取模塊還用于，獲取用戶輸入的新的語音數據;將所述新的語音數據發送給所述信息展示模塊；
[0044]所述信息展示模塊還用于，接收所述數據獲取模塊發送的新的語音數據，根據所述新的語音數據，展示所述新的語音數據對應的富媒體信息。
[0045]優選的，所述信息獲取模塊還用于，
[0046]根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征；
[0047]按照富媒體信息的屬性特征以及用戶的屬性，查找并判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息；[〇〇48]若是，則過濾掉所述富媒體信息。
[0049]從上面所述可以看出，本發明提供的基于語音交互的富媒體展示方法及系統，通過對語音數據進行頻域變換處理，并利用頻域變換處理得到的頻譜特征獲得用戶的屬性，進而能夠根據用戶的不同屬性，實現語音交互的差異化處理，使富媒體的展示更具有針對性。也即，能夠根據用戶的不同屬性，進而按照不同的展示規則進行富媒體的展示。同時，所述基于語音交互的富媒體展示方法及系統通過語義識別，能夠查找并獲取得到與語音數據相關的富媒體信息，進而提高了語音交互展示的信息數量和類型，使得語音交互展示的效率和效果大大提高。【附圖說明】
[0050]圖1為本發明提供的基于語音交互的富媒體展示方法的一個實施例的流程圖；
[0051]圖2為本發明提供的基于語音交互的富媒體展示方法的另一個實施例的流程圖； [〇〇52]圖3為本發明提供的基于語音交互的富媒體展示系統的一個實施例的流程圖； [〇〇53]圖4為本發明提供的基于語音交互的富媒體展示系統的另一個實施例的流程圖。【具體實施方式】
[0054]為使本發明的目的、技術方案和優點更加清楚明白，以下結合具體實施例，并參照附圖，對本發明進一步詳細說明。
[0055]需要說明的是，本發明實施例中所有使用“第一”和“第二”的表述均是為了區分兩個相同名稱非相同的實體或者非相同的參量，可見“第一” “第二”僅為了表述的方便，不應理解為對本發明實施例的限定，后續實施例對此不再一一說明。[〇〇56]參照圖1所示，為本發明提供的基于語音交互的富媒體展示方法的一個實施例的流程圖。所述基于語音交互的富媒體展示方法包括:[〇〇57]步驟101，獲取用戶輸入的語音數據；[〇〇58]其中，這里所述的語音數據是根據用戶的語音輸入產生的語音數據，語音輸入是指用戶在終端或相關設備的語音接收部位說出需要進行交互的語音指令，例如:用戶想要搜索蘋果，則需要說出“蘋果”的口語發音。此外，用戶還可以采用已經錄制好的語音數據作為用戶的語音輸入，例如:使用另一個播放設備將用戶預先錄制好的語音播放出來。終端或者交互系統將根據所述語音數據與用戶進行語音交互。
[0059]步驟102,對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性；
[0060]其中，所述頻域變換處理是指將獲得得到的語音數據進行頻域分析，得到語音的頻域信息，進而獲得語音數據的頻譜特性。所述用戶屬性列表是指預先設置的用于將不同的用戶屬性與頻譜特征相互對應的關系列表，通過得到的頻譜特征查找所述用戶屬性列表，就能夠確定所述語音數據對應的用戶屬性。所述用戶屬性包含用戶的年齡、性別、人種等屬性。當然，還可以根據頻譜特征獲取能夠區分用戶屬性的其他區別。
[0061]步驟103,將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息；
[0062]其中，所述將所述語音數據進行語義識別通常首先將所述語音數據進行語音識另IJ，然后根據語音識別的結果進行語義識別。所述語音識別是指確定所述語音數據中的文字內容，所述語義識別是指識別話語中的意境和含義。所述富媒體包括:文字、圖片、視頻、音頻等各類多媒體信息。
[0063]步驟104,按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示。 [〇〇64]其中，所述用戶屬性對應的展示規則是指每一類用戶均分別對應有一個展示規貝1J，所述展示規則包括展示界面的布局、富媒體展示的順序、富媒體展示的形式等等。
[0065]由上述實施例可知，所述基于語音交互的富媒體展示方法通過對用戶輸入的語音數據進行頻域變換處理，然后利用頻域變換處理得到的頻譜特征得到用戶的屬性，進而能夠根據用戶的不同屬性，實現語音交互的差異化處理，使富媒體的展示更具有針對性。也即，針對不同類型的用戶，交互系統或終端能夠實現不同的交互過程，使得能夠根據用戶的不同屬性，進而按照不同的展示規則進行富媒體的展示。同時，所述基于語音交互的富媒體展示方法通過語義識別，能夠查找并獲取得到與語音數據相關的富媒體信息，進而提高了語音交互展示的信息數量和類型，也即大大提高了語音交互展示的效率和效果。尤其針對于兒童領域或者是教育領域的語音交互，本發明所述的基于語音交互的富媒體展示方法使得用戶通過語音交互不僅能夠獲得更加豐富的信息資源，而且通過富媒體的交互展示，能夠大大提高用戶的體驗度，吸引用戶注意力的同時也能夠加深用戶的印象，提高培養和教育的效果。
[0066]作為本發明一些優選的實施例，所述獲得所述語音數據的語義信息的步驟之后還包括:將所述語音數據根據語義識別的結果轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面中。通過將語音數據轉換為文字信息，一方面，能夠使得用戶確認交互系統或終端所識別的語音是否正確，另一方面，也使得用戶對于交互結果的展示更為直觀。通常，將文字信息在界面中展示一定時間后需要隱藏，以避免給富媒體的展示帶來干擾。所述文字信息的展示方式既可以展示在界面最頂層，也可以將所述文字信息展示在界面的某一個角落中，例如界面的右下角，其顯示方式可以根據需要相應選定。這樣，不僅提高了語音交互中語音信息的準確性，而且針對于視力不好的用戶來說，能夠進一步確定自己輸入的語音是否準確，同時，也方便其他旁觀的用戶識別進行語音交互的用戶輸入的語音信息。
[0067]作為本發明另一個較佳的實施例，所述對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征的步驟之前還包括:
[0068]根據所述語音數據判斷當前用戶是否為系統用戶，
[0069]若為系統用戶，則獲取與當前用戶對應的預設用戶信息;將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息;按照預設的與所述用戶信息對應的展示規則進行富媒體信息的展示；
[0070]若當前用戶不是系統用戶，則執行對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征的步驟。
[0071]其中，所述系統用戶是指系統中預存的具有賬戶的用戶，還可以稱為會員用戶。例如，對于某一個手機終端來說，可以在手機上預先存儲手機擁有者的頻譜信息，并記錄該用戶的更多詳細信息，這里，手機擁有者即為系統用戶。這樣，通過判斷當前用戶是否為系統用戶能夠進一步區分系統用戶和非系統用戶。而且，通過預設用戶信息，能夠獲得更加詳細的系統用戶相關的信息，進而針對系統用戶實現更加準確的富媒體展示。
[0072]在一些優選的實施例中，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息展示的步驟包括:按照富媒體信息中的展示規則進行富媒體文件的展示，其中，所述富媒體信息中包含富媒體文件信息和相應的展示規則信息，所述展示規則包括富媒體文件展示的順序和展示的方式。所述富媒體內容包括:視頻、音頻、文字、動畫，甚至一些可以執行的應用程序。當然，富媒體的內容并不限于上述列舉的內容，可以按照需要相應的添加，此處不再復述。所述展示規則或展示規則的體現包含但不限于如下方式:播放視頻，播放音頻，音頻視頻順序播放，圖片展示，背景展示音頻，動畫，或者類似的互媒體展示的其他規則或方式，應用的展示方式等等。例如:多張圖片既可以依次滑動展示，也可以像在PPT中一樣展示。所述富媒體可以包括展示規則，也可以不包含展示規則，當不包括展示規則時，可以在系統中默認設置默認規則，將默認規則作為展示規則。這樣，能夠針對富媒體實現不同規則的展示，提高了富媒體展示的多樣性。而且，通過將展示規則添加到富媒體信息中，使得能夠在系統中針對每一種搜索類型設定相應的展示規則，進而實現更加豐富的展示方式。
[0073]進一步，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示的步驟之后還包括:
[0074]根據所述富媒體信息，播放預設的語音引導信息；[〇〇75]獲取用戶輸入的新的語音數據；
[0076]根據所述新的語音數據，展示所述新的語音數據對應的富媒體信息。
[0077]這樣，用戶能夠根據所述引導信息進一步引導用戶再次選擇后續相應的富媒體，然后展示用戶后續選擇的富媒體文件，使得交互的展示過程更加靈活，提高用戶的體驗度。
[0078]作為本發明另一個較佳的實施例，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息展示的步驟104包括:根據用戶屬性，查找預設的用戶屬性與展示規則的對應關系列表，得到當前用戶的展示規則，所述展示規則包含富媒體信息的排序;將所述富媒體信息按照所述展示規則中的順序自動播放展示。其中，所述將所述富媒體信息按照所述展示規則中的順序自動播放展示是指將富媒體按照展示規則中的順序分別播放或者展示出來。這里，針對于音頻和視頻信息來說，所述播放是指直接播放音頻或視頻文件;對于文字或者圖片信息來說，所述播放是指采用雷士幻燈片的方式進行播放，當然，也可以采用其他的播放形式進行播放。這樣，使得用戶根據語音數據獲得的所有富媒體能夠自動向用戶展示出來，而且展示的順序是基于用戶自身屬性所對應的展示規則，不僅提高了用戶交互的體驗度，而且增強了富媒體信息進行展示的效果，進而提高了語音交互的效率。
[0079]作為本發明進一步的實施例，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示的步驟還包括:判斷當前展示的富媒體信息是否為語音或視頻信息；若當前展示的富媒體信息為語音或視頻信息，則不執行任何操作;若當前展示的富媒體信息不是語音或視頻信息，則獲取與所述富媒體信息綁定的語音信息，并將所述語音信息與富媒體信息同時展示。針對于不是語音或視頻信息的信息文件，需要預先設定一個綁定的語音信息，這樣，在進行圖片或者文字等信息展示時，也能夠達到語音展示的效果，例如:展示的是關于平板電腦的圖片，那么，針對于每一個電腦圖片都將有一個大致的語音信息進行介紹，例如:品牌平板”。當然，所述語音信息還可以是交互系統或終端根據富媒體信息解析獲得的語音信息，例如:富媒體為文字信息，那么交互系統在后臺可以將這些文字信息轉化為語音信息，并與這些文字信息進行綁定。這樣，不僅增強了語音交互的多樣性，而且進一步提高了用戶的體驗度。
[0080]在一些可選的實施例中，所述根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息的步驟103還包括:根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征;按照富媒體信息的屬性特征以及用戶的屬性，查找并判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息;若是，則過濾所述富媒體信息。其中，所述屬性特征一般指富媒體信息的類型，例如:某一個視頻文件可以分為文藝、色情、暴力、兇殺、冒險、科幻等等類型，某一個圖片可以分為血腥、清新、惡心等等類型。針對不同的用戶屬性，預先分別設定了一個屏蔽信息的列表。例如:對于兒童來說，屏蔽信息為:游戲、暴力、兇殺、色情等不適宜的信息，而對于成年人來說，屏蔽信息為:某些特定的宗教、犯罪等等信息。還可以根據需要，針對不同性別的人群設定不同的屏蔽信息列表。這樣，有利于進一步提高語音交互的效率，避免一些錯誤或者不適宜信息的展示，對于教育領域，通過屏蔽信息能夠將許多分散兒童注意力的信息屏蔽掉，使得兒童的語音交互過程更為健康、有效。
[0081]參照圖2所示，為本發明提供的基于語音交互的富媒體展示方法的另一個實施例的流程圖。所示基于語音交互的富媒體展示方法包括:[〇〇82]步驟201，獲取用戶輸入的語音數據；[〇〇83]步驟202,判斷當前用戶是否為系統用戶，若是，則執行步驟204,否則，執行步驟 203；
[0084]步驟203,對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性
[0085]步驟204,獲取與當前用戶對應的預設用戶信息；
[0086]步驟205,將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息；[〇〇87]步驟206,將所述語音數據轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面的最頂層；[〇〇88]步驟207，根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征；
[0089]步驟208,判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息;若是，則執行步驟210，否則執行步驟209;
[0090]步驟209,根據步驟208,所述富媒體不屬于該用戶屬性下預設的屏蔽信息，則保留所示富媒體信息；
[0091]步驟210,根據步驟208,所述富媒體屬于該用戶屬性下預設的屏蔽信息，則過濾掉所述富媒體信息，也即提出這一類富媒體信息；
[0092]步驟211，將所述富媒體信息按照所述展示規則中的順序自動播放展示。
[0093]由上述實施例可知，所述基于語音交互的富媒體展示方法通過將語音信息轉化為文字信息并顯示，提高了語音交互的準確性，通過獲取富媒體信息的特征信息能夠針對相應的用戶屬性排除預設的屏蔽信息，使得所有富媒體的展示過程更加穩定和可靠，提高了語音交互的展示效果。因此，本發明所述的基于語音交互的富媒體展示方法不僅提高了語音交互的準確性，而且提高了交互的效果，給用戶帶來更好的交互體驗。[〇〇94]參照圖3所示，為本發明提供的基于語音交互的富媒體展示系統的一個實施例的流程圖。所述基于語音交互的富媒體展示系統，包括:
[0095]數據獲取模塊301，用于獲取用戶輸入的語音數據;將獲得得到的語音數據發送給屬性查找模塊302和信息獲取模塊303;[〇〇96]屬性查找模塊302,用于接收所述數據獲取模塊301發送的語音數據，對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性;將得到的用戶屬性信息發送給信息展示模塊304;[〇〇97]信息獲取模塊303,用于接收所述數據獲取模塊301發送的語音數據，將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息;將獲取的富媒體信息發送給信息展示模塊304;[〇〇98]信息展示模塊304,用于接收所述屬性查找模塊302發送的用戶屬性信息以及所述信息獲取模塊303發送的富媒體信息，按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示。
[0099]由上述實施例可知，所述基于語音交互的富媒體展示系統通過所述數據獲取模塊 301獲取用戶輸入的語音數據，通過所述屬性查找模塊302確定用戶的屬性，通過所述信息獲取模塊303得到語音數據對應的富媒體信息，最后通過所述信息展示模塊304將富媒體信息按照預設的展示規則進行展示。這樣，不僅使得交互系統能夠根據用戶的不同屬性進行差異化的交互處理，而且大大提高了用戶進行語音交互的效率和效果。
[0100]在本發明一些優選的實施例中，參照圖4所示，所述基于語音交互的富媒體展示系統還包括文字展示模塊305;所述數據獲取模塊301還用于，將得到的語音數據發送給所述文字展示模塊305;所述文字展示模塊305用于，接收所述數據獲取模塊發送的語音數據并將所述語音數據轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面中。
[0101]在本發明另一些優選的實施例中，還包括:用戶判斷模塊306，[〇1〇2]所述數據獲取模塊301還用于，將得到的語音數據發送給所述用戶判斷模塊306; [〇1〇3]所述用戶判斷模塊306用于，接收所述數據獲取模塊301發送的語音數據，根據所述語音數據判斷當前用戶是否為系統用戶，若為系統用戶，則獲取與當前用戶對應的預設用戶信息；將所述預設用戶信息發送給信息展示模塊304;若當前用戶不是系統用戶，則將所述語音數據發送給屬性查找模塊302;[〇1〇4]所述信息展示模塊304還用于，接收所述用戶判斷模塊306發送的預設用戶信息，按照預設的與所述預設用戶信息對應的展示規則進行富媒體信息的展示。
[0105]在本發明進一步的實施例中，所述信息展示模塊304還用于，按照富媒體信息中的展示規則進行富媒體文件的展示，其中，所述富媒體信息中包含富媒體文件信息和相應的展示規則信息，所述展示規則包括富媒體文件展示的順序和展示的方式。
[0106]在本發明可選的實施例中，還包括:引導模塊307;[〇1〇7]所述信息展示模塊304還用于，根據所述富媒體信息向引導模塊307發送引導指令；[〇1〇8]所述引導模塊307用于，接收信息展示模塊304發送的引導指令，播放預設的語音引導信息；
[0109]所述數據獲取模塊301還用于，獲取用戶輸入的新的語音數據;將所述新的語音數據發送給所述信息展示模塊304;
[0110]所述信息展示模塊304還用于，接收所述數據獲取模塊301發送的新的語音數據，根據所述新的語音數據，展示所述新的語音數據對應的富媒體信息。
[0111]作為本發明一個較佳的實施例，所述信息獲取模塊303還用于，根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征;按照富媒體信息的屬性特征以及用戶的屬性，查找并判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息;若是，則過濾掉所述富媒體信息。
[0112]參照圖4所示，為本發明提供的基于語音交互的富媒體展示系統的另一個實施例的流程圖。所述基于語音交互的富媒體展示系統包括:數據獲取模塊301、屬性查找模塊 302、信息獲取模塊303、信息展示模塊304、文字展示模塊305、用戶判斷模塊306和引導模塊 307〇
[0113]所屬領域的普通技術人員應當理解:以上任何實施例的討論僅為示例性的，并非旨在暗示本公開的范圍(包括權利要求)被限于這些例子;在本發明的思路下，以上實施例或者不同實施例中的技術特征之間也可以進行組合，步驟可以以任意順序實現，并存在如上所述的本發明的不同方面的許多其它變化，為了簡明它們沒有在細節中提供。[〇114]另外，為簡化說明和討論，并且為了不會使本發明難以理解，在所提供的附圖中可以示出或可以不示出與集成電路(1C)芯片和其它部件的公知的電源/接地連接。此外，可以以框圖的形式示出裝置，以便避免使本發明難以理解，并且這也考慮了以下事實，即關于這些框圖裝置的實施方式的細節是高度取決于將要實施本發明的平臺的(即，這些細節應當完全處于本領域技術人員的理解范圍內)。在闡述了具體細節(例如，電路)以描述本發明的示例性實施例的情況下，對本領域技術人員來說顯而易見的是，可以在沒有這些具體細節的情況下或者這些具體細節有變化的情況下實施本發明。因此，這些描述應被認為是說明性的而不是限制性的。
[0115]盡管已經結合了本發明的具體實施例對本發明進行了描述，但是根據前面的描述，這些實施例的很多替換、修改和變型對本領域普通技術人員來說將是顯而易見的。例如，其它存儲器架構(例如，動態RAM(DRAM))可以使用所討論的實施例。
[0116]本發明的實施例旨在涵蓋落入所附權利要求的寬泛范圍之內的所有這樣的替換、修改和變型。因此，凡在本發明的精神和原則之內，所做的任何省略、修改、等同替換、改進等，均應包含在本發明的保護范圍之內。
【主權項】
1.一種基于語音交互的富媒體展示方法，其特征在于，包括:獲取用戶輸入的語音數據；對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性；將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息；按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示。2.根據權利要求1所述的方法，其特征在于，所述獲得所述語音數據的語義信息的步驟之后還包括:將所述語音數據轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面中。3.根據權利要求1所述的方法，其特征在于，所述對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征的步驟之前還包括:根據所述語音數據判斷當前用戶是否為系統用戶，若為系統用戶，則獲取與當前用戶對應的預設用戶信息；將所述語音數據進行語義識另IJ，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息;按照預設的與所述用戶信息對應的展示規則進行富媒體信息的展示；若當前用戶不是系統用戶，則執行對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征的步驟。4.根據權利要求1所述的方法，其特征在于，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息展示的步驟包括:按照富媒體信息中的展示規則進行富媒體文件的展示，其中，所述富媒體信息中包含富媒體文件信息和相應的展示規則信息，所述展示規則包括富媒體文件展示的順序和展示的方式。5.根據權利要求1所述的方法，其特征在于，所述按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展示的步驟之后還包括:根據所述富媒體信息，播放預設的語音引導信息；獲取用戶輸入的新的語音數據；根據所述新的語音數據，展示所述新的語音數據對應的富媒體信息。6.根據權利要求1所述的方法，其特征在于，所述根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息的步驟還包括:根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征；按照富媒體信息的屬性特征以及用戶的屬性，查找并判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息；若是，則過濾掉所述富媒體信息。7.—種基于語音交互的富媒體展示系統，其特征在于，包括:數據獲取模塊，用于獲取用戶輸入的語音數據;將獲得得到的語音數據發送給屬性查找模塊和信息獲取模塊；屬性查找模塊，用于接收所述數據獲取模塊發送的語音數據，對所述語音數據進行頻域變換處理，得到所述語音數據的頻譜特征，根據所述頻譜特征查找預設的用戶屬性列表，得到用戶的屬性;將得到的用戶屬性信息發送給信息展示模塊；信息獲取模塊，用于接收所述數據獲取模塊發送的語音數據，將所述語音數據進行語義識別，獲得所述語音數據的語義信息，根據所述語義信息查找并獲取與所述語義信息相關的富媒體信息;將獲取的富媒體信息發送給信息展示模塊；信息展示模塊，用于接收所述屬性查找模塊發送的用戶屬性信息以及所述信息獲取模塊發送的富媒體信息，按照預設的與所述用戶屬性對應的展示規則進行富媒體信息的展不。8.根據權利要求7所述的系統，其特征在于，所述系統還包括文字展示模塊；所述數據獲取模塊還用于，將得到的語音數據發送給所述文字展示模塊；所述文字展示模塊用于，接收所述數據獲取模塊發送的語音數據并將所述語音數據轉換為文字信息，在預設的時間內，將所述文字信息顯示于界面中。9.根據權利要求7所述的系統，其特征在于，還包括:用戶判斷模塊，所述數據獲取模塊還用于，將得到的語音數據發送給所述用戶判斷模塊；所述用戶判斷模塊用于，接收所述數據獲取模塊發送的語音數據，根據所述語音數據判斷當前用戶是否為系統用戶，若為系統用戶，則獲取與當前用戶對應的預設用戶信息;將所述預設用戶信息發送給信息展示模塊;若當前用戶不是系統用戶，則將所述語音數據發送給屬性查找模塊；所述信息展示模塊還用于，接收所述用戶判斷模塊發送的預設用戶信息，按照預設的與所述預設用戶信息對應的展示規則進行富媒體信息的展示。10.根據權利要求7所述的系統，其特征在于，所述信息展示模塊還用于，按照富媒體信息中的展示規則進行富媒體文件的展示，其中，所述富媒體信息中包含富媒體文件信息和相應的展示規則信息，所述展示規則包括富媒體文件展示的順序和展示的方式。11.根據權利要求7所述的系統，其特征在于，還包括:引導模塊；所述信息展示模塊還用于，根據所述富媒體信息向引導模塊發送引導指令；所述引導模塊用于，接收信息展示模塊發送的引導指令，播放預設的語音引導信息；所述數據獲取模塊還用于，獲取用戶輸入的新的語音數據;將所述新的語音數據發送給所述信息展示模塊；所述信息展示模塊還用于，接收所述數據獲取模塊發送的新的語音數據，根據所述新的語音數據，展示所述新的語音數據對應的富媒體信息。12.根據權利要求7所述的系統，其特征在于，所述信息獲取模塊還用于，根據查找得到的富媒體信息，獲取所述富媒體信息的屬性特征；按照富媒體信息的屬性特征以及用戶的屬性，查找并判斷所述富媒體是否屬于該用戶屬性下預設的屏蔽信息；若是，則過濾掉所述富媒體信息。
【文檔編號】G10L15/30GK106027485SQ201610279818
【公開日】2016年10月12日
【申請日】2016年4月28日
【發明人】吳建國, 張珩, 沈韡, 劉超華
【申請人】樂視控股（北京）有限公司, 樂意互聯智能科技（北京）有限公司

完整全部(bu)詳細技術(shu)資料(liao)下載

該技術(shu)已(yi)申請專利(li)。僅供(gong)學習研究(jiu)，如(ru)用于商業用途，請聯系技術(shu)所有人(ren)。
技術研發人(ren)員(yuan)：吳建國;張珩;沈韡;劉超華;
技(ji)術所有(you)(you)(you)人：樂(le)視控股(gu)（北(bei)京(jing)）有(you)(you)(you)限公司(si);樂(le)意互聯智能(neng)科技(ji)（北(bei)京(jing)）有(you)(you)(you)限公司(si);
我是此專利的發明人