中文字幕无码日韩视频无码三区

網頁語音接口的操作方法

文檔序號:6395033閱讀:270來源:國知局
專利名稱:網頁語音接口的操作方法
技術領域
本發明涉及一種操作方法,尤其是關于一種網頁語音接口的操作方法。
背景技術
在傳統的操作系統MS-DOS文字模式下,屏幕上顯示的是單調的文字接口,使用者必須通過鍵盤輸入指令,才能操作計算機。因此DOS時代所謂的學計算機常常和背指令劃上等號,這是許多人的刻板印象,也是許多學計算機人的痛苦回憶,直到圖形使用者接口系統的出現才改變了這樣的情況。
所謂的圖形使用者接口為Graphical User Interface,可縮寫為GUI。其中GUI的系統很多,有熟知的微軟Windows操作系統、蘋果計算機的MacOS、UNIX底下的X Window System等PC GUI系統,Embedded領域里頭也有不少的GUI系統如QNX Photon microGUI等等。
圖形使用者接口是目前最主要的計算機系統與程序采用的接口,其操作環境以圖形及窗口方式顯示,使用者只要用鼠標進行操作,就可以看圖標找到需要的指令來進行操作,其親和性的設計可說是操作系統設計上的一大突破。
隨著計算機的普及,采用語音與計算機進行交互操作是未來人機接口設計的一個發展方向,這里的語音技術包括兩項內容語音識別(speechrecognition,SR)與語音合成(speech synthesis,SS)。因為這兩項技術很復雜,需要相關的語音引擎(speech engine)來支持,而許多軟件廠商都出品過自己的語音合成或語音識別引擎,但是這些引擎之間并不兼容,如果一個軟件要使用語音功能,開發者必須得從眾多的語音引擎中挑選一個來使用,如果將來想要換一個語音引擎,就必須為新引擎重新改寫程序,為了解決這個問題,微軟公司推出了一組新的應用程序開發接口(API)。然而,應用程序開發接口只提供了一系列接口,它本身并不能做任何事情,以此應用程序開發接口編寫的程序還需要語音引擎的支持才能運行。于是微軟在此基礎上推出語音軟件開發工具(Speech SDK)這個開發工具,幫助軟件開發者開發語音軟件,并在此工具中提供了一系列語音引擎(包括SR和SS),使得軟件開發人員輕而易舉地就能使自己的程序能說又能聽。
雖然,微軟的語音軟件開發工具提供ASP.NET的平臺,程序開發人員可使用ASP.NET+HTML來開發網頁語音應用(Web Speech Application),但是現行的語音應用并無法以內容為導向的方式來操作網頁。
因此,如何開發一種可改善上述已知技術缺陷,且能提供以內容導向的方式來操作網頁的語音接口的操作方法,實為目前迫切需要解決的問題。

發明內容
本發明的主要目的在于提供一種網頁語音接口的操作方法,以解決傳統的語音應用無法以內容為導向的方式來操作網頁等缺陷。
為實現上述目的,本發明提供一種網頁語音接口的操作方法,適用于一圖形使用者接口系統,用以借助一語音命令來操控一網頁,其中該網頁根據多個內容事件的選擇而運作,該方法包含下列步驟接收該網頁的多個內容事件的注冊,因應這些內容事件的數據而各別產生一相對應的對照信號,并儲存于一對照表數據庫中;接收該語音命令,將該語音命令轉換成與該對照信號相同形式的信號,將轉換所得的信號于該對照表數據庫中比對出相對應的內容事件;以及選擇該內容事件顯示于該網頁上或是執行該內容事件的指令。
根據上述的操作方法,其中該網頁為一超文本標記語言(HypertextMarkup Language,HTML)網頁。
根據上述的操作方法,其中該語音命令借助一語音引擎(speech engine)所接收。
根據上述的操作方法,其中該網頁語音接口的操作方法利用一語音軟件開發工具(Speech SDK)所開發。
根據上述的操作方法,其中這些內容事件的數據包含一使用者接口識別碼(user interface id)、事件形式(event type)和/或事件內容名稱。
根據上述的操作方法,其中該圖形使用者接口系統為一訂單系統,用以借助該語音命令來操控該網頁。
根據上述的操作方法,其中該圖形使用者接口系統為一操作系統。
根據上述的操作方法,其中該圖形使用者接口系統為一窗口(Windows)操作系統。
根據上述的操作方法,其中該圖形使用者接口系統為一Mac OS操作系統或是UNIX操作系統的X窗口系統(X Window System)。
本發明結合下列圖示與實施例說明,使得更深入的了解


圖1為本發明較佳實施例的網頁語音接口的操作方法的流程圖。
圖2為使用本發明較佳實施例的網頁語音接口的操作方法的結構示意圖。
圖3為使用本發明較佳實施例的網頁語音接口的操作方法的HTML網頁示意圖。
其中,附圖標記說明如下S11~S13網頁語音接口的操作方法的軟件流程步驟20網頁語音接口的操作軟件21HTML網頁22語音引擎30HTML網頁具體實施方式
本發明為一種網頁語音接口的操作方法,適用于一圖形使用者接口系統,其使用微軟公司的語音軟件開發工具(Speech SDK)所開發的網頁語音應用(Web Speech Application)軟件,用以借助一語音引擎(speech engine)所接收的語音命令來操控網頁的多個內容事件的選擇,其中該網頁以一超文本標記語言(Hypertext Markup Language,HTML)網頁為佳,且HTML網頁根據多個內容事件的選擇而運作。
請參閱圖1,其為本發明較佳實施例的網頁語音接口的操作方法的流程圖。首先,接收HTML網頁的多個內容事件的注冊,根據這些內容事件的數據而各別產生相對應的對照信號,并儲存于一對照表數據庫中(步驟S11)。至于,這些內容事件的數據為該內容事件所屬的使用者接口識別碼(userinterface id)、事件形式(event type)及/或事件內容名稱等。
接著,接收由語音引擎(speech engine)所接收的語音命令,將該語音命令轉換成與這些內容事件所產生的對照信號相同形式的信號,并根據語音命令轉換所得的信號于該對照表數據庫中搜尋并比對出與該語音命令相對應的內容事件(步驟S12)。
最后,根據該語音命令所比對的結果,選擇相對應的內容事件顯示于HTML網頁上或是執行內容事件的指令(步驟S13)。
當然,本發明的網頁語音接口的操作方法所適用的圖形使用者接口系統可為一訂單系統或是一操作系統,但不限定于此。且該操作系統為微軟的窗口(Windows)操作系統、蘋果計算機的Mac OS操作系統或是UNIX操作系統的X窗口系統(X Window System),但不限定于此。
本發明的網頁語音接口的操作方法可以安裝軟件的形式執行于圖形使用者接口系統的系統目錄下,因此以網頁語音接口的操作軟件來代表本發明網頁語音接口的操作方法的結構,用以描述本發明網頁語音接口的操作方法與其它結構之間的運作方式。請參閱圖2,其為使用本發明較佳實施例的網頁語音接口的操作方法的結構示意圖。如圖2所示,網頁語音接口的操作軟件20與HTML網頁21及語音引擎22連接,HTML網頁21所包含的所有內容事件必須對網頁語音接口的操作軟件20進行注冊,并于注冊完成后將內容事件所各別對應的對照信號儲存于對照表數據庫中(未圖標)。當使用者所發出的語音命令借助語音引擎22被接收時,網頁語音接口的操作軟件20必須對語音命令進行信號轉換后,與存放于對照表數據庫中的對照信號進行比對,進而判斷出與語音命令對應的內容事件,最后操控該內容事件顯示于HTML網頁上或是執行內容事件的指令。
圖3為使用本發明較佳實施例的網頁語音接口的操作方法的HTML網頁示意圖。在此實施例中,網頁語音接口的操作方法適用于一訂單系統。如圖3所示,該HTML網頁30包含“產品類別”、“演出地點”、“演出年度”、“演出月份”等標的,其中產品類別的內容事件為音樂及戲劇等,演出地點的內容事件為地點1、地點2...地點N等。因此,在此HTML網頁30初始化時,網頁中所有的內容事件需對圖2所示的網頁語音接口的操作軟件20進行注冊,進而讓使用者可借助語音命令來操控網頁的顯示。
請再參閱圖3,以下將舉例描述使用者所發出的語音命令如何造成HTML網頁30圖形接口的反應1、使用者語音命令地點2音樂;網頁的圖形接口反應節目類別→音樂;演出地點→地點2。
2、使用者語音命令2003年5月;網頁的圖形接口反應演出年度→2003年;演出月份→5月。
3、使用者語音命令地點2情境夜上海;網頁的圖形接口反應演出地點→地點2;產品名稱→情境夜上海。
4、使用者語音命令開始查詢→如同按下“開使查詢”按鈕。
由于網頁中使用的圖形使用者接口(GUI)一般包括文字輸入盒(TextBox)及選項(Radio button,Check Box,ComboBox)等,同時存在于一復雜網頁,因此使用本發明的網頁語音接口的操作方法能夠輔助圖形操作接口,再加上直接以內容來控制網頁的圖形操作接口,使用者可直接說出任何出現在圖形使用者接口中的文字,當系統辨識后會直接操作適當的使用者接口(UI)組件,使其正確反應出使用者的意圖。
而且,對網頁設計者而言,只需在網頁初使化時,增加一小段程序代碼,例如Java Script or VB Script,使用本發明的網頁語音接口的操作方法即可使該網頁成為能夠以語音內容為導向的網頁(Content-oriented Speech EnabledPage)。
另外,由于使用者欲使用網頁語音接口來操控網頁時,需要按壓一熱鍵或是網頁中的一個按鈕才能觸發語音引擎來接收語音命令。反之,如未按壓熱鍵或是網頁中的按鈕時,圖形操作接口仍然可正常使用,故使用者可以任何的順序交互使用圖形接口及網頁語音接口。
縱上所述,本發明的網頁語音接口的操作方法具有下述優點1、提供使用者以內容導向的方式來操作網頁。
2、提供使用者以語音操作接口來輔助圖形操作接口。對使用者而言,圖形操作接口仍然可正常使用,故使用者可以任何的順序交互使用圖形接口及網頁語音接口。
3、對網頁設計者而言,僅需作些微小修改即可。
權利要求
1.一種網頁語音接口的操作方法,適用于一圖形使用者接口系統,用以借助一語音命令來操控一網頁,其中該網頁根據多個內容事件的選擇而運作,該方法包含下列步驟接收該網頁的多個內容事件的注冊,因應這些內容事件的數據而各別產生一相對應的對照信號,并儲存于一對照表數據庫中;接收該語音命令,將該語音命令轉換成與該對照信號相同形式的信號,將轉換所得的信號于該對照表數據庫中比對出相對應的內容事件;以及選擇該內容事件顯示于該網頁上或是執行該內容事件的指令。
2.如權利要求1所述的網頁語音接口的操作方法,其特征在于該網頁為一超文本標記語言網頁。
3.如權利要求1所述的網頁語音接口的操作方法,其特征在于該語音命令借助一語音引擎所接收。
4.如權利要求1所述的網頁語音接口的操作方法,其特征在于該網頁語音接口的操作方法利用一語音軟件開發工具所開發。
5.如權利要求1所述的網頁語音接口的操作方法,其特征在于這些內容事件的數據包含一使用者接口識別碼、事件形式和/或事件內容名稱。
6.如權利要求1所述的網頁語音接口的操作方法,其特征在于該圖形使用者接口系統為一訂單系統,用以借助該語音命令來操控該網頁。
7.如權利要求1所述的網頁語音接口的操作方法,其特征在于該圖形使用者接口系統為一操作系統。
8.如權利要求7所述的網頁語音接口的操作方法,其特征在于該圖形使用者接口系統為一窗口操作系統。
9.如權利要求7所述的網頁語音接口的操作方法,其特征在于該圖形使用者接口系統為一Mac OS操作系統或是UNIX操作系統的X窗口系統。
全文摘要
本發明公開了一種網頁語音接口的操作方法,適用于一圖形使用者接口系統,用以借助一語音命令來操控一網頁,其中該網頁根據多個內容事件的選擇而運作,該方法包含下列步驟接收該網頁的多個內容事件的注冊,因應這些內容事件的數據而別產生一相對應的對照信號,并儲存于一對照表數據庫中;接收該語音命令,將該語音命令轉換成與該對照信號相同形式的信號,將轉換所得的信號于該對照表數據庫中比對出相對應的內容事件;以及選擇該內容事件顯示于該網頁上或是執行該內容事件的指令。
文檔編號G06F3/00GK1564123SQ20041003131
公開日2005年1月12日 申請日期2004年3月26日 優先權日2004年3月26日
發明者王文良 申請人:宏碁股份有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1