中文字幕无码日韩视频无码三区

用于端到端體驗質量測量的音頻指紋差的制作方法

文檔序號:2824955閱讀:238來源:國知局
專利名稱:用于端到端體驗質量測量的音頻指紋差的制作方法
用于端到端體驗質量測量的音頻指紋差
背景技術
除非在本文中另外指出,否則此部分所描述的方法不是針對本申請的權利要求的現有技術,并且也不通過被包括在此部分中而被認為是現有技術。最初發展并且增強了服務質量(QoS)度量以用于交換陸地線電話。這些QoS度量被很好地描述并且形成了提供商提供服務時的重要工具。最近IP語音(VoIP)電話服務的急劇增加極大地改變了陸地線電話,并且近期的3G/4G的發展使得能夠在移動環境下使用電話的用于VoIP的因特網連接。不幸的是,這些VoIP應用中的大多數應用都不包含遺留陸地線系統的內置端到端QoS監控機制,并且也缺乏開發了前一代陸地線系統標準的工業協會和團體。因此,用戶和/或提供方可能難以在移動設備上測量針對VoIP呼叫的QoS和整體體驗質量(QoE)。水印是可以用于監控數據退化的常用技術。通常,水印被添加到數據流,可以根據隨著數據信號在網絡上傳輸時在水印中所觀察到的變化來推斷數據退化。然而,水印要求改變數據信號,并且只能提供數據退化的間接評估。音頻或聲學指紋技術可以在不要求改變數據信號的情況下,用于描繪和/或保護音頻內容。音頻指紋可以提供精簡的數字摘要,直接由音頻信號確定性地生成并可通常用于識別音頻樣本或者在音頻數據庫中迅速定位類似的項目。

發明內容
根據一些實現方式,用于確定移動體驗質量的方法可以通常包括接收根據數字音頻信號產生的音頻指紋。從而,接著可以至少部分地基于音頻指紋和在數字音頻信號接收方根據數字音頻信號產生的另一個音頻指紋的比較來確定體驗質量(QoE)度量值。根據一些實現方式,還一般性地描述了包括計算機程序產品的制品,其中該產品存儲有指令,如果執行這些指令,則可以通過接收根據數字音頻信號產生的音頻指紋,并且至少部分地基于所述音頻指紋和在數字音頻信號接收方根據數字音頻信號產生的另一個音頻指紋的比較來確定體驗質量(QoE)度量值,從而確定移動體驗質量。根據一些實現方式,一般性地描述了一種系統,該系統可以包括:被配置為接收根據數字音頻信號產生的音頻指紋的一個或更多個模塊。所述一個或更多個模塊接著可以被配置為至少部分地基于所述音頻指紋和根據數字音頻信號產生的另一個音頻指紋的比較來確定體驗質量(QoE)度量值,其中,所述另一個音頻指紋是在數字音頻信號接收方產生的。以上概述僅是例示性的,并不旨在以任何方式進行限制。除了以上描述的示例性方面、實施方式和特征以外,其它的方面、實施方式和特征將通過參照附圖和以下具體描述
變得明顯。


在說 明書的結論部分具體指出并明確要求保護本公開的主題。結合附圖并根據以下描述和所附權利要求書,本公開的前述特征和其它特征將變得更加充分明顯。理解到這些附圖僅描繪了根據本公開的幾種實施方式,因此,不將這些附圖認為限制了本公開的范圍,將利用附加的特征和細節通過使用附圖來描述本公開。在附圖中:圖1是示例系統的示意圖;圖2是示例過程的例示圖;圖3是另一個不例系統的不意圖;圖4是另Iv不例系統的不意圖;圖5是不例計算機程序廣品的例不圖;并且圖6是根據全部本公開的至少一些實施方式進行設置的示例計算裝置的例示圖。
具體實施例方式以下描述連同具體細節闡述了各種示例,以提供對所要求保護的主題的徹底理解。然而,本領域技術人員應理解的是,可以實踐所要保護的主題而無需本文所公開的一些或更多的特定細節。此外,在一些情況下,沒有詳細地描述熟知的方法、過程、系統、組件和/或電路,以免不必要地掩蓋所要求保護的主題。在以下詳細描述中,參照構成本發明一部分的附圖。在附圖中,除非上下文另外規定,否則相同的符號通常標識相同的組件。在具體實施方式
、附圖和權利要求書中所描述的示例性實施方式不是意在進行限制。在不脫離本文所展示的主題的精神或范圍的情況下,可以利用其它實施方式,并且可以進行其它修改。容易理解的是,如本文總 體描述并在附圖中例示的本公開的實施方式可以被設置、替代、組合并設計為多種不同的配置,這些都是明確地預期的并成為本公開的一部分。本公開尤其涉及與在移動通信系統中采用音頻指紋來提供服務質量(QoS)度量相關的方法、裝置和系統。根據本公開的各個實現方式,可以在源通信設備和目的地通信設備兩者處生成音頻指紋,進而可以生成音頻指紋之間的差。這種音頻指紋之間的發散度可以提供對偏離最優服務水平的測量,進而可以提供關于編解碼、壓縮和/或信道問題的一個或更多個可量化的QoE/QoS度量(在下文中稱為“QoE”度量)。在一些示例中,可以通過對音頻輸出采樣來生成音頻指紋,以便于入耳的QoE測量。在一些示例中,可以在包括諸如服務器這樣的中間網絡節點的通信網絡的各個位置生成音頻指紋。此外,在各個示例中,可以在特定通信事件發生期間和/或之后生成音頻指紋。根據本公開的各個實現方式,可以當捕獲用戶的語音以便發送時,在移動設備的送受話器處計算或者生成發端指紋或者“源”指紋。發指紋可以與音頻信號一起使用例如因特網協議語音(VoIP)技術而被發送到接收送受話器。在一些示例中,源指紋可以與對應的音頻信號分開提供。在各個實現方式中,可以在接收送受話器生成接收到的音頻信號的音頻指紋或“接收”指紋。在一些示例中,可以在將接收到的音頻信號從數字信號形式轉換成模擬信號形式之前計算接收指紋。接著,可以把源指紋與接收指紋比較,并且兩個指紋之間的任何差異可以提供諸如傳輸媒介質量、編碼效果等的一個或更多個特征的QoE測量。根據本公開的各個實現方式,可以使用包括一個或更多個集成麥克風的移動設備從接收設備的揚聲器捕獲音頻信號。在這些實現方式中,可以生成接收設備的物理聽覺信號的音頻指紋或“聽覺”指紋,然后將其與源指紋和/或接收指紋進行比較。這種比較可以提供用于辨識惡劣的連接或送受話器、嘈雜的環境等的QoE測量。根據本公開的各種實現方式,服務提供商和/或用戶可以比較源音頻指紋、接收音頻指紋和/或聽覺音頻指紋來獲得各種的QoE度量。在各個示例中,服務提供商可以沿網絡路徑在各個點處生成音頻指紋,并且可以比較各個“中間”指紋中的各個來隔離與不同網絡部分、部件等有關的服務問題。在一些示例中,零差(例如,源指紋等于接收指紋)可以表示可接受的傳輸,而非零的差可以表示次優傳輸。在一些示例中,可以在接近實時的環境中比較音頻指紋和/或可以通過使用送受話器的數據能力在后處理中來比較音頻指紋。為了便于同步,在一些實現方式中可以使用分組定時和標識。在各個示例中,可以采用不在人類聽力范圍的同步音調來輔助音頻指紋之間的同步。根據本公開的各種實現方式,比較音頻指紋可以包括直接比較指紋的二進制表示和/或可以包括指紋特征向量之間的距離測量。在一些示例中,指紋特征向量可以指定音頻信號的感知特性,例如平均過零率、估計節拍、平均譜、譜平坦度、在一組頻段上的主要音調、和/或帶寬。圖1示出根據本公開的至少一些實施方式的示例系統100的部分。系統100包括源設備102和目的地或匯設備104。設備102和104可以是能夠生成數字音頻信號、經由諸如蜂窩通信網絡這樣的網絡106接收和/或發送數字音頻信號的任何類型的設備。例如,在各種實現方式中,設備102和104可以是蜂窩電話送受話器。設備102和104包括能夠將各種信號在模擬格式和數字格式之間進行轉換的相應轉換模塊108和110。進一步地,設備102和104還包括能夠生成音頻指紋的相應指紋模塊112和114,以下將對其進行詳細說明。 源設備102還包括能夠將(例如由用戶的語音提供的)音頻輸入轉換為模擬音頻信號的麥克風116。接著,模塊108可以將該模擬音頻信號轉換為數字音頻信號。接著,可以通過使用例如VoIP技術經由網絡106把數字音頻信號以通信方式傳送給目的地設備104。指紋模塊112可以響應于模塊108提供的數字音頻信號而生成音頻指紋(“源”指紋)。可以認識到的是設備102和104可以包括附加組件和/或模塊,例如發送/接收模塊、存儲器組件、處理器,天線等,為了清楚起見,在圖1中省略了這些組件和/或模塊。在各個實現方式中,指紋模塊112和114可以是能夠利用各種已知音頻指紋技術中的任一種來生成源指紋的軟件、固件和/或硬件的任意組合。在各個實現方式中,模塊112和/或114可以至少部分地由在一個或更多個處理器內核(諸如數字信號處理器(DSP)的一個或更多個處理器內核)上執行的軟件和/或固件算法來實現。源設備102還可以經由網絡106向目的地設備104以通信的方式傳輸源指紋。目的地設備104包括能夠將(例如由用戶語音提供的)音頻輸入轉換成模擬音頻信號的麥克風118。接著,模塊110可以將該模擬音頻信號轉換為可以被提供給指紋模塊114的數字音頻信號。進一步地,模塊110可以將從源設備102接收的數字音頻信號轉換為揚聲器120可用來生成音頻輸出(例如再現以數字音頻信號形式傳送的設備102的用戶的語音)的模擬音頻信號。接著,揚聲器120的音頻輸出可以被麥克風118捕獲,并且被模塊110轉換成數字音頻信號。接著,模塊Iio可以將該數字音頻信號提供給指紋模塊114。設備的指紋模塊114可以根據從源設備102接收的數字音頻信號生成音頻指紋(“匯”指紋)。模塊114還可以根據麥克風118捕獲的音頻輸入獲得的數字音頻信號生成另一個音頻指紋(“聽覺”指紋)。源指紋和匯指紋可以被提供給比較模塊122,它們在比較模塊122中可以被相互比較以生成一個或更多個QoE度量值,此后將對其進行進一步的詳細描述。此外,比較模塊122還可以接收聽覺指紋,并且可以將聽覺指紋與源指紋和/或匯指紋中的一個或兩者進行比較,從而生成一個或更多個QoE度量值,此后也會對其進行進一步的詳細描述。圖2示出了根據本公開的各個實現方式的示例過程200的流程圖。如一個或更多個框202和/或框204所示,處理200可以包括一個或更多個操作、功能或動作。處理200可以從框202開始。在框202,可以接收音頻指紋,其中該音頻指紋是根據數字音頻信號生成的。在一些示例中,參照圖1,框202可以涉及在設備104處接收設備102生成的源指紋。指紋模塊112可以使用多種已知指紋技術中的任一種根據數字音頻信號生成源指紋。在一些示例中,數字音頻信號可以是VoIP信號的至少一部分。在生成指紋的過程中,可以執行多個信號處理功能。最初,被表示為強度值的時間序列的數字音頻信號可以通過將其轉換為諸如16比特脈沖編碼調制(PCM)格式這樣的標準格式而被預處理。還可以進行其他預處理,諸如左右聲道單聲道平均、帶通濾波等。接著,該數字音頻信號可以被分段為一系列的幀,這些幀可以交疊也可以不交疊。接著,可以使用諸如快速傅里葉(Fourier)變換(FFT)、離散傅里葉變換(DFT)、哈爾(Haar)變換、沃爾什-阿達馬(Walsh-Hadamard)變換等各種變換,將這些幀從時域變換到頻域。接著,生成指紋可以涉及從信號幀中提取一個或更多個特征。在一些實現方式中,所提取的特征可以是感知特性,諸如但是不局限于,平均過零率、估計節拍、平均譜、譜平坦度、在一個或更多個頻段上的主要音調、和/或帶寬。例如,可以通過估計幀信號頻譜中的頻帶的類似音調質量或類似噪音質量來獲得對應于譜平坦度的特征。在另一個示例中,所提取的特征可以包括具有巾貞中的主 首調的頻帶索引的有序列表。所生成的指紋可以包括排列在一個或更多個特征向量中的一個或更多個特征。進一步地,指紋可以被量化。例如,指紋的向量可以被二進制編碼。此外,可以通過將特征向量聚集為序列,隨后用與碼書關聯的代表性編碼向量來近似特征向量,來以緊湊形式提供指紋。在框204處,可以至少部分地基于在框202接收的音頻指紋和根據數字音頻信號生成的第二音頻指紋的比較來確定QoE度量值,其中,第二音頻指紋是在接收所述數字音頻信號的設備處生成的。在一些示例中,參照圖1,框204可以涉及設備104采用比較模塊112將從設備102接收的源指紋與匯指紋進行比較,其中,設備104使用指紋模塊114根據從設備102接收的數字音頻信號生成匯指紋。在各個實現方式中,在框204比較指紋可以包括確定指紋特征向量之間的距離度量,其中距離度量可以提供被比較的各特征向量的相似度測量。例如,對于量化的特征向量,可以確定曼哈頓(Manhattan)距離或漢明(Hamming)距離。隨后,可以通過比較距離度量和閾值得到QoE度量。例如,在各個實現方式中,如果距離度量滿足或超過閾值,因此被比較指紋的一個或更多個特征向量可以被認為顯著不同,則對應的QoE度量可以被指派失敗(FAILED)值。在另一方面,如果距離度量降低到閾值以下,因此被比較指紋的一個或更多個特征向量可以被認為相似,則對應的QoE度量可以被指派通過(PASS)值。盡管在圖1的示例系統100的環境下,描述了處理200的實現方式,但是在各個實現方式中,可以在各種環境下實現處理200。例如,圖3示出了根據本公開的至少一些實施方式的另一個示例網絡300的一些部分。網絡300可以是諸如蜂窩通信網絡這樣的任何類型的網絡。網絡300包括:第一網絡節點(節點“A”)302和第二網絡節點(節點“B”)304。節點302和節點304可以是能夠經由網絡300接收和/或發送數字音頻信號的任意類型的網絡節點。例如,在各個實現方式中,節點302和/或節點304可以是網絡服務器、網絡網關等。可以認識到的是節點302和/或節點304可以包括附加的組件和/或模塊,例如發送/接收模塊、存儲器組件、處理器等,為了清楚起見,圖3中省略了這些組件和/或模塊。節點302和304包括能夠如本文所描述地生成音頻指紋的相應的指紋模塊306和308。在各個實現方式中,指紋模塊306和/或308可以是能夠利用各種已知的音頻指紋技術中的一種來生成源指紋的軟件、固件和/或硬件的任意組合。在各個實現方式中,模塊306和/或308可以至少部分地由在一個或更多個處理器內核(諸如數字信號處理器(DSP)的一個或更多個處理器內核)上執行的軟件和/或固件算法來實現。節點302可以接收數字音頻信號并且可以使用指紋模塊306來如本文所描述地生成該信號的指紋(“節點A指紋”)。節點302還可以接收由諸如另一個網絡節點或該數字音頻信號的生成設備這樣的另一個設備根據數字音頻信號生成的源指紋。接著,節點302可以使用比較模塊310比較節點A指紋和源指紋,以生成一個或更多個QoE度量值。節點302可以向節點304傳送數字音頻信號、節點A指紋和/或源指紋。節點304可以接收數字音頻信號,并且可以使用指紋模塊308來如本文所描述地生成該信號的指紋(“節點B指紋”)。節點304還可以接收源指紋和節點A指紋。接著,如本文所描述的那樣,節點304可以使用比較模塊312比較節點B指紋和源指紋,以生成一個或更多個QoE度量值。此外,如·本文所描述的那樣,節點304還可以使用模塊312比較節點B指紋和節點A指紋,以生成一個或更多個QoE度量值。
·
盡管圖3描述了節點302直接可通信地耦接到節點304,但是可以認識到的是,可以存在將節點302可通信地耦接到節點304的一個或者更多個中間網絡節點(未示出)。此外,盡管圖3描述了在節點302和節點304之間傳送數字音頻信號,但是在一些示例中,數字音頻信號可以被轉換為模擬格式,在節點302和節點304之間進行傳輸,因此,節點302和/或節點304可以包括用于將數字音頻信號轉換為模擬音頻信號以及反之亦然的轉換模塊(未示出)。圖4示出了根據本公開的至少一些實施方式的另一個示例網絡400的一些部分。網絡400可以是諸如蜂窩通信網絡這樣的任意類型的網絡。網絡400包括第一網絡節點(節點“A”)402、第二網絡節點(節點“B”)404和第三節點(節點“C”)406。節點402、404和406可以是能夠經由網絡400接收和/或發送數字音頻信號的任意類型的網絡節點。例如,在各個實現方式中,節點402、404和/或406可以是網絡服務器、網絡網關等。在系統400的示例中,各個節點402和節點404可以采用指紋模塊(未示出)以如本文所描述地根據數字音頻信號生成相應的指紋。進一步地,節點406除了分別來自節點402和404的指紋還可以接收源指紋,并且可以采用一個或更多個比較模塊(未示出)以如本文所描述地生成一個或更多個相應QoE度量值。例如,節點406可以從節點402和404兩者接收指紋,并且可以通過把各個節點指紋分別與源指紋進行比較和/或通過把節點指紋相互比較,來生成不同的QoE度量值。可以認識到的是,節點402、404和/或406可以包括附加的組件和/或模塊,例如發送/接收模塊、存儲部組件、處理器等,為了清楚起見,圖4中省略了上述組件和/或模塊。盡管圖4中描述了節點402、404和406彼此直接可通信地耦接,但是可以認識到的是,可以存在將圖4的各個節點彼此可通信地耦接的一個或者更多個中間網絡節點(未示出)。例如,節點406可以是遠離節點402和節點404的服務器,節點402和節點404可以是通過一個或更多個中間節點彼此分開的相應網絡網關。圖5例示了根據本公開的至少一些示例所設置的示例性計算機程序產品500。程序產品500可以包括信號承載媒介502。信號承載媒介502可以包括一條或更多條指令504,當這些指令例如被處理器執行時,可以提供以上參照圖2所描述的功能。因而,例如,參照圖1和圖3的系統,設備102、104和/或節點302和/或304中的一個或更多個可以響應于由媒介502所傳送的指令504進行圖2中所示的一個或更多個框。在一些實現方式中,信號承載媒介502可以包括計算機可讀介質506,諸如(但不限于)硬盤驅動器、質密盤(CD)、數字通用盤(DVD)、數字磁帶、存儲器等。在一些實現方式中,信號承載媒介502可以包括可記錄介質508,例如(但不限于)存儲器、讀/寫(R/W)⑶、R/W DVD等。在一些實現方式中,信號承載媒介502可以包括通信媒介510,例如(但不限于)數字和/或模擬通信媒介(例如,光纜、波導、有線通信鏈路、無線通信鏈路等)。因而,例如,參照圖1的系統,程序產品500通過信號承載媒介502可以無線地傳送至設備102,其中,信號承載媒介502通過無線通信媒介510 (例如,符合802.11標準的無線通信媒介)被傳送到設備108。圖6是例示了根據本公開的各種實現方式的示例性計算裝置600的框圖。在非常基本的配置601中,計算裝置600 —般包括一個或更多個處理器610以及系統存儲器620。存儲器總線630可以用 于進行處理器610和系統存儲器620之間的通信。依賴于所期望的配置,系統存儲器620可以是任意類型的存儲器,包括(但不限于)易失性存儲器(諸如RAM)、非易失性存儲器(諸如ROM、閃速存儲器等)或者它們的任意組合。系統存儲器620通常包括操作系統621、一個或更多個應用622以及程序數據624。應用622可以包括被設置為執行包括針對圖2所示的流程圖所描述的動作的本文所描述的功能的指令。程序數據624可以包括對于實現指令623有用的與指紋有關的數據625、諸如數字音頻信號幀值、指紋向量數據等。在一些示例中,可以將應用622設置為在操作系統621上結合程序數據624進行操作,使得可以提供如本文所描述的本公開的實現。在圖6中通過虛線601內的這些部件例示了所描述的基本配置。計算裝置600可以具有附加特征或功能以及附加接口,以便于基本配置601和任何所需的裝置和接口之間的通信。例如,可以使用總線/接口控制器640,以便于通過存儲接口總線641在基本配置601和一個或更多個數據存儲裝置650之間的通信。數據存儲裝置650可以是可拆卸的存儲裝置651、不可拆卸的存儲裝置652或者它們的組合。可拆卸的存儲裝置和不可拆卸的存儲裝置的示例包括,僅作為示例,諸如軟盤驅動器和硬盤驅動器(HDD)這樣的磁盤驅動器、諸如質密盤(⑶)驅動器或數字通用盤(DVD)驅動器這樣的光盤驅動器、固態驅動器(SSD)以及磁帶驅動器等。示例性計算機存儲介質可以包括以任何方法或技術實現的用于存儲諸如計算機可讀指令、數據指令、程序模塊或其它數據這樣的信息的易失性和非易失性、可拆卸和不可拆卸的介質。系統存儲器620、可拆卸存儲器651以及不可拆卸存儲器652都是計算機存儲介質的示例。計算機存儲介質包括(但是不限于)RAM、ROM、EEPR0M、閃速存儲器或其它存儲技術、CD-ROM、數字通用盤(DVD)或其它光學存儲器、磁帶盒、磁帶、磁盤存儲器或其它磁存儲裝置,或者可以用于存儲期望信息并且可以被計算裝置600訪問的任何其它介質。任何這種計算機存儲介質可以是裝置600的一部分。計算裝置600也可以包括用于便于通過總線/接口控制器640從各種接口裝置(例如,輸出接口、外圍接口和通信接口)到基本配置601的通信的接口總線642。示例性輸出接口 660包括圖形處理單元661和音頻處理單元662,它們可以被配置為通過一個或更多個A/V端口 663與例如顯示器或揚聲器這樣的各種外部裝置通信。示例性外圍接口 660包括串行接口控制器671或并行接口控制器672,它們可以被配置為通過一個或更多個I/O接口 673與諸如輸入裝置(例如,鍵盤、鼠標、筆、語音輸入裝置、觸摸輸入裝置等)或其它外圍裝置(例如,打印機、掃描儀等)這樣的外部裝置進行通信。示例性通信接口 680包括網絡控制器681,其可以被設置為便于經由一個或更多個通信端口 682通過網絡通信與一個或更多個其它計算裝置690進行通信。網絡通信連接是通信媒介的一種示例。通信媒介通常可以通過諸如載波或其它傳輸機制這樣的已調制數據信號中的計算機可讀指令、數據結構、程序模塊或其它數據來具體實現,并且包括任何信息傳遞媒介。“已調制數據信號”可以是這樣的信號,即,該信號具有以在信號中對信息編碼的方式設置或改變的一個或者更多個特征。作為示例,但不限于此,通信媒介可以包括諸如有線網絡或者直接有線連接這樣的有線媒介,以及諸如聲波、射頻(RF)、紅外(IR)和其它無線媒介的無線媒介。本文所使用的計算機可讀介質的術語可以包括存儲介質和通信媒介兩者。計算裝置600可以被實現為小型的便攜式(或移動)電子裝置的一部分,諸如,移動電話、智能電話、個人數據助理(PDA)、個人媒體播放裝置、無線網絡收看裝置、個人耳機裝置、專用裝置或者包括 任何上述功能的混合裝置。計算裝置600也可以被實現為包括膝上型計算機和非膝上型計算機裝置在內的個人計算機,或被實現為工作站或服務器裝置。在本公開中對措辭“響應于”或者“對……的響應”的引用不限于僅對特定的特征和/或結構的響應性。特征還可以響應于其它特征和/或結構,并且還可以位于該特征和/或結構中。此外,當在本文中或在權利要求中使用諸如“耦接”或“響應于”或“對……的響應”或“與……通信”等這樣的術語或短語時,這些術語應該被廣義地解釋。例如,短語“耦接至”可以針對短語所使用的上下文適當地表示可通信地、電地和/或可操作地耦接。上述具體描述的一些部分以對存儲在計算系統存儲器(諸如,計算機存儲器)內的數據比特或二進制數字信號進行操作的算法或符號表示來呈現。這些算法描述或表示是數據處理領域的技術人員將他們的工作的實質傳達給其它技術人員所使用的技術示例。這里的算法通常被認為是得到期望結果的前后一致的一序列操作或者類似處理。在這個上下文中,操作或處理涉及物理量的物理操作。一般地,盡管不是必須的,但是這些量可以采用能夠被存儲、傳送、組合、比較或進行其它操作的電信號或磁信號的形式。有時,為了方便,主要是為了一般的使用,將這樣的信號稱為比特、數據、值、元件、符號、字符、術語、編號、數字等。但是,應理解的是,所有這些術語和相似的術語都與適當的物理量相關,并且僅僅是方便的標記。如根據以下討論明顯可見,除非另外特別規定,否則應理解的是,在該說明書,利用例如“處理”、“計算”、“推算”、“確定”等這樣的措辭的討論是指計算裝置的動作或處理,這些動作或處理操縱或轉換被表示為計算裝置的存儲器、寄存器或其它信息存儲裝置、發送裝置或顯示裝置內的物理的電量或磁量的數據。以上詳細描述通過使用框圖、流程圖和/或示例闡述了裝置和/或處理的各種實施方式。在這種框圖、流程圖和/或示例包含一個或更多個功能和/或操作的范圍內,本領域技術人員應理解的是,在這種框圖、流程圖或示例內的各功能和/或操作可以由寬范圍的硬件、軟件、固件或實質上它們的任何組合單獨地和/或共同地實現。在一種實施方式中,本文所描述的主題的幾個部分可以經由專用集成電路(ASIC)、現場可編程門陣列(FPGA)、數字信號處理器(DSP)或其它集成格式實現。然而,本領域技術人員將認識到,本文所公開的實施方式的一些方面在整體上或部分上可以作為在一個或更多個計算機上運行的一個或更多個計算機程序(例如,作為在一個或更多個計算機系統上運行的一個或更多個程序),作為在一個或更多個處理器上運行的一個或更多個程序(例如,作為在一個或更多個微處理器上運行的一個或更多個程序)、作為固件或者實質上作為它們的任何組合等同地實現為集成電路;并且,設計電路和/或編寫用于軟件和或固件的代碼鑒于本公開將在本領域技術人員的技能之內。此外,本領域技術人員將理解的是,本文所描述的主題的機制能夠作為多種形式的程序產品分配,并且應用本文所描述的主題的示例性實施方式,而與用于實際進行分配的特定類型的信號承載媒介無關。信號承載媒介的示例包括(但不限于)以下各項:諸如軟盤、硬盤驅動器(HDD)、質密盤(CD)、數字通用盤(DVD)、數字磁帶、計算機存儲器等的可記錄型介質;以及諸如數字和/或模擬通信媒介(例如,光纜、波導、有線通信鏈路、無線通信鏈路等)這樣的傳輸型媒介。本領域技術人員將認識到以本文所闡述的方式來描述裝置和/或處理,并在其后利用工程實踐將這種所描述的裝置和/或處理集成到數據處理系統中在本領域是常見的。也就是說,通過合理數量的實驗,可以將本文所描述的至少一部分裝置和/或處理集成到數據處理系統中。本領域技術人員將認識到,一般的數據處理系統通常包括以下中的一個或者更多個:系統單元殼體、視頻顯示裝置、諸如易失性存儲器和非易失性存儲器這樣的存儲器、諸如微處理器和數字信號處理器這樣的處理器、諸如操作系統、驅動器、圖形用戶接口和應用程序這樣的計算實體、諸如觸摸板或觸摸屏這樣的一個或更多個交互裝置和/或包括反饋環和控制馬達(例如,用于感測位置和/或速度的反饋;用于移動和/或調整部件和/或量的控制馬達)在內的控制系統。可以利用任何合適的市售部件(例如,在數據計算/通信和/或網絡計算/通信系統中通常可以找到的部件)來實現一般的數據處理系統。本文所描述的主題有時例示了包括在不同的其它部件內的或者連接至不同的其它部件的不同的部件。應理解的是,所描述的這種架構僅僅是示例性的,并且實際上可以實現達到相同功能的許多其它架構。在概念層面上,為了實現相同功能的任何部件的設置被有效地“相關”,使得實現期望功能。因此,在這里相結合以實現特定功能的任意兩個部件可以被視為彼此“相關”,使得實現期望功能,而與架構或中間部件無關。同樣地,這樣相關的任何兩個部件也可以被視為被彼此“可操作地連接”或“可操作地耦接”以實現所期望的功能,并且能夠如此相關的任何兩個部件也可以被視為彼此“可操作地可連接”以實現期望功能。可操作地可連接的特定示 例包括(但不限于)物理上可配對和/或物理上交互的部件和/或無線可交互和/或無線交互的部件和/或邏輯上交互和/或邏輯上可交互的部件。對于本文中大量使用的任何復數的和/或單數的術語,本領域技術人員可以根據適合于上下文和/或應用的情況從復數轉換為單數和/或從單數轉換為復數。為了清楚,可以在本文明確地闡述各種單數/復數置換。本領域技術人員應理解的是,一般地,本文所使用的措辭,特別是在所附權利要求中(例如,所附權利要求的主體)所使用的措辭一般意在是“開放式”措辭(例如,措辭“包括”應被解釋為“包括但不限于”,措辭“具有”應被解釋為“至少具有”,措辭“包含”應被解釋為“包含但不限于”等)。本領域技術人員還將理解的是,如果意在特定數目的所引入權利要求記載,則將在權利要求中明確地記載這種意圖,并且在沒有這種記載時沒有這種意圖。例如,為了幫助理解,以下所附權利要求可以包含使用引導性短語“至少一個”和“一個或更多個”來引入權利要求記載。然而,這種短語的使用不應被解讀為意指通過不定冠詞“一(a)”或“一(an)”對權利要求記載的引入將包含這種所引入的權利要求記載的任何特定的權利要求限制于包含僅一個這種記載的實現方式,即使當相同的權利要求包括引導性短語“一個或更多個”或“至少一個”以及諸如“一(a)”或“一(an)”(例如,“一(a) ”和/或“一(an)”一般應被解讀為表示“至少一個”或“一個或更多個”)這樣的不定冠詞時;這也適用于使用用于引入權利要求記載的定冠詞的情況。此外,即使明確地記載了特定數目的所引入的權利要求記載,本領域技術人員將認識到這種記載應當通常被解讀為表示至少所記載的數量(例如,沒有其它修飾的“兩個記載”的無限定記載一般表示至少兩個記載或兩個或更多個記載)。此外,在其中使用了類似于“A、B和C等中的至少之一”的語句的實例中,這種結構一般意在本領域技術人員會理解該語句(例如,“具有A、B和C中至少之一的系統”將包括但不限于這樣的系統:僅具有A、僅具有B、僅具有C、具有A連同B、具有A連同C、具有B連同C、和/或A、B以及C 一起等)。在使用了類似于“A、B或C等中至少之一,,的語句的示例中,一般,這種結構意在本領域技術人員會理解該語句(例如,“具有A、B或C中至少之一的系統”將包括但不限于這樣的系統:僅具有A、僅具有B、僅具有C、具有A連同B、具有A連同C、具有B連同C、和/或A、B以及C 一起等)。本領域技術人員還將理解的是,實際上,呈現出兩 個或更多個候選措辭的任何分隔的詞語和/或短語,無論是在說明書、權利要求還是在附圖中,都應被理解為包括一個措辭、措辭中之一或兩個措辭的可能性。例如,短語“A或B”將被理解為包括“A”或“B”或“A和B”的可能性。還應理解的是,措辭“優化”可以包括最大化和/或最小化。本文所使用的措辭“最小化”和/或此類措辭可以包括全局最小化、局部最小化、近似全局最小化和/或近似局部最小化。同樣地,還應理解的是,本文所使用的措辭“最大化”和/或此類措辭可以包括全局最大化、局部最大化、近似全局最大化和/或近似局部最大化。在說明書中對“實現方式”、“一個實現方式”、“一些實現方式”或“其它實現方式”的描述可以表示結合一個或更多個實現方式而描述的特定特征、結構或特性可以包括在至少一些實現方式中,但不必包括在所有實現方式中。在前述描述中的“實現方式”、“一個實現方式”或“一些實現方式”的各種表現形式未必全部表示相同的實現方式。盡管在本文利用各種方法和系統已經描述并示出了特定示例性技術,但本領域技術人員應理解的是,在不脫離所保護的主題的情況下可以做出各種其它修改并可以用等同物來替換。此外,在不脫離本文所描述的中心概念的情況下可以做出許多修改,以使具體的情況適應于所要求保護的教導。因此,所要求保護的主題不意在限于所公開的特定的示例,并且所要求保護的主題還可以包括落入所附權利要求及其等同物的范圍內的全部實現方式
權利要求
1.一種用于確定移動體驗質量的方法,所述方法包括以下步驟: 接收根據數字音頻信號生成的第一音頻指紋; 至少部分地基于所述第一音頻指紋和根據數字音頻信號生成的第二音頻指紋的比較來確定體驗質量(Q0E)度量值,其中,所述第二音頻指紋是在所述數字音頻信號的接收方生成的。
2.根據權利要求1所述的方法,其中,所述數字音頻信號包括基于IP的語音(VoIP)信號。
3.根據權利要求1所述的方法,其中,所述第一音頻指紋是在所述數字音頻信號的發送源處生成的。
4.根據權利要求1所述的方法,其中,確定QoE度量值包括:至少部分地基于所述第一音頻指紋和所述第二音頻指紋中的至少一方與第三音頻指紋的比較來確定所述QoE度量值,其中,所述第三音頻指紋是在所述數字音頻信號的接收方至少部分地響應于位于所述數字音頻信號的接收方處的至少一個麥克風捕獲的音頻而生成的。
5.根據權利要求4所述的方法,其中,所述數字音頻信號的發送源包括第一蜂窩電話送受話器,并且其中,所述數字音頻信號的接收方包括第二蜂窩電話送受話器。
6.根據權利要求1所述的方法,其中,所述第一音頻指紋是在第一網絡節點處生成的,其中,所述數字音頻信號的接收方包括第二網絡節點,并且其中,所述第二音頻指紋是在所述第二網絡節點處生成的。
7.根據權利要求6所述的方法,其中,所述第一網絡節點和/或所述第二網絡節點中的至少一方包括服務器。
8.根據權利要求1所述的方法,其中,至少部分地基于所述第一音頻指紋和所述第二音頻指紋的比較來確定所述QoE度量值包括:至少部分地基于所述第一音頻指紋的感知特性和所述第二音頻指紋的感知特性的比較來確定所述QoE度量值。
9.根據權利要求8所述的方法,其中,感知特性包括以下各項中的至少一個:平均過零率、估計節拍、平均譜、譜平坦度、在一個或更多個譜段上的主要音調、或帶寬。
10.一種包括計算機程序產品的制品,其中,所述計算機程序產品內存儲了指令,如果所述指令被執行則導致: 接收根據數字音頻信號生成的第一音頻指紋;以及 至少部分地基于所述第一音頻指紋和根據所述數字音頻信號生成的第二音頻指紋的比較來確定體驗質量(QoE)度量值,其中,所述第二音頻指紋是在所述數字音頻信號的接收方生成的。
11.根據權利要求10所述的制品,其中,所述數字音頻信號包括基于IP的語音(VoIP)信號。
12.根據權利要求10所述的制品,其中,確定QoE度量值包括:至少部分地基于所述第一音頻指紋和所述第二音頻指紋中的至少一方與第三音頻指紋的比較來確定所述QoE度量值,其中,所述第三音頻指紋是在所述數字音頻信號的接收方至少部分地響應于位于所述數字音頻信號的接收方處的至少一個麥克風捕獲的音頻而生成的。
13.根據權利要求12所述的制品,其中,所述數字音頻信號的發送源包括第一蜂窩電話送受話器,并且其中,所述數字音頻信號的接收方包括第二蜂窩電話送受話器。
14.根據權利要求10所述的制品,其中,所述第一音頻指紋是在第一網絡節點生成的,其中,所述數字音頻信號的接收方包括第二網絡節點,并且其中,所述第二音頻指紋是在所述第二網絡節點生成的。
15.根據權利要求10所述的制品,其中,至少部分地基于所述第一音頻指紋和所述第二音頻指紋的比較來確定所述QoE度量值包括:至少部分地基于所述第一音頻指紋的感知特性和所述第二音頻指紋的感知特性的比較來確定所述QoE度量值。
16.根據權利要求10所述的制品,其中,感知特性包括以下各項中的至少一項:平均過零率、估計節拍、平均譜、譜平坦度、在一個或更多個譜段上的主要音調、或帶寬。
17.—種系統包括: 一個或更多個模塊,所述一個或更多個模塊被配置為 : 接收根據數字音頻信號生成的第一音頻指紋;以及 至少部分地基于所述第一音頻指紋和根據所述數字音頻信號生成的第二音頻指紋的比較來確定體驗質量(QoE)度量值,其中,所述第二音頻指紋是在所述數字音頻信號的接收方生成的。
18.根據權利要求17所述的系統,其中,確定QoE度量值包括:至少部分地基于所述第一音頻指紋和所述第二音頻指紋中的至少一方與第三音頻指紋的比較來確定所述QoE度量值,其中,所述第三音頻指紋是在所述數字音頻信號的接收方至少部分地響應于位于所述數字音頻信號的接收方處的至少一個麥克風捕獲的音頻而生成的。
19.根據權利要求17所述的系統,其中,至少部分地基于所述第一音頻指紋和所述第二音頻指紋的比較來確定所述QoE度量值包括:至少部分地基于所述第一音頻指紋的感知特性和所述第二音頻指紋的感知特性的比較來確定所述QoE度量值。
20.根據權利要求19所述的系統,其中,感知特性包括以下各項中的至少一項:平均過零率、估計節拍、平均譜、譜平坦度、在一個或更多個譜段上的主要音調、或帶寬。
全文摘要
本發明涉及,尤其涉及與VoIP電話一起使用的,用于確定移動通信網絡中體驗質量(QoE)的方法、系統和計算機程序產品,其中在接收方接收根據數字音頻信號生成的第一音頻指紋,在接收器端根據數字音頻信號生成第二音頻指紋。兩個音頻指紋的比較用于確定QoE度量。在一個單獨的實施方式中,在接收方響應于數字音頻信號的接收方的麥克風捕獲的音頻,生成第三音頻指紋,將所述第三音頻指紋與第一音頻指紋和第二音頻指紋中的一方進行比較,以確定QoE度量值。
文檔編號G10L19/00GK103250205SQ201080070076
公開日2013年8月14日 申請日期2010年12月7日 優先權日2010年12月7日
發明者E·克魯格里克 申請人:英派爾科技開發有限公司
網(wang)友詢問留(liu)言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1