使用經縮放的高頻帶激勵對音頻信號進行帶寬擴展的方法、設備、裝置、計算機可讀媒體的制作方法
【專利說明】使用經縮放的高頻帶激勵對音頻信號進行帶寬擴展的方法、 設備、裝置、計算機可讀媒體
[0001 ] 相關申請案的交叉參考
[0002] 本申請案要求2013年10月14日申請的名為"SYSTEMS AND METHODS OF ENERGY-SCALED SIGNAL PROCESSING(能量經縮放的信號處理的系統和方法)" 的美國 臨時專利申請 案第61/890,812號和2014年 10月13 日申請的名為 "SYSTEMS AND METHODS OF ENERGY-SCALED SIGNAL PROCESSING(能量經縮放的信號處理的系統和方法)" 的美國非臨時專利申 請案第14/512,892號的優先權,上述申請案的內容以全文引用的方式并入。
技術領域
[0003] 本發明大體上涉及信號處理。
【背景技術】
[0004] 技術的進步已經產生了更小且更強大的計算裝置。舉例來說,當前存在多種便攜 式個人計算裝置,包含無線計算裝置,例如便攜式無線電話、個人數字助理(PDA)和尋呼裝 置,其體積小、重量輕且易于由用戶攜帶。更具體來說,例如蜂窩電話和因特網協議(IP)電 話等便攜式無線電話可經由無線網絡傳送話音和數據包。此外,許多此類無線電話包含并 入其中的其它類型裝置。舉例來說,無線電話還可包含數字靜態攝像機、數碼攝像機、數字 記錄器,及音頻文件播放器。
[0005] 在傳統電話系統(例如,公共交換電話網絡(PSTN))中,信號帶寬限于300Hz到 3.4kHz的頻率范圍。在例如蜂窩電話和因特網話音協議(VoIP)的寬帶(WB)應用中,信號帶 寬可橫跨50Hz到7kHz的頻率范圍。超寬帶(SWB)譯碼技術支持擴展到16kHz左右的帶寬。將 信號帶寬從3.4kHz的窄帶電話擴展到16kHz的SWB電話可改善可懂度和自然性。
[0006] SWB譯碼技術通常涉及編碼及發射信號的較低頻率部分(例如,50Hz到7kHz,也被 稱為"低頻帶")。舉例來說,可使用濾波器參數及/或低頻帶激勵信號表示低頻帶。然而,為 了改善譯碼效率,可使用信號建模技術來編碼信號的較高頻率部分(例如,7kHz到16kHz,也 被稱為"高頻帶")以預測高頻帶。在一些實施方案中,可將與高頻帶相關聯的數據提供到接 收器以輔助預測。此數據可被稱為"旁側信息",且可包含增益信息、線譜頻率(LSF,也被稱 為線譜對(LSP))等。所述增益信息可包含基于高頻帶信號和經建模高頻帶信號兩者的子框 架能量確定的增益形狀信息。歸因于原始高頻帶信號相對于經建模高頻帶信號的差異,所 述增益形狀信息可具有較寬動態范圍(例如,大擺幅)。較寬動態范圍可降低用于編碼/發射 增益形狀信息的編碼器的效率。
【發明內容】
[0007] 揭示執行音頻信號編碼的系統和方法。在特定實施例中,將音頻信號編碼成包含 低頻帶位流(表示音頻信號的低頻帶部分)和高頻帶旁側信息(表示音頻信號的高頻帶部 分)的位流或數據流。可使用音頻信號的低頻帶部分產生高頻帶旁側信息。舉例來說,可擴 展低頻帶激勵信號以產生高頻帶激勵信號。高頻帶激勵信號可用于產生(例如,合成)第一 經建模高頻帶信號。高頻帶信號與經建模高頻帶信號之間的能量差可用于確定縮放因數 (例如,第一組一或多個縮放因數)。縮放因數(或基于第一組縮放因數確定的第二組縮放因 數)可應用于高頻帶激勵信號以產生(例如,合成)第二經建模高頻帶信號。第二經建模高頻 帶信號可用于確定高頻帶旁側信息。由于第二經建模高頻帶信號經縮放以彌補相對于高頻 帶信號的能量差,因此基于第二經建模高頻帶信號的高頻帶旁側信息可相對于未經縮放以 彌補能量差而確定的高頻帶旁側信息具有縮減的動態范圍。
[0008] 在特定實施例中,方法包含基于音頻信號的低頻帶激勵信號確定第一經建模高頻 帶信號。所述音頻信號包含高頻帶部分和低頻帶部分。所述方法還包含基于所述第一經建 模高頻帶信號的子幀的能量和所述音頻信號的所述高頻帶部分的對應子幀的能量確定縮 放因數。所述方法包含:將所述縮放因數應用于經建模高頻帶激勵信號以確定經縮放的高 頻帶激勵信號;以及基于所述經縮放的高頻帶激勵信號確定第二經建模高頻帶信號。所述 方法還包含基于所述第二經建模高頻帶信號和所述音頻信號的所述高頻帶部分確定增益 信息。
[0009] 在另一特定實施例中,設備包含第一合成濾波器,其經配置以基于音頻信號的低 頻帶激勵信號確定第一經建模高頻帶信號,其中所述音頻信號包含高頻帶部分和低頻帶部 分。所述設備還包含縮放模塊,其經配置以基于所述第一經建模高頻帶信號的子幀的能量 和所述音頻信號的所述高頻帶部分的對應子幀的能量確定縮放因數,以及將所述縮放因數 應用于經建模高頻帶激勵信號以確定經縮放的高頻帶激勵信號。所述設備還包含第二合成 濾波器,其經配置以基于經縮放的高頻帶激勵信號確定第二經建模高頻帶信號。所述設備 還包含增益估計器,其經配置以基于所述第二經建模高頻帶信號和所述音頻信號的所述高 頻帶部分確定增益信息。
[0010] 在另一特定實施例中,裝置包含用于基于音頻信號的低頻帶激勵信號確定第一經 建模高頻帶信號的裝置,其中所述音頻信號包含高頻帶部分和低頻帶部分。所述裝置還包 含用于基于所述第一經建模高頻帶信號的子幀的能量和所述音頻信號的所述高頻帶部分 的對應子幀的能量確定縮放因數的裝置。所述裝置還包含用于將所述縮放因數應用于經建 模高頻帶激勵信號以確定經縮放的高頻帶激勵信號的裝置。所述裝置還包含用于基于所述 經縮放的高頻帶激勵信號確定第二經建模高頻帶信號的裝置。所述裝置還包含用于基于所 述第二經建模高頻帶信號和所述音頻信號的所述高頻帶部分確定增益信息的裝置。
[0011] 在另一特定實施例中,非暫時性計算機可讀媒體包含指令,所述指令在由計算機 執行時引起所述計算機執行包含基于音頻信號的低頻帶激勵信號確定第一經建模高頻帶 信號的操作,其中所述音頻信號包含高頻帶部分和低頻帶部分。所述操作還包含基于所述 第一經建模高頻帶信號的子幀的能量和所述音頻信號的所述高頻帶部分的對應子幀的能 量確定縮放因數。所述操作還包含將所述縮放因數應用于經建模高頻帶激勵信號以確定經 縮放的高頻帶激勵信號。所述操作還包含基于所述經縮放的高頻帶激勵信號確定第二經建 模高頻帶信號。所述操作還包含基于所述第二經建模高頻帶信號和所述音頻信號的所述高 頻帶部分確定增益參數。
[0012] 由所揭示實施例中的至少一者提供的特定優勢包含通過縮放用于計算增益信息 的經建模高頻帶激勵信號來縮減提供到編碼器的增益信息的動態范圍。舉例來說,可基于 經建模高頻帶信號的子幀和音頻信號的高頻帶部分的對應子幀的能量來縮放經建模高頻 帶激勵信號。以此方式縮放經建模高頻帶激勵信號可捕獲子幀之間的時間特性的變化且降 低增益形狀信息對音頻信號的高頻帶部分的時間改變的依賴性。在檢視整個申請案后,本 發明的其它方面、優勢和特征將變得顯而易見,申請案包含以下部分:【附圖說明】、具體實施 方式和權利要求書。
【附圖說明】
[0013] 圖1為說明可操作以基于經縮放的經建模高頻帶激勵信號產生高頻帶旁側信息的 系統的特定實施例的圖;
[0014] 圖2為說明圖1的高頻帶分析模塊的特定實施例的圖;
[0015] 圖3為說明對子幀信息進行內插的特定實施例的圖;
[0016] 圖4為說明對子幀信息進行內插的另一特定實施例的圖;
[0017] 圖5到7-起為說明圖1的高頻帶分析模塊的另一特定實施例的圖;
[0018] 圖8為說明音頻信號處理的方法的特定實施例的流程圖;
[0019] 圖9為根據圖1到8的系統和方法的可操作以執行信號處理操作的無線裝置的框 圖。
【具體實施方式】
[0020] 圖1為說明可操作以基于經縮放的經建模高頻帶激勵信號產生高頻帶旁側信息的 系統100的特定實施例的圖。在特定實施例中,系統100可整合到編碼系統或設備中(例如, 無線電話或譯碼器/解碼器(CODEC)中)。
[0021] 在以下描述中,將由圖1的系統100執行的各種功能描述為由某些組件或模塊執 行。然而,組件和模塊的此劃分僅為了說明。在替代實施例中,由特定組件或模塊執行的功 能可實際上劃分為多個組件或模塊。此外,在替代實施例中,圖1的兩個或兩個以上組件或 模塊可整合到單個組件或模塊中。圖1中所說明的每一組件或模塊可使用硬件(例如,現場 可編程門陣列(FPGA)裝置、專用集成電路(ASIC)、數字信號處理器(DSP)、控制器等)、軟體 (例如,可由處理器執行的指令)或其任何組合來實施。
[0022] 系統100包含經配置以接收音頻信號102的分析濾波器組110。舉例來說,音頻信號 102可由麥克風或其它輸入裝置提供。在特定實施例中,輸入音頻信號102可包含語音。音頻 信號102可為包含在大約50Hz到大約16kHz的頻率范圍中的數據的SWB信號。分析濾波器組 110可基于頻率將輸入音頻信號102濾波成多個部分。舉例來說,分析濾波器組110可產生低 頻帶信號122和高頻帶信號124。低頻帶信號122和高頻帶信號124可具有相等或不相等帶 寬,且可重疊或不重疊。在替代實施例中,分析濾波器組110可產生兩個以上輸出。
[0023] 在圖1的實例中,低頻帶信號122和高頻帶信號124占用不重疊頻帶。舉例來說,低 頻帶信號122和高頻帶信號124可分別占用50Hz到7kHz和7kHz到16kHz的不重疊頻帶。在替 代實施例中,低頻帶信號122和高頻帶信號124可分別占用50Hz到8kHz和8kHz到16kHz的不 重疊頻帶。在另一替代實施例中,低頻帶信號122與高頻帶信號124重疊(例如,分別為50Hz 到8kHz和7kHz到16kHz),其可使分析濾波器組110的低通濾波器和高通濾波器具有光滑滾 邊,這可簡化設計且降低低通濾波器和高通濾波器的成本。重疊低頻帶信號122和高頻帶信 號124還可實現接收器處低頻帶和高頻帶信號的平滑摻合,此情形可導致較少可聽偽影。
[0024] 盡管圖1的描述涉及SWB信號的處理,但此僅為了說明。在替代實施例中,輸入音頻 信號102可為具有大約50Hz到大約8kHz的頻率范圍的WB信號。在此實施例中,低頻帶信號 122可對應于大約50Hz到大約6.4kHz的頻率范圍,且高頻帶信號124可對應于大約6.4kHz到 大約8kHz的頻率范圍。
[0025] 系統100可包含經配置以接收低頻帶信號122的低頻帶分析模塊130(也被稱作低 頻帶編碼器)。在特定實施例中,低頻帶分析模塊130可表示代碼激勵線性預測(CELP)編碼 器的實施例。低頻帶分析模塊130可包含線性預測(LP)分析和譯碼模塊132、線性預測系數 (LPC)到線譜對(LSP)變換模塊134,以及量化器1361SP也可被稱作線譜頻率(LSF),且所述 兩個術語在本文重可以可互換地使用。LP分析和譯碼模塊132可將低頻帶信號122的頻譜包 絡編碼成一組LPC。可針對音頻的每一幀(例如,在16kHz的取樣速率下對應于320個樣本的 20ms的音頻)、音頻的每一子幀(例如,5ms的音頻)或其任何組合產生LPC。可由所執行的LP 分析的"階數"確定針對每一幀或子幀所產生的LPC的數目。在特定實施例中,LP分析和譯碼 模塊132可產生對應于十階LP分析的一組^^一個LPC。
[002