音頻信號處理的制作方法
【專利說明】
[0001] 相關申請奪叉引用
[0002] 本申請要求申請日為2013年11月27日、發明名稱為"音頻信號處理"、申請號為 201310629975. 6的中國專利申請的優先權。
技術領域
[0003] 本發明總體上涉及音頻信號處理,更具體地,涉及用于低延遲的特定于設備的音 頻信號處理的方法和系統。
【背景技術】
[0004] 為了以良好的質量回放音頻信號,通常需要對音頻信號進行處理。例如,可以根 據目標回放設備的特性或者參數來處理音頻信號。這種處理稱為特定于設備的(device specific)或者以設備為中心(device centric)音頻信號處理。一般而言,特定于設備的 音頻信號處理包括與根據回放設備和/或環境的呈現和校正有關的所有處理。通常,特定 于設備的音頻信號處理可以包括均衡器(equalizer)處理、調節器(regulator)處理、峰值 限制(peak limiting)處理,等等。作為示例,如果回放設備重現音頻信號中的高頻分量的 能力有限,則可以對音頻信號進行處理以相應地抑制高頻分量,從而避免在回放中的任何 破音、失真或者其他可聽到的瑕疵。當然,將會理解,可以出于任何其他目的來處理音頻信 號。
[0005] 對于VoIP(網際語音)通信和游戲等某些情況而言,音頻信號處理的延遲是一個 重要因素。較長的音頻信號處理延遲很可能降低應用的總體性能,并且對用戶體驗造成不 良影響。然而目前,用于音頻信號處理的方案通常出于保真度的考慮而無法使延遲最小化。 具體而言,音頻信號處理通常包括在時域與頻域之間的變換。例如,音頻信號可以從時域被 變換到頻域以獲得一系列頻率系數。這些頻率系數可以根據回放設備的特性而被修改。繼 而,具有經修改系數的音頻信號被變換回時域以便回放。在音頻處理延遲與計算效率之間 存在著權衡。為了實現濾波器頻率響應中的高分辨率,已知的方案不得不以較高的計算代 價或者顯著的延遲進行操作。而且,為了允許對所有頻率參數的精細控制,現有方案通常將 會引入較高的失真或者較長的延遲。然而,在某些音頻信號處理(例如,特定于設備的音頻 處理)中,可能僅需要修改少數頻帶的帶能量便能夠滿足多數用戶的質量需求。
[0006] 由此,本領域中需要一種低延遲的音頻信號處理的解決方案。
【發明內容】
[0007] 為了解決上述以及其他潛在的問題,本發明提出一種用于處理音頻信號的方法和 系統。
[0008] 在一方面,本發明的實施例提供一種用于處理音頻信號的方法。該方法包括:針對 所述音頻信號的當前幀,至少部分地基于所述當前幀的頻率參數,確定多個預定義頻帶的 頻帶能量;通過處理所述頻帶能量,生成所述多個預定義頻帶的頻帶增益;以及使用預定 義的頻帶濾波器組,基于所述頻帶增益生成針對所述當前幀的頻點增益,所述頻帶濾波器 組特定于所述多個預定義頻帶。
[0009] 在另一方面,本發明的實施例提供一種用于處理音頻信號的系統。該系統包括:頻 帶能量確定單元,被配置為針對所述音頻信號的當前幀,至少部分地基于所述當前幀的頻 率參數,確定多個預定義頻帶的頻帶能量;頻帶增益生成單元,被配置為通過處理所述頻帶 能量,生成所述多個預定義頻帶的頻帶增益;以及頻點增益生成單元,被配置為使用預定義 的頻帶濾波器組,基于所述頻帶增益生成針對所述當前幀的頻點增益,所述頻帶濾波器組 特定于所述多個預定義頻帶。
[0010] 通過下文描述將會理解,根據本發明的實施例,可以簡單地通過操作特定數目的 預定義頻帶的頻帶增益來實現音頻信號處理,其中所述頻帶是實現根據例如人類聽覺特性 或者模型而被定義和固定下來的。由于頻帶是事先固定的,因此可以使用預定義的頻帶濾 波器組,基于頻帶增益導出頻點增益,從而降低音頻信號處理的延遲。本發明的實施例所帶 來的其他益處將通過下文描述而清楚。
【附圖說明】
[0011] 通過參考附圖閱讀下文的詳細描述,本發明實施例的上述以及其他目的、特征和 優點將變得易于理解。在附圖中,以示例而非限制性的方式示出了本發明的若干實施例,其 中:
[0012] 圖1示出了根據本發明的一個示例實施例的用于處理音頻信號的方法的流程圖;
[0013] 圖2示出了根據本發明的另一示例實施例的用于處理音頻信號的方法的流程圖;
[0014] 圖3示出了根據本發明的一個示例實施例的加窗信號的框圖;
[0015] 圖4A和圖4B示出了根據本發明的一個示例實施例的對數掃略(log swe印)信號 的頻帶激勵的框圖;
[0016] 圖5示出了根據本發明的示例實施例的示例對稱的五個揚聲器配置的示例的示 意圖;
[0017] 圖6示出了根據本發明的示例實施例的用于處理音頻信號的系統的框圖;以及
[0018] 圖7示出了適于實現本發明的示例實施例的計算機系統的框圖。
[0019] 在各個附圖中,相同或對應的標號表不相同或對應的部分。
【具體實施方式】
[0020] 下面將參考附圖中示出的若干示例實施例來描述本發明的原理。應當理解,描述 這些實施例只是為了使本領域技術人員能夠更好地理解進而實現本發明,而并非以任何方 式限制本發明的范圍。
[0021] 本發明的基本思想是:通過控制頻域中的一組預定義頻帶的頻帶增益來處理音頻 信號。根據本發明的實施例,待操作的頻帶可以根據例如人類聽覺特性或者模型而被事先 定義和固定。而且,由于頻帶是事先固定的,因此可以使用預定義的頻帶濾波器組以頻帶增 益為基礎生成頻點增益,從而縮短音頻信號處理中的延遲。另外,由于所要處理的頻率系數 的減少,與時頻變換(時域向頻域的變換)和頻時變換(頻域向時域的變換)相關聯的時 間代價將會顯著降低。
[0022] 首先參考圖1,其示出了根據本發明的示例實施例的用于處理音頻信號的方法 100的流程圖。
[0023] 在步驟S101,對于待處理的音頻信號的當前幀或者塊,至少部分地基于當前幀的 頻率參數來確定多個預定義頻帶的頻帶能量。在某些實施例中,音頻信號可以作為頻域信 號被輸入。例如,音頻信號的形式可以是一系列頻點,每個頻點例如被表示為一個復數。備 選地,輸入音頻信號可以處于時域中,并且因此需要被變換到頻域中,這將在下文詳述。
[0024] 根據本發明的實施例,頻帶可以事先定義,例如根據人類聽覺特性或者模型來定 義。例如,已經證明:人類用戶對特定范圍內的頻率是敏感的,例如0到24kHz的范圍。相 應地,將僅對處于該范圍內的頻帶進行頻域處理。這樣,本發明的實施例利用了一種遵循人 類聽覺系統的方便、高效的簡化,以有助于降低延遲。例如,在某些實施例中,〇到24kHz范 圍內的頻率可以被劃分為20個頻帶。應當注意,這僅僅是出于說明目的,任何其他適當的 頻率范圍和/或頻帶數目均可被使用。
[0025] 對于當前幀的每個預定義頻帶,可以存在與之關聯的頻率參數。頻率參數可以通 過各種不同的方式獲得。例如,在上文描述的某些實施例中,頻域音頻信號可以包括多個頻 點,每個頻點被表示為一個復數。在這樣的實施例中,每個復數的實部和虛部可以被用作頻 率參數。備選地或附加地,可以通過對音頻信號的任何適當的頻率分析或者處理來獲得頻 率參數。
[0026] 每個頻帶的頻帶能量可以基于當前幀的關聯頻率參數而確定。給定頻率參數,可 以將頻帶能量計算為例如頻率參數的和或者平方和,這方面的示例實施例將在下文詳述。
[0027] 接下來,方法100進行到步驟S102,在此處理頻帶能量以生成預定義頻帶的頻帶 增益。根據本發明的實施例,對一個或多個頻帶能量的處理可以通過任何適當的頻域音頻 處理技術來實現,包括但不限于均衡器處理、調節器處理、峰值限制處理,等等。相應地,均 衡器、調節器、峰值限制器或者任何其他設備均可與本發明的實施例結合使用,不論它們是 目前已知的還是將來開發的。特別地,在某些實施例中,為了生成頻帶增益,可以根據用于 回放音頻信號的回放設備的一個或多個參數來處理頻帶能量,從而實現特定于設備的音頻 信號處理。通過處理頻帶能量而生成頻帶增益的很多技術是已知的并且可以用于本發明的 實施例。本發明的范圍在這方面不受限制。
[0028] 繼而,在步驟S103,生成當前幀的頻點增益。根據本發明的實施例,可以使用特定 于所述多個預定義頻帶的多個預定義頻帶濾波器組,以基于頻帶增益生成頻點增益。例如, 可以針對每個預定義頻帶而設計一個濾波器組。如上所述,頻帶是預定義的。相應地,特定 于每個頻帶的頻帶濾波器組也可以被事先設計。通過向頻帶增益應用這樣的頻帶濾波器 組,可以獲得多個頻點增益,其形式例如是濾波器系數。
[0029] 給定頻點增益,例如可以通過將頻點增益與相應的頻點相乘來確定當前幀的頻域 輸出。特別地,在某些實施例中,當前幀的頻域輸出可以僅僅基于當前幀的頻點來確定。在 某些備選實施例中,當前幀的頻域輸出不僅可以基于當前幀的頻點增益、而且還可以基于 音頻信號的至少一個先前幀的頻點增益而被確定。
[0030] 通過執行方法100,本發明的實施例能夠以較低的延遲來處理音頻信號。具體而 言,如上所述,已知的方案需要獲得和處理大量的頻率系數以滿足質量要求,這將導致變換 中的較長延遲。相反,根據本發明的實施例,只需要針對特定數目的預定義的、固定的頻帶 來控制頻帶增益。由此,時頻變換和頻時變換的時間代價將會被顯著降低。而且,生成的頻 率增益可以通過預定義的頻帶濾波器組而被轉換為頻點增益,這些頻帶濾波器組是特定于 預定義頻帶的。因為這些頻帶濾波器組可以根據頻帶的定義而被設計,因此快速地實現頻 點增益和頻域輸出的生成。
[0031] 圖2示出了根據本發明的示例實施例的用于處理音頻信號的方法200的流程圖。 將會理解,方法200可以被視為上文描述的方法100的