中文字幕无码日韩视频无码三区

通信系統中噪聲抑制方法及裝置的制作方法

文檔序號:7570524閱讀:431來源:國知局
專利名稱:通信系統中噪聲抑制方法及裝置的制作方法
技術領域
本發明涉及一般的噪聲抑制,尤其涉及通信系統中的噪聲抑制。
通信系統中的噪聲抑制技術廣為人知。噪聲抑制系統的目的是減少在語音編碼中的背景噪聲量,從而提高用戶編碼語音信號的總體性能。完成語音編碼的通信系統包括語音信箱系統、蜂窩無線電話系統、干線通信系統、航空通信系統等等,但也不局限于這些。
一種已被蜂窩無線電話系統采用的噪聲抑制技術是頻譜相減。在這種方法中,用一適當的分頻器將音頻輸入分成單獨的頻帶(信道),此單獨的頻譜信道然后根據每個信道的噪聲能量含量進行衰減。這種頻譜相減方法利用背景噪聲功率頻譜密度估算值,為每個信道中的語音產生一信噪比(SNR),反過來再利用它為每個單獨的信道計算一增益系數。然后用該增益系數作為輸入,去修正每個單獨頻譜信道的信道增益。這些信道然后再合并產生經過噪聲抑制的輸出波形。這種頻譜相減方法在模擬蜂窩無線電話系統中實現的一個例子,可參閱美國專利號為4811404的專利,由Vilmur發明,遵照本發明應用指派人的意見,在此一并作為參考。
如前面提到的美國專利中所說一樣,當有一突發的、背景噪聲電平迅增時,原有的噪聲抑制技術受到嚴重影響。為克服前述技術的這個缺陷,在前述的Vilmur的美國專利中采用的是若經M幀后依舊沒有更新任何一個背景噪聲估算,將進行強制更新噪聲估算值而不管音量和,此處Vilmur推薦M在50到300之間取值。由于Vilmur所說的一幀是10ms,并假定M取為100,則不管音量VMSUM(也就是不管是否需要進行一次更新),每一秒至少進行一次更新。
不管音量而強制更新噪聲估算會導致即使沒有額外的背景噪聲加入,用戶的語音信號也會衰減。這又反過來導致終端用戶接收到的聲音質量下降。而且,輸入信號不是用戶語音信號(如“連續的音樂”)時會導致問題,因為噪聲估算的強制更新會在連續的時間間隔內發生。這是由于音樂可能在幾秒(或幾分種)內沒有足夠的停頓允許進行正常的背景噪聲估算更新。前述技術因此允許每M幀就進行一次強迫更新,因為它沒有一種機制能將背景噪聲從非穩態輸入信號中區分出來。無效的強迫更新不僅減弱了輸入信號,同時,由于頻譜估算是根據時變非穩態輸入來更新的,從而會導致它產生嚴重變形。
因此,在通信系統中,需要使用一種更為精確和可靠的噪聲抑制系統。


圖1概括性地描述了一用于通信系統的語音編碼器的方框圖。
圖2概括性地描述了與本發明對應的噪聲抑制系統的方框圖。
圖3概括性地描述了在與本發明對應的噪聲抑制系統中所產生的幀對幀重疊。
圖4概括性地描述了在與本發明對應的噪聲抑制系統中所產生的預加重樣值的梯形開窗。
圖5概括性地描述了如圖2所描述的頻譜偏差估算器的方框圖,它用于與本發明對應的噪聲抑制系統中。
圖6概括性地描述了如圖2所描述的更新判決器的操作步驟流程圖,用于與本發明對應的噪聲抑制中。
圖7概括性地描述了一采用與本發明對應的噪聲抑制系統而從中受益的通信系統的方框圖。
圖8概括性地描述了采用以前技術實現時,與語音信號的噪聲抑制有關的變量。
圖9概括性地描述了采用與本發明對應的噪聲抑制系統實現時,與語音信號的噪聲抑制有關的變量。
圖10概括性地描述了采用以前技術實現時,與音樂信號的噪聲抑制有關的變量。
圖11概括性地描述了采用與本發明對應的噪聲抑制系統實現時,與音樂信號的噪聲抑制有關的變量。
在通信系統中實現的噪聲抑制系統,在背景噪聲電平突增期間,它提供一種經改進的更新判決。該噪聲抑制系統除了別的以外,通過持續地監視頻譜能量偏差以及根據預定閾值標準進行的強迫更新來產生更新。此頻譜能量偏差由對先前功率頻譜成分的數值進行指數加權的單元來決定。指數加權是當前輸入能量的函數,意思是說,輸入信號能量越高,該指數窗口就越長。反過來,此信號能量越低,該指數窗口就越短。這樣一來,該噪聲抑制系統防止了在連續非穩態輸入信號(諸如“連續的音樂”)期間進行強迫更新。
一般說來,語音編碼器在通信系統中實現噪聲抑制系統。該通信系統在信道中用信息幀傳輸語音樣值,信道中的信息幀包含了信道上的噪聲。語音編碼器以語音樣值作為輸入,并包括根據偏差來抑制噪聲從而生成噪聲抑制語音樣值的裝置,用該裝置來抑制語音樣值幀中的噪聲,此偏差是語音樣值當前幀的頻域能量與語音樣值的大量先前幀的平均頻譜能量之間的差值。然后,一種用于對噪聲抑制語音樣值進行編碼的裝置對該噪聲抑制語音樣值進行編碼,由該通信系統來傳輸。在優選實施方式中,該語音編碼器要么位于集中基站控制器(CBSC),要么位于通信系統的移動臺(MS)。然而,在其它實施方式中,該語音編碼器可以位于移動交換中心(MSC)或基站收發信臺(BTS)。還有,在優選實施方式中,該語音編碼器是在碼分多址(CDMA)通信系統中實現的,但本技術的有利之處是與本發明對應的該語音編碼器和噪聲抑制系統可應用到許多不同類型的通信系統中。
在優選實施方式中,用于抑制語音樣值的一幀中的噪聲的裝置包括根據信道能量估算,用于估算在語音樣值當前幀內總信道能量的裝置;以及,根據信道能量估算,用于估算語音樣值當前幀的頻譜功率的裝置。它還包括一種根據當前幀的頻譜功率估算,對語音樣值的大量先前幀的頻譜功率進行估算的裝置。借助這些信息,一用于判決偏差的裝置來決定所述的頻譜偏差,該偏差是當前幀的頻譜估算與大量先前幀的頻譜功率估算之間的差值;根據總的信道能量估算及此判決所得的偏差,一裝置對該信道噪聲估算進行更新。根據此噪聲估算更新,用于修正信道增益的裝置修正信道增益,產生噪聲抑制語音樣值。
在優選實施方式中,用于估算信息的大量先前幀的頻譜功率的裝置還包括根據信息的大量先前幀的指數加權來估算這些先前幀的頻譜功率的裝置,此處對信息的這些先前幀的指數加權是當前信息幀內的總信道能量估算的函數。另外,在此發明優選實施方式中,根據總信道能量估算及判決所得的偏差來進行信道噪聲估算更新的裝置還包括對信道噪聲估算進行更新的裝置,它是根據此總信道能量估算與第一閾值的比較結果,以及判決所得偏差與第二閾值的比較結果來進行的。更明確地說,根據總信道能量估算與第一閾值的比較結果,以及判決所得偏差與第二閾值的比較結果,來對信道噪聲估算進行更新的裝置還包括用于更新信道噪聲估算的裝置,它在總信道能量估算大于第一預定數量幀的第一閾值,同時又沒有總信道能量估算小于或等于此第一閾值的第二預定數量的連續幀,并且判決所得偏差低于第二閾值時進行更新。在該發明優選實施方式中,此第一預定數量幀是50幀,而第二預定數量的連續幀是6幀。
圖1概括性地描述了用于通信系統的語音編碼器100的方框圖。在該優選實施方式中,此語音編碼器100是一率可變語音編碼器100,它適于在碼分多址(CDMA)通信系統中進行噪聲抑制,此通信系統與過渡標準(IS)95兼容。有關IS-95的更多信息,參閱TIA/EIA/IS-95,1993年七月的“雙模式寬帶擴頻蜂窩系統移動站-基站兼容性標準”,在此一并作為參考。另外,在該發明優選實施方式中,此率可變語音編碼器100支持IS-95允許的四種比特率中的三種全速率(速率1-每幀170比特)、1/2速率(速率1/2-每幀80比特)以及1/8速率(速率1/8-每幀16比特)。可喜的是,在后面所描述的實施方式只是個例子而已,此語音編碼器100是和許多不同類型的通信系統兼容的。
參看圖1,用于對噪聲抑制后的語音樣值進行編碼的裝置102采用的是冗余碼激勵線性預測(RCELP)算法,在本技術中廣為人知。有關RCELP算法的更多信息,可參閱W.B.Kleijn,P.Kroon,和D.Nahumi的“RCELP語音編碼算法”,發表在1994年9/10月的European Transactions onTelecommunications,第五卷,第5期,573-582頁。有關適合率可變操作及CDMA環境中強壯要求的修正RCELP算法的更多信息,參閱D.Nahumi和W.B.Kleijn的“一種改進8kb/s RCELP編碼器”,發表在Proc.ICASSP1995上。RCELP是碼激勵線性預測(CELP)算法的概括。有關CELP算法的更多信息,參閱B.S.Atal和M.R.Schroeder的“在極低比特速率下的隨機語音編碼”,發表在Proc Int.Conf.Comm.,Amsterdam,1984年,第1610-1613頁。上述所有參考文獻在此都作為參考。
雖然上述參考文獻提供了CELP/RCELP算法的完整說明,但對RCELP算法作一簡要描述還是有用的。與CELP編碼器不同,RCELP不要求與信源用戶的語音信號完全匹配。取而代之的是RCELP與信源殘余的“時間回繞”語音信號匹配,此殘余與用戶語音信號的簡化音調包絡一致。此用戶語音信號的音調包絡通過估算每幀中一次的音調延遲得到,并從幀到幀來線性插入此音調。用這種簡化音調表示法的一個好處是在每幀中,可比采用傳統的部分音調方法時獲得更多的比特,用于隨機激發與信道損害的保護。這樣一來,在明確的信道條件下,不對確知語音的質量產生影響的同時,提高了幀的錯誤性能。
參看圖1,語音編碼器100的輸入是一語音信號矢量,s(n)103,以及一外部速率指令信號106。此語音信號矢量103可由一模擬輸入通過每秒8000次的采樣速率產生,并對所得的語音樣值進行線性(均勻)量化,動態范圍至少為13比特。此語音信號矢量103也可以由8比特的μ律輸入產生,參照ITU-T建議G.711中的表2格式,將其轉換成統一的脈沖編碼調制(PCM)格式。外部速率指令信號106可以指揮編碼器,產生一空包或不僅僅是速率1的一個包。如果接收到了外部速率指令信號106,此信號將接管語音編碼器100的內部速率選擇機構。
輸入語音矢量103被送到噪聲抑制裝置101中,此裝置在本優選實施方式中是噪聲抑制系統109。噪聲抑制系統109執行與本發明對應的噪聲抑制。然后,將經噪聲抑制后的語音矢量s(n)112同時送到速率判決模塊115以及模型參數估算模塊118中。此速率判決模塊115利用語音激活檢測(VAD)算法和速率選擇邏輯電路來確定要產生的包類型(速率1/8、1/2或1)。此模型參數估算模塊118進行線性預測編碼(LPC)分析,以產生模型參數121。這些模型參數包括一組線性預測系數(LPCs)和一最佳音調延遲(t)。模型參數估算模塊118還將LPCs轉換為線性頻譜對(LSPs),并計算長時及短時預測增益。
這些模型參數121輸入到一可變速率編碼模塊124中,模塊124用與所選速率對應的方法提取受激信號特征并量化這些模塊參數121。速率信息是從速率判決信號139獲得,該信號同時也輸入到此可變速率編碼模塊124中。如果選擇了速率1/8,此可變速率編碼模塊124將不對語音冗余中的任何周期進行特征提取,而會用簡單提取它的能量輪廓特征來替代。對于速率1/2和速率1,此可變編程碼塊124會利用RCELP算法,去匹配信源用戶的時間回繞語音信號殘余。編碼后,包格式化模塊133接收所有這些參數,這些參數在可變速率編碼模塊124中計算和/或量化所得,包格式化模塊133還將包136格式化為與所選速率對應的格式。然后將格式化以后的包136送入復用子層以作進一步處理,速率判決信號139也一樣。有關語音編碼器100全面操作的進一步細節,參看IS-127公文“EVRC草稿標準(IS-127)”第一版,發行號為TR4 5.5.1.1/95.10.17.06,1995年10月17日,在此一并作為參考。
圖2概括性地描述了與本發明對應的改進噪聲抑制系統109的方框圖。在本優選實施方式中,此噪聲抑制系統109用于提高信號質量,它用在語音編碼器100的模型參數估算模塊118及速率判決模塊115中。不過,此噪聲抑制系統109通常能和設計人員在特定通信系統中希望實現的任何類型的語音編碼器一起工作。值得注意的是,在本應用的圖2中描述的幾個方框,與Vilmur的美國專利號為4,811,404的圖1描述的對應方框功能相仿。遵照本應用指派人的意見,Vilmur的美國專利號為4,811,404的專利在此一并作為參考。
噪聲抑制系統109包括一高通濾波器(HPF)200及殘余噪聲抑制器電路。HPF200的輸出Shp(n)作為殘余噪聲抑制器電路的輸入。盡管該語音編碼器的一幀大小是20ms(按IS-95定義),但此殘余噪聲抑制器電路的一幀大小是10ms。結果,在此優選實施方式中,執行與本發明對應的噪聲抑制步驟是在每20ms語音幀內執行兩次。
在開始進行與本發明對應的噪聲抑制時,輸入信號s(n)經高通濾波器(HPF)200高通濾波后產生信號Shp(n)。該HPF 200屬四階Chebyshev II型濾波器,截止頻率為120Hz,這在本技術中十分熟悉。HPF 200的傳遞函數定義為Hhp(z)=Σi=04b(i)z-iΣi=04a(i)z-i]]>其中分子分母中的系數分別定義為b={0.898025036,-3.59010601,5.38416243,-3.59010601,0.898024917},a={1.0,-3.78284979,5.37379122,-3.39733505,0.806448996}。本技術的有利之處是,任何高通濾波器配置的數值都可采用。
接著,在預加重方框203中,用一平滑梯形窗對信號shp(n)開窗,在窗中輸入幀(幀“m”)的最開始的D個樣值d(m)與前一幀(幀“m-1”)的最末的D個樣值重疊。此重疊在圖3中看得很清楚。除非額外說明,所有變量的初值都為0,也就是說d(m)=0;m<=0。這可描述如下d(m,n)=d(m-1,L+n);0<=n<D,其中m是當前幀,n是緩沖區{d(m)}的樣值下標,L=80是幀長,D=24是樣值中的重疊(或延遲)。此輸入緩沖區的剩余樣值然后根據下式進行預加重d(m,D+n)=Shp(n)+ξpShp(n-1);0<=n<L,其中ξp=-0.8是預加重系數。這樣在輸入緩沖區中有L+D=104個樣值,其中,最開始的D個樣值是從前一幀經預加重重疊后得到的,剩下的L個樣值是從當前幀輸入得到的。
接著,在圖2的開窗框204中,平滑梯形窗口400(圖4)用于對樣值進行處理,以產生離散付立葉變換(DFT)輸入信號g(n)。在優選實施方式中,g(n)定義為
其中M=128,是DFT序列長度,其余項都已在前面定義。
在圖2的信道分配器206中,g(n)在轉換為頻域信號時采用的離散付立葉變換(DFT)定義如下
其中ejω是一單位幅度復相位,其瞬時徑向位置為ω。它不是經典定義,但它利用了復數快速付立葉變換(FFT)的效率。比例系數2/M從預定的M點實序列得到,這些點用來產生M/2點復數序列,對它用M/2點復數FFT進行變換。在該優選實施方式中,信號G(k)包括65個單獨信道。此技術的細節可在Proakis和Manolakis的“數字信號處理導論”(第二版,NewYork,Macmillan,1988年)的721-722頁找到。
信號G(k)然后輸入到信道能量估算器109中,在那,當前幀m的信道能量估算Ech(m)由下式決定Ech(m,i)=max{Emin,αch(m)Ecp(m-1,j)+(1-αch(m))1fH(i)-fL(i)+1Σk=fL(i)fH(i)|G(k)|2};]]>0≤i<Nc,其中Emin=0.0625 是信道能量最小允許值,αch(m)是信道能量平滑系數(在下定義),Nc=16是結合信道數,fL(i)和fH(i)分別是低信道結合表fL和高信道結合表fH中的第i個元素。在此優選實施方式中,fL和fH定義如下fL={2,4,6,8,10,12,14,17,20,23,27,31,36,42,49,56},fH={3,5,7,9,11,13,16,19,22,26,30,35,41,48,55,63},信道能量平滑系數αch(m)可定義如下
它的意思是αch(m)假定第一幀的值為0(m=1),并且所有后續幀的值為0.45。這允許信道能量估算可初始化為第一幀的未經濾波的信道能量。另外,信道噪聲能量估算(在下定義)需初始化為第一幀的信道能量,也就是En(m,i)=max{Eimt,Ech(m,i)}m=1.0<=i<Nc其中Eimt=16是信道噪聲初始能量最小允許值。
然后用當前幀的信道能量估算Ech(m)來估算量化后的信道信噪比(SNR)索引,這在圖2的信道SNR估算器218中進行,定義如下σq(i)=max{0,min{89,round·10log10(Ech(m,i)En(m,i))/0.375}}};0≤i<Nc,]]>其中En(m)是當前信道噪聲能量估算(如后定義),{σq}的取值在0與89之間,包括0與89。
用此信道SNR估算{σq},音量總和在音量計算器215中用下式確定V(m)=Σi=0Nc-1V(σq(i))]]>其中V(k)是音量表V中90個元素的第k個元素的值,音量表定義如下V={2,2,2,2,2,2,2,2,2,2,2,3,3,3,3,3,4,4,4,5,5,5,6,6,7,7,7,8,8,9,9,10,10,11,12,12,13,13,14,15,15,16,17,17,18,19,20,20,21,22,23,24,24,25,26,27,28,28,29,30,31,32,33,34,35,36,37,37,38,39,40,41,42,43,44,45,46,47,48,49,50,50,50,50,50,50,50,50,50,50}。
當前幀的信道能量估算Ech(m)同時也用作頻譜偏差估算器210的輸入,它估算頻譜偏差ΔE(m)。參看圖5,此信道能量估算Ech(m)輸入到一對數功率頻譜估算器500中,在此,對數功率頻譜估算如下EdB(m,i)=10log10(Ech(m,i));0<=i<Nc當前幀的信道能量估算Ech(m)還輸入到總信道能量估算器503中,根據下式,決定當前幀的總信道能量估算Etot(m)Etot(m)=10log10(Σi=0Nc-1Ech(m,i)).]]>接著,由下式在指數開窗系數判決器506中,決定指數開窗系數α(m)(它是總信道能量Etot(m)的函數)α(m)=αH-(αH-αLEH-EL)(EH-Etot(m)),]]>它限制在αH和αL之間α(m)=max{αL,min{αH,α(m)}},其中EH和E是Etot(m)的線性插入的能量端點(以分貝表示,或dB),它被轉換為α(m),其范圍是αL≤α(m)≤αH。這些常數值定義為EH=50,EL=30,αH=0.99,αL=0.50。這些給定后,例如相對能量為40dB的信號,根據上述的計算,用α(m)=0.745的指數開窗系數。
然后在頻譜偏差估算器509中估算頻譜偏差ΔE(m)。頻譜偏差AE(m)是當前功率頻譜與平均長時功率頻譜估算之間的差值&Delta;E(m)=&Sigma;i=0Nc-1|EdB(m,i)-E&OverBar;dB(m,i)|,]]>其中EdB(m)是平均長時功率頻譜估算,它在長時頻譜能量估算器512中用下式決定EdB(m+1,i)=α(m)EdB(m,i)+(1-α(m))EdB(m,i) 0≤i<Nc,其中所有的變量已在前面定義。EdB(m)的初值定義為幀1的估算所得的對數功率頻譜,或為EdB(m)=EB(m);m=1在該處,音量和v(m)、當前幀的總信道能量估算Etot(m)以及頻譜偏差ΔE(m)均輸入到更新決定判決器212中,簡化了與本發明對應的噪聲抑制。判決邏輯電路的偽代碼如下所示,并在圖6中的流程圖中有說明,示范了噪聲估算更新判決的進行過程。整個過程從步驟600開始,接著是步驟603清更新標志(update_flag)。然后,步驟604通過檢查音量和v(m)是否小于更新閾值(UPDATE_THLD),完成Vilmur的更新邏輯電路(僅是VMSUM)。如果音量和小于更新閾值,在步驟605清更新計數器(update_cnt),并在步驟606設置更新標志。步驟603到606的偽代碼如下所示<pre listing-type="program-listing"><![CDATA[update_flag=FALSE;if(v(m)<=UPDATE_THLD){ update_flag=TRUE update_cnt=0}]]></pre>如果在步驟604中,音量和大于更新閾值,則完成與本發明相應的噪聲抑制。首先,在步驟607,在頻譜偏差ΔE(m)與偏差閾值(DEV_THLD)相比較的同時,當前幀m的總信道能量估算Etot(m)與dB表示的噪聲下限(NOISE_FLOOR_DB)相比較。如果總信道能量估算大于噪聲下限并且頻譜偏差小于偏差閾值,則在步驟608更新計數器加1。更新計數器加1以后,在步驟609執行一測試,以判決更新計數器是否大于或等于更新計數器閾值(UPDATE_CNT_THLD)。如果步驟609的測試結果為真,則在步驟606中設置更新標志。步驟607到609及606的偽代碼如下<pre listing-type="program-listing"><![CDATA[else if((Etot(m)>NOISE_FLOOR_DB)and(ΔE(m)<DEV_THLD)){ update_cnt=update_cnt+1if(update_cnt>+UPDATE_CNT_THLD) update_flag=TRUE}]]></pre>從圖6可看出,如果步驟607和609的測試為假,或經步驟606設置了更新標志后,就可實現防止更新計數器長時“爬升”的邏輯電路。此磁滯邏輯電路避免了最小頻譜偏差的長期累積以及無效強制更新的產生。該過程從步驟610開始執行測試,以判決更新計數器是否已經等于最后六幀(HYSTER_CNT_THLD)的最后更新計數器值(last_update_cnt)。在該優選實施方式中,用六幀作為閾值,但也可以用其它任何數目的幀數。如果步驟610的測試為真,則在步驟611中清除更新計數器,并在步驟612退出而進入下一幀的處理。如果步驟610的測試為假,則直接轉到步驟612退出以進入下一幀的處理。步驟610到612的偽代碼如下<pre listing-type="program-listing"><![CDATA[if(update_cnt==last_update_cnt)hyster_cnt+1elsehyster_cnt=0last_update_cnt=update_cntif(hyster_cnt>HYSTER_CNT_THLD)update_cnt=0]]></pre>
在該優選實施方式中,前面用到的常量值如下UPDATE_THLD=35,NOISE_FLOOR_DB=10log10(1),DEV_THLD=28,UPDATE_CNT_THLD=50,TYSTER_CNT_THLD=6。
無論何時,根據一給定幀在步驟606中設置更新標志時,對下一幀的信道噪聲估算進行與本發明相應的更新。此信道噪聲估算根據下式在平滑濾波器224中進行En(m+l,i)=max{Emin,αnEn(m,i)+(1-αn)Ech(m,i)},0<=i<Nc其中Emin=0.0625是信道能量最小允許值,αn=0.9是信道噪聲平滑系數,它存儲在平滑濾波器224本地中。更新后的信道噪聲估算保存在能量估算存儲器225中,能量估算存儲器225的輸出是更新后的信道噪聲估算En(m)。此更新后的信道噪聲估算En(m)作為前述的信道SNR估算器218的輸入,還作為增益計算器233的輸入,增益計算器233將在下面描述。
接著,噪聲抑制系統109判斷是否需進行信道SNR修正。此判決在信道SNR修正器227中進行,它統計信道SNR索引超過索引閾值的信道數目。在修正過程本身期間,信道SNR修正器227降低那些SNR索引低于退化閾值(SETBACK_THLD)信道的SNR值,或在音量和小于音量閾值(METRIC_THLD)時降低所有信道的SNR值。在信道SNR修正器227中進行的信道SNR修正過程的偽代碼如下<pre listing-type="program-listing"><![CDATA[index_cnt=0for(i=NM to Nc-1step1){ if(σq(i)≥INDEX_THLD) index_cnt=index_cnt+1}if(index_cnt<INDEX_CNT_THLD) modify_flag=TRUEelse modify_flag=FALSEif(modify_flag==TRUE) for(i=O to Nc-1 step1) if((υ(m)≤METRIC_THLD)or(σq(i)≤SETBACK_THLD)) σ′q(j)=1 else σ′q(j)=σq(i)else {σ′q}={σq}]]></pre>在該處,信道SNR索引{σq}受SNR閾值塊230中的SNR閾值限制。常數σth存儲在SNR閾值塊230本地中。在此SNR閾值塊230中執行的處理的偽代碼如下<pre listing-type="program-listing"><![CDATA[for(i=O to Nc-1step1) if(σ′q(i)<σth) σ″q(j)=σth else σ″q(j)=σ′q(i)]]></pre>在本優選實施方式中,前述常數與閾值為NM=5,INDEX_THLD=12,INDEX_CNT_THLD=5,METRIC_THLD=45,SETBACK_THLD=12,σth=6。
在該處,受限的SNR索引{σ″q}輸入到增益計算器233中,在那決定信道增益。首先,用下式決定總增益系數&gamma;n=max{&gamma;min,-10log10(1Efloor&Sigma;i=0Nc-1En(m,i))},]]>其中,γmin=-13是最小總增益,Efloor=1是噪聲下限能量,En(m)是在前幀期間算得的估算噪聲頻譜。在本優選實施方式中,常數γmin和Efloor存儲在增益計算器233本地中。接著,信道增益(以dB表式)用下式決定γdB(i)=μg(σ″q(i)-σrh)+γn; 0≤i<Nc,其中μg=0.39是增益斜率(也存儲在增益計算器233本地上)。然后用下式進行線性信道增益轉換&gamma;ch(i)=min{1,10&gamma;dB(i)&prime;20};0&le;i&lt;Nc,]]>在此,變換后的輸入信號G(k)利用由上決定的信道增益,根據下述標準在信道增益修正器239生成輸出信號H(k)
上式中的“其它”條件假定k的間隔為0<=k<=M/2。進一步假定H(k)是偶對稱的,這樣就還可利用下述條件H(M-k)=H(k);0<k<M/2.然后,信號H(k)用下式的反DFT,在信道組合器242中被轉換(還原)到時域h(m,n)=12&Sigma;k=0M-1H(k)ej2&pi;nk/M;0&le;n&lt;M,]]>并且,根據下式標準,利用重疊及累加完成頻域濾波處理,生成輸出信號h′(n)
利用解加重方框245對信號h′(n)進行信號解加重,生成與本發明對應的噪聲抑制信號s(n)S(n)=h(n)+ξdS(n-1);0<=n<L其中ξd=0.8是解加重系數,存儲在解加重方框245本地中。
圖7概括性地描述了通信系統700的方框圖,它利用與本發明對應的噪聲抑制系統實現。在優選實施方式中,此通信系統是一碼分多址(CDMA)蜂窩無線電話系統。然而,利用本技術可在任何通信系統中實現與本發明對應的噪聲抑制系統,可從中獲益。這些系統包括語音信箱系統、蜂窩無線電話系統、干線通信系統、航空通信系統等等,但又不局限于這些。值得注意的一點是在那些不包括語音編碼的通信系統,如模擬蜂窩無線電話系統中,采用與本發明對應的噪聲抑制系統也會帶來好處。
參看圖7,為方便起見采用了縮寫。下面是圖7中用到的縮寫定義列表BTS 基站收發信臺CBSC 中央基站控制器EC波消除器VLR 訪問用戶位置寄存器HLR 本地位置寄存器ISDN 綜合業務數字網MS移動站MSC 移動交換中心MM移動性管理OMCR 操作維護中心-無線OMCS 操作維護中心-交換PSTN 公用交換電話網TC代碼轉換機如圖7所示,一BTS701-703耦合到一CBCS704中。每個BTS701-703向MS705-706提供射頻(RF)通信。在該優選實施方式中,支持RF通信的發射機/接收機(收發信機)硬件在BTSs701-703以及MSs705-706中實現,這在TIA/EIA/IS-95的文獻“雙模式寬帶擴展頻譜蜂窩系統的移動臺-基站兼容標準”(1993年7月)中有定義,這可從電信工業協會(TIA)獲得。CBSC704除了其它事之外,還利用TC710負責呼叫處理,并利用MM709完成移動管理。在此優選實施方式中,圖2中描述的語音編碼器100的機能位于TC704。CBSC704的其它工作包括特性控制和傳輸/網絡接口技術。有關CBSC704機能的更多信息,參看Bach等人的美國專利,應用序列號為07/997,997,遵照本發明應用指派人的意見,在此一并作為參考。
在圖7中還描述了耦合到CBSC704的MM709上的OMCR712。OMCR712負責通信系統700中無線部分(CBSC704和BTS701-703相結合)的操作與一般維護。CBSC704耦合到MSC715中,MSC715提供在PSTN720/ISDN722和CBSC704之間的交換能力。OMCS724負責通信系統700交換部分(MSC715)的操作與一般維護。HLR716和VLR717向通信系統700提供用戶信息,主要用于計費目的。ECs711與719用于提高通過此通信系統700傳輸的語音信號的質量。
CBSC704、MSC715、HLR716和VLR717的機能如圖7所示,然而有利的是,本技術中的某個一般技術同樣可將這些機能集中到單個單元中。而且,對不同的配置,TC710同樣可位于MSC715或BTS701-703中。既然此噪聲抑制系統109的機能具有一般性,本發明擬采用在一個單元(如MSC715)中執行與本發明對應的噪聲抑制,同時在不同的單元(如CBSC704)中實現語音編碼功能。在此實施方式中,經噪聲抑制后的信號s′(n)(或代表經噪聲抑制后的信號s′(n)的數據)通過鏈路726,從MSC715傳送到CBSC704。
在此優選實施方式中,TC710利用如圖2所示的噪聲抑制系統109,進行與本發明對應的噪聲抑制。將MSC715與CBSC704耦合到一起的鏈路726是一T1/E1鏈路,本技術人員對此十分熟悉。將TC710放到CBSC中后,由于TC710對輸入信號(從T1/E1鏈路726輸入)進行了壓縮,鏈路預算可提高4倍。壓縮后的信號傳送到某特定的BTS701-703中,由它傳輸給某特定的MS705-706。要注意的是,傳送給特定BTS701-703的是壓縮信號,在進行傳輸前還要在BTS701-703中作進一步的處理。也就是說,最終發射給MS705-706的信號與TC710輸的壓縮信號相比,形式不同但本質一樣。在任何情形下,用噪聲抑制系統109(如圖2)對TC710輸出的壓縮信號進行與本發明對應的噪聲抑制。
當MS705-706接收到由BTS701-703發射的的信號時,MS705-706會“還原”(通常是指“解碼”)在BTS701-703中所作的所有操作以及由TC710所作的語音編碼。當MS705-706發射回信號給BTS701-703時,它同樣完成語音編碼。因此,圖1中的語音編碼器在MS705-706中同樣也有,這樣一來,MS705-706也執行與本發明對應的噪聲抑制。信號經噪聲抑制后,由MS705-706發射(MS還對信號作進一步的處理以改變信號格式,但不改變其本質)給BTS701-703,BTS701-703對信號進行“還原”,將所得信號發送給TC710以進行語音解碼。經TC710的語音解碼后,信號通過T1/E1鏈路726發送給一終端用戶。由于終端用戶與MS705-706的用戶最終接收的都是經過了與本發明對應的噪聲抑制,因此每個用戶可獲得語音編碼器100的噪聲抑制系統109帶來的好處。
圖8概括性地描述了采用以前技術時,與語音信號的噪聲抑制有關的變量;而圖9則概括性地描述了采用與本發明對應的噪聲抑制系統時,與語音信號的噪聲抑制有關的變量。在此,不同的曲線代表不同狀態變量的值,它們是幀序號m的函數,如水平軸所示。圖8和圖9的第一條曲線(曲線1)顯示的總信道能量Etot(m),接著是音量和v(m)、更新計數器(update_cnt或Vilmur中的TIMER)、更新標志(update_flag)、信道噪聲估算和(∑En(m,i)以及估算信號衰減10log10(Einput/Eoutput),其中輸入是Shp(n),輸出是s′(n)。
參看圖8和圖9,在曲線1中可觀察到,背景噪聲的增加就在幀600之前。在幀600以前的輸入是一“干凈的”(低背景噪聲)語音信號801。當背景噪聲803突然增加時,曲線2中描述的音量和v(m)也相應增加,并且以前的噪聲抑制方法較差。從該狀態還原的能力如曲線3所示,其中更新計數器(update_cnt)只要不執行更新,就允許一直增加。在本例中顯示,大約在幀900的有效語音期間更新計數器達到更新閾值(UPDATE_CNT_THLD)300(對Vilmur)。大約在幀900設置更新標志(update_glag),如曲線4所示,利用曲線5所示的有效語音信號可完成背景噪聲估算的更新。這可通過曲線6所示的有效語音的衰減觀察到。著重注意的是噪聲估算的更新發生在語音信號期間(曲線1的幀900是在語音期間),通過語音信號不必要的更新產生的“掩蔽”效應來完成的。同樣,由于更新計算閾值可能在正常語音期間終止,為防止這樣的更新需要一相對較高的閾值(300)。
參看圖9,更新計數器只在背景噪聲增加期間但在語音信號開始之前增加。同樣,更新閾值可下降到50而依舊保持可靠的更新。在此,更新計數器直到幀650方達到更新計數器閾值(UPDATE_CNT_THLD)50,這使噪聲抑制系統109有足夠的時間,在語音信號幀800返回之前集中于新噪聲狀態。在這段時間中,可看到衰減只在非語音幀期間發生,從而不產生語音信號的“掩蔽”效應。結果,終端用戶聽到的是經過改進的語音信號。
語音信號得到改進是由于更新判決是基于當前幀能量與先前幀平均能量之間的頻譜偏差,而不是簡單地讓定時器在沒有正常音量更新時中止工作。在后一種情形下(就象Vilmur所提到的),系統察覺到語音信號增加的同時,若噪聲突然增加,它就無法從真實語音信號中將增加的背景噪聲電平區分出來。而利用頻譜偏差可將背景噪聲從真實語音信號中區分出來,從而提高了更新判決。
圖10概括性地描述了采用以前的技術時,與音樂信號的噪聲抑制有關的變量,而圖11概括性地描述了采用與本發明對應的技術實現噪聲抑制時,與音樂信號的噪聲抑制有關的變量。為了說明,圖10和圖11中,直到幀600的信號與圖8和圖9中的干凈信號800是一樣的。參看圖10,以前的技術方法的作用與圖8中描述的背景噪聲的例子幾乎一樣。在幀600,音樂信號805產生如曲線2所示的實際連續音量和v(m),它最后被更新計數器(如曲線3所示)在幀900處丟棄。當音樂信號805的特性隨時間變化時,曲線6所示的衰減降低,但更新計數器繼續丟棄音量,如在幀1800處所示。相反地,如圖11所示,更新計數器(曲線3所示)從未達到閾值(UPDATE_CNT_THLD)50,因此不進行更新。參看圖11的曲線6,事實上沒有產生更新,在曲線6中,音樂信號805的衰減是常數0dB(也就是沒有衰減產生)。因此,用戶聽音樂(例如,“連續的音樂”)時,采用以前的技術實現噪聲抑制時會聽到不想要的音樂電平的變化;而采用與本發明對應的技術實現噪聲抑制時,音樂是維持在所希望的恒定電平上。
盡管本發明是在特定實施方式中進行演示與描述的,本技術的熟練技術人員能夠理解那些不脫離本發明實質及范圍的形式與具體細節的各種改變。在接下來的權利要求書中包括相應的結構、材料、行為以及所有裝置或步驟的等價裝置或步驟加上功能單元,以及與其它任何結構、材料或功能執行行為及其它特別聲明的單元的結合。
我的權利要求如下
權利要求
1.一種用于通信系統中的噪聲抑制方法,此通信系統用信道內的信息幀實現信息發送,信道內的信息幀有噪聲,需要進行信道的噪聲估算,該方法包括以下步驟估算信息當前幀內信道能量;根據估算所得的信道能量,在信息當前幀內估算總信道能量;根據估算所得的信道能量,在信息當前幀內估算頻譜功率;根據估算所得的當前幀的頻譜功率,估算大量信息先前幀的頻譜功率;確定當前幀頻譜估算與這些先前幀的頻譜功率估算之間的偏差;以及,根據總信道能量估算及確定所得的偏差,更新信道的噪聲估算。
2.權利要求1的方法,還包括根據噪聲估算的更新來修正信道增益以產生噪聲抑制信號的步驟。
3.權利要求1的方法,其中,估算大量信息先前幀的頻譜功率的步驟還包括根據這些信息先前幀的指數加權來估算大量先前幀的頻譜功率的步驟。
4.權利要求3的方法,其中,信息先前幀的指數加權是信息當前幀內的總信道能量估算的函數。
5.權利要求1的方法,其中,根據總信道能量估算和確定所得的偏差來更新信道噪聲估算的步驟還包括根據總信道能量估算與第一閾值的比較結果,以及確定所得的偏差與第二閾值的比較結果來更新信道噪聲估算的步驟。
6.權利要求5的方法,其中,根據總信道能量估算與第一閾值的比較結果,以及確定所得的偏差與第二閾值的比較結果來更新信道噪聲估算的步驟還包括當總信道能量估算大于第一閾值,并且確定所得的偏差低于第二閾值時,更新信道噪聲估算的步驟。
7.權利要求6的方法,其中,當總信道能量估算大于第一閾值,并且確定所得的偏差低于第二閾值時,更新信道噪聲估算的步驟還包括當第一給定數量幀的總信道能量估算大于第一閾值,同時沒有第二給定數量的后續幀的總信道能量估算小于等于第一閾值時,更新信道噪聲估算的步驟。
8.權利要求7的方法,其中,第一預定數量幀還包括50幀。
9.權利要求7的方法,其中,第二預定數量的后續幀還包括6幀。
10.權利要求1的方法,其中,此方法可在移動交換中心(MSC)、集中式基站控制器(CBSC)、基站收發信臺(BTS)或移動臺(MS)之中的任何一個內實現。
11.一種用于在通信系統抑制噪聲的裝置,此通信系統利用信道內的信息幀實現信息傳送,信道內的信息幀含有噪聲,因此要進行信道噪聲估算,該裝置包括用于估算信息當前幀內信道能量的裝置;根據信道能量估算,估算信息當前幀內總信道能量的裝置;根據信道能量估算,估算信息當前幀內的頻譜功率的裝置;根據當前幀的頻譜功率估算,估算大量信息先前幀的頻譜功率的裝置;用于確定當前幀的頻譜估算與大量先前幀的頻譜功率估算之間偏差的裝置;以及,根據總信道能量估算與確定所得的偏差,用于更新信道噪聲估算的裝置。
12.權利要求11的裝置,還包括根據噪聲估算的更新來修正信道增益的裝置,以產生噪聲抑制信號。
13.權利要求11的裝置,其中,此裝置耦合到一語音編碼器中,此語音編碼器的輸入是噪聲抑制信號。
14.權利要求11的裝置,其中,此裝置可位于通信系統中的移動交換中心(MSC)、集中基站控制器(CBSC)、基站收發信臺(BTS)或移動臺(MS)任何一個之中。
15.權利要求14的裝置,其中,通信系統還包括碼分多址(CDMA)通信系統。
16.權利要求11的裝置,其中,用于估算大量信息先前幀的頻譜功率的裝置還包括根據信息先前幀的指數加權,用于估算大量先前幀的頻譜功率的裝置。
17.權利要求16的裝置,其中,信息先前幀的指數加權是信息當前幀內的總信道能量估算的函數。
18.權利要求11的裝置,其中,根據總信道能量估算以及判決所得的偏差,來更新信道噪聲估算的裝置還包括根據總信道能量估算與第一閾值的比較結果,以及判決所得偏差與第二閾值比較結果,來進行信道噪聲估算更新的裝置。
19.權利要求18的裝置,其中,根據總信道能量估算與第一閾值的比較結果,以及判決所得偏差與第二閾值比較結果,來進行信道噪聲估算更新的裝置還包括當總信道能量估算大于第一閾值,并且判決所得的偏差低于第二閾值時,用于更新信道噪聲估算的裝置。
20.權利要求19的裝置,其中,當總信道能量估算大于第一閾值,并且判決所得的偏差低于第二閾值時,用于更新信道噪聲估算的裝置還包括當第一預定數量幀的總信道能量估算大于第一閾值,同時沒有第二預定數量的后續幀的總信道能量估算小于或等于此第一閾值時,用于更新信道噪聲估算的裝置。
21.權利要求20的裝置,其中,第一預定數量的幀還包括50幀。
22.權利要求20的裝置,其中,第二預定數量的后續幀還包括6幀。
23.一種在通信系統中用于語音編碼的語音編碼器,此通信系統利用信道內的信息幀傳送語音樣值,信道內的這些信息幀含有信道噪聲,此語音編碼器以語音樣值作為輸入,此語音編碼器包括根據語音樣值當前幀頻譜能量與大量語音樣值先前幀的平均頻譜能量之間的偏差,來抑制語音樣值一幀內的噪聲的裝置,以生成噪聲抑制語音樣值;以及,對通信系統傳送的噪聲抑制語音樣值進行編碼的裝置。
24.權利要求23的語音編碼器,其中,此語音編碼器可位于通信系統的移動交換中心(MSC)、集中基站控制器(CBSC)、基站收發信臺(BTS)或移動臺(MS)任何一個之中。
25.權利要求24的語音編碼器,其中,通信系統還包括碼分多址(CDMA)通信系統。
26.權利要求23的語音編碼器,其中,在一幀語音樣值內進行噪聲抑制的裝置還包括根據信道能量估算,估算語音樣值當前幀內的總信道能量的裝置;根據信道能量估算,估算語音樣值當前幀的頻譜功率的裝置;根據當前幀的頻譜功率估算,估算大量語音樣值先前幀的頻譜功率的裝置;用于確定當前幀的頻譜估算大量先前幀的頻譜功率估算之間的偏差的裝置;以及根據總信道能量估算和確定的偏差,用于更新信道噪聲估算的裝置;以及根據噪聲估算的更新,用于修正信道增益以產生噪聲抑制語音樣值的裝置。
27.一種用于通信系統中語音編碼的語音編碼器,通信系統利用信道內的信息幀傳送語音信號,信道內的這些信息幀含有信道噪聲,此語音編碼器以語音信號作為輸入,此語音編碼器包括根據語音信號當前幀內的頻譜能量與語音信號的大量先前幀內的平均頻譜能量之間的偏差,來抑制包含此語音信號的幀的噪聲,以產生噪聲抑制語音信號的裝置;以及用于編碼此噪聲抑制語音信號以供此通信系統傳送的裝置。
28.權利要求27的語音編碼器,其中,此語音編碼器可位于通信系統的移動交換中心(MSC)、集中基站控制器(CBSC)、基站收發信臺(BTS)或移動臺(MS)任何一個之中。
29.權利要求28的語音編碼器,其中,通信系統還包括碼分多址(CDMA)通信系統。
30.權利要求27的語音編碼器,其中,用于抑制包括語音信號的一幀內的噪聲的裝置還包括根據信道能量估算,估算此語音信號的當前幀內的總信道能量的裝置;根據信道能量估算,估算此語音信號的當前幀內的頻譜功率的裝置;根據當前幀的頻譜功率估算,估算語音信號的大量先前幀內的頻譜功率的裝置;確定當前幀的頻譜估算與大量先前幀的頻譜的功率估算之間偏差的裝置;以及,根據總信道能量與確定所得的偏差,更新信道噪聲估算的裝置;以及,根據噪聲估算的更新,來修正信道增益,以產生噪聲抑制語音信號的裝置。
31.權利要求30的語音編碼器,其中,語音信號既可以是模擬語音信號,也可以是數字語音信號。
全文摘要
在通信系統(700)中實現一種噪聲抑制系統(109),在諸如背景噪聲電平突增期間,它提供一種改進的更新判決。另外,此噪聲抑制系統(109)通過連續監視頻譜能量偏差以及,根據預定閾值標準強迫更新來產生一次更新。頻譜能量偏差由包含頻譜功率值的指數加權部分的先前值的單元決定。指數加權是當前輸入能量的函數,意思是輸入信號能量越高,指數窗口越長。反過來,信號能量越低,指數窗口越短。此噪聲抑制系統(109)還防止在連續的、非固定輸入信號(諸如“連續的音樂”)期間產生一強迫更新。
文檔編號H04Q7/20GK1168204SQ96191426
公開日1997年12月17日 申請日期1996年9月4日 優先權日1995年11月13日
發明者詹姆斯·P·阿施里 申請人:摩托羅拉公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1