中文字幕无码日韩视频无码三区

音頻編碼裝置和方法、音頻解碼裝置和方法以及程序的制作方法

文檔序號(hao):2833393閱讀:281來源:國知局
專利名稱:音頻編碼裝置和方法、音頻解碼裝置和方法以及程序的制作方法
技術領域
本技術涉及音頻編碼裝置和音頻編碼方法、音頻解碼裝置和音頻解碼方法以及程序。更具體而言,本技術涉及能夠通過自適應地使用更適當的窗函數來對音頻信號進行編碼的音頻編碼裝置和音頻編碼方法、音頻解碼裝置和音頻解碼方法、以及程序。
背景技術
作為音頻信號的編碼方法,通常,眾所周知的是MP3 (運動圖像專家組音頻層_3)、AAC (高級音頻編碼)、ATRAC (自適應變換聲學編碼)等作為轉換編碼方法。作為用于對音頻信號進行編碼的音頻編碼裝置,已知將音頻信號劃分成多個帶并接著以帶為基礎執行正交變換和量化(例如,參考第2906483號日本專利)。圖1是示出對音頻信號進行編碼的音頻編碼裝置的配置的示例的框圖。圖1所示的音頻編碼裝置10被配置為包括加窗部11、頻率轉換部12、歸一化系數確定部13、歸一化系數編碼部14、歸一化部15、量化部16、編碼部17和多路復用部18。音頻編碼裝置10接收PCM (脈沖編碼調制)信號的音頻信號T,該音頻信號是幀數據T[J]并被分段成多個特定段(section),特定段被稱為幀。音頻編碼裝置10對幀數據T[J]進行編碼。這里,J是從首幀開始按順序附于每幀的指數。音頻編碼裝置10的加窗部11將輸入的幀數據T[J]與窗函數WF相乘,并將所得到的相乘后數據WFT [J]提供給頻率轉換部12。頻率轉換部12對從加窗部12提供的相乘后數據WFT [J]執行頻率轉換,以獲得頻譜SP [J]。頻率轉換部12將頻譜SP [J]提供給歸一化系數確定部13和歸一化部15。歸一化系數確定部13基于從頻率轉換部12提供的頻譜SP[J]來確定表示頻譜SP[J]的輪廓(本文中,稱為包絡)的歸一化系數SF[J],并將該歸一化系數SF[J]提供給歸一化系數編碼部14和歸一化部15。歸一化系數編碼部14計算對從歸一化系數確定部13提供的歸一化系數SF[J]進行編碼所需的位數NSF[J],并且將該位數NSF[J]提供給量化部16。此外,歸一化系數編碼部14對歸一化系數SF[J]執行編碼,并且將所得到的編碼后歸一化系數HSF[J]提供給多路復用部18。歸一化部15通過使用從歸一化系數確定部13提供的歸一化系數SF[J]來對從頻率轉換部12提供的頻譜SP[J]進行歸一化,并將所得到的歸一化譜NSP[J]提供給量化部16。量化部15基于表示作為量化精度的量化位數的量化信息P[J]來對從歸一化部15提供的歸一化譜NSP [J]進行量化,并且將所得到的量化譜QSP [J]提供給編碼部17。此時,量化部16獲得從編碼部17反饋的、對應于量化譜QSP [J]的位數NQSP [J],并且調整量化信息P[J],使得位數NQSP[J]變為預定值。量化部16將調整后的量化信息P[J]提供給多路復用部18。編碼部17計算對從量化部16提供的量化譜QSP[J]進行編碼所需的位數NQSP[J]。這里,當下文將描述的碼串B[J]的位數NB[J]是預定的時,位數NQSP[J]必須是值NQ或更小,其中位數NB[J]減去與量化信息P[J]的位數NP[J]和歸一化系數SF[J]的編碼相關的位數NSF [J]。因此,編碼部17將位數NQSP [J]反饋至量化部16,并且量化部16調整量化信息P[J],使得位數NQSP[J]為值NQ或更小。此外,編碼部17對量化譜QSP[J]進行編碼,并將所得到的編碼頻譜HSP[J]提供給多路復用部18。多路復用部18將來自歸一化系數編碼部14的編碼后歸一化系數HSF[J]、來自量化部16的量化信息P[J]和來自編碼部17的編碼頻譜HSP[J]相乘,并且傳送所得到的碼串 B[J]。圖2是示出用于對從圖1所示的音頻編碼裝置10傳送的碼串B[J]進行解碼的音·頻解碼裝置的配置的示例的框圖。圖2所示的音頻解碼裝置30被配置為包括分解部31、解碼部32、逆量化部33、歸一化系數解碼部34、逆歸一化部35、逆頻率轉換部36、加窗部37和重疊部38。音頻解碼裝置30中的分解部31將從圖1所示的音頻編碼裝置10傳送的碼串B [J]分解成編碼頻譜HSP [J]、量化信息P [J]和編碼后歸一化系數HSF [J]。分解部31將編碼頻譜HSP[J]提供給解碼部32,將量化信息P [J]提供給逆量化部33,并且將編碼后歸一化系數HSF[J]提供給歸一化系數解碼部34。解碼部32對從分解部31提供的編碼頻譜HSP [J]進行解碼,并且將所得到的量化譜QSP[J]提供給逆量化部33。逆量化部33基于從解碼部31提供的量化信息P [J]來對從解碼部32提供的量化譜QSP [J]執行逆量化,以獲得歸一化譜NSP [J]。逆量化部33將歸一化譜NSP [J]提供給逆歸一化部35。歸一化系數解碼部34對從分解部31提供的編碼后歸一化系數HSF[J]進行解碼,并將所得到的歸一化系數SF[J]提供給逆歸一化部35。逆歸一化部35通過使用歸一化譜NSP [J]和從歸一化系數解碼部34提供的歸一化系數SF[J]來執行逆歸一化,并將所得到的頻譜SP [J]提供給逆頻率轉換部36。逆頻率轉換部36對從逆歸一化部35提供的頻譜SP[J]執行逆頻率轉換,并將所得到的時軸數據ST[J]提供給加窗部37。加窗部37將從逆頻率轉換部36提供的時軸數據ST[J]與窗函數WB相乘。圖1所示的加窗部11中的窗函數WF與窗函數WB之間的關系具有如下的約束條件。S卩,當量化位數是無限大的(量化精度是無限大的)時,以下將描述的輸入到音頻編碼裝置10的幀數據T[J]和從音頻解碼裝置30輸出的幀數據T[J]彼此一致。加窗部37將作為乘法結果所獲得的相乘后數據WBT [J]提供給重疊部38。重疊部38保存從加窗部37提供的相乘后數據WBT [J]。此外,重疊部38將所保存的指數為J-1的幀的相乘后數據WBT [J-1]與相乘后數據WBT [J]在彼此重疊例如一幀的一半的情況下相加。重疊部38將所得到的幀數據T[J]輸出作為解碼結果。應注意,為了簡化描述,作為解碼結果的幀數據以T[J]表示,其與編碼前的幀數據相同。然而,實際上,解碼結果和編碼前的幀數據不是相同的。在圖1所示的音頻編碼裝置10中,當對歸一化系數SF[J]的編碼所需的位數NSF[J]相對于碼串B[J]的位數NB[J]之比越大時,可用于頻譜SP[J]的編碼的位數NQSP[J]越小。結果,頻譜SP[J]的量化精度可能減小,從而導致音質劣化。
因此,通過減少編碼頻譜SP[J]的數量,可以在不使頻譜SP[J]的量化精度劣化的情況下減少位數NQSP [J],從而防止音質劣化。當減少編碼頻譜SP[J]的數量時,一般,主要減小了高通頻譜SP[J]。在這種情況下,作為解碼結果的聲音會導致產生不具有高通成分的聲音,即,所謂的像是從箱子里面發出的聲音。此外,眾所周知的是,當以幀為基礎編碼的頻譜SP[J]的數量改變時,這種改變可能導致音質劣化。另一方面,公知的是,即使在相同的幀數據T[J]輸入到音頻編碼裝置10時,與歸一化系數SF[J]的編碼和量化誤差相關的位數NSF[J]根據窗函數WF的配置而改變。

發明內容
因此,期望通過使用更適當的窗函數對音頻信號進行編碼來減少位數NSF[J]以及/或者提聞量化精度,從而減少首質劣化。鑒于上述情況而提出了本技術。本技術能夠使用更適當的窗函數來自適應地對音頻信號進行編碼。根據本技術的第一實施例,提供了一種音頻編碼裝置,包括第一加窗部,將音頻信號與第一窗函數相乘;第二加窗部,將音頻信號與第二窗函數相乘,第二窗函數的特征不同于第一窗函數的特征;窗選擇部,基于經第一加窗部相乘后的音頻信號和經第二加窗部相乘后的音頻信號,選擇第一窗函數或第二窗函數作為最佳窗函數;編碼部,對與最佳窗函數相乘后的音頻信號的頻譜進行編碼;以及傳送部,傳送經編碼部編碼后的頻譜和表示最佳窗函數的窗函數信息。本技術的第一實施例的音頻編碼方法和程序對應于本技術的第一實施例的音頻編碼裝置。在本技術的第一實施例中,將音頻信號與第一窗函數相乘,將音頻信號與特征與第一窗函數的特征不同的第二窗函數相乘,基于與第一窗函數相乘后的音頻信號和與第二窗函數相乘后的音頻信號來選擇第一窗函數或第二窗函數作為最佳窗函數,對與最佳窗函數相乘后的音頻信號的頻譜進行編碼,并且傳送編碼后的頻譜和表示最佳窗函數的窗函數信息。根據本技術的第二實施例,提供了一種音頻解碼裝置,包括接收部,接收編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息,其中,編碼頻譜作為對與作為最佳窗函數的第一窗函數或第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得的,第二窗函數的特征不同于第一窗函數的特征;解碼部,對接收部接收到的編碼頻譜進行解碼;窗選擇部,基于接收部接收到的窗函數信息來從第一窗函數和第二窗函數中選擇最佳窗函數;以及加窗部,基于窗選擇部選擇的最佳窗函數,根據作為解碼部執行解碼的結果而獲得的頻譜的音頻信號生成音頻信號。本技術的第二實施例的音頻解碼方法和程序對應于本技術的第二實施例的音頻解碼裝置。在本技術的第二實施例中,接收編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息,其中,編碼頻譜作為與作為最佳窗函數的第一窗函數或第二窗函數相乘后的音頻信號的頻譜的編碼結果而獲得的,第一窗函數的特征不同于第一窗函數的特征;對所接收到的編碼頻譜進行解碼;基于所接收到的窗函數信息來從第一窗函數和第二窗函數中選擇最佳窗函數;基于所選擇的最佳窗函數,根據作為解碼結果而獲得的頻譜的音頻信號生成音頻信號。根據本技術的第一實施例,可以通過自適應地使用更適當的窗函數來對音頻信號進行編碼。根據本技術的第二實施例,可以通過自適應地使用更適當的窗函數來對編碼后的音頻信號進行解碼。


圖1是示出對音頻信號進行編碼的音頻編碼裝置的配置的示例的框圖;圖2是示出已知的音頻解碼裝置的配置的示例的框圖;圖3是示出應用了本技術的音頻編碼裝置的第一實施例的配置示例的框圖;圖4示出窗函數WFl的示例;圖5示出窗函數WF2的示例;圖6示出頻譜SPl [J]的示例;圖7示出頻譜SP2 [J]的示例;圖8是說明圖3所示的音頻編碼裝置進行的編碼處理的流程圖;圖9是示出與圖3所示的音頻編碼裝置對應的音頻解碼裝置的配置示例的框圖;圖10是說明圖9所示的音頻解碼裝置的解碼處理的流程圖;圖11是示出應用了本技術的音頻編碼裝置的第二實施例的配置示例的框圖;圖12是說明圖11所示的音頻編碼裝置進行的編碼處理的流程圖;以及圖13示出計算機的實施例的配置示例。
具體實施例方式下文中,將參照附圖詳細描述本公開的優選實施例。應注意,在本說明書和附圖中,具有基本上相同的功能和結構的結構元件以相同的附圖標記表示,并且省略了對這些結構元件的重復說明。<第一實施例>[音頻編碼裝置的第一實施例的配置示例]圖3是示出應用了本技術的音頻編碼裝置的第一實施例的配置示例的框圖。在圖3所示的配置中,與圖1所示的元件相同的元件被賦予了相同的標記。將適當地省略重復描述。圖3所示的音頻編碼裝置50的配置與圖1所示的配置的不同之處在于,設置了加窗部51和55、頻率轉換部52和56、歸一化系數確定部53和57、歸一化系數編碼部54和58以及多路復用部61來替代圖1所示的配置中的加窗部11、頻率轉換部12、歸一化系數確定部13、歸一化系數編碼部14和多路復用部18,并且不同之處還在于對其新設置了窗選擇部59和頻譜選擇部60。音頻編碼裝置50將幀數據T [J]與各自具有彼此不同特征的窗函數WFl和窗函數WF2相乘。而且,音頻編碼裝置50基于對頻譜的歸一化系數進行編碼所需的位數,選擇獲得歸一化系數的最佳編碼效率的窗函數作為最佳窗函數,其中,該頻譜是通過對所得到的相乘后數據執行頻率轉換而獲得的。具體而言,在音頻編碼裝置50中,包括加窗部51、頻率轉換部52、歸一化系數確定部53和歸一化系數編碼部54的路徑I用于獲得與窗函數WFl相乘的幀數據T[J]的頻譜SPl [J]以及編碼后歸一化系數HSFl [J]。更具體而言,加窗部51將輸入的幀數據T [J]與窗函數WFl相乘,并且將所得到的相乘后數據WFTl [J]提供給頻率轉換部52。頻率轉換部52對從加窗部51提供的相乘后數據WFTl [J]執行頻率轉換,以獲得頻譜SPl [J]。頻率轉換部52將頻譜SPl [J]提供給歸一化系數確定部53和頻譜選擇部60。歸一化系數確定部53根據從頻率轉換部52提供的頻譜SPl [J]確定頻譜SPl [J]的歸一化系數SFl [J],并且將其提供給歸一化系數編碼部54。歸一化系數編碼部54計算對從歸一化系數確定部53提供的歸一化系數SFl [J]的編碼所需的位數NSFl [J],并且將其提供給窗選擇部59。此外,歸一化系數編碼部54對歸一化系數SFl [J]進行編碼,并且將所得到的編碼后歸一化系數HSFl [J]和歸一化系數SFl [J]提供給窗選擇部59。包括加窗部55、頻率轉換部56、歸一化系數確定部57和歸一化系數編碼部58的路徑2被配置為與路徑I相同以獲得與窗函數WF2相乘的幀數據T[J]的頻譜SP2[J]以及編碼后歸一化系數HSF2[J]。具體而言,加窗部55將輸入的幀數據T [J]與窗函數WF2相乘,并將所得到的相乘后數據WFT2[J]提供給頻率轉換部56。頻率轉換部56對從加窗部55提供的相乘后數據WFT2 [J]執行頻率轉換以獲得頻譜SP2 [J]。頻率轉換部56將頻譜SP2 [J]提供給歸一化系數確定部57和頻譜選擇部60。歸一化系數確定部57根據從頻率轉換部56提供的頻譜SP2 [J]確定頻譜SP2 [J]的歸一化系數SF2[J],并將其提供給歸一化系數編碼部58。歸一化系數編碼部58計算對從歸一化系數確定部57提供的歸一化系數SF2[J]的編碼所需的位數NSF2 [J],并將其提供給窗選擇部59。此外,歸一化系數編碼部58對歸一化系數SF2[J]進行編碼,并將所得到的編碼后歸一化系數HSF2[J]和歸一化系數SF2[J]提供給窗選擇部59。窗選擇部59將從歸一化系數編碼部54提供的位數NSFl [J]與從歸一化系數編碼部58提供的位數NSF2[J]進行比較,并選擇與較小的位數對應的窗函數作為最佳窗函數。當位數NSF1[J]和位數NSF2[J]彼此相同時,窗選擇部59選擇窗函數WFl和窗函數WF2中的任一個。當選擇了窗函數WFl時,窗選擇部59將從歸一化系數編碼部54提供的編碼后歸一化系數HSFl [J]確定為編碼后歸一化系數HSF[J],將歸一化系數SFl [J]確定為歸一化系數SF [J],并將位數NSFl [J]確定為位數NSF [J]。窗選擇部59生成表示被選擇作為最佳窗函數的窗函數WFl的窗函數信息SW[J],并將其提供給頻譜選擇部60。另一方面,當選擇了窗函數WF2時,窗選擇部59將從歸一化系數編碼部58提供的編碼后歸一化系數HSF2[J]確定為編碼后歸一化系數HSF[J],將歸一化系數SF2[J]確定為歸一化系數SF [J],并將位數NSF2[J]確定為位數NSF [J]。此外,窗選擇部59生成表示被選擇作為最佳窗函數的窗函數WF2的窗函數信息SW[J],并將其提供給頻譜選擇部60。這里,假設表示窗函數WFl的窗函數信息SW[J]為0,并且表示窗函數WF2的窗函數信息SW[J]為I。窗選擇部59將編碼后歸一化系數HSF[J]提供給多路復用部61,將歸一化系數SF[J]提供給歸一化部15,并將位數NSF[J]提供給量化部16。頻譜選擇部60基于從窗選擇部59提供的窗函數信息SW[J],選擇從頻率轉換部52提供的頻譜SPl [J]或從頻率轉換部56提供的頻譜SP2 [J]。頻譜選擇部60將所選的頻譜SPl [J]或頻譜SP2 [J]作為頻譜SP [J]提供給歸一化部15。此外,頻譜選擇部60將窗函數信息SW [J]提供給乘法部61。多路復用部61對來自窗選擇部59的編碼后歸一化系數HSF[J]、來自頻譜選擇部60的窗函數信息SW[J]、來自量化部16的量化信息P[J]和來自編碼部17的編碼頻譜HSP[J]進行多路復用。多路復用部61起到傳送部的作用,以控制對作為乘法結果而獲得的碼串B[J]的傳送并傳送碼串B[J]。[窗函數WFl的示例]圖4示出窗函數WFl的示例。圖4A表示樣本數為N的窗函數WFl ;圖4B表示樣本數為N的窗函數WFl的頻率特征。在圖4A中,橫軸表示對于每個樣本的指數,以及縱軸表示窗函數WFl的幅度。在圖4B中,橫軸表示具有中心頻率0的頻率,其范圍基于弧度為從-Ji到+ JI。縱軸表示頻率特征的水平[dB]。如圖4A所示的窗函數WFl的頻率特征具有如圖4B所示的、中心頻率的水平尖銳地突出的特征。因此,窗函數WFl是具有較高頻率分辨率的窗函數。[窗函數WF2的示例]圖5示出窗函數WF2的示例。圖5A表示樣本數為N的窗函數WF2 ;圖5B表示樣本數為N的窗函數WF2的頻率特征。在圖5A中,橫軸表示對于每個樣本的指數,以及縱軸表示窗函數WF2的幅度。在圖5B中,橫軸表示具有中心頻率0的頻率,其范圍基于弧度為從-Ji到+ JI。縱軸表示頻率特征的水平[dB]。如圖5A所示的窗函數WF2的頻率特征具有如圖5B所示的、與圖4相比而言中心頻率的水平沒有尖銳地突出的特征。因此,窗函數WF2是具有較低頻率分辨率的窗函數。[頻譜的示例]圖6示出頻譜SPl [J]的示例。圖7示出頻譜SP2[J]的示例。在圖6和圖7中,橫軸表示頻率指數,以及縱軸表示頻譜的水平。此外,在圖6和圖7中,每個黑色圓圈各表示每個頻率指數的頻譜的水平,以及虛線表示歸一化系數。在圖6和圖7的示例中,為了簡化描述的目的,針對頻率指數的每個頻譜確定歸一化系數。然而,一般,針對幾個頻譜確定一個歸一化系數。由于窗函數WFl是具有較高頻率分辨率的窗函數,因此,當幀數據T[J]是具有較高音調的音頻信號(在圖6的示例中,具有頻率Fn的正弦信號)時,頻譜SPl [J]的能量收斂于如圖6所示的頻率指數Fn的頻譜。即,在頻譜SP1[J]的包絡中,頻率指數Fn的頻譜尖銳地突出。因此,在表示頻譜SPl [J]的包絡的歸一化系數SFl [J]中,頻率指數Fn的歸一化系數SFl [J]很大程度地突出。另一方面,由于窗函數WF2是具有較低頻率分辨率的窗函數,因此,頻譜SP2[J]整體分散,如圖7所示。即,與頻譜SP1[J]的包絡相比,在頻譜SP2[J]的包絡中,頻譜指數Fn的頻譜的突出部分沒有尖銳地突出。因此,與歸一化系數SFl [J]比較,在頻率指數Fn的歸一化系數SF2[J]中,表示頻譜SP2[J]的包絡的歸一化系數SF2[J]不是如此大。由于頻譜的包絡根據如上所述的窗函數的特征改變,所以歸一化系數的包絡也改變。因此,當歸一化系數的編碼方法相同時,可以通過改變窗函數的特征來改變對歸一化系數進行編碼所需的位數。例如,在圖6和圖7中,與歸一化系數SF2[J]相比,在歸一化系數SF1[J]中,鄰間差(interproximal difference)較大。因此,當歸一化系數編碼部54和58對鄰間差執行編碼時,位數NSF2[J]相比于歸一化系數SF2[J]變得較小的可能性高。因此,音頻編碼裝置50通過使用彼此具有不同特征的兩個不同的窗函數WFl和WF2來生成頻譜,并選擇對頻譜的歸一化系數進行編碼所需的位數較小的窗函數作為最佳窗函數。于是,可能增加為了對頻譜的編碼而分配的位數。結果,能夠減少音質劣化。[音頻編碼裝置的處理的描述]圖8是說明圖3所示的音頻編碼裝置50的編碼處理的流程圖。例如,當幀數據T[J]被輸入作為編碼對象時,編碼處理開始。參照圖8,在步驟Sll中,加窗部51將輸入的幀數據T[J]與窗函數WFl相乘,并將所得到的相乘后數據WFTl [J]提供給頻率轉換部52。加窗部55還將輸入的幀數據T[J]與窗函數WF2相乘,并將所得到的相乘后數據WFT2 [J]提供給頻率轉換部56。在步驟S12中,頻率轉換部52對從加窗部51提供的相乘后數據WFT1[J]執行頻率轉換,以獲得頻譜SPl [J]。頻率轉換部52將頻譜SPl [J]提供給歸一化系數確定部53和頻譜選擇部60。頻率轉換部56還對從加窗部55提供的相乘后數據WFT2[J]執行頻率轉換,以獲得頻譜SP2 [J]。頻率轉換部56將頻譜SP2 [J]提供給歸一化系數確定部57和頻譜選擇部60。在步驟S13中,歸一化系數確定部53根據從頻率轉換部52提供的頻譜SPl [J]確定頻譜SPl [J]的歸一化系數SFl [J],并將其提供給歸一化系數編碼部54。歸一化系數確定部57還根據從頻率轉換部56提供的頻譜SP2 [J]確定頻譜SP2 [J]的歸一化系數SF2 [J],并將其提供給歸一化系數編碼部58。在步驟S14中,歸一化系數編碼部54計算對從歸一化系數確定部53提供的歸一化系數SFl [J]的編碼所需的位數NSFl [J],并將其提供給窗選擇部59。歸一化系數編碼部58還計算對從歸一化系數確定部57提供的歸一化系數SF2[J]的編碼所需的位數NSF2 [J],并將其提供給窗選擇部59。在步驟S15中,歸一化系數編碼部54對歸一化系數SFl [J]進行編碼,并將所得到的編碼后歸一化系數HSFl [J]和歸一化系數SFl [J]提供給窗選擇部59。歸一化系數編碼部58還對歸一化系數SF2[J]進行編碼,并將所得到的編碼后歸一化系數HSF2[J]和歸一化系數SF2[J]提供給窗選擇部59。在步驟S16中,窗選擇部59確定從歸一化系數編碼部54提供的位數NSFl [J]是否小于從歸一化系數編碼部58提供的位數NSF2[J]。
當在步驟S16中確定位數NSFl [J]小于位數NSF2[J]時,窗選擇部59選擇窗函數WFl作為最佳窗函數,并且處理進行到步驟S17。在步驟S17中,窗選擇部59生成表示被選擇作為最佳窗函數的窗函數WFl的窗函數信息SW [J],并將其提供給頻譜選擇部60。在步驟S18中,窗選擇部59確定從歸一化系數編碼部54提供的編碼后歸一化系數HSFl [J]作為編碼后歸一化系數HSF[J],將歸一化系數SFl [J]確定為歸一化系數SF [J],并將位數NSFl [J]確定為位數NSF [J]。窗選擇部59將編碼后歸一化系數HSF [J]提供給多路復用部61,將歸一化系數SF[J]提供給歸一化部15,并將位數NSF[J]提供給量化部16。在步驟S19中,頻譜選擇部60基于從窗選擇部59提供的窗函數信息SW[J]來選擇從頻率轉換部52提供的頻譜SPl [J],并將其作為頻譜SP[J]提供給歸一化部15。此外,頻譜選擇部60將窗函數信息SW[J]提供給多路復用部61。然后,處理進行到步驟S23。另一方面,當在步驟S16中確定位數NSF1[J]不小于位數NSF2[J]時,窗選擇部59選擇窗函數WF2作為最佳窗函數,并且處理進行到步驟S20。在步驟S20中,窗選擇部59生成表示被選擇作為最佳窗函數的窗函數WF2的窗函數信息SW [J],并將其提供給頻譜選擇部60。在步驟S21中,窗選擇部59將從歸一化系數編碼部58提供的編碼后歸一化系數HSF2[J]確定為編碼后歸一化系數HSF[J],將歸一化系數SF2[J]確定為歸一化系數SF[J],并將位數NSF2 [J]確定為位數NSF[J]。窗選擇部59將編碼后歸一化系數HSF[J]提供給多路復用部61,將歸一化系數SF[J]提供給歸一化部15,并將位數NSF[J]提供給量化部16。在步驟S22中,頻譜選擇部60基于從窗選擇部59提供的窗函數信息SW[J]來選擇從頻率轉換部56提供的頻譜SP2[J],并將其作為頻譜SP[J]提供給歸一化部15。此外,頻譜選擇部60將窗函數信息SW[J]提供給多路復用部61。然后,處理進行到步驟S23。在步驟S23中,歸一化部15通過使用從窗選擇部59提供的歸一化系數SF[J]來對從頻譜選擇部60提供的頻譜SP[J]進行歸一化,并將所得到的歸一化譜NSP[J]提供給量化部16。在步驟S24中,量化部16基于量化信息P[J]量化從歸一化部15提供的歸一化譜NSP [J],并將所得到的量化譜OSP [J]提供給編碼部17。此時,編碼部17計算對從量化部16提供的量化譜QSP [J]進行編碼所需的位數NQSP[JJ0這里,當碼串B[J]的位數NB[J]是預定的時,需要位數NQSP[J]為值NQ’或更小,其中,值NQ’作為位數NB[J]減去量化信息P[J]的位數NP[J]、對歸一化系數SF[J]進行編碼所需的位數NSF[J]和窗函數信息SW[J]的位數的結果。在該實施例中,由于存在兩個不同的窗函數,因此,窗函數信息SW[J]的位數為I位。編碼部17將位數NQSP[J]反饋到量化部16。量化部16調整量化信息P [J],使得位數NQSP [J]等于值NQ’或更小。量化部16將調整后的量化信息P[J]提供給多路復用部61。在步驟S25中,編碼部17對從量化部16提供的量化譜QSP[J]進行編碼,并將所得到的編碼頻譜HSP[J]提供給多路復用部61。在步驟S26中,多路復用部61對來自窗選擇部59的編碼后歸一化系數HSF[J]、來自頻譜選擇部60的窗函數信息SW[J]、來自量化部16的量化信息P[J]和來自編碼部17的編碼頻譜HSP[J]進行多路復用。多路復用部61傳送所得到的碼串B[J]并結束處理。如上所述,音頻編碼裝置50將幀數據T [J]與各自具有不同特征的窗函數WFl和窗函數WF2相乘,基于所得到的相乘后數據來選擇窗函數WFl或窗函數WF2作為最佳窗函數,并傳送與最佳窗函數相乘后的相乘后數據的編碼頻譜作為編碼結果。因此,音頻編碼裝置60例如選擇在對各自與窗函數WFl和窗函數WF2相乘后的幀數據T[J]的歸一化系數進行編碼所需的位數方面位數較小的窗函數,作為最佳窗函數。從而,可以通過使用最佳窗函數來對音頻信號進行編碼以減少音質劣化。[音頻解碼裝置的配置示例]圖9是示出對從圖3所示的音頻編碼裝置50傳送的碼串B[J]進行解碼的音頻解碼裝置的配置示例的框圖。在圖9所示的配置中,與圖2中所示的部件相同的部件被賦予相同的標記,并將適當地省略重復描述。圖9中的音頻解碼裝置80的配置與圖2所示的配置的不同之處在于設置了分解部81和加窗部83來替代分解部31和加窗部37,并且不同之處在于另外設置了窗選擇部82。音頻解碼部80基于包括在音頻編碼裝置50傳送的碼串B[J]中的窗函數信息Sff [J]來選擇與窗函數WFl或窗函數WF2對應的窗函數,并將時軸數據ST [J]與該窗函數相乘。具體而言,音頻解碼裝置80的分解部81起到用以接收從圖3所示的音頻編碼裝置50傳送的碼串B[J]的接收部的作用。分解部81將碼串B[J]分解成編碼頻譜HSP[J]、量化信息P [J]、編碼后歸一化系數HSF [J]和窗函數信息SW [J]。分解部81將編碼頻譜HSP [J]提供給解碼部32,將量化信息P[J]提供給逆量化部33,將編碼后歸一化系數HSF[J]提供給歸一化系數解碼部34,并將窗函數信息SW[J]提供給窗選擇部82。窗選擇部82基于從分解部81提供的窗函數信息SW[J]來選擇與窗函數WFl對應的窗函數WBl或與窗函數WF2對應的窗函數WB2。窗函數WFl與窗函數WBl之間的關系以及窗函數WF2與窗函數WB2之間的關系具有如下約束條件當量化位數是無限大的時,輸入到音頻編碼裝置50中的幀數據T[J]和從音頻解碼裝置80輸出的幀數據T[J]彼此一致。窗選擇部82將所選的窗函數作為窗函數WB提供給加窗部83。加窗部83將從逆頻率轉換部36提供的時軸數據ST[J]與從窗選擇部82提供的窗函數WB相乘,并將作為乘法結果所獲得的相乘后數據WBT [J]提供給重疊部38。[音頻解碼裝置中的處理的描述]圖10是說明圖9所示的音頻解碼裝置80進行的解碼處理的流程圖。例如當從音頻編碼裝置50傳送碼串B[J]時,解碼處理開始。參照圖10,在步驟S41中,包括在音頻解碼裝置80中的分解部81接收從圖3所示的音頻編碼裝置50傳送的碼串B[J],并將其分解成編碼頻譜HSP[J]、量化信息P[J]、編碼后歸一化系數HSF[J]和窗函數信息SW[J]。分解部81將編碼頻譜HSP[J]提供給解碼部32,將量化信息P[J]提供給逆量化部33,將編碼后歸一化系數HSF[J]提供給歸一化系數解碼部34,并將窗函數信息SW[J]提供窗選擇部82。在步驟S42中,解碼部32對從分解部81提供的編碼頻譜HSP[J]進行解碼,并將所得到的量化譜QSP[J]提供給逆量化部33。 在步驟S43中,逆量化部33基于從分解部81提供的量化信息P [J],對從解碼部32提供的量化譜QSP [J]執行逆量化以獲得歸一化譜NSP [J]。逆量化部33將歸一化譜NSP [J]提供給逆歸一化部35。在步驟S44中,歸一化系數解碼部34對從分解部81提供的編碼后歸一化系數HSF[J]進行解碼,并將所得到的歸一化系數SF[J]提供給逆歸一化部35。在步驟S45中,逆歸一化部35通過使用從歸一化系數解碼部34提供的歸一化系數SF[J]和歸一化譜NSP [J]來執行逆歸一化,并將所得到的頻譜SP [J]提供給逆頻率轉換部36。在步驟S46中,逆頻率轉換部36對從逆歸一化部35提供的頻譜SP[J]執行逆頻 率轉換,并將所得到的時軸數據ST [J]提供給加窗部83。在步驟S47中,窗選擇部82確定從分解部81提供的窗函數信息SW[J]是否為O。當在步驟S47中確定窗函數信息SW[J]為0時,在步驟S48中,窗選擇部82選擇與窗函數WFl對應的窗函數WBl,并將其作為窗函數WB提供給加窗部83。然后,處理進行到步驟S50。另一方面,當在步驟S47中確定窗函數信息SW[J]不為0時,S卩,當窗函數信息Sff [J]為I時,在步驟S49中,窗選擇部82選擇與窗函數WF2對應的窗函數WB2,并將其作為窗函數WB提供給加窗部83。然后,處理進行到步驟S50。在步驟S50中,加窗部83將從逆頻率轉換部36提供的時軸數據ST[J]與窗函數WB相乘,并將作為乘法結果所獲得的相乘后數據WBT [J]提供給重疊部38。在步驟S51中,重疊部38保存從加窗部83提供的相乘后數據WBT [J]。在步驟S52中,重疊部38將所保存的具有幀指數J_1的相乘后數據WBT [J-1]與相乘后數據WBT[J]在彼此重疊例如一幀的一半的情況下相加。重疊部38輸出所得到的幀數據T[J]作為解碼結果,并結束處理。〈第二實施例〉[編碼裝置的配置示例]圖11是示出應用了本技術的音頻編碼裝置的第二實施例的配置示例的框圖。在圖11所示的配置中,與圖3所示的部件相同的部件被賦予相同的標記,并且將適當地省略重復描述。圖11所示的音頻編碼裝置100的配置與圖3所示的配置不同之處主要在于,設置了歸一化部101和105、量化部102和106、編碼部103和107、以及多路復用部104和108來替代歸一化部15、量化部16、編碼部17和多路復用部61,并且不同之處還在于另外設置了窗選擇部109和切換部110。音頻編碼裝置100被配置為基于量化誤差選擇最佳窗函數。具體而言,音頻編碼裝置100中包括加窗部51、頻率轉換部52、歸一化系數確定部53、歸一化系數編碼部54、歸一化部101、量化部102、編碼部103和多路復用部104的路徑I’被配置為獲得與窗函數WFl相乘后的巾貞數據T[J]的碼串BI [J]。更具體而言,歸一化部101通過使用歸一化系數確定部53確定的歸一化系數SFl [J]來對從頻率轉換部52提供的頻譜SPl [J]進行歸一化,并將所得到的譜NSPl [J]提供給量化部102和窗選擇部109。量化部102基于量化信息Pl [J]對從歸一化部101提供的譜NSPl [J]進行量化,并將所得到的量化譜QSPl [J]提供給編碼部103和窗選擇部109。此時,量化部102獲得從編碼部103反饋的與量化譜QSPl [J]對應的位數NQSP [J],并調整量化信息Pl [J],使得位數NQSPl [J]變為預定值。量化部102將調整后的量化信息Pl [J]提供給多路復用部104。編碼部103計算對從量化部102提供的量化譜QSP1[J]進行編碼所需的位數NQSPl [J]。這里,當碼串B [J]的位數NB [J]是預定的時,需要位數NQSPl [J]是值NQl或更小,其中,值NQl作為位數NB[J]減去量化信息Pl [J]的位數NPl [J]、對歸一化系數編碼部54算出的歸一化系數進行編碼SFl [J]進行編碼所需的位數NSFl [J]和窗函數信息SW[J]的位數的結果。因此,編碼部103將位數NQSPl [J]提供給量化部102,并且量化部102調整量化信息Pl [J],使得位數NQSPl [J]是值NQl或更小。此外,編碼部103對量化譜QSPl [J]進行編碼,并將所得到的編碼頻譜HSPl [J]提供給多路復用部104。多路復用部104對來自歸一化系數編碼部54的編碼后歸一化系數HSFl [J]、來自量化部102的量化信息Pl [J]和來自編碼部103的編碼頻譜HSPl [J]進行多路復用,并將所得到的碼串B1[J]提供給切換部110。包括加窗部55、頻率轉換部56、歸一化系數確定部57、歸一化系數編碼部58、歸一化部105、量化部106、編碼部107和多路復用部108的路徑2’被配置為與路徑I’中的各部相同,以獲得與窗函數WF2相乘后的幀數據T[J]的碼串B2[J]。具體而言,歸一化部105通過使用從歸一化系數確定部57提供的歸一化系數SF2 [J]來對從頻率轉換部56提供的頻譜SP2 [J]進行歸一化,并將所得到的譜NSP2 [J]提供給量化部106和窗選擇部109。量化部106基于量化信息P2 [J]對從歸一化部105提供的譜NSP2 [J]進行量化,并將所得到的量化譜QSP2[J]提供給編碼部107和窗選擇部109。此時,量化部106獲得從編碼部107反饋的與量化部QSP2 [J]對應的位數NQSP2,并調整量化信息P2 [J],使得位數NQSP2變為預定值。量化部106將調整后的量化信息P2[J]提供給多路復用部108。編碼部107計算對從量化部106提供的量化譜QSP2[J]進行編碼所需的位數NQSP2[J]。這里,當碼串B [J]的位數NB [J]是預定的時,需要位數NQSP2[J]是值NQ2或更小,其中,值NQ2作為位數NB [J]減去量化信息P2 [J]的位數NPl [J]、對歸一化系數編碼部58算出的歸一化系數SF2[J]進行編碼所需的位數NSF2[J]和窗函數信息SW[J]的位數的結果。因此,編碼部107將位數NQSP2[J]提供給量化部106,并且量化部106調整量化信息P2 [J],使得位數NQSP2 [J]為值NQ2或更小。此外,編碼部107對量化譜QSP2 [J]進行編碼,并將所得到的編碼頻譜HSP2[J]提供給多路復用部108。多路復用部108將來自歸一化系數編碼部58的編碼后歸一化系數HSF2[J]、來自量化部106的量化信息P2[J]和來自編碼部107的編碼頻譜HSP2[J]相乘,并將所得到的碼串B2[J]提供給切換部110。與音頻解碼裝置80的逆量化部33相同,窗選擇部109對從量化部102提供的量化譜QSPl [J]執行逆量化,以生成譜NSP1’ [J]。因此,窗選擇部109將譜NSP1’ [J]與從歸一化部101提供的原始譜NSPl [J]進行比較,以獲得量化誤差Dl [J]。具體而言,窗選擇部109針對在整個譜上的每個譜,將譜NSP1’ [J]與譜NSP1[J]之間的差相加,以獲得量化誤差 Dl[J]。同樣,窗選擇部109對從量化部106提供的量化譜QSP2[J]執行逆量化,并通過使用所得到的NSP2’ [J]和從歸一化部105提供的原始譜NSP2 [J]來獲得量化誤差D2 [J]。窗選擇部109將量化誤差Dl [J]與量化誤差D2[J]進行比較,并選擇與較小的量化誤差對應的窗函數作為最佳窗函數。然后,窗選擇部109生成表不被選擇作為最佳窗函數的窗函數WFl或窗函數WF2的窗函數信息SW[J],并將其提供給切換部110。切換部110基于從窗選擇部109提供的窗函數信息SW[J],選擇從多路復用部104提供的碼串B[J]或從多路復用部108提供的碼串B2[J]。切換部110在所選的碼串上多路復用窗函數信息SW[J]。切換部110起到傳送部的作用,并且控制作為多路復用結果所獲得的碼串B[J]的傳送并傳送該碼串B[J]。[音頻編碼裝置的處理的描述]圖12是說明圖11所示的音頻編碼裝置100進行的編碼處理的流程圖。例如當幀數據T[J]作為編碼對象被輸入時,該編碼處理開始。由于圖12中從步驟S71到S75的處理與圖8中從步驟Sll到S15的處理相同,因此,省略了對其的描述。在完成步驟S75中的處理之后,在步驟S76中,歸一化部101通過使用從歸一化系數確定部53提供的歸一化系數SFl [J]來對從頻率轉換部52提供的頻譜SPl [J]進行歸一化。歸一化部101將所得到的譜NSP1[J]提供給量化部102和窗選擇部109。此外,歸一化部105通過使用從頻率轉換部56提供的歸一化系數SF2 [J]來對從歸一化系數確定部47提供的頻譜SP2[J]進行歸一化,并將所得到的譜NSP2[J]提供給量化部106和窗選擇部109。在步驟S77中,量化部102基于量化信息Pl [J]來量化從歸一化部101提供的譜NSPl [J],并將所得到的量化譜QSPl [J]提供給編碼部103和窗選擇部109。此時,編碼部103計算對從量化部102提供的量化譜QSPl [J]進行編碼所需的位數NQSPl [J]。編碼部103將位數NQSPl [J]提供給量化部102,并且量化部102調整量化信息Pl [J],使得位數NQSPl [J]變為值NQl或更小。量化部102將調整后的量化信息Pl [J]提供給多路復用部104。量化部106基于量化信息P2 [J]來量化從歸一化系數105提供的譜NSP2 [J],并將所得到的量化譜QSP2[J]提供給編碼部107和窗選擇部109。此時,編碼部107計算對從量化部106提供的量化譜QSP2[J]進行編碼所需的位數NQSP2 [J]。編碼部107將位數NQSP2 [J]提供給量化部106,并且量化部106調整量化信息P2 [J],使得位數NQSP2 [J]變為值NQ2或更小。量化部106將調整后的量化信息P2 [J]提供給多路復用部108。在步驟S78中,編碼部103對量化譜QSPl [J]進行編碼,并將所得到的編碼頻譜HSP1[J]提供給乘法部104。編碼部107對量化譜QSP2[J]進行編碼,并將所得到的編碼頻譜HSP2[J]提供給乘法部108。在步驟S79中,多路復用部104對來自歸一化系數編碼部54的編碼后歸一化系數HSFl [J]、來自量化部102的量化信息Pl [J]和來自編碼部103的編碼頻譜HSPl [J]進行多路復用。多路復用部104將所得到的碼串B1[J]提供給切換部110。多路復用部108對來自歸一化系數編碼部58的編碼后歸一化系數HSF2 [J]、來自量化部106的量化信息P2 [J]和來自編碼部107的編碼頻譜HSP2[J]進行多路復用,并將所得到的碼串B2[J]提供給切換部110。
在步驟S80中,與音頻解碼裝置80中的逆量化部33相同,窗選擇部109對從量化部102提供的量化譜QSPl [J]和從量化部106提供的量化譜QSP2 [J]執行逆量化。在步驟S81中,窗選擇部109獲得量化誤差Dl [J]和量化誤差D2[J]。具體而言,窗選擇部109將作為對量化譜QSPl [J]的逆量化的結果所獲得的譜NSP1’ [J]與從歸一化部101提供的原始譜NSPl [J]的每個譜的差分在整個譜內相加,并確定為量化誤差Dl [J]。此外,窗選擇部109將作為對量化譜QSP2[J]的逆量化的結果而獲得的譜NSP2’ [J]與從歸一化部105提供的原始譜NSP2[J]的每個譜的差分在整個譜內相加,并確定為量化誤差D2[J]。在步驟S82中,窗選擇部109確定量化誤差Dl [J]是否小于量化誤差D2[J]。當在步驟S82中量化誤差D1[J]小于量化誤差D2[J]時,窗選擇部108選擇與量化誤差Dl [J]對應的窗函數WFl作為最佳窗函數。在步驟S83中,窗選擇部109生成表示被選擇作為最佳窗函數的窗函數WFl的窗函數信息SW[J],并將其提供給切換部110。在步驟S84中,切換部110基于從窗選擇部109提供的窗函數信息SW[J]來選擇從多路復用部104提供的碼串BI [J],并在所選的碼串BI [J]上對窗函數信息SW[J]進行多路復用。切換部110傳送所得到的碼串B[J]并結束處理。另一方面,當在步驟S82中確定量化誤差Dl [J]不小于量化誤差D2[J]時,窗選擇部109選擇與量化誤差D2 [J]對應的窗函數WF2作為最佳窗函數。在步驟S85中,窗選擇部109生成表不被選擇作為最佳窗函數的窗函數WF2的窗函數信息SW[J],并將其提供給切換部110。在步驟S86中,切換部110選擇從多路復用部108提供的碼串B2[J],并在所選的碼串B2[J]上對窗函數信息SW[J]進行多路復用。切換部110傳送所得到的碼串B[J],并
結束處理。如上所述,音頻編碼裝置100將幀數據T[J]分別與各自具有不同特征的窗函數WFl和窗函數WF2相乘,基于所得到的相乘后數據來選擇窗函數WFl或窗函數WF2作為最佳窗函數,并傳送與最佳窗函數相乘后的相乘后數據的編碼頻譜作為編碼結果。因此,音頻編碼裝置100可以通過選擇例如具有與窗函數WFl和窗函數WF2相乘后的巾貞數據T[J]的較小量化誤差的窗函數作為最佳窗函數,使用減少音質劣化的最佳窗函數來對音頻信號進行編碼。盡管音頻編碼裝置100通過使用逆量化后的譜和量化前的譜來獲得量化誤差,但是可通過使用歸一化前的頻譜、逆量化后的譜和通過使用歸一化系數所恢復的頻譜來獲得量化誤差。在這種情況下,可以更精確地計算量化誤差。由于用于對從音頻編碼裝置100傳送的碼串B[J]進行解碼的裝置與圖9所示的音頻解碼裝置80相同,因此省略了對其的描述。〈第三實施例〉[應用了本技術的計算機的說明]接下來,可以通過硬件或軟件來執行如上所述的一系列處理。當通過軟件執行該系列處理時,構成軟件的程序安裝在通用計算機等中。因此,圖13示出根據安裝有執行上述系列處理的程序的計算機的一個實施例的構成示例。程序可以預先存儲在存儲部208或作為內置在計算機中的記錄介質的ROM (只讀存儲器)202中。或者,程序可以存儲(記錄)在可移動介質211中。這樣的可移動介質211可以被設置為所謂的封裝軟件。這里,作為可移動介質211,例如有軟盤、CD-ROM(致密盤只讀存儲器)、M0 (磁光)盤、DVD (數字通用盤)、磁盤、半導體存儲器等。另外,程序可以從如上所述的可移動介質211經由驅動器210安裝在計算機中,或者可以經由通信網絡或廣播網絡下載到計算機中以安裝在內置的存儲部208中。S卩,程序 可以從下載站點例如經由用于數字衛星廣播的衛星、通過無線通信轉移到計算機,或者可以經由諸如LAN (局域網)和因特網的網絡、通過有線通信轉移到計算機。計算機包括內部的CPU (中央處理單元)201,并且I/O接口 205經由總線204連接到 CPU 201。當CPU 201通過輸入部206的操作而接收經由I/O接口 205從用戶輸入的命令時,根據命令,CPU 201執行存儲在ROM 202中的程序。或者,CPU 201將存儲在存儲部208中的程序加載到RAM (隨機存取存儲器)203中以執行該程序。從而,CPU 201執行根據上述流程圖的處理或者根據上述框圖的配置所執行的處理。然后,CPU 201按照需要經由I/O接口 205輸出例如來自輸出部207的處理結果,或者從通信部209傳送該處理結果,并且另外,將程序記錄在存儲部208等中。另外,輸入部206被配置為包括鍵盤、鼠標、麥克風等。此外,輸出部207被配置為包括IXD (液晶顯示器)、揚聲器等。這里,在本說明書中,不一定以流程圖表示的順序按時間順序執行計算機根據程序執行的處理。即,計算機根據程序執行的處理還包括并行或獨立地執行的處理(例如,并行處理或面向對象的處理)。此外,程序可由一臺計算機(處理器)處理,或者可由多個計算機按分布式處理方式執行。另外,程序可被轉移到遠程計算機以執行。本領域技術人員應理解,在所附權利要求或其等同方案的范圍內,根據設計要求和其它因素,可進行各種修改、組合、子組合和變更。另外,本技術可以如下進行配置。(I) 一種音頻編碼裝置,包括第一加窗部,將音頻信號與第一窗函數相乘;第二加窗部,將所述音頻信號與第二窗函數相乘,其中所述第二窗函數的特征不同于所述第一窗函數的特征;窗選擇部,基于經所述第一加窗部相乘后的所述音頻信號和經所述第二加窗部相乘后的所述音頻信號,選擇所述第一窗函數或所述第二窗函數作為最佳窗函數;編碼部,對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行編碼;以及傳送部,傳送經所述編碼部編碼后的所述頻譜和表示所述最佳窗函數的窗函數信
肩、O(2)根據(I)所述的音頻編碼裝置,還包括第一歸一化系數確定部,確定經所述第一加窗部相乘后的所述音頻信號的頻譜的歸一化系數,作為第一歸一化系數;第二歸一化系數確定部,確定經所述第二加窗部相乘后的所述音頻信號的頻譜的歸一化系數,作為第二歸一化系數;第一歸一化系數編碼部,對所述第一歸一化系數確定部確定的所述第一歸一化系數進行編碼;第二歸一化系數編碼部,對所述第二歸一化系數確定部確定的所述第二歸一化系數進行編碼;以及歸一化部,通過使用與所述最佳窗函數對應的所述第一歸一化系數或所述第二歸一化系數來對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行歸一化,其中,所述窗選擇部基于對所述第一歸一化系數和所述第二歸一化系數進行編碼所需的位數來選擇所述最佳窗函數,所述編碼部對經所述歸一化部歸一化后的所述頻譜進行編碼,并且所述傳送部傳送編碼后的頻譜、與所述最佳窗函數對應的所述第一歸一化系數或所述第二歸一化系數的編碼結果和表示所述最佳窗函數的窗函數信息。(3)根據(I)所述的音頻編碼裝置,還包括第一量化部,對經所述第一加窗部相乘后的所述音頻信號的頻譜進行量化;第二量化部,對經所述第二加窗部相乘后的所述音頻信號的頻譜進行量化;其中,所述窗選擇部基于第一量化誤差和第二量化誤差來選擇所述最佳窗函數,其中所述第一量化誤差是經所述第一加窗部相乘后的所述音頻信號的頻譜的量化誤差,所述第二量化誤差是經所述第二加窗部相乘后的所述音頻信號的頻譜的量化誤差,并且所述編碼部對與所述最佳窗函數相乘后的音頻信號的量化頻譜進行編碼。(4)根據(3)所述的音頻編碼裝置,其中,所述窗選擇部基于量化前的與所述第一窗函數相乘后的所述音頻信號的頻譜以及經所述第一量化部量化、然后逆量化后的頻譜而獲得所述第一量化誤差,并且基于量化前的與所述第二窗函數相乘后的所述音頻信號的頻譜以及經所述第二量化部量化、然后逆量化后的頻譜而獲得所述第二量化誤差。(5) 一種由音頻編碼裝置執行的音頻編碼方法,包括第一加窗步驟,將音頻信號與第一窗函數相乘;第二加窗步驟,將所述音頻信號與第二窗函數相乘,其中所述第二窗函數的特征不同于所述第一窗函數的特征;窗選擇步驟,基于通過所述第一加窗步驟的處理相乘后的音頻信號和通過所述第二加窗部的處理相乘后的所述音頻信號,選擇所述第一窗函數或所述第二窗函數作為最佳窗函數;編碼步驟,對與所述最佳窗函數相乘后的音頻信號的頻譜進行編碼;以及傳送步驟,傳送通過所述編碼步驟的處理編碼后的頻譜和表示所述最佳窗函數的窗函數信息。(6) 一種程序,用于使計算機執行包括如下步驟的處理第一加窗步驟,將音頻信號與第一窗函數相乘;
第二加窗步驟,將所述音頻信號與第二窗函數相乘,其中所述第二窗函數的特征不同于所述第一窗函數的特征;窗選擇步驟,基于通過所述第一加窗步驟的處理相乘后的所述音頻信號和通過所述第二加窗部的處理相乘后的音頻信號,選擇所述第一窗函數或所述第二窗函數作為最佳窗函數;編碼步驟,對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行編碼;以及傳送控制步驟,控制對通過所述編碼步驟的處理編碼后的頻譜和表示所述最佳窗函數的窗函數信息的傳送。(7) 一種音頻解碼裝置,包括接收部,接收編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息,其中,所述編碼頻譜是通過對與作為所述最佳窗函數的所述第一窗函數或所述第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得的,所述第二窗函數的特征不同于所述第一窗函數的特征;解碼部,對所述接收部接收到的所述編碼頻譜進行解碼;窗選擇部,基于所述接收部接收到的所述窗函數信息來從所述第一窗函數和所述第二窗函數中選擇所述最佳窗函數;以及加窗部,基于所述窗選擇部選擇的所述最佳窗函數,根據作為所述解碼部執行的解碼的結果而獲得的頻譜來生成所述音頻信號。(8)根據(7)所述的音頻解碼裝置,還包括歸一化系數解碼部,對用于對與所述最佳窗函數相乘后的音頻信號的頻譜進行歸一化的歸一化系數的編碼結果進行解碼;以及逆歸一化部,通過使用經所述歸一化系數解碼部解碼后的歸一化系數,對作為所述解碼部執行的解碼的結果所獲得的頻譜進行逆歸一化,其中,所述接收部接收作為對通過使用所述歸一化系數歸一化的所述頻譜進行編碼的結果而獲得的所述編碼頻譜、所述歸一化系數的編碼結果和所述窗函數信息,并且所述加窗部基于所述最佳窗函數,根據作為所述逆歸一化部執行的逆歸一化的結果而獲得的頻譜來生成所述音頻信號。(9)根據(7)所述的音頻解碼裝置,還包括逆量化部,對作為所述解碼部執行的解碼的結果所獲得的頻譜進行逆量化,其中,所述接收部接收作為對量化后的頻譜進行編碼的結果所獲得的所述編碼頻譜和所述窗函數信息,并且所述加窗部基于所述最佳窗函數,根據作為所述逆量化部執行的逆量化的結果所獲得的頻譜來生成所述音頻信號。(10) 一種由音頻解碼裝置執行的音頻解碼方法,包括接收步驟,接收編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息,其中,通過對與作為所述最佳窗函數的所述第一窗函數或所述第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得所述編碼頻譜,所述第二窗函數的特征不同于所述第一窗函數的特征;解碼步驟,對通過所述接收步驟的處理接收到的所述編碼頻譜進行解碼;窗選擇步驟,基于通過所述接收步驟的處理接收到的所述窗函數信息來從所述第一窗函數和所述第二窗函數中選擇所述最佳窗函數;以及加窗步驟,基于通過所述窗選擇步驟的處理所選擇的所述最佳窗函數,根據作為通過所述解碼步驟的處理所執行的解碼的結果而獲得的頻譜來生成所述音頻信號。(11) 一種程序,用于使計算機執行包括以下步驟的處理接收控制步驟,控制對編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息的接收,其中,通過對與作為所述最佳窗函數的所述第一窗函數或所述第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得所述編碼頻譜,所述第二窗函數的特征不同于所述第一窗函數的特征;解碼步驟,對通過所述接收控制步驟的處理接收到的所述編碼頻譜進行解碼;窗選擇步驟,基于通過所述接收控制步驟的處理接收到的所述窗函數信息來從所述第一窗函數和所述第二窗函數中選擇所述最佳窗函數;以及加窗步驟,基于通過所述窗選擇步驟的處理所選擇的所述最佳窗函數,根據作為通過所述解碼步驟的處理所執行的解碼的結果而獲得的頻譜的音頻信號生成所述音頻信號。本公開內容包含與2011年9月26日向日本專利局提交的日本優先權專利申請JP中公開的主題內容相關的主題內容,其全部內容通過引用合并于此。
權利要求
1.一種音頻編碼裝置,包括第一加窗部,將音頻信號與第一窗函數相乘;第二加窗部,將所述音頻信號與第二窗函數相乘,其中所述第二窗函數的特征不同于所述第一窗函數的特征;窗選擇部,基于經所述第一加窗部相乘后的所述音頻信號和經所述第二加窗部相乘后的所述音頻信號,選擇所述第一窗函數或所述第二窗函數作為最佳窗函數;編碼部,對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行編碼;以及傳送部,傳送經所述編碼部編碼后的所述頻譜和表示所述最佳窗函數的窗函數信息。
2.根據權利要求1所述的音頻編碼裝置,還包括第一歸一化系數確定部,確定經所述第一加窗部相乘后的所述音頻信號的頻譜的歸一化系數,作為第一歸一化系數;第二歸一化系數確定部,確定經所述第二加窗部相乘后的所述音頻信號的頻譜的歸一化系數,作為第二歸一化系數;第一歸一化系數編碼部,對所述第一歸一化系數確定部確定的所述第一歸一化系數進行編碼;第二歸一化系數編碼部,對所述第二歸一化系數確定部確定的所述第二歸一化系數進行編碼;以及歸一化部,通過使用與所述最佳窗函數對應的所述第一歸一化系數或所述第二歸一化系數來對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行歸一化,其中,所述窗選擇部基于對所述第一歸一化系數和所述第二歸一化系數進行編碼所需的位數來選擇所述最佳窗函數,所述編碼部對經所述歸一化部歸一化后的所述頻譜進行編碼,并且所述傳送部傳送編碼后的頻譜、與所述最佳窗函數對應的所述第一歸一化系數或所述第二歸一化系數的編碼結果和表示所述最佳窗函數的窗函數信息。
3.根據權利要求1所述的音頻編碼裝置,還包括第一量化部,對經所述第一加窗部相乘后的所述音頻信號的頻譜進行量化;第二量化部,對經所述第二加窗部相乘后的所述音頻信號的頻譜進行量化;其中,所述窗選擇部基于第一量化誤差和第二量化誤差來選擇所述最佳窗函數,其中所述第一量化誤差是經所述第一加窗部相乘后的所述音頻信號的頻譜的量化誤差,所述第二量化誤差是經所述第二加窗部相乘后的所述音頻信號的頻譜的量化誤差,并且所述編碼部對與所述最佳窗函數相乘后的所述音頻信號的量化頻譜進行編碼。
4.根據權利要求3所述的音頻編碼裝置,其中,所述窗選擇部基于量化前的與所述第一窗函數相乘后的所述音頻信號的頻譜以及經所述第一量化部量化、然后逆量化后的頻譜而獲得所述第一量化誤差,并且基于量化前的與所述第二窗函數相乘后的所述音頻信號的頻譜以及經所述第二量化部量化、然后逆量化后的頻譜而獲得所述第二量化誤差。
5.一種由音頻編碼裝置執行的音頻編碼方法,包括第一加窗步驟,將音頻信號與第一窗函數相乘;第二加窗步驟,將所述音頻信號與第二窗函數相乘,其中所述第二窗函數的特征不同于所述第一窗函數的特征;窗選擇步驟,基于通過所述第一加窗步驟的處理相乘后的所述音頻信號和通過所述第二加窗部的處理相乘后的所述音頻信號,選擇所述第一窗函數或所述第二窗函數作為最佳窗函數;編碼步驟,對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行編碼;以及傳送步驟,傳送通過所述編碼步驟的處理編碼后的頻譜和表示所述最佳窗函數的窗函數信息。
6.一種程序,用于使計算機執行包括如下步驟的處理第一加窗步驟,將音頻信號與第一窗函數相乘;第二加窗步驟,將所述音頻信號與第二窗函數相乘,其中所述第二窗函數的特征不同于所述第一窗函數的特征;窗選擇步驟,基于通過所述第一加窗步驟的處理相乘后的所述音頻信號和通過所述第二加窗部的處理相乘后的所述音頻信號,選擇所述第一窗函數或所述第二窗函數作為最佳窗函數;編碼步驟,對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行編碼;以及傳送控制步驟,控制對通過所述編碼步驟的處理編碼后的頻譜和表示所述最佳窗函數的窗函數信息的傳送。
7.一種音頻解碼裝置,包括接收部,接收編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息,其中,所述編碼頻譜是通過對與作為所述最佳窗函數的所述第一窗函數或所述第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得的,所述第二窗函數的特征不同于所述第一窗函數的特征;解碼部,對所述接收部接收到的所述編碼頻譜進行解碼;窗選擇部,基于所述接收部接收到的所述窗函數信息來從所述第一窗函數和所述第二窗函數中選擇所述最佳窗函數;以及加窗部,基于所述窗選擇部選擇的所述最佳窗函數,根據作為所述解碼部執行的解碼的結果而獲得的頻譜來生成所述音頻信號。
8.根據權利要求7所述的音頻解碼裝置,還包括歸一化系數解碼部,對用于對與所述最佳窗函數相乘后的所述音頻信號的頻譜進行歸一化的歸一化系數的編碼結果進行解碼;以及逆歸一化部,通過使用經所述歸一化系數解碼部解碼后的歸一化系數,對作為所述解碼部執行的解碼的結果所獲得的頻譜進行逆歸一化,其中,所述接收部接收作為對通過使用所述歸一化系數歸一化的所述頻譜進行編碼的結果而獲得的所述編碼頻譜、所述歸一化系數的編碼結果和所述窗函數信息,并且所述加窗部基于所述最佳窗函數,根據作為所述逆歸一化部執行的逆歸一化的結果而獲得的頻譜來生成所述音頻信號。
9.根據權利要求7所述的音頻解碼裝置,還包括逆量化部,對作為所述解碼部執行的解碼的結果而獲得的頻譜進行逆量化,其中,所述接收部接收作為對量化后的頻譜進行編碼的結果而獲得的所述編碼頻譜和所述窗函數信息,并且所述加窗部基于所述最佳窗函數,根據作為所述逆量化部執行的逆量化的結果而獲得的頻譜來生成所述音頻信號。
10.一種由音頻解碼裝置執行的音頻解碼方法,包括接收步驟,接收編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息,其中,通過對與作為所述最佳窗函數的所述第一窗函數或所述第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得所述編碼頻譜,所述第二窗函數的特征不同于所述第一窗函數的特征;解碼步驟,對通過所述接收步驟的處理接收到的所述編碼頻譜進行解碼;窗選擇步驟,基于通過所述接收步驟的處理接收到的所述窗函數信息來從所述第一窗函數和所述第二窗函數中選擇所述最佳窗函數;以及加窗步驟,基于通過所述窗選擇步驟的處理所選擇的所述最佳窗函數,根據作為通過所述解碼步驟的處理所執行的解碼的結果而獲得的頻譜生成所述音頻信號。
11.一種程序,用于使計算機執行包括以下步驟的處理接收控制步驟,控制對編碼頻譜和表示作為最佳窗函數的第一窗函數或第二窗函數的窗函數信息的接收,其中,通過對與作為所述最佳窗函數的所述第一窗函數或所述第二窗函數相乘后的音頻信號的頻譜進行編碼的結果而獲得所述編碼頻譜,所述第二窗函數的特征不同于所述第一窗函數的特征;解碼步驟,對通過所述接收控制步驟的處理接收到的所述編碼頻譜進行解碼;窗選擇步驟,基于通過所述接收控制步驟的處理接收到的所述窗函數信息來從所述第一窗函數和所述第二窗函數中選擇所述最佳窗函數;以及加窗步驟,基于通過所述窗選擇步驟的處理所選擇的所述最佳窗函數,根據作為通過所述解碼步驟的處理所執行的解碼的結果而獲得的頻譜的音頻信號生成所述音頻信號。
全文摘要
本發明提供了音頻編碼裝置和音頻編碼方法、音頻解碼裝置和音頻解碼方法、以及程序,其中該音頻編碼裝置包括第一加窗部,將音頻信號與第一窗函數相乘;第二加窗部,將音頻信號與第二窗函數相乘,第二窗函數的特征不同于第一窗函數的特征;窗選擇部,基于經第一加窗部相乘后的音頻信號和經第二加窗部相乘后的音頻信號,選擇第一窗函數或第二窗函數作為最佳窗函數;編碼部,對與最佳窗函數相乘后的音頻信號的頻譜進行編碼;以及傳送部,傳送經編碼部編碼后的頻譜和表示最佳窗函數的窗函數信息。
文檔編號G10L19/022GK103021416SQ20121035006
公開日2013年4月3日 申請日期2012年9月19日 優先權日2011年9月26日
發明者鈴木志朗, 松村祐樹, 戶栗康裕, 前田祐兒, 松本淳 申請人:索尼公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1