專利名稱:基于徑向基函數統計模型的演唱評分方法
技術領域:
本發明涉及演唱評分領域,特別是涉及ー種基于徑向基函數統計模型的演唱評分方法。
背景技術:
演唱評分方法主要用于卡拉OK裝置或軟件,目的是對演唱者的聲音作評價,増加歌唱樂趣。傳統的演唱評分方法通過比對目標音頻與參考音頻的聲學特征差異進行評分,其缺陷在于使用不同的參考音頻將得到迥異的評分結果。
發明內容
為了克服現有技術的不足,本發明公開了ー種基于徑向基函數統計模型的演唱評分方法。本發明采用了如下的技術方案一種基于徑向基函數統計模型的演唱評分方法,其特征在于,包括以下步驟(1)預處理,包括如下步驟制作特征庫采集同一歌曲的若干參考音頻樣本,即同一歌手在不同時期的錄音及不同歌手的錄音,記為{Si},將樣本分割成相互重疊時間長度為T的音頻段,記為,提
取音頻段的短時信號特征,包括梅爾倒譜系數特征、線性預測系數、基頻特征,記為び乃;建立統計模型并訓練建立各段音頻對應的徑向基函數統計模型Pj(X) = R(Dj(X))
權利要求
1.基于徑向基函數統計模型的演唱評分方法,其特征在于,包括以下步驟 (1)預處理,包括如下步驟 制作特征庫采集同一歌曲的若干參考音頻樣本,即同一歌手在不同時期的錄音及不同歌手的錄音,記為{Si},將樣本分割成時間長度為T、前后重疊時間長度一致的音頻段,記為,提取音頻段的短時信號特征,包括梅爾倒譜系數特征、線性預測系數、基頻特征,記MFib 建立統計模型并訓練建立各段音頻對應的徑向基函數統計模型 Pj (X) = R (Dj (X))Dj (X) = (X - "y) ·び,1 · (X — "y) 其中,R為單調遞減徑向基函數;μ j為各音頻樣本的第j段音頻均值;σ j為第j段音頻的協方差矩陣,代表樣本在空間中的分布鞏(X)為輸入向量X與音頻均值的馬氏距離,該距離計算方法用于歸ー化特征向量在不同方向上長度め(X)為第j段音頻對應的徑向基函數統計模型;通過如下計算μ j與:
2.如權利要求I所述的基于徑向基函數統計模型的演唱評分方法,其特征在于,步驟(I)的所述的單調遞減徑向基函數為高斯函數或樣條函數。
全文摘要
本發明公開了一種基于徑向基函數統計模型的演唱評分方法。傳統的演唱評分方法通過比對目標音頻與參考音頻的聲學特征差異進行評分,其缺陷在于使用不同的參考音頻將得到迥異的評分結果。本發明提出一種基于徑向基函數統計模型的演唱評分方法,采集標準樣本不同的參考音頻并提取聲學特征,包括梅爾倒譜系數特征、線性預測系數、基頻特征,使用這些特征訓練得到基于徑向基函數統計模型,再利用該模型計算目標音頻的對數概率矩陣,最后使用動態規整計算最佳匹配對數概率,能得到更精確而穩定的評分。
文檔編號G10L19/00GK102664018SQ20121012713
公開日2012年9月12日 申請日期2012年4月26日 優先權日2012年4月26日
發明者劉康苗, 劉迪搏, 張愷, 林裕旭 申請人:杭州來同科技有限公司