專利名稱:測量語音波形相似度的一種新方法
技術領域:
本發明涉及一種語音信號的處理技術,屬于語音信號處理領域。
背景技術:
語音信號是一種非平穩的隨機信號,可以用隨時間變化的一維波形來描述。從語音信號的波形分析,可以大致分為兩類一類是輔音,其波形類似于噪聲;另一類是元音,其波形類似于準周期信號。目前,判斷兩個語音波形是否相似一般采用相關性檢測的方法,或者類似的方法。由于語音信號的時變特性,基于相關性檢測的方法往往對語音波形的相似性判斷準確性不高。另外一類判斷兩個語音波形是否相似的辦法是變換域法,即把時域波形的相似性問題變換為等價的頻域的相似性問題。變換域法同樣也存在判斷準確性不高的問題,同時還帶來計算量增加的問題。為了解決上述問題,我們設計實現了一種測量語音波形相似度的新方法,其特點是完全基于時域實現,計算量小,抗噪聲性好,準確度高。本發明的語音波形相似度測量方法,不僅能測量語音波形的絕對相似度,而且能夠測量語音波形的相對相似度(即語音波形經放大或縮小后的相似度),可以用于語音信號的基音檢測,語音信號的高質量壓縮與還原,非線性特征抽取等方面,對語音信號處理有多方面的影響。
發明內容
本發明是一種基于時域的語音信號處理技術,用來測量兩個語音波形的相似度,其基本思想是對一段語音信號x(t),首先找出兩個相鄰的過零點t1和t2(且t1<t2);在區間[t1,t2]上,用平行于橫軸的直線將語音信號x(t)切分成互不重疊的N部分,計算每一部分的面積,然后將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應分量成比例,則可以判斷兩個語音波形經放大或縮小后相似(即相對相似)。
本發明的技術方案是數字化后的語音信號用一個有限序列{x(n)}表示,其中n表示語音樣本的序號,x(n)表示第n個樣本點的取值。語音信號x(n)的取值有三種情況正數,負數,零。正數表示波形在時間軸上方,負數表示波形在時間軸下方。語音信號x(n)的過零點有兩類情況一類是x(n)正好為零,那么這是稱n為過零點的位置;一類是x(n)和x(n+1)都不為零,但它們的符號相反,這時稱在x(n)和x(n+1)之間存在過零點,這個過零點的位置可以通過插值計算近似得到。
對一段離散化的語音信號x(t),首先找出兩個相鄰的過零點t1和t2(且t1<t2);在區間[t1,t2]上,語音信號x(t)要么全大于0,要么全小于0,不妨設x(t)全大于0;找出語音信號x(t)在區間[t1,t2]上的最大值(如果x(t)全小于0則找出最小值),不妨設最大值為x(t0);在橫軸(時間軸)到x(t0)之間,用平行于橫軸的直線將語音信號x(t)在區間[t1,t2]上圖像分為N部分,每一部分類似于梯形,其上下底邊都是直線,但左右邊是曲線,對這樣的每一部分采用近似算法計算其面積;然后將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;然后計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應分量成比例,則可以判斷兩個語音波形經放大或縮小后相似(即相對相似)。
權利要求
1.本發明涉及一種測量語音波形相似度的新方法,其特征是對于兩個相鄰的過零點之間的語音信號的圖像分塊計算面積。
2.根據權利要求1,語音信號的圖像分塊計算面積的技術特征是語音信號的圖像被平行于橫軸(時間軸)的直線切分成N部分,每一部分類似于梯形,其上下底邊都是直線,但左右邊是曲線,對這樣的每一部分采用近似算法計算其面積。
3.根據權利要求1和權利要求2,對語音信號的圖像分成N塊并計算每一塊的面積后,可以將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應分量成比例,則可以判斷兩個語音波形經放大或縮小后相似(即相對相似)。
全文摘要
一種測量語音波形相似度的新方法,其特點是完全基于時域實現,計算量小,抗噪聲性好,準確度高;其基本思想是對一段語音信號x(t),首先找出兩個相鄰的過零點t1和t2(且t1<t2);在區間[t1,t2]上,用平行于橫軸的直線將語音信號x(t)切分成互不重疊的N部分,計算每一部分的面積,然后將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應分量成比例,則可以判斷兩個語音波形經放大或縮小后相似(即相對相似)。本發明的語音波形相似度測量方法,不僅能測量語音波形的絕對相似度,而且能夠測量語音波形的相對相似度(即語音波形經放大或縮小后的相似度),可以用于語音信號的基音檢測,語音信號的高質量壓縮與還原,非線性特征抽取等方面,對語音信號處理有多方面的影響。
文檔編號G10L11/02GK101067928SQ20071012262
公開日2007年11月7日 申請日期2007年7月10日 優先權日2007年7月10日
發明者章森 申請人:章森