一種語音合成、刪除方法、裝置及語音刪除合成方法
【技術領域】
[0001]本發明涉及語音處理技術領域,尤其涉及一種語音合成、刪除方法、裝置及語音刪除合成方法。
【背景技術】
[0002]隨著語音識別技術的發展,其在人們的生活中扮演越來越重要的角色,人們越來越習慣使用語音技術。人們也習慣通過語音進行交互,這樣既方便又安全,也體現了智能終端的發展趨勢。聲紋是用電聲學儀器顯示的攜帶言語信息的聲波頻譜。現代科學研究表明,聲紋不僅具有特定性,而且有相對穩定性的特點。成年以后,人的聲音可保持長期相對穩定不變。
[0003]所謂聲紋,是用電聲學儀器顯示的攜帶言語信息的聲波頻譜。現代科學研究表明,聲紋不僅具有特定性,而且有相對穩定性的特點。成年以后,人的聲音可保持長期相對穩定不變。實驗證明,無論講話者是故意模仿他人聲音和語氣,還是耳語輕聲講話,即使模仿得惟妙惟肖,其聲紋卻始終不相同。人的發聲具有特定性和穩定性。從理論上講,它同指紋一樣具有身份識別(認定個人)的作用。
[0004]但現有技術中對于語音處理的方式負復雜,不適合在移動終端等設備進行簡易、快捷的語音處理。
【發明內容】
[0005]本發明的主要目的在于提出一種一種語音合成、刪除方法、裝置及語音刪除合成方法,旨在解決現有技術中語音和成刪除技術復雜的問題。
[0006]為實現上述目的,本發明提供的一種語音合成的方法,包含:
[0007]從第一語音信號中提取與預存聲紋特征信息對應的聲紋特征信號;
[0008]合成所述提取的聲紋特征信號與第二語音信號。
[0009]進一步的,合成所述提取的聲紋特征信號與第二語音信號具體包含:對第二語音信號進行頻譜分析,獲取包含基準頻率、基準時間在內的信息,將提取的聲紋特征信號與所述獲取的包含基準頻率、基準時間的信息拼接,實現提取的聲紋特征信號與第二語音信號的合成。
[0010]進一步的,從第一語音信號中提取與預存聲紋特征信息對應的聲紋特征信號之前還包含:建立聲紋特征信息模型,初始化相關變量,通過所述聲紋特征信息模型對選定聲音進行至少一次頻譜分析,獲取所述選定聲音的聲紋特征信息。
[0011 ]此外,為實現上述目的,本發明還提出一種語音合成裝置,
[0012]提取單元,用于從第一語音信號中提取與預存聲紋特征信息對應的聲紋特征信號;
[0013]合成單元,用于將所述提取的聲紋特征信號與第二語音信號進行合成。
[0014]進一步的,所述的合成單元進一步設置為:對第二語音信號進行頻譜分析,獲取包含基準頻率、基準時間在內的信息,將提取的聲紋特征信號與所述獲取的包含基準頻率、基準時間的信息拼接,實現提取的聲紋特征信號與第二語音信號的合成。
[0015]進一步的,還包含模型與訓練單元,用于建立聲紋特征信息模型,初始化相關變量,通過所述聲紋特征信息模型對選定聲音進行至少一次頻譜分析,獲取所述選定聲音的聲紋特征信息。
[0016]以及,一種語音刪除方法,包含:
[0017]從第一語音信號中提取與預存聲紋特征信息對應的聲紋特征信號;
[0018]從第二語音信號中移除帶有所述聲紋特征信號的聲波。
[0019]進一步的,所述從第二語音信號中移除帶有所述聲紋特征信號的聲波具體包含:對第二語音信號進行頻譜分析,獲取與提取的聲紋特征信號相匹配的聲波,刪除該段聲波。
[0020]以及,一種語音刪除裝置,包含:
[0021]提取單元,用于從第一語音信號中提取與預存聲紋特征信息對應的聲紋特征信號;
[0022]刪除單元,用于從第二語音信號中移除帶有所述聲紋特征信號的聲波。
[0023]進一步的,所述的刪除單元進一步設置為:對第二語音信號進行頻譜分析,獲取與聲紋特征信號相匹配的聲波,刪除該段聲波。
[0024]以及,一種語音刪除合成的方法,
[0025]獲取第一語音信號的聲紋特征信號;
[0026]從第二語音信號中移除含有所述第一語音信號聲紋特征信號的波形;
[0027]獲取第三語音信號的聲紋特征信號;
[0028]將所述第三語音信號的聲紋特征信號合成到所述第二語音信號中。
[0029]進一步的,所述獲取第一語音信號或者第三語音信號的聲紋特征信號的過程為:建立聲紋特征信息模型,初始化相關變量,通過所述聲紋特征信息模型對選定聲音進行至少一次頻譜分析,獲取所述選定聲音的聲紋特征信息;
[0030]從第一語音信號或者第三語音信號中提取與所述聲紋特征信息對應的聲紋特征信號。
[0031]進一步的,從第二語音信號中移除含有所述第一語音信號聲紋特征信號的波形的過程為:對第二語音信號進行頻譜分析,獲取與第一語音信號的聲紋特征信號相匹配的聲波,刪除該段聲波。
[0032]進一步的,所述將所述第三語音信號的聲紋特征信號合成到所述第二語音信號中的過程為:對第二語音信號進行頻譜分析,獲取包含基準頻率、基準時間在內的信息,將提取的第三語音信號的聲紋特征信號與所述獲取的第二語音信號的包含基準頻率、基準時間的信息拼接,使第三語音信號的聲紋特征信號合成到所述第二語音信號中。
[0033]進一步的,所述獲取第一語音信號、第二語音信號、第三語音信號的方式包括:錄
■~>V.曰ο
[0034]本發明提出的語音合成、刪除的方法和裝置以及刪除合成的方法,基于聲紋特征信息來識別特定人的聲音,在聲音合成(或者移除)的時候進行處理,完成后期語音信號的處理,比如錄音的時候可以輕易的合成特定人的聲音,或者移除特定人的聲音,對聲音的制作有很大的幫助,使得語音處理更加簡潔,方便。
【附圖說明】
[0035]圖1為本發明實施例一提供的一種語音合成方法流程示意圖;
[0036]圖2為本發明實施例二提供的一種語音合成方法結構示意圖;
[0037]圖3為本發明實施例三提供的一種語音合成裝置結構示意圖;
[0038]圖4為本發明實施例四提供的一種語音刪除方法流程示意圖;
[0039]圖5為本發明實施例五提供的一種語音刪除裝置結構示意圖;
[0040]圖6為本發明實施例六提供的一種語音刪除合成方法流程示意圖;
[0041 ]圖7為本發明實施例七提供的一種語音刪除合成方法流程示意圖;
[0042]圖8為本發明實施例八提供的一種語音刪除合成裝置結構示意圖。
[0043]本發明目的的實現、功能特點及優點將結合實施例,參照附圖做進一步說明。
【具體實施方式】
[0044]應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。
[0045]現在將參考附圖描述實現本發明各個實施例的移動終端。在后續的描述中,使用用于表示元件的諸如“模塊”、“部件”或“單元”的后綴僅為了有利于本發明的說明,其本身并沒有特定的意義。因此,"模塊"與"部件"可以混合地使用。
[0046]實施例一
[0047]如圖1所示,本發明第一實施例提出一種語音合成方法,包括:
[0048]S101,從第一語音信號中提取與預存聲紋特征信息