歌詞文件的生成方法及裝置的制造方法

文檔序號：9811933閱讀：876來源：國知局

歌詞文件的生成方法及裝置的制造方法
【技術領域】
[0001] 本發明涉及音頻處理技術領域，特別涉及一種歌詞文件的生成方法及裝置。
【背景技術】
[0002] 隨著音頻處理技術的發展，用戶對試聽體驗有了更高的要求，不僅要求音頻播放應用能夠播放音頻文件，還希望音頻播放應用能夠同步顯示與音頻文件相應的歌詞文件。
[0003] 為了滿足用戶的需求，現有技術主要采用人工方式為音頻文件數據庫中的每個音頻文件生成相應的歌詞文件，并將所生成的歌詞文件導入到音頻播放應用中，從而在播放音頻文件時，同步顯示相應地歌詞文件。
[0004] 在實現本發明的過程中，發明人發現現有技術至少存在以下問題：
[0005] 對于音頻文件數據庫中不同版本的音頻文件，現有技術也會采用人工方式為每個音頻文件分別生成一個歌詞文件，該過程效率較低、制作成本較高。

【發明內容】

[0006] 為了解決現有技術的問題，本發明實施例提供了一種歌詞文件的生成方法及裝置。所述技術方案如下：
[0007] -方面，提供了一種歌詞文件的生成方法，所述方法包括：
[0008] 獲取目標音頻文件及參考音頻文件，所述目標音頻文件與所述參考音頻文件為同一音頻文件的不同版本；
[0009] 分別對所述目標音頻文件和所述參考音頻文件進行特征提取，得到第一音頻特征和第二音頻特征；
[0010] 根據所述第一音頻特征和所述第二音頻特征，計算所述目標音頻文件與所述參考音頻文件之間的時間偏差；
[0011] 根據所述時間偏差，調整所述參考音頻文件對應歌詞文件的時間戳，得到所述目標音頻文件對應的歌詞文件。
[0012] 可選地，所述分別對所述目標音頻文件和所述參考音頻文件進行特征提取，得到第一音頻特征和第二音頻特征，包括：
[0013] 采用預設頻率對所述目標音頻文件進行重采樣；
[0014] 將重采樣后的目標音頻文件劃分為多個音頻片段，每個音頻片段中包含預設數量個采樣點；
[0015] 對于任意相鄰的第一音頻片段和第二音頻片段，采用漢寧窗函數進行處理，得到第一加窗音頻片段和第二加窗音頻片段；
[0016] 對所述第一加窗音頻片段和所述第二加窗音頻片段分別進行快速傅里葉變換 FFT，得到所述第一音頻片段對應的第一頻譜和所述第二音頻片段對應的第二頻譜；
[0017] 對所述第一頻譜和所述第二頻譜分別進行映射，得到所述第一音頻片段對應的多個第一頻率點和所述第二音頻片段對應的多個第二頻率點，所述第一頻率點和所述第二頻率點的數量相同；
[0018]根據所述多個第一頻率點和多個所述第二頻率點，獲取所述第一音頻片段的音頻特征值；
[0019]對所述多個音頻片段的音頻特征值進行組合，得到所述第一音頻特征。
[0020] 可選地，所述對所述第一頻譜和所述第二頻譜分別進行映射，得到所述第一音頻片段對應的第一頻率點和所述第二音頻片段對應的第二頻率點，包括：
[0021] 對于所述第一頻譜，根據所述預設數量個采樣點和所述預設頻率，計算每個采樣點對應的頻率范圍；
[0022] 將小于指定范圍的頻率范圍進行線性映射，得到多個線性頻率點；
[0023]將大于所述指定范圍的頻率范圍，應用以下公式，進行對數映射，得到多個對數頻率占.
[0025] 其中，示所述對數頻率點，Bin表示大于所述指定范圍的任一頻率范圍，Δ f表示相鄰兩個采樣點對應的頻率范圍之間的頻率間隔，fref表示參考頻率，*表示乘號；
[0026] 將所述多個線性頻率點和所述多個對數頻率點作為所述多個第一頻率點。
[0027] 可選地，所述根據所述多個第一頻率點和所述多個第二頻率點，獲取所述第一音頻片段的音頻特征值，包括：
[0028] 獲取所述第一音頻片段對應的每個第一頻率點的能量值，并獲取所述第二音頻片段對應的每個第二頻率點的能量值；
[0029] 獲取所述第一音頻片段上每個第一頻率點的能量值與所述第二音頻片段上位置相同的第二頻率點的能量值之差，作為所述第一音頻片段的音頻特征值。
[0030] 可選地，所述根據所述第一音頻特征和所述第二音頻特征，計算所述目標音頻文件與所述參考音頻文件之間的時間偏差，包括：
[0031] 計算所述第一音頻特征和所述第二音頻特征之間的互相關函數；
[0032] 根據所述互相關函數，計算所述第一音頻特征和所述第二音頻特征之間的時間偏差，作為所述目標音頻文件與所述參考音頻文件之間的時間偏差。
[0033] 可選地，所述計算所述第一音頻特征和所述第二音頻特征之間的互相關函數，包括：
[0034] 對于所述第一音頻特征和所述第二音頻特征，應用以下公式，計算所述互相關函數：
[0035] Rxy=IFFT(conj(FFT(x))*FFT(y))
[0036] 其中，X表示所述第一音頻特征，y表示所述第二音頻特征，Rxy表示所述互相關函數，con j表示共輒運算符，IFFT表示反傅里葉變換，FFT表示傅里葉變換，*表示乘號。
[0037] 可選地，所述根據所述互相關函數，計算所述第一音頻特征和所述第二音頻特征之間的時間偏差，包括：
[0038]計算所述互相關函數的最大值；
[0039] 獲取所述互相關函數的最大值對應的位置偏差；
[0040] 對于所述位置偏差，應用以下公式，計算所述第一音頻特征和所述第二音頻特征之間的時間偏差：
[0041] i=m〇/ko
[0042] 其中，τ表示所述第一音頻特征和所述第二音頻特征之間的時間偏差，mo表示所述互相關函數的最大值所對應的位置偏差，ko表示所述預設頻率，/表示除號。
[0043] 另一方面，提供了一種歌詞文件的生成裝置，所述裝置包括：
[0044] 獲取模塊，用于獲取目標音頻文件及參考音頻文件，所述目標音頻文件與所述參考音頻文件為同一音頻文件的不同版本；
[0045] 提取模塊，用于分別對所述目標音頻文件和所述參考音頻考文件進行特征提取，得到第一音頻特征和第二音頻特征；
[0046] 計算模塊，用于根據所述第一音頻特征和所述第二音頻特征，計算所述目標音頻文件與所述參考音頻文件之間的時間偏差；
[0047] 調整模塊，用于根據所述時間偏差，調整所述參考音頻文件對應歌詞文件的時間戳，得到所述目標音頻文件對應的歌詞文件。
[0048] 可選地，所述提取模塊，用于采用預設頻率對所述目標音頻文件進行重采樣;將重采樣后的目標音頻文件劃分為多個音頻片段，每個音頻片段中包含預設數量個采樣點；對于任意相鄰的第一音頻片段和第二音頻片段，采用漢寧窗函數進行處理，得到第一加窗音頻片段和第二加窗音頻片段;對所述第一加窗音頻片段和所述第二加窗音頻片段分別進行快速傅里葉變換FFT，得到所述第一音頻片段對應的第一頻譜和所述第二音頻片段對應的第二頻譜;對所述第一頻譜和所述第二頻譜分別進行映射，得到所述第一音頻片段對應的多個第一頻率點和所述第二音頻片段對應的多個第二頻率點，所述第一頻率點和所述第二頻率點的數量相同；根據所述多個第一頻率點和多個所述第二頻率點，獲取所述第一音頻片段的音頻特征值;對所述多個音頻片段的音頻特征值進行組合，得到所述第一音頻特征。
[0049] 可選地，所述提取模塊，還用于對于所述第一頻譜，根據所述預設數量個采樣點和所述預設頻率，計算每個采樣點對應的頻率范圍；將小于指定范圍的頻率范圍進行線性映射，得到多個線性頻率點;將大于所述指定范圍的頻率范圍，應用以下公式，進行對數映射，得到多個對數頻率點：
[0051]其中，示所述對數頻率點，Bin表示大于所述指定范圍的任一頻率范圍，Δ f表示相鄰兩個采樣點對應的頻率范圍之間的頻率間隔，fref表示參考頻率，*表示乘號； [0052]將所述多個線性頻率點和所述多個對數頻率點作為所述多個第一頻率點。
[0053]可選地，所述提取模塊，用于獲取所述第一音頻片段對應的每個第一頻率點的能量值，并獲取所述第二音頻片段對應的每個第二頻率點的能量值;獲取所述第一音頻片段上每個第一頻率點的能量值與所述第二音頻片段上位置相同的第二頻率點的能量值之差，作為所述第一音頻片段的音頻特征值。
[0054]可選地，所述計算模塊，用于計算所述第一音頻特征和所述第二音頻特征之間的互相關函數;根據所述互相關函數，計算所述第一音頻特征和所述第二音頻特征之間的時間偏差，作為所述目標音頻文件與所述參考音頻文件之間的時間偏差。
[0055]可選地，所述計算模塊，還用于對于所述第一音頻特征和所述第二音頻特征，應用以下公式，計算所述互相關函數：
[0056] Rxy=IFFT(conj(FFT(x))*FFT(y))
[0057] 其中，X表示所述第一音頻特征，y表示所述第二音頻特征，Rxy表示所述互相關函數，con j表示共輒運算符，IFFT表示反傅里葉變換，FFT表示傅里葉變換，*表示乘號。
[0058]可選地，所述計算模塊，還用于計算所述互相關函數的最大值;獲取所述互相關函數的最大值對應的位置偏差;對于所述位置偏差，應用以下公式，計算所述第一音頻特征和所述第二音頻特征之間的時間偏差：
[0059] i=m〇/ko
[0060] 其中，τ表示所述第一音頻特征和所述第二音頻特征之間的時間偏差，mo表示所述互相關函數的最大值所對應的位置偏差，ko表示所述預設頻率，/表示除號。
[0061] 本發明實施例提供的技術方案帶來的有益效果是：
[0062] 對于同一音頻文件的不同版本，通過調整參考音頻文件對應的歌詞文件，即可為目標音頻文件生成對應的歌詞文件，無需重復生成多個歌詞文件，提高了音頻文件的制作效率，降低了制作成本。
【附圖說明】
[0063] 為了更清楚地說明本發明實施例中的技術方案，下面將對實施例描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發明的一些實施例，對于本領域普通技術人員來講，在不付出創造性勞動的前提下，還可以根據這些附圖獲得其他的附圖。
[0064] 圖1A是本發明一個實施例提供的歌詞文件的生成方法所涉及的實施環境的結構示意圖；
[0065] 圖1B是本發明另一個實施例提供的一種歌詞文件的生成方法流程圖；
[0066] 圖2是本發明另一個實施例提供的一種歌詞文件的生成方法流程圖；
[0067] 圖3是本發

完整全部詳細技術資料下載

當前第1頁1 2 3 4 5

該技術已申請專利。僅供學習研究，如用于商業用途，請聯系技術所有人。
技術研發人員：武大偉;
技術所有人：廣州酷狗計算機科技有限公司;
我是此專利的發明人

上一篇：一種改進硬盤背板掛鉤結構減輕硬盤震動下性能衰減的方法
上一篇：車輛用多媒體裝置的音樂播放方法

該領域下的技術專家
如您需求助技術專家，請點此查看客服電話進行咨詢。
1、畢老師：機構動力學與控制
2、袁老師：1.計算機視覺 2.無線網絡及物聯網
3、王老師：1.計算機網絡安全 2.計算機仿真技術
4、王老師：1.網絡安全；物聯網安全、大數據安全 2.安全態勢感知、輿情分析和控制 3.區塊鏈及應用
5、張老師：1.機械設計的應力分析、強度校核的計算機仿真 2.生物反應器研制 3.生物力學
如您是高校老師，可以點此聯系我們加入專家庫。

相關技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

license文件生成方法相關技術

生體魔力生成裝置相關技術

中文字幕无码日韩视频无码三区

歌詞文件的生成方法及裝置的制造方法