中文字幕无码日韩视频无码三区

歌詞文件的生成方法及裝置的制造方法

文檔序號:9811933閱讀:876來源:國知局
歌詞文件的生成方法及裝置的制造方法
【技術領域】
[0001] 本發明涉及音頻處理技術領域,特別涉及一種歌詞文件的生成方法及裝置。
【背景技術】
[0002] 隨著音頻處理技術的發展,用戶對試聽體驗有了更高的要求,不僅要求音頻播放 應用能夠播放音頻文件,還希望音頻播放應用能夠同步顯示與音頻文件相應的歌詞文件。
[0003] 為了滿足用戶的需求,現有技術主要采用人工方式為音頻文件數據庫中的每個音 頻文件生成相應的歌詞文件,并將所生成的歌詞文件導入到音頻播放應用中,從而在播放 音頻文件時,同步顯示相應地歌詞文件。
[0004] 在實現本發明的過程中,發明人發現現有技術至少存在以下問題:
[0005] 對于音頻文件數據庫中不同版本的音頻文件,現有技術也會采用人工方式為每個 音頻文件分別生成一個歌詞文件,該過程效率較低、制作成本較高。

【發明內容】

[0006] 為了解決現有技術的問題,本發明實施例提供了一種歌詞文件的生成方法及裝 置。所述技術方案如下:
[0007] -方面,提供了一種歌詞文件的生成方法,所述方法包括:
[0008] 獲取目標音頻文件及參考音頻文件,所述目標音頻文件與所述參考音頻文件為同 一音頻文件的不同版本;
[0009] 分別對所述目標音頻文件和所述參考音頻文件進行特征提取,得到第一音頻特征 和第二音頻特征;
[0010] 根據所述第一音頻特征和所述第二音頻特征,計算所述目標音頻文件與所述參考 音頻文件之間的時間偏差;
[0011] 根據所述時間偏差,調整所述參考音頻文件對應歌詞文件的時間戳,得到所述目 標音頻文件對應的歌詞文件。
[0012] 可選地,所述分別對所述目標音頻文件和所述參考音頻文件進行特征提取,得到 第一音頻特征和第二音頻特征,包括:
[0013] 采用預設頻率對所述目標音頻文件進行重采樣;
[0014] 將重采樣后的目標音頻文件劃分為多個音頻片段,每個音頻片段中包含預設數量 個采樣點;
[0015] 對于任意相鄰的第一音頻片段和第二音頻片段,采用漢寧窗函數進行處理,得到 第一加窗音頻片段和第二加窗音頻片段;
[0016] 對所述第一加窗音頻片段和所述第二加窗音頻片段分別進行快速傅里葉變換 FFT,得到所述第一音頻片段對應的第一頻譜和所述第二音頻片段對應的第二頻譜;
[0017] 對所述第一頻譜和所述第二頻譜分別進行映射,得到所述第一音頻片段對應的多 個第一頻率點和所述第二音頻片段對應的多個第二頻率點,所述第一頻率點和所述第二頻 率點的數量相同;
[0018]根據所述多個第一頻率點和多個所述第二頻率點,獲取所述第一音頻片段的音頻 特征值;
[0019]對所述多個音頻片段的音頻特征值進行組合,得到所述第一音頻特征。
[0020] 可選地,所述對所述第一頻譜和所述第二頻譜分別進行映射,得到所述第一音頻 片段對應的第一頻率點和所述第二音頻片段對應的第二頻率點,包括:
[0021] 對于所述第一頻譜,根據所述預設數量個采樣點和所述預設頻率,計算每個采樣 點對應的頻率范圍;
[0022] 將小于指定范圍的頻率范圍進行線性映射,得到多個線性頻率點;
[0023]將大于所述指定范圍的頻率范圍,應用以下公式,進行對數映射,得到多個對數頻 率占.
[0025] 其中,示所述對數頻率點,Bin表示大于所述指定范圍的任一頻率范圍,Δ f表示相鄰兩個采樣點對應的頻率范圍之間的頻率間隔,fref表示參考頻率,*表示乘號;
[0026] 將所述多個線性頻率點和所述多個對數頻率點作為所述多個第一頻率點。
[0027] 可選地,所述根據所述多個第一頻率點和所述多個第二頻率點,獲取所述第一音 頻片段的音頻特征值,包括:
[0028] 獲取所述第一音頻片段對應的每個第一頻率點的能量值,并獲取所述第二音頻片 段對應的每個第二頻率點的能量值;
[0029] 獲取所述第一音頻片段上每個第一頻率點的能量值與所述第二音頻片段上位置 相同的第二頻率點的能量值之差,作為所述第一音頻片段的音頻特征值。
[0030] 可選地,所述根據所述第一音頻特征和所述第二音頻特征,計算所述目標音頻文 件與所述參考音頻文件之間的時間偏差,包括:
[0031] 計算所述第一音頻特征和所述第二音頻特征之間的互相關函數;
[0032] 根據所述互相關函數,計算所述第一音頻特征和所述第二音頻特征之間的時間偏 差,作為所述目標音頻文件與所述參考音頻文件之間的時間偏差。
[0033] 可選地,所述計算所述第一音頻特征和所述第二音頻特征之間的互相關函數,包 括:
[0034] 對于所述第一音頻特征和所述第二音頻特征,應用以下公式,計算所述互相關函 數:
[0035] Rxy=IFFT(conj(FFT(x))*FFT(y))
[0036] 其中,X表示所述第一音頻特征,y表示所述第二音頻特征,Rxy表示所述互相關函 數,con j表示共輒運算符,IFFT表示反傅里葉變換,FFT表示傅里葉變換,*表示乘號。
[0037] 可選地,所述根據所述互相關函數,計算所述第一音頻特征和所述第二音頻特征 之間的時間偏差,包括:
[0038]計算所述互相關函數的最大值;
[0039] 獲取所述互相關函數的最大值對應的位置偏差;
[0040] 對于所述位置偏差,應用以下公式,計算所述第一音頻特征和所述第二音頻特征 之間的時間偏差:
[0041] i=m〇/ko
[0042] 其中,τ表示所述第一音頻特征和所述第二音頻特征之間的時間偏差,mo表示所述 互相關函數的最大值所對應的位置偏差,ko表示所述預設頻率,/表示除號。
[0043] 另一方面,提供了一種歌詞文件的生成裝置,所述裝置包括:
[0044] 獲取模塊,用于獲取目標音頻文件及參考音頻文件,所述目標音頻文件與所述參 考音頻文件為同一音頻文件的不同版本;
[0045] 提取模塊,用于分別對所述目標音頻文件和所述參考音頻考文件進行特征提取, 得到第一音頻特征和第二音頻特征;
[0046] 計算模塊,用于根據所述第一音頻特征和所述第二音頻特征,計算所述目標音頻 文件與所述參考音頻文件之間的時間偏差;
[0047] 調整模塊,用于根據所述時間偏差,調整所述參考音頻文件對應歌詞文件的時間 戳,得到所述目標音頻文件對應的歌詞文件。
[0048] 可選地,所述提取模塊,用于采用預設頻率對所述目標音頻文件進行重采樣;將重 采樣后的目標音頻文件劃分為多個音頻片段,每個音頻片段中包含預設數量個采樣點;對 于任意相鄰的第一音頻片段和第二音頻片段,采用漢寧窗函數進行處理,得到第一加窗音 頻片段和第二加窗音頻片段;對所述第一加窗音頻片段和所述第二加窗音頻片段分別進行 快速傅里葉變換FFT,得到所述第一音頻片段對應的第一頻譜和所述第二音頻片段對應的 第二頻譜;對所述第一頻譜和所述第二頻譜分別進行映射,得到所述第一音頻片段對應的 多個第一頻率點和所述第二音頻片段對應的多個第二頻率點,所述第一頻率點和所述第二 頻率點的數量相同;根據所述多個第一頻率點和多個所述第二頻率點,獲取所述第一音頻 片段的音頻特征值;對所述多個音頻片段的音頻特征值進行組合,得到所述第一音頻特征。
[0049] 可選地,所述提取模塊,還用于對于所述第一頻譜,根據所述預設數量個采樣點和 所述預設頻率,計算每個采樣點對應的頻率范圍;將小于指定范圍的頻率范圍進行線性映 射,得到多個線性頻率點;將大于所述指定范圍的頻率范圍,應用以下公式,進行對數映射, 得到多個對數頻率點:
[0051]其中,示所述對數頻率點,Bin表示大于所述指定范圍的任一頻率范圍,Δ f表示相鄰兩個采樣點對應的頻率范圍之間的頻率間隔,fref表示參考頻率,*表示乘號; [0052]將所述多個線性頻率點和所述多個對數頻率點作為所述多個第一頻率點。
[0053]可選地,所述提取模塊,用于獲取所述第一音頻片段對應的每個第一頻率點的能 量值,并獲取所述第二音頻片段對應的每個第二頻率點的能量值;獲取所述第一音頻片段 上每個第一頻率點的能量值與所述第二音頻片段上位置相同的第二頻率點的能量值之差, 作為所述第一音頻片段的音頻特征值。
[0054]可選地,所述計算模塊,用于計算所述第一音頻特征和所述第二音頻特征之間的 互相關函數;根據所述互相關函數,計算所述第一音頻特征和所述第二音頻特征之間的時 間偏差,作為所述目標音頻文件與所述參考音頻文件之間的時間偏差。
[0055]可選地,所述計算模塊,還用于對于所述第一音頻特征和所述第二音頻特征,應用 以下公式,計算所述互相關函數:
[0056] Rxy=IFFT(conj(FFT(x))*FFT(y))
[0057] 其中,X表示所述第一音頻特征,y表示所述第二音頻特征,Rxy表示所述互相關函 數,con j表示共輒運算符,IFFT表示反傅里葉變換,FFT表示傅里葉變換,*表示乘號。
[0058]可選地,所述計算模塊,還用于計算所述互相關函數的最大值;獲取所述互相關函 數的最大值對應的位置偏差;對于所述位置偏差,應用以下公式,計算所述第一音頻特征和 所述第二音頻特征之間的時間偏差:
[0059] i=m〇/ko
[0060] 其中,τ表示所述第一音頻特征和所述第二音頻特征之間的時間偏差,mo表示所述 互相關函數的最大值所對應的位置偏差,ko表示所述預設頻率,/表示除號。
[0061] 本發明實施例提供的技術方案帶來的有益效果是:
[0062] 對于同一音頻文件的不同版本,通過調整參考音頻文件對應的歌詞文件,即可為 目標音頻文件生成對應的歌詞文件,無需重復生成多個歌詞文件,提高了音頻文件的制作 效率,降低了制作成本。
【附圖說明】
[0063] 為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于 本領域普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他 的附圖。
[0064] 圖1A是本發明一個實施例提供的歌詞文件的生成方法所涉及的實施環境的結構 示意圖;
[0065] 圖1B是本發明另一個實施例提供的一種歌詞文件的生成方法流程圖;
[0066] 圖2是本發明另一個實施例提供的一種歌詞文件的生成方法流程圖;
[0067] 圖3是本發
當前第1頁1 2 3 4 5 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1