多媒體數據推送方法及裝置的制造方法
【技術領域】
[0001] 本發明涉及網絡技術領域,特別涉及一種多媒體數據推送方法及裝置。
【背景技術】
[0002] 隨著網絡技術的快速發展,互聯網已成為廣大用戶進行信息分享的平臺,在這種 情況下,用戶往往湮沒在低價值的海量數據信息中。為了改善網絡服務質量,使得網絡服務 更加智能化,時下通常針對不同用戶進行不同類型的數據推送,以提升用戶體驗度。然而, 由于互聯網中充斥著海量的數據信息,因此如何在海量數據信息中向用戶推送其感興趣的 多媒體數據,成為了一個亟待解決的問題。
[0003] 以多媒體數據為歌曲和為當前唱歌用戶推薦下一首演唱歌曲的情景為例,則現有 技術通常采取下述方式進行歌曲推薦:基于日志信息獲取用戶行為數據,將用戶行為數據 和各個歌曲信息映射到歐式空間中,得到用戶興趣特征信息和歌曲特征信息;基于用戶興 趣特征信息和歌曲特征信息,利用最大似然估計模型預測用戶當前曲目歌唱完畢后,接下 來最有可能演唱哪一首歌曲。其中,用戶唱完當前曲目后唱另一歌曲的概率可以表示為:
[0004]
【主權項】
1. 一種多媒體數據推送方法,其特征在于,所述方法包括: 對獲取到的日志信息進行預處理,得到處理后的日志數據; 根據所述日志數據,確定用戶興趣特征信息和多媒體數據特征信息; 在向所述用戶推送多媒體數據時,獲取用戶行為數據和所述多媒體數據的時效信息; 根據所述用戶行為數據和所述時效信息,更新所述用戶興趣特征信息和所述多媒體數 據特征信息; 根據更新后的興趣特征信息和更新后的多媒體數據特征信息,為所述用戶推送多媒體 數據。
2. 根據權利要求1所述的方法,其特征在于,所述根據所述用戶行為數據和所述時效 信息,更新所述用戶興趣特征信息和所述多媒體數據特征信息,包括: 根據所述用戶行為數據,計算所述用戶興趣特征信息對應的興趣信息變化值; 根據所述時效信息,計算所述多媒體數據特征信息對應的時效信息變化值; 根據所述興趣信息變化值和所述時效信息變化值,更新所述用戶興趣特征信息和所述 多媒體數據特征信息。
3. 根據權利要求1所述的方法,其特征在于,所述根據所述日志數據,確定所述用戶興 趣特征信息和多媒體數據特征信息,包括: 設置所述用戶的多媒體數據轉移概率; 根據所述日志數據,計算所述用戶在歐式空間中的第一特征向量集、所述多媒體數據 在歐式空間中的第二特征向量集; 根據所述多媒體數據轉移概率、所述第一特征向量集和所述第二特征向量集,確定所 述用戶興趣特征信息和多媒體數據特征信息。
4. 根據權利要求3所述的方法,其特征在于,所述設置所述用戶的多媒體數據轉移概 率之前,所述方法還包括: 設置興趣信息偏置項和時效信息偏置項; 其中,所述興趣信息偏置項B'u(t) =B'u+a ?signU-tu) · |t_tu|'所述時效信息偏 置項我;(,)=5: ,a、β、γ為常數,B,u、B〃b為與時間無關的偏置參數,t u為 用戶時間基值,tb為所述多媒體數據的上線時間。
5. 根據權利要求3所述的方法,其特征在于,應用下述公式,設置所述用戶的多媒體數 據轉移概率: . ^ Il f ^ CC \Xa ~xb W2 ~\\yu ~Xb IΓ + Bu (tUSk )+Bb (tUSk ) 其中,P (sb I sa, u, tusk)表示用戶U在tusk時刻消費完多媒體數據Sa后消費多媒體數據S b 的概率;P (Sb I Sa,u,tusk)表示用戶U在tusk時刻消費完多媒體數據S a后消費多媒體數據S,的 概率;B' u(tusk)表示在tusk時刻所述用戶興趣特征信息對應的興趣信息變化值,B〃 b(tusk) 表示在tusk時刻所述多媒體數據特征信息對應的時效信息變化值;X a表示所述多媒體數據 Sa在歐式空間中的特征向量,Xb表示所述多媒體數據s b在歐式空間中的特征向量,y u表示 所述用戶在歐式空間中的特征向量。Xa表示所述多媒體數據s a在歐式空間中的特征向量, Xb表示所述多媒體數據S b在歐式空間中的特征向量,y u表示所述用戶在歐式空間中的特征 向量。
6. 根據權利要求3所述的方法,其特征在于,應用下述公式,根據所述多媒體數據轉移 概率、所述第一特征向量集和所述第二特征向量集,確定所述用戶興趣特征信息和多媒體 數據特征信息:
其中,戶(A(i_+ll| 表示用戶U在tusk時刻消費完多媒體數據Z后消費多媒體數 據/^+1>的概率;尤表示用戶u在會話s e S(u)中消費的第k項多媒體數據,tusk表示用 戶u在會話s內消費第k項多媒體數據的時間,X和Y分別表示所述第一特征向量集和所 述第二特征向量集,B'u(t)、B"b(t)分別表示所述興趣信息偏置項和所述時效信息偏置項, s I表示一個會話中多媒體數據的項數,一個會話表征一個用戶在一個時間段內消費的一 個多媒體數據序列。
7. 根據權利要求2所述的方法,其特征在于,所述根據所述興趣信息變化值和所述時 效信息變化值,更新所述用戶興趣特征信息和所述多媒體數據特征信息,包括: 將所述興趣信息變化值累加到所述用戶興趣特征信息對應的列向量上,得到更新后的 用戶興趣特征信息; 將所述時效信息變化值累加到所述多媒體數據特征信息對應的列向量上,得到更新后 的多媒體數據特征信息。
8. 根據權利要求1至7中任一權利要求所述的方法,其特征在于,所述根據更新后的興 趣特征信息和更新后的多媒體數據特征信息,為所述用戶推送多媒體數據,包括: 根據更新后的用戶興趣特征信息和更新后的多媒體數據特征信息,計算各項多媒體數 據對應的轉移概率值; 對各項多媒體數據對應的轉移概率值進行排序; 根據排序結果,確定數值最大的預設數目個指定轉移概率值; 將所述預設數目個指定轉移概率值對應的多媒體數據推送給所述用戶。
9. 一種多媒體數據推送裝置,其特征在于,所述裝置包括: 數據處理模塊,用于對獲取到的日志信息進行預處理,得到處理后的日志數據; 特征信息確定模塊,用于根據所述日志數據,確定用戶興趣特征信息和多媒體數據特 征信息; 數據獲取模塊,用于在向所述用戶推送多媒體數據時,獲取用戶行為數據和所述多媒 體數據的時效信息; 特征信息更新模塊,用于根據所述用戶行為數據和所述時效信息,更新所述用戶興趣 特征信息和所述多媒體數據特征信息; 數據推送模塊,用于根據更新后的興趣特征信息和更新后的多媒體數據特征信息,為 所述用戶推送多媒體數據。
10. 根據權利要求9所述的裝置,其特征在于,所述特征信息更新模塊,用于根據所述 用戶行為數據,計算所述用戶興趣特征信息對應的興趣信息變化值;根據所述時效信息,計 算所述多媒體數據特征信息對應的時效信息變化值;根據所述興趣信息變化值和所述時效 信息變化值,更新所述用戶興趣特征信息和所述多媒體數據特征信息。
11. 根據權利要求9所述的裝置,其特征在于,所述特征信息確定模塊,用于設置所述 用戶的多媒體數據轉移概率;根據所述日志數據,計算所述用戶在歐式空間中的第一特征 向量集、所述多媒體數據在歐式空間中的第二特征向量集;根據所述多媒體數據轉移概率、 所述第一特征向量集和所述第二特征向量集,確定所述用戶興趣特征信息和多媒體數據特 征信息。
12. 根據權利要求11所述的裝置,其特征在于,所述裝置還包括: 偏置項設置模塊,用于設置興趣信息偏置項和時效信息偏置項; 其中,所述興趣信息偏置項B' u(t) =B'u+a .signU-tu) · |t_tu|p,所述時效信息 偏置項α、β、γ為常數,B,u、B〃b為與時間無關的偏置參數,tu 為用戶時間基值,tb為所述多媒體數據的上線時間。
13. 根據權利要求11所述的裝置,其特征在于,所述特征信息確定模塊,用于應用下述 公式,設置所述用戶的多媒體數據轉移概率: p/e out Λ rr ^~Wxa~xb\\2~\\yu~xb\\ 2+Bu (tUSk )+Bb(tusk) r\sb sa^u^uskJcce 其中,P (sb I sa, u, tusk)表示用戶U在tusk時刻消費完多媒體數據Sa后消費多媒體數據S b 的概率;P (Sb I sa,u,tusk)表示用戶u在tusk時刻消費完多媒體數據S a后消費多媒體數據S,的 概率;B' u(tusk)表示在tusk時刻所述用戶興趣特征信息對應的興趣信息變化值,B〃 b(tusk) 表示在tusk時刻所述多媒體數據特征信息對應的時效信息變化值;X a表示所述多媒體數據 Sa在歐式空間中的特征向量,Xb表示所述多媒體數據s b在歐式空間中的特征向量,y u表示 所述用戶在歐式空間中的特征向量。Xa表示所述多媒體數據s a在歐式空間中的特征向量, Xb表示所述多媒體數據s b在歐式空間中的特征向量,y u表示所述用戶在歐式空間中的特征 向量。
14. 根據權利要求11所述的裝置,其特征在于,所述特征信息確定模塊,用于應用下述 公式,根據所述多媒體數據轉移概率、所述第一特征向量集和所述第二特征向量集,確定所 述用戶興趣特征信息和多媒體數據特征信息:
其中,ΑαΓ?乂具U表示用戶U在tusl^刻消費完多媒體數據 < 后消費多媒體數 據/^+11的概率;<表示用戶U在會話S e S(U)中消費的第k項多媒體數據,tusl^示用戶 u在會話s內消費第k項多媒體數據的時間,X和Y分別表示所述第一特征向量集和所述第 二特征向量集,B'u(t)、B〃b(t)分別表示所述興趣信息偏置項和所述時效信息偏置項,|s 表示一個會話中多媒體數據的項數,一個會話表征一個用戶在一個時間段內消費的一個多 媒體數據序列。
15. 根據權利要求10所述的裝置,其特征在于,所述特征信息更新模塊,用于將所述興 趣信息變化值累加到所述用戶興趣特征信息對應的列向量上,得到更新后的用戶興趣特征 信息;將所述時效信息變化值累加到所述多媒體數據特征信息對應的列向量上,得到更新 后的多媒體數據特征信息。
16. 根據權利要求9至15中任一權利要求所述的裝置,其特征在于,所述數據推送 模塊,用于根據更新后的用戶興趣特征信息和更新后的多媒體數據特征信息,計算各項多 媒體數據對應的轉移概率值;對各項多媒體數據對應的轉移概率值進行排序;根據排序結 果,確定數值最大的預設數目個指定轉移概率值;將所述預設數目個指定轉移概率值對應 的多媒體數據推送給所述用戶。
【專利摘要】本發明公開了一種多媒體數據推送方法及裝置,屬于網絡技術領域。方法包括:對獲取到的日志信息進行預處理,得到處理后的日志數據;根據日志數據,確定用戶興趣特征信息和多媒體數據特征信息;在向用戶推送多媒體數據時,獲取用戶行為數據和多媒體數據的時效信息;根據用戶行為數據和時效信息,更新用戶興趣特征信息和多媒體數據特征信息;根據更新后的興趣特征信息和更新后的多媒體數據特征信息,為用戶推送多媒體數據。由于在多媒體數據推送時,還基于用戶行為數據和時效信息更新用戶興趣特征信息和多媒體數據特征信息,所以可精確捕捉用戶興趣的變化趨勢和多媒體數據的時效性變化,所以該種數據推送所參考的依據較為豐富,數據推送精準率較高。
【IPC分類】G06F17-30
【公開號】CN104731861
【申請號】CN201510060615
【發明人】胡琴敏, 林欣, 王智謹, 陳晨
【申請人】騰訊科技(深圳)有限公司, 華東師范大學
【公開日】2015年6月24日
【申請日】2015年2月5日