中文字幕无码日韩视频无码三区

一種信息投放的預處理方法和裝置的制造方法

文檔序號:10624777閱讀:398來源:國知局
一種信息投放的預處理方法和裝置的制造方法
【專利摘要】本申請提供了一種信息投放的預處理方法和裝置,以解決精準的定位來推薦業務對象以防止資源浪費的技術問題。所述的方法包括:在用戶訪問網站時,基于用戶的當前訪問網頁和歷史行為信息確定所述用戶的特征信息;根據特征信息確定分類標簽及其用戶群,為每個分類標簽創建業務對象組;計算特征信息所屬分類標簽對應用戶群的群體價值信息;依據所述群體價值信息設置所述業務對象組的價值特征信息,其中,所述價值特征信息用于確定網頁展示位中展示的業務對象組。從而能夠全面、準確地確定用戶所具有的特征,可以在投放廣告前準確分析用戶所屬分類標簽并確定對應業務對象組及其價值特征信息,使得后續所投放的業務對象定位更精準,符合用戶期望和需求。
【專利說明】
-種信息投放的預處理方法和裝置
技術領域
[0001] 本申請設及數據處理技術領域,特別是設及一種信息投放的預處理方法和一種信 息投放的預處理裝置。
【背景技術】
[0002] 隨著互聯網技術的發展,用戶常常在網絡中查找各種信息,瀏覽相關網頁。用戶在 網絡中捜索信息時往往采用捜索網站如Google、百度等,從而通過其捜索引擎反饋相應的 捜索結果進行查找。
[0003] 由于捜索引擎上有大量的用戶查詢流量,因此當需要推薦某些業務對象的信息 時,可W將其投放給捜索引擎W進行推薦。捜索引擎對運類業務對象的推薦可W是將其展 示在與捜索引擎合作的網站提供展示位上,同時為了兼顧投放質和量的需求,可W對展示 位的流量進行重定向(retargeting),只購買展示的業務對象流量中到曾經到達過網站的 用戶。
[0004] 對業務對象的推薦后,用戶可W點擊查看該業務對象,進而執行與該業務對象相 關的操作,因此對用戶精準的定位才能提高對業務對象的點擊率,使得推薦更符合需求。對 于定位不準確而推薦的業務對象,不但點擊率較低,也造成了網站展示位資源的浪費,W及 用戶網絡流量資源的浪費。 陽〇化]因此,目前需要本領域技術人員迫切解決的一個技術問題就是:如何精準的定位 來推薦業務對象W防止資源浪費。

【發明內容】

[0006] 本申請實施例所要解決的技術問題是提供一種信息投放的預處理方法,W解決精 準的定位來推薦業務對象W防止資源浪費的技術問題。
[0007] 相應的,本申請實施例還提供了一種信息投放的預處理裝置,用W保證上述方法 的實現及應用。
[0008] 為了解決上述問題,本申請公開了一種信息投放的預處理方法,包括:在用戶訪問 網站時,基于用戶的當前訪問網頁和歷史行為信息確定所述用戶的特征信息;根據所述特 征信息確定分類標簽及其用戶群,為每個分類標簽創建業務對象組;計算特征信息所屬分 類標簽對應用戶群的群體價值信息;依據所述群體價值信息設置所述業務對象組的價值特 征信息,其中,所述價值特征信息用于確定網頁展示位中展示的業務對象組。
[0009] 本申請還公開了一種信息投放的預處理裝置,包括:特征分析模塊,用于在用戶訪 問網站時,基于用戶的當前訪問網頁和歷史行為信息確定所述用戶的特征信息;標簽分析 模塊,用于根據所述特征信息確定分類標簽及其用戶群;創建模塊,用于為每個分類標簽創 建業務對象組;群體價值計算模塊,用于計算特征信息所屬分類標簽對應用戶群的群體價 值信息;價值特征設置模塊,用于依據所述群體價值信息設置所述業務對象組的價值特征 信息,其中,所述價值特征信息用于確定網頁展示位中展示的業務對象組。
[0010] 與現有技術相比,本申請實施例包括W下優點:
[0011] 在本申請實施例中,通過基于用戶的當前訪問網頁和歷史行為信息確定所述用戶 的特征信息,從而全面、準確地確定用戶所具有的特征,再基于各用戶的特征信息分析出對 應的分類標簽,W及該分類標簽所對應的用戶群,并為每個分類標簽創建業務對象組,即可 W基于用戶當前和歷史行為分析出其所對應的業務對象組,從而后續精準的定位推薦的業 務對象。并且,還采用特征信息分析其所屬分類標簽對應用戶群的群體價值信息,進而設置 業務對象組的價值特征信息,準確的分析每個業務對象組的價值,W在投放廣告時依據其 價值特征信息準確的確定投放的業務對象,從而通過上述投放的預處理操作,可W在投放 廣告前準確分析用戶所屬分類標簽并確定對應業務對象組及其價值特征信息,使得后續所 投放的業務對象定位更精準,符合用戶期望和需求。
【附圖說明】
[0012] 圖1是本申請實施例提供的一種信息投放的預處理方法的步驟流程圖;
[0013] 圖2是本申請實施例提供的另一種信息投放的預處理方法的步驟流程圖;
[0014] 圖3是本申請實施例提供的捜索引擎廣告投放架構示意圖;
[0015] 圖4是本申請實施例提供的捜索引擎和網站的廣告投放交互示意圖;
[0016] 圖5是本申請實施例提供的一種信息投放的預處理裝置的結構框圖;
[0017] 圖6A-E是本申請實施例提供的另一種信息投放的預處理裝置的結構框圖。
【具體實施方式】
[001引為使本申請的上述目的、特征和優點能夠更加明顯易懂,下面結合附圖和具體實 施方式對本申請作進一步詳細的說明。
[0019] 網站對自身所展示的目標對象進行推薦時,可W生成其對應的業務對象并投放到 其它網站的網頁上進行展示。若用戶對推薦的業務對象感興趣即可點擊該業務對象來查看 對應的目標對象,因此在向網站投放業務對象時,對用戶和所投放業務對象的精準定位有 助于提高業務對象的點擊率,獲得更好的推薦效果,反之若定位不準確則網站的展示位中 展示的業務對象點擊率較低,造成流量資源的浪費且達不到推薦效果。
[0020] 本申請實施例的核屯、構思之一在于,提出一種信息投放的預處理方法,W解決精 準的定位來推薦業務對象W防止資源浪費的技術問題。可W在投放廣告前準確分析用戶所 屬分類標簽并確定對應業務對象組及其價值特征信息,使得后續所投放的業務對象定位更 精準,符合用戶期望和需求。 陽〇21] 實施例一
[0022] 參照圖1,示出了本申請實施例提供的一種信息投放的預處理方法的步驟流程圖, 具體可W包括如下步驟:
[0023] 步驟102,在用戶訪問網站時,基于用戶的當前訪問網頁和歷史行為信息確定所述 用戶的特征信息。
[0024] 在為用戶推薦業務對象時,需要為用戶推薦其感興趣的業務對象才能得到用戶的 關注并點擊查看,因此,可W預先設置業務對象的分類標簽,采用該分類標簽標記業務對象 的類別,從而依據用戶所具有的分類標簽推薦相應的業務對象。通常分類標簽是對用戶當 前訪問網頁進行標注確定的,如網頁標題、網頁關鍵字等,但是當前訪問網頁并不一定是用 戶感興趣的,可能是由用戶誤操作等開啟的,因此僅基于當前訪問網頁確定用戶具有的分 類標簽準確性較低。
[0025] 本實施例中,在用戶訪問網站時,可W獲取該當前訪問網頁,W及其歷史行為信 息,歷史行為信息指的是該用戶在該網站的訪問歷史,如在所述網站中歷史瀏覽器的網頁, 在網頁中執行的操作等。從而分別通過對當前訪問網頁和歷史行為信息的分析,確定該用 戶的特征信息。所述特征信息指的是用戶在網站中的訪問特征,其包括各類特征及其特征 值,例如訪問網站的次數、訪問過的網頁標題、關鍵字等。
[00%] 步驟104,根據特征信息確定分類標簽及其用戶群,為每個分類標簽創建業務對象 組。
[0027] 特征信息標識了用戶在網站中的訪問特征,因此對所有訪問網站的用戶的特征信 息進行分析就可W獲取訪問該網站的用戶的群體特征,從而確定該網站所具有的分類標 簽,W及每個標簽所對應的用戶群。
[0028] 再為每個分類標簽創建一個業務對象組,該業務對象組是具有相同特征的業務對 象的集合,如具有相同類目、具有相同來源等。從而投放廣告時確定一個用戶所屬用戶群的 分類標簽,即可確定為其推薦的業務對象組。本實施例中為用戶推薦的業務對象是基于用 戶歷史行為信息所確定的,所確定的分類標簽準確性更高,能夠確定更符合用戶期望的業 務對象。
[0029] 步驟106,計算特征信息所屬分類標簽對應用戶群的群體價值信息。
[0030] 通過用戶所屬用戶群的分類標簽可W確定對應的業務對象組,但是一個用戶可能 同時屬于多個用戶群,即對應多個業務對象組,因此在對用戶進行業務對象的推薦時,就要 分析實際的推薦方式W獲取更高的點擊率、更好的推薦效果。
[0031] 本實施例中設置了用戶群的群體價值信息,該群體價值信息用于衡量投放該用戶 群對應業務對象組的價值。可W對各用戶的特征信息進行分析,如通過模型訓練等方式計 算該特征信息所屬分類標簽對應用戶群的群體價值信息。
[0032] 步驟108,依據所述群體價值信息設置所述業務對象組的價值特征信息。
[0033] 本實施例中,設置了價值特征信息來標識業務對象組的價值,所述價值特征信息 用于確定網頁展示位中展示的業務對象組,因此可W通過群體價值信息設置所述業務對象 組的價值特征信息。從而在其他網站中投放業務對象時,可W基于該用戶所對應的業務對 象組的價值特征信息確定投放的業務對象。
[0034] 綜上所述,本實施例通過基于用戶的當前訪問網頁和歷史行為信息確定所述用戶 的特征信息,從而全面、準確地確定用戶所具有的特征,再基于各用戶的特征信息分析出對 應的分類標簽,W及該分類標簽所對應的用戶群,并為每個分類標簽創建業務對象組,即可 W基于用戶當前和歷史行為分析出其所對應的業務對象組,從而后續精準的定位推薦的業 務對象。并且,還采用特征信息分析其所屬分類標簽對應用戶群的群體價值信息,進而設置 業務對象組的價值特征信息,準確的分析每個業務對象組的價值,W在投放廣告時依據其 價值特征信息準確的確定投放的業務對象,從而通過上述投放的預處理操作,可W在投放 廣告前準確分析用戶所屬分類標簽并確定對應業務對象組及其價值特征信息,使得后續所 投放的業務對象定位更精準,符合用戶期望和需求。
[0035] 本申請實施例中,信息投放可W應用于多種不同的場景中,例如廣告的推薦投放、 新聞等信息的推送投放等,即應用場景不同推送的業務對象也不同,可W依據實際需求設 定。
[0036] 實施例二
[0037] 在上述實施例的基礎上,本實施例詳細論述信息投放的預處理方法。
[0038] 參照圖2,示出了本申請實施例提供的另一種信息投放的預處理方法的步驟流程 圖,具體可W包括如下步驟:
[0039] 步驟202,在用戶訪問網站時,分別獲取所述用戶的當前訪問網頁和歷史行為信 息。
[0040] 步驟204,按照一種或多種維度分別對所述當前訪問網頁和歷史行為信息進行分 析,確定所述用戶的特征信息。
[0041] 用戶訪問網站瀏覽網頁時,可W獲取該用戶的當前訪問網頁,并獲取該用的歷史 行為信息。例如,針對購物網站,可W獲取用戶當前瀏覽的購物頁面,并且獲取該用戶對購 物網站的歷史行為信息,如在網站中的捜索歷史,網站中的購物信息等。
[0042] 由于用戶對網站和網頁的訪問是一個完整的操作行為,因此對于其對應的信息可 W通過多個維度進行衡量,即通過一種或多種維度分別對所述當前訪問網頁和歷史行為信 息進行分析,例如通過文本維度、時間維度、操作維度等多種維度分別進行分析,從而獲取 全面、綜合、準確的分析結果。
[0043] (1)對當前訪問網頁的分析
[0044] 本申請一個可選實施例中,對所述當前訪問網頁進行分析確定所述用戶的特征信 息的步驟,包括:按照文本維度對所述當前訪問網頁的文本信息進行分析,從所述文本信息 中提取業務特征和所述業務特征的特征值作為所述用戶的特征信息。
[0045] 用戶所訪問的網頁通常具有一定的文本特征,且該文本特征能夠反映出用戶對該 網頁的興趣點,因此可W基于文本維度對當前訪問網頁的文本信息進行分析,如對網頁的 標題、正文進行文本分析,確定其中的關鍵詞等信息,從而從網頁中獲取與所推薦業務對象 相關的業務特征和所述業務特征的特征值作為所述用戶的特征信息。
[0046] 其中,由于應用場景不同時,推薦的業務對象也不同,因此在進行文本分析時對文 本的標注點也不同,例如針對購物網站,可W提取網頁中與購物商品相關的商品名稱、商品 類目W及諸如制造商、賣家等相關商品信息作為業務特征的特征值。
[0047] 還包括:針對操作維度,通過對所述用戶在當前訪問網頁內執行的操作信息的分 析,提取所述用戶的分類特征及其特征值,其中,所述操作信息包括:停留時間數據和動作 執行數據。
[0048] 用戶在瀏覽網頁時,除了網頁內容本身能夠顯示用戶的興趣點之外,用戶在網頁 中執行的操作也能顯示用戶的興趣,例如,用戶在開啟網頁很短時間(如5秒)內即關閉網 頁,則可能表征用戶對該網頁不感興趣,如該網頁是由誤操作而開啟的。又如,用戶在網頁 中點擊或選中某些內容等操作,表征用戶可能對其有興趣。
[0049] 因此可W對用戶在當前訪問網頁中執行的操作信息進行分析,所述操作信息包 括:停留時間數據和動作執行數據,即分析具體的操作、操作對象W及操作時間等信息,從 而提取相應的分類特征,W及分類特征的特征值。
[0050] 從而網頁本身和用戶操作確定多種維度進行網頁分析確定該用的特征信息。
[0051] (2)對歷史行為信息的分析
[0052] 對所述歷史行為信息進行分析確定所述用戶的特征信息的步驟包括W下子步驟 一到Ξ中至少一項:
[0053] 步驟一:按照文本維度對所述歷史行為信息中的文本信息進行分析,從所述文本 信息中提取業務特征和所述業務特征的特征值作為所述用戶的特征信息。
[0054] 與當前訪問網頁的文本分析類似,用戶歷史行為信息中包括歷史捜索和瀏覽記 錄,因此用戶歷史行為信息的文本信息包括歷史捜索記錄,W及歷史瀏覽網頁的文本等信 息,從而通過對文本信息的分析,可W獲取相應的業務特征及其特征值。
[0055] 步驟二:按照時間維度對所述歷史行為信息中的時間相關信息進行分析,從所述 時間相關信息中提取階段特征和所述階段特征的特征值作為用戶的特征信息。
[0056] 用戶的歷史行為信息中包括很多時間相關信息,例如用戶對歷史網頁的瀏覽時 間、用戶對歷史網頁所執行操作的時間等。例如對于購物網站,用戶的歷史行為信息包括其 歷史捜索、購買商品的時間,歷史購買的商品所處的階段等,W及用戶對購物網站的訪問次 數等與時間相關的信息。
[0057] 因此,可W在時間維度上對歷史行為信息中的時間相關信息進行分析,確定用戶 對網站訪問的規律、活躍度等,從所述時間相關信息中提取階段特征和所述階段特征的特 征值作為用戶的特征信息,例如用戶訪問網站的次數、頻率等。
[0058] 步驟Ξ:按照其他維度對所述歷史行為信息中的關聯信息進行分析,從所述關聯 信息中提取地域特征及其特征值,和/或,設備特征及其特征值作為用戶的特征信息。
[0059] 還可W按照其他維度對所述歷史行為信息中的關聯信息進行分析,從關聯信息中 提取地域特征及其特征值,如訪問購物網站時,確定用戶購買商品的寄送地址、商品產地 等,或者從關聯信息中提取設備特征及其特征值,如用戶訪問網站所使用的設備,如采用移 動設備,W及具體的移動設備等。
[0060] 從而通過多種維度的分析得到多維的特征信息,全面、準確的分析訪問網站的用 戶所具有的特征。
[0061] 步驟206,獲取各用戶的特征信息中的特征值,確定各特征值對應匹配的分類標 簽。
[0062] 步驟208,針對每個分類標簽,通過特征值圈定所述分類標簽對應的用戶構成用戶 群。
[0063] 本實施例中,對網站中所有用戶的特征信息進行分析,確定相應的分類標簽,每一 種特征對應一個或多個分類標簽,而每個分類標簽對應一個或多個特征值,從而確定用戶 的特征信息中各特征值對應匹配的分類標簽。
[0064] 分類標簽的設置可W依據實際需求確定,例如在購物網站中,業務特征包括類目 特征和商品特征,而一個類目可W作為一個分類標簽,則一個分類標簽可能對應多個商品 特征的特征值。而對于設備特征、地域特征則可W各自對應一個分類標簽。 陽0化]由于每個分類標簽對應一個或多個特征值,因此針對每個分類標簽,通過其所對 應的特征值圈定該特征值所對應用戶,構成該分類標簽的用戶群 [0066] 步驟210,為每個分類標簽創建業務對象組。
[0067] 由于在投放時是按照用戶所具有的分類標簽確定投放的業務對象,因此要為每個 分類標簽創建一個業務對象組,該業務對象組中包括屬于該分類標簽的各業務對象。
[0068] 然后分析每個業務對象組所對應用戶群的群體價值信息,W通過用戶群的群體價 值信息設置業務對象組的價值特征信息,據此確定業務對象的投放。
[0069] 步驟212,對第一時間段內各用戶的特征信息進行特征分析,確定用戶群的價值權 重。
[0070] 針對任意用戶群,可W獲取第一時間段內該用戶群中各用戶的特征信息進行特征 分析,例如采用模型訓練獲取該用戶群的價值權重,該價值權重用于預估用戶群的全體價 值倍息。
[0071] 本申請一個可選實施例中,所述對第一時間段內各用戶的特征信息進行特征分 析,確定用戶群的價值權重,包括:對所述第一時間段進行切分,確定訓練時間段和測試時 間段;對所述訓練時間段內各用戶的特征信息進行特征分析確定特征矩陣;從所述測試時 間段內各用戶的特征信息中抽取訓練目標;對所述特征矩陣和訓練目標進行回歸訓練,計 算所述用戶群的價值權重。
[0072] 將第一時間段切分為兩部分,前一部分作為訓練時間段,后一部分作為測試時間 段。然后采用訓練時間段內各用戶的特征信息進行特征分析確定特征矩陣,生成特征模型。 從所述測試時間段內各用戶的特征信息中抽取訓練目標,對特征模型進行模型訓練,即對 所述特征矩陣和訓練目標進行回歸訓練,計算該用戶群的價值權重。
[0073] 步驟214,對第二時間段內各用戶的特征信息進行特征分析,并通過所述價值權重 的加權計算確定所述用戶群的群體價值信息。
[0074] 第二時間段可W使進行投放預測前的一段時間,在對該第二時間段內各用戶的特 征信息進行特征分析后,通過價值權重對分析結果進行加權計算,確定所述用戶群的群體 價值信息。
[0075] 本申請一個可選實施例中,對第二時間段內各用戶的特征信息進行特征分析,并 通過所述價值權重的加權計算確定所述用戶群的群體價值信息,包括:對第二時間段內各 用戶的特征信息進行特征分析確定預測的特征矩陣;采用所述價值權重對所述預測的特征 矩陣進行加權,計算確定所述用戶群的群體價值信息。在對第二時間段內各用戶的特征信 息進行特征分析時,可W計算該用戶的特征矩陣,然后采用價值權重對所述預測的特征矩 陣進行加權,計算確定所述用戶群的群體價值信息。
[0076] 步驟216,通過預設的目標價值信息和所述用戶群的群體價值信息,計算所述業務 對象組的價值特征信息。
[0077] 本實施例中,預先設置了目標價值信息,該目標價值信息指的是業務對象投放后 預期獲取的價值,因此對于業務對象組的價值特征信息,可W采用預設的目標價值信息和 所述用戶群的群體價值信息進行計算得到。
[0078] 步驟218,根據所述用戶的特征信息確定所述用戶對應的候選分類標簽。
[0079] 每個用戶訪問網站時都可W分析出其所具有的特征信息,由于一個用戶特征具有 多種特征信息,各特征的特征值對應了分類標簽,而不能對每種特征都投放其相應的業務 對象,因此要從該用戶所對應分類標簽總篩選候選分類標簽。
[0080] 本申請一個可選實施例中,根據所述用戶的特征信息確定所述用戶對應的候選分 類標簽,包括:從所述用戶訪問網站的數據庫中篩選所述用戶的業務特征的特征值對應關 聯特征信息;按照所述關聯特征信息計算每個業務特征的特征值的排序分值;按照所述排 序分值對所述用戶的業務特征的特征值進行排序,確定排序結果;從所述排序結果中篩選 前N個業務特征的特征值,將篩選的特征值對應分類標簽作為特征分類標簽。
[0081] 本實施例中,將業務對象對應的網頁內容稱為目標對象,例如針對購物網站的廣 告,該廣告所對應購物網站的商品即為目標對象。數據庫中存儲有目標對象的各種關聯特 征,如對于某一商品其存儲有訂單數量,該商品的點擊數量等特征。因此針對用戶業務特征 的各特征值,可W獲取該特征值的關聯特征信息,然后采用關聯特征信息計算每個業務特 征的特征值的排序分值。
[0082] 再按照排序分值由大到小的順序對該用戶的每個特征值進行排序,獲取相應的排 序結果。再從該排序結果中篩選出前N個特征值,其中N為正整數,將篩選出的特征值對應 分類標簽作為特征分類標簽。特征分類標簽為該用戶興趣較高的分類標簽,可W用于確定 投放的業務對象,W及選中業務對象后所顯示登陸頁面中展示的目標對象。
[0083] 步驟220,按照所述候選分類標簽設置所述用戶的登陸頁面。
[0084] 在網站中投放業務對象的目的之一是希望用戶基于該業務對象訪問其對應網站 的網頁W查看目標對象,因此本實施例中還配置了業務對象被點擊觸發后顯示的登錄頁 面,即登陸頁面為觸發所述網頁展示位中展示的業務對象所鏈接到的頁面。
[0085] 由于每個用戶具有多個分類標簽,而其觸發的分類標簽僅是其中的一個,因此為 了更全面的為用戶推薦目標對象,可W在該登錄頁面中展示觸發分類標簽的目標對象,W 及該用戶所具有的其他候選分類標簽的目標對象。
[0086] 本申請一個可選實施例中,按照所述候選分類標簽設置所述用戶的登陸頁面,包 括:按照所述候選分類標簽確定檢索關鍵詞對目標對象進行檢索,獲取檢索到的目標對象; 按照所述候選分類標簽的排序分值,對所述檢索到的目標對象的點擊數據進行修正;按照 修正的點擊數據對所述檢索到的目標對象進行排序;依據排序結果生成包含所述檢索到的 目標對象的登錄頁面。
[0087] 針對每個候選分類標簽其對應一定的特征值,可該特征值為檢索關鍵詞對網 站中的目標對象進行檢索,獲取檢索到的目標對象,然后按照候選分類標簽的排序分值對 檢索到的目標對象的點擊數據進行修正,按照修正的點擊數據由多到少的順序對所述檢索 到的目標對象進行排序,依據排序結果生成包含所述檢索到的目標對象的登錄頁面。
[0088] 綜上,可W通過文本維度、時間維度、操作維度W及其他維度等一種或多種維度分 別對用戶的當前訪問網頁和歷史行為信息進行分析,從而獲取與該維度相關的特征及其特 征值構成特征信息,通過多維分析得到的特征信息更加全面、準確。
[0089] 其次,基于各用戶的特征信息,確定每個特征值對應匹配的分類標簽,進而圈定每 個分類標簽的用戶群,確定具有該分類標簽的用戶群體,得到用戶的群體特征。
[0090] 再次,可W通過模型訓練等方式對特征信息進行特征分析確定用戶群的價值權 重,從而基于預測前的第二時間段內用戶的特征信息分析該用戶群的群體價值信息,基于 用戶的行為能夠得到更準確的群體價值信息,繼而計算所述業務對象組準確的價值特征信 息,準確的該價值特征信息能夠提高業務對象的投放準確性,使得投放符合用戶預期,得到 更好的推薦效果。
[0091] 再次,根據用戶歷史行為分析出的特征信息選取排序分支較高的候選分類標簽, 從而基于該候選分類標簽檢索目標對象生成所述用戶的登陸頁面,使得用戶在觸發業務對 象時不僅展示與該業務對象相關的目標對象,還顯示該用戶可能感興趣的其他目標對象, 使得推薦更加全面。 陽ow] 實施例S
[0093] 本實施例中,采用廣告投放的場景為例,基于捜索引擎的競價方式進行廣告投放 來舉例論述對其預處理方法。
[0094] 投放捜索引擎文字廣告是一種有效拓展網站流量的方式。運種方式引入流量由于 帶有用戶查詢關鍵詞(query),具有明確的意圖,是電商平臺優先考慮購買的流量。但對于 大批量流量購買的電商平臺,捜索引擎文字廣告流量有限,不能滿足量的需求。運時電商平 臺會考慮展示廣告流量。展示廣告流量一般是由與捜索引擎合作的網站提供展示位廣告位 上的訪問流量。展示廣告的流量可能是捜索引擎文字廣告量的10倍W上,但流量質量會顯 著差于捜索引擎文字廣告。為了同時兼顧投放質和量的需求,可W對展示廣告流量進行重 定向(retargeting),只購買展示廣告流量中到曾經到達過網站的用戶。
[0095] 運是因為數據分析發現,電商平臺流量中的老用戶會比新用戶帶來更多的商業價 值。老用戶熟悉平臺的操作規則,對平臺具有一定的忠誠度,因此容易更快更多地帶來轉 化。電商平臺在進行流量購買時,會優先考慮召回已經訪問過網站的老用戶。運部分老用 戶也稱之為再營銷流量(^Remarketing或者Retargeting)。其中,再營銷Remarketing是流 量采購的一種方式,定位人群為網站老用戶。
[0096] 假設,廣告信息作為業務對象,則廣告組為業務對象組,目標對象為商品信息,廣 告投放時可W基于捜索引擎的競價規則進行投放,因此競價信息即為預估的業務對象組的 價值特征信息。
[0097] 再營銷在標注人群分類標簽時,通常是根據當前訪問網頁的內容進行靜態標注。 其標注的分類標簽可W是基于:一、網頁的關鍵詞;二、網頁的標題;Ξ、網頁類目導航中類 目,即標注的分類標簽來自于網頁的靜態內容,因此所確定的分類標簽準確性較低,而本實 施例引入用戶歷史行為信息,通過用戶的歷史行為進行確定分類標簽W及廣告的競價等信 息,對投放廣告的定位更加精準。其中,捜索引擎廣告投放架構示意圖如圖3所示,捜索引 擎和網站的廣告投放交互示意圖如圖4所示。
[0098] 4. 02網站埋點。 W99] 在指定購物網站的網頁上埋點,即在該網頁中插入捜索引擎的再營銷的 JS(JavaScript)代碼。該JS代碼可W獲取在該網站訪問的用戶的分類標簽,從而后續進行 廣告的投放。 陽100] 4. 04獲取用戶的當前訪問網頁和歷史行為信息。 陽101] 4. 06分析用戶的特征信息。 陽102] 本實施例中,通過對當前訪問網頁和歷史行為信息的一維或多維分析所得到的分 類特征的主要分類Ξ類:一、購買意圖即業務特征,表征用戶想要購買或采購的商品,可W 用商品詞或者類目來描述;二、購買階段即階段特征,在確定購買意圖后,根據用戶訪問歷 史數據中的到訪次數、到訪頻率、離站時間和轉化階段等數據可W表征用戶所處的購買階 段;Ξ、購買習慣即其他特征,用戶的購買習慣可W通過用戶所在國家、設備等反應,如表1 所示。 陽 103]
陽10引表1
[0106] 4. 08發送訪問用戶的投放信息給捜索引擎。 陽107] 用戶在訪問埋點網頁時,會執行網頁中的再營銷JS代碼,然后回想該捜索引擎發 送身份標識gid和該用戶的分類標簽tag,該分類標簽tag是通過對當前瀏覽網頁和歷史行 為信息的分析確定的。該身份標識gid是捜索引擎為用戶分配的唯一標識。 陽10引 4. 10依據各用戶的特征信息確定分類標簽及其用戶群。 陽109] 依據上述表1所述的特征信息,至少可W分析如下分類標簽:
[0110] 1) keyword是指用戶在網站捜索過或瀏覽的商品詞,可W包括一個或多個。 陽111] 2) catego巧是指用戶在網站瀏覽過的類目或者所查找商品所屬的類目,同樣可W 包括一個或多個。 陽11引 3)visit_cnt是指用戶訪問網站的次數,即會話數量。
[0113] 4)visit_heq是指單位時間內用戶訪問網站的次數。
[0114] 5)left_time是指用戶離開網站的時間。 陽115] 6)trans_step是指用戶所處的采購階段,例如捜索、加入購物車或支付等。
[0116] 7) count巧是指用戶所在的國家,例如,US代表美國。 陽117] 8)device是指用戶訪問網站的設備,例如,MB代表手機等移動設備。
[0118] 本實施例中,針對再營銷方式,在對靜態網頁進行標注確定分類特征的基礎上,還 分析了訪問用戶的歷史行為信息,采用歷史數據和當前網頁內容同時對人群進行標注分 類,即對訪問用戶進行多維度的標簽標準,并精準圈定分類標簽的用戶群。并且,還會根據 訪問用戶在當前頁的停留時間和操作動作等確定特征信息對應分類標簽。當前上述特征信 息及確定的分類標簽僅用于舉例論述本實施例,實際處理中還可W依據需求分析其他特征 信息,如瀏覽或點擊過商品、購買商品的周期和購買時間點等。
[0119] 4. 12為每個分類標簽設置一個廣告組adgroup。
[0120] 其中,廣告組adgroup是廣告賬戶結構中的一種粒度。 陽121] 4. 14基于用戶群中各用戶的特征信息確定群體價值信息。 陽122] 4. 16基于群體價值信息設置各廣告組的競價
[0123] 通常,再營銷的競價設置由人工經驗決定,運營專員會根據投放市場行情W及不 同廣告組對應網站內行業情況進行設定。但運種設置方式過于粗略,難W批量應用于大量 的廣告組,競價調整成本也非常高,效果也難W達到預期。
[0124] 本實施例為了同時兼顧投放效率和效果,合理的設置競價,因此要準確的預估廣 告組對應用戶群的群體價值信息W合理的設置競價。本申請根據用戶群的分類標簽和特征 預估人群價值,設置對應的競價,從而達到較好的投放效果。對群體價值信息的預估可W包 括如下兩個階段: 陽125] 1)模型訓練 陽126] 取一段時間的網站訪問用戶U,并在時間上進行切分,時間段tl作為訓練時間段, 時間段t2作為測試時間段。按照時間段tl內分析的用戶特征對訓練數據進行特征抽取, 得到由用戶和分類標簽構成的特征矩陣: 陽 127]
公式1
[0128]訓練目標為群體價值信息,本實施例中,群體價值信息指的是訪問用戶所帶來的 收益與訪問會話次數的比值: 陽129]
公式2
[0130] 再根據時間段t2獲取的特征信息作為測試數據,抽取訓練目標。
[0131] V = [valuei,values, ...,valuej 12了 公式 3 陽132] 采用線性回歸做訓練,即求解特征的權重系數W。 陽13引 F*w = V 公式4 陽 134] w = pi*v公式5 陽135] 本實施例中,除了采用線性回歸模型之外,還可W采用邏輯回歸模型或回歸樹模 型等,可W依據實際需求選取。 陽136] 2)群體價值信息預估
[0137] 在進行群體價值信息預估時,需要對待預測用戶預測前時間段口的數據進行特 征抽取,得到特征矩陣:
陽13引 公式6
[0139] 分類標簽對應群體價值信息可W根據公式7得到:
[0140]
公式 7 陽141] 從而通過群體價值信息計算得到最終的競價,其計算公式如下所示: 陽142]
公式8
[0143] 其中,bid為競價,ROIth為設定的營收比目標,α為經驗參數。其中,R0I為Revenue on Investment,即投資回報比,收益與投入的比值。
[0144] 4. 18設置訪問用戶的登錄頁面。
[0145] 再營銷方式中廣告組的登陸頁是在創建廣告組后設定的,根據分類標簽來確定登 陸頁的鏈接地址。例如"電子商品"對應的廣告組(用戶群)可W設置"電子商品"所對應 類目的導航頁。
[0146] 再營銷流量進入網站登陸頁時,內容可能是類目頁面或者是關鍵詞捜索頁面,該 內容取決于訪問用戶在展示網絡上所觸發標簽(廣告)。例如,用戶在訪問網站埋點網頁時 會上傳該用戶的分類標簽,因此在廣告賬戶中會有與該用戶分類標簽對應的廣告。當用戶 在訪問展示網絡上的廣告位置時,會觸發某個標簽對應的廣告,在用戶點擊廣告后進入標 簽所對應的登陸頁。 陽147] 本實施例中,分類標簽所對應的登陸頁在反映了用戶當前的興趣點的基礎上,進 一步考慮用戶的歷史偏好。即在登陸頁加入用戶的歷史偏好內容,實現個性化,改善用戶體 驗,W達到提高轉化和收益的目標。
[0148] 本實施例中,分析用戶歷史行為信息得到的特征信息中,業務特征可W包括關鍵 詞和類目。然后對用戶的偏好關鍵詞和類目集合計算排序分值并進行排序。 陽149]
公式9
[0150] 其中,i為關鍵詞或類目對應的商品,W商品匯總效果而言關聯特征信息包括: view為商品的曝光量,click為商品獲得的點擊量,order是訂單數量。取排序分值由大到 小排在前N個的商品詞和類目作為候選分類標簽。 陽151] 不同于單一的關鍵詞或類目捜索頁面,個性化登陸頁面采用了多個關鍵詞和類目 進行商品檢索。檢索的商品集合為所有關鍵詞和類目的并集。 陽152] 傳統的廣告排序采用點擊率(Click-T虹OU曲-Rate, CTR)*競價,即ct巧bid的方 式進行,W保證千次展示收入巧evenue Per Mille,RPM)最大化。登錄頁面中商品的個性 化排序可W根據檢索關鍵詞和類目的權重對CTR進行修正。 陽 153] ctr;' = 丫 * Σ jScorei, j+ctr; 公式 10
[0154] ctri為商品i的原始ctr,scorei,,為商品i所對應的檢索關鍵詞或類目對應的偏 好得分,丫為經驗參數。 陽155] 現有登陸頁的內容只反映了用戶當前的興趣點,而沒有考慮用戶歷史的興趣點。 本申請實施例在分析用戶歷史行為數據,挖掘用戶更多興趣點和更精確的用戶意圖確定分 類標簽W及用戶群的群體價值信息基礎上,基于用戶的特征信息在登陸頁組織更豐富的個 性化內容提升用戶體驗,從而帶來更多的平臺收益。例如對于某個"電子商品"對應的訪問 用戶,通過歷史數據的分析,發現用戶對"上衣"也感興趣,另外發現用戶對"電子商品"中的 "平板"感興趣。因此,在登陸頁中可w將"平板"相關商品排在前面,"上衣"等其他興趣可 W組織在頁面右側等區域。并且,還可W通過分析用戶所在群體的特征確定登陸頁面,如基 于年齡、區域進行等進行設置。
[0156] 4. 20在捜索引擎中執行標簽映射。 陽157] 4. 22用戶瀏覽其他網站的網頁時點擊觸發廣告。 陽15引 4. 24返回該廣告對應的登陸頁。 陽159] 捜索引擎基于網站上傳的gid和tag,完成映射(gid,tag),從而在該用戶捜索引 擎的展示廣告網絡被發現時,如在google展示廣告網絡(Google Display ^tworkiGON) 被發現時,依據映射(gid, tag)觸發展示相應的廣告。用戶在點擊某一廣告后,基于該廣告 所對應的鏈接地址可W開啟相應的登陸頁面。
[0160] 本實施中通過用戶和分類標簽進行映射進行廣告的投放,運只是具體實施中的一 種方式,還可W采用如對網站用戶和再營銷平臺用戶進行映射(cookie mapping)的方式, 本實施例對此不作限定。 陽161] 通過上述交互過程實現了廣告投放的預處理,W及廣告投放步驟。本實施例可W 應用于分布式集群的Linux操作系統上、利用化doop和化ve運行較佳的實施效果。 陽162] 綜上,根據用戶當前瀏覽網頁和歷史行為信息,分析用戶的特征信息即興趣點所 在,并從多種維度分析用戶購買意圖、購買階段W及購買習慣。通過分析得到的興趣點、所 處購買階段和真實購買意圖對人群進行分類標注確定分類。本實施例在在進行人群分類標 注時,不再局限于只使用埋點網頁的內容與標題,而是結合用戶歷史行為信息的分析,對用 戶提供更多維度的分類標簽。
[0163] 其次,根據再營銷流量的特征信息,對用戶群的特征信息建模,預估群體價值信 息,并根據群體價值信息進行廣告組的競價設置,保證能夠達到營收比的條件下獲取更多 的流量。
[0164] 再次,分析用戶的歷史行為信息,得到用戶的特征信息從而總結出購買偏好和習 慣。利用用戶的特征信息對登陸頁面的商品進行個性化檢索和排序,為用戶在訪問登陸頁 面動態生成個性化內容。
[01化]需要說明的是,對于方法實施例,為了簡單描述,故將其都表述為一系列的動作組 合,但是本領域技術人員應該知悉,本申請實施例并不受所描述的動作順序的限制,因為依 據本申請實施例,某些步驟可W采用其他順序或者同時進行。其次,本領域技術人員也應該 知悉,說明書中所描述的實施例均屬于優選實施例,所設及的動作并不一定是本申請實施 例所必須的。 陽166] 實施例四
[0167] 在上述實施例的基礎上,本實施例還提供了一種信息投放的預處理裝置。 陽168] 參照圖5,示出了本申請實施例提供的一種信息投放的預處理裝置的結構框圖,具 體可W包括如下模塊:
[0169] 特征分析模塊502,用于在用戶訪問網站時,基于用戶的當前訪問網頁和歷史行為 信息確定所述用戶的特征信息。標簽分析模塊504,用于根據特征信息確定分類標簽及其用 戶群。創建模塊506,用于為每個分類標簽創建業務對象組。群體價值計算模塊508,用于 計算特征信息所屬分類標簽對應用戶群的群體價值信息。價值特征設置模塊510,用于依據 所述群體價值信息設置所述業務對象組的價值特征信息,其中,所述價值特征信息用于確 定網頁展示位中展示的業務對象組。
[0170] 綜上所述,本實施例通過基于用戶的當前訪問網頁和歷史行為信息確定所述用戶 的特征信息,從而全面、準確地確定用戶所具有的特征,再基于各用戶的特征信息分析出對 應的分類標簽,W及該分類標簽所對應的用戶群,并為每個分類標簽創建業務對象組,即可 W基于用戶當前和歷史行為分析出其所對應的業務對象組,從而后續精準的定位推薦的業 務對象。并且,還采用特征信息分析其所屬分類標簽對應用戶群的群體價值信息,進而設置 業務對象組的價值特征信息,準確的分析每個業務對象組的價值,W在投放廣告時依據其 價值特征信息準確的確定投放的業務對象,從而通過上述投放的預處理操作,可W在投放 廣告前準確分析用戶所屬分類標簽并確定對應業務對象組及其價值特征信息,使得后續所 投放的業務對象定位更精準,符合用戶期望和需求。 陽171] 實施例五
[0172] 參照圖6A,示出了本申請實施例提供的另一種信息投放的預處理裝置的結構框 圖,具體可W包括如下模塊: 陽173] 特征分析模塊602,用于在用戶訪問網站時,基于用戶的當前訪問網頁和歷史行為 信息確定所述用戶的特征信息。標簽分析模塊604,用于根據特征信息確定分類標簽及其用 戶群。創建模塊606,用于為每個分類標簽創建業務對象組。群體價值計算模塊608,用于 計算特征信息所屬分類標簽對應用戶群的群體價值信息。價值特征設置模塊610,用于依據 所述群體價值信息設置所述業務對象組的價值特征信息,其中,所述價值特征信息用于確 定網頁展示位中展示的業務對象組。登陸頁設置模塊612,用于根據所述用戶的特征信息確 定所述用戶對應的候選分類標簽;按照所述候選分類標簽設置所述用戶的登陸頁面,所述 登陸頁面為觸發所述網頁展示位中展示的業務對象所鏈接到的頁面。
[0174] 參照圖6B,示出了本申請實施例提供的另一種信息投放的預處理裝置中特征分析 模塊的結構框圖。
[01巧]其中,所述特征分析模塊602,包括:信息獲取子模塊60202,用于在用戶訪問網 站時,分別獲取所述用戶的當前訪問網頁和歷史行為信息;分析子模塊60204,用于按照一 種或多種維度分別對所述當前訪問網頁和歷史行為信息進行分析,確定所述用戶的特征信 息。 陽176] 本申請一個可選實施例中,所述分析子模塊60204,包括:第一分析單元602042, 用于按照文本維度對所述當前訪問網頁的文本信息進行分析,從所述文本信息中提取業務 特征和所述業務特征的特征值作為所述用戶的特征信息。
[0177] 第二分析單元602044,用于按照文本維度對所述歷史行為信息中的文本信息進 行分析,從所述文本信息中提取業務特征和所述業務特征的特征值作為所述用戶的特征信 息;和/或,按照時間維度對所述歷史行為信息中的時間相關信息進行分析,從所述時間相 關信息中提取階段特征和所述階段特征的特征值作為用戶的特征信息;和/或,按照其他 維度對所述歷史行為信息中的關聯信息進行分析,從所述關聯信息中提取地域特征及其特 征值,和/或,設備特征及其特征值作為用戶的特征信息。
[0178] 其中,所述第一分析單元602042,還用于針對操作維度,通過對所述用戶在當前訪 問網頁內執行的操作信息的分析,提取所述用戶的分類特征及其特征值,其中,所述操作信 息包括:停留時間數據和動作執行數據。
[0179] 參照圖6C,示出了本申請實施例提供的另一種信息投放的預處理裝置中標簽分析 模塊的結構框圖。
[0180] 所述標簽分析模塊604,包括:標簽確定子模塊60402,用于獲取各用戶的特征信 息中的特征值,確定各特征值對應匹配的分類標簽,其中,每個分類標簽對應一個或多個特 征值;用戶群圈定子模塊60404,用于針對每個分類標簽,通過特征值圈定所述分類標簽對 應的用戶構成用戶群。 陽181] 參照圖6D,示出了本申請實施例提供的另一種信息投放的預處理裝置中群體價值 計算模塊的結構框圖。
[0182] 所述群體價值計算模塊608,包括:權重訓練子模塊60802,用于對第一時間段內 各用戶的特征信息進行特征分析,確定用戶群的價值權重;價值預估子模塊60804,用于對 第二時間段內各用戶的特征信息進行特征分析,并通過所述價值權重的加權計算確定所述 用戶群的群體價值信息。
[0183] 本申請一個可選實施例中,所述權重訓練子模塊60802,包括:切分單元608022, 用于對所述第一時間段進行切分,確定訓練時間段和測試時間段;特征分析單元608024, 用于對所述訓練時間段內各用戶的特征信息進行特征分析確定特征矩陣;抽取單元 608026,用于從所述測試時間段內各用戶的特征信息中抽取訓練目標;訓練單元608028, 用于對所述特征矩陣和訓練目標進行回歸訓練,計算所述用戶群的價值權重。
[0184] 所述價值預估子模塊60804,包括:特征預測單元608042,用于對第二時間段內各 用戶的特征信息進行特征分析確定預測的特征矩陣;價值計算單元608044,用于采用所述 價值權重對所述預測的特征矩陣進行加權,計算確定所述用戶群的群體價值信息。
[0185] 所述價值特征設置模塊610,用于通過預設的目標價值信息和所述用戶群的群體 價值信息,計算所述業務對象組的價值特征信息。
[0186] 參照圖犯,示出了本申請實施例提供的另一種信息投放的預處理裝置中登陸頁設 置模塊的結構框圖。
[0187] 本申請一個可選實施例中,所述登陸頁設置模塊612,包括:第一篩選子模塊 61202,用于從所述用戶訪問網站的數據庫中篩選所述用戶的業務特征的特征值對應關聯 特征信息;分值計算子模塊61204,用于按照所述關聯特征信息計算每個業務特征的特征 值的排序分值;特征值排序子模塊61206,用于按照所述排序分值對所述用戶的業務特征 的特征值進行排序,確定排序結果;第二篩選子模塊61208,用于從所述排序結果中篩選前 N個業務特征的特征值,將篩選的特征值對應分類標簽作為特征分類標簽。
[0188] 檢索模塊61210,用于按照所述候選分類標簽確定檢索關鍵詞對目標對象進行檢 索,獲取檢索到的目標對象;修正模塊61212,用于按照所述候選分類標簽的排序分值,對 所述檢索到的目標對象的點擊數據進行修正;目標對象排序子模塊61214,用于按照修正 的點擊數據對所述檢索到的目標對象進行排序;頁面生成子模塊61216,用于依據排序結 果生成包含所述檢索到的目標對象的登錄頁面。
[0189] 綜上,可W通過文本維度、時間維度、操作維度W及其他維度等一種或多種維度分 別對用戶的當前訪問網頁和歷史行為信息進行分析,從而獲取與該維度相關的特征及其特 征值構成特征信息,通過多維分析得到的特征信息更加全面、準確。
[0190] 其次,基于各用戶的特征信息,確定每個特征值對應匹配的分類標簽,進而圈定每 個分類標簽的用戶群,確定具有該分類標簽的用戶群體,得到用戶的群體特征。 陽191] 再次,可W通過模型訓練等方式對特征信息進行特征分析確定用戶群的價值權 重,從而基于預測前的第二時間段內用戶的特征信息分析該用戶群的群體價值信息,基于 用戶的行為能夠得到更準確的群體價值信息,繼而計算所述業務對象組準確的價值特征信 息,準確的該價值特征信息能夠提高業務對象的投放準確性,使得投放符合用戶預期,得到 更好的推薦效果。
[0192] 再次,根據用戶歷史行為分析出的特征信息選取排序分支較高的候選分類標簽, 從而基于該候選分類標簽檢索目標對象生成所述用戶的登陸頁面,使得用戶在觸發業務對 象時不僅展示與該業務對象相關的目標對象,還顯示該用戶可能感興趣的其他目標對象, 使得推薦更加全面。 陽193] 對于裝置實施例而言,由于其與方法實施例基本相似,所W描述的比較簡單,相關 之處參見方法實施例的部分說明即可。 陽194] 本說明書中的各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與 其他實施例的不同之處,各個實施例之間相同相似的部分互相參見即可。
[0195] 本領域內的技術人員應明白,本申請實施例的實施例可提供為方法、裝置、或計算 機程序商品。因此,本申請實施例可采用完全硬件實施例、完全軟件實施例、或結合軟件和 硬件方面的實施例的形式。而且,本申請實施例可采用在一個或多個其中包含有計算機可 用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、CD-ROM、光學存儲器等)上 實施的計算機程序商品的形式。
[0196] 在一個典型的配置中,所述計算機設備包括一個或多個處理器(CPU)、輸入/輸出 接口、網絡接口和內存。內存可能包括計算機可讀介質中的非永久性存儲器,隨機存取存儲 器(RAM)和/或非易失性內存等形式,如只讀存儲器(ROM)或閃存(flash RAM)。內存是 計算機可讀介質的示例。計算機可讀介質包括永久性和非永久性、可移動和非可移動媒體 可W由任何方法或技術來實現信息存儲。信息可W是計算機可讀指令、數據結構、程序的模 塊或其他數據。計算機的存儲介質的例子包括,但不限于相變內存(PRAM)、靜態隨機存取 存儲器(SRAM)、動態隨機存取存儲器值RAM)、其他類型的隨機存取存儲器(RAM)、只讀存儲 器(ROM)、電可擦除可編程只讀存儲器巧EPROM)、快閃記憶體或其他內存技術、只讀光盤只 讀存儲器(CD-ROM)、數字多功能光盤值VD)或其他光學存儲、磁盒式磁帶,磁帶磁磁盤存儲 或其他磁性存儲設備或任何其他非傳輸介質,可用于存儲可W被計算設備訪問的信息。按 照本文中的界定,計算機可讀介質不包括非持續性的電腦可讀媒體(transitory media), 如調制的數據信號和載波。 陽197] 本申請實施例是參照根據本申請實施例的方法、終端設備(系統)、和計算機程序 商品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框 圖中的每一流程和/或方框、W及流程圖和/或方框圖中的流程和/或方框的結合。可提 供運些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數據處理 終端設備的處理器W產生一個機器,使得通過計算機或其他可編程數據處理終端設備的處 理器執行的指令產生用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多 個方框中指定的功能的裝置。
[0198] 運些計算機程序指令也可存儲在能引導計算機或其他可編程數據處理終端設備 W特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包 括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方 框或多個方框中指定的功能。
[0199] 運些計算機程序指令也可裝載到計算機或其他可編程數據處理終端設備上,使得 在計算機或其他可編程終端設備上執行一系列操作步驟W產生計算機實現的處理,從而在 計算機或其他可編程終端設備上執行的指令提供用于實現在流程圖一個流程或多個流程 和/或方框圖一個方框或多個方框中指定的功能的步驟。 陽200] 盡管已描述了本申請實施例的優選實施例,但本領域內的技術人員一旦得知了基 本創造性概念,則可對運些實施例做出另外的變更和修改。所W,所附權利要求意欲解釋為 包括優選實施例W及落入本申請實施例范圍的所有變更和修改。 陽201] 最后,還需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將 一個實體或者操作與另一個實體或操作區分開來,而不一定要求或者暗示運些實體或操作 之間存在任何運種實際的關系或者順序。而且,術語"包括"、"包含"或者其任何其他變體意 在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者終端設備不僅包 括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為運種過程、方法、物品 或者終端設備所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要 素,并不排除在包括所述要素的過程、方法、物品或者終端設備中還存在另外的相同要素。 陽202] W上對本申請所提供的一種信息投放的預處理方法和一種信息投放的預處理裝 置,進行了詳細介紹,本文中應用了具體個例對本申請的原理及實施方式進行了闡述,W上 實施例的說明只是用于幫助理解本申請的方法及其核屯、思想;同時,對于本領域的一般技 術人員,依據本申請的思想,在【具體實施方式】及應用范圍上均會有改變之處,綜上所述,本 說明書內容不應理解為對本申請的限制。
【主權項】
1. 一種信息投放的預處理方法,其特征在于,包括: 在用戶訪問網站時,基于用戶的當前訪問網頁和歷史行為信息確定所述用戶的特征信 息; 根據所述特征信息確定分類標簽及其用戶群,為每個分類標簽創建業務對象組; 計算特征信息所屬分類標簽對應用戶群的群體價值信息; 依據所述群體價值信息設置所述業務對象組的價值特征信息,其中,所述價值特征信 息用于確定網頁展示位中展示的業務對象組。2. 根據權利要求1所述的方法,其特征在于,在用戶訪問網站時,基于用戶的當前訪問 網頁和歷史行為信息確定所述用戶的特征信息,包括: 在用戶訪問網站時,分別獲取所述用戶的當前訪問網頁和歷史行為信息; 按照一種或多種維度分別對所述當前訪問網頁和歷史行為信息進行分析,確定所述用 戶的特征信息。3. 根據權利要求2所述的方法,其特征在于,對所述當前訪問網頁進行分析確定所述 用戶的特征信息的步驟,包括: 按照文本維度對所述當前訪問網頁的文本信息進行分析,從所述文本信息中提取業務 特征和所述業務特征的特征值作為所述用戶的特征信息。4. 根據權利要求2所述的方法,其特征在于,對所述歷史行為信息進行分析確定所述 用戶的特征信息的步驟包括以下至少一項: 按照文本維度對所述歷史行為信息中的文本信息進行分析,從所述文本信息中提取業 務特征和所述業務特征的特征值作為所述用戶的特征信息; 按照時間維度對所述歷史行為信息中的時間相關信息進行分析,從所述時間相關信息 中提取階段特征和所述階段特征的特征值作為用戶的特征信息; 按照其他維度對所述歷史行為信息中的關聯信息進行分析,從所述關聯信息中提取地 域特征及其特征值,和/或,設備特征及其特征值作為用戶的特征信息。5. 根據權利要求3所述的方法,其特征在于,對所述當前訪問網頁進行分析確定所述 用戶的特征信息的步驟還包括: 針對操作維度,通過對所述用戶在當前訪問網頁內執行的操作信息的分析,提取所述 用戶的分類特征及其特征值,其中,所述操作信息包括:停留時間數據和動作執行數據。6. 根據權利要求3或4或5所述的方法,其特征在于,根據所述特征信息確定分類標簽 及其用戶群,包括: 獲取各用戶的特征信息中的特征值,確定各特征值對應匹配的分類標簽,其中,每個分 類標簽對應一個或多個特征值; 針對每個分類標簽,通過特征值圈定所述分類標簽對應的用戶構成用戶群。7. 根據權利要求1至5任一項所述的方法,其特征在于,計算特征信息所屬分類標簽對 應用戶群的群體價值信息,包括: 對第一時間段內各用戶的特征信息進行特征分析,確定用戶群的價值權重; 對第二時間段內各用戶的特征信息進行特征分析,并通過所述價值權重的加權計算確 定所述用戶群的群體價值信息。8. 根據權利要求7所述的方法,其特征在于,所述對第一時間段內各用戶的特征信息 進行特征分析,確定用戶群的價值權重,包括: 對所述第一時間段進行切分,確定訓練時間段和測試時間段; 對所述訓練時間段內各用戶的特征信息進行特征分析確定特征矩陣; 從所述測試時間段內各用戶的特征信息中抽取訓練目標; 對所述特征矩陣和訓練目標進行回歸訓練,計算所述用戶群的價值權重。9. 根據權利要求7所述的方法,其特征在于,對第二時間段內各用戶的特征信息進行 特征分析,并通過所述價值權重的加權計算確定所述用戶群的群體價值信息,包括: 對第二時間段內各用戶的特征信息進行特征分析確定預測的特征矩陣; 采用所述價值權重對所述預測的特征矩陣進行加權,計算確定所述用戶群的群體價值 信息。10. 根據權利要求9所述的方法,其特征在于,依據所述群體價值信息設置所述業務對 象組的價值特征信息,包括: 通過預設的目標價值信息和所述用戶群的群體價值信息,計算所述業務對象組的價值 特征信息。11. 根據權利要求3或4所述的方法,其特征在于,還包括: 根據所述用戶的特征信息確定所述用戶對應的候選分類標簽; 按照所述候選分類標簽設置所述用戶的登陸頁面,所述登陸頁面為觸發所述網頁展示 位中展示的業務對象所鏈接到的頁面。12. 根據權利要求11所述的方法,其特征在于,根據所述用戶的特征信息確定所述用 戶對應的候選分類標簽,包括: 從所述用戶訪問網站的數據庫中篩選所述用戶的業務特征的特征值對應關聯特征信 息; 按照所述關聯特征信息計算每個業務特征的特征值的排序分值; 按照所述排序分值對所述用戶的業務特征的特征值進行排序,確定排序結果; 從所述排序結果中篩選前N個業務特征的特征值,將篩選的特征值對應分類標簽作為 特征分類標簽。13. 根據權利要求12所述的方法,其特征在于,按照所述候選分類標簽設置所述用戶 的登陸頁面,包括: 按照所述候選分類標簽確定檢索關鍵詞對目標對象進行檢索,獲取檢索到的目標對 象; 按照所述候選分類標簽的排序分值,對所述檢索到的目標對象的點擊數據進行修正; 按照修正的點擊數據對所述檢索到的目標對象進行排序; 依據排序結果生成包含所述檢索到的目標對象的登錄頁面。14. 一種信息投放的預處理裝置,其特征在于,包括: 特征分析模塊,用于在用戶訪問網站時,基于用戶的當前訪問網頁和歷史行為信息確 定所述用戶的特征信息; 標簽分析模塊,用于根據所述特征信息確定分類標簽及其用戶群; 創建模塊,用于為每個分類標簽創建業務對象組; 群體價值計算模塊,用于計算特征信息所屬分類標簽對應用戶群的群體價值信息; 價值特征設置模塊,用于依據所述群體價值信息設置所述業務對象組的價值特征信 息,其中,所述價值特征信息用于確定網頁展示位中展示的業務對象組。15. 根據權利要求14所述的裝置,其特征在于,所述特征分析模塊,包括: 信息獲取子模塊,用于在用戶訪問網站時,分別獲取所述用戶的當前訪問網頁和歷史 行為信息; 分析子模塊,用于按照一種或多種維度分別對所述當前訪問網頁和歷史行為信息進行 分析,確定所述用戶的特征信息。16. 根據權利要求15所述的裝置,其特征在于,所述分析子模塊,包括: 第一分析單元,用于按照文本維度對所述當前訪問網頁的文本信息進行分析,從所述 文本信息中提取業務特征和所述業務特征的特征值作為所述用戶的特征信息。17. 根據權利要求15所述的裝置,其特征在于,所述分析子模塊,包括: 第二分析單元,用于按照文本維度對所述歷史行為信息中的文本信息進行分析,從所 述文本信息中提取業務特征和所述業務特征的特征值作為所述用戶的特征信息;和/或, 按照時間維度對所述歷史行為信息中的時間相關信息進行分析,從所述時間相關信息中提 取階段特征和所述階段特征的特征值作為用戶的特征信息;和/或,按照其他維度對所述 歷史行為信息中的關聯信息進行分析,從所述關聯信息中提取地域特征及其特征值,和/ 或,設備特征及其特征值作為用戶的特征信息。18. 根據權利要求16所述的裝置,其特征在于, 所述第一分析單元,還用于針對操作維度,通過對所述用戶在當前訪問網頁內執行的 操作信息的分析,提取所述用戶的分類特征及其特征值,其中,所述操作信息包括:停留時 間數據和動作執行數據。19. 根據權利要求16或17或18所述的裝置,其特征在于,所述標簽分析模塊,包括: 標簽確定子模塊,用于獲取各用戶的特征信息中的特征值,確定各特征值對應匹配的 分類標簽,其中,每個分類標簽對應一個或多個特征值; 用戶群圈定子模塊,用于針對每個分類標簽,通過特征值圈定所述分類標簽對應的用 戶構成用戶群。20. 根據權利要求14至18任一項所述的裝置法,其特征在于,所述群體價值計算模塊, 包括: 權重訓練子模塊,用于對第一時間段內各用戶的特征信息進行特征分析,確定用戶群 的價值權重; 價值預估子模塊,用于對第二時間段內各用戶的特征信息進行特征分析,并通過所述 價值權重的加權計算確定所述用戶群的群體價值信息。21. 根據權利要求20所述的裝置,其特征在于,所述權重訓練子模塊,包括: 切分單元,用于對所述第一時間段進行切分,確定訓練時間段和測試時間段; 特征分析單元,用于對所述訓練時間段內各用戶的特征信息進行特征分析確定特征矩 陣; 抽取單元,用于從所述測試時間段內各用戶的特征信息中抽取訓練目標; 訓練單元,用于對所述特征矩陣和訓練目標進行回歸訓練,計算所述用戶群的價值權 重。22. 根據權利要求20所述的裝置,其特征在于,所述價值預估子模塊,包括: 特征預測單元,用于對第二時間段內各用戶的特征信息進行特征分析確定預測的特征 矩陣; 價值計算單元,用于采用所述價值權重對所述預測的特征矩陣進行加權,計算確定所 述用戶群的群體價值信息。23. 根據權利要求22所述的裝置,其特征在于, 所述價值特征設置模塊,用于通過預設的目標價值信息和所述用戶群的群體價值信 息,計算所述業務對象組的價值特征信息。24. 根據權利要求16或17所述的裝置,其特征在于,還包括: 登陸頁設置模塊,用于根據所述用戶的特征信息確定所述用戶對應的候選分類標簽; 按照所述候選分類標簽設置所述用戶的登陸頁面,所述登陸頁面為觸發所述網頁展示位中 展示的業務對象所鏈接到的頁面。25. 根據權利要求24所述的裝置,其特征在于,所述登陸頁設置模塊,包括: 第一篩選子模塊,用于從所述用戶訪問網站的數據庫中篩選所述用戶的業務特征的特 征值對應關聯特征信息; 分值計算子模塊,用于按照所述關聯特征信息計算每個業務特征的特征值的排序分 值; 特征值排序子模塊,用于按照所述排序分值對所述用戶的業務特征的特征值進行排 序,確定排序結果; 第二篩選子模塊,用于從所述排序結果中篩選前N個業務特征的特征值,將篩選的特 征值對應分類標簽作為特征分類標簽。26. 根據權利要求25所述的裝置,其特征在于,所述登陸頁設置模塊,包括: 檢索模塊,用于按照所述候選分類標簽確定檢索關鍵詞對目標對象進行檢索,獲取檢 索到的目標對象; 修正模塊,用于按照所述候選分類標簽的排序分值,對所述檢索到的目標對象的點擊 數據進行修正; 目標對象排序子模塊,用于按照修正的點擊數據對所述檢索到的目標對象進行排序; 頁面生成子模塊,用于依據排序結果生成包含所述檢索到的目標對象的登錄頁面。
【文檔編號】G06F17/30GK105989004SQ201510041351
【公開日】2016年10月5日
【申請日】2015年1月27日
【發明人】黃凱明, 李波, 劉奎龍
【申請人】阿里巴巴集團控股有限公司
網友詢問留言(yan) 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1