一種廣告投放方法及裝置的制造方法
【技術領域】
[0001] 本發明設及互聯網領域,尤其設及一種廣告投放方法及裝置。
【背景技術】
[0002] 品牌廣告主在進行廣告投放時,首要關注的往往是廣告是否達到一定的展現量, 希望廣告能夠吸引更多的觀看的用戶點擊廣告來進一步了解他們的產品,也就是說,在一 定展現量的前提下需要提升廣告的點擊率。一只廣告的點擊率與很多因素有關,除了與廣 告素材本身做得引人入勝等原因外,最重要的因素是運支廣告是否正好切中觀看用戶的喜 好與需求。然而,目前視頻網站并不具備捜索引擎那樣能夠獲取用戶直接的需求信息的能 力,造成視頻網站的品牌廣告的點擊率較低,廣告點擊率優化工作難W取得長足的進步,可 見一種優化廣告點擊率的方案有待被提出。
【發明內容】
[0003] 本發明提供例一種廣告點擊率優化方法及裝置,用于解決現有技術中視頻網站無 法根據用戶需求投放廣告導致廣告點擊率較低的問題。
[0004] 根據本發明的一個方面,提供了一種廣告投放方法,包括:根據廣告的歷史訪問數 據確定用戶對廣告的偏好信息;對偏好信息進行特征提取;W提取到的特征數據為訓練數 據,按照預設的算法模型進行訓練得到訓練模型;使用訓練模型對廣告測試數據進行預測, 得到廣告的預測點擊率;根據預測點擊率投放廣告。
[0005] 其中,對偏好信息進行特征提取包括:提取偏好信息中的發生點擊或展示廣告時 的上下文環境信息、廣告的描述信息、點擊或展示廣告的用戶屬性信息W及用戶對廣告的 偏好信息。
[0006] 其中,W提取到的特征數據為訓練數據,按照預設的算法模型進行訓練得到訓練 模型包括:使用邏輯回歸模型和/或樹模型算法對訓練數據進行訓練,得到訓練模型。
[0007] 其中,使用邏輯回歸模型和/或樹模型算法對訓練數據進行訓練,得到訓練模型包 括:在僅使用邏輯回歸模型的情況下,使用邏輯回歸模型在訓練數據的向量空間中計算每 一個特征維度的權重值,針對廣告的點擊日志或展示日志中的每一條記錄計算權重值與對 應特征值的加權和,再將加權和代入邏輯回歸函數;在僅適用樹模型的情況下,使用一個樹 對訓練數據進行訓練,逐漸加入新的樹對上一次訓練得到的模型進行增強,得到訓練模型; 在同時使用邏輯回歸模型W及樹模型的情況下,使用樹模型對廣告的點擊日志或展示日志 中的每條記錄進行分區,得到新的特征集合,使用邏輯回歸模型對新的特征集合進行訓練。
[0008] 其中,根據廣告的歷史訪問數據確定用戶對廣告的偏好信息包括:對廣告的點擊 日志或展示日志對儲存在用戶本地終端上的數據、會話標識ID、廣告ID進行整合;通過廣告 的點擊日志或展示日志中的廣告素材ID與廣告素材信息庫進行整合得到廣告素材的行業 描述信息;通過廣告的點擊日志或展示日志里的儲存在用戶本地終端上的數據與用戶信息 進行連接整合得到該用戶的屬性信息與對廣告的偏好信息;對經過整合的數據進行清洗去 掉不合法的儲存在用戶本地終端上的數據。
[0009] 進一步的,上述方法還包括:在對偏好信息進行特征提取之后,如果偏好信息中的 特征為具有有限類別的離散型特征,對離散型特征進行離散化編碼;如果偏好數據中的特 征為連續型特征,則根據預設模型算法的類型確定是否對連續型特征進行離散化編碼。
[0010] 其中,根據預測點擊率投放廣告包括:在得到廣告的預測點擊率之后,使用廣告的 驗證數據確定廣告的最佳點擊率闊值;如果廣告的預測點擊率大于最佳點擊率闊值,則投 放該廣告,否則放棄投放該廣告。
[0011] 根據本發明的另一個方面,提供了一種廣告投放裝置,包括:第一確定模塊,用于 根據廣告的歷史訪問數據確定用戶對廣告的偏好信息;提取模塊,用于對偏好信息進行特 征提取;訓練模塊,用于W提取到的特征數據為訓練數據,按照預設的算法模型進行訓練得 到訓練模型;預測模塊,使用訓練模型對廣告測試數據進行預測,得到廣告的預測點擊率; 投放模塊,用于根據預測點擊率投放廣告。
[0012] 其中,上述提取模塊具體用于:提取偏好信息中的發生點擊或展示廣告時的上下 文環境信息、廣告的描述信息、點擊或展示廣告的用戶屬性信息W及用戶對廣告的偏好信 息。
[0013] 其中,上述訓練模塊具體用于:使用邏輯回歸模型和/或樹模型算法對訓練數據進 行訓練,得到訓練模型。
[0014] 其中,上述訓練模塊包括:第一訓練單元,用于在僅使用邏輯回歸模型的情況下, 使用邏輯回歸模型在訓練數據的向量空間中計算每一個特征維度的權重值,針對廣告的點 擊日志或展示日志中的每一條記錄計算權重值與對應特征值的加權和,再將加權和代入邏 輯回歸函數;第二訓練單元,用于在僅適用樹模型的情況下,使用一個樹對訓練數據進行訓 練,逐漸加入新的樹對上一次訓練得到的模型進行增強,得到訓練模型;第Ξ訓練單元,用 于在同時使用邏輯回歸模型W及樹模型的情況下,使用樹模型對廣告的點擊日志或展示日 志中的每條記錄進行分區,得到新的特征集合,使用邏輯回歸模型對新的特征集合進行訓 練。
[0015] 其中,上述第一確定模塊包括:第一整合單元,用于對廣告的點擊日志或展示日志 對儲存在用戶本地終端上的數據、會話標識ID、廣告ID進行整合;第二整合單元,用于通過 廣告的點擊日志或展示日志中的廣告素材ID與廣告素材信息庫進行整合得到廣告素材的 行業描述信息;第Ξ整合單元,用于通過日志里的儲存在用戶本地終端上的數據與用戶信 息進行連接整合得到該用戶的屬性信息與對廣告的偏好信息;清洗單元,用于對經過整合 的數據進行清洗去掉不合法的儲存在用戶本地終端上的數據。
[0016] 進一步的,上述裝置還包括:離散模塊,用于在對偏好信息進行特征提取之后,如 果偏好信息中的特征為具有有限類別的離散型特征,對離散型特征進行離散化編碼;如果 偏好數據中的特征為連續型特征,則根據預設模型算法的類型確定是否對連續型特征進行 離散化編碼。
[0017] 其中,上述投放模塊包括:確定單元,用于在得到廣告的預測點擊率之后,使用廣 告的驗證數據確定廣告的最佳點擊率闊值;投放單元,用于如果廣告的預測點擊率大于最 佳點擊率闊值,則投放該廣告,否則放棄投放該廣告。
[001引本發明有益效果如下:
[0019] 本發明實施例提供的方案,能夠充分利用視頻網站中被挖掘出的大量用戶信息, 包括用戶屬性信息和用戶對廣告的偏好信息,結合廣告素材本身的行業描述來進行點擊率 的預測,預測出的點擊率可W很好的指導廣告的投放,使得廣告的投放更有針對性,優化了 網頁上廣告的點擊率。
【附圖說明】
[0020] 此處所說明的附圖用來提供對本發明的進一步理解,構成本申請的一部分,本發 明的示意性實施例及其說明用于解釋本發明,并不構成對本發明的不當限定。在附圖中: [0021 ]圖1是本發明實施例1提供的廣告投放方法的流程圖;
[0022] 圖2是本發明實施例2提供的廣告投放方法的流程圖;
[0023] 圖3是本發明實施2中提取到的特征值向量示意圖;
[0024] 圖4是本發明實施例3提供的廣告投放裝置的結構框圖。
【具體實施方式】
[0025] 為了解決現有技術中網頁