推薦應用的方法及裝置的制造方法
【專利摘要】本發明提供了一種推薦應用的方法及一種推薦應用的裝置,其中,該方法包括:獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息;基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機器學習以構建用戶屬性預測模型;將待預測的第二用戶的特征信息輸入用戶屬性預測模型,以預測確定第二用戶的個人屬性信息;基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。基于本發明提供的用戶屬性預測模型預測確定的個人屬性信息準確率較高,且預測確定的過程不需要用戶的參與,實現了全自動化的軟件推薦方式。
【專利說明】
推薦應用的方法及裝置
技術領域
[0001] 本發明涉及無線移動通信技術領域,具體而言,本發明涉及一種推薦應用的方法 及一種推薦應用的裝置。
【背景技術】
[0002] 隨著科學技術日新月異的發展,具有各式各樣功能的軟件層出不窮,它為人們的 生活帶來了便利。在現有技術中,由于應用市場中的軟件數量龐大,所以在向用戶進行軟件 推薦時,通常采取對軟件進行分類的方式,分別計算同一分類下的各個軟件的使用率,并在 各個分類中將使用率較高的軟件作為熱門軟件向用戶進行推薦。但上述向用戶進行軟件推 薦的方式,并未針對不同用戶設計個性化推薦方式,因此,軟件推薦的成功率較低。因此,如 何針對不同用戶進行個性化的軟件推薦,同時保證較高的軟件推薦成功率成為了亟待解決 的問題。
【發明內容】
[0003] 為克服上述技術問題或者至少部分地解決上述技術問題,特提出以下技術方案:
[0004] 本發明的一個實施例提出了一種推薦應用的方法,包括:
[0005] 獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息;
[0006] 基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機器學習以構建 用戶屬性預測模型;
[0007] 將待預測的第二用戶的特征信息輸入用戶屬性預測模型,以預測確定第二用戶的 個人屬性信息;
[0008] 基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。
[0009] 優選地,已安裝應用信息包括第一用戶的終端設備中已安裝應用的應用描述信 息、應用分類信息、應用價格信息中的至少一項。
[0010]優選地,用戶相關信息包括第一用戶的終端設備的設備相關信息和/或第一用戶 的個人屬性信息。
[0011]優選地,基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機器學 習以構建用戶屬性預測模型,具體包括:
[0012] 采用特征工程,基于已安裝應用信息及用戶相關信息生成特征向量;
[0013] 將特征向量輸入預定的訓練模型進行機器學習以構建用戶屬性預測模型。
[0014] 優選地,個人屬性信息包括以下一項或多項:
[0015] 年齡區間;性別;收入區間;教育程度;婚姻狀況。
[0016] 優選地,基于第二用戶的個人屬性信息,確定與其相匹配的待推薦應用,包括:
[0017] 基于第二用戶的個人屬性信息,確定與第二用戶相匹配的一個或多個應用分類;
[0018] 從相匹配的應用分類對應的應用集合中選取相應的至少一個待推薦應用。
[0019] 優選地,基于第二用戶的個人屬性信息,確定與其相匹配的待推薦應用,包括:
[0020] 確定多個待推薦應用分別所屬的應用分類;
[0021] 基于應用分類與第二用戶的個人屬性信息的對應關系,從該多個待推薦應用種選 取與第二用戶相匹配的待推薦應用。
[0022] 本發明的另一實施例提出了一種推薦應用的裝置,包括:
[0023] 獲取模塊,用于獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息; [0024]學習模塊,用于基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行 機器學習以構建用戶屬性預測模型;
[0025] 預測模塊,用于將待預測的第二用戶的特征信息輸入用戶屬性預測模型,以預測 確定第二用戶的個人屬性信息;
[0026] 確定模塊,用于基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。 [0027]優選地,已安裝應用信息包括第一用戶的終端設備中已安裝應用的應用描述信 息、應用分類信息、應用價格信息中的至少一項。
[0028]優選地,用戶相關信息包括第一用戶的終端設備的設備相關信息和/或第一用戶 的個人屬性信息。
[0029]優選地,學習模塊具體包括:
[0030]向量生成單元,用于采用特征工程,基于已安裝應用信息及用戶相關信息生成特 征向量;
[0031] 機器學習單元,用于將特征向量輸入預定的訓練模型進行機器學習以構建用戶屬 性預測模型。
[0032] 優選地,個人屬性信息包括以下一項或多項:
[0033] 年齡區間;性別;收入區間;教育程度;婚姻狀況。
[0034]優選地,確定模塊包括:
[0035] 第一確定單元,用于基于第二用戶的個人屬性信息,確定與第二用戶相匹配的一 個或多個應用分類;
[0036] 第一選取單元,用于從相匹配的應用分類對應的應用集合中選取相應的至少一個 待推薦應用。
[0037]優選地,確定模塊包括:
[0038]第二確定單元,用于確定多個待推薦應用分別所屬的應用分類;
[0039] 第二選取單元,用于基于應用分類與第二用戶的個人屬性信息的對應關系,從該 多個待推薦應用種選取與第二用戶相匹配的待推薦應用。
[0040] 本發明的技術方案解決了如何針對不同用戶的個人情況進行應用推薦的問題。首 先,訓練用戶屬性預測模型,該模型是基于大量原始數據訓練得到的;接著,將待預測的第 二用戶的特征信息輸入用戶屬性預測模型,以預測確定第二用戶的個人屬性信息,基于用 戶屬性預測模型可保證對個人屬性信息的判斷具有較高的準確率;最后,基于第二用戶的 用戶屬性信息,確定與其相匹配的待推薦應用,有針對性地根據不同用戶的特點以預先制 定的不同的應用推薦策略將待推薦應用推薦給第二用戶。基于本發明實施例提供的用戶屬 性預測模型預測確定的個人屬性信息準確率較高,且預測確定的過程不需要用戶的參與, 實現了全自動化的軟件推薦方式。另外,根據預測確定的準確率較高的個人屬性信息進行 應用推薦操作的應用推薦成功率也相應會大大提高。
[0041] 本發明附加的方面和優點將在下面的描述中部分給出,這些將從下面的描述中變 得明顯,或通過本發明的實踐了解到。
【附圖說明】
[0042] 本發明上述的和/或附加的方面和優點從下面結合附圖對實施例的描述中將變得 明顯和容易理解,其中:
[0043] 圖1為本發明一個實施例的軟件推薦的方法的流程示意圖;
[0044] 圖2為本發明一個優選實施例的軟件推薦的方法的流程示意圖;
[0045] 圖3為本發明另一實施例的軟件推薦的裝置的結構示意圖。
【具體實施方式】
[0046] 下面詳細描述本發明的實施例,所述實施例的示例在附圖中示出,其中自始至終 相同或類似的標號表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附 圖描述的實施例是示例性的,僅用于解釋本發明,而不能解釋為對本發明的限制。
[0047]本技術領域技術人員可以理解,除非特意聲明,這里使用的單數形式"一"、"一 個"、"所述"和"該"也可包括復數形式。應該進一步理解的是,本發明的說明書中使用的措 辭"包括"是指存在所述特征、整數、步驟、操作、元件和/或組件,但是并不排除存在或添加 一個或多個其他特征、整數、步驟、操作、元件、組件和/或它們的組。應該理解,當我們稱元 件被"連接"或"耦接"到另一元件時,它可以直接連接或耦接到其他元件,或者也可以存在 中間元件。此外,這里使用的"連接"或"親接"可以包括無線連接或無線耦接。這里使用的措 辭"和/或"包括一個或更多個相關聯的列出項的全部或任一單元和全部組合。
[0048]本技術領域技術人員可以理解,除非另外定義,這里使用的所有術語(包括技術術 語和科學術語),具有與本發明所屬領域中的普通技術人員的一般理解相同的意義。還應該 理解的是,諸如通用字典中定義的那些術語,應該被理解為具有與現有技術的上下文中的 意義一致的意義,并且除非像這里一樣被特定定義,否則不會用理想化或過于正式的含義 來解釋。
[0049]本技術領域技術人員可以理解,這里所使用的"終端"、"終端設備"既包括無線信 號接收器的設備,其僅具備無發射能力的無線信號接收器的設備,又包括接收和發射硬件 的設備,其具有能夠在雙向通信鏈路上,進行雙向通信的接收和發射硬件的設備。這種設備 可以包括:蜂窩或其他通信設備,其具有單線路顯示器或多線路顯示器或沒有多線路顯示 器的蜂窩或其他通信設備;PCS(Personal Communications Service,個人通信系統),其可 以組合語音、數據處理、傳真和/或數據通信能力;PDA(Personal Digital Assistant,個人 數字助理),其可以包括射頻接收器、尋呼機、互聯網/內聯網訪問、網絡瀏覽器、記事本、日 歷和/或GPS(Global Positioning System,全球定位系統)接收器;常規膝上型和/或掌上 型計算機或其他設備,其具有和/或包括射頻接收器的常規膝上型和/或掌上型計算機或其 他設備。這里所使用的"終端"、"終端設備"可以是便攜式、可運輸、安裝在交通工具(航空、 海運和/或陸地)中的,或者適合于和/或配置為在本地運行,和/或以分布形式,運行在地球 和/或空間的任何其他位置運行。這里所使用的"終端"、"終端設備"還可以是通信終端、上 網終端、音樂/視頻播放終端,例如可以是PDA、MID(Mobile Internet Device,移動互聯網 設備)和/或具有音樂/視頻播放功能的移動電話,也可以是智能電視、機頂盒等設備。
[0050] 圖1為本發明一個實施例的軟件推薦的方法的流程示意圖。
[0051] 步驟S110:獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息。
[0052]優選地,與第一用戶的相關的已安裝應用信息包括但不限于:第一用戶的終端設 備中已安裝應用的應用描述信息、應用分類信息、應用價格信息。
[0053]具體地,獲取與多個第一用戶的相關的已安裝應用信息的步驟包括:首先,分別提 取多個第一用戶的終端設備中的已安裝的多個應用分別對應的應用日志;接著,依據各個 應用的應用日志,分別建立多個第一用戶的相關的已安裝應用信息。
[0054] 例如,在提取用戶A的終端設備中的已安裝的3款應用分別對應的應用日志的應用 情景下,提取用戶A的移動終端如智能手機中存儲的已安裝的3款應用分別對應的應用日 志,應用日志分別記錄著3款應用的應用信息,該信息包括應用標識、應用描述信息、應用分 類信息、應用價格信息,3款應用的應用信息具體如下所述:
[0055] APP1的應用日志包括,應用標識:XX即時通訊應用;應用描述信息:安裝XX即時通 訊是一種生活方式,你可以快速高效地收發消息,輕松愉快地和朋友暢談,讓溝通更方便; 應用分類信息:聊天通訊類;應用價格信息:應用內消費。
[0056] APP2的應用日志包括,應用標識:XX拍照應用;應用描述信息:超過5億用戶正在使 用!近50款小清新范兒全新實時濾鏡,搭配獨有的美顏技術和景深功能,讓鏡頭里的你擁有 無與倫比的美麗!現已獲得眾多知名攝影師傾情推薦;應用分類信息:圖像編輯類;應用價 格信息:免費。
[0057] APP3的應用日志包括,應用標識:XX游戲應用;應用描述信息:XX游戲的多種玩法 百玩不膩!新版本加入萌寵系統及寶物探索,增加青菜英雄!戰斗中可召喚寵物一同戰;應 用分類信息:游戲類;應用價格信息:18RMB。
[0058] 優選地,用戶相關信息包括但不限于:第一用戶的終端設備的設備相關信息和/或 第一用戶的個人屬性信息。
[0059] 其中,第一用戶的終端設備的設備相關信息包括但不限于:移動終端型號、內存大 小、網絡環境狀態;第一用戶的個人屬性信息包括但不限于:年齡區間、性別、收入區間、教 育程度、婚姻狀況。
[0060] 具體地,獲取多個第一用戶的終端設備的設備相關信息和/或個人屬性信息可以 根據用戶的輸入操作獲取,如在人機交互界面以調查問卷的方式向提供用戶輸入窗口,接 收用戶輸入的與調查問卷相應的數據信息;還可以基于第一用戶的用戶標識在服務器端預 存的數據庫中查詢獲得。
[0061] 步驟S120:基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機器 學習以構建用戶屬性預測模型。
[0062] 優選地,如圖2所示,基于已安裝應用信息及用戶相關信息,通過預定的訓練模型 進行機器學習以構建用戶屬性預測模型的步驟具體包括步驟S121和步驟S122:步驟S121: 采用特征工程,基于已安裝應用信息及用戶相關信息生成特征向量;步驟S122:將特征向量 輸入預定的訓練模型進行機器學習以構建用戶屬性預測模型。
[0063]首先,采用特征工程,基于已安裝應用信息及用戶相關信息生成特征向量。
[0064]需要說明的是,特征工程是利用數據領域的相關知識來創建能夠使機器學習的算 法達到最佳性能的特征的過程,是把原始數據如在本實施例中的已安裝應用信息及用戶相 關信息轉變成特征向量的過程,這些特征向量可以較為準確地描述原始數據,利用特征向 量建立的模型可以達到最優在未知數據的預測上。
[0065] 另外,在機器學習的過程中,特征向量是原始數據的一種獨立、可測量的屬性,選 擇信息量大的、有差別性的、獨立的特征向量是解決機器學習中主要問題如模式識別、分類 和回歸問題的關鍵的一步。然而,原始數據的規模是巨大的,且原始數據中存在著冗余的提 供非必要信息的原始數據,因此,在機器學習的過程中,需要選擇原始數據中的一部分生成 特征向量,或者基于原始數據重新構建一套特征向量,以減少冗余的原始數據,故而可以促 進機器學習的過程,提高泛化能力和可解釋性。
[0066] 接著,將特征向量輸入預定的訓練模型進行機器學習以構建用戶屬性預測模型。
[0067] 其中,預定的訓練模型可以是預先存儲的可以解決構建用戶屬性預測模型的問題 的訓練t吳型。
[0068]優選地,本發明實施例可以通過邏輯回歸模型或線性回歸SVM模型進行機器學習 以構建用戶屬性預測模型。
[0069] 具體地,邏輯回歸模型是機器學習中的一種分類模型,由于算法的簡單和高效,在 實際中應用非常廣泛。其中,邏輯回歸模型應用邏輯回歸方法,邏輯回歸方法是回歸方法的 一種。回歸方法是通過具有已知值的變量值來預測其他非已知變量值,最簡單的回歸方法 采用線性回歸方法。但是很多問題不能應用簡單的線性回歸方法預測,因為不能應用簡單 的線性回歸方法預測的事件所需的變量值的規模較大,且變量值是非線性的,故而在解決 上述問題時,可以應用非線性回歸方法如邏輯回歸方法、決策樹等解決。
[0070] 邏輯回歸模型分為二項邏輯回歸模型和多項邏輯回歸模型,二模型要區別在于目 標變量所屬的類別數量。邏輯回歸模型,主要用來對受多因素影響的事件進行概率預測,根 據預測的概率對目標變量進行分類。以最常用的二項邏輯回歸模型為例,即因變量的取值 只包含兩個類別,通過以下公式可以計算兩個類別中一個類別發生的概率:
[0071]
[0072]
[0073]
[0074] 其中,p為兩個類別中一個類別發生的概率;X為影響因素。
[0075]另外,線性回歸SVM模型是20世紀90年代初Vapnik等人根據統計學習理論提出的 一種新的機器學習方法,它以結構風險最小化原則為理論基礎,通過適當地選擇函數子集 及該子集中的判別函數,使學習機器的實際風險達到最小,保證了通過有限訓練樣本得到 的小誤差分類器,對獨立測試集的測試誤差仍然較小。
[0076]線性回歸SVM模型的基本思想是:首先,在線性可分情況下,在原空間尋找兩類樣 本的最優分類超平面。在線性不可分的情況下,加入了松弛變量進行分析,通過使用非線性 映射將低維輸入空間的樣本映射到高維屬性空間使其變為線性情況,從而使得在高維屬性 空間采用線性算法對樣本的非線性進行分析成為可能,并在該特征空間中尋找最優分類超 平面。其次,它通過使用結構風險最小化原理在屬性空間構建最優分類超平面,使得分類器 得到全局最優,并在整個樣本空間的期望風險以某個概率滿足一定上界。
[0077]需要說明的是,可以根據步驟S110中獲取得到的大量的已安裝的應用信息及安裝 這些應用的相應用戶的用戶相關信息,在步驟S120中通過預定的訓練模型進行機器學習以 構建用戶屬性預測模型,可以輸入特征向量于用戶屬性預測模型中,以根據輸出結果判斷 個人屬性信息。
[0078]步驟S130:將待預測的第二用戶的特征信息輸入用戶屬性預測模型,以預測確定 第二用戶的個人屬性信息。
[0079] 首先,獲取第二用戶的特征信息如已安裝應用信息、包括終端設備的設備相關信 息和個人屬性信息的用戶相關信息,在此步驟中可以盡量多地獲取第二用戶的特征信息; 接著,基于獲取到的第二用戶的特征信息生成第二用戶的特征向量;最后,將第二用戶的特 征向量輸入用戶屬性預測模型得到預測結果,基于預測結果可以預測確定第二用戶的個人 屬性信息。
[0080] 需要說明的是,在獲取第二用戶的特征信息時,相對于獲取第二用戶的個人屬性 信息,終端設備更易于獲取到第二用戶的已安裝應用信息和終端設備的設備相關信息,因 為第二用戶的已安裝應用信息和終端設備的設備相關信息可以通過提取第二用戶的終端 設備中的相應的信息獲取,在上述信息獲取的過程中不需要第二用戶的主動參與。相反地, 在獲取第二用戶的個人屬性信息時,需要第二用戶主動參與完成信息獲取的過程,例如需 要第二用戶在人機交互界面填寫調查問卷提供個人屬性信息。本發明提供的實施例可以僅 根據第二用戶的已安裝應用信息、終端設備的設備相關信息生成第二用戶的特征向量,將 該特征向量輸入用戶屬性預測模型得到輸出結果,以預測確定第二用戶的個人屬性信息, 不需要第二用戶過多的主動參與。另外,如果可以獲取到全面的或者非全面的第二用戶的 個人屬性信息,將該信息作為參考進行第二用戶的個人屬性信息的預測的準確度也會大大 提尚。
[0081] 優選地,個人屬性信息包括但不限于:年齡區間、性別、收入區間、教育程度、婚姻 狀況。
[0082] 例如,獲取用戶A的終端設備如智能手機的已安裝應用信息"應用標識:XX游戲應 用;應用描述信息:XX游戲的多種玩法百玩不膩!新版本加入萌寵系統及寶物探索,增加青 菜英雄!戰斗中可召喚寵物一同戰;應用分類信息:游戲類;應用價格信息:18RMB"、設備相 關信息"iPhone6s內存大小:64G";隨后,基于獲取到的已安裝應用信息、設備相關信息生成 特征向量;最后,將該特征向量輸入訓練好的用戶屬性預測模型,根據模型輸出結果可以預 測確定用戶A的個人屬性信息如收入區間為"5000-10000RMB"。
[0083]需要說明的是,用戶屬性預測模型是基于相關聯的事實對個人屬性信息進行預測 的,例如,接上例,事實上用戶A安裝的應用非免費應用而是需要消費18RMB的應用,且用戶A 使用的智能手機也屬于高端檔位的手機,因為可以推斷用戶A的收入水平是較高的。本發明 實施例中的用戶屬性預測模型是基于大量原始數據訓練得到的,因而基于該用戶屬性預測 模型輸出結果得到的個人屬性信息比人為主觀推斷個人屬性信息更加準確。基于本發明實 施例提供的用戶屬性預測模型預測確定的個人屬性信息進行相應的應用推薦的操作使得 待推薦應用的推薦成功率大大提高。
[0084]又例如,獲取用戶A的用戶相關信息"年齡區間:22-24歲;教育程度:本科",將基于 用戶A的用戶相關信息生成的特征向量輸入用戶屬性預測模型,可以預測確定用戶A的收入 區間為 "5000-8000RMB"。
[0085]步驟S140:基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。
[0086] 優選地,基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用的步驟包 括步驟S141和步驟S142:步驟S141:基于第二用戶的個人屬性信息,確定與第二用戶相匹配 的一個或多個應用分類;步驟S142:從相匹配的應用分類對應的應用集合中選取相應的至 少一個待推薦應用。
[0087] 首先,基于第二用戶的個人屬性信息,確定與第二用戶相匹配的一個或多個應用 分類。
[0088]例如,預測確定用戶B的個人屬性信息"年齡區間:22-24歲;性別:男;收入區間: 5000-10000RMB;教育程度:本科;婚姻狀況:未婚",根據用戶B的個人屬性信息查找預先存 儲的個人屬性信息與應用分類對應關系的列表;隨后,基于用戶B是男性、年齡區間在22-24 歲,在預先存儲的個人屬性信息與應用分類對應關系的列表中確定相匹配的應用分類是格 斗游戲類,確定與用戶B相匹配的一個應用分類為格斗游戲類。
[0089] 接著,從相匹配的應用分類對應的應用集合中選取相應的至少一個待推薦應用。
[0090] 例如,接上例,與用戶B相匹配的一個應用分類為格斗游戲類,再在預先存儲的個 人屬性信息與應用對應關系的列表中基于用戶B的個人屬性信息查找與用戶B相匹配的待 推薦應用;接著,基于用戶B的收入區間"5000-10000RMB",在預先存儲的個人屬性信息與應 用對應關系的列表中確定與收入區間是"5000-10000RMB"相應的待推薦應用是"XX拳王", 且該格斗游戲應用的獲取費用是"5RMB"。需要說明的是,因為預測確定用戶B的收入區間是 "?^",所以可以推斷用戶8是"小資"水平,相應地可以給用戶財隹薦收取一定費 用的應用。
[0091] 除上述步驟方法之外,基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦 應用的步驟也可以包括步驟S143和步驟S144:步驟S143:確定多個待推薦應用分別所屬的 應用分類;步驟S144:基于應用分類與第二用戶的個人屬性信息的對應關系,從該多個待推 薦應用種選取與第二用戶相匹配的待推薦應用。
[0092]例如,確定待推薦應用"XX即時通訊應用"所屬的應用分類為聊天通訊類、XX拍照 應用所屬的應用分類為圖像編輯類、XX游戲應用所屬的應用分類為游戲類;接著,基于待推 薦應用所屬的應用分類和用戶C的個人屬性信息"年齡區間:22-24歲;性別:女;收入區間: 5000-10000RMB;教育程度:本科;婚姻狀況:未婚",在預先存儲的應用分類與個人屬性信息 對應關系的列表中查找確定與用戶C相匹配的待推薦應用為"XX拍照應用"。需要說明的是, 因為用戶C是名女性用戶,因此根據絕大多數女性用戶的偏好可以得知女性用戶偏向于圖 像編輯類應用以美化個人照等人物照片,所以根據用戶C的性別對用戶C具有針對性地推薦 圖像編輯類應用時,用戶C接受該推薦的成功率大大提高。當然,在具體推薦策略的制定中, 遠比本實施例中的舉例說明要復雜,對于待推薦應用的推薦過程,需要綜合考慮全面的用 戶的個人屬性信息。
[0093] 本發明的技術方案解決了如何針對不同用戶的個人情況進行應用推薦的問題。首 先,訓練用戶屬性預測模型,該模型是基于大量原始數據訓練得到的;接著,將待預測的第 二用戶的特征信息輸入用戶屬性預測模型,以預測確定第二用戶的個人屬性信息,基于用 戶屬性預測模型可保證對個人屬性信息的判斷具有較高的準確率;最后,基于第二用戶的 用戶屬性信息,確定與其相匹配的待推薦應用,有針對性地根據不同用戶的特點以預先制 定的不同的應用推薦策略將待推薦應用推薦給第二用戶。基于本發明實施例提供的用戶屬 性預測模型預測確定的個人屬性信息準確率較高,且預測確定的過程不需要用戶的參與, 實現了全自動化的軟件推薦。另外,根據預測確定的準確率較高的個人屬性信息進行應用 推薦操作的應用推薦成功率也相應會大大提高。
[0094] 圖3為本發明另一實施例的軟件推薦的裝置的結構示意圖。
[0095]獲取模塊310獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息。 [0096]優選地,與第一用戶的相關的已安裝應用信息包括但不限于:第一用戶的終端設 備中已安裝應用的應用描述信息、應用分類信息、應用價格信息。
[0097]具體地,獲取模塊310具體用于首先,分別提取多個第一用戶的終端設備中的已安 裝的多個應用分別對應的應用日志;接著,依據各個應用的應用日志,分別建立多個第一用 戶的相關的已安裝應用信息。
[0098]例如,在提取用戶A的終端設備中的已安裝的3款應用分別對應的應用日志的應用 情景下,提取用戶A的移動終端如智能手機中存儲的已安裝的3款應用分別對應的應用日 志,應用日志分別記錄著3款應用的應用信息,該信息包括應用標識、應用描述信息、應用分 類信息、應用價格信息,3款應用的應用信息具體如下所述:
[0099] APP1的應用日志包括,應用標識:XX即時通訊應用;應用描述信息:安裝XX即時通 訊是一種生活方式,你可以快速高效地收發消息,輕松愉快地和朋友暢談,讓溝通更方便; 應用分類信息:聊天通訊類;應用價格信息:應用內消費。
[0100] APP2的應用日志包括,應用標識:XX拍照應用;應用描述信息:超過5億用戶正在使 用!近50款小清新范兒全新實時濾鏡,搭配獨有的美顏技術和景深功能,讓鏡頭里的你擁有 無與倫比的美麗!現已獲得眾多知名攝影師傾情推薦;應用分類信息:圖像編輯類;應用價 格信息:免費。
[0101] APP3的應用日志包括,應用標識:XX游戲應用;應用描述信息:XX游戲的多種玩法 百玩不膩!新版本加入萌寵系統及寶物探索,增加青菜英雄!戰斗中可召喚寵物一同戰;應 用分類信息:游戲類;應用價格信息:18RMB。
[0102] 優選地,用戶相關信息包括但不限于:第一用戶的終端設備的設備相關信息和/或 第一用戶的個人屬性信息。
[0103] 其中,第一用戶的終端設備的設備相關信息包括但不限于:移動終端型號、內存大 小、網絡環境狀態;第一用戶的個人屬性信息包括但不限于:年齡區間、性別、收入區間、教 育程度、婚姻狀況。
[0104] 具體地,獲取多個第一用戶的終端設備的設備相關信息和/或個人屬性信息可以 根據用戶的輸入操作獲取,如在人機交互界面以調查問卷的方式向提供用戶輸入窗口,接 收用戶輸入的與調查問卷相應的數據信息;還可以基于第一用戶的用戶標識在服務器端預 存的數據庫中查詢獲得。
[0105] 學習模塊320基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機 器學習以構建用戶屬性預測模型。
[0106] 優選地,學習模塊320具體包括向量生成單元和機器學習單元:向量生成單元采用 特征工程,基于已安裝應用信息及用戶相關信息生成特征向量;機器學習單元將特征向量 輸入預定的訓練模型進行機器學習以構建用戶屬性預測模型。
[0107] 首先,向量生成單元采用特征工程,基于已安裝應用信息及用戶相關信息生成特 征向量。
[0108] 接著,機器學習單元將特征向量輸入預定的訓練模型進行機器學習以構建用戶屬 性預測模型。
[0109] 其中,預定的訓練模型可以是預先存儲的可以解決構建用戶屬性預測模型的問題 的訓練t吳型。
[0110] 優選地,本發明實施例可以通過邏輯回歸模型或線性回歸SVM模型進行機器學習 以構建用戶屬性預測模型。
[0111] 需要說明的是,獲取模塊310可以獲取得到大量的已安裝的應用信息及安裝這些 應用的相應用戶的用戶相關信息,學習模塊320通過預定的訓練模型進行機器學習來構建 用戶屬性預測模型,可以輸入特征向量于用戶屬性預測模型中,以根據輸出結果判斷個人 屬性信息。
[0112]預測模塊330將待預測的第二用戶的特征信息輸入用戶屬性預測模型,以預測確 定第二用戶的個人屬性信息。
[0113]首先,獲取第二用戶的特征信息如已安裝應用信息、包括終端設備的設備相關信 息和個人屬性信息的用戶相關信息,可以盡量多地獲取第二用戶的特征信息;接著,基于獲 取到的第二用戶的特征信息生成第二用戶的特征向量;最后,將第二用戶的特征向量輸入 用戶屬性預測模型得到預測結果,基于預測結果可以預測確定第二用戶的個人屬性信息。
[0114] 需要說明的是,在獲取第二用戶的特征信息時,相對于獲取第二用戶的個人屬性 信息,終端設備更易于獲取到第二用戶的已安裝應用信息和終端設備的設備相關信息,因 為第二用戶的已安裝應用信息和終端設備的設備相關信息可以通過提取第二用戶的終端 設備中的相應的信息獲取,在上述信息獲取的過程中不需要第二用戶的主動參與。相反地, 在獲取第二用戶的個人屬性信息時,需要第二用戶主動參與完成信息獲取的過程,例如需 要第二用戶在人機交互界面填寫調查問卷提供個人屬性信息。本發明提供的實施例可以僅 根據第二用戶的已安裝應用信息、終端設備的設備相關信息生成第二用戶的特征向量,將 該特征向量輸入用戶屬性預測模型得到輸出結果,以預測確定第二用戶的個人屬性信息, 不需要第二用戶過多的主動參與。另外,如果可以獲取到全面的或者非全面的第二用戶的 個人屬性信息,將該信息作為參考進行第二用戶的個人屬性信息的預測的準確度也會大大 提尚。
[0115] 優選地,個人屬性信息包括但不限于:年齡區間、性別、收入區間、教育程度、婚姻 狀況。
[0116] 例如,獲取用戶A的終端設備如智能手機的已安裝應用信息"應用標識:XX游戲應 用;應用描述信息:XX游戲的多種玩法百玩不膩!新版本加入萌寵系統及寶物探索,增加青 菜英雄!戰斗中可召喚寵物一同戰;應用分類信息:游戲類;應用價格信息:18RMB"、設備相 關信息"iPhone6s內存大小:64G";隨后,基于獲取到的已安裝應用信息、設備相關信息生成 特征向量;最后,將該特征向量輸入訓練好的用戶屬性預測模型,根據模型輸出結果可以預 測確定用戶A的個人屬性信息如收入區間為"5000-10000RMB"。
[0117]需要說明的是,用戶屬性預測模型是基于相關聯的事實對個人屬性信息進行預測 的,例如,接上例,事實上用戶A安裝的應用非免費應用而是需要消費18RMB的應用,且用戶A 使用的智能手機也屬于高端檔位的手機,因為可以推斷用戶A的收入水平是較高的。本發明 實施例中的用戶屬性預測模型是基于大量原始數據訓練得到的,因而基于該用戶屬性預測 模型輸出結果得到的個人屬性信息比人為主觀推斷個人屬性信息更加準確。基于本發明實 施例提供的用戶屬性預測模型預測確定的個人屬性信息進行相應的應用推薦的操作使得 待推薦應用的推薦成功率大大提高。
[0118]又例如,獲取用戶A的用戶相關信息"年齡區間:22-24歲;教育程度:本科",將基于 用戶A的用戶相關信息生成的特征向量輸入用戶屬性預測模型,可以預測確定用戶A的收入 區間為 "5000-8000RMB"。
[0119] 確定模塊340基于第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。
[0120] 優選地,確定模塊340具體包括第一確定單元和第一選取單元:第一確定單元基于 第二用戶的個人屬性信息,確定與第二用戶相匹配的一個或多個應用分類;第一選取單元 從相匹配的應用分類對應的應用集合中選取相應的至少一個待推薦應用。
[0121] 首先,第一確定單元基于第二用戶的個人屬性信息,確定與第二用戶相匹配的一 個或多個應用分類。
[0122] 例如,預測確定用戶B的個人屬性信息"年齡區間:22-24歲;性別:男;收入區間: 5000-10000RMB;教育程度:本科;婚姻狀況:未婚",根據用戶B的個人屬性信息查找預先存 儲的個人屬性信息與應用分類對應關系的列表;隨后,基于用戶B是男性、年齡區間在22-24 歲,在預先存儲的個人屬性信息與應用分類對應關系的列表中確定相匹配的應用分類是格 斗游戲類,確定與用戶B相匹配的一個應用分類為格斗游戲類。
[0123] 接著,第一選取單元從相匹配的應用分類對應的應用集合中選取相應的至少一個 待推薦應用。
[0124] 例如,接上例,與用戶B相匹配的一個應用分類為格斗游戲類,再在預先存儲的個 人屬性信息與應用對應關系的列表中基于用戶B的個人屬性信息查找與用戶B相匹配的待 推薦應用;接著,基于用戶B的收入區間"5000-10000RMB",在預先存儲的個人屬性信息與應 用對應關系的列表中確定與收入區間是"5000-10000RMB"相應的待推薦應用是"XX拳王", 且該格斗游戲應用的獲取費用是"5RMB"。需要說明的是,因為預測確定用戶B的收入區間是 "?^",所以可以推斷用戶8是"小資"水平,相應地可以給用戶財隹薦收取一定費 用的應用。
[0125] 除上述模塊之外,確定模塊340也可以包括第二確定單元和第二選取單元:第二確 定單元確定多個待推薦應用分別所屬的應用分類;第二選取單元基于應用分類與第二用戶 的個人屬性信息的對應關系,從該多個待推薦應用種選取與第二用戶相匹配的待推薦應 用。
[0126] 例如,確定待推薦應用"XX即時通訊應用"所屬的應用分類為聊天通訊類、XX拍照 應用所屬的應用分類為圖像編輯類、XX游戲應用所屬的應用分類為游戲類;接著,基于待推 薦應用所屬的應用分類和用戶C的個人屬性信息"年齡區間:22-24歲;性別:女;收入區間: 5000-10000RMB;教育程度:本科;婚姻狀況:未婚",在預先存儲的應用分類與個人屬性信息 對應關系的列表中查找確定與用戶C相匹配的待推薦應用為"XX拍照應用"。需要說明的是, 因為用戶C是名女性用戶,因此根據絕大多數女性用戶的偏好可以得知女性用戶偏向于圖 像編輯類應用以美化個人照等人物照片,所以根據用戶C的性別對用戶C具有針對性地推薦 圖像編輯類應用時,用戶C接受該推薦的成功率大大提高。當然,在具體推薦策略的制定中, 遠比本實施例中的舉例說明要復雜,對于待推薦應用的推薦過程,需要綜合考慮全面的用 戶的個人屬性信息。
[0127] 本發明的技術方案解決了如何針對不同用戶的個人情況進行應用推薦的問題。首 先,訓練用戶屬性預測模型,該模型是基于大量原始數據訓練得到的;接著,將待預測的第 二用戶的特征信息輸入用戶屬性預測模型,以預測確定第二用戶的個人屬性信息,基于用 戶屬性預測模型可保證對個人屬性信息的判斷具有較高的準確率;最后,基于第二用戶的 用戶屬性信息,確定與其相匹配的待推薦應用,有針對性地根據不同用戶的特點以預先制 定的不同的應用推薦策略將待推薦應用推薦給第二用戶。基于本發明實施例提供的用戶屬 性預測模型預測確定的個人屬性信息準確率較高,且預測確定的過程不需要用戶的參與, 實現了全自動化的軟件推薦。另外,根據預測確定的準確率較高的個人屬性信息進行應用 推薦操作的應用推薦成功率也相應會大大提高。
[0128] 本技術領域技術人員可以理解,本發明包括涉及用于執行本申請中所述操作中的 一項或多項的設備。這些設備可以為所需的目的而專門設計和制造,或者也可以包括通用 計算機中的已知設備。這些設備具有存儲在其內的計算機程序,這些計算機程序選擇性地 激活或重構。這樣的計算機程序可以被存儲在設備(例如,計算機)可讀介質中或者存儲在 適于存儲電子指令并分別耦聯到總線的任何類型的介質中,所述計算機可讀介質包括但不 限于任何類型的盤(包括軟盤、硬盤、光盤、CD-ROM、和磁光盤)、R0M( Read-Only Memory,只 讀存儲器)、RAM(Random Access Memory,隨即存儲器)、EPROM(Erasable Programmable Read-Only Memory,可擦寫可編程只讀存儲器)、EEPROM(Electrically Erasable Programmable Read-Only Memory,電可擦可編程只讀存儲器)、閃存、磁性卡片或光線卡 片。也就是,可讀介質包括由設備(例如,計算機)以能夠讀的形式存儲或傳輸信息的任何介 質。
[0129] 本技術領域技術人員可以理解,可以用計算機程序指令來實現這些結構圖和/或 框圖和/或流圖中的每個框以及這些結構圖和/或框圖和/或流圖中的框的組合。本技術領 域技術人員可以理解,可以將這些計算機程序指令提供給通用計算機、專業計算機或其他 可編程數據處理方法的處理器來實現,從而通過計算機或其他可編程數據處理方法的處理 器來執行本發明公開的結構圖和/或框圖和/或流圖的框或多個框中指定的方案。
[0130]本技術領域技術人員可以理解,本發明中已經討論過的各種操作、方法、流程中的 步驟、措施、方案可以被交替、更改、組合或刪除。進一步地,具有本發明中已經討論過的各 種操作、方法、流程中的其他步驟、措施、方案也可以被交替、更改、重排、分解、組合或刪除。 進一步地,現有技術中的具有與本發明中公開的各種操作、方法、流程中的步驟、措施、方案 也可以被交替、更改、重排、分解、組合或刪除。
[0131]以上所述僅是本發明的部分實施方式,應當指出,對于本技術領域的普通技術人 員來說,在不脫離本發明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視為本發明的保護范圍。
【主權項】
1. 一種推薦應用的方法,包括: 獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息; 基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機器學習以構建用戶 屬性預測模型; 將待預測的第二用戶的特征信息輸入所述用戶屬性預測模型,以預測確定所述第二用 戶的個人屬性信息; 基于所述第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。2. 根據權利要求1所述的方法,其中,所述已安裝應用信息包括第一用戶的終端設備中 已安裝應用的應用描述信息、應用分類信息、應用價格信息中的至少一項。3. 根據權利要求1所述的方法,其中,所述用戶相關信息包括第一用戶的終端設備的設 備相關信息和/或第一用戶的個人屬性信息。4. 根據權利要求1所述的方法,其中,基于已安裝應用信息及用戶相關信息,通過預定 的訓練模型進行機器學習以構建用戶屬性預測模型,具體包括: 采用特征工程,基于所述已安裝應用信息及用戶相關信息生成特征向量; 將所述特征向量輸入預定的訓練模型進行機器學習以構建用戶屬性預測模型。5. 根據權利要求1所述的方法,其中,所述個人屬性信息包括以下一項或多項: 年齡區間;性別;收入區間;教育程度;婚姻狀況。6. 根據權利要求5所述的方法,其中,基于所述第二用戶的個人屬性信息,確定與其相 匹配的待推薦應用,包括: 基于所述第二用戶的個人屬性信息,確定與第二用戶相匹配的一個或多個應用分類; 從相匹配的應用分類對應的應用集合中選取相應的至少一個待推薦應用。7. 根據權利要求5所述的方法,其中,基于所述第二用戶的個人屬性信息,確定與其相 匹配的待推薦應用,包括: 確定多個待推薦應用分別所屬的應用分類; 基于應用分類與所述第二用戶的個人屬性信息的對應關系,從該多個待推薦應用種選 取與所述第二用戶相匹配的待推薦應用。8. -種推薦應用的裝置,包括: 獲取模塊,用于獲取與多個第一用戶的相關的已安裝應用信息及用戶相關信息; 學習模塊,用于基于已安裝應用信息及用戶相關信息,通過預定的訓練模型進行機器 學習以構建用戶屬性預測模型; 預測模塊,用于將待預測的第二用戶的特征信息輸入所述用戶屬性預測模型,以預測 確定所述第二用戶的個人屬性信息; 確定模塊,用于基于所述第二用戶的用戶屬性信息,確定與其相匹配的待推薦應用。9. 根據權利要求8所述的裝置,其中,所述已安裝應用信息包括第一用戶的終端設備中 已安裝應用的應用描述信息、應用分類信息、應用價格信息中的至少一項。10. 根據權利要求8所述的裝置,其中,所述用戶相關信息包括第一用戶的終端設備的 設備相關信息和/或第一用戶的個人屬性信息。
【文檔編號】H04L29/08GK105933425SQ201610330682
【公開日】2016年9月7日
【申請日】2016年5月18日
【發明人】周楠, 岳華東, 張永攀, 常富洋
【申請人】北京奇虎科技有限公司, 奇智軟件(北京)有限公司