一種基于用戶活動特征的基站劃分方法
【專利摘要】本發明提供了一種基于用戶活動特征的基站劃分方法,本方法利用移動互聯網的基站數據集,獲取以時間為序的用戶記錄,所述用戶記錄包括單個用戶在不同時間分別訪問的基站,上網時長和流量信息;進行數據重構,按基站統計用戶記錄,統計單個用戶在每個基站下上網的總時長和總流量;遍歷所有用戶,計算單個人描述的基站之間的合作緊密程度,構建一張有權的空間合作網絡,其中節點代表基站,邊代表基站之間的合作關系,邊的權重代表了合作關系的緊密程度;利用基于模塊度最優化的方法,對有權的空間合作網絡進行劃分;本發明利用移動互聯網的基站數據集,從空間合作的角度,提出一個新方法,確定用戶日常活動的區域。
【專利說明】一種基于用戶活動特征的基站劃分方法
【技術領域】
[0001] 本發明涉及移動互聯網【技術領域】,特別涉及一種基于用戶活動特征的基站劃分方 法。
【背景技術】
[0002] 隨著信息技術的發展,帶有定位功能的移動電子設備被廣泛的應用到人們的日常 生活中來。從支撐用戶移動通話、社交網絡等通信行為的智能手機、平板電腦,到公交車、出 租車等公共交通工具中的車載GPS,都能長時間、高精度的跟蹤個體的空間移動行為。進入 到大數據時代,這些能夠高效的記錄人類移動軌跡的設備所產生的包含豐富的關于人類日 常行為位置信息的數據被保存下來,使得基于大規模原始數據的人類移動行為研究成為可 能。
[0003] 人類移動軌跡數據被當成一種重要的大數據資源吸引著各個領域的科學家、工程 師的目光。不同的研究中,人類移動距離分布被不同的形式的函數擬合,例如冪律函數形 式、指數函數形式、指數截斷的冪律形式。盡管這些函數從不同的方面表現了人類移動行為 的動力學原因,但是它們一致得出移動距離的分布P(d)隨著d的增大而減小,表明人的活 動范圍是有限的。并且人的主要活動主要集中在少數的幾個地方,例如家庭和工作地,人的 主要日常活動是有一定區域特征的。
[0004] 在移動互聯網中,基站作為基礎服務設施根據用戶密度在空間上分布,用戶的移 動性使得他們會通過不同的基站下接入通信網絡獲得服務。在此背景下,空間合作網絡中 的節點代表了移動互聯網中的基站,節點間的合作關系由移動的用戶引起。
[0005] 根據用戶的移動性特征,可以將移動互聯網中的用戶-基站構成的二分網絡轉化 成基站構成的簡單有權網絡。該有權網絡能有效的反應空間分布的基礎設施間的合作關 系。
[0006] 當前對于人類活動區域性研究的方法主要是基于個體的活動軌跡,用質心和回轉 半徑描述個體活動區域,于是用戶在空間中就以質心-半徑的形式分布,當記錄的位置較 少時,這種方法不能準確反映人的真實活動范圍。
【發明內容】
[0007] 本發明針對上述問題,提出了一種基于用戶活動特征的基站劃分方法,對有權的 空間合作網絡進行劃分。
[0008] 本發明的技術方案是:一種基于用戶活動特征的基站劃分方法,其特征在于,包括 如下步驟:
[0009] 步驟1.利用移動互聯網的基站數據集,獲取以時間為序的用戶記錄,所述用戶記 錄包括單個用戶在不同時間分別訪問的基站,上網時長和流量信息;
[0010] 步驟2.對步驟1中的用戶記錄進行數據重構,得到按基站統計的用戶記錄;
[0011] 步驟3.遍歷所有用戶,計算單個人描述的基站之間的合作緊密程度,構建一張有 權的空間合作網絡,其中節點代表基站,邊代表基站之間的合作關系,邊的權重代表了合作 關系的緊密程度;
[0012] 步驟4利用基于模塊度最優化的方法,對有權的空間合作網絡進行劃分。
[0013] 所述的步驟2包括如下步驟:
[0014] 步驟2. 1.令a= 1,n=用戶總數;a為第a個用戶;
[0015] 步驟2. 2.查詢第a個用戶以時間為序的上網記錄表,并為該用戶初始化一個包括 基站號,總時長和總流量的新表;
[0016] 步驟2. 3.令b= 1,w=第a個用戶的上網記錄表中記錄總條數;b為該用戶的第 b條記錄;
[0017] 步驟2. 4?查詢該用戶的第b條記錄;
[0018] 步驟2. 5.判斷新表是否為空表,如果是,則跳轉執行步驟2. 7,如果否,則執行步 驟 2. 6 ;
[0019] 步驟2. 6.判斷新表中是否已有第b條記錄中的基站號,如果是,則跳轉執行步驟 2. 8,如果否,則執行步驟2.7 ;
[0020] 步驟2. 7.在新表中新增一條基站號記錄,總時長和總流量與該條記錄中的基站, 時長,流量分別對應相等,然后跳轉執行步驟2. 9 ;
[0021] 步驟2. 8.將該條記錄中的時長和流量分別累加到新表中該基站號對應的總時長 和總流量中;
[0022] 步驟2.9.令b=b+l,判斷b是否大于w,如果是,則執行步驟2. 10,如果否,則跳 轉執行步驟2. 4 ;
[0023] 步驟2. 10.令a=a+1,判斷a是否大于n,如果是,則結束步驟2,如果否,則跳轉 執行步驟2. 2
[0024] 所述的步驟3包括如下步驟:
[0025] 步驟3. 1.初始化任意兩個基站之間邊的權重&= 0 ;
[0026] 步驟3. 2.令u=l,m=基站總數,n=用戶總數;u為第u個用戶;
[0027] 步驟3. 3.令i= 1 ;i為第i個基站;
[0028] 步驟3. 4.令j=i+1 ;j為第j個基站;
[0029] 步驟3. 5.判斷第u個用戶是否同時訪問過基站i和基站j,如果是,則執行步驟 3. 6,如果否,則跳轉執行步驟3. 8 ;
[0030] 步驟3. 6.計算該單個用戶描述的基站i和基站j之間的合作關系< :
[0031] 步驟3. 7.將該單個用戶的%累加到中,基站i和基站j之間邊的權重更新為
【權利要求】
1. 一種基于用戶活動特征的基站劃分方法,其特征在于,包括如下步驟: 步驟1.利用移動互聯網的基站數據集,獲取以時間為序的用戶記錄,所述用戶記錄包 括單個用戶在不同時間分別訪問的基站,上網時長和流量信息; 步驟2.對步驟1中的用戶記錄進行數據重構,得到按基站統計的用戶記錄; 步驟3.遍歷所有用戶,計算單個人描述的基站之間的合作緊密程度,構建一張有權的 空間合作網絡,其中節點代表基站,邊代表基站之間的合作關系,邊的權重代表了合作關系 的緊密程度; 步驟4利用基于模塊度最優化的方法,對有權的空間合作網絡進行劃分。
2. 根據權利要求1所述的一種基于用戶活動特征的基站劃分方法,其特征在于,所述 的步驟2包括如下步驟: 步驟2. L令a = 1,η =用戶總數;a為第a個用戶; 步驟2. 2.查詢第a個用戶以時間為序的上網記錄表,并為該用戶初始化一個包括基站 號,總時長和總流量的新表; 步驟2. 3.令b = 1,w =第a個用戶的上網記錄表中記錄總條數;b為該用戶的第b條 記錄; 步驟2. 4.查詢該用戶的第b條記錄; 步驟2. 5.判斷新表是否為空表,如果是,則跳轉執行步驟2. 7,如果否,則執行步驟 2. 6 ; 步驟2. 6.判斷新表中是否已有第b條記錄中的基站號,如果是,則跳轉執行步驟2. 8, 如果否,則執行步驟2. 7; 步驟2. 7.在新表中新增一條基站號記錄,總時長和總流量與該條記錄中的基站,時 長,流量分別對應相等,然后跳轉執行步驟2. 9 ; 步驟2. 8.將該條記錄中的時長和流量分別累加到新表中該基站號對應的總時長和總 流量中; 步驟2.9.令b = b+l,判斷b是否大于w,如果是,則執行步驟2. 10,如果否,則跳轉執 行步驟2. 4 ; 步驟2. 10.令a = a+Ι,判斷a是否大于n,如果是,則結束步驟2,如果否,則跳轉執行 步驟2. 2。
3. 根據權利要求1所述的一種基于用戶活動特征的基站劃分方法,其特征在于,所述 的步驟3包括如下步驟: 步驟3. 1.初始化任意兩個基站之間邊的權重Wij= 0 ; 步驟3. 2.令u = 1,m =基站總數,η =用戶總數;u為第u個用戶; 步驟3. 3.令i = I ;i為第i個基站; 步驟3. 4.令j = i+1 ; j為第j個基站; 步驟3. 5.判斷第u個用戶是否同時訪問過基站i和基站j,如果是,則執行步驟3. 6, 如果否,則跳轉執行步驟3. 8; 步驟3. 6.計算該單個用戶描述的基站i和基站j之間的合作關系< ; 步驟3. 7.將該單個用戶的 < 累加到&中,基站i和基站j之間邊的權重更新為 . ^ u ;υ ; ? 步驟3. 8.令j = j+l,判斷j是否大于m,如果是,則執行步驟3. 9,如果否,則跳轉執 行步驟3. 5 ; 步驟3.9.令i = i+Ι,判斷i是否大于m-1,如果是,則執行步驟3. 10,如果否,則跳轉 執行步驟3. 4 ; 步驟3. 10.令U = u+1,判斷u是否大于n,如果是,則結束步驟3,如果否,則跳轉執行 步驟3. 3。
4.根據權利要求1或3所述的一種基于用戶活動特征的基站劃分方法,其特征在于,所 述的計算單個人描述的基站之間的合作緊密程度為:
其中,< 表示單個人描述基站之間的合作關系,·<代表基站i為用戶u提供的服務, Vu代表為用戶u提供服務的基站的集合;n U= |VU|為用戶u提供服務的基站的個數,因子 使得4的定義滿足1歸一化每個個體對空間合作網絡的描述。
【文檔編號】H04W16/18GK104519497SQ201510014621
【公開日】2015年4月15日 申請日期:2015年1月12日 優先權日:2015年1月12日
【發明者】吳禮華, 江昊, 李倩, 周晨, 羿舒文, 吳靜, 陳祖泉 申請人:武漢大學