本申請涉及通信領域,尤其涉及到一種流量預測方法和裝置。
背景技術:
無線網絡系統、是指電信運營商在某一地區廣泛部署,為用戶提供數據傳輸服務的通信系統。通常,無線網絡系統包括兩大組成部分,基站子系統以及網絡子系統。其中,基站子系統直接為附近用戶的終端設備提供網絡接入服務。對于一個電信運營商來講,基站的數量可達上萬甚至數十萬,分散地部署在各個區域,為區域進行全面覆蓋。網絡子系統則通過線纜將基站連接起來,為接入網絡的終端設備提供數據收發服務。
在無線網絡系統的規劃與調整中,由于用戶人流的變化、終端設備升級等因素,電信運營商會根據網絡流量使用的變化,對基站、小區的數量進行適應的增減,以適應不同的流量需求。而這種增減調整是需要綜合考慮未來可能的網絡流量的具體使用情況,因為當網絡流量使用洪峰到來時,再去采購并部署相關的基站,已經為時已晚。因此,為了適應上述未來可能的網絡流量的具體使用情況,依據具體情況,需要對不同粒度(例如預設范圍內的部分小區或全部小區)在不同周期(例如1或6,或12個月后)的使用流量進行預測。
現有技術中,提供了一種基于分組方式進行預測的方法,在預置范圍內,先是按照小區的歷史使用流量相近的原則對小區進行分組,在對某個小區的使用流量進行預測時,以該某個小區的分組下所有小區的歷史使用流量作為參考數據對該某小區的使用流量進行預測。那么可以看出,基于分組方式可以抑制預測模型復雜度,但對該分組下的某個小區的使用流量進行預測時,則未考慮該部分小區與其他分組的其他相關性,只考慮了歷史使用流量相近這個因素,使得在對小區進行預測時,未充分考慮到所有相關小區的信息,導致最終小區的使用流量的預測值誤差較大。
技術實現要素:
本申請實施例提供了一種流量預測方法,用于解決現有技術中,對小區的使用流量進行預測時預測出來的預測值誤差比較大的問題。
為了解決上述問題,本申請實施例提供以下技術方案:
第一方面,本申請實施例提供了一種流量預測方法,先獲取預置范圍內,所有小區的歷史總使用流量數據,該歷史總使用流量數據是指預置范圍內所有小區之前的一些歷史使用流量的總和所構成的數據,接著以獲得到的所有小區的歷史總使用流量數據作為輸入,使用第一預測模型對預置范圍內所有小區的總使用流量進行預測以獲得目標預測值,最后根據目標預測值對目標小區,即預置范圍內所有小區中的任意一個小區的使用流量進行預測得到目標小區的使用流量預測值。
由此可見,對于任意一個待預測小區而言,在對每個待預測小區進行預測時,根據計算出來的預置范圍下所有小區的使用流量的目標預測值進行預測即可,抑制了對小區預測時的預測模型復雜度,且該目標預測值考慮到了預置范圍內所有小區預測得到的,不是將小區進行分組,將預測參考小區的數目局限在部分小區,有效地減少了小區的使用流量的預測值誤差。
在一種可能的實現中,根據所述目標預測值對目標小區的使用流量進行預測得到所述目標小區的使用流量預測值,包括:根據樹形層級結構中,第一節點下所有小區的使用流量預測值以及第二節點下所有小區的歷史總使用流量數據,使用第二預測模型對第二節點下所有小區的總使用流量進行預測,第二節點為第一節點的下級節點,其中,當第一節點為根節點時,第一節點下所有小區的總使用流量預測值為目標預測值;當確定了第三節點下所有小區的使用流量預測值后,根據第三節點下所有小區的使用流量預測值以及目標小區的歷史總使用流量數據,使用第二預測模型對目標小區的使用流量進行預測得到目標小區的使用流量預測值,目標小區為第三節點下的小區。由此可以看出,在本實現中,對于樹形層級結構中的頂層節點,即根節點而言,只需要訓練出一個模型,利用根節點下的所有小區的歷史使用總流量預測出在該根節點下所有小區的使用流量;而對于樹形層級結構的中間節點,和底層節點,只需要本層下的所有小區,以及上層節點的使用流量預測值作為輸入,進行預測,而不是上層節點的歷史使用流量作為輸入,對參數進行了有效地壓縮,實測效果更好,可以使得最終的目標小區的使用流量預測值更準。
在一種可能的實現中,對預置范圍內的小區進行分層以獲得樹形層級結構可以有多種獲得方式,其中一種方式是,先獲取小區工程參數;再利用獲得的小區工程參數確定預置范圍內小區的網絡拓撲結構,最后將網絡拓撲結構作為本申請實施例中的樹形層級結構。即在本實現中,提出了一種獲得樹形層級結構的方式,提高了方案的可實施性。
在一種可能的實現中,對預置范圍內的小區進行分層以獲得樹形層級結構還可以通過以下方式獲得:先獲取小區工程參數;利用獲取的小區工程參數確定預置范圍內各個小區的擬位置,即利用獲取的小區工程參數為預置范圍內的各個小區重新擬定一個位置參數,在本申請實施例中定義為擬位置,最后根據各個小區的擬位置對預置范圍所有小區進行分層以獲得樹形層次結構。由此可見,在本實現提出了另一種獲得樹形層級結構的方式,提高了方案的多樣性。示例性的,在一種可能的實現中,根據小區工程參數確定各個小區的擬位置,可以依據下述公式確定確定各個小區的擬位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,xsite、ysite分別為各個小區對應基站的經度、維度;xcell、ycell分別為各個小區的經度、維度,λ為預設數據,ptrx為基站的發射功率,h為各個小區的天線高度,α、θ分別為各個小區對應的天線下傾角、方向角。
在一種可能的實現中,根據各個小區的擬位置對預置范圍內所有小區進行分層以獲得樹形層級結構可以通過對各個小區的擬位置進行層次化聚類,從而獲得預置范圍內所有小區的樹形層級結構。
在一種可能的實現中,對各個小區的擬位置進行層次化聚類以獲得樹形層級結構,可以使用k-mean聚類(也稱為k均值聚類)方式對各個小區的擬位置進行層次化聚類以獲得樹形層級結構。當然,這里只是以k-mean聚類為例,實際應用中,可以根據經驗采用其他的層次化聚類方式獲得,這里不做限定。
在一種可能的實現中,根據話單記錄對預置范圍內的小區進行分層以獲得樹形層級結,包括:獲取話單記錄;根據話單記錄獲取訓練樣本;將訓練樣本展開為目標根向量;對目標根向量進行層次化聚類以獲得樹形層級結構。在本實現中,具體提出了一種怎么利用話單記錄獲得預置范圍內小區的樹形層級結構的方式,提高了方案的可實施性。
在一種可能的實現中,所述根據所述話單記錄獲取訓練樣本,包括:查詢所述話單記錄得到在所述預設范圍內的每個小區中,所有終端設備的流量記錄信息;將所述流量記錄信息作為所述訓練樣本。
在一種可能的實現中,對目標根向量進行層次化聚類以獲得樹形層級結構,包括:使用bi-clustering聚類(也稱雙聚類)方式對目標根向量進行層次化聚類以獲得樹形層級結構。
在一種可能的實現中,本申請實施例所提供的流量預測方法包括:基于第一樹形層級結構、二樹形層級結構以及第三樹形層級結構對目標小區的使用流量進行預測以分別獲得第一預測值、第二預測值和第三預測值,其中,第一樹形層級結構為根據網絡拓撲結構獲得的樹形層級結構,第二樹形層級結構為根據擬位置獲得的樹形層級結構,第三樹形層級結構為根據話單記錄獲得的樹形層級結構;根據第一預測值、第二預測值和第三預測值得到目標小區的使用流量預測值。即在本實現中,當利用上述第一方面所獲取的樹形層級結構預測得到預測值時,可以利用算法以確定出目標小區的使用流量的最佳的預測值,可以有效地提高本申請實施例對目標小區的使用流量的預測準確度。
在一種可能的實現中,根據第一預測值、第二預測值和第三預測值得到目標小區的使用流量預測值之前,該方法還包括:確定預設時段內目標小區的歷史使用流量數據的加權平均值,接著以所述第一預測值、第二預測值、第三預測值以及所述小區工程參數為輸入,所述加權平均值為標簽,基于隨機森林算法進行融合,得到所述目標小區的使用流量預測值。在本實現中,在對不同樹形層級結構下所得到的目標小區的使用流量預測值進行綜合判定以確定出最終的目標小區的使用流量預測值,即還綜合考慮了小區工程參數,因為,上述三種樹形層級結構在不同網絡制式、不同頻段的網絡上的預測值可能是不一樣的,因此,在進行融合時,考慮具體的小區工程參數,可以使得最終的目標小區的使用流量預測效果更佳。
在一種可能的實現中,確定預設時段內目標小區的歷史使用流量數據的加權平均值,可以通過以下方式進行:對預設時段內的目標小區的n個歷史使用流量數據點進行異常檢測,n為正整數,n大于或等于2;通過異常檢測后獲得預設時段內,歷史使用流量數據點的n個異常系數;根據n個異常系數確定n個歷史使用流量數據點對應的權重;根據n個歷史使用流量數據點對應的權重確定目標小區在預設時段內的歷史使用流量的加權平均值。
在一種可能的實現中,所述根據所述n個歷史使用流量數據點對應的權重確定所述目標小區在預設時段內的歷史使用流量的加權平均值,包括:將所述n個歷史使用流量數據點對應的權重進行加權平均以得到所述目標小區在預設時段內的歷史使用流量數據的加權平均值。
第二方面,本申請實施例提供了一種流量預測裝置包括獲取模塊、第一預測模塊以及第二預測模塊。其中,獲取模塊,用于獲取預置范圍內,所有小區的歷史總使用流量數據;第一預測模塊,用于將所有小區的歷史總使用流量數據作為輸入,使用第一預測模型對獲取模塊獲取的預置范圍內所有小區的總使用流量進行預測以獲得目標預測值;第二預測模塊,用于根據第一預測模塊預測的目標預測值對目標小區的使用流量進行預測得到目標小區的使用流量預測值,其中,目標小區為預置范圍內的任意一個小區。
在本申請的第二方面中,上述流量預測裝置的組成模塊還可以執行前述第一方面中各種可能的實現方式中所描述的步驟,詳見前述對第一方面中各種可能的實現方式中的說明,具體此處不再做贅述。
第三方面,本申請實施例還提供另一種流量預測裝置,該流量預測裝置具有實現上述方法中流量預測裝置的行為的功能,上述功能可以通過硬件實現,也可以通過硬件執行相應的軟件實現。硬件或軟件包括一個或多個與上述功能相對應的模塊。在一種可能的設計中,流量預測裝置的結構中包括可以包括存儲器和處理器,和存儲在存儲器上并可在處理器上運行的計算機程序,該處理器執行計算機程序時實現上述第一方面/第一方面中各種可能的實現方式,這里不再贅述。
第四方面,本申請提供了一種計算機可讀存儲介質,計算機可讀存儲介質中存儲有指令,當其在計算機上運行時,使得計算機執行上述各方面/各實現所描述的方法,具體可參閱前述描述,這里不再進行贅述。
從以上技術方案可以看出,對于任意一個待預測小區而言,在對每個待預測小區進行預測時,根據計算出來的預置范圍下所有小區的使用流量的目標預測值進行預測即可,抑制了對小區預測時的預測模型復雜度,且該目標預測值考慮到了預置范圍內所有小區預測得到的,不是將小區進行分組,將預測參考小區的數目局限在部分小區,有效地減少了小區的使用流量的預測值誤差。
附圖說明
為了更清楚地說明本申請實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡單地介紹。
圖1為本申請實施例一種流量預測方法的一個系統框架示意圖;
圖2為本申請實施例一種流量預測方法的一個實施例流程示意圖;
圖3為本申請實施例一種小區工程參數示意圖;
圖4為本申請實施例一種流量預測方法中一種樹形層級結構示意圖;
圖5為本申請實施例一種流量預測方法的另一實施例流程示意圖;
圖6為本申請實施例一種流量預測裝置一個實施例結構示意圖;
圖7為本申請實施例一種流量預測裝置另一實施例結構示意圖;
圖8為本申請實施例一種流量預測裝置另一實施例結構示意圖;
圖9為本申請實施例一種計算機設備一個實施例結構示意圖。
具體實施方式
本申請實施例提供了一種流量預測方法,用于有效地減少了小區的使用流量預測值的預測誤差。
為了使本技術領域的人員更好地理解本申請方案,下面將結合本申請實施例中的附圖,描述本申請實施例中的技術方案。顯然,所描述的實施例僅僅是本申請一部分的實施例,而不是全部的實施例。基于本申請中的實施例,本領域普通技術人員所獲得的所有其他實施例,都應當屬于本申請保護的范圍。
需要說明的是,本申請的說明書和權利要求書及上述附圖中的術語“第一”、“第二”、“第三”、“第四”等(如果存在)是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數據在適當情況下可以互換,以便這里描述的實施例能夠以除了在這里圖示或描述的內容以外的順序實施。此外,術語“包括”和以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。
本申請實施例所提供的流量預測方法可以應用于各種各樣的通信系統中,示例性的,可以應用于全球移動通信系統(globalsystemformobilecommunication,gsm)、碼分多址(codedivisionmultipleaccess,cdma)系統、寬帶碼分多址(widebandcodedivisionmultipleaccess,wcdma)系統、通用分組無線業務(generalpacketradioservice,gprs)、通用移動通信系統(universalmobiletelecommunicationssystem,umts)、時分長期演進(timedivisionlongtermevolution,td-lte)、頻分長期演進(frequencydivisionlongtermevolution,fdd-lte及未來的第五代移動通信技術(5rd-generationmobilecommunicationtechnology,5g)等各種各樣的通信系統中,具體此處不做限定。
首先,先對本申請實施例所提供的一種流量預測方法的系統框架進行一個介紹,請參閱圖1,圖1為本申請實施例一種流量預測方法一個系統框架示意圖,包括終端設備和基站,終端設備基站和終端設備之間可以通過空中接口實現數據或信令的收發。該終端設備可被稱為接入終端、用戶設備(userequipment,ue)、用戶單元、用戶站、移動站、移動臺、遠方臺、遠程終端移動設備等設備或裝置,具體此處不做限定。圖1所示的系統框架圖在這里只是舉例說明,并不對本申請實施例構成限定。
基站是指與終端設備進行通信的網絡設備,該基站可以是gsm系統的基站(basetransceiverstation,bts),也可以是wcdma系統中的基站(nodeb,nb),還可以是指lte系統中的演進型基站(evolutionnodeb,enb或enodeb),或者可以是指未來5g等通信系統中的基站設備,具體此處也不做限定。
基站可以對應一個或多個小區,在終端設備通過小區與基站實現交互的過程中,每個小區都會生產使用流量,在本申請實施例提出了一種對小區的使用流量進行預測的方法,其核心思想在于,獲取預置范圍內,所有小區的歷史總使用流量數據;將所述所有小區的歷史總使用流量數據作為輸入,使用第一預測模型對所述預置范圍內所有小區的總使用流量進行預測以獲得目標預測值,根據所述目標預測值對目標小區的使用流量進行預測得到所述目標小區的使用流量預測值,其中,所述目標小區為所述預置范圍下所有小區中的任意一個小區。在本申請實施例中,在利用目標預測值對目標小區的使用流量預置值進行預測時,有多種方式進行預測,詳見下述實施例。
現針對上述核心思想,對本申請實施例一種流量預測方法進行詳細描述。
請參閱圖2,圖2為本申請實施例一種流量預測方法一個實施例流程示意圖,包括:
步驟101、對預置范圍內的小區進行分層以獲得樹形層級結構。
其中,上述預置范圍可以根據實際應用情況進行選擇,當然,在具體實現中,可以根據一些預測經驗圈定上述預設范圍,該預置范圍內包括待預測的目標小區。
另外,在本申請實施例中,可以有多種預置分層方式對上述預置范圍的所有小區進行分層,這里不做限定,下面將示例性的對本申請實施例提供的一些對預置范圍內的小區進行分層的方式進行描述:
在本申請的一些實施例中,對所述預置范圍內的小區進行分層以獲得樹形層級結構,包括:獲取小區工程參數;根據所述小區工程參數確定所述預置范圍內小區的網絡拓撲結構;將所述網絡拓撲結構作為所述樹形層級結構。
應理解,小區工程參數表中保存有各種各樣的小區工程參數信息,包括小區的網絡拓撲結構的具體分層情況,其中,小區工程參數包含有區域碼(area)、位置區碼(locationareacode,lac)、基站識別碼(site_id)以及小區識別碼(cell_id),根據上述小區工參參數可以對應得到預置范圍內小區的網絡拓撲結構。為了便于理解,以一個實際的例子為例進行說明,具體參閱圖3所示,圖3為一個小區工程參數一個示意圖,可以看出,區域碼為arbsc01的區域被分為位置區碼為3031和3033兩個位置區域,3031下又分為aru001和aru002的,aru001和aru002下再分具體的小區。根據圖3所示的示意圖,可以確定出圖3所示所有小區的網絡拓撲結構,應理解,小區的網絡拓撲結構呈現樹形層次關系,在本申請中,可以確定的小區的網絡拓撲結構作為本申請實施例中的樹形層級結構。另外需要說明的是,圖3在這里只是舉例說明,不對本申請做限定。
除了上述分層方式外,在本申請的一些實施例中,對所述預置范圍內的小區進行分層以獲得樹形層級結構,包括:獲取小區工程參數;根據所述小區工程參數確定所述預置范圍內各個小區的擬位置;根據所述各個小區的擬位置對所述預置范圍所有小區進行分層以獲得所述樹形層次結構。
在本方案中,為了使得對小區的分層結果更加合理,在本申請實施例的一些實施例,提出了另外一種分層方式,具體根據小區工程參數為預置范圍內的每個小區定義一個擬位置,利用定義的每個小區的擬位置生成小區的樹形層級結構。
其中,在本申請的一些實施例中,確定所述各個小區的擬位置,包括:
依據以下公式確定所述各個小區的擬位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,所述xsite、ysite分別為所述各個小區對應基站的經度、維度;所述xcell、ycell分別為所述各個小區的經度、維度,所述λ為預設數據,所述ptrx為所述基站的發射功率,所述h為所述各個小區的天線高度,所述α、θ分別為所述各個小區對應基站的天線下傾角、方向角。應理解,上述預設數據為經驗數據,具體由實際應用情況所獲得的經驗數據決定,這里不做限定。
經過上述公式,可以確定出預置范圍內各個小區的擬位置。
在本申請的一些實施例中,所述根據所述各個小區的擬位置對所述預置范圍內的小區進行分層以獲得所述樹形層級結構,包括:對所述各個小區的擬位置進行層次化聚類以獲得所述樹形層級結構。即在對各個小區的擬位置進行分層時,具體可以利用一些層次化聚類算法對生成的各個小區的擬位置進行分層以獲得樹形層級結構。需要說明的是,可以有多種層次化聚類算法對各個小區的擬位置進行分層以獲得樹形層級結構,這里不做限定。
示例性的,在本申請的一些實施例中,可以使用k-mean聚類方式對所述各個小區的擬位置進行層次化聚類以獲得所述樹形層級結構。示例性的,以一個實際例子為例,可以按照以下步驟進行聚類:
1、可以先設置需要的樹形層級結構的層數為l和分組數為n,其中,l和n都為正整數,首先使用k-mean聚類方式將小區的擬位置分為n組;
2、針對上述步驟獲得的n組中的每一組,繼續使用k-mean聚類方式分為n組,其中,如果某組內小區的數目小于n,則不再進行劃分;
3、重復步驟2,直至達到總的層數l獲得預置范圍內小區的樹形層級結構。
在本申請的一些實施例中,還可以使用譜聚類方式對所述各個小區的擬位置進行分層以獲得所述樹形層級結構,具體此處不限定,也不贅述。
上述提出了兩種根據預置分層方式對所述預置范圍內的小區進行分層以獲得樹形層級結構的方式,其中一種是基于小區的位置關系進行分層的方式,在本申請實施例中,還可以通過以下分層方式進行分層:
根據話單記錄對所述預置范圍內所有小區進行分層以獲得所述樹形層級結構。
在本申請的一些實施例中,根據話單記錄記錄對所述預置范圍內所有小區進行分層以獲得所述樹形層級結,包括:獲取話單記錄;根據所述話單記錄獲取訓練樣本;將所述訓練樣本展開為目標根向量;對所述目標根向量進行層次化聚類以獲得所述樹形層級結構。舉例說明,應理解,話單記錄中的記錄為形如<time,user,cell,traffic>的元組,在本申請實施例中,可以聚合為形如<user,cell,traffic>的記錄,其中,聚合后的traffic字段表示在某段時間內,某一終端設備在某一小區發生的歷史總使用流量。這里,可以聚合獲得的預置范圍內各個小區的<user,cell,traffic>的記錄作為訓練樣本,在本申請中,可以對獲得的訓練樣本進行預處理得到最終的訓練樣本。其中,上述預處理可以包括以下至少一種處理方式:1、刪除聚合獲得的訓練樣本中,traffic過低的訓練樣本,示例性的,可以去掉traffic小于1mb(兆)的訓練樣本,具體不做限定;2、對聚合獲得的訓練樣本中,對每個訓練樣本的traffic加1后再取對數處理。在獲得了訓練樣本后,將所述訓練樣本展開為目標根向量<cell,traffic_of_user_1,traffic_of_user_2,…,traffic_of_user_n>,再對獲得的目標根向量進行層次化聚類以獲得所述樹形層級結構。
在本申請的一些實例中,所述對所述目標根向量進行層次化聚類以獲得所述樹形層級結構,包括:使用bi-clustering聚類方式對所述目標根向量進行層次化聚類以獲得所述樹形層級結構。需要說明的是,這里是基于目標根向量進行聚類,主要是用于把預置范圍內,把小區和終端設備分為若干簇,并且這兩者之間的簇,呈一一對應關系。舉例說明,假設存在a終端設備簇,a小區簇,a終端設備簇和a小區簇為一一對應關系,那么說明a終端設備簇的下的終端設備會頻繁出現在該a小區簇下的小區中。
另外需要說明的是,在本申請實施例中,可以有多種層次化聚類算法對目標根向量進行分層以獲得樹形層級結構,這里不做限定,例如,還可以使用譜聚類方式對目標根向量進行分層以獲得樹形層級結構。
步驟102、確定所述樹形層級結構中,根節點下所有小區的歷史總使用流量數據。
在本申請實施例中,在按照步驟101所描述的分層方式對預置范圍內的小區進行分層獲得樹形層級結構后,可以確定該樹形層級結構中,根節點下所有小區的歷史總使用流量。可以理解,確定該樹形層級結構中,根節點下所有小區的歷史總使用流量數據,實際就是確定預置范圍內所有小區的歷史總使用流量數據。
這里需要說明的是,這里所描述的根節點下所有小區的歷史總使用流量數據是指先前某段預設時間內,根節點下所有小區的歷史使用流量總量數據。示例性的,這個預設時間可以是一個月前,或3個月前,或6個月前,或者一年前,具體此處不做限定。在實際應用中,可以根據需求確定需要獲取所需的根節點下所有小區的歷史使用流量數據。
步驟103、根據所述根節點下所有小區的歷史總使用流量數據,使用第一預測模型對所述根節點下所有小區的總使用流量進行預測以獲得目標預測值。
在獲得了根據所述根節點下所有小區的歷史總使用流量后,可以使用第一預測模型對所述根節點下所有小區的總使用流量進行預測以獲得目標預測值。
其中,第一預測模塊可以是時間序列模型進行預測,常見的時間序列模型有自回歸模型(autoregressive,ar)和向量自回歸模型(vectorautoregressive,var),通過上述時間序列模型可以尋找時間序列前后數值之間的相關性,可以從過去推測未來,從而可以根據之前的流量使用情況推測出未來的流量使用情況。因此,在本申請實施例中,可以使用上述預測模型進行預測得到目標預測值。當然,除了使用時間序列模型,還可以有其他的回歸模型,具體此處不做限定。
步驟104、根據所述目標預測值對目標小區的使用流量進行預測得到目標小區的使用流量預測值,其中,所述目標小區為所述根節點下所有小區中的任意一個小區。
其中,在本申請的實施例中,根據所述目標預測值對目標小區的使用流量進行預測得到目標小區的使用流量預測值,包括:
根據所述樹形層級結構中,第一節點下所有小區的總使用流量預測值以及第二節點下所有小區的歷史總使用流量數據,使用第二預測模型對第二節點下所有小區的總使用流量進行預測,所述第二節點為所述第一節點的下級節點,這里需要說明的是,這里所說的第一節點,是指第二節點上的所有上級節點,包括與第二節點相連的每一級節點,為了便于理解,這里以一個樹形層級結構為例對第一節點和第二節點的關系進行說明,請參閱圖4所示。其中,當所述第一節點為所述根節點時,所述第一節點下所有小區的總使用流量預測值為所述目標預測值;當確定了第三節點下所有小區的總使用流量預測值后,根據所述第三節點下所有小區的總使用流量預測值、和所述第三節點的上級節點中各個節點下所有小區的總使用流量預測值以及所述目標小區的歷史總使用流量數據,使用所述第二預測模型對所述目標小區的使用流量進行預測以得到目標小區的使用流量預測值,所述目標小區為所述第三節點下的小區。
示例性的,第二預測模型可以采用時間序列模型,例如,可以是ar預測模型、var預測模型,這里不做限定。當然,除了使用時間序列模型,還可以有其他的回歸模型,具體此處不做限定。
為了便于理解上述預測過程,下面以根據網絡拓撲獲得的樹形層級結構為例,以一個實際的例子,對上述根據所述目標預測值對目標小區的使用流量(設為1個月后的使用流量)進行預測的過程進行描述:假設現有小區aru001a,其對應的基站為aru001,位置區碼為3031,區域碼為arbsc01。先從頂層(根節點)開始,基于arbsc01的所有小區的歷史使用流量(假設arbsc01下有10000個小區),利用時間序列模型預測aru001a在一個月后的使用流量得到目標預測值。完成后,基于3031下的所有小區流量(假設3031下有500個小區),再加上剛剛得到的arbsc01的目標預測值,預測3031在一個月后的使用流量。完成后,基于aru001下的所有小區的歷史使用流量(假設有10個),在加上目標預測值、3031下所有小區的使用流量的預測值,使用時間序列模型預測aru001下所有小區在一個月后的使用流量,完成后,基于小區aru001a的歷史使用流量,再加上目標預測值、3031和aru001下所有小區的在一個月后的使用流量的預測值,接著再使用時間序列模型再對小區aru001a的使用流量進行預測,得到小區aru001a在一個月后的使用流量預測值。
由此可見,對于任意一個待預測小區而言,在對每個待預測小區進行預測時,根據計算出來的預置范圍下所有小區的使用流量的目標預測值進行預測即可,抑制了對小區預測時的預測模型復雜度,且該目標預測值考慮到了預置范圍內所有小區預測得到的,不是將小區進行分組,將預測參考小區的數目局限在部分小區,有效地減少了小區的使用流量的預測值誤差。
需要說明的是,在本申請實施例中,還提供了另一種流量預測方法,請參閱圖5,該方法包括:
步驟201、對所述預置范圍內的小區進行分層以分別獲得第一樹形層級結構、第二樹形層級結構以及第三樹形層級結構。
其中,上述第一樹形層級結構、第二樹形層級結構以及第三樹形層級結構分別為根據不同的分層方式得到。在本申請的一些實施例中,上述第一樹形層級結構、第二樹形層級結構以及第三樹形層級結構分別可為前束實施例描述的預置分層方式對預置范圍內的小區進行分層以獲得。具體可以參閱前述實施例的描述,這里不再一一重復贅述。示例性的,這里為了便于描述,假設第一樹形層級結構為根據預置范圍內的小區的網絡拓撲結構得到的樹形層級結構,第二樹形層級結構為根據預置范圍內各個小區的擬位置得到的樹形層級結構,而第三樹形層級結構為根據話單記錄得到的樹形層級結構。
另外,上述預置范圍可以根據實際應用情況進行選擇,當然,在具體實現中,可以根據一些預測經驗圈定上述預設范圍,該預置范圍內包括待預測的目標小區。
步驟202、基于所述第一樹形層級結構、第二樹形層級結構以及第三樹形層級結構對目標小區的使用流量進行預測以分別獲得第一預測值、第二預測值和第三預測值,所述目標小區為所述預置范圍內的任意一個小區。
具體的關于第一樹形層級結構、第二樹形層級結構以及第三樹形層級結構中,每種樹形層級結構下,怎么對目標的使用流量進行預測的過程可以參閱前述描述,這里不再贅述。
203、根據第一預測值、第二預測值和第三預測值得到目標小區的使用流量預測值。
在本申請實施例中,在分別根據上述樹形層級結構第一預測值、第二預測值以及第三預測值這3個預測值后,可以對這三者進行融合,以獲得最終的目標小區的使用流量預測值,目的在于選出一個預測誤差最小的預測值作為目標小區的使用流量預測值。這里,可以有多種確定方式,只要使得能選出一個預測誤差最小的預測值作為目標小區的使用流量預測值即可,具體的方式這里不做限定。
根據所述第一預測值、第二預測值和第三預測值得到所述目標小區的使用流量預測值之前,所述方法還包括:
確定預設時段內所述目標小區的歷史使用流量數據的加權平均值;
其中,預設時段可以根據實際情況進行選擇,示例性的,可以是一個月前,、或3個月前,或6個月前,或者一年前,具體此處不做限定。
確定預設時段內所述目標小區的歷史使用流量數據的加權平均值,包括:
以所述第一預測值、第二預測值、第三預測值以及所述小區工程參數為輸入,所述加權平均值為標簽,基于隨機森林算法進行融合,得到所述目標小區的使用流量預測值。其中,示例性的,在基于隨機森林算法進行融合時小區工程參數可以取頻點信息作為輸入,具體此處不做限定。
在本申請實施例的一些實施例中,所述確定預設時段內所述目標小區的歷史使用流量數據的加權平均值,包括:對所述預設時段內的目標小區的n個歷史使用流量數據點進行異常檢測,所述n為正整數,所述n大于或等于2;通過所述異常檢測后獲得所述預設時段內,所述歷史使用流量數據點的n個異常系數;根據所述n個異常系數確定所述n個歷史使用流量數據點對應的權重;根據所述n個歷史使用流量數據點對應的權重確定所述目標小區在預設時段內的歷史使用流量的加權平均值。
其中,在本申請的一些實施例中,通過所述異常檢測后獲得所述預設時段內,每個歷史使用流量數據點的異常系數是指對每個歷史使用流量數據點的大小進行異常檢測每個歷史使用流量數據點的異常系數e。異常系數e,表示該歷史使用數據點的大小有多么異常(例如離均值遠),越異常,則異常系數也越大。
在本申請的一些實施例中,根據所述每個歷史使用流量數據點的異常系數確定每個歷史使用流量數據點的權重可以通過以下公式確定:權重=異常系數e,或權重=異常系數e*可解釋比例r。
其中,該可解釋比例可以通過以下方式獲得:以每個歷史使用流量數據點的傳輸速率為輸入,進行線性回歸,對應得到每個歷史使用流量數據點的誤差百分比f,設1-f為每個歷史使用流量數據點的范圍為0-1之間的解釋比例r。由此可見,可解釋比例定義了歷史使用流量數據點的異常與傳輸速率變化有沒有關系,越有關系,則越應該關注,對應計算的權重則越大。通過可解釋比例r計算每個歷史使用數據點的權重,這里要生成的加權平均值,實際為預設時段內流量值的加權平均。w定義了權重的分布。如果直接取平均,以預設時段為一個月為例,那么每天的權重均為1/30;如果直接取最大,則只有某一天為1,而其他都是0。這里的通過可解釋比例的做法為兩種做法的折衷。
在本申請實施例的一些實施例中,所述根據所述n個歷史使用流量數據點對應的權重確定所述目標小區在預設時段內的歷史使用流量的加權平均值,包括:將所述n個歷史使用流量數據點對應的權重進行加權平均以得到所述目標小區在預設時段內的歷史使用流量數據的加權平均值。
從以上技術方案可以看出,還提出了一種根據不同樹形層級結構的目標小區的使用流量預測值確定出最佳預測值的方法,更加有效地減少了小區的使用流量的預測誤差。
需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領域技術人員應該知悉,本申請并不受所描述的動作順序的限制,因為依據本申請,某些步驟可以采用其他順序或者同時進行。其次,本領域技術人員也應該知悉,說明書中所描述的實施例均屬于示例性實施例,所涉及的動作和模塊并不一定是本申請所必須的。
為便于更好的實施本申請上述實施例中所描述的方案,下面還提供用于實施上述方案的相關裝置。
請參閱圖6,本申請實施例提供了一種流量預測裝置,包括獲取模塊101、第一預測模塊102以及第二預測模塊103。
其中,獲取模塊101,用于獲取預置范圍內,所有小區的歷史總使用流量數據;
第一預測模塊102,用于將所述所有小區的歷史總使用流量數據作為輸入,使用第一預測模型對所述獲取模塊101獲取的所述預置范圍內所有小區的總使用流量進行預測以獲得目標預測值;
第二預測模塊103,用于根據所述第一預測模塊102預測的所述目標預測值對目標小區的使用流量進行預測得到所述目標小區的使用流量預測值,其中,所述目標小區為所述預置范圍內的任意一個小區。
從以上技術方案可以看出,對于任意一個待預測小區而言,在對每個待預測小區進行預測時,根據計算出來的預置范圍下所有小區的使用流量的目標預測值進行預測即可,抑制了對小區預測時的預測模型復雜度,且該目標預測值考慮到了預置范圍內所有小區預測得到的,不是將小區進行分組,將預測參考小區的數目局限在部分小區,有效地減少了小區的使用流量的預測值誤差。
請參閱圖7,在本申請實施例的一些實施例中,所述裝置還包括:
分層模塊104,用于對所述預置范圍內的小區進行分層以獲得樹形層級結構;
第二預測模塊103用于根據所述第一預測模塊102預測的所述目標預測值對目標小區的使用流量進行預測得到所述目標小區的使用流量預測值,包括:
所述第二預測模塊103,用于根據所述樹形層級結構中,第一節點下所有小區的總使用流量預測值以及第二節點下所有小區的歷史總使用流量數據,使用第二預測模型對所述第二節點下所有小區的總使用流量進行預測,所述第二節點為所述第一節點的下級節點,其中,當所述第一節點為所述根節點時,所述第一節點下所有小區的總使用流量預測值為所述第一預測模塊102預測的所述目標預測值;
當確定了第三節點下所有小區的使用流量預測值后,用于根據所述第三節點下所有小區的總使用流量預測值、和所述第三節點的上級節點中各個節點下所有小區的總使用流量預測值以及所述目標小區的歷史總使用流量數據,使用所述第二預測模型對所述目標小區的使用流量進行預測得到所述目標小區的使用流量預測值,所述目標小區為所述第三節點下的小區。
在本申請的一些實施例中,所述分層模塊104用于對所述預置范圍內的小區進行分層以獲得樹形層級結構包括:
所述分層模塊104用于:
獲取小區工程參數;
根據所述小區工程參數確定所述預置范圍內小區的網絡拓撲結構;
將所述網絡拓撲結構作為所述樹形層級結構。
在本申請的一些實施例中,所述分層模塊104用于對所述預置范圍內的小區進行分層以獲得樹形層級結構包括:
所述分層模塊104用于:
依據以下公式確定所述預置范圍內各個小區的擬位置(xcell、ycell):
xcell=xsite*(λ*ptrx)*h*sin(α)*cos(θ);
ycell=ysite*(λ*ptrx)*h*sin(α)*sin(θ);
其中,所述xsite、ysite分別為所述各個小區對應基站的經度、維度;所述xcell、ycell分別為所述各個小區的經度、維度,所述λ為預設數據,所述ptrx為所述基站的發射功率,所述h為所述各個小區的天線高度,所述α、θ分別為所述各個小區對應基站的天線下傾角、方向角;
根據所述各個小區的擬位置對所述預置范圍內所有小區進行分層以獲得所述樹形層級結構。
在本申請的一些實施例中,所述分層模塊104用于根據所述各個小區的擬位置對所述預置范圍內所有小區進行分層以獲得所述樹形層級結構,包括:
所述分層模塊104,用于對所述各個小區的擬位置進行層次化聚類以獲得所述樹形層級結構。
在本申請的一些實施例中,所述分層模塊104用于對所述各個小區的擬位置進行層次化聚類以獲得所述樹形層級結構,包括:
所述分層模塊104,用于使用k-mean聚類方式對所述各個小區的擬位置進行層次化聚類以獲得所述樹形層級結構。
在本申請的一些實施例中,所述分層模塊104用于根據預置分層方式對所述預置范圍內的小區進行分層以獲得樹形層級結構包括:
所述分層模塊104具體用于:
獲取話單記錄;
根據所述話單記錄獲取訓練樣本;
將所述訓練樣本展開為目標根向量;
對所述目標根向量進行層次化聚類以獲得所述樹形層級結構。
在本申請的一些實施例中,所述分層模塊104用于根據所述話單記錄獲取訓練樣本,包括:
所述分層模塊104用于:
查詢所述話單記錄得到在所述預設范圍內的每個小區中,所有終端設備的流量記錄信息;
將所述流量記錄信息作為所述訓練樣本。
在本申請的一些實施例中,所述分層模塊104用于對所述目標根向量進行層次化聚類以獲得所述樹形層級結構,包括:
所述分層模塊104,用于使用bi-clustering聚類方式對所述目標根向量進行層次化聚類以獲得所述樹形層級結構。
請參閱圖8,在本申請的一些實施例中,所述第二預測模塊103用于:
基于第一樹形層級結構、二樹形層級結構以及第三樹形層級結構對所述目標小區的使用流量進行預測以分別獲得第一預測值、第二預測值和第三預測值,其中,所述第一樹形層級結構為根據所述網絡拓撲結構獲得的樹形層級結構,所述第二樹形層級結構為根據所述擬位置獲得的樹形層級結構,所述第三樹形層級結構為根據所述話單記錄獲得的樹形層級結構;
所述裝置還包括:
第三預測模塊105,用于根據所述第二預測模塊103預測的所述第一預測值、第二預測值和第三預測值得到所述目標小區的使用流量預測值。
在本申請的一些實施例中,所述裝置還包括確定模塊106;
所述確定模塊106,用于在所述第三預測模塊根據所述第二預測模塊103預測的所述第一預測值、第二預測值和第三預測值得到所述目標小區的使用流量預測值之前,確定預設時段內所述目標小區的歷史使用流量數據的加權平均值;
所述第三預測模塊105用于根據所述第二預測模塊103預測的所述第一預測值、第二預測值和第三預測值得到所述目標小區的使用流量預測值,包括:
所述第三預測模塊105,用于以所述第一預測值、第二預測值、第三預測值以及所述小區工程參數為輸入,所述加權平均值為標簽,基于隨機森林算法進行融合,得到所述目標小區的使用流量預測值。從以上技術方案可以看出,還提出了一種根據不同樹形層級結構的預測值進行融合以確定出最佳預測值的流量預測裝置,更加有效地有效地減少了小區的使用流量的預測誤差。
在本申請的一些實施例中,所述確定模塊106用于確定預設時段內所述目標小區的歷史使用流量數據的加權平均值包括:
所述確定模塊106具體用于:
對所述預設時段內的目標小區的n個歷史使用流量數據點進行異常檢測,所述n為正整數,所述n大于或等于2;
通過所述異常檢測后獲得所述預設時段內,所述歷史使用流量數據點的n個異常系數;
根據所述n個異常系數確定所述n個歷史使用流量數據點對應的權重;
根據所述n個歷史使用流量數據點對應的權重確定所述目標小區在預設時段內的歷史使用流量的加權平均值。
在本申請的一些實施例中,所述確定模塊106用于所述根據所述n個歷史使用流量數據點對應的權重確定所述目標小區在預設時段內的歷史使用流量的加權平均值,包括:
將所述n個歷史使用流量數據點對應的權重進行加權平均以得到所述目標小區在預設時段內的歷史使用流量數據的加權平均值。
需要說明的是,上述裝置各模塊/單元之間的信息交互、執行過程等內容,由于與本申請實施例中的方法實施例基于同一構思,其帶來的技術效果與本申請方法實施例相同,具體內容可參見本申請前述所示的方法實施例中的敘述,此處不再贅述。
本申請實施例還提供一種計算機存儲介質,其中,該計算機存儲介質存儲有程序,該程序被計算機執行時能實現上述方法實施例中記載的部分或全部步驟。
請參閱圖9,本申請實施例提供一種計算機設備,該計算機設備可以作為上述流量預測裝置,實現上述流量預測裝置的方法,該計算機設備300包括:
處理器301、存儲器302、和存儲在存儲器上并可在處理器上運行的計算機程序(其中,計算機設備300中的處理器301的數量可以一個或多個,圖9中以一個處理器為例)。在本申請的一些實施例中,該計算機設備還可以包括通信端口303、其中,通信端口303、處理器301和存儲器302可通過總線或其它方式連接,具體此處不做限定,其中,圖8中以通過總線連接為例進行示例說明。
存儲器302還可以包括只讀存儲器和隨機存取存儲器,并向處理器301提供指令和數據。存儲器302的一部分還可以包括非易失性隨機存取存儲器(non-volatilerandomaccessmemory,nvram)。存儲器302存儲有操作系統和操作指令、可執行模塊或者數據結構,或者它們的子集,或者它們的擴展集,其中,操作指令可包括各種操作指令,用于實現各種操作。操作系統可包括各種系統程序,用于實現各種基礎業務以及處理基于硬件的任務。
處理器301控制計算機設備300的操作,處理器301還可以稱為中央處理單元(centralprocessingunit,cpu)。具體的應用中,計算機設備的各個組件通過總線系統耦合在一起,其中總線系統除包括數據總線之外,還可以包括電源總線、控制總線和狀態信號總線等。但是為了清楚說明起見,在圖中將各種總線都稱為總線系統。
上述本申請實施例揭示的方法可以應用于處理器301中,或者由處理器301實現。處理器301可以是一種集成電路芯片,具有信號的處理能力。在實現過程中,上述方法的各步驟可以通過處理器301中的計算機程序完成。上述的處理器301可以是通用處理器、數字信號處理器(digitalsignalprocessing,dsp)、專用集成電路(application-specificintegratedcircuit,asic)、現場可編程門陣列(field-programmablegatearray,fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件。可以實現或者執行本申請實施例中的公開的各方法、步驟及邏輯框圖。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。結合本申請實施例所公開的方法的步驟可以直接體現為硬件譯碼處理器執行完成,或者用譯碼處理器中的硬件及軟件模塊組合執行完成。軟件模塊可以位于隨機存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領域成熟的存儲介質中。該存儲介質位于存儲器302,處理器301讀取存儲器302中的計算機程序,結合其硬件完成上述方法的步驟。
通信端口303可用于接收或者發送信令/信息,例如用于接收小區工程參數。
本申請實施例中,處理器301,用于執行前述流量預測方法。
還需要說明的是,在上述實施例中,可以全部或部分地通過軟件、硬件、固件或者其任意組合來實現。當使用軟件實現時,可以全部或部分地以計算機程序產品的形式實現。
所述計算機程序產品包括一個或多個計算機指令。在計算機上加載和執行所述計算機程序指令時,全部或部分地產生按照本發明實施例所述的流程或功能。所述計算機可以是通用計算機、專用計算機、計算機網絡、或者其他可編程裝置。所述計算機指令可以存儲在計算機可讀存儲介質中,或者從一個計算機可讀存儲介質向另一計算機可讀存儲介質傳輸,例如,所述計算機指令可以從一個網站站點、計算機、服務器或數據中心通過有線(例如同軸電纜、光纖、數字用戶線(dsl))或無線(例如紅外、無線、微波等)方式向另一個網站站點、計算機、服務器或數據中心進行傳輸。所述計算機可讀存儲介質可以是計算機能夠存儲的任何可用介質或者是包含一個或多個可用介質集成的服務器、數據中心等數據存儲設備。所述可用介質可以是磁性介質,(例如,軟盤、硬盤、磁帶)、光介質(例如,dvd)、或者半導體介質,例如固態硬盤(solidstatedisk,ssd)等。
另外需說明的是,以上所描述的裝置實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部模塊來實現本實施例方案的目的。另外,本申請提供的裝置實施例附圖中,模塊之間的連接關系表示它們之間具有通信連接,具體可以實現為一條或多條通信總線或信號線。
在本申請所提供的幾個實施例中,應該理解到,所揭露的系統,模塊和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述模塊的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或組件可以結合或者可以集成到另一個系統,或一些特征可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網絡單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。
通過以上的實施方式的描述,所屬領域的技術人員可以清楚地了解到本申請可借助軟件加必需的通用硬件的方式來實現,當然也可以通過專用硬件包括專用集成電路、專用cpu、專用存儲器、專用元器件等來實現。一般情況下,凡由計算機程序完成的功能都可以很容易地用相應的硬件來實現,而且,用來實現同一功能的具體硬件結構也可以是多種多樣的,例如模擬電路、數字電路或專用電路等。但是,對本申請而言更多情況下軟件程序實現是更佳的實施方式。基于這樣的理解,本申請的技術方案本質上或者說對現有技術做出貢獻的部分可以以軟件產品的形式體現出來,該計算機軟件產品存儲在可讀取的存儲介質中,如計算機的軟盤、u盤、移動硬盤、只讀存儲器、隨機存取存儲器、磁碟或者光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行本申請各個實施例所述的方法。
以上所述,以上實施例僅用以說明本申請的技術方案,而非對其限制;盡管參照前述實施例對本申請進行了詳細的說明,本領域的普通技術人員應當理解:其依然可以對前述各實施例所記載的技術方案進行修改,或者對其中部分技術特征進行等同替換;而這些修改或者替換,并不使相應技術方案的本質脫離本申請各實施例技術方案的精神和范圍。