用于在地理分布數據中心中降低延遲和改善彈性的優化機制的制作方法
【專利摘要】一種將負荷從云計算網絡中的一個數據中心站點重新分配至其它數據中心站點的方法。所述負荷是基于定義了云計算網絡在每個數據中心站點處的性能特征的目標函數而被重新分配的。所述方法為其它數據中心站點的組合中的每一個評估導數;基于評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分增加時,該數據中心站點對目標函數的影響最小;并且基于評估的導數和所識別的其它數據中心站點在數據中心站點和其它數據中心站點之間重新分配負荷。
【專利說明】用于在地理分布數據中心中降低延遲和改善彈性的優化機制
【技術領域】
[0001]在此公開的各種典型實施方式一般涉及用于在地理分布數據中心中降低延遲和改善彈性的優化機制。
【背景技術】
[0002]云計算是將計算基礎設施(例如,服務器,存儲器和系統軟件)轉移到網絡設施上以降低成本的范例。服務通過互聯網或任何其它網絡傳遞給終端用戶。托管計算基礎設施的設施通常稱為數據中心,也稱為云。數據中心的優勢是可以大規模地匯集計算資源,由此即使在突發事件下也可以對瞬間流量需求做出有效響應。術語“彈性”通常用于描述云提供商根據業務負荷為給定用戶增加或縮減其資源(例如,服務器的數量)的能力。動態分配至給定終端用戶的資源能夠以按使用付費的模式提供,從而用戶主要關心的是業務費用而非基礎建設費用。
[0003]目前,云提供商的突出例子包括亞馬遜EC2、微軟Azure和谷歌應用引擎。盡管無法公開地得到詳細數據,但是這些云通常包括幾個位于不同地點的大型數據中心。這種具有散布于大地理區域(國家)中的幾個位置的數據中心可以稱為集中式數據中心。在典型部署中,每個數據中心可以托管數以萬計或更多的服務器。這些集中式的數據中心通過統計復用可以實現彈性,并獲取無限能力。由于可能只有幾個大型數據中心,它們的位置無法靠近終端用戶。結果,遠離數據中心的用戶可能會遭受無法接受的延遲。如果具有許多較小的數據中心(每個站點上千臺或更少服務器),站點的位置可以離終端用戶近得多。但是,當出現云提供商無法預測的需求激增時,使用較小數據中心進行適當供應就可能無法實現或成本太高。
【發明內容】
[0004]因此,可以開發用于建設適用于電話公司(telco)環境的新型云計算系統的技術和方法,因為電話公司和其它類似服務提供商可以使用現有基礎設施來提供云計算。電話公司和其它類似服務提供商具有“最后一公里”優勢。不同于傳統的云計算提供商,電話公司可以利用成千的中心局(CO)的大量不動產資產來托管計算基礎設施。電話公司的另一個優勢是它們還擁有“最后一公里”,因此具有提供要求低延遲的關鍵任務服務的巨大優勢。
[0005]此外,基于電話公司的云計算可以利用低成本建筑物來實現。研究調查了 CO中不同組件的電力消耗。這些研究顯示,5級TDM電話交換機在CO中功耗最大,占設備總功耗的43%。此外,這些交換機體積龐大,占據了 CO的很大面積。典型CO中的電話交換機的功耗估計是53KW。如果服務器的平均功耗為大約100W,這就相當于托管了大約500個服務器。眾所周知,手機的廣泛使用對固定電話產生了巨大沖擊。根據國家衛生統計中心自2009年12月起的數據,每四個美國人中就有一個放棄使用固定電話。結果,看起來電話交換機最終將退休并可能被服務器取代,將CO轉變為小型或中型數據中心。
[0006]因此,分布式數據中心似乎提供了非常具有吸引力的電話公司云方案,因為每個數據中心站點可以服務它附近的終端用戶。不幸的是,這種具有少量服務器的數據中心可能不會具有更大型云計算系統所具有的彈性。因此,仍然需要具有負荷重新分配的分布式數據中心。當給定數據中心接收到超過其本地所能處理的需求時,系統可以將需求的一部分重新分配(reallocate)給一個或多個遠程數據中心。由于由遠程數據中心處理的工作可能會需要本地數據中心和遠程數據中心之間的額外往返時間,系統也可以選擇合適的遠程數據中心位置以使延遲(終端用戶所感知的響應時間)最小化,或達到其它所需的性能特征。
[0007]下面是各種典型實施方式的簡要概括。在下面的概括中可能會做一些簡化或省略,這樣做的目的是為了突出和介紹各種典型實施方式的一些方面,但是不對本發明的保護范圍構成限制。在接下來的部分中對優選典型實施方式進行詳細描述,這些詳細描述足以使本領域技術人員能夠開發并使用本發明的概念。
[0008]各種典型實施方式涉及一種利用目標函數(function)和目標函數(derivative)的導數將負荷從云計算網絡中的一個數據中心站點重新分配至其它數據中心站點的方法,目標函數定義了云計算網絡在每個數據中心站點處的性能特征,該方法包括:為其它數據中心站點的集合中的每一個評估導數;基于評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分(fraction)增加時,該數據中心站點對目標函數的影響最小;基于評估的導數和所識別的其它數據中心站點在數據中心站點和其它數據中心站點之間重新分配負荷。合格的數據中心站點(允許將負荷發送至給定站點或從給定站點接收負荷的數據中心站點)可以包括:⑴所有站點,⑵相鄰站點的集合,
(3)預配置站點的集合,或(4)由分布式方法動態確定的站點的集合。
[0009]各種典型實施方式涉及一種利用目標函數和目標函數的導數將云計算網絡中一個數據中心站點處的負荷重新分配至其它數據中心站點的方法,目標函數定義了云計算網絡在每個數據中心站點處的性能特征,該方法包括:為其它數據中心站點的集合中的每一個評估導數;基于評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分減少時,該數據中心站點對目標函數的改善最大;基于評估的導數和所識別的其它數據中心站點在數據中心站點和其它數據中心站點之間重新分配負荷。
[0010]各種典型實施方式涉及一種利用目標函數和目標函數的導數將負荷從云計算網絡中的一個數據中心站點重新分配至其它數據中心站點的方法,目標函數定義了云計算網絡在每個數據中心站點處的性能特征,該方法包括:確定數據中心站點是否過載;如果數據中心站點過載,則執行以下步驟:為其它數據中心站點的集合中的每一個評估導數;基于評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分減少時,該數據中心站點對目標函數的改善最大;基于評估的導數和所識別的其它數據中心站點在數據中心站點和其它數據中心站點之間重新分配負荷;如果數據中心站點未過載,則執行以下步驟:為其它數據中心站點的集合中的每一個評估導數;基于評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分增加時,該數據中心站點對目標函數的影響最小;基于評估的導數和所識別的其它數據中心站點在數據中心站點和其它數據中心站點之間重新分配負荷。
【專利附圖】
【附圖說明】
[0011]為了更好地理解各種示例性實施方式,對附圖進行參考,其中:
[0012]圖1和2顯示了具有5個數據中心的云系統;
[0013]圖3顯示了另一個例子的數據中心拓撲結構;
[0014]圖4顯示了三個備選方案的標準化延遲和利用率圖示;
[0015]圖5顯示了三個備選方案的延遲,其中每次試驗中都有負荷變化;
[0016]圖6是顯示了上述方法的操作的流程圖;
[0017]圖7是顯示了方法的另一個實施方式的操作的流程圖,該操作優化了等式⑴所示的目標函數。
[0018]為促進理解,相同的附圖標記可以用于指代具有基本上相同或相似的結構和/或基本上相同或相似的功能的元素。
【具體實施方式】 [0019]根據其應用,工作被數據中心以不同的方式處理。一般來講,應用可以根據其資源要求分類如下:(1)處理密集型,(2)帶寬密集型或(3)存儲密集型。內容分發是帶寬密集型和存儲密集型的一個例子。互聯網搜索是處理密集型和存儲密集型的一個例子。控制平面中見到的電話公司服務通常都是處理密集型的。下面的實施方式幾種于處理密集型的應用。假定每個數據中心i(i = I,...N)每時間單位從終端用戶接受類型_k工作,可以確定要本地處理的工作的部分和遠程處理的工作的部分,以優化給定的目標函數。取決于用戶和云提供商之間的服務水平協議(SLA),不同的應用可能會涉及不同的指標。延遲是一個重要指標,其影響用戶體驗,并在文獻中被廣泛考慮。可以假設每個數據中心上的負荷是相對靜態的,并為負責解決優化問題的實體所知。盡管下面描述了用于使加權平均延遲最小化的目標函數,但是還可以使用其它目標函數來使任意的所需性能指標最小化或最大化。
[0020]問題可以轉化為具有凸(convex)目標函數的非線性程序。決策變量或重新分配矩陣表示將從站點i重新分配到站點j的類型_k工作負荷的部分。假定工作可以全部由本地數據中心或遠程數據中心處理。如果工作由遠程數據中心處理,則可能在兩個站點i和j之間存在提交工作和獲得響應的額外往返延遲,其由表示。使加權平均延遲最小化的優化問題可以限定如下:
【權利要求】
1.一種利用目標函數和該目標函數的導數將負荷從云計算網絡中的一個數據中心站點重新分配至其它數據中心站點的方法,所述目標函數定義了所述云計算網絡在每個數據中心站點處的性能特征,所述方法包括: 為所述其它數據中心站點的集合中的每一個數據中心站點評估導數; 基于所評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分增加時,該數據中心站點對所述目標函數的影響最小;以及 基于所評估的導數和所識別的其它數據中心站點在所述數據中心站點和所述其它數據中心站點之間重新分配負荷。
2.一種利用目標函數和該目標函數的導數將云計算網絡中的一個數據中心站點處的負荷重新分配至其它數據中心站點 的方法,所述目標函數定義了所述云計算網絡在每個數據中心站點處的性能特征,所述方法包括: 為所述其它數據中心站點的集合中的每一個數據中心站點評估導數; 基于所評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分減少時,該數據中心站點對所述目標函數的改善最大;以及 基于所評估的導數和所識別的其它數據中心站點在所述數據中心站點和所述其它數據中心站點之間重新分配負荷。
3.如權利要求1和2中任意一項所述的方法,該方法進一步包括在重新分配負荷之后確定所述重新分配是否收斂到重新分配的解上。
4.如權利要求1至3中任意一項所述的方法,其中,如果所述重新分配未收斂到重新分配的解上,則重復評估所述導數、識別數據中心站點、重新分配負荷、并確定所述重新分配是否收斂。
5.如權利要求1至3中任意一項所述的方法,其中確定重新分配是否收斂到重新分配的解上包括: 計算所識別的數據中心站點的導數與所述其它數據中心站點中每一個數據中心站點的導數之間的多個差值;以及 確定所述多個差值中的每一個差值是否低于閾值。
6.如權利要求1至5中任意一項所述的方法,其中,如果所述數據中心站點檢測到延遲或利用率的變化,則重復評估所述導數、識別數據中心站點、重新分配負荷、并確定所述重新分配是否收斂。
7.如權利要求1至6中任意一項所述的方法,其中, 重新分配矩陣限定所述數據中心站點與所述其它數據中心站點之間的負荷的重新分配,并且 重新分配負荷包括計算重新分配調整矩陣、并對所述重新分配矩陣和重新分配調整矩陣求和。
8.如權利要求1至7中任意一項所述的方法,其中評估所述導數包括: 從其它數據中心站點的集合中的每一個數據中心站點接收負荷參數; 從其它數據中心站點的集合中的每一個數據中心站點接收服務率參數;以及 接收所述其它數據中心站點中的每一個數據中心站點的延遲參數,該延遲參數限定了所述數據中心站點與所述其它數據中心站點中的每一個數據中心站點之間的延遲,其中所評估的導數基于所述負荷參數、服務率參數和延遲參數。
9.如權利要求1至8中任意一項所述的方法,進一步包括計算初始重新分配矩陣,該初始重新分配矩陣限定所述數據中心站點與所述其它數據中心站點之間的負荷的重新分配。
10.如權利要求1至9所述的方法,其中所述其它數據中心站點的集合是以下之一: 位于所述數據中心站點的指定距離內的所有其它數據中心站點; 鄰近所述數據中心站點的所有其它數據中心站點; 由網絡策略識別的所有其它數據中心站點;以及 所有其它數據中心站點。
11.一種利用目標函數和該目標函數的導數將負荷從云計算網絡中的一個數據中心站點重新分配至其它數據中心站點的方法,所述目標函數定義了所述云計算網絡在每個數據中心站點處的性能特征,所述方法包括: 確定所述數據中心站點是否過載; 如果所述數據中心站點過載,則執行以下步驟: 為所述其它數據中心站點的集合中的每一個數據中心站點評估導數; 基于所評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分減少時,該數據中心站點對所述目標函數的改善最大;以及 基于所評估的導數和所識別的其它數據中心站點在所述數據中心站點和所述其它數據中心站點之間重新分配負荷; 如果所述數據中心站點未過載,則執行以下步驟: 為所述其它數據中心站點的集合中的每一個數據中心站點評估導數; 基于所評估的導數來識別合格的數據中心站點的集合中的一個數據中心站點,當該數據中心站點的負荷部分增加時,該數據中心站點對所述目標函數的影響最小;以及 基于所評估的導數和所識別的其它數據中心站點在所述數據中心站點和所述其它數據中心站點之間重新分配負荷。
12.如權利要求11所述的方法,該方法進一步包括:在確定所述數據中心站點是否未過載則執行上述步驟之前,再次確定所述數據中心站點是否過載。
【文檔編號】H04L29/08GK103988179SQ201280060122
【公開日】2014年8月13日 申請日期:2012年11月19日 優先權日:2011年12月7日
【發明者】I·維德佳佳, S·博斯特, I·薩尼 申請人:阿爾卡特朗訊公司