專利名稱:網絡資源協作的激勵方法
技術領域:
本發明涉及一種網絡資源協作的激勵方法,屬于計算機網絡計算技術領域。
背景技術:
計算技術和網絡技術的迅猛發展使得互聯網已成為現代社會重要的
基礎設施。網格(Grid )計算、點對點(Peer-to-Peer ,以下簡稱P2P ) 計算、面向服務的計算以及云(Cloud)計算等新型網絡計算模式的出現, 使得跨自治域的資源共享和協作成為可能。目前,對于許多大規模分布式 應用經常需要隸屬不同提供者的多個節點提供閑置的資源,協作完成計算任務。
在現有技術中,基于網絡資源協作的激勵方法主要包括基于信譽度的 軟激勵方法和基于貨幣的硬激勵方法兩類。基于信譽度的軟激勵方法通過 分析節點的交互歷史,建立信譽度計算系統,根據節點的信譽度高低對其 提供差異性的服務,以識別并懲罰不合作節點,實現對節點的激勵。基于 貨幣的硬激勵方法通過貨幣獎勵實現對節點的激勵,其實現的關鍵難點在 于報酬值的計算。現有的網絡資源管理系統或任務調度方法大多基于節,泉 無條件合作的假設。在計算密集型應用中,當用戶無法利用本地資源完成 所有的計算任務時,會將這些任務分別部署到不同的網絡節點上。由于提
供資源會帶來開銷,因此,追求效用最大化的資源提供者不會總是主動合 作地完成用戶交付的計算任務。
為了讓這些節點最大限度地提供資源,協作完成所有的計算任務,激 勵機制必須考慮兩個共存的博弈。第一個是用戶節點和服務節點之間的博 棄用戶節點的效用是任務成功完成的得益與激勵開銷的差額;服務節點 的效用為提供資源獲取的報酬減去帶來的開銷。顯然用戶節點希望花少錢
5完成更多的任務,而服務節點希望通過提供資源多賺錢,即它們的目標是 相互沖突的。第二個是服務節點之間的博弈環境總負載的變化直接影響 服務節點的報酬,如當環境總負載偏高時,資源供給不足,激勵負載低的 節點協作顯然比環境總負載偏低時要花費更多的報酬。因此,服務節點處 于負載相關的環境,每個節點獲得的利益受其他節點的負載影響,而節點 負載又依賴自己的資源提供決策,這就是說,每個服務節點的決策行為受 其他服務節點決策行為的影響。
對于第一個博弈來說,由于用戶節點不易探知服務節點的諸如開銷等 私人信息,尤其當服務節點的開銷隨負載的改變而改變時。因此,用戶節 點面臨在缺少服務節點的真實負載信息的情況下,如何確定最優激勵報酬 的問題。對于第二個博弈來說, 一個用戶任務的最終完成情況取決于所有 服務節點的努力,服務節點能夠獨立決策給每個用戶節點具體提供多少資 源,尤其當環境具備不確定性時,服務節點潛在更多選擇,這樣某個或某 些服務節點很容易搭其他節點的便車,用戶節點很難公正地分配報酬。因 此,用戶節點面臨服務節點的動作隱藏問題,其必須提供可促使所有服務 節點都合作的支付方案。因此,提供一種既使得用戶節點自身效用最大化, 又能保證服務節點合作的激勵機制是現有技術中亟待解決的問題之一 。
發明內容
本發明的目的是針對上述現有技術的缺陷,提供一種網絡資源協作的激 勵方法,以實現在充分考慮用戶節點與服務節點之間以及各個服務節點之間 這兩個共存博弈的情況下,既使得用戶節點自身效用最大化,又能保證服 務節點合作。
為實現上述目的,本發明提供了一種網絡資源協作的激勵方法,包括 用戶節點獲取服務節點的狀態先驗信息,根據所述狀態先驗信息確定與 所述服務節點對應的服務策略信息,將所述服務策略信息對應地發送給所述 服務節點;
所述用戶節點向所述服務節點發送計算任務信息,接收所逸服務節點反饋的任務結果信息;
所述用戶節點根據所述任務結果信息和所述服務策略信息向所述服務節 點發送報酬信息。
由上述技術方案可知,在本發明網絡資源協作的激勵方法中,用戶節點 通過對服務節點的狀態先驗信息進行統計,能夠為用戶節點與服務節點之間 進行交互制定服務策略信息。該服務策略信息充分考慮了用戶節點和服務節 點之間以及不同服務節點之間的兩個共存博弈。在向該服務節點中接受服務 策略信息的服務節點反饋報酬信息時,由于在服務策略信息的控制下,用戶 節點針對服務節點不同的任務完成狀態支付相應的報酬,實現了對服務節點
的差異化報酬管理,從而保證了用戶節點的效用最大化;由于在該服務策略 信息的控制下,服務節點只有積極向用戶節點提供服務才能獲取較高報酬, 從而促使服務節點在該激勵機制下積極與用戶節點合作。
下面通過附圖和實施例,對本發明的技術方案做進一步的詳細描述。
圖l為本發明網絡資源協作的激勵方法第一實施例的流程圖; 圖2為本發明網絡資源協作的激勵方法第二實施例的流程圖; 圖3為本發明網絡資源協作的激勵方法第三實施例的流程圖。
具體實施例方式
本發明網絡資源協作的激勵方法主要針對在大規模的計算密集型應用 中,需要用戶節點對服務節點提供足夠激勵,在充分考慮用戶節點與服務節 點之間以及各個服務節點之間這兩個共存博弈的情況下,順利完成用戶節點
分配的所有計算任務。該方法的主要思想是綜合考慮用戶節點和服務節點 的效用最大化目標,通過對用戶節點和服務節點的行為交互以及服務節點間 行為交互的博弈分析,設計任務調度的服務策略,這些服務策略既能保證用戶效用的最大化,也能促使所有服務節點按用戶節點的意愿合作地完成計算 任務。在完成計算任務的同時,該服務策略還具有信號揭發獎勵機制,以抵 制服務節點潛在的欺騙問題,確保服務策略的優化實施。
圖1為本發明網絡資源協作的激勵方法第一實施例的流程圖。如圖1所
示,本實施例的方法具體包括如下步驟
步驟IOI、用戶節點獲取服務節點的狀態先驗信息,根據該狀態先驗信 息確定與服務節點對應的服務策略信息,將該服務策略信息對應地發送給服 務節點。
開放網絡環境中有許多物理節點。本發明網絡資源協作的激勵方法第一 實施例對物理節點進行了角色劃分,即用戶節點和服務節點。用戶節點是分 配計算任務的節點,而接收計算任務、提供網絡資源完成任務的節點為服務 節點。在一些真實的網絡系統中,如P2P網絡,節點可以同時充當用戶和服 務節點的角色。
在確定與服務節點對應的服務策略信息時,要充分考慮用戶節點和服務
節點之間以及不同服務節點之間的兩個共存博棄,針對用戶節點和不同服務
節點的服務策略信息的確定必須以實現最大化用戶節點的效用和促使各服務 節點合作這兩個效果為目標。
在實際確定該服務策略信息時,由于用戶節點無法監控服務節點的每次 動作即提供的資源量和當前狀態信息,故只能基于可觀察到的計算速度設計 激勵機制,為了描述簡便,根據服務節點被分配到的任務量將節點的工作狀 態分為好狀態和壞狀態。因此,為了實現上述目標,所要制定的服務策略信 息必須滿足在提供相同計算速度的前提下,服務節點處于壞狀態下帶來的 開銷比好狀態下的開銷大。故要提供相同的激勵,用戶節點必須在服務節點 處于壞狀態下仍提供較快的計算速度時支付更多的報酬。
為了促使服務節點合作,步驟IOI中用戶節點確定的服務策略信息必須 滿足兩個固有約束(1) 個人理性約束服務節點接受相應的服務策略信息得到的期望效用 不小于不接受服務策略信息能獲得的最大期望效用;
(2) 激勵相容約束服務節點按用戶節點的希望提供資源的期望效用不 d 、于采取其他資源提供#:作的期望效用。
步驟103、用戶節點向服務節點發送計算任務信息。
用戶節點向所有的服務節點發送服務策略信息,但是并不是所有的服務 節點在此時的工作狀態下都會接受該服務策略信息。比如說,服務節點當前 的負載量過大,已經沒有能力向用戶節點提供服務,那么該服務節點就會拒 絕該服務策略信息。但是這些服務策略信息從本質上具有激勵機制,會提高 服務節點接受該服務策略信息的可能性。用戶節點向接受服務策略信息的服 務節點發送計算任務信息
步驟105、用戶節點接收服務節點反饋的任務結果信息。
接受用戶節點發送服務策略信息的服務節點根據用戶節點分配的計算任 務信息執行相應的任務。在執行任務的過程中,服務節點可以根據其當前處 于好狀態還是壞狀態來決定提供給任務執行的資源量,并向用戶節點反饋執 行任務后的任務結果信息。該任務結果信息可以包括服務節點被分配的任務 的完成信息等。該完成信息即為與服務節點完成計算任務相關的統計信息, 可用于獲取服務節點的計算速度,作為用戶節點向服務節點提供報酬的依據。
步驟107、用戶節點根據該任務結果信息和服務策略信息向服務節點發 送報酬信息。
用戶節點可以從每個服務節點向其反饋的任務結果信息中統計出相應的 計算速度。用戶節點即可根據該計算速度與相應的服務策略信息向服務節點 反饋相應的報酬信息。在相應的服務策略信息的控制下,服務節點在處于壞 狀態且計算速度又較高時能夠獲取較多報酬,在處于好狀態但計算速度又較 低時獲取較少報酬。
綜上可知,在本發明網絡資源協作的激勵方法第一實施例中,用戶節點
9通過對服務節點的狀態先驗信息進行統計,能夠為用戶節點與服務節點之間 進行交互制定服務策略信息。該服務策略信息充分考慮了用戶節點和服務節 點之間以及不同服務節點之間的兩個共存博弈。在向服務節點反饋報酬信息 時,由于在服務策略信息的控制下,用戶節點針對服務節點不同的任務完成 狀態支付相應的報酬,實現了對服務節點的差異化報酬管理,從而保證了用
戶節點的效用最大化;由于在該服務策略信息的控制下,服務節點只有積極 向用戶節點提供服務才能獲取較高報酬,從而促使服務節點在該激勵機制下 積極與用戶節點合作。
圖2為本發明網絡資源協作的激勵方法第二實施例的流程圖。如圖2所 示,本實施例的方法具體包括如下步驟
步驟201 、用戶節點從狀態信息收集中心獲取服務節點處于狀態w)的 概率o,(,)、服務節點/在其余服務節點的狀態向量為心)的條件下處于狀態柳
的概率仏,);
其中,W) = = Z7,g;/,/ = V..";y-/,"為服務節點的總數。
步驟203、用戶節點根據該 ,)和^,)^按照下述公式(1)計算服務節點 /處于狀態力')=g時的計算速度^;服務節點/處于狀態W) = 6時的計算速度 A;服務節點/在其余服務節點處于狀態向量</),其計算速度為 時獲得的 報酬值p^)以及服務節點/在其余服務節點處于狀態向量s(/),其計算速度為 ^時獲得的報酬值/V,):
<formula>formula see original document page 10</formula>度為a時獲得的滿意度,W(fCg)為用戶節點在服務節點f的計算速度為fCg時獲得的滿意度,其中w為實數域上的下凹減函數;C/( "為服務節點/獲得報酬值^")時的滿意度,t/(/V(力)為服務節點/獲得報酬值&,(,)時的滿意度,其中"為實數域上的上凸
增函數;z)(^,&)為服務節點/在狀態力')=z)且計算速度為&時的開銷值,
Z)(、, g)為服務節點/在狀態= g且計算速度為^時的開銷值,其中Z)為實
數域上的下凹增函數;Z7(w為服務節點/在狀態= 6時不接受服務策略信息的最大期望效益值,G(g)為服務節點/在狀態w)-g時不接受服務策略信息的最大期望效益值。
步驟205、用戶節點將、、a、 /Vw以及a。)作為服務策略信息,相應
地發送給服務節點。
步驟207、服務節點根據當前的服務狀態指標和服務策略信息判斷接受該服務策略信息獲得的收益值是否高于預定值,若是,則執行步驟209,否則,執行步驟211.
步驟209、服務節點接受該服務策略信息,執行步驟213。
步驟211、服務節點丟棄該服務策略信息,結束。
步驟213 、用戶節點向接受該服務策略信息的服務節點發送計算任務信
自
步驟215、服務節點根據該計算任務信息和當前的負載狀態信息確定資源提供量,根據該資源提供量完成任務,并向用戶節點反饋任務結果信息。
步驟217、用戶節點4艮據該任務結果信息統計服務節點的計算速度。
步驟219、當服務節點/t的計算速度為^,其余服務節點的計算速度為&(;)時,用戶節點向服務節點《發送報酬值為;v"的報酬信息。
步驟221、當服務節點yt的計算速度為^,其余服務節點的計算速度為a(,)時,用戶節點向服務節點a發送報酬值為/v(力的報酬信息;其中,
iiA: = 1…w,A: # j.。
一般地,對于多個服務節點的情況,每個服務節點的服務策略信息均具
備i^,"^的性質OGX6…6)),即一個服務節點在所有服務節點都按計 算速度^完成任務時得到的報酬,要高于其他服務節點中至少有一個是以 計算速度、完成任務而其按計算速度&完成任務得到的報酬。在服務策略 信息的控制下,每個服務節點實際以概率和&。)的方式獲取報酬。
下面以一個用戶節點與兩個服務節點交互為例對上述步驟201 步驟203 確定服務策略信息的過程進行說明。
用戶節點可以不定期從狀態信息收集中心獲取服務節點的狀態先驗信 息,統計出服務節點的狀態先驗知識。設^r)表示服務節點/t當前的狀態,0sW
代表服務節點*處于狀態s(/t)的概率,其中= 6代表服務節點/t當前處于壞 狀態,卓)-g代表服務節點yfc當前處于好狀態,yfc = l,2。義#(2)代表服務節點1 在服務節點2狀態為<2)的條件下處于狀態的概率。
用戶節點的效用是任務成功完成的滿意度與激勵服務節點所支付的報酬 值的差額;服務節點的效用為提供資源獲取的滿意度減去完成任務花費的開 銷值。
設vK.)為實數域上的下凹減函數,其中w( ,))表示用戶節點對服務節點1
的計算速度^(D的滿意度,W(fc^))表示用戶節點對服務節點2的計算速度^(2)
的滿意度。A,("是用戶節點給服務節點1的報酬值,;^,是用戶節點給服 務節點2的報酬值。則用戶節點從服務節點1獲取的效用為M;(fc,(,))-A(l),(2),
用戶節點從服務節點2獲取的效用為w(~2))-A(2W1),則用戶節點所獲得的總
效用為w(,c柳)+孝,(2)) - ps(1W2) - p,(2),(1)。
設Z)為實數域上的下凹增函數。s(l))為服務節點1在狀態^(1)且計
算速度為fc仰時的開銷值。C/為實數域上的上凸增函數,"(/^),(2))為服務節點1獲得報酬/^,(2)時的滿意度。則服務節點1的效用為"(/7,,(2))-Z)(fc,(,—(1)),服務節點2的效用為C/(a(2w,))-D( 2),s(2))。此外,還為服務節點a不接受該服務策略信息預留 一個最大期望效益值5(^t)) , * = 1,2 。
基于上述狀態先驗信息,該服務策略信息的確定依據如下原理用戶節點無法監控服務節點的每次動作和當前環境狀態,故只能基于可觀察到的計算速度設計服務策略。此外,由于相同的計算速度在壞狀態下帶來的開銷值比好狀態下大,故要提供相同的激勵,用戶節點必須在服務節點處于壞狀態下支付更多的報酬值。
為了促使服務節點合作,步驟IOI中用戶節點確定的服務策略信息必須
滿足兩個固有約束
(1 )個人理性約束服務節點接受相應的服務策略信息得到的期望效用不小于不接受服務策略信息能獲得的最大期望效用;
(2)激勵相容約束服務節點按用戶節點的希望提供資源的期望效用不小于采取其他資源提供操作的期望效用。
基于上述原理,為實現用戶節點效用最大化和促使服務節點合作的雙重目標,可以將確定該服務策略信息的問題轉化成求解以最大化用戶節點從服務節點獲取的效用為目標,以服務節點的個人理性約束和激勵相容約束為約束條件的規劃問題。即可以通過求解下述公式(2)確定發送給服務節點1的服務策略信息
。*k W<%) - A》+(1 -^)(KA) - Ag)J+。gk《(傘g) -/V)十(1 - -
%*Mas)—A,c,)^(Z>) 1 (2)
5》為)+0、禽 ,§由
顯然,采用上述方法確定的服務策略信息滿足服務節點的個人理性約束和激勵相容約束,故可以導出服務節點博弈的納什均^f,即服務節點間的合作。此外,容易驗證每個服務節點的服務策略信息均具備A, 的性質,即
13服務節點1在其本身和服務節點2均按計算速度^完成任務時得到的報酬,
要高于服務節點2按計算速度、完成任務而其按計算速度&完成任務得到的
報酬。由于用戶節點不能在確定服務策略信息時準確獲取各服務節點接到任 務時的狀態信息,故在該服務策略信息的控制下,每個服務節點實際以概率
;^和/v的方式獲取報酬。
通過求解上述公式(2),即可獲得^, ,/V/^,/v;^。 用戶節點將這些參數作為服務策略信息下發給服務節點1。
同理,用戶節點依據上述計算方法也可以確定與服務節點2對應的服務 策略信息并發送給服務節點2。
綜上可知,在本發明基于網絡資源協作的激勵方法第二實施例中,該服 務策略信息在充分考慮了用戶節點和服務節點之間以及不同服務節點之間的 兩個共存博弈的基礎上,將確定該服務策略信息的問題轉化為具有約束條件 的最優化問題,通過求解出的決策變量即可確定發送給相應的服務節點的服 務策略信息。用戶節點在該服務策略信息的控制下向該服務節點反饋報酬信 息時,可以針對服務節點不同的任務完成狀態支付相應的報酬,實現了對服
務節點的差異化報酬管理,從而保證了用戶節點的效用最大化;在該服務策 略信息的控制下,服務節點只有積極向用戶節點提供服務才能獲取較高報酬, 從而促使服務節點在該激勵機制下積極與用戶節點合作。
圖3為本發明網絡資源協作的激勵方法第三實施例的流程圖。如圖3所 示,本實施例服務節點的任務結果信息包括該服務節點被分配任務的完成信 息和揭發信息e,在本發明網絡資源協作的激勵方法第二實施例的基礎上將 步驟219 步驟221替換為步驟319 步驟321,具體為
步驟319、當判斷服務節點的計算速度為^和被揭發服務節點的計算速 度為&時,用戶節點向發送揭發信息^的服務節點/t發送報酬值為 Pfo(y) + =6…6的報酬信息,向被揭發服務節點發送報酬值為;^a)的報酬信息;
步驟321、當判斷服務節點的計算速度為^和被揭發服務節點的計算速度為 時,用戶節點向發送揭發信息P的服務節點/fc發送報酬值為p吣)-W,s(/) = 6…6的報酬信息,向被揭發服務節點發送報酬值為p^)的報酬信息。
其中,hl…";《為正數。
具體來說,如果所有的服務節點在任何狀態下總是保持按計算速度^完
成用戶節點交給的任務,那么當服務節點完成任務時,對與每個服務節點,它可以確定地獲取更高的報酬;V.r即服務節點可能通過合謀,偽裝成高負栽狀態而騙取用戶節點支付更多的錢,這顯然損害了用戶節點的利益。
由此,服務策略信息需要提供一種信號揭發機制,該機制需要用戶節點
修改與發送揭發信號0的服務節點和被揭發服務節點相對應的服務策略信臺、
確定該信號揭發機制的原理是假設服務節點*反饋的任務結果信息除自身被分配任務的完成信息,還包括與服務節點/ 對應的揭發信息《,該揭發信息^表示服務節點/t認為服務節點A會以至少+ 0的概率按計算速度&A
完成任務,即被揭發服務節點為服務節點A,服務節點/2可能欺騙。如果服務節點/z真的欺騙,則揭發該服務節點A的服務節點yfe應該獲得獎勵,即更多的報酬值,但如果服務節點&沒有欺騙,而服務節點it是惡意揭發,則服務節點)fc也應該受到懲罰。
而對于被揭發的服務節點/7來說,在欺騙的情況下,其獲得的報酬值為其在被觀察到為好狀態時獲取的報酬值,這與其沒有欺騙時獲得的報酬值相同。這樣,即便服務節點//想欺騙,即觀察到好狀態時假裝是壞狀態,也不能得到更多的利益。此外,服務節點/t在上述步驟提供的監督機制下獲取的報酬值和在服務策略信息的控制下獲得的報酬值一致,因此,揭發行為是不
15需要用戶節點額外支付激勵費用的。
綜上可知,本發明網絡資源協作的激勵方法第三實施例是一種服務節點 相互監督的機制。該機制既能抵制服務節點潛在的欺騙行為,又不需要用戶節 點額外支付激勵花費,就能確保激勵的實施效果。從而進一步優化了以用戶 節點效用最大化和促使服務節點合作的雙重激勵為目標的技術方案的效果。
最后應說明的是以上實施例僅用以說明本發明的技術方案而非對其進
行限制,盡管參照較佳實施例對本發明進行了詳細的說明,本領域的普通技 術人員應當理解'.其依然可以對本發明的技術方案進行修改或者等同替換, 而這些修改或者等同替換亦不能使修改后的技術方案脫離本發明技術方案的
精神和范圍。
權利要求
1、一種網絡資源協作的激勵方法,其特征在于,包括用戶節點獲取服務節點的狀態先驗信息,根據所述狀態先驗信息確定與所述服務節點對應的服務策略信息,將所述服務策略信息對應地發送給所述服務節點;所述用戶節點向所述服務節點發送計算任務信息,接收所述服務節點反饋的任務結果信息;所述用戶節點根據所述任務結果信息和所述服務策略信息向所述服務節點發送報酬信息。
2、 根據權利要求i所述的網絡資源協作的激勵方法,其特征在于,所述用戶節點向所述服務節點發送計算任務信息之前,還包括所述服務節點根據當前的服務狀態指標和所述服務策略信息判斷接受所迷服務策略信息獲得的收益值是否高于預定值,若是,則接受所述服務策略信息,否則,丟棄所述服務策略信息。
3、 沖艮據權利要求1所述的網絡資源協作的激勵方法,其特征在于,接收所述服務節點反饋的任務結果信息之前,還包括所述服務節點根據所述計算任務信息和當前的負載狀態信息確定資源提供量,根據所述資源提供量完成任務,并向所述用戶節點反饋所述任務結果信息。
4、 根據權利要求1~3中任一權利要求所述的網絡資源協作的激勵方法,其特征在于,根據所迷狀態先-瞼信息確定與所述服務節點對應的服務策略信息,將所述服務策略信息對應地發送給所述服務節點具體為所述用戶節點獲取服務節點/處于狀態的概率 ,)、服務節點,'在其余服務節點的狀態向量為^/)的條件下處于狀態W)的概率《s(,)sU),其中s(/) = 6,g;s(力=6,g;! J = 1,...";J W ,"為所述月良務節點的總凄t;所述用戶節點根據所述o,(。和^^按照下述公式(1)計算服務節點,'處于狀態= g時的計算速度 ;服務節點/處于狀態= 6時的計算速度&;服務節點/在其余服務節點處于狀態向量s(力,其計算速度為 時獲得的報酬值;^")以及服務節點/在其余服務節點處于狀態向量0),其計算速度為&時獲得的報酬值^,。)<formula>formula see original document page 3</formula>這里,M<&)為所述用戶節點在服務節點/的計算速度為&時獲得的滿意度,H^g為所述用戶節點在服務節點/的計算速度為^時獲得的滿意度,其中w為實數域上的下凹減函數;為服務節點/獲得報酬值時的滿意度,f/(/v(,i)為服務節點f獲得報酬值^(,)時的滿意度,其中"為實數域上的上凸增函數;Z)(&,6)為服務節點/在狀態力')=6且計算速度為&時的開銷值,ZXfcg, g)為服務節點,'在狀態s(/) = g且計算速度為、時的開銷值,其中d為實數域上的下凹增函數;5(6)為服務節點/在狀態w) = 6時不接受所述服務策略信息的最大期望效益值,為服務節點/在狀態力')=g時不接受所述服務策略信息的最大期望效益值;將、、&、 ;^(力以及;^(/)作為所述服務策略信息,相應地發送給所述服務節點。
5、根據權利要求4所述的網絡資源協作的激勵方法,其特征在于,所述任務結果信息包括所述服務節點被分配任務的完成信息,所述用戶節點根據所述任務結果信息和所述服務策略信息向所述服務節點發送報酬信息具體為所述用戶節點根據所述服務節點被分配任務的完成信息統計所述服務節點的計算速度;當所述服務節點的計算速度為&,其余服務節點的計算速度為包(力時,所述用戶節點向所述服務節點發送報酬值為&。)的報酬信息;當所述服務節點的計算速度為、,其余服務節點的計算速度為, ;)時,所述用戶節點向所述服務節點發送報酬值為;^力的報酬信息。
6、根據權利要求4所述的網絡資源協作的激勵方法,其特征在于,所述任務結果信息包括所述服務節點被分配任務的完成信息和揭發信息0,所述用戶節點根據所述任務結果信息和所述服務策略信息向所述服務節點發送報酬信息具體為所述用戶節點根據所述服務節點被分配任務的完成信息統計發送所述揭發信息S的揭發服務節點的計算速度和被揭發服務節點的計算速度;當判斷所述揭發服務節點的計算速度為,Cfc,所述被揭發服務節點的計算速度為時,所述用戶節點向所述揭發服務節點發送報酬值為&(力+ ^^(力=6...6的報酬信息;向所述被揭發服務節點發送報酬值為&、(,)的報酬信息;當判斷所述揭發服務節點的計算速度為& ,所述被揭發服務節點的計算速度為^時,所述用戶節點向所述揭發服務節點發送報酬值為P一) -^,s(力-6…6的報酬信息;向所述被揭發服務節點發送報酬值為;^、.(7)的報酬信息;其中,《為正數。
全文摘要
本發明涉及一種網絡資源協作的激勵方法。該方法包括用戶節點獲取服務節點的狀態先驗信息,根據所述狀態先驗信息確定與所述服務節點對應的服務策略信息,將所述服務策略信息對應地發送給所述服務節點;所述用戶節點向服務節點發送計算任務信息,接收所述服務節點反饋的任務結果信息;所述用戶節點根據所述任務結果信息和所述服務策略信息向所述服務節點發送報酬信息。本發明充分考慮用戶節點與服務節點之間以及各個服務節點之間存在的博弈問題,既使得用戶節點自身效用最大化,又能保證服務節點合作。
文檔編號H04L29/08GK101488972SQ20091007623
公開日2009年7月22日 申請日期2009年1月6日 優先權日2009年1月6日
發明者懷進鵬, 李建欣, 莉 林, 沃天宇, 胡春明, 亮 鐘 申請人:北京航空航天大學