一種基于自適應MADDPG的星群規避自主決策方法

文檔序號：39426381發(fa)布日期：2024-09-20 22:22閱讀：來源：國知局

技術特征：

1.一種基于自適應maddpg的星群規避(bi)自主(zhu)決策(ce)方法，其(qi)特征在于，包(bao)括(kuo)以(yi)下步(bu)驟：

2.根(gen)據(ju)權利要求(qiu)1所述的基于(yu)自(zi)適應maddpg的星群規避(bi)自(zi)主決策方法，其特征在于(yu)，所述s1的具體(ti)步驟為：

3.根(gen)據權利要求2所(suo)述的(de)(de)基(ji)于自適應maddpg的(de)(de)星群規避(bi)自主決策方法，其特征在(zai)于，所(suo)述s12的(de)(de)具體步驟為：

4.根據(ju)權利要求3所述(shu)的(de)基于(yu)自適(shi)應maddpg的(de)星群規避(bi)自主決策(ce)方法，其特征在于(yu)，所述(shu)s121中相對(dui)運動線性(xing)模型的(de)表達式為：

5.根據權利(li)要求1所述的(de)基(ji)于(yu)自(zi)適應maddpg的(de)星群(qun)規避(bi)自(zi)主決策方法(fa)，其特征在于(yu)，所述s2中(zhong)星群(qun)威(wei)脅規避(bi)自(zi)主決策的(de)獎(jiang)勵函數的(de)表達(da)式為：

6.根據權(quan)利要求1所(suo)述(shu)的(de)(de)基于(yu)自(zi)適應maddpg的(de)(de)星(xing)群(qun)規避(bi)自(zi)主決策方(fang)法(fa)，其特征(zheng)在于(yu)，所(suo)述(shu)s3中威脅場景(jing)預(yu)測(ce)神(shen)經(jing)網絡的(de)(de)輸入為非合作目標(biao)與星(xing)群(qun)信(xin)息(xi)，輸出(chu)為當(dang)前(qian)星(xing)群(qun)所(suo)處的(de)(de)威脅場景(jing)；

7.根據權利要(yao)求(qiu)1所述的(de)基于自適應maddpg的(de)星群規避自主決策方法，其(qi)特征在于，所述critic_loss函數的(de)表達式為：

8.根(gen)據權利要求7所(suo)(suo)述的基于自(zi)(zi)適(shi)應maddpg的星群(qun)規避自(zi)(zi)主決(jue)策方法，其(qi)特征在于，所(suo)(suo)述s5的具(ju)體(ti)步驟為：

9.根(gen)據權(quan)利要求7所述的(de)基于自適應maddpg的(de)星(xing)(xing)群規避(bi)自主決策方法(fa)，其特征在于，所述s57中星(xing)(xing)群規避(bi)任(ren)(ren)務的(de)失敗(bai)條件為滿足星(xing)(xing)群規避(bi)失敗(bai)公式中的(de)任(ren)(ren)一公式；

技術總結
本發明公開了一種基于自適應MADDPG的星群規避自主決策方法，屬于航天器任務規劃技術領域，包括以下步驟：建立脈沖式星群對空間非合作目標規避任務模型；設計星群威脅規避自主決策的獎勵函數；構建威脅場景預測神經網絡，并進行訓練；基于獎勵函數，構建星群威脅規避自主決策網絡；基于MADDPG算法，訓練不同威脅場景下的星群威脅規避自主決策網絡；將非合作目標與星群信息輸入至訓練后的威脅場景預測神經網絡中，得到當前威脅場景，并選擇對應威脅場景下訓練的星群威脅規避自主決策網絡，進行星群規避的自主決策。本發明解決了現有算法難以處理的由大量衛星組成的星群對非合作目標抵近威脅進行規避時產生的高復雜度的決策問題。

技術研發人員：劉闖,駱軒宇,岳曉奎,王峰林,石珂珂,葛樂飛,韓非,余衛倬,宋婷
受保護的技術使用者：西北工業大學
技術研發日：
技術公布日：2024/9/19

完(wan)整全部詳細(xi)技術(shu)資料下載

當前第2頁1 2

相關(guan)技術

網友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

中文字幕无码日韩视频无码三区

一種基于自適應MADDPG的星群規避自主決策方法