1.一種基于自適應maddpg的星群規避(bi)自主(zhu)決策(ce)方法,其(qi)特征在于,包(bao)括(kuo)以(yi)下步(bu)驟:
2.根(gen)據(ju)權利要求(qiu)1所述的基于(yu)自(zi)適應maddpg的星群規避(bi)自(zi)主決策方法,其特征在于(yu),所述s1的具體(ti)步驟為:
3.根(gen)據權利要求2所(suo)述的(de)(de)基(ji)于自適應maddpg的(de)(de)星群規避(bi)自主決策方法,其特征在(zai)于,所(suo)述s12的(de)(de)具體步驟為:
4.根據(ju)權利要求3所述(shu)的(de)基于(yu)自適(shi)應maddpg的(de)星群規避(bi)自主決策(ce)方法,其特征在于(yu),所述(shu)s121中相對(dui)運動線性(xing)模型的(de)表達式為:
5.根據權利(li)要求1所述的(de)基(ji)于(yu)自(zi)適應maddpg的(de)星群(qun)規避(bi)自(zi)主決策方法(fa),其特征在于(yu),所述s2中(zhong)星群(qun)威(wei)脅規避(bi)自(zi)主決策的(de)獎(jiang)勵函數的(de)表達(da)式為:
6.根據權(quan)利要求1所(suo)述(shu)的(de)(de)基于(yu)自(zi)適應maddpg的(de)(de)星(xing)群(qun)規避(bi)自(zi)主決策方(fang)法(fa),其特征(zheng)在于(yu),所(suo)述(shu)s3中威脅場景(jing)預(yu)測(ce)神(shen)經(jing)網絡的(de)(de)輸入為非合作目標(biao)與星(xing)群(qun)信(xin)息(xi),輸出(chu)為當(dang)前(qian)星(xing)群(qun)所(suo)處的(de)(de)威脅場景(jing);
7.根據權利要(yao)求(qiu)1所述的(de)基于自適應maddpg的(de)星群規避自主決策方法,其(qi)特征在于,所述critic_loss函數的(de)表達式為:
8.根(gen)據權利要求7所(suo)(suo)述的基于自(zi)(zi)適(shi)應maddpg的星群(qun)規避自(zi)(zi)主決(jue)策方法,其(qi)特征在于,所(suo)(suo)述s5的具(ju)體(ti)步驟為:
9.根(gen)據權(quan)利要求7所述的(de)基于自適應maddpg的(de)星(xing)(xing)群規避(bi)自主決策方法(fa),其特征在于,所述s57中星(xing)(xing)群規避(bi)任(ren)(ren)務的(de)失敗(bai)條件為滿足星(xing)(xing)群規避(bi)失敗(bai)公式中的(de)任(ren)(ren)一公式;