一種腔體濾波器智能調諧算法及使用該算法的調諧方法
【技術領域】
[0001] 本申請涉及工業機器人和自動化領域,尤其涉及一種腔體濾波器智能調諧算法及 使用該算法的調諧方法。
【背景技術】
[0002] 腔體濾波器是一種無源微波器件,廣泛應用于衛星通信、中繼通信、雷達、電子對 抗及微波測量儀表中,它的使用對于分離頻譜信息、提高通信質量、防止信號串擾有著十分 重要的作用。在腔體濾波器生產過程中,由于工件存在生產誤差,需要調整調諧螺桿的位 置,即調整濾波器內的形狀,從而使得腔體濾波器符合規格要求一一這一工序簡稱為"濾波 器調諧工序"。
[0003] 當前,"濾波器調諧工序"主要采用人工操作,即工人使用螺絲刀,觀察矢量網絡分 析儀顯示的散射參數(S參數)波形的變化,根據自己的調諧經驗進行判斷,逐個手動調諧腔 體濾波器上的調諧螺桿,直到矢量網絡分析儀顯示的S參數波形符合要求。現有的人工調試 工序極為復雜:一個腔體濾波器由多路諧振腔構成,每路諧振腔均有不同的波形輸出的要 求,需要通過幾個至十幾個調諧桿的高度來調諧。每個調諧桿的高度對整體的波形輸出均 有不同的影響,調諧桿的高度的不同組合也會影響輸出,且所產生影響的規律難以把握。且 調試工序還沒有一套規范固定的程序,能實現快速的調諧,只能通過人工觀察S參數波形, 憑借經驗,不斷循環嘗試。據統計,對于一個調諧經驗比較豐富的工人,調好一個腔體濾波 器產品,也需要花費30到40分鐘,調試效率極低。
[0004] 且由于受到前段生產工藝、機械加工精度、手工作業等的影響,同一款腔體濾波器 產品也存在個體差異。作為一種十分敏感的電子產品,同種腔體濾波器產品的個體差異會 對濾波波形輸出產生較大影響,即同一款腔體濾波器產品并不適用同一種調諧方式,同一 款產品中的每個個體均需不一樣的調諧方式。
【發明內容】
[0005] 本申請實施例提供一種腔體濾波器智能調諧方法,用以解決現有技術中無法實現 自動化調諧腔體濾波器,人工調諧腔體濾波器效率低下、成本高昂的問題。
[0000]本申請實施例采用下述技術方案:
[0007] -種腔體濾波器智能調諧算法,其特征在于,包括:
[0008] 設定目標數據并獲取實際數據,所述目標數據包括待調腔體濾波器的調諧指標、 腔體濾波器的調諧螺桿分布位置、可調位置限制、調諧螺桿數量,所述實際數據包括當前腔 體濾波器的S參數波形;
[0009] 隨機采集S參數波形樣本數據并獲取特征向量;
[0010] 訓練獲得調諧策略模型,所述調諧策略模型是增強學習模型與神經網絡系統的融 合,包括狀態、環境、獎勵、動作和策略,其中狀態為當前S參數波形的降維特征,環境為待調 濾波器,動作為濾波器調諧過程中調諧螺桿的執行動作,策略為"ε_貪婪機制",根據策略挑 選動作、執行動作獲得新狀態和對應新獎勵值以不斷優化策略,使獎勵值達到最佳。
[0011] 優選地,隨機采集S參數波形樣本數據并獲取特征向量,包括:
[0012] 隨機調整腔體濾波器的調諧螺桿的高度,采集若干狀態下S參數波形的原始樣本 數據,該樣本數據包含各種螺桿高度組合對應的S參數波形;
[0013] 計算采集到的樣本數據的協方差矩陣;
[0014] 利用奇異值分解求出協方差矩陣的特征向量和特征值,并將特征值按大到小排 序;
[0015] 選取前k個最大的特征值對應的特征向量得到S參數波形的特征向量。
[0016] 優選地,選取前k個最大的特征值對應的特征向量得到S參數波形的特征向量,其 中,所述k為5。
[0017]優選地,訓練獲得調諧策略模型,包括:
[0018] 初始化調諧策略模型,包括設置待調濾波器的調諧指標、神經網絡的各參數、數據 儲存空間大小、樣本抽取數量、訓練周期數、最大調諧步數;
[0019] 從數據空間中隨機采樣以獲取訓練樣本;每組樣本數據包括"原狀態(St)、動作 Ut)、新狀態(st+1)、該動作的獎勵值(rt)"四部分,其中"原狀態"為某時刻的S參數波形經數 據降維后的特征,"動作"為某個可執行的調諧螺桿的調諧動作,"新狀態"為相對于"原狀 態",指在執行"動作"后得到的S參數波形降維后的特征,"該動作的獎勵值"為經過以上動 作獲取到的獎勵值,根據當前S參數波形與調諧目標S參數波形的歐氏距離計算得到;
[0020] 用訓練樣本數據訓練并更新Q網絡,其中輸入為訓練樣本數據中的"原狀態",輸出 目標為各執行動作對應的Q值,依據如下公式計算:
[0021]
[0022] 其中,rt表示第t步的獎勵值,w和b為Q網絡的參數,即神經網絡各層的權值和偏 置,& +1為"新狀態",at+A "新狀態"下可執行的有效動作,γ為設定的折扣因子;
[0023] 采樣待調濾波器的當前狀態的S參數波形,輸入當前狀態S參數波形降維后特征, 經過Q網絡預測獲得各個執行動作對應的Q值;
[0024] 以"ε-貪婪機制"選取合適的Q值對應的執行動作并作用于調諧螺桿,完成本次的 濾波器調諧動作;
[0025] 采樣待調濾波器執行調諧動作后的S參數波形,計算與調諧目標S參數波形的歐氏 距離,計算出本次動作執行的獎勵值。
[0026] 對執行調諧動作后獲得的S參數波形進行數據降維處理;
[0027] 保存本次執行動作的數據組到數據存儲空間,數據組包括原狀態(St)、動作(at)、 新狀態(s t+1)、該動作的獎勵值(rt)。
[0028] 優選地,在保存執行調諧動作的數據組到存儲空間后,還包括步驟:
[0029] 判斷當前的S參數波形是否達到目標S參數波形:
[0030] 若當前的S參數波形達到目標S參數波形,則退出本周期的訓練過程;
[0031] 若當前的S參數波形未達到目標S參數波形,且未超出最大執行步數,則跳轉至步 驟"從數據空間中隨機采樣以獲取訓練樣本"繼續優化;
[0032]若當前的S參數波形未達到目標S參數波形,且已超出最大執行步數,則退出本周 期訓練過程。
[0033] 優選地,從數據空間中隨機采樣以獲取訓練樣本,包括:
[0034] 若存儲空間中無樣本數據,則設置本次的樣本數據全為0;
[0035] 若存儲空間中樣本數據不足預設數量,則進行重復抽取直至達到預設數量。
[0036] 優選地,調諧策略模型的Q網絡是通過一個單隱層前向傳播神經網絡來實現的,即 具有一個輸入層、一個輸出層,一個中間隱藏層,其中神經網絡的隱藏層神經元個數為m個, 輸入層為數據存儲空間中抽取的樣本數據的"原狀態",輸出層為每個可執行動作對應的Q 值,激活函數為S型函數,神經網絡參數的優化方法為隨機梯度下降的方法。
[0037] 優選地,定義每根調諧螺桿以某個固定角度順、逆時針旋轉,Q網絡輸出單元的個 數為調諧螺桿根數的2倍。
[0038] -種使用腔體濾波器智能調諧算法的調諧方法,包括:
[0039] 安裝連接調諧系統,所述調諧系統包括工控機系統、連接工控機系統的機械執行 機構、置于所述機械執行機構內的腔體濾波器、連接工控機系統與腔體濾波器的矢量網絡 分析儀;
[0040] 采樣當前待調腔體濾波器的S參數波形;
[0041 ]將采樣的S參數波形降維處理得到該S參數波形的降維特征;
[0042] 將當前S參數波形的降維特征輸入預先訓練好的調諧策略模型計算出待調腔體濾 波器需執行的調諧動作;選擇動作的方式仍然為"ε_貪婪機制",此時ε固定為一個較小的數 值,如0.1;
[0043] 輸出計算得到的調諧動作指令并依據所述調諧動作指令調節所述腔體濾波器的 調諧螺桿。
[0044] 優選地,在輸出計算得到的調諧動作指令并依據所述調諧動作指令調節所述腔體 濾波器的調諧螺桿之后,還包括步驟:
[0045] 采樣執行所述調諧動作后的腔體濾波器的S參數波形并與目