本發明涉(she)及管廊隱患(huan)風險預測,特別是涉(she)及一種基(ji)于知識(shi)圖譜(pu)的(de)綜(zong)合(he)管廊隱患(huan)風險預測方法。
背景技術:
1、地下綜合管(guan)廊在運營過程中易發生(sheng)管(guan)線老化(hua)、泄漏及廊體(ti)沉降變形等(deng)病害,導致嚴重的(de)(de)運行及經濟后果。對隱患風險(xian)進行識別和預測(ce),為運維(wei)風險(xian)管(guan)理提供決策依據(ju),可(ke)有效(xiao)降低風險(xian)發生(sheng)概率。建筑(zhu)運維(wei)風險(xian)預測(ce)主要是(shi)指根據(ju)動(dong)態監測(ce)數據(ju)結(jie)合相關標準對綜合管(guan)廊安全(quan)隱患進行預測(ce)的(de)(de)過程。目(mu)前已有的(de)(de)方法實現還存在以下問題:
2、1、傳統綜合(he)管廊(lang)風(feng)險預測(ce)依賴(lai)于文本(ben)標準文件,采集的(de)監測(ce)數(shu)據(ju)與(yu)標準的(de)比對工(gong)作依賴(lai)于人工(gong),且得到的(de)風(feng)險結論主觀(guan)性強(qiang),無法有效利用(yong)監測(ce)數(shu)據(ju)的(de)動態變化(hua);
3、2、基于知識(shi)圖譜(pu)的動(dong)態風險評價方法需要構建(jian)復雜的知識(shi)圖譜(pu),風險預(yu)測的結論通過固(gu)定的模版(ban)查詢語句進行生成,無法利用歷史(shi)監測數據在時間維度上的波動(dong),從(cong)而作出合理的決(jue)策;
4、3、綜合(he)管廊知識圖(tu)譜節(jie)點(dian)數(shu)量龐大,使用條件語句查詢風險(xian)排序的數(shu)據(ju)庫(ku)執(zhi)行效率很低,導致時間開銷昂貴、預(yu)測(ce)實(shi)時性不(bu)強。
技術實現思路
1、本(ben)發明旨(zhi)在至少解決現有技(ji)術(shu)中存在的技(ji)術(shu)問題,特(te)別創新地提(ti)出了一種(zhong)基(ji)于(yu)知(zhi)識圖(tu)譜的綜合管廊隱患風(feng)險預測方法。
2、為了(le)實現本發(fa)明(ming)(ming)的上述目的,本發(fa)明(ming)(ming)提供了(le)一種基于知識圖譜的綜合(he)管廊隱患風險預測方法,其特(te)征在于,包(bao)括(kuo)以(yi)下步(bu)驟:
3、s1,獲(huo)取異常監(jian)測(ce)數據類型序(xu)列(lie),所(suo)述異常監(jian)測(ce)數據類型序(xu)列(lie)包括(kuo)若干個類型標簽;
4、s2,將(jiang)異常監測數據類(lei)型序列分別輸(shu)入實體(ti)推薦(jian)網絡(luo)和響應生成(cheng)網絡(luo)預(yu)測風(feng)險構(gou)件概(gai)率排名;
5、s3,將實(shi)體生(sheng)成網絡與響應(ying)生(sheng)成網絡得到的(de)風(feng)(feng)險構件概率進(jin)行加權求和(he),得到最(zui)終的(de)風(feng)(feng)險構件概率,最(zui)后確(que)定(ding)風(feng)(feng)險:選(xuan)擇風(feng)(feng)險構件概率高于設定(ding)閾值的(de)風(feng)(feng)險構件或者選(xuan)擇排(pai)名最(zui)高的(de)風(feng)(feng)險構件,最(zui)后得到風(feng)(feng)險構件對應(ying)綜合管廊隱的(de)患風(feng)(feng)險類型。
6、進一步(bu)地(di),通過實體推薦網絡得到風(feng)險構件概率,包括以(yi)下步(bu)驟:
7、s2-1,應用圖卷積網絡rgcn對(dui)整個(ge)知識(shi)(shi)圖譜進(jin)行(xing)編(bian)碼,獲得每個(ge)知識(shi)(shi)圖譜實體節點的(de)嵌入表示;
8、s2-2,將監測(ce)數據類別(bie)序列(lie)中(zhong)的每個(ge)(ge)類型標簽與知識(shi)圖譜(pu)中(zhong)每個(ge)(ge)實(shi)體(ti)的名稱進行窮盡式匹(pi)配,識(shi)別(bie)出(chu)監測(ce)數據類別(bie)序列(lie)中(zhong)的k個(ge)(ge)實(shi)體(ti);
9、s2-3,對監測數(shu)據(ju)類(lei)別(bie)序列的(de)k個實體(ti)的(de)嵌入,采用注(zhu)意(yi)力機制獲取注(zhu)意(yi)力向量,將所述注(zhu)意(yi)力向量與監測數(shu)據(ju)類(lei)別(bie)序列中對應(ying)的(de)實體(ti)嵌入矩陣(zhen)相乘,從而得到(dao)監測數(shu)據(ju)類(lei)別(bie)序列中出現的(de)實體(ti)濃(nong)縮表示;
10、s-4,將步驟s2-3的(de)監測數據類別(bie)序(xu)列(lie)中出(chu)現的(de)實(shi)體濃縮表示與步驟s2-1的(de)每個知識圖譜實(shi)體節(jie)點的(de)嵌入表示進(jin)行匹配,得到構件實(shi)體的(de)概率(lv)。
11、進(jin)一(yi)步(bu)地,采(cai)用注意力(li)機(ji)制獲取(qu)注意力(li)向量,通(tong)過以下方式獲得:
12、
13、其中,softmax()為softmax激活函數;
14、表示he的轉(zhuan)置(zhi),he表示k個實(shi)體(ti)的實(shi)體(ti)嵌(qian)入矩(ju)陣;
15、wk和wq為(wei)可學習參(can)數(shu);
16、由(you)此(ci),得(de)到監(jian)測數據類別序列中(zhong)出(chu)現(xian)的實體(ti)濃縮表示ce:
17、ce=αhe。
18、進一步地,通(tong)過響應(ying)生成網(wang)絡得到風險構件(jian)概率,包括以下步驟(zou):
19、s201,采用transformer編碼(ma)器逐字編碼(ma)異常監測(ce)數據類(lei)型序列,得(de)到編碼(ma)器的輸出;
20、s202,然后采用transformer解碼器進行解碼:將編碼器的輸(shu)出(chu)與實體(ti)推薦網絡生成的實體(ti)的濃縮(suo)表示進行級(ji)聯(lian),將級(ji)聯(lian)結果(guo)先經過(guo)兩個全連接層,再通過(guo)softmax函數,得到上下文級(ji)別(bie)的構件的概率(lv)分布;
21、pres=softmax(wvwa[sj:ce])
22、其中,pres表示(shi)整張(zhang)詞匯(hui)表的概(gai)率(lv)分布(bu),包括(kuo)所有構件的概(gai)率(lv)分布(bu);
23、wv為(wei)與編(bian)碼器(qi)共享的詞嵌入矩陣;
24、wa為一個可(ke)訓練的(de)線性投影;
25、[sj:ce]表示解碼(ma)器狀態(tai),即(ji)將sj與ce進行級聯(拼接(jie));在每個解碼(ma)器時間(jian)步使用(yong)交叉熵對網絡進行訓(xun)練。
26、sj表示編碼器(qi)的輸出;
27、ce表(biao)(biao)示(shi)風險類別(bie)序列(lie)中出現的實體的濃縮(suo)表(biao)(biao)示(shi)。
28、進一步地,還包(bao)括:通過實體包(bao)損失得到最終的風險構件概(gai)率:
29、首先,對于響(xiang)應(ying)生成網絡的(de)(de)解(jie)碼(ma)器的(de)(de)每個(ge)時間步,我們計算知識圖譜中所有的(de)(de)m個(ge)實(shi)體的(de)(de)得分rj:
30、rj=hwb[sj:ce]+bent
31、其中,rj表示在解碼時間步j的所(suo)有m個實(shi)體的得分(fen)矩陣(zhen);
32、h表示rgcn生成的所有知識圖譜實體(ti)的嵌(qian)入(ru);
33、wb是用于(yu)維度對齊和偏(pian)置的可訓(xun)練矩陣;
34、bent表示(shi)偏置;
35、然后,判斷預測的(de)構件(jian)實體m是否存(cun)在(zai)(zai)一(yi)階(jie)鄰居,若存(cun)在(zai)(zai),則(ze)存(cun)在(zai)(zai)標簽0,若不存(cun)在(zai)(zai),則(ze)存(cun)在(zai)(zai)標簽1;并采用(yong)交叉熵損失函數計算標簽值與分(fen)(fen)數值的(de)差距,從而(er)更新分(fen)(fen)數rj;
36、得到構(gou)件實體m在(zai)響應生成網(wang)絡(luo)中(zhong)被預測(ce)的概率:
37、
38、其中,l為響應長度;
39、rjm是(shi)rj的第m個分量;
40、m為m構件實(shi)體中的(de)某一(yi)個實(shi)體,m為全部實(shi)體的(de)數(shu)量(liang);
41、sigmoid()是sigmoid函(han)數(shu);
42、最(zui)后,得到響(xiang)應生成網(wang)絡的(de)風險構件概(gai)率分布pall:
43、pall=pres+λ3pboe
44、式(shi)中(zhong)λ3為超參數。
45、進(jin)一(yi)步地,在得到編碼器的輸出后(hou),在解(jie)碼器之前,進(jin)行詞(ci)、實體(ti)嵌(qian)入(ru)對齊:
46、s=wv[e]wcce+balign
47、其(qi)中,wv[e]是只選擇wv中與實(shi)體標(biao)記相對應(ying)的行得到(dao)的矩陣;
48、wc是可訓練矩陣;
49、balign是偏置;
50、s表示ce跟wc的每個詞(ci)的相似度得(de)分;
51、對齊(qi)損失lalign表示為:
52、lalign=||s-q||2
53、其中,q表示(shi)指示(shi)向量;
54、||.||表示范數。
55、進一步(bu)地,響(xiang)應生(sheng)成網絡的目標函數為(wei):
56、ltotal=lgen+λ1lboe+λ2lalign
57、其中,lgen為響應網絡損失;
58、lboe為一階鄰居損失;
59、lalign為對齊損失;
60、λ1和λ2是(shi)兩個超參數。
61、綜(zong)上(shang)所述(shu)(shu),由于采用(yong)(yong)了(le)上(shang)述(shu)(shu)技術方案,本發(fa)(fa)明提出(chu)應用(yong)(yong)綜(zong)合管(guan)廊(lang)運(yun)維(wei)風(feng)(feng)險(xian)知識圖譜、結合生成式模型(xing),利(li)用(yong)(yong)歷史(shi)動(dong)態監測數據訓練,根據輸入的動(dong)態監測數據,推理生成風(feng)(feng)險(xian)分析結論,獲(huo)取(qu)排名靠前的數個隱患風(feng)(feng)險(xian)。通過本發(fa)(fa)明方法能快速、準確(que)地預測出(chu)管(guan)廊(lang)運(yun)維(wei)風(feng)(feng)險(xian)的風(feng)(feng)險(xian)類型(xing),從而提供基于風(feng)(feng)險(xian)信息(xi)的運(yun)維(wei)決(jue)策支持。
62、本發明相對于已有方法,具有以下的優勢與(yu)改進:
63、1、將基于(yu)動(dong)態(tai)數(shu)據的(de)風險預測(ce)建模為序列生成(cheng)(cheng)的(de)過程,利(li)用生成(cheng)(cheng)式語言模型(xing)訓(xun)練,有效利(li)用了(le)往期的(de)歷史預測(ce)數(shu)據,充分捕捉動(dong)態(tai)數(shu)據的(de)變化特性與(yu)隱患風險的(de)潛(qian)在關(guan)系;
64、2、使用(yong)知識(shi)圖譜嵌(qian)入代(dai)替知識(shi)圖譜查詢,克服了(le)基于數據庫(ku)操作的模版(ban)僵化、依(yi)賴(lai)于人(ren)工(gong)經驗的缺陷,利用(yong)訓練數據擬合最佳(jia)的風(feng)險預測(ce)邏輯,從而(er)提高(gao)了(le)預測(ce)風(feng)險的準確性;
65、3、結合知識(shi)圖譜基(ji)于(yu)輕量化模(mo)型推(tui)理(li),進一步提升了(le)風險預(yu)測的處理(li)速度與(yu)實時(shi)性。
66、本(ben)發(fa)明(ming)(ming)的附加方面和優(you)點將(jiang)在下(xia)面的描述中(zhong)部分(fen)給出,部分(fen)將(jiang)從下(xia)面的描述中(zhong)變得明(ming)(ming)顯(xian),或通過本(ben)發(fa)明(ming)(ming)的實踐了(le)解到。