中文字幕无码日韩视频无码三区

一種Ⅱ型糖尿病危險因素因果發現方法

文檔序(xu)號:39426906發布日(ri)期:2024-09-20 22:24閱(yue)讀:14來源:國知局(ju)
一種Ⅱ型糖尿病危險因素因果發現方法

本(ben)發(fa)明涉及醫(yi)療器械領(ling)域,尤其涉及一種(zhong)ⅱ型糖尿病危險因(yin)(yin)素因(yin)(yin)果發(fa)現方(fang)法,更(geng)為尤其涉及一種(zhong)基于改(gai)進變(bian)量序和強化學習的ⅱ型糖尿病危險因(yin)(yin)素因(yin)(yin)果發(fa)現方(fang)法。


背景技術:

1、隨(sui)著生活質量與模式改變,全世界糖尿病(bing)(bing)(bing)(bing)患者比例逐年(nian)攀高(gao),糖尿病(bing)(bing)(bing)(bing)已成為嚴重(zhong)威脅人(ren)類健(jian)康的(de)流行疾病(bing)(bing)(bing)(bing)。糖尿病(bing)(bing)(bing)(bing)危險(xian)因(yin)(yin)素備(bei)受(shou)醫學(xue)人(ren)員和研究(jiu)人(ren)員關注,如何有效分(fen)析(xi)糖尿病(bing)(bing)(bing)(bing)危險(xian)因(yin)(yin)素成為亟待解決的(de)問題。目前,國(guo)內外主(zhu)要從新危險(xian)因(yin)(yin)素發掘和危險(xian)因(yin)(yin)素關系分(fen)析(xi)兩(liang)個方(fang)面展開研究(jiu)。

2、糖(tang)尿(niao)病(bing)危(wei)(wei)險(xian)因(yin)素(su)(su)(su)研(yan)究不(bu)僅有利于(yu)(yu)深入剖(pou)析糖(tang)尿(niao)病(bing)病(bing)理生(sheng)理,更有利于(yu)(yu)對癥(zheng)下(xia)藥(yao)、減(jian)少(shao)藥(yao)物副作用。然而,現(xian)有t2dm危(wei)(wei)險(xian)因(yin)素(su)(su)(su)研(yan)究大多(duo)基(ji)于(yu)(yu)統(tong)計(ji)(ji)相關性分析,難(nan)以有效(xiao)(xiao)揭示(shi)危(wei)(wei)險(xian)因(yin)素(su)(su)(su)之(zhi)間因(yin)果(guo)(guo)關系,越來越多(duo)臨床決策(ce)需要因(yin)果(guo)(guo)知(zhi)識;同(tong)時現(xian)有糖(tang)尿(niao)病(bing)因(yin)果(guo)(guo)發(fa)現(xian)研(yan)究往往局限(xian)于(yu)(yu)小規模樣本(ben)(ben),難(nan)以直接用于(yu)(yu)高維(wei)特征臨床樣本(ben)(ben)的因(yin)果(guo)(guo)發(fa)現(xian)研(yan)究;同(tong)時,隨著數據維(wei)度增(zeng)加,算(suan)法計(ji)(ji)算(suan)成本(ben)(ben)也大幅(fu)增(zeng)加,如何提(ti)高因(yin)果(guo)(guo)發(fa)現(xian)算(suan)法計(ji)(ji)算(suan)效(xiao)(xiao)率(lv)也是(shi)更值得關注的問題(ti)。因(yin)此,結合變量(liang)序(xu)縮小搜素(su)(su)(su)空間、強(qiang)化(hua)學習(xi)強(qiang)提(ti)升尋優能力(li)、隨機(ji)森林快速計(ji)(ji)算(suan)特征貢獻度以及(ji)因(yin)果(guo)(guo)強(qiang)度能量(liang)化(hua)因(yin)果(guo)(guo)強(qiang)弱的優點,本(ben)(ben)發(fa)明提(ti)出一種基(ji)于(yu)(yu)改(gai)進變量(liang)序(xu)和強(qiang)化(hua)學習(xi)相結合的ⅱ型糖(tang)尿(niao)病(bing)危(wei)(wei)險(xian)因(yin)素(su)(su)(su)因(yin)果(guo)(guo)發(fa)現(xian)方法,為糖(tang)尿(niao)病(bing)預防與治(zhi)療(liao)提(ti)供新思路。

3、此外,一方面由于對本(ben)(ben)領域技(ji)術(shu)人員的理解存(cun)在(zai)差異;另一方面由于申請人做出本(ben)(ben)發明時研(yan)究了大量文獻和專利(li),但篇幅所(suo)限(xian)并未詳細(xi)羅列(lie)所(suo)有的細(xi)節與(yu)內容,然而(er)這絕(jue)非本(ben)(ben)發明不具備這些現(xian)有技(ji)術(shu)的特(te)征,相反本(ben)(ben)發明已經具備現(xian)有技(ji)術(shu)的所(suo)有特(te)征,而(er)且申請人保(bao)留在(zai)背景(jing)技(ji)術(shu)中增加相關現(xian)有技(ji)術(shu)之(zhi)權(quan)利(li)。


技術實現思路

1、本(ben)(ben)發明的目的是在于(yu)提(ti)供(gong)一種基于(yu)acorl的t2dm危險(xian)因(yin)素(su)(su)(su)因(yin)果(guo)(guo)(guo)發現方(fang)法(fa),針對現有ⅱ型糖尿(niao)病危險(xian)因(yin)素(su)(su)(su)的研(yan)究大多是基于(yu)統計相關性分析,難以揭示危險(xian)因(yin)素(su)(su)(su)之間因(yin)果(guo)(guo)(guo)關系(xi),且現有因(yin)果(guo)(guo)(guo)發現方(fang)法(fa)往往局限(xian)于(yu)小規模樣本(ben)(ben),難以解決高(gao)維數據的因(yin)果(guo)(guo)(guo)發現問題,結合變(bian)量(liang)序(xu)縮小搜(sou)素(su)(su)(su)空間、強化(hua)學習強提(ti)升尋優能力、隨(sui)機森林快速計算特(te)征貢獻度(du)以及因(yin)果(guo)(guo)(guo)強度(du)能量(liang)化(hua)因(yin)果(guo)(guo)(guo)強弱的優勢,提(ti)出了基于(yu)acorl的t2dm危險(xian)因(yin)素(su)(su)(su)因(yin)果(guo)(guo)(guo)發現方(fang)法(fa)。

2、為實現上述發(fa)明的(de)(de)目的(de)(de),本發(fa)明采取的(de)(de)技術方(fang)案如下:

3、如(ru)圖1、2、11所示(shi),一種(zhong)基于acorl的ⅱ型糖(tang)尿病(bing)危險因素(su)因果發現方法,包(bao)括如(ru)下步驟:

4、((1)進行原始數據預處理與標準化;

5、(2)引入基于acorl的因(yin)果(guo)發(fa)現方法,生成ⅱ型糖尿病危(wei)險因(yin)素初(chu)始因(yin)果(guo)結構;

6、(3)結合(he)逆信(xin)息熵計算初始因(yin)果(guo)結構(gou)的(de)因(yin)果(guo)強度,構(gou)建ⅱ型糖(tang)尿病危險(xian)因(yin)素因(yin)果(guo)發現模型;

7、(4)設計ⅱ型糖(tang)尿(niao)病(bing)危險因(yin)素(su)因(yin)果發現(xian)算法流程,得到(dao)ⅱ型糖(tang)尿(niao)病(bing)危險因(yin)素(su)最終因(yin)果結構。

8、進(jin)一步的,所述基于acorl的ⅱ型(xing)糖尿(niao)病危險因(yin)素因(yin)果發現方法(fa),其特征在于,進(jin)行原(yuan)始數據預處理與標(biao)準(zhun)化。z-score標(biao)準(zhun)化計算(suan)公式為:

9、

10、其中,x是(shi)個體觀測(ce)值(zhi),μ是(shi)總數(shu)據(ju)均值(zhi),σ是(shi)總數(shu)據(ju)標(biao)準差(cha)。

11、進(jin)一步的,引入基(ji)于acorl的因(yin)果(guo)發現方法(fa),生成(cheng)ⅱ型(xing)糖尿病(bing)危險因(yin)素初(chu)始因(yin)果(guo)結(jie)(jie)構。該方法(fa)包(bao)括兩個(ge)階(jie)段(duan):構建(jian)(jian)全(quan)連接因(yin)果(guo)結(jie)(jie)構與生成(cheng)初(chu)始因(yin)果(guo)結(jie)(jie)構。第一階(jie)段(duan)將因(yin)果(guo)圖(tu)搜索問(wen)題轉化(hua)為變量排(pai)序問(wen)題,利用強化(hua)學(xue)習構建(jian)(jian)得分最優(you)的全(quan)連接因(yin)果(guo)結(jie)(jie)構。第二階(jie)段(duan)使用統計學(xue)方法(fa),根據特(te)定閾值(zhi),修(xiu)剪全(quan)連接因(yin)果(guo)結(jie)(jie)構從而(er)得到初(chu)始因(yin)果(guo)結(jie)(jie)構。具(ju)體敘述如下:

12、(1)第一階段(duan)主要(yao)包括初(chu)始狀態構(gou)建、動作執行與轉態轉移(yi)、策略獎(jiang)勵回饋以(yi)及結構(gou)迭(die)代(dai)尋(xun)優(you)等步(bu)驟(zou)。具體步(bu)驟(zou)如下:

13、(1-1)構建初始狀態。為了優化(hua)算法(fa)搜索(suo)路徑,應(ying)充分考慮各危險(xian)因(yin)素重要(yao)程度(du),構建合理的初始狀態模型。首先,利用隨機森林計算數據集x={x1,x2…xn}中各個t2dm危險(xian)因(yin)素的貢獻(xian)度(du);其(qi)次,篩選d個貢獻(xian)度(du)較(jiao)大(da)的危險(xian)因(yin)素組成變量集合根據其(qi)貢獻(xian)度(du)生成相應(ying)權重

14、

15、最(zui)后(hou),基于公式(2)構(gou)建改進的加權初始狀態其(qi)計算(suan)公式為:

16、

17、其(qi)中,d為的(de)元素個(ge)數(shu),是每個(ge)特征(zheng)權重。編碼(ma)器對應的(de)狀態(tai)和初始(shi)狀態(tai)構成(cheng)了狀態(tai)空間其(qi)中,senc對應于解碼(ma)器的(de)狀態(tai)sdec為

18、(1-2)動(dong)(dong)(dong)作執行(xing)與轉態轉移(yi)(yi)。將(jiang)(jiang)變量(liang)選擇作為搜索動(dong)(dong)(dong)作,即每一步(bu)動(dong)(dong)(dong)作選擇一個(ge)變量(liang),從而生成(cheng)變量(liang)序,所有(you)動(dong)(dong)(dong)作構成(cheng)動(dong)(dong)(dong)作空間a:={a1,...,ad},|a|=d;狀態轉移(yi)(yi)與當前決策所選擇的(de)動(dong)(dong)(dong)作有(you)關。在第t步(bu)根據(ju)動(dong)(dong)(dong)作at選擇了(le)變量(liang)xj,xj通(tong)過編碼(ma)(ma)器將(jiang)(jiang)狀態轉移(yi)(yi)到sj∈senc,而解碼(ma)(ma)器第t+1步(bu)的(de)狀態與編碼(ma)(ma)器的(de)第j步(bu)狀態一致,即

19、(1-3)策略(lve)獎(jiang)(jiang)勵(li)回饋。通過(guo)計(ji)算(suan)變(bian)量排序(xu)(xu)的得分(fen),認為具有最大獎(jiang)(jiang)勵(li)的搜索排序(xu)(xu)是真實(shi)因果圖(tu)的拓撲排序(xu)(xu),計(ji)算(suan)變(bian)量排序(xu)(xu)獎(jiang)(jiang)勵(li)的分(fen)數(shu)函數(shu)如(ru)下:

20、

21、其中,t=d-1,l代表(biao)排序,gl表(biao)示根據(ju)排序l創建的(de)全連接圖,sbic(gl)根據(ju)該圖計算的(de)貝(bei)葉斯信(xin)息準則的(de)值(zhi)。而對于sbic的(de)定(ding)義有:

22、

23、其(qi)中(zhong),是xj的(de)(de)第k個觀測值,θj是與(yu)每個似然(ran)相(xiang)關聯(lian)的(de)(de)參(can)(can)數,|θj|表示參(can)(can)數維數,m為(wei)數據(ju)集(ji)x的(de)(de)數據(ju)量。將pa(xj)替(ti)換為(wei)潛(qian)在(zai)父變(bian)量集(ji)u(xj):

24、

25、其中(zhong),u(xj)表示(shi)l中(zhong)在變(bian)量xj前面的(de)變(bian)量集合。

26、(1-4)結構迭代尋優(you)(you)。在(zai)尋優(you)(you)過程(cheng)中,首(shou)先根(gen)據公式(4)得到(dao)變(bian)量(liang)排(pai)(pai)序獎勵分數,用于反映了模(mo)型對于變(bian)量(liang)排(pai)(pai)序的(de)好壞(huai)程(cheng)度;其次,將所得分數輸入(ru)actor-critic算法,對編(bian)碼(ma)(ma)-解碼(ma)(ma)器模(mo)型參數進行訓(xun)練,再使(shi)用更(geng)新的(de)編(bian)碼(ma)(ma)-解碼(ma)(ma)器生成因(yin)果(guo)(guo)結構;最(zui)后,循環迭代搜(sou)索最(zui)優(you)(you)因(yin)果(guo)(guo)結果(guo)(guo),直到(dao)達到(dao)迭代終止(zhi)條件。

27、本發明采(cai)用transformer編碼(ma)器(qi)(qi)(qi)將觀測數據映射(she)到狀(zhuang)態空(kong)間使用基于lstm的解(jie)碼(ma)器(qi)(qi)(qi)將狀(zhuang)態空(kong)間映射(she)到動作(zuo)空(kong)間通過掩(yan)碼(ma)來限制每個(ge)變量只(zhi)能(neng)被選擇一次,從(cong)而生成(cheng)有(you)效(xiao)的變量序;采(cai)用策略梯度來優(you)化編碼(ma)-解(jie)碼(ma)器(qi)(qi)(qi)模(mo)型參數,策略梯度公式如下:

28、

29、其中,φ={φe,φd},φe和φd分別是(shi)與(yu)編碼器fenc和解(jie)碼器fdec相關參數(shu),是(shi)由(you)φ參數(shu)化(hua)的策略。

30、(2)第(di)二階段(duan)通過(guo)剪枝法得到(dao)初始因(yin)果結構。具體步驟如下:

31、首先,對第一(yi)階段輸出全連接因果結構gl,遍歷每對變量,通過(guo)線性回歸模(mo)型計算因果邊的(de)系(xi)數,定義線性回歸模(mo)型如下:

32、

33、其中,yi是(shi)(shi)預測(ce)值,βij是(shi)(shi)節點(dian)i和節點(dian)j之間的線(xian)性回歸系數,xj是(shi)(shi)節點(dian)j的特(te)征,εi是(shi)(shi)誤(wu)差項。

34、其次(ci),比較(jiao)每條因(yin)果邊的回歸系數與剪枝閾(yu)值(zhi)thresh,,當(dang)|βij|<thresh時,將邊(i,j)進(jin)行剪枝,反之(zhi)則保留

35、最后,遍歷全連接因(yin)果(guo)結(jie)(jie)構gl,刪(shan)除閾值較小的因(yin)果(guo)邊,輸出初始因(yin)果(guo)結(jie)(jie)構g。

36、進一步的(de),結(jie)合逆(ni)信息(xi)熵計算初始因(yin)(yin)(yin)果(guo)(guo)結(jie)構(gou)的(de)因(yin)(yin)(yin)果(guo)(guo)強度,構(gou)建ⅱ型糖尿病危險(xian)因(yin)(yin)(yin)素因(yin)(yin)(yin)果(guo)(guo)發現模型。為消除因(yin)(yin)(yin)果(guo)(guo)強度與真實強度的(de)偏差,故使用標準化逆(ni)信息(xi)熵因(yin)(yin)(yin)果(guo)(guo)強度,其定義如下:

37、

38、其(qi)中,s(px1,n),s(px2,n)分別(bie)為(wei)變量x1,x2數據標準化之后的信息熵(shang)。

39、進一(yi)步的,設計ⅱ型(xing)糖尿病危(wei)(wei)險因(yin)素(su)因(yin)果發現(xian)算法流(liu)程(cheng),得到(dao)最終(zhong)ⅱ型(xing)糖尿病危(wei)(wei)險因(yin)素(su)因(yin)果結構。算法流(liu)程(cheng)如下所(suo)示(shi):

40、步驟1:輸入糖尿病(bing)危險(xian)因(yin)素的觀(guan)察(cha)數(shu)(shu)(shu)據,并對(dui)觀(guan)察(cha)數(shu)(shu)(shu)據進(jin)行標(biao)準(zhun)化,設置迭代(dai)次(ci)數(shu)(shu)(shu)n、評分函(han)數(shu)(shu)(shu)等超(chao)參數(shu)(shu)(shu)。

41、步(bu)驟(zou)2:從(cong)數(shu)據集(ji)中隨機(ji)抽取一批樣本并編碼,利用隨機(ji)森(sen)林(lin)計算當前數(shu)據集(ji)特征貢獻度(du),篩選具(ju)有權(quan)重的變量集(ji)合,進而根據公(gong)式構建初始狀態。

42、步(bu)驟3:使用編碼-解碼器生成變量序,經過每(mei)次迭代,收集當前狀態、對應動作(zuo)、獎勵及策(ce)略,存入緩(huan)沖區。

43、步驟4:檢查當前(qian)動作(zuo)(zuo)序列(lie)和(he)獎勵(li)是否已在(zai)緩沖區中記(ji)錄(lu),若不在(zai),則添加,用(yong)于記(ji)錄(lu)已評估過的動作(zuo)(zuo)序列(lie)和(he)獎勵(li)。

44、步驟5:如果第i次迭代獎勵(li)總(zong)和(he)(he)大于第i-1次獎勵(li)總(zong)和(he)(he),則(ze)用最大者更新當(dang)前獎勵(li)總(zong)和(he)(he)以(yi)及當(dang)前排(pai)序(xu)序(xu)列。

45、步(bu)驟6:判斷迭代次數是否大于(yu)n,若大于(yu)n,則得到變(bian)量序對應的全(quan)連接因果結構(gou),通(tong)過剪枝(zhi)獲得最(zui)終(zhong)因果結構(gou);否則,返回步(bu)驟2。

46、步驟7:根據步驟6所(suo)輸出的有(you)向圖,利(li)用(yong)標準化數據計算因果(guo)強(qiang)度。

47、步驟8:輸出最終因果結(jie)構。

48、由于糖(tang)尿(niao)病(bing)的(de)影響因素(su)眾多,現(xian)有ⅱ型糖(tang)尿(niao)病(bing)危險(xian)因素(su)研(yan)究(jiu)大(da)多基(ji)于統計(ji)(ji)相關性分析(xi),難以揭示危險(xian)因素(su)之(zhi)間因果(guo)關系,同時(shi)現(xian)有糖(tang)尿(niao)病(bing)因果(guo)發(fa)現(xian)研(yan)究(jiu)往(wang)往(wang)局(ju)限于小規(gui)模樣本,難以直(zhi)接用于高(gao)維(wei)(wei)特征臨床樣本因果(guo)發(fa)現(xian)研(yan)究(jiu);同時(shi),隨(sui)(sui)著數據(ju)維(wei)(wei)度增(zeng)加,算(suan)法計(ji)(ji)算(suan)成本也(ye)大(da)幅(fu)增(zeng)加,如何(he)提(ti)高(gao)因果(guo)發(fa)現(xian)算(suan)法計(ji)(ji)算(suan)效率(lv)也(ye)是(shi)需(xu)要關注的(de)問題(ti)。因此(ci),結(jie)合變量序縮小搜素(su)空間、強化(hua)學習(xi)強提(ti)升尋優能力以及隨(sui)(sui)機森林快速計(ji)(ji)算(suan)特征貢獻度的(de)優點,本發(fa)明(ming)提(ti)出一(yi)種基(ji)于acorl相結(jie)合的(de)ⅱ型糖(tang)尿(niao)病(bing)危險(xian)因素(su)因果(guo)發(fa)現(xian)方法。

49、本發明相對于(yu)現有技術的有益效果是:

50、結合變量序縮小(xiao)搜素空間、強(qiang)化(hua)學(xue)習強(qiang)提(ti)升尋優能力、隨(sui)機森林快速計算特征貢獻度以及(ji)因果強(qiang)度能量化(hua)因果強(qiang)弱的優點,通(tong)過基于acorl的ⅱ型糖尿(niao)病(bing)危險(xian)因素因果發現方法(fa),可有(you)效發現ⅱ型糖尿(niao)病(bing)危險(xian)因素的因果關系,為糖尿(niao)病(bing)防治與研究提(ti)供(gong)方案。

當前第1頁1 2 
網友詢問留(liu)言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1