本發明(ming)屬于疾(ji)病預測(ce),涉及到(dao)一種疾(ji)病遺(yi)傳風(feng)險評估的基因檢(jian)測(ce)方法(fa)。
背景技術:
0、技術背景
1、疾(ji)病預(yu)測技術領域利用分(fen)子生物學(xue)、遺傳學(xue)、生物信(xin)息(xi)學(xue)和計算生物學(xue)等多(duo)學(xue)科交叉的知識和技術,對個(ge)體的基(ji)因組數據(ju)進行分(fen)析,以(yi)識別可(ke)能(neng)增(zeng)加某些疾(ji)病風險的遺傳變異,對于早期診斷(duan)、預(yu)防性治療(liao)以(yi)及個(ge)性化醫療(liao)提供了重要支持(chi)。
2、基因檢(jian)(jian)測是(shi)利用遺傳學(xue)、分(fen)子生物學(xue)技(ji)術來進(jin)行(xing)檢(jian)(jian)測、分(fen)析(xi),從而發現特定遺傳物質(zhi)異常的(de)過(guo)程。通過(guo)血液(ye)、其他體液(ye)、或(huo)細(xi)胞對(dui)dna進(jin)行(xing)檢(jian)(jian)測的(de)技(ji)術,取被檢(jian)(jian)測者(zhe)外周靜脈(mo)血或(huo)其他組織(zhi)細(xi)胞,擴增其基因信息(xi)后,通過(guo)特定設備對(dui)被檢(jian)(jian)測者(zhe)細(xi)胞中(zhong)的(de)dna分(fen)子信息(xi)作檢(jian)(jian)測,分(fen)析(xi)其所含(han)有的(de)基因類型和(he)基因缺陷及其表達功能是(shi)否正常的(de)方法,從而使人(ren)們(men)能了解自(zi)己的(de)基因信息(xi),明確(que)病(bing)因或(huo)預知身體患某種疾病(bing)的(de)風險(xian)。
3、現有技(ji)術常常未(wei)能(neng)(neng)充分優化來自不同樣本的測(ce)(ce)量(liang)偏差,導致(zhi)數(shu)據分析結果可能(neng)(neng)受(shou)到影響(xiang),這在實際操作中(zhong)(zhong)降低了(le)風險(xian)評(ping)估(gu)的準(zhun)確(que)性(xing)(xing)(xing)和可靠性(xing)(xing)(xing)。未(wei)進行詳盡的生物標記(ji)篩選,可能(neng)(neng)忽視了(le)一些關鍵的疾病預(yu)測(ce)(ce)指(zhi)標,減(jian)少了(le)疾病預(yu)測(ce)(ce)模型的全面性(xing)(xing)(xing)和適用性(xing)(xing)(xing)。例如,若基因數(shu)據中(zhong)(zhong)含有來自實驗條件(jian)變化的批次效(xiao)應(ying)未(wei)被糾正,可能(neng)(neng)會導致(zhi)對某些疾病風險(xian)的過(guo)度估(gu)計或低估(gu),進而影響(xiang)到疾病的早(zao)期診斷和預(yu)防治療的策略制定(ding)。
技術實現思路
1、鑒于(yu)以上(shang)現有技術(shu)存在的問(wen)題(ti),本發明提供一種疾病遺傳(chuan)風險評估的基(ji)因檢測方法,用于(yu)解(jie)決據上(shang)述技術(shu)問(wen)題(ti)。
2、為了實現(xian)上述目(mu)(mu)的及其他目(mu)(mu)的,本(ben)發明(ming)采(cai)用的技術方案如(ru)下:
3、本(ben)發明一(yi)方(fang)面(mian)提供了一(yi)種疾病(bing)遺傳風險評估的基因檢測方(fang)法,該方(fang)法包括:
4、步驟(zou)一:基于參與(yu)者定期(qi)健(jian)康檢查(cha)周期(qi),采(cai)集研究參與(yu)者的血液(ye)(ye)樣本,對血液(ye)(ye)中(zhong)的dna分子(zi)進行(xing)分析,并對基因進行(xing)識(shi)別(bie),生成初(chu)始基因序(xu)列數據;
5、步驟二:執(zhi)行數據(ju)歸一化處(chu)理,通(tong)過調整樣(yang)本間測量偏差(cha)優化數據(ju),得到(dao)均(jun)衡基因表達(da)集;
6、步驟(zou)三:采用隱馬爾可夫模(mo)型,通過識別和記錄基(ji)因活動的變化模(mo)式(shi),形成基(ji)因表達狀態(tai)序(xu)列;
7、步驟四:采用力導向布局(ju)算法,對數(shu)據進行(xing)結構化分析,繪(hui)制(zhi)出因(yin)表達數(shu)據的結構圖,得到基因(yin)數(shu)據拓撲結構圖;
8、步驟五:篩(shai)選與疾病風險高(gao)度相關的生物標(biao)(biao)記,并進行識別和篩(shai)選,形成(cheng)風險生物標(biao)(biao)記集(ji);
9、步(bu)驟六:測(ce)試疾(ji)(ji)病預測(ce)效(xiao)能,并(bing)進(jin)行分析,建立個體疾(ji)(ji)病風(feng)險評估模(mo)型;
10、步驟七:對參(can)與者的未來健(jian)康狀況進行風險(xian)評估,生成遺傳風險(xian)分(fen)析信(xin)息。
11、作為本發明的(de)進(jin)一步方案,所述步驟一中,初(chu)始(shi)基因(yin)序列數據包(bao)括基因(yin)的(de)編碼序列信息、表達量(liang)指(zhi)標、時間點(dian)樣(yang)本標記。
12、作為本(ben)發明的(de)進一步(bu)方案,所(suo)述步(bu)驟(zou)二中,基(ji)于(yu)所(suo)述初始基(ji)因(yin)序列數據(ju)(ju),進行數據(ju)(ju)完整性(xing)審(shen)核,剔除含缺失(shi)值或超閾值的(de)記錄,并檢測異常值,對(dui)數據(ju)(ju)轉換處理,均勻(yun)化數據(ju)(ju)分布(bu),并調(diao)整每個數據(ju)(ju)點(dian)到(dao)標準正態(tai)分布(bu),得(de)到(dao)均衡基(ji)因(yin)表(biao)達集。
13、作為(wei)本發明(ming)的進一步方(fang)案,所述步驟三中,基(ji)于所述均衡基(ji)因(yin)表(biao)達集,提取dna,并(bing)進行徹底洗脫去除殘留(liu)雜質,分析基(ji)因(yin)表(biao)達數據,計算并(bing)篩選(xuan)出偏(pian)差超標(biao)的基(ji)因(yin),采(cai)用隱馬爾可(ke)夫模型(xing),分析周期性波(bo)動,生(sheng)成基(ji)因(yin)表(biao)達狀態序列。
14、作為本發明的(de)(de)進(jin)一步方案(an),所(suo)述基(ji)(ji)因(yin)(yin)表(biao)達狀態序(xu)(xu)列基(ji)(ji)于(yu)所(suo)述均衡基(ji)(ji)因(yin)(yin)表(biao)達集,提取dna,通(tong)過(guo)使用細胞裂(lie)解溶液(ye)和(he)(he)機(ji)械破(po)(po)碎技術,破(po)(po)裂(lie)細胞并釋放(fang)dna,并進(jin)行多步離心(xin)和(he)(he)過(guo)濾,并通(tong)過(guo)洗滌劑和(he)(he)高鹽緩沖液(ye)徹(che)底洗脫(tuo)dna,去除蛋白質和(he)(he)其他細胞雜質,同時檢(jian)測dna的(de)(de)質量和(he)(he)完(wan)整(zheng)度,分析基(ji)(ji)因(yin)(yin)表(biao)達數(shu)據,并量化基(ji)(ji)因(yin)(yin)表(biao)達水(shui)平,計(ji)算基(ji)(ji)因(yin)(yin)表(biao)達的(de)(de)標準(zhun)偏(pian)差,篩(shai)選出偏(pian)差超(chao)標的(de)(de)基(ji)(ji)因(yin)(yin),評(ping)估基(ji)(ji)因(yin)(yin)表(biao)達的(de)(de)周(zhou)(zhou)期性(xing)(xing)波動,并采用隱馬爾可夫模(mo)型識別(bie)周(zhou)(zhou)期性(xing)(xing)模(mo)式,生成基(ji)(ji)因(yin)(yin)表(biao)達狀態序(xu)(xu)列;
15、所述隱馬爾(er)可夫模(mo)型,按照公式:
16、
17、其中:p(o|q)表示給定隱藏狀態(tai)序列(lie)q下,觀察序列(lie)o出現的(de)(de)(de)總概率,λ為(wei)歸一化系(xi)數(shu),表示對時間序列(lie)從t=1到t的(de)(de)(de)所有時間點(dian)中進行的(de)(de)(de)連乘(cheng)操作,p(ot|qt)為(wei)觀測到ot的(de)(de)(de)概率,αt是前向(xiang)概率,βt是后向(xiang)概率,γ(qt,ot)是權(quan)重因子;
18、執行過(guo)程:計算(suan)每個時(shi)間點(dian)t下(xia)給定(ding)隱(yin)藏(zang)狀(zhuang)(zhuang)(zhuang)態(tai)qt時(shi)觀(guan)測值ot出現(xian)的(de)概(gai)率(lv)p(ot|qt),通(tong)過(guo)動態(tai)規劃前向概(gai)率(lv)αt和(he)后向概(gai)率(lv)βt并進行計算(suan),系(xi)統處(chu)于狀(zhuang)(zhuang)(zhuang)態(tai)qt的(de)概(gai)率(lv),引(yin)入相(xiang)關性(xing)權重γ(qt,ot),調整狀(zhuang)(zhuang)(zhuang)態(tai)和(he)觀(guan)測之間的(de)關聯強(qiang)度,乘(cheng)以(yi)歸(gui)一化(hua)系(xi)數λ,計算(suan)觀(guan)測序列o在(zai)給定(ding)隱(yin)藏(zang)狀(zhuang)(zhuang)(zhuang)態(tai)序列q條件下(xia)的(de)整體(ti)概(gai)率(lv)。
19、作為本(ben)發(fa)明的進(jin)一(yi)步方案,所述步驟四(si)中,基(ji)于所述基(ji)因(yin)(yin)表達狀(zhuang)態序列,對各基(ji)因(yin)(yin)表達值(zhi)進(jin)行歸一(yi)化處理,將數(shu)據(ju)轉換為標準正態分布(bu),計算基(ji)因(yin)(yin)間(jian)的表達關聯性,并根(gen)據(ju)得(de)到的相關系(xi)數(shu)建立(li)基(ji)因(yin)(yin)之(zhi)間(jian)的連(lian)接(jie),使用力導向布(bu)局算法對網絡圖(tu)(tu)進(jin)行空(kong)間(jian)優化,調(diao)整(zheng)節點位置(zhi),生成基(ji)因(yin)(yin)數(shu)據(ju)拓撲結(jie)構(gou)圖(tu)(tu);
20、所述力導向(xiang)布(bu)局(ju)算法(fa),按照(zhao)公式(shi):
21、
22、其中(zhong):f為(wei)(wei)(wei)作用于節(jie)(jie)點(dian)的力(li),k為(wei)(wei)(wei)彈簧常數(shu)(shu),d為(wei)(wei)(wei)節(jie)(jie)點(dian)間實際距離,dopt為(wei)(wei)(wei)節(jie)(jie)點(dian)間理(li)想(xiang)(xiang)距離,α為(wei)(wei)(wei)速度(du)(du)調整(zheng)系數(shu)(shu),v為(wei)(wei)(wei)當(dang)前節(jie)(jie)點(dian)速度(du)(du),vopt為(wei)(wei)(wei)理(li)想(xiang)(xiang)節(jie)(jie)點(dian)移動速度(du)(du),β為(wei)(wei)(wei)網絡(luo)密度(du)(du)調節(jie)(jie)因(yin)子,n為(wei)(wei)(wei)網絡(luo)中(zhong)的節(jie)(jie)點(dian)總數(shu)(shu);
23、執(zhi)行(xing)過程:彈(dan)簧常數k控制距(ju)離調節(jie)力(li),基(ji)于距(ju)離d和(he)理(li)想距(ju)離dopt之(zhi)差(cha)的(de)(de)基(ji)本斥力(li)和(he)吸引力(li),表示基(ji)因(yin)間可(ke)能的(de)(de)相互作用力(li),速(su)度(du)調整系(xi)數α控制速(su)度(du)調節(jie)力(li),結(jie)合(he)當前(qian)節(jie)點速(su)度(du)v和(he)理(li)想速(su)度(du)vopt動(dong)態(tai)調整節(jie)點的(de)(de)移動(dong),模擬基(ji)因(yin)表達(da)變化(hua)的(de)(de)速(su)率和(he)對疾(ji)病風險預測的(de)(de)實時(shi)影響,β通(tong)過參(can)照網(wang)絡中(zhong)節(jie)點的(de)(de)總數n,調整密度(du)調節(jie)力(li),根(gen)據對數函數,平(ping)滑處(chu)理(li)大(da)規模網(wang)絡的(de)(de)效果。
24、作為本發明的(de)進(jin)一(yi)步(bu)方案,所(suo)述步(bu)驟(zou)五中,基(ji)于所(suo)述基(ji)因數據拓撲(pu)結構(gou)圖,分析圖中節點(dian)的(de)連接性(xing)和表達強度(du),識別與(yu)疾病有關聯性(xing)的(de)節點(dian),對(dui)標記(ji)的(de)表達模(mo)式進(jin)行(xing)分析,比較每個標記(ji)與(yu)疾病案例的(de)匹(pi)配度(du),篩選關鍵標記(ji),生(sheng)成風險生(sheng)物標記(ji)集。
25、作為本發明的進(jin)(jin)(jin)(jin)一(yi)步(bu)方案,所(suo)述(shu)步(bu)驟六中,基于所(suo)述(shu)風險(xian)(xian)生物標(biao)(biao)記集,進(jin)(jin)(jin)(jin)行(xing)(xing)數(shu)據(ju)分類,根據(ju)病(bing)種相關(guan)性對每個標(biao)(biao)記進(jin)(jin)(jin)(jin)行(xing)(xing)排序(xu),并(bing)建立索(suo)引,整理成(cheng)結構(gou)化表格形式,并(bing)進(jin)(jin)(jin)(jin)行(xing)(xing)統計分析,比較每個標(biao)(biao)記與已知疾病(bing)案例的匹配度,評估(gu)每個標(biao)(biao)記與疾病(bing)的關(guan)聯性,并(bing)進(jin)(jin)(jin)(jin)行(xing)(xing)整合(he),為參與者計算風險(xian)(xian)評分,生成(cheng)個體(ti)疾病(bing)風險(xian)(xian)評估(gu)模型。
26、作為本發明的進一(yi)步方案,所述步驟(zou)七中,基(ji)于(yu)所述個體疾病風(feng)險(xian)評估模(mo)型,收集并整理參與者(zhe)的健康記錄,匹配模(mo)型的輸入格式,并進行分析,計算(suan)每位參與者(zhe)的疾病風(feng)險(xian)得分,匯總(zong)得分和(he)健康狀況信(xin)息(xi)(xi),生成遺(yi)傳風(feng)險(xian)分析信(xin)息(xi)(xi)。
27、如(ru)上(shang)所(suo)述,本(ben)發(fa)明提供的一種(zhong)疾病(bing)遺傳風險(xian)評(ping)估的基因檢測方法,至少具有(you)以下有(you)益效果:
28、本發明中,通過采用(yong)隱馬爾可夫(fu)模(mo)型(xing)識別(bie)并(bing)記(ji)錄基因(yin)活動的(de)(de)變化(hua)(hua)模(mo)式,有(you)效地捕捉基因(yin)表達(da)的(de)(de)動態(tai)變化(hua)(hua),提(ti)(ti)高了(le)對(dui)復雜遺傳信息的(de)(de)理解,使疾病預(yu)測更加(jia)準(zhun)確和敏感,力(li)導向布局算法對(dui)數據進行結構(gou)化(hua)(hua)分析(xi),通過生(sheng)成基因(yin)數據的(de)(de)拓撲(pu)結構(gou)圖,增強了(le)數據的(de)(de)可解釋性和可視化(hua)(hua)水平,為(wei)科(ke)研人員提(ti)(ti)供了(le)直觀(guan)的(de)(de)工具,識別(bie)與疾病風險高度(du)相關的(de)(de)關鍵(jian)生(sheng)物標記(ji),促(cu)進了(le)個體化(hua)(hua)醫(yi)療(liao)和早期診斷(duan)的(de)(de)效率(lv),為(wei)疾病管(guan)理和預(yu)防(fang)提(ti)(ti)供了(le)有(you)力(li)支持。