本發明涉(she)及(ji)一種生物(wu)學信(xin)息(xi)學、智能優化、計算機應用領域(yu),尤(you)其涉(she)及(ji)的是,一種基于(yu)局(ju)部抽象凸支(zhi)撐面的多策略群體蛋白質結構預(yu)測方法。
背景技術:
生(sheng)物細(xi)胞中(zhong)包含許多由20多種氨基(ji)酸所形成(cheng)的(de)(de)(de)(de)長(chang)鏈折疊而成(cheng)的(de)(de)(de)(de)蛋(dan)(dan)白(bai)(bai)質(zhi),蛋(dan)(dan)白(bai)(bai)質(zhi)結(jie)構(gou)預測(ce)(ce)(ce)問(wen)題是當今計(ji)(ji)算(suan)(suan)生(sheng)物學領域中(zhong)的(de)(de)(de)(de)研(yan)究熱點(dian),不(bu)僅具(ju)有非常重(zhong)要(yao)的(de)(de)(de)(de)理論機制,而且對新(xin)蛋(dan)(dan)白(bai)(bai)的(de)(de)(de)(de)設計(ji)(ji)、蛋(dan)(dan)白(bai)(bai)質(zhi)之間相互作用(yong)建模、藥物標靶蛋(dan)(dan)白(bai)(bai)的(de)(de)(de)(de)設計(ji)(ji)具(ju)有十分重(zhong)要(yao)的(de)(de)(de)(de)指導意義。目前,最常用(yong)的(de)(de)(de)(de)蛋(dan)(dan)白(bai)(bai)質(zhi)結(jie)構(gou)實驗(yan)測(ce)(ce)(ce)定(ding)(ding)方法(fa)包括X-晶(jing)(jing)(jing)體衍射和(he)核磁共振(zhen),但是上述兩(liang)種蛋(dan)(dan)白(bai)(bai)質(zhi)結(jie)構(gou)測(ce)(ce)(ce)定(ding)(ding)方法(fa)存(cun)在(zai)一(yi)定(ding)(ding)的(de)(de)(de)(de)缺陷(xian),無(wu)法(fa)滿足所有蛋(dan)(dan)白(bai)(bai)質(zhi)結(jie)構(gou)預測(ce)(ce)(ce)的(de)(de)(de)(de)需求。例如,對于一(yi)些不(bu)易結(jie)晶(jing)(jing)(jing)的(de)(de)(de)(de)蛋(dan)(dan)白(bai)(bai),無(wu)法(fa)使用(yong)X-晶(jing)(jing)(jing)體衍射方法(fa)進(jin)行測(ce)(ce)(ce)定(ding)(ding);使用(yong)核磁共振(zhen)房產(chan)測(ce)(ce)(ce)定(ding)(ding)一(yi)個蛋(dan)(dan)白(bai)(bai)的(de)(de)(de)(de)結(jie)構(gou)費用(yong)較大(da)(大(da)約(yue)15萬美(mei)元),并且極其費時(shi)(大(da)約(yue)需要(yao)半年)。因此,如何以計(ji)(ji)算(suan)(suan)機為(wei)工具(ju),運用(yong)適當的(de)(de)(de)(de)算(suan)(suan)法(fa),從氨基(ji)酸序列出發直接(jie)預測(ce)(ce)(ce)蛋(dan)(dan)白(bai)(bai)質(zhi)的(de)(de)(de)(de)三維結(jie)構(gou),成(cheng)為(wei)當前生(sheng)物信(xin)息學中(zhong)一(yi)種重(zhong)要(yao)的(de)(de)(de)(de)研(yan)究課題。
1965年(nian),Anfinsen等提出(chu)了蛋白(bai)質的(de)(de)(de)一(yi)級結構(gou)完全決(jue)定了其(qi)三(san)維(wei)空間結構(gou)的(de)(de)(de)著名(ming)論(lun)(lun)(lun)斷,這(zhe)一(yi)論(lun)(lun)(lun)斷使得根據蛋白(bai)質得氨基酸序(xu)(xu)列從(cong)理論(lun)(lun)(lun)上(shang)預(yu)測其(qi)相應的(de)(de)(de)空間結構(gou)成為了現實。從(cong)熱力學角度來(lai)看(kan),也就是說(shuo)蛋白(bai)質的(de)(de)(de)天(tian)然態(tai)(tai)結構(gou)通常(chang)對(dui)(dui)應著能(neng)量(liang)最(zui)低的(de)(de)(de)構(gou)象(xiang)(xiang)。因(yin)此(ci),從(cong)氨基酸序(xu)(xu)列出(chu)發,以能(neng)量(liang)函數來(lai)衡量(liang)構(gou)象(xiang)(xiang)的(de)(de)(de)質量(liang),采用適當的(de)(de)(de)算(suan)(suan)法(fa)搜索(suo)能(neng)量(liang)模(mo)型中(zhong)最(zui)小能(neng)量(liang)構(gou)象(xiang)(xiang),從(cong)而預(yu)測蛋白(bai)質的(de)(de)(de)天(tian)然態(tai)(tai)結構(gou),已成為計算(suan)(suan)生物信(xin)息學中(zhong)重要的(de)(de)(de)研究課(ke)題之(zhi)一(yi)。目前,最(zui)常(chang)用的(de)(de)(de)預(yu)測方法(fa)可以劃(hua)分(fen)為以下三(san)類:針對(dui)(dui)高相似(si)序(xu)(xu)列的(de)(de)(de)同源(yuan)建模(mo)方法(fa);針對(dui)(dui)較低相似(si)性序(xu)(xu)列的(de)(de)(de)折疊識別(bie)方法(fa);以及不依賴模(mo)板的(de)(de)(de)從(cong)頭(tou)預(yu)測方法(fa)(ab initio或de novo)。經過20多(duo)年(nian)的(de)(de)(de)發展歷(li)程表(biao)明,對(dui)(dui)于(yu)序(xu)(xu)列相似(si)度較高的(de)(de)(de)情(qing)(qing)況(kuang)(>50%),TBM預(yu)測精度能(neng)夠達到左右;然而,序(xu)(xu)列相似(si)度<30%的(de)(de)(de)情(qing)(qing)況(kuang)下并不理想;對(dui)(dui)于(yu)序(xu)(xu)列相似(si)度<20%或寡肽(<10個殘基的(de)(de)(de)小蛋白(bai))來(lai)說(shuo),從(cong)頭(tou)預(yu)測方法(fa)是唯一(yi)的(de)(de)(de)選擇。
從(cong)頭預測方(fang)(fang)法(fa)(fa)(fa)直接基于(yu)(yu)(yu)Anfinsen假說建立蛋白質(zhi)(zhi)(zhi)物理或知(zhi)識能量(liang)(liang)模(mo)型(xing),然后設計適當優(you)化(hua)(hua)(hua)(hua)算(suan)法(fa)(fa)(fa)求解最(zui)小能量(liang)(liang)構(gou)(gou)象(xiang)(xiang)。可以看出,從(cong)頭預測方(fang)(fang)法(fa)(fa)(fa)必須(xu)考慮(lv)以下兩個因(yin)素:(1)知(zhi)識能量(liang)(liang)的(de)(de)(de)構(gou)(gou)建;(2)構(gou)(gou)象(xiang)(xiang)空(kong)間搜索方(fang)(fang)法(fa)(fa)(fa)。第一個因(yin)素本質(zhi)(zhi)(zhi)上(shang)(shang)(shang)屬于(yu)(yu)(yu)分(fen)子(zi)力(li)學問(wen)題(ti),主要(yao)是(shi)(shi)為(wei)了能夠計算(suan)得到每個蛋白質(zhi)(zhi)(zhi)結構(gou)(gou)對應(ying)的(de)(de)(de)能量(liang)(liang)值。第二個因(yin)素本質(zhi)(zhi)(zhi)上(shang)(shang)(shang)屬于(yu)(yu)(yu)全局優(you)化(hua)(hua)(hua)(hua)問(wen)題(ti),通過選擇一種合適的(de)(de)(de)優(you)化(hua)(hua)(hua)(hua)方(fang)(fang)法(fa)(fa)(fa),對構(gou)(gou)象(xiang)(xiang)空(kong)間進行快速搜索,得到能量(liang)(liang)最(zui)低構(gou)(gou)象(xiang)(xiang)。其中(zhong)(zhong),蛋白質(zhi)(zhi)(zhi)構(gou)(gou)象(xiang)(xiang)空(kong)間優(you)化(hua)(hua)(hua)(hua)屬于(yu)(yu)(yu)一類非常難解的(de)(de)(de)NP-Hard問(wen)題(ti)。群(qun)體進化(hua)(hua)(hua)(hua)類算(suan)法(fa)(fa)(fa)是(shi)(shi)研(yan)究蛋白質(zhi)(zhi)(zhi)分(fen)子(zi)構(gou)(gou)象(xiang)(xiang)優(you)化(hua)(hua)(hua)(hua)的(de)(de)(de)重要(yao)方(fang)(fang)法(fa)(fa)(fa),主要(yao)包(bao)括差分(fen)進化(hua)(hua)(hua)(hua)算(suan)法(fa)(fa)(fa)(DE)、遺傳算(suan)法(fa)(fa)(fa)(GA)、粒子(zi)群(qun)算(suan)法(fa)(fa)(fa)(PSO),這些算(suan)法(fa)(fa)(fa)不僅結構(gou)(gou)簡(jian)單,易(yi)于(yu)(yu)(yu)實現(xian)(xian),而(er)(er)(er)且魯棒性強(qiang),因(yin)此,經常被用于(yu)(yu)(yu)從(cong)頭預測方(fang)(fang)法(fa)(fa)(fa)中(zhong)(zhong)的(de)(de)(de)全局最(zui)小能量(liang)(liang)構(gou)(gou)象(xiang)(xiang)搜索。然而(er)(er)(er),對于(yu)(yu)(yu)上(shang)(shang)(shang)述群(qun)體算(suan)法(fa)(fa)(fa),新構(gou)(gou)象(xiang)(xiang)生成策略的(de)(de)(de)選擇至(zhi)關重要(yao),不恰(qia)當的(de)(de)(de)策略會導致算(suan)法(fa)(fa)(fa)搜索效率(lv)低、收(shou)斂速度慢(man),甚至(zhi)陷(xian)入局部最(zui)優(you),出現(xian)(xian)早熟收(shou)斂現(xian)(xian)象(xiang)(xiang),從(cong)而(er)(er)(er)影響預測精度。
因(yin)此(ci),現有的構象空(kong)間優化(hua)方(fang)法在(zai)搜索效(xiao)率和預測精度方(fang)面存(cun)在(zai)著(zhu)缺陷,需要改進(jin)。
技術實現要素:
為了克服現有的(de)群體蛋白(bai)質結構預(yu)測(ce)(ce)方(fang)法在預(yu)測(ce)(ce)精(jing)度和搜索(suo)效率方(fang)面的(de)不足,本(ben)發明(ming)提出一種預(yu)測(ce)(ce)精(jing)度高、搜索(suo)效率高的(de)基于局部抽象凸支撐面的(de)多策略群體蛋白(bai)質結構預(yu)測(ce)(ce)方(fang)法。
本發(fa)明解決其技術問題所采用(yong)的(de)技術方案是:
一種基于局部抽象(xiang)凸支撐面的多策略(lve)群體蛋白質(zhi)結構(gou)預(yu)測方法,所述方法包括以下(xia)步驟:
1)選取蛋(dan)白(bai)(bai)質(zhi)力場模型,即能量函數E(X),并輸入待測蛋(dan)白(bai)(bai)質(zhi)的(de)序列信息;
2)初始化:設置種群規模NP,交叉概率CR,增益常數F,支撐面斜率控制因子M和最大迭代次數Gmax;根據輸入的序列信息生成初始構象種群并計算每個構象個體的能量值f(Xi)=E(Xi),i=1,2,…,NP,其中,N表示維數,表示第i個構象個體Xi的第N維元素,并初始化迭代次數(shu)G=0;
3)對種群中的每個構象Xi,i∈{1,2,…,NP}作如下(xia)處理:
3.1)從當前種群中隨機選取四個互不相同的構象個體Xa,Xb,Xc,Xd,其中a≠b≠c≠d≠i;
3.2)根據變異操作V1i=Xa+F(Xb-Xc)生成變異構象個體V1i;
3.3)根據變異操作生成變異構象個體
3.4)根據能量值對當前種群中的構象個體進行升序排列,找出能量最低的構象個體Xbest;
3.5)根據(ju)變異操作生成變異構(gou)象個體
3.6)分別對變異構象個體V1i、和執行交叉操作生成新構象個體和其中m=1,2,3,j=1,2,…,N,表示新構象個體的第j維元素,表示變異構象個體的第j維元素,表示目標構象個體Xi的第j維元素,R1表示0和1之間的隨機小數,R2表示(shi)1和N之間的隨機(ji)整(zheng)數;
3.7)根(gen)據如(ru)下操作分別(bie)計算(suan)新(xin)構(gou)象個體和的能量估計值:
3.7.1)計算當前種群中(zhong)每個(ge)構象個(ge)體(ti)到新(xin)構象個(ge)體(ti)之間(jian)的距離表示第i個(ge)構象個(ge)體(ti)到第1個(ge)新(xin)構象個(ge)體(ti)之間(jian)的距離;
3.7.2)根據(ju)距離(li)對所有構象(xiang)個體進行升序排列,選取距離(li)最小的兩個構象(xiang)個體并記為并計算其抽象(xiang)凸(tu)下界估計支撐面(mian):
其中(zhong),為(wei)所選(xuan)構象(xiang)個(ge)體(ti)的能量函數值,n=1,2,…,N+1為(wei)所選(xuan)構象(xiang)個(ge)體(ti)的第n維元素,為(wei)輔助變量,M為(wei)支(zhi)撐面斜率控(kong)制因子(zi);
3.7.3)計(ji)算(suan)新構(gou)象(xiang)個(ge)體的能量估計(ji)值(zhi)其中max表示求最大(da)值(zhi),min表示求最小值(zhi),為支
撐向量lt的第j維元素;
3.7.4)根(gen)據(ju)步驟3.7.1)-3.7.3)計算新構(gou)象個體的能量估計值
3.7.5)根據步驟3.7.1)-3.7.3)計(ji)算新(xin)構(gou)象個體的能量估計(ji)值
3.8)比較新構象個體和的能量估計值,并選出能量估計值最小的新構象個體,并記為Umin;
3.9)計算構象Umin的能量函數值f(Umin)=E(Umin),如果f(Umin)小于當前目標構象個體Xi的能量函數值f(Xi),則構象Umin替換構象Xi;
4)判斷是(shi)否(fou)滿足終止條件,若滿足則輸出結果并退出,否(fou)則返回步驟(zou)3)。
進一步,所述步驟4)中,對種群中的每個構象個體都執行完步驟3)以后,迭代次數G=G+1,終止條件為迭代次數G達到預設最大迭代次數Gmax。
本(ben)發明(ming)的(de)技術構(gou)(gou)思(si)為:首(shou)先,根據(ju)隨機選(xuan)擇的(de)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)、當(dang)前(qian)目標(biao)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)和能(neng)量值(zhi)最(zui)低的(de)構(gou)(gou)象(xiang)(xiang)構(gou)(gou)體(ti)(ti)(ti)生成(cheng)三個(ge)不(bu)同的(de)新(xin)(xin)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti);然后(hou),分別計算當(dang)前(qian)種群中各(ge)(ge)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)到各(ge)(ge)新(xin)(xin)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)的(de)距(ju)離(li),并根據(ju)距(ju)離(li)進行升(sheng)序排列;其次,計算離(li)各(ge)(ge)新(xin)(xin)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)最(zui)近的(de)部(bu)分構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)的(de)抽象(xiang)(xiang)凸支撐面,從而(er)計算各(ge)(ge)新(xin)(xin)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)的(de)能(neng)量估計值(zhi);最(zui)后(hou),比較各(ge)(ge)新(xin)(xin)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)能(neng)量估計值(zhi),從而(er)選(xuan)取能(neng)量估計值(zhi)最(zui)低的(de)新(xin)(xin)構(gou)(gou)象(xiang)(xiang)個(ge)體(ti)(ti)(ti)進行能(neng)量函數評價(jia)。
本發明的(de)有益效果表現在:一方面(mian),根據不同(tong)的(de)策略生成多個不同(tong)的(de)新構(gou)(gou)(gou)象(xiang)個體,避免因策略選(xuan)擇不恰當(dang)而(er)引起(qi)的(de)早熟(shu)收斂(lian),從(cong)而(er)提高(gao)預(yu)測精度;另一方面(mian),根據新構(gou)(gou)(gou)象(xiang)個體的(de)抽(chou)象(xiang)凸能(neng)量估計值(zhi)選(xuan)擇新構(gou)(gou)(gou)象(xiang)構(gou)(gou)(gou)體,減(jian)少(shao)能(neng)量函數平均(jun),從(cong)而(er)降低(di)計算代價,提高(gao)搜索效率。
附圖說明
圖1是基于局部抽(chou)象(xiang)凸(tu)支(zhi)撐面的(de)多(duo)策略群體蛋白質結構預測方(fang)法的(de)流程圖。
圖2是基于局部抽象凸支撐(cheng)面(mian)的(de)多策略群體蛋白質結構預測方法對(dui)蛋白質1AIL進行結構預測時的(de)構象更新示意(yi)圖。
圖(tu)(tu)3是基于(yu)局部抽象凸(tu)支(zhi)撐面的多(duo)策(ce)略群體蛋白(bai)質(zhi)結構(gou)預測方法(fa)對蛋白(bai)質(zhi)1AIL進行結構(gou)預測時得到的構(gou)象分布圖(tu)(tu)。
圖4是(shi)基于局(ju)部抽象凸支撐面的(de)多策略群體蛋白質(zhi)(zhi)結構(gou)預(yu)測方法對蛋白質(zhi)(zhi)1AIL進行結構(gou)預(yu)測得到的(de)三維(wei)結構(gou)圖。
具體實施方式
下面結合附圖對本發明作進一(yi)步描述(shu)。
參照圖1~圖4,一種基于局部抽象(xiang)凸(tu)支(zhi)撐面的多策略(lve)群(qun)體(ti)蛋白質結(jie)構預測方法,包(bao)括以下(xia)步驟:
1)選取蛋白(bai)質力場(chang)模(mo)型,即能(neng)量函(han)數(shu)E(X),并(bing)輸入待(dai)測蛋白(bai)質的序列信息;
2)初始化:設置種群規模NP,交叉概率CR,增益常數F,支撐面斜率控制因子M和最大迭代次數Gmax;根據輸入的序列信息生成初始構象種群并計算每個構象個體的能量值f(Xi)=E(Xi),i=1,2,…,NP,其中,N表示維數,表示第i個構象個體Xi的第N維元素(su),并初(chu)始化迭代次數G=0;
3)對種群中的每個構象Xi,i∈{1,2,…,NP}作如下處理:
3.1)從當前種群中隨機選取四個互不相同的構象個體Xa,Xb,Xc,Xd,其(qi)中a≠b≠c≠d≠i;
3.2)根據變異操作V1i=Xa+F(Xb-Xc)生成變異構象個體V1i;
3.3)根據(ju)變異操作生成(cheng)變異構象個體(ti)
3.4)根據能量值對當前種群中的構象個體進行升序排列,找出能量最低的構象個體Xbest;
3.5)根據變異操(cao)作(zuo)生成變異構象個體
3.6)分別對變異構象個體V1i、和執行交叉操作生成新構象個體和其中m=1,2,3,j=1,2,…,N,表示新構象個體的第j維元素,表示變異構象個體的第j維元素,表示目標構象個體Xi的第j維元素,R1表示0和1之間的隨機小數,R2表(biao)示1和N之間的(de)隨機整數;
3.7)根據(ju)如(ru)下操作分別計(ji)算新構(gou)象個體(ti)和的能(neng)量估(gu)計(ji)值:
3.7.1)計算當前種群中每個(ge)構象(xiang)個(ge)體(ti)(ti)到新構象(xiang)個(ge)體(ti)(ti)之間的(de)距離(li)表示第i個(ge)構象(xiang)個(ge)體(ti)(ti)到第1個(ge)新構象(xiang)個(ge)體(ti)(ti)之間的(de)距離(li);
3.7.2)根據距離對所有構象(xiang)個(ge)(ge)體進行升序排列,選取距離最小的兩(liang)個(ge)(ge)構象(xiang)個(ge)(ge)體并(bing)記為并(bing)計算其抽象(xiang)凸下界估(gu)計支撐面:
其中(zhong),為(wei)所選構象個體的能量函數值(zhi),n=1,2,…,N+1為(wei)所選構象個體的第n維元素,為(wei)輔助變(bian)量,M為(wei)支撐(cheng)面斜率控制因子;
3.7.3)計算新構象個體的能量估計值其中max表示求最大值,min表示求最小值,為支撐向量lt的第j維元素;
3.7.4)根據步驟3.7.1)-3.7.3)計算新構象個體的能量估(gu)計值
3.7.5)根據步驟3.7.1)-3.7.3)計(ji)算新構象個體的(de)能量估計(ji)值
3.8)比較新構象個體和的能量估計值,并選出能量估計值最小的新構象個體,并記為Umin;
3.9)計算構象Umin的能量函數值f(Umin)=E(Umin),如果f(Umin)小于當前目標構象個體Xi的能量函數值f(Xi),則構象Umin替換構象Xi;
4)判斷是(shi)否(fou)滿足終止(zhi)條件,若滿足則輸(shu)出結(jie)果并退出,否(fou)則返回(hui)步驟3)。
進一步,所述步驟4)中,對種群中的每個構象個體都執行完步驟3)以后,迭代次數G=G+1,終止條件為迭代次數G達到預設最大迭代次數Gmax。
本實施例序列長度為(wei)73的(de)α折疊蛋(dan)白質(zhi)(zhi)1AIL為(wei)實施例,一種基于局部抽象(xiang)凸支撐面的(de)多策略(lve)群體蛋(dan)白質(zhi)(zhi)結構預測方法,其中包(bao)含以下(xia)步驟(zou):
1)選取(qu)蛋(dan)白質Rosetta Score3力場模型,即Rosetta Score3能量函數E(X),并輸入待測(ce)蛋(dan)白質的序列信息;
2)初始化:設置種群規模NP=50,交叉概率CR=0.5,增益常數F=0.5,支撐面斜率控制因子M=1000,最大迭代次數Gmax=10000;根據輸入的序列信息生成初始構象種群并計算每個構象個體的能量值f(Xi)=E(Xi),i=1,2,…,NP,其中,N表示維數,表示第i個構象個體Xi的第N維元(yuan)素,并(bing)初始化迭代次數G=0;
3)對種群中的每個構象Xi,i∈{1,2,…,NP}作如(ru)下(xia)處理:
3.1)從當前種群中隨機選取四個互不相同的構象個體Xa,Xb,Xc,Xd,其中a≠b≠c≠d≠i;
3.2)根據變異操作V1i=Xa+F(Xb-Xc)生成變異構象個體V1i;
3.3)根(gen)據(ju)變(bian)異操作生成變(bian)異構象個體
3.4)根據能量值對當前種群中的構象個體進行升序排列,找出能量最低的構象個體Xbest;
3.5)根據變(bian)異(yi)操作生成(cheng)變(bian)異(yi)構(gou)象個體
3.6)分別對變異構象個體V1i、和執行交叉操作生成新構象個體和其中m=1,2,3,j=1,2,…,N,表示新構象個體的第j維元素,表示變異構象個體的第j維元素,表示目標構象個體Xi的第j維元素,R1表示0和1之間的隨機小數,R2表(biao)示1和N之間的隨機整數;
3.7)根據(ju)如下(xia)操作分別計算(suan)新構象(xiang)個體和的能(neng)量估計值(zhi):
3.7.1)計算當前種群中每個(ge)構象(xiang)個(ge)體到新構象(xiang)個(ge)體之(zhi)間(jian)的距離表示第i個(ge)構象(xiang)個(ge)體到第1個(ge)新構象(xiang)個(ge)體之(zhi)間(jian)的距離;
3.7.2)根據距離對(dui)所有構象個(ge)體(ti)進行(xing)升序排列,選取(qu)距離最小的兩(liang)個(ge)構象個(ge)體(ti)并記為并計算其(qi)抽象凸下界(jie)估計支撐(cheng)面:
其(qi)中(zhong),為(wei)所(suo)選構象個(ge)體的(de)能量函數值,n=1,2,…,N+1為(wei)所(suo)選構象個(ge)體的(de)第n維元素,為(wei)輔(fu)助變量,M為(wei)支撐面斜(xie)率控制因子;
3.7.3)計算新構象個體的能量估計值其中max表示求最大值,min表示求最小值,為支撐向量lt的第j維元素;
3.7.4)根據步驟3.7.1)-3.7.3)計算(suan)新構象個體的能(neng)量估計值
3.7.5)根據步驟3.7.1)-3.7.3)計(ji)算新構象個體的能量估計(ji)值(zhi)
3.8)比較新構象個體和的能量估計值,并選出能量估計值最小的新構象個體,并記為Umin;
3.9)計算構象Umin的能量函數值f(Umin)=E(Umin),如果f(Umin)小于當前目標構象個體Xi的能量函數值f(Xi),則構象Umin替換構象Xi;
4)對種群中的每個構象個體都執行完步驟3)以后,迭代次數G=G+1,判斷迭代次數G是否大于最大迭代次數Gmax,若G大于Gmax,則(ze)(ze)輸出預測(ce)結果并退出,否則(ze)(ze)返(fan)回步驟(zou)3)。
以序列長度(du)為(wei)73的α折疊蛋(dan)白(bai)質(zhi)(zhi)1AIL為(wei)實(shi)施例,運用以上方(fang)法得(de)到(dao)了該蛋(dan)白(bai)質(zhi)(zhi)的近天然態構象(xiang),最小均方(fang)根(gen)偏差(cha)為(wei)平均均方(fang)根(gen)偏差(cha)為(wei)預測結構如(ru)圖(tu)4所(suo)示。
以(yi)上說明(ming)(ming)是(shi)本發明(ming)(ming)以(yi)1AIL蛋白質為實例所(suo)得(de)出的(de)(de)優化效果,并非限(xian)定(ding)本發明(ming)(ming)的(de)(de)實施范(fan)圍,在不偏離本發明(ming)(ming)基(ji)本內容所(suo)涉及范(fan)圍的(de)(de)的(de)(de)前(qian)提下(xia)對其做各種變形(xing)和改進,不應排除(chu)在本發明(ming)(ming)的(de)(de)保護范(fan)圍之(zhi)外(wai)。