專利名稱:氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法
技術領域:
本發明涉及一種網絡構建和分析方法。特別是涉及ー種氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法。
背景技術:
氧化葡萄糖酸桿菌屬醋酸桿菌科,革蘭氏陰性。可以將多種醇類、多元醇和碳水化合物不完全氧化成相應的酮類和糖酸。例如,將甘油氧化為ニ羥基丙酮,葡萄糖氧化成葡萄糖酸,山梨醇氧化成2-酮基-古洛酸等。由于其獨特且高效的不完全氧化能力,氧化葡萄糖酸桿菌在エ業上已經獲得廣泛地應用。其生產的產品在作為藥物或藥物合成前體物質領域具有良好的應用價值。對氧化葡萄糖酸桿菌的研究日益受到人們的重視。自2005年氧化葡萄糖酸桿菌的基因組得到測序并且大部分基因被注釋以來,對該菌的認識變得更加深入,與其相關的研究也取得了很多非常有價值的成果。不過這些成果大部分只是關于氧化葡萄糖酸桿菌的一種產品或一條代謝途徑,而沒有從整體角度研究氧化葡萄糖酸桿菌,缺乏ー個能夠系統的分析該菌代謝行為的工具。本發明所涉及的基因組尺度代謝網絡正好填補了這一空缺。基因組尺度代謝網絡包含ー種生物體內的全部與小分子代謝有關的基因、酶、代謝物和代謝反應,能夠在系統水平上對生物中的各組分進行整體分析,能體現各組分的相互作用關系,對生物的生理功能有全面的了解。利用網絡拓撲結構分析可以找到代謝的中心代謝物和關鍵節點,利用魯棒性分析可以分析內部或外部擾動對生物代謝狀態的影響,基因必要性分析可以分析ー個或多個基因對生物量或目標產物合成的必要性,通量可變性分析可以確定在相同表型下特定反應的通量所能達到的最大和最小值。對于氧化葡萄糖酸桿菌目前還沒有基因組尺度代謝網絡的報道,因此構建氧化葡萄糖酸桿菌的基因組尺度代謝網絡,分析它在生產各種產品時的代謝行為,能夠更好地指導對氧化葡萄糖酸桿菌的研究和應用。
發明內容
本發明所要解決的技術問題是,提供ー種利用所構建的基因主尺度代謝網絡分析氧化葡萄糖酸桿菌的中心代謝物,找到對氧化葡萄糖酸桿菌的代謝狀態有顯著影響的代謝擾動,找到對菌體生長和合成產物所必須的基因和重要代謝反應的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法。本發明所采用的技術方案是一種氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,包括如下步驟I)利用KEGG數據庫中氧化葡萄糖酸桿菌的基因注釋信息和對應酶的生物化學信息構建反應列表草圖,為了確保準確性也需要參考其他數據庫和相關文獻;2)對反應列表草圖進行修改;3)添加生物量合成反應、運輸反應和交換反應,形成代謝網絡;
4)將代謝網絡轉化為SBML格式,利用Matlab和COBRA Toolbox對代謝網絡進行調試,分析其中存在缺口和無效循環,井根據調試結果修正所述的缺口和無效循環;5)根據步驟4)生成的最終代謝網絡,利用Pajek繪制代謝網絡圖,并進行網絡拓撲結構分析;6)根據步驟4)生成的最終代謝網絡,利用Matlab和COBRA Toolbox進行魯棒性分析、基因必要性分析和通量可變性分析中的ー種或多種分析。步驟I)所述的草圖中包括有反應的ID、反應名稱、反應方程式、催化該反應的酶和與該反應對應的基因ID的信息。步驟2)所述的修改包括刪去蛋白質、DNA、RNA、肽聚糖和碳水化合物這些大分子的合成與修飾反應;同時存在總反應形式和分反應形式的多步反應只能保留其中ー種形式;統一各代謝物的ID,確保同一種代謝物只保留ー種ID ;確定參與反應的輔因子和反應方向。步驟3)所述的生物量合成反應是首先將生物量分解成幾種成分蛋白質、DNA、RNA、脂質、肽聚糖和碳水化合物,再按各成分所占的mol比組合而成,最后再分別添加各組分的合成反應。步驟3)所述的運輸反應是根據培養基的成分和氧化葡萄糖酸桿菌產生的胞外發酵產物來添加,所述的交換反應是對所有的胞外代謝物添加交換反應,用來平衡胞外代謝物的合成與消耗,形成系統的邊界。步驟4)所述的代謝網絡是由1007個代謝物、860個反應、433個基因和403種酶組成,分類于72個子代謝途徑或子系統。步驟5)所述的Pajek繪制的代謝網絡圖包括918個節點和1223條連接線。步驟6)所述的魯棒性分析,是分析反映生物體的代謝狀態對內部或外部擾動的敏感性。步驟6)所述的基因必要性分析是模擬生物體在基因敲除下的性狀,分析各個基因對選定的目標函數的必要性。步驟6)所述的通量可變性分析是用來分析各反應對選定的目標函數的通量可變 范圍。本發明的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,可以利用所構建的基因主尺度代謝網絡分析氧化葡萄糖酸桿菌的中心代謝物,找到對氧化葡萄糖酸桿菌的代謝狀態有顯著影響的代謝擾動,找到對菌體生長和合成產物所必須的基因和重要的代謝反應。本發明可以分析氧化葡萄糖酸桿菌在生產ニ羥基丙酮、維生素C和葡萄糖酸等各種產物時的代謝狀態,為研究氧化葡萄糖酸桿菌提供了一個新的工具。
圖I是本發明構建的基因組尺度代謝網絡圖。
具體實施例方式下面結合實施例和附圖對本發明的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法做出詳細說明。
本發明的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,包括如下步驟I)利用KEGG數據庫中氧化葡萄糖酸桿菌的基因注釋信息和對應酶的生物化學信息構建反應列表草圖,為了確保準確性也需要參考其他數據庫如NCBI ;所述的草圖中包括有反應的ID、反應名稱、反應方程式、催化該反應的酶和與該反應對應的基因ID的信息。2)對反應列表草圖進行修改;反應列表草圖可能會存在錯誤和冗余的信息,也有可能遺失一部分反應。所述的修改包括刪去蛋白質、DNA、RNA、肽聚糖和碳水化合物這些大分子的合成與修飾反應,因為這部分反應最后會合并到生物量反應中;同時存在總反應形式和分反應形式的多步反應只能保留其中ー種形式;統ー各代謝物的ID,確保同一種代謝物只保留ー種ID ;確定參與反應的輔因子和反應方向。3)添加生物量合成反應、運輸反應和交換反應;所述的生物量合成反應是首先將生物量分解成幾種主要成分蛋白質、DNA、RNA、脂質、肽聚糖和碳水化合物,再按各成分所占的mol比組合而成,最后再分別添加各組分的合成反應。所述的運輸反應是根據培養基的成分和氧化葡萄糖酸桿菌產生的胞外發酵產物來添加,所述的交換反應是對所有的胞外代謝物添加交換反應,用來平衡胞外代謝物的合成與消耗,形成系統的邊界。4)將代謝網絡轉化為SBML (Systems Biology Markup Language,生物系統標記語言)格式,利用Matlab和COBRA Toolbox對代謝網絡進行調試,分析其中存在缺ロ和無效循環,井根據調試結果修正所述的缺口和無效循環;所述的代謝網絡是由1007個代謝物、860個反應、433個基因和403種酶組成,分類于72個子代謝途徑或子系統。5)根據步驟4)生成的最終代謝網絡,利用Pajek繪制代謝網絡圖,并進行網絡拓撲結構分析;所述的Pajek繪制的代謝網絡圖包括918個節點和1223條連接線。6)根據步驟4)生成的最終代謝網絡,利用Matlab和COBRA Toolbox進行魯棒性分析、基因必要性分析和通量可變性分析中的ー種或多種分析。其中,所述的魯棒性分析,是分析反映生物體的代謝狀態對內部或外部擾動的敏感性;所述的基因必要性分析是模擬生物體在基因敲除下的性狀,分析各個基因對選定的目標函數的必要性;所述的通量可變性分析是用來分析各反應對選定的目標函數的通量可變范圍。實施例一根據KEGG數據庫以及其他相關數據庫和文獻報道的信息構建氧化葡萄糖酸桿菌的基因組尺度代謝網絡。該代謝網絡由1007個代謝物、860個反應、433個基因和403種酶組成,分類于72個子代謝途徑或子系統,這部分反應包括胞內外小分子代謝反應、生物量合成反應及運輸反應。利用Pajek繪制代謝網絡圖,需要將代謝網絡進行修改并轉化為Pajek可識別的格式。修改內容如下刪去ATP、ADP、NADH、NAD+、NADPH、NADP+、THF、等流通代謝物,因為它們雖然參與了大量的代謝反應,但是并不直接參與底物至產物的物質轉化過程。刪去聚合反應和大分子參與的反應,如蛋白質、DNA的合成等。用節點代表代謝物,連接線代表代謝物之間的反應。所繪制的代謝網絡圖包括918個節點和1223條連接線(如圖I所示)。根據所繪制的代謝圖可以分析網絡拓撲結構特性,例如各節點的連接度。節點的連接度直接反應該代謝物參與的反應個數,連接度越高的代謝物往往對該生物的代謝越重要,可以認為是潛在的中心代謝物。本發明對氧化葡萄糖酸桿菌代謝網絡進行連接度分析,找到8個可能的中心代謝物,分別是丙酮酸、こ酰_CoA、谷氨酸、3-磷酸甘油醛、こ酸、甘氨酸、6-磷酸葡萄糖和5-磷酸核糖-I-焦磷酸。魯棒性分析可以反映生物的代謝狀態(如菌體生長、產物合成)對內部或外部擾動的敏感性。以計算生物量合成隨甘油速率的變化為例,在模擬過程中選擇生物量的交換反應為目標函數,保持模型中其他條件不變,而甘油吸收速率由O變化到50mmol/gDW-1 · !-1,計算每個甘油吸收速率值下對應的生物量合成速率。根據所得數據繪制生物量隨甘油的變化趨勢圖。模擬過程中可以同時設定其他約束條件,如對氧氣吸收速率上限設制約束。也可以同時模擬多個因素對目標函數的影響。如產物ニ羥基丙酮的合成量隨生物量和甘油吸收速率兩個因素的變化,可獲得相應表型相平面圖。對所構建的代謝網絡進行了通量可變性分析,先在以生物量合成為目標函數,甘油速率選取20mmol/gDW-l · h_l下,計算生物量最大合成速率為9. 24mmol/gDff-l · h_l,然后將生物量速率的上下限都設定在9. 24mmol/gDff-l · h_l,然后分別以每個反應為目標函數計算每個反應的最大最小通量值。由通量可變性分析結果可知,在包含交換反應在內的953個反應中,最大與最小通量值相等的反應有750個,其他203個反應是可變的。也可以用來分析除生物量合成以外的目標函數的通量可變性。對代謝網絡中包含的433個基因在以生物量合成為目標下進行基因必要性分析, 模擬單基因敲除和雙基因敲除下的性狀。根據單基因敲除結果,有92個基因是致死基因,這些基因的敲除導致生物前體物質不能合成,細胞將不能生長。根據雙基因敲除結果,除單基因敲除致死型之外,雙基因敲除致死型有55種。將目標函數改為其他反應,例如ニ羥基丙酮的交換反應,則可以用來分析對合成ニ羥基丙酮所必須的基因。
權利要求
1.一種氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,包括如下步驟 1)利用KEGG數據庫中氧化葡萄糖酸桿菌的基因注釋信息和對應酶的生物化學信息構建反應列表草圖; 2)對反應列表草圖進行修改; 3)添加生物量合成反應、運輸反應和交換反應,形成代謝網絡; 4)將代謝網絡轉化為SBML格式,利用Matlab和COBRAToolbox對代謝網絡進行調試,分析其中存在缺口和無效循環,井根據調試結果修正所述的缺口和無效循環; 5)根據步驟4)生成的最終代謝網絡,利用Pajek繪制代謝網絡圖,并進行網絡拓撲結構分析; 6)根據步驟4)生成的最終代謝網絡,利用Matlab和COBRAToolbox進行魯棒性分析、基因必要性分析和通量可變性分析中的ー種或多種分析。
2.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟I)所述的草圖中包括有反應的ID、反應名稱、反應方程式、催化該反應的酶和與該反應對應的基因ID的信息。
3.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在干,步驟2)所述的修改包括刪去蛋白質、DNA、RNA、肽聚糖和碳水化合物這些大分子的合成與修飾反應;同時存在總反應形式和分反應形式的多步反應只能保留其中ー種形式;統一各代謝物的ID,確保同一種代謝物只保留ー種ID ;確定參與反應的輔因子和反應方向。
4.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟3)所述的生物量合成反應是首先將生物量分解成幾種成分蛋白質、DNA、RNA、脂質、肽聚糖和碳水化合物,再按各成分所占的mol比組合而成,最后再分別添加各組分的合成反應。
5.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟3)所述的運輸反應是根據培養基的成分和氧化葡萄糖酸桿菌產生的胞外發酵產物來添加,所述的交換反應是對所有的胞外代謝物添加交換反應,用來平衡胞外代謝物的合成與消耗,形成系統的邊界。
6.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟4)所述的代謝網絡是由1007個代謝物、860個反應、433個基因和403種酶組成,分類于72個子代謝途徑或子系統。
7.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟5)所述的Pajek繪制的代謝網絡圖包括918個節點和1223條連接線。
8.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟6)所述的魯棒性分析,是分析反映生物體的代謝狀態對內部或外部擾動的敏感性。
9.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在干,步驟6)所述的基因必要性分析是模擬生物體在基因敲除下的性狀,分析各個基因對選定的目標函數的必要性。
10.根據權利要求I所述的氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法,其特征在于,步驟6)所述的通量可變性分析是用來分析各反應對選定的目標函數的通量可變范圍。
全文摘要
一種氧化葡萄糖酸桿菌的基因組尺度代謝網絡構建和分析方法利用KEGG數據庫中氧化葡萄糖酸桿菌的基因注釋信息和對應酶的生物化學信息構建反應列表草圖;對草圖進行修改;添加生物量合成、運輸和交換反應形成代謝網絡;將代謝網絡轉化為SBML格式,利用Matlab和COBRA Toolbox對代謝網絡進行調試,分析存在的缺口和無效循環,并根據調試結果進行修正;根據代謝網絡,利用Pajek繪制代謝網絡圖,并進行網絡拓撲結構分析;根據代謝網絡,利用Matlab和COBRA Toolbox進行魯棒性、基因必要性和通量可變性分析中的一種或多種分析。本發明分析氧化葡萄糖酸桿菌在生產二羥基丙酮、維生素C和葡萄糖酸等各種產物時的代謝狀態。
文檔編號G06F19/26GK102663272SQ20121006691
公開日2012年9月12日 申請日期2012年3月14日 優先權日2012年3月14日
發明者盧文玉, 吳欣森 申請人:天津大學