一種快速構建血漿dna測序文庫的方法和試劑盒的制作方法
【技術領域】
[0001] 本發明涉及用于構建血漿DNA測序文庫的方法和試劑盒,更具體地,本發明涉及 用于構建高通量測序的血漿DNA文庫構建的方法和試劑盒。
【背景技術】
[0002] 隨著科技的進步,傳統的Sanger測序已經不能完全滿足研究的需要,對基因組 測序,需要費用更低、通量更高、速度更快的測序技術,高通量測序(也稱第二代測序)技 術應運而生。高通量測序技術的核必思想是邊合成邊測序,即通過捕捉新合成的末端的標 記來確定DNA的序列,現有的技術平臺主要包括Roche/454FLX、Illumina/Hiseq、Miseq、 NextSeq和LifeTechnologies/SOLIDsystem、PGM、Proton等。到目前為止,HiSeq2000 每個run可W達到6個人基因組30X覆蓋的測序通量,約600G/run數據,在測序時間上 Hiseq2500可W達到平均每8分鐘讀取一個堿基的速度。而且隨著第二代測序技術的成熟, 將其應用于臨床的研究迅猛發展。
[0003] 血漿DNA又稱循環DNA,是血液中的細胞外DNA,長約幾十到幾百核巧酸,可WW DNA-蛋白質復合物的形式存在,也可W是游離的DNA片段。正常情況下,血漿DNA來源于少 量衰老死亡細胞的DNA釋放。健康狀態下,循環DNA的生成與清除處于動態平衡狀態,維持 在較恒定的低水平。循環DNA能反映人體內細胞新陳代謝的狀況,是健康評判的一個重要 指標。外周血循環DNA量和質的改變與多種疾病(包括腫瘤、復合性嚴重外傷、器官移植、 妊娠相關疾病、感染性疾病、器官功能衰竭等)關系密切,作為一種無創性檢測指標,有望 成為某些疾病早期診斷、病情監測、療效及預后評估的一種重要的分子標志物。
[0004]自從母體血液中的胚胎DNA被發現之后,無創傷地直接診斷和檢測胚胎染色體異 常性成了一個重大的研究課題。2008年,盧燈明教授及其團隊率先使用高通量測序檢測孕 婦血漿DNA,統計染色體比例關系,血漿中微量的胚胎DNA的染色體數目的變化能被檢測出 來(化iu,化anetal. 2008)。隨著檢測技術的逐漸完善成熟,各國都在致力于將該實驗室 技術轉為臨床應用。另有研究發現,癌癥病人的癌細胞調亡產物(包括斷裂游離的癌細胞 DNA)會釋放到的血液中,隨血液循環系統運送到全身,血漿DNA中攜帶有癌細胞基因組的 全部遺傳信息(Schwarzenbach,化onetal.2011)。近期,盧燈明教授發現通過對癌癥病 人血漿DNA進行高通量測序,W統計重復區甲基化狀況,可W有效區分癌癥患者和健康人 群(Qian,Jiangetal. 2013)。
[0005] 測序效率的提升和多樣品混合測序的普及對樣品的制備效率提出了更高的要求, 特別是大量臨床樣品制備;而現有的臨床血漿樣品制備方法的發展一直趕不上測序能力的 提高。因此,第二代高通量測序臨床血漿DNA樣品的制備效率和成本,成為高通量測序能否 得W普及的關鍵。
[0006] 第二代高通量測序的血漿DNA樣品的制備過程本質上是將符合測序長度的DNA插 入到已有的測序載體中,即在待測序DNA兩端連上已知的測序接頭序列。目前血漿DNA文 庫的構建主要包括先將提取的血漿DNA進行末端修復及5'末端磯酸化、然后進行末端懸 A、連接接頭、PCR等主要步驟(圖I),其中,在各個步驟之間幾乎都需要進行純化步驟。送 種血漿DNA測序文庫的構建方法共需要6種主要的酶,4種酶反應體系,并經過4次清潔純 化,因而成本較高,操作復雜,對環境要求苛刻,易形成氣溶膠的污染,同時對實驗者分子生 物學的操作能力要求很高,實現多樣品同時處理的難度較大。此外,PCR過程導致的氣溶膠 污染極易造成測序樣本的污染,同時PCR過程也會引入一定的堿基偏好性,從而測序結果 在基因組上的覆蓋度也會不均勻,導致最終判定結果的不準確性。
【發明內容】
[0007] 鑒于目前血漿DNA測序文庫構建過程中所遇到的問題,本發明人發現了新的更加 簡化、更加快速、更加均一的血漿DNA測序文庫的構建方法,其可適用于多種第二代測序平 臺,包括但不限于如R〇che/454FLX、Illumina/Hiseq、Miseq和LifeTechnologies/SOLID system、PGM、Proton等測序平臺。
[0008] 本發明是基于W下的事實;本發明人發現,血漿DM連接上測序接頭后無須經過 PCR擴增即可進行上機測序,現有實驗流程的PCR擴增步驟并不是必需的,也無需使用PCR 反應聚合酶。本發明人還發現現有實驗流程中的末端補平、末端懸A和連接測序接頭H步 可W在一個反應體系中完成,中間不需經過純化步驟且血漿DNA末端補平過程可不經5'末 端磯酸化處理,最終連接反應純化后即可得到待上機測序的文庫。依據本發明,生物體內斷 裂的血漿DNA在低至化g的條件下依然可W構建出很好的血漿DNA文庫,得到有效的測序 結果,而且本發明第一次將PCR化ee技術應用于極低量(小于IOng)血漿DNA。
[0009] 因此,本發明的一個方面是提供一種用于構建血漿DNA測序文庫的方法,其特征 在于,包括W下步驟:
[0010] 1)抽提血漿DNA;
[0011] 2)任選將血漿DNA進行末端補平,獲得末端補平后的血漿DNA;
[001引 3)將任選末端補平后的血漿DNA進行3'懸A,獲得3'懸A后的血漿DNA;
[001引 4)將3'懸A后的血漿DNA與測序接頭連接,獲得連接產物;
[0014] 5)對連接產物進行純化,獲得純化產物。
[001引因此,根據本發明,純化產物不需PCR擴增反應步驟即可獲得所述血漿DNA測序文 庫。
[0016] 根據本發明一個優選的實施方式,上述將3'懸A后的血漿DNA與測序接頭連接W 獲得連接產物的步驟4)通過選自W下的一種或兩種酶來進行;T4DNA連接酶和T7DNA連接 酶。
[0017] 根據本發明一個優選的實施方式,所述測序接頭為雙鏈的測序接頭。
[0018] 本發明中所述雙鏈接頭是由兩條單鏈DNA退火而得,其中一條為通用序列,即該 條DNA的序列是固定的,在不同的文庫應用中是完全一致的,如下文中所示通用適配子 (universaladaptor)。另外一條為帶有index的序列,即該條DNA的序列有自己特定的堿 基,一般3-8個特定堿基,用W區分不同的接頭序列,特定堿基之外的序列是固定的,如下 文中所示index適配子。
[0019] 本發明中所用接頭序列示例如下:
[0020] UniversalAdapter
[0021] 5'AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT3'
[0022] Indexadaptor
[0023] 5,GATCGGAAGAGCACACGTCTGAACTCCAGTCACATCACGATCTCGTATGCCGTCTTCTGCTTG
[0024] 上述僅僅是適用于本發明的接頭序列的一個示例。本領域的技術人員可W根據測 序平臺的不同,例如Illumina,IonTorrent,Roche454為本發明的血漿DNA文庫連接不同 和合適的接頭序列。
[00巧]根據本發明一個實施方式,在所述抽提血漿DNA之后、但在所述將血漿DNA與測序 接頭連接之前,對抽提得到的血漿DNA進行末端懸A并對經末端懸A的血漿DNA進行純化。 優選地,所述末端懸A采用klenowex-酶、或Taq酶、或klenowex-酶與Taq酶的組合。優 選地,末端懸A和測序接頭的連接可W在一個反應體系中進行,即,在末端懸A后可無需進 行純化,而是直接進行測序接頭的連接,連接反應之后對血漿DNA進行純化,即可得到待上 機測序的血漿DNA文庫。其中末端懸A采用Taq酶。
[0026] 根據本發明另一個實施方式,在所述抽提血漿DNA之后、但在所述將血漿DNA與測 序接頭連接之前,對抽提得到的血漿DNA進行末端補平和末端懸A。其中,所述末端補平和 所述末端懸A可W在兩個反應體系中進行,即,在末端補平后,需經過純化后再進行末端懸 A;可替換地且為優選地,所述末端補平和所述末端懸A在一個反應體系中進行,在末端補 平和末端懸A之后對血漿DNA進行純化,其中所述末端補平采用T4DNA聚合酶,所述末端懸 A采用Taq酶;或者更加優選地,所述末端補平和所述末端懸A、W及所述將血漿DNA與測序 接頭連接H者僅僅在一個反應體系中進行,連接反應之后對血漿DNA進行純化,即可得到 待上機測序的血漿DNA文庫。在最優選的實施方式中,血漿DNA只需一個反