本(ben)發明(ming)涉及生物技(ji)術領域,具體涉及一種特異(yi)地高靈敏(min)度檢(jian)測(ce)低頻基因(yin)突(tu)變的高通量檢(jian)測(ce)方法和試劑盒(he),尤其(qi)在egfr基因(yin)突(tu)變檢(jian)測(ce)方面取(qu)得(de)良好效果。
背景技術:
血(xue)(xue)漿作(zuo)為重(zhong)要的液體活(huo)檢樣本(ben)(ben)來源之(zhi)一,含有較多來源于衰老死(si)亡細(xi)胞(bao)釋放的循(xun)環dna,病人血(xue)(xue)漿中含有更多的游離dna,主要由凋亡和壞死(si)的腫(zhong)瘤(liu)細(xi)胞(bao)產生,其遺傳學(xue)特性與腫(zhong)瘤(liu)基(ji)因組dna相似(si),變異形式包括缺失、點突變、拷(kao)貝數增加等(deng)。因此,血(xue)(xue)漿dna已經作(zuo)為一種(zhong)無創(chuang)性檢測(ce)樣本(ben)(ben),成為疾病早期診斷、病情監測(ce)、療效(xiao)及預后評估的一種(zhong)重(zhong)要標志(zhi)物(wu)。
自腫瘤(liu)癌(ai)癥患者的(de)血(xue)(xue)漿dna中可以獲得精細的(de)基因突變,在(zai)癌(ai)癥的(de)初始診(zhen)斷、治療監控(kong)和復發(fa)監控(kong)均有望發(fa)揮重要作用。隨著(zhu)二代(dai)測序技術(shu)的(de)廣泛應用,血(xue)(xue)漿dna越(yue)來越(yue)多地被應用于腫瘤(liu)相關基因的(de)變異檢(jian)測中,進行快速、準確、無創、高靈敏檢(jian)測,為患者提(ti)供(gong)各種診(zhen)斷依據。
但(dan)在通(tong)常的血(xue)(xue)液(ye)樣本中,ctdna含量(liang)很(hen)低(0.1-1%),且每個突(tu)變點可(ke)能為低頻突(tu)變。研究表明,第(di)二代高通(tong)量(liang)測序可(ke)快速(su)準(zhun)確高通(tong)量(liang)獲得血(xue)(xue)漿(jiang)(jiang)游離dna信息,但(dan)以低含量(liang)、片段化形式存(cun)在的血(xue)(xue)漿(jiang)(jiang)dna使(shi)得傳(chuan)統pcr方式很(hen)難有效的排除檢測到的低頻突(tu)變的假陽性(xing)。
表(biao)皮生長(chang)因(yin)子(zi)受體(epidermalgrowthfactorreceptor,egfr)是與人體表(biao)皮生長(chang)因(yin)子(zi)結合(he)后(hou)啟(qi)動(dong)下(xia)游的(de)(de)信(xin)號(hao)傳導通路而發揮一(yi)系(xi)列生理(li)及病理(li)作用。egfr主要分布于(yu)(yu)細(xi)胞膜表(biao)面,屬于(yu)(yu)i型酪氨酸(suan)激(ji)酶受體家(jia)族(zu),具有酪氨酸(suan)激(ji)酶活性。研宄(gui)表(biao)明,約43%~89%的(de)(de)非(fei)小細(xi)胞肺癌患(huan)(huan)者(zhe),egfr高表(biao)達,其(qi)下(xia)游的(de)(de)信(xin)號(hao)通路會(hui)影響腫(zhong)瘤細(xi)胞的(de)(de)增(zeng)殖、分化、浸潤轉移及血管生成。egfr基(ji)因(yin)突(tu)變(bian)與非(fei)小細(xi)胞肺癌患(huan)(huan)者(zhe)對(dui)酪氨酸(suan)激(ji)酶抑制(zhi)劑的(de)(de)敏感(gan)性有關。egfr基(ji)因(yin)突(tu)變(bian)包括3種(zhong)不(bu)同(tong)類型(點突(tu)變(bian)、缺(que)失突(tu)變(bian)和插(cha)入突(tu)變(bian)),主要集中于(yu)(yu)編(bian)碼酪氨酸(suan)激(ji)酶結構(gou)域的(de)(de)18-21外顯子(zi)。目前,血液(ye)egfr突(tu)變(bian)檢測因(yin)二代測序的(de)(de)上述局限并未(wei)得到廣泛開展,針(zhen)對(dui)egfr基(ji)因(yin)的(de)(de)低頻突(tu)變(bian)檢測水平(ping)需要更高靈(ling)敏度(du),更高特異性的(de)(de)方(fang)法。
技術實現要素:
有鑒(jian)于此,本發明(ming)創造旨在提(ti)出(chu)一種(zhong)癌癥(zheng)相關基因突變高靈敏度檢測方(fang)法,能(neng)夠有效排除假陽性的低(di)頻(pin)突變,檢測結果靈敏度和特異性都較高。
本發明創造(zao)提供的癌癥相關基因突變高靈敏度檢測方(fang)法,包(bao)括下述步驟:
(1)樣品dna提取;
(2)第一(yi)步擴增:將樣品dna與(yu)多重pcr擴增試劑混(hun)合,同時加入針對至少一(yi)個目的基因設計的帶標(biao)簽引(yin)物(wu)組,進行pcr擴增,得到目的基因dna片段;
其中,針對(dui)一個目的(de)基因設計的(de)帶(dai)標簽(qian)引(yin)物組(zu)含有下述(shu)4條引(yin)物:
序列l1:自5’端(duan)依(yi)次(ci)連(lian)接的正(zheng)向接頭序列、uid序列、正(zheng)向引物序列
序列l2:自5’端依次連(lian)接的反(fan)向接頭序列、uid序列、反(fan)向引物序列
序(xu)(xu)列l3:自5’端依次連接的正(zheng)向(xiang)接頭(tou)序(xu)(xu)列、uid序(xu)(xu)列、反(fan)向(xiang)引(yin)物序(xu)(xu)列
序列(lie)(lie)l4:自5’端依(yi)次連(lian)接(jie)的反向接(jie)頭序列(lie)(lie)、uid序列(lie)(lie)、正向引物序列(lie)(lie)
其中,所述(shu)(shu)正向(xiang)(xiang)(xiang)接頭序列(lie)(lie)和(he)反(fan)(fan)向(xiang)(xiang)(xiang)接頭序列(lie)(lie)均為(wei)一段適用于(yu)pcr擴增的(de)通用序列(lie)(lie);所述(shu)(shu)uid序列(lie)(lie)為(wei)一段含有若干(gan)n或x堿(jian)基的(de)標(biao)簽序列(lie)(lie);所述(shu)(shu)正向(xiang)(xiang)(xiang)引(yin)物序列(lie)(lie)和(he)反(fan)(fan)向(xiang)(xiang)(xiang)引(yin)物序列(lie)(lie)分別為(wei)針對目的(de)基因5’端和(he)3’端設計得到的(de)引(yin)物序列(lie)(lie);
(3)第二(er)步(bu)(bu)擴增(zeng):對第一步(bu)(bu)擴增(zeng)得到的目的基(ji)因dna片段進(jin)行pcr擴增(zeng),以使(shi)第一步(bu)(bu)擴增(zeng)得到的目的基(ji)因dna片段得到富集;
(4)二(er)代測序(xu):將第二(er)步擴增產(chan)物進行(xing)高(gao)通量測序(xu)并進行(xing)數據分(fen)析。
進(jin)一(yi)步(bu),所(suo)述樣(yang)品dna優(you)選為血漿(jiang)dna;所(suo)述第一(yi)步(bu)擴增優(you)選進(jin)行(xing)2-10輪(lun)擴增循環;所(suo)述第二步(bu)擴增第一(yi)步(bu)擴增優(you)選進(jin)行(xing)15-35輪(lun)擴增循環。
進一步,所述第二步擴(kuo)(kuo)增(zeng)(zeng)中,利用分別帶正向接頭序(xu)(xu)列和反向接頭序(xu)(xu)列的(de)(de)第二步擴(kuo)(kuo)增(zeng)(zeng)引物對目的(de)(de)基(ji)因dna片段進行pcr擴(kuo)(kuo)增(zeng)(zeng),第二步擴(kuo)(kuo)增(zeng)(zeng)引物中可以(yi)帶有或不帶有適用于測(ce)(ce)序(xu)(xu)的(de)(de)測(ce)(ce)序(xu)(xu)接頭。
進一步,所述數據分(fen)析包括如下步驟:
s1:將所(suo)有讀取結果(reads)比(bi)對到人類基(ji)因組上,去(qu)除瑕疵reads;其中,瑕疵reads包(bao)括(kuo)以下至少(shao)一種情況:
1)去除比對(dui)到基因組多個位置的reads序列,減少非唯一比對(dui)reads序列對(dui)最終結(jie)果的影(ying)響;
2)判斷測序所得(de)的reads序列(lie)是(shi)否包(bao)(bao)含(han)需要檢測的位點,如果不包(bao)(bao)含(han),去(qu)除該條reads,如果包(bao)(bao)含(han),去(qu)除測序質量低于10的reads序列(lie);
3)識別每條(tiao)reads序列(lie)是否在(zai)兩端存(cun)在(zai)完整的uid序列(lie),如果不完整,去除(chu)該條(tiao)reads;
s2:按(an)照uid標簽序(xu)列(lie),將reads分成(cheng)不同的家族(zu)(family),每個family中(zhong)前后(hou)的uid標簽序(xu)列(lie)相(xiang)同,去除(chu)瑕(xia)疵family;其中(zhong),瑕(xia)疵family包括以下(xia)至少一(yi)種情況:
1)如果兩(liang)個(ge)(ge)(ge)family中的(de)(de)(de)(de)uid只差一(yi)個(ge)(ge)(ge)位點(dian)(base),而其中一(yi)個(ge)(ge)(ge)family的(de)(de)(de)(de)reads的(de)(de)(de)(de)數量大于(yu)等于(yu)另一(yi)個(ge)(ge)(ge)family的(de)(de)(de)(de)reads數量的(de)(de)(de)(de)兩(liang)倍,第二個(ge)(ge)(ge)family可以當作pcr或測序錯誤所(suo)產(chan)生的(de)(de)(de)(de),去除第二個(ge)(ge)(ge)family;
2)對同一(yi)個family中reads數(shu)目(mu)進行統計,如果reads數(shu)目(mu)少于(yu)3條,去除該family;
s3:統計突(tu)變型reads并對突(tu)變型的存(cun)在進(jin)行判斷(duan),判斷(duan)標(biao)準一般包括(kuo)以下至少一種情況:
1)對同一個family中突(tu)變(bian)型(xing)和野生型(xing)的(de)(de)reads進行統計,當突(tu)變(bian)型(xing)的(de)(de)reads占這(zhe)個family里面reads的(de)(de)80%以上,才(cai)認為該(gai)family中這(zhe)個突(tu)變(bian)型(xing)是真實(shi)存在的(de)(de);
2)統計每個檢測位點(dian)突(tu)變型(xing)family的數(shu)目,只要該位點(dian)突(tu)變型(xing)family數(shu)目大于3且突(tu)變型(xing)頻率(lv)占總頻率(lv)的0.0005以上,才認為該檢測位點(dian)存在堿基突(tu)變。
本發明還提(ti)供(gong)了一種癌癥相關(guan)基因突變高靈敏(min)度檢測試(shi)劑(ji)盒,包(bao)(bao)括帶標(biao)簽(qian)引(yin)物試(shi)劑(ji),所述(shu)帶標(biao)簽(qian)引(yin)物試(shi)劑(ji)包(bao)(bao)括至(zhi)少一個目的(de)基因的(de)一組(zu)帶標(biao)簽(qian)引(yin)物,針對一個目的(de)基因的(de)一組(zu)帶標(biao)簽(qian)引(yin)物組(zu)含有下述(shu)4條引(yin)物:
序列(lie)l1:自5’端依次(ci)連接的(de)正(zheng)向接頭序列(lie)、uid序列(lie)、正(zheng)向引物序列(lie)
序(xu)列(lie)l2:自(zi)5’端依次連接(jie)的反(fan)向接(jie)頭序(xu)列(lie)、uid序(xu)列(lie)、反(fan)向引物序(xu)列(lie)
序(xu)列(lie)(lie)l3:自5’端依次連接的正(zheng)向接頭序(xu)列(lie)(lie)、uid序(xu)列(lie)(lie)、反向引物(wu)序(xu)列(lie)(lie)
序(xu)(xu)列(lie)l4:自5’端(duan)依次連接的反向(xiang)接頭序(xu)(xu)列(lie)、uid序(xu)(xu)列(lie)、正(zheng)向(xiang)引物序(xu)(xu)列(lie)
其中,帶(dai)標(biao)(biao)簽引(yin)物(wu)(wu)試劑分為兩種混(hun)合(he)液(ye)進行存放,其中一種混(hun)合(he)液(ye)為所有目的(de)基因的(de)帶(dai)標(biao)(biao)簽引(yin)物(wu)(wu)中序(xu)列(lie)l1和(he)序(xu)列(lie)l2構成的(de)引(yin)物(wu)(wu)混(hun)合(he)液(ye),另一種混(hun)合(he)液(ye)為所有目的(de)基因的(de)帶(dai)標(biao)(biao)簽引(yin)物(wu)(wu)中序(xu)列(lie)l3和(he)序(xu)列(lie)l4構成的(de)引(yin)物(wu)(wu)混(hun)合(he)液(ye)。
進一步(bu),所述(shu)試(shi)劑(ji)(ji)盒(he)還可(ke)以包(bao)括(kuo)樣品dna提取試(shi)劑(ji)(ji)、多重pcr擴增試(shi)劑(ji)(ji)、與目的(de)基(ji)因的(de)一組帶標簽引(yin)(yin)物(wu)的(de)接頭(tou)序(xu)列(lie)匹配的(de)第二步(bu)擴增引(yin)(yin)物(wu)試(shi)劑(ji)(ji)、以及引(yin)(yin)物(wu)特異性酶解試(shi)劑(ji)(ji)。
本發明(ming)還提(ti)供了針對egfr基因的至少一個突變位點的帶(dai)標簽引物,包括下面的至少一組帶(dai)標簽引物:
帶標簽引物組a:
a-f-p1:
ctaacctgatgggcagtcggtgatnnxxntgaggatcttgaaggaaactgaa
a-r-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxntaccttatacaccgtgccgaa
a-r-p1:
ctaacctgatgggcagtcggtgatnnxxntaccttatacaccgtgccgaa
a-f-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxntgaggatcttgaaggaaactgaa
帶標簽引物組b:
b-f-p1:
ctaacctgatgggcagtcggtgatnnxxnggtgagaaagttaaaattcccgtc
b-r-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxngatttccttgttggctttcgg
b-f-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxnggtgagaaagttaaaattcccgtc
b-r-p1:
ctaacctgatgggcagtcggtgatnnxxngatttccttgttggctttcgg
帶標簽引物組c:
c-f-p1:
ctaacctgatgggcagtcggtgatnnxxncctccaggaagcctacgtga
c-r-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxncagcaggcggcacacg
c-f-a1:
ctaacctgatgggcagtcggtgatnnxxncagcaggcggcacacg
c-r-p1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxncctccaggaagcctacgtga
帶標簽引物組d:
d-f-p1:
ctaacctgatgggcagtcggtgatnnxxnatctgcctcacctccacc
d-r-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxngttcccggacatagtcca
d-f-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxnatctgcctcacctccacc
d-r-p1:
ctaacctgatgggcagtcggtgatnnxxngttcccggacatagtcca
帶標簽引物組e:
e-f-p1:
ctaacctgatgggcagtcggtgatnnxxncgcagcatgtcaagatcaca
e-r-a1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxnatggtattctttctcttccgc
e-f-a1:
ctaacctgatgggcagtcggtgatnnxxnatggtattctttctcttccgc
e-r-p1:
gcgacctgatgtctccgactcagctaaggtaacgatnnxxncgcagcatgtcaagatcaca
本(ben)發明還提供了(le)針(zhen)對肺癌egfr基因(yin)的檢測試劑盒(he),包括(kuo)分為兩(liang)種(zhong)混合液分別(bie)存放的帶標簽引(yin)物試劑,其中一種(zhong)混合液包括(kuo)上(shang)述帶標簽引(yin)物中的
a-f-p1/a-r-a1,b-f-p1/b-r-a1,c-f-p1/c-r-a1,d-f-p1/d-r-a1,e-f-p1/e-r-a1
另一種混合液(ye)包(bao)括上述帶標簽引物中的(de)
a-r-p1/a-f-a1,b-f-a1/b-r-p1,c-r-p1/c-f-a1,d-f-a1/d-r-p1,e-r-p1/e-f-a1。
相對于現有技術,本(ben)發明創具有以下優勢:
1、始游離dna輸入量少:起始只(zhi)需要加入游離dna的量為2-50ng。
2、采用標簽技術(shu)進行兩步擴增(zeng)的(de)(de)方法,能(neng)夠有效排除假陽性的(de)(de)低頻突(tu)變,能(neng)夠檢測(ce)到(dao)低至0.1%以下的(de)(de)微量低頻突(tu)變。
3、優化了連接在(zai)引物兩端(duan)的接頭(tou)序列(lie),pcr擴增(zeng)特異性大(da)幅(fu)度增(zeng)加。
4、pcr擴增過程采用正(zheng)反向(xiang)同時進行雙(shuang)向(xiang)擴增,消除了鏈偏差,增加了分析(xi)突(tu)變的(de)特異性。
5、優化了(le)數(shu)據分析步驟,消(xiao)除了(le)瑕(xia)疵序列的(de)干(gan)擾,有效排(pai)除pcr或測序錯誤。
具體實施方式
下面(mian)詳細說明(ming)本發(fa)(fa)明(ming)創造。但(dan)不用于限定本發(fa)(fa)明(ming)。
本(ben)發明檢(jian)測癌(ai)癥相關基因突(tu)變情況,是(shi)通過(guo)采(cai)用帶標簽的(de)(de)特異(yi)性引物首先對目的(de)(de)基因進行多重pcr擴增(zeng),然后在(zai)進行高(gao)通量(liang)二代測序的(de)(de)方(fang)法獲得的(de)(de)。具體地,可以(yi)包(bao)括(kuo)如下處理步驟。
一、帶標簽引物設計
從在線(xian)數據庫(ku)檢(jian)索癌癥相關基因(如egfr基因)突(tu)變(bian)位點的dna序(xu)列(lie),通過(guo)軟件進行比(bi)對并針對這些突(tu)變(bian)區域設計引(yin)物(wu)(wu),在引(yin)物(wu)(wu)端加(jia)接頭序(xu)列(lie)和(he)(he)唯一標(biao)識符(fu)(uniqueidentifier(uid))序(xu)列(lie)。經(jing)過(guo)反復試(shi)驗篩(shai)選和(he)(he)驗證,得(de)到擴(kuo)增(zeng)效(xiao)率高、特(te)異性好,能(neng)夠正(zheng)確獲得(de)待檢(jian)測樣本中低頻基因突(tu)變(bian)的帶標(biao)簽引(yin)物(wu)(wu)。
其中,針(zhen)對癌癥(zheng)相關基(ji)因一個外顯子的一個突變(目的基(ji)因)設有(you)一組帶標簽引物(wu),一組帶標簽引物(wu)含有(you)下述(shu)4條引物(wu):
序(xu)列(lie)l1:自5’端依次連接的正(zheng)向接頭序(xu)列(lie)、uid序(xu)列(lie)、正(zheng)向引(yin)物序(xu)列(lie)
序列(lie)l2:自(zi)5’端(duan)依(yi)次連接的(de)反(fan)(fan)向接頭序列(lie)、uid序列(lie)、反(fan)(fan)向引物序列(lie)
序列(lie)(lie)l3:自5’端依次連(lian)接的正向接頭序列(lie)(lie)、uid序列(lie)(lie)、反向引物序列(lie)(lie)
序列(lie)(lie)(lie)(lie)l4:自5’端依次連(lian)接的反向接頭序列(lie)(lie)(lie)(lie)、uid序列(lie)(lie)(lie)(lie)、正(zheng)向引物序列(lie)(lie)(lie)(lie)
其中,所述正向接頭序列和反向接頭序列均為一段適用于pcr擴增的通用序列,便于第二步擴增并為制備文庫做好準備;所述uid序列為一段含有若干n或x堿基的標簽序列,一條引物序列中(如序列l1)標簽序列的數量為n,則擴增后可以產生4n個標簽數量;所述正向(xiang)引物序(xu)(xu)列(lie)和反向(xiang)引物序(xu)(xu)列(lie)分別為針對(dui)目(mu)的基因5’端(duan)和3’端(duan)設計得到的引物序(xu)(xu)列(lie)。
一組帶標簽引物的(de)(de)4條引物的(de)(de)設(she)計有利于實現雙向(xiang)擴增后(hou)測(ce)序(xu),消除鏈偏向(xiang)性(strandbias),減少了檢(jian)測(ce)結(jie)果的(de)(de)非(fei)特異(yi)性。
非限定性的示例性癌癥相關基因可以包括(kuo):
(1)tp53基因第175號密碼子(zi)所攜帶的(de)突變(bian)位點
(2)tp53基(ji)因(yin)第245號密(mi)碼子所攜帶的(de)突(tu)變(bian)位(wei)點
(3)tp53基(ji)因第(di)248號(hao)密碼子所攜帶(dai)的突變位點
(4)tp53基因第273號密碼子所攜帶的突變位點
(5)tp53基因第306號密碼(ma)子(zi)所攜帶的突變位(wei)點
(6)ret基(ji)因第918號密碼(ma)子所(suo)攜帶的突變位(wei)點
(7)pten基(ji)因第267號密碼子所攜(xie)帶的突變位點
(8)pten基因第233號(hao)密碼子所攜帶(dai)的突(tu)變位(wei)點
(9)pten基(ji)因第159號密碼子所攜帶(dai)的(de)突變位點
(10)pik3ca基因(yin)第1047號密碼(ma)子所攜(xie)帶的突變位點(dian)
(11)pik3ca基因第542號密碼子所攜帶的突變位點
(12)pik3ca基(ji)因第545號密碼(ma)子所攜帶的突變位(wei)點
(13)pik3ca基因第(di)546號(hao)密碼(ma)子所(suo)攜帶的突變(bian)位(wei)點
(14)pik3ca基因第(di)549號(hao)密碼子所攜帶的突(tu)變位點(dian)
(15)nras基因第12號密碼子所攜帶(dai)的突變位點
(16)nras基因第13號密碼子所攜帶(dai)的突變位點
(17)nras基(ji)因第61號(hao)密碼子所攜帶的(de)突變位點
(18)nras基因第117號密碼子(zi)所攜帶的突變位點
(19)nras基因(yin)第(di)146號(hao)密碼子所攜帶的突變位點
(20)kras基因第12號密碼子所攜(xie)帶的突變位點(dian)
(21)kras基因第13號密碼子所攜帶的突(tu)變(bian)位(wei)點
(22)kras基因(yin)第61號密碼(ma)子所攜(xie)帶(dai)的(de)突(tu)變(bian)位(wei)點
(23)kras基因第117號(hao)密碼子所攜(xie)帶(dai)的突變位(wei)點
(24)kras基因第146號密碼(ma)子所攜帶(dai)的(de)突(tu)變位點
(25)kit基因(yin)第816號密碼子所攜帶(dai)的(de)突變位點
(26)kit基因第642號密碼子所攜帶(dai)的突(tu)變位(wei)點
(27)kit基(ji)因(yin)第576號密碼子所攜帶的突(tu)變位點
(28)kit基因(yin)第559號(hao)密(mi)碼子所攜帶的突變位點
(29)kit基因第(di)557號密碼子所攜帶的(de)突變位(wei)點(dian)
(30)fgfr3基因第249號密碼子所攜帶的突變位(wei)點
(31)fgfr3基因第(di)380號密(mi)碼子所攜帶(dai)的(de)突變位(wei)點
(32)fgfr3基因第(di)391號(hao)密(mi)碼子所攜帶的突變(bian)位點(dian)
(33)fgfr3基因第641號密碼子所攜帶(dai)的(de)突(tu)變(bian)位點(dian)
(34)fgfr3基因第(di)650號(hao)密碼子所攜(xie)帶的突變位點
(35)egfr基(ji)因第719號密(mi)碼(ma)子所攜帶的突變(bian)位點(dian)
(36)egfr基因(yin)第747號密碼子所攜帶的突(tu)變(bian)位點
(37)egfr基因第790號(hao)密碼子所攜(xie)帶(dai)的突變位(wei)點
(38)egfr基因第(di)854號密碼(ma)子所攜帶的突變位點
(39)egfr基因第(di)858號密碼子所攜帶的突變位點(dian)
(40)egfr基(ji)因第(di)858號密碼子所攜帶的(de)突變位(wei)點
(41)egfr基(ji)因第861號密碼子所攜帶的(de)突變位(wei)點
(42)ctnnb1基因(yin)第37號密(mi)碼子所攜帶(dai)的突變(bian)位點
(43)ctnnb1基因第45號密(mi)碼子所攜帶的突變位點
(44)braf基因第466號密碼子(zi)所攜帶的突變位點
(45)braf基因第469號密碼子(zi)所攜帶的突變位點
(46)braf基因第594號密碼(ma)子所攜帶的突變位點
(47)braf基因第596號密碼子(zi)所攜帶的突變位(wei)點(dian)
(48)braf基(ji)因(yin)第597號密碼子所(suo)攜帶的突(tu)變位(wei)點
(49)braf基因(yin)第600號(hao)密碼子(zi)所(suo)攜帶的突變位(wei)點(dian)
二、采用(yong)帶標簽引物對癌癥相關基因進行檢測
(1)樣品(pin)dna提(ti)取:提(ti)取血漿dna作為檢測樣本(ben);
(2)目的基因多(duo)重pcr擴(kuo)增(zeng)(第一步(bu)擴(kuo)增(zeng)):將樣品dna與(yu)多(duo)重pcr擴(kuo)增(zeng)試劑混合,同(tong)時加(jia)入針對目的基因設計的一組帶(dai)標簽(qian)引物,進(jin)行pcr擴(kuo)增(zeng),得到(dao)目的基因dna片(pian)段,一般為(wei)160-200bp的長度;本(ben)步(bu)擴(kuo)增(zeng)優選進(jin)行2-10輪(cycle)的pcr擴(kuo)增(zeng);
(3)引(yin)物二(er)聚體酶(mei)解(jie)(jie):將得到目的基因(yin)dna片(pian)段,加入引(yin)物特異性酶(mei)解(jie)(jie)試劑,降解(jie)(jie)去除pcr擴增片(pian)段中的引(yin)物序列;
(4)第(di)二步(bu)擴(kuo)增(zeng)(zeng):利用分別帶(dai)正向(xiang)接頭(tou)序(xu)列和反(fan)向(xiang)接頭(tou)序(xu)列的第(di)二步(bu)擴(kuo)增(zeng)(zeng)引物(wu)對(dui)目的基因(yin)dna片段(duan)進行(xing)pcr擴(kuo)增(zeng)(zeng),第(di)二步(bu)擴(kuo)增(zeng)(zeng)引物(wu)中可以帶(dai)有或不帶(dai)有適用于測序(xu)的測序(xu)接頭(tou),本步(bu)擴(kuo)增(zeng)(zeng)優選進行(xing)15-35個cycle的pcr擴(kuo)增(zeng)(zeng);
(5)二(er)代測序:將第二(er)步擴增產物(wu)進行高通量測序并進行數據分析。
本發(fa)明的數(shu)據分析包括下述(shu)步驟:
s1:將所(suo)有讀取(qu)結果(reads)比對到人類基(ji)因組(zu)上(shang),去除(chu)瑕疵reads;其中,瑕疵reads包括以下(xia)至少一(yi)種情況:
1)去除比對(dui)到基因組多個位置的reads序(xu)列,減少非(fei)唯一(yi)比對(dui)reads序(xu)列對(dui)最(zui)終結(jie)果的影(ying)響;
2)判斷測(ce)序(xu)所得的(de)reads序(xu)列是(shi)否包含需(xu)要檢測(ce)的(de)位點(dian),如(ru)果不包含,去(qu)除(chu)(chu)該(gai)條reads,如(ru)果包含,去(qu)除(chu)(chu)測(ce)序(xu)質量(liang)低(di)于10的(de)reads序(xu)列;
3)識別(bie)每條reads序列是否在兩端存在完(wan)整(zheng)的uid序列,如果不完(wan)整(zheng),去除(chu)該條reads;
s2:按(an)照uid標簽序列,將reads分成不同的家族(family),每個family中(zhong)前后的uid標簽序列相同,去除瑕疵family;其中(zhong),瑕疵family包括以(yi)下(xia)至少一種情況:
1)如果兩(liang)個(ge)family中的(de)uid只差一(yi)個(ge)位點(base),而其中一(yi)個(ge)family的(de)reads的(de)數量(liang)大于等于另一(yi)個(ge)family的(de)reads數量(liang)的(de)兩(liang)倍,第(di)(di)二個(ge)family可以當(dang)作pcr或測序錯(cuo)誤(wu)所產(chan)生(sheng)的(de),去除(chu)第(di)(di)二個(ge)family;
2)對同一(yi)個family中(zhong)reads數目進行統計,如(ru)果reads數目少于3條,去除該family;
s3:統(tong)計突變型reads并(bing)對突變型的存在進行判斷(duan),判斷(duan)標準一(yi)般包括以(yi)下至少一(yi)種情況:
1)對同(tong)一個(ge)(ge)family中突(tu)變(bian)型(xing)和野(ye)生型(xing)的(de)(de)(de)reads進行(xing)統計,當突(tu)變(bian)型(xing)的(de)(de)(de)reads占這個(ge)(ge)family里面(mian)reads的(de)(de)(de)80%以上,才認為該family中這個(ge)(ge)突(tu)變(bian)型(xing)是真實存在的(de)(de)(de);
2)統計(ji)每個檢(jian)測位點(dian)突變(bian)型family的數(shu)目,只要(yao)該位點(dian)突變(bian)型family數(shu)目大于3且突變(bian)型頻率占總頻率的0.0005以(yi)上,才認(ren)為(wei)該檢(jian)測位點(dian)存在堿基突變(bian)。
本發明(ming)經過(guo)上述監測(ce)和數(shu)據分析,能夠(gou)有效去(qu)除pcr或測(ce)序錯誤產生的假陽性結(jie)果,能夠(gou)檢測(ce)到低至0.1%以(yi)下的微(wei)量低頻突變(bian)。
本發(fa)明對癌癥相關基(ji)因(yin)的(de)(de)(de)檢測(ce)可以采用試劑(ji)盒(he)的(de)(de)(de)形式,具體可以包(bao)括樣品(pin)dna(血漿dna)提取試劑(ji)、帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu)試劑(ji)、多(duo)重pcr擴增(zeng)(zeng)試劑(ji)、帶(dai)(dai)(dai)有(you)測(ce)序(xu)(xu)接(jie)頭的(de)(de)(de)與目(mu)的(de)(de)(de)基(ji)因(yin)的(de)(de)(de)一(yi)組帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu)的(de)(de)(de)接(jie)頭序(xu)(xu)列匹(pi)配的(de)(de)(de)第二(er)步擴增(zeng)(zeng)引(yin)物(wu)(wu)(wu)(wu)試劑(ji)、以及引(yin)物(wu)(wu)(wu)(wu)特異性酶解試劑(ji)。其(qi)中(zhong),所(suo)述(shu)帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu)試劑(ji)包(bao)括至(zhi)少一(yi)個目(mu)的(de)(de)(de)基(ji)因(yin)的(de)(de)(de)一(yi)組帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu),且帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu)試劑(ji)分為兩種(zhong)混(hun)(hun)合液(ye)進行存放,其(qi)中(zhong)一(yi)種(zhong)混(hun)(hun)合液(ye)為所(suo)有(you)目(mu)的(de)(de)(de)基(ji)因(yin)的(de)(de)(de)帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu)中(zhong)序(xu)(xu)列l1和序(xu)(xu)列l2構(gou)成的(de)(de)(de)引(yin)物(wu)(wu)(wu)(wu)混(hun)(hun)合液(ye),另一(yi)種(zhong)混(hun)(hun)合液(ye)為所(suo)有(you)目(mu)的(de)(de)(de)基(ji)因(yin)的(de)(de)(de)帶(dai)(dai)(dai)標(biao)(biao)(biao)簽引(yin)物(wu)(wu)(wu)(wu)中(zhong)序(xu)(xu)列l3和序(xu)(xu)列l4構(gou)成的(de)(de)(de)引(yin)物(wu)(wu)(wu)(wu)混(hun)(hun)合液(ye)。進一(yi)步,所(suo)述(shu)試劑(ji)盒(he)中(zhong)還可以包(bao)括用于高通量測(ce)序(xu)(xu)的(de)(de)(de)試劑(ji),例如文庫擴增(zeng)(zeng)試劑(ji)等。
下(xia)面以egfr基因為例,進一步(bu)詳細介紹本發明的(de)檢測方法。
一、帶標簽引物設計
針對常見的egfr基因的9個常見突變位點,從pubmed在線(xian)數據(ju)庫檢索egfr基因突變位點的dna序(xu)(xu)列(lie),通(tong)過ncbiblast軟件(jian)(//www.ncbi.nlm.nih.gov/blast/)進行比(bi)對,然(ran)后應(ying)用primeprimer5(primerbiosoft,usa)軟件(jian)針對這些(xie)突變區域(yu)設計引物序(xu)(xu)列(lie)(正(zheng)向引物序(xu)(xu)列(lie)以f表(biao)示(shi),反向引物序(xu)(xu)列(lie)以r表(biao)示(shi)),在引物端(duan)加接(jie)(jie)頭(tou)序(xu)(xu)列(lie)(正(zheng)向接(jie)(jie)頭(tou)序(xu)(xu)列(lie)以p1表(biao)示(shi),反向接(jie)(jie)頭(tou)序(xu)(xu)列(lie)以a1表(biao)示(shi))和唯一(yi)標識符(uid)序(xu)(xu)列(lie)。經(jing)過反復試驗(yan)篩選和驗(yan)證,得到了擴(kuo)增效(xiao)率高、特異性好,針對待測樣本中不同目的基因的五組(zu)帶標簽引物,具體(ti)如下。
帶標簽引物(wu)組a用于(yu)檢測egfr基因(yin)18號外顯子g719x突變,引物(wu)序列如下:
a-f-p1:
a-r-a1:
a-r-p1:
a-f-a1:
帶標(biao)簽引物組b用于檢測egfr基因19號外顯子e746_a750del&v769_d770insasv的缺失/插入(ru),引物序列如下(xia):
b-f-p1:
b-r-a1:
b-f-a1:
b-r-p1:
帶標簽引物組c用(yong)于檢測egfr基因20號(hao)外顯子(zi)s768i突變,引物序列如下(xia):
c-f-p1:
c-r-a1:
c-f-a1:
c-r-p1:
帶標簽引(yin)物組d用(yong)于(yu)檢(jian)測egfr基因20號外顯(xian)子t790m突變,引(yin)物物序列如下:
d-f-p1:
d-r-a1:
d-f-a1:
d-r-p1:
帶標簽引物組e用于檢(jian)測egfr基(ji)因20號外(wai)顯(xian)子(zi)l858r&ll861q突變,引物序列(lie)如下:
e-f-p1:
e-r-a1:
e-f-a1:
e-r-p1:
在上述(shu)帶(dai)標(biao)簽引物(wu)中,單(dan)下(xia)劃線部(bu)(bu)(bu)分(fen)(fen)為正(zheng)(zheng)向(xiang)接頭序列,雙(shuang)下(xia)劃線部(bu)(bu)(bu)分(fen)(fen)為反向(xiang)結構序列,單(dan)曲(qu)線部(bu)(bu)(bu)分(fen)(fen)為正(zheng)(zheng)向(xiang)引物(wu)序列,雙(shuang)曲(qu)線部(bu)(bu)(bu)分(fen)(fen)為反向(xiang)引物(wu)序列,無下(xia)劃線部(bu)(bu)(bu)分(fen)(fen)為uid序列。
二、采用上述帶(dai)標簽引物對癌(ai)癥相關基因進行擴增
1、引物稀釋與混合
將上述(shu)帶標簽引物(wu)高速離心后,分組混(hun)合(he)成預(yu)混(hun)引物(wu),以1:15的(de)比例向預(yu)混(hun)引物(wu)中加(jia)入lowtebuffer,配置成引物(wu)混(hun)合(he)液(ye)(primermixer)用于第一(yi)步擴(kuo)增。其(qi)中,引物(wu)混(hun)合(he)液(ye)為兩(liang)種,分別包括5對引物(wu):
primermix1(5pairs):
a-f-p1/a-r-a1,b-f-p1/b-r-a1,c-f-p1/c-r-a1,d-f-p1/d-r-a1,e-f-p1/e-r-a1
primermix2(5pairs):
a-r-p1/a-f-a1,b-f-a1/b-r-p1,c-r-p1/c-f-a1,d-f-a1/d-r-p1,e-r-p1/e-f-a1
上述兩種引物混合液(ye)可(ke)以(yi)分別作為成(cheng)品試劑盒中(zhong)的帶(dai)標簽引物試劑。
2、樣品dna提取
從單個血液樣本分離血漿部分,然后用magmaxtmcell-freednaisolationkit提取游離(li)dna。
3、第一步擴增
將(jiang)樣品dna與帶標簽(qian)引物試劑(primermix1&primermix2)混合,進行(xing)覆(fu)蓋度均一的特異性擴(kuo)(kuo)增,得到140~190bp長度的目的基因(yin)dna片段。本(ben)步擴(kuo)(kuo)增在目的基因(yin)兩端加(jia)上uid標簽(qian),叫做(zuo)taggingpcr,擴(kuo)(kuo)增條件是(shi)98℃10秒(miao),65℃秒(miao),72℃30秒(miao),2-10個(ge)cycle。
4、引物二聚體酶解
將第一步擴增得到(dao)目的(de)基(ji)因dna片段(duan),加入引物(wu)特異性酶解(jie)試劑,降解(jie)去(qu)除pcr擴增片段(duan)中的(de)引物(wu)序列(lie)。
5、第二步擴增
用pcr擴增試劑盒qiagenmultiplexpcrkit做第二步pcr,將帶標簽的目的基因dna片段進行富集,本步擴增的擴增引物(第二步擴增引物)包含第一步擴增引物中的接頭序列,即正向引物包含ctaacctgatgggcagtcggtgat,反向引物包含
三、高通量測序
1、接頭連接
若第二步擴增引(yin)物中不同時含有適用于測(ce)序(xu)(xu)的(de)測(ce)序(xu)(xu)接(jie)頭(tou),可以單獨(du)進行接(jie)頭(tou)連接(jie)操作(zuo),將上述(shu)第二步擴增的(de)產物與測(ce)序(xu)(xu)接(jie)頭(tou)、特異性區分序(xu)(xu)列的(de)barcord標簽、連接(jie)反應試(shi)劑、end-repair反應后(hou)純化,得到加了測(ce)序(xu)(xu)接(jie)頭(tou)的(de)dna片段(duan)。
2、文庫構建
將(jiang)含(han)有測序(xu)接頭的dna片段與文庫擴(kuo)增試劑(ji)混合,進行pcr擴(kuo)增,得到小片段dna文庫。
3、文庫均一化
將獲得的小片段dna文庫加入額(e)定吸附能力的磁珠,進行純化,獲得特定濃度的小片段dna文庫。
4、文庫檢測
將上一步所獲得的特定濃度(du)的小片段dna文庫采用(yong)熒光定量(liang)pcr的方法檢(jian)測濃度(du)。
5、上機測序
上(shang)一步檢測(ce)后的(de)特(te)定濃度的(de)小片段dna文(wen)庫進行高通(tong)量測(ce)序,采用(yong)ionprotontm測(ce)序平(ping)臺(其他高通(tong)量測(ce)序平(ping)臺的(de)高通(tong)量檢測(ce)方法也同樣(yang)適用(yong))。
四、數據分析
1、將所有reads比對到人類(lei)基因組上(shang),去除瑕疵(ci)reads;其(qi)中,瑕疵(ci)reads的去除包括:
1)去除比對到基因組多(duo)個位置(zhi)的reads序列,減少(shao)非唯一比對reads序列對最終結果的影響(xiang);
2)判斷測序(xu)所得的(de)reads序(xu)列(lie)是否包(bao)(bao)含需(xu)要(yao)檢測的(de)位點,如(ru)果不包(bao)(bao)含,去除(chu)該(gai)條(tiao)reads,如(ru)果包(bao)(bao)含,去除(chu)測序(xu)質(zhi)量低于10的(de)reads序(xu)列(lie);
3)識(shi)別每(mei)條reads序列是否在(zai)兩(liang)端存在(zai)完整的uid序列,如果不完整,去(qu)除該條reads;
2、按照uid標簽序(xu)列,將reads分成不(bu)同(tong)的family,每(mei)個family中(zhong)(zhong)前后的uid標簽序(xu)列相同(tong),去除(chu)瑕疵(ci)family;其(qi)中(zhong)(zhong),瑕疵(ci)family的去除(chu)包括:
1)如果兩個family中的(de)uid只差一個base,而其(qi)中一個family的(de)reads的(de)數量大于(yu)等于(yu)另一個family的(de)reads數量的(de)兩倍,第二(er)(er)個family可以(yi)當作pcr或測序錯(cuo)誤所(suo)產生的(de),去除第二(er)(er)個family;
2)對同一(yi)個(ge)family中reads數(shu)目(mu)進行統計,如果reads數(shu)目(mu)少于3條,去除該family;
3、統計突(tu)變型reads并(bing)對突(tu)變型的存在進行判斷,判斷標準包括:
1)對同(tong)一個(ge)family中突變型(xing)和野生型(xing)的(de)reads進行統(tong)計,當突變型(xing)的(de)reads占這個(ge)family里面(mian)reads的(de)80%以上(shang),才認(ren)為該family中這個(ge)突變型(xing)是真實存在的(de);
2)統(tong)計每(mei)個(ge)檢測(ce)位點突(tu)變(bian)(bian)型(xing)family的(de)數(shu)目(mu),只(zhi)要(yao)該位點突(tu)變(bian)(bian)型(xing)family數(shu)目(mu)大于3且突(tu)變(bian)(bian)型(xing)頻率占總(zong)頻率的(de)0.0005以上,才認(ren)為該檢測(ce)位點存(cun)在堿基(ji)突(tu)變(bian)(bian)。
以上所述僅為本發明(ming)創(chuang)造的(de)較佳實施(shi)例而已,并不(bu)用以限(xian)制本發明(ming)創(chuang)造,凡在本發明(ming)創(chuang)造的(de)精(jing)神和原(yuan)則之內,所作的(de)任何修改(gai)、等同替換、改(gai)進等,均應(ying)包含(han)在本發明(ming)創(chuang)造的(de)保護范圍之內。