專利名稱:對基因探針的改良的制作方法
本發明總地涉及多核苷酸和DNA及RNA探針、它們的制備以及它們在遺傳特性鑒定中的應用。這些用途例如可以包括證實人、動物或植物的來源,因而本發明的多核苷酸和探針可以在例如父親身份爭異或法醫學中或者在遺傳病或遺傳素因的予防、診斷和治療方面得到應用。
在英國專利申請NO8525252(公開號2166445)中描述了多種DNA序列,這些序列可以用來作為探針在人和動物基因組內的許多多態性位點處分別雜交,使得能夠產生由標記的不同分子量的帶構成的“指紋圖”。這種指紋圖總體上是有關的個體的特征,通過個體的譜系可以追溯這些不同譜帶的來源,在某些情況下其來源可以假定為與某些遺傳病有聯系。
本發明是基于這樣一個發現,即通過使用多位點探針在基因組中可以識別信息性基因位點,并且可以制備出一些多核苷酸及多核苷酸探針,其中每個對于這樣的單一的信息性基因位點是特異的。
迄今為止,在人體DNA中只發現了數量有限的高可變位點,這些位點包括胰島素基因的5′小隨體(minisatellites)(Bell、Selby和Rutter,1982);C-Ha-rasl基因的3′小隨體(Capon等,1983),Ⅱ型膠原基因(Stoker等,1985)和ξ2與ψξ1珠蛋白基因之間的區域(Goodbourn等,1983),以及由染色體14之長臂的終端區得到的無名DNA克隆所限定的D14S1位點(Wyman和White,1980;Balazs等,1982;Wyman、Wolfe和Botstein,1984)。這些小隨體的變異性有實質性差異,其范圍從在膠原高可變區檢測到的僅僅6個不同的等位基因(Sykes、Ogilvie和Wordsworth,1985)到在D14S1位點處的80多個(Balazs等,1986)。人的基因組中的高可變位點的總數有多少目前還不知道,但這個數字有可能很大。人的基因組可能含有至少1500個高可變區。
業已發現,有可能克隆一個通過將基因組DNA的片段同某多核苷酸探針雜交所鑒定的DNA片段,上述探針是能夠通過參考一種以上的多態性小隨體區或高可變位點鑒別DNA的多核苷酸探針,例如在前面所述的英國專利申請No.8525252(公開號2166445)中所描述并提出權利要求
的探針33.6和33.15;并可以由其制備出能夠雜交到一DNA片段上的多核苷酸或探針,該DNA片段含有一個對于基因組中的某特定區域或位點為特異的小隨體,而所說的區域或位點是一個可以提供信息的基因位點。在本說明書中我們將提供信息的基因位點定義為在任何100,個隨機選取的無關個體的樣品中的該位點處可以鑒別出至少3個不同的等位基因。本文中將這一含義表述為,該位點具有至少3(100)個等位基因變異。隨機選取的無關個體的樣品數較好為500個,最好是1000個。在本文中將在這樣一些樣品中區分出至少3個不同的等位基因的能力分別稱為3(500)和3(1000)。重要的是這100、500或1000個隨機選取的無關個體的樣品必須確實是隨機選取的,因為通常情況下通過篩分總人群中的足夠大數量的樣本,可以鑒別100、500或1000個在給定的提供信息之基因位點上具有3個以下等位基因的個體。
在一個給定的提供信息的基因位點處,這種多態性越高,這種位點特異的探針在遺傳特性鑒定中(例如為確定父親身份或法醫鑒定而進行個體鑒別時)就越有用并且提供更可靠的信息。
在這方面,可將上述“個體”一詞理解為不僅用來指人,而且還指動物和植物以及由這些人、動物和植物得到的細胞系。但是在每一種情況中,隨機選取的無關個體的樣品應該都是取自同一物種。
就本發明應用于人的情況而言,本文中所使用的“信息性基因位點”這一表述可以換一種方式定義為一個基因位點,在該位點處在從選自下列任何20個細胞系〔這些細胞系已經寄存在美國典型培養物保藏中心(ATCC)〕中提取的DNA中可以區分出至少3個不同的等位基因。
細胞系 ATCC寄存號Hela CCL2RPMI2650 CCL30Detroit532 CCL54Detroit525 CCL65Detroit529 CCL66Detroit510 CCL72WI-38 CCL75Citrullinemia CCL76EB-3 CCL85RAJI CCL83JIYOYE(P-2003) CCL87
WI-26 CCL95Detroit551 CCL110RPMI6666 CCL113RPMI7666 CCL114CCRF-CEM CCL119CCRF-SB CCL120HT-1080 CCL121HG261 CCL122CHP3(M.W.) CCL132LL47(MaDo) CCL135HEL299 CCL137LL24 CCL151HFLI CCL153WI-1003 CCL154MRC-5 CCL171IMR-90 CCL186LS174T CCL188LL86(LeSa) CCL190LL97A(AIMy) CCL191HLF-a CCL199CCD-13Lu CCL200CCD-8Lu CCL201CCD-11Lu CCL202CCD-14Br CCL203
CCD-16Lu CCL204CCD-18Lu CCL205CCD-19Lu CCL210Hs888Lu CCL21MRC-9 CCL212Daudi CCL213CCD-25Lu CCL215SW403 CCL230NAMALWA CRL1432上述所有細胞系均可隨意向ATCC索取,地址是12301 Parklawn Drive,Rockville,Maryland 20852-1776,USA。這些細胞系已列入ATCC的細胞系與雜交瘤的目錄冊中。上述細胞系都是在1985年以前寄存在ATCC的。
根據本發明的一個特征,其提供了一種制備能夠雜交到一個DNA片段上的多核苷酸的方法,該DNA片段含有一個對于基因組中的某特定區域或位點是特異的小隨體,所述的區域或位點具有至少3(100)個等位基因變異(根據上文中的定義)。該方法包括克隆一個通過將基因組DNA的片段與一多核苷酸探針雜交而鑒定的DNA片段,上述多核苷酸探針能夠參考一個以上的多態性小隨體區域高可變位點來鑒別DNA;由此制備能夠雜交到一含小隨體之DNA片段上的多核苷酸,所述的小隨體對于基因組中的某特定區域或位點是特異的,而所述的區域或位點具有至少為3(100)個等位基因變異(根據上文中定義)。
根據本發明的另一特征,其提供了一種制備能夠雜交到一DNA片段上的多核苷酸的方法,該DNA片段含有一個對于基因組中的一個特定區域或位點是特異的小隨體,而所述的區域或位點的多態性程度至少為3(根據上文定義)。
這一方法包括克隆一個通過將基因組DNA的片段與一個多核苷酸探針雜交而鑒定的DNA片段(該探針能夠參考一種以上多形性小隨體區域或高可變位點鑒定DNA);由此制備能雜交到一個含小隨體之DNA片段上的多核苷酸,該小隨體對于基因組中的一個特定區域或位點是特異的,而所述的區域或位點具有的多態性程度至少為3(根據上文定義)。
多核苷酸探針最好包含同時包括有己標記或標志組件的、至少含有3個串聯重復(在所有串聯重復的序列之間平均至少有70%的同源性)序列的多核苷酸,這些序列與基因組的小隨體區是同源的,其相符程度為能使探針雜交到用限制性核酸內切酶切斷樣品DNA所得到的一個相應的DNA片段上,其中a)每次重復都含有一個核心,該核心與來自不同之基因位點的多個小隨體中存在的有相似長度的相符核心區至少有70%的同源性(即70%相符);
b)這一核心長度為6至16個核苷酸;
c)對該核心沒有貢獻的重復單元中核苷酸的總數不超過15個。
另外,上述DNA片段含有一來自小隨體區或高可變位點的小隨體,這個區域或位點可以用一個多核苷酸探針測到,所述的多核苷酸探針包含序列(包括其互補序列)(A)AGGGCTGGAGG 1(其中T是T或U,(A)可有可無),或序列(包括其互補序列)
AGAGGTGGGCAGGTGG 2(其中T是T或U)的至少三次串聯重復。
根據本發明的另一特征,其提供了一個分離形式或已克隆形式的核苷酸,它包含一個對單一小隨體區或高可變位點特異的核苷酸序列,并且是與之同源的,其相符程度為能使該核苷酸序列雜交到用限制性核酸內切酶切斷樣品基因組DNA所得到之相應的DNA片段上,所說的DNA片斷含有一個來自所述之小隨體區或高可變位點的小隨體,其中1)上述區域或位點具有至少為3(100)的等位基因變異(根據本文中的定義);
2)上述區域或位點可以用一個多核苷酸探針檢測到,該探針含有序列(包括互補序列)(A)AGGGGCTGGAGG 1(式中T是T或U,(A)可有可無),或者序列(包括互補序列)AGAGGTGGGCAGGTGG 2(式中T是T或U)的至少三個串聯重復序列。
本發明還涉及相應的多核苷酸,其中正與至少3個等位基因變異相對,上述的區域或位點具有的多形性程度至少為3。
根據本發明的另一特征,本發明的多核苷酸及采用上文中限定的本發明之方法制備的多核苷酸是通過增殖含有己克隆之物質的微生物或直接合成來制備的。
本發明包括DNA、RNA的多核苷酸以及可雜交到DNA上的任何其它類型的多核苷酸。以上限定的多核苷酸是未標記的,且可以是雙股(ds)或單股(ss)形式的。
本發明包括用作探針的ss形式的標記的多核苷酸以及用以制備ss-探針的其標記的ds-前體。
因而,根據本發明的另一特征,其提供了一種多核苷酸探針,它包括上文中所限定的本發明的多核苷酸或用上文中指定的方法制備的具有一標記或標志組件的多核苷酸。一般地說,至少該多核苷酸的核苷酸序列應是單股形式的,最好是探針由整體上為單股形式的多核苷酸所構成。
根據本發明的另一特征,其提供了一種制備上文中所限定的多核苷酸探針的方法,該方法包括標記或標志上文中所限定的本發明的多核苷酸或用上文中限定的本發明之方法制備的多核苷酸。
本發明的多核苷酸探針最好是以任何常規方式進行32p-放射性同位素標記,但也可以用雜交技術領域:
中所熟知的其它方法進行放射性同位素標記,以得到35s-放射性同位素標記的探針。它們也可以按D.C.Ward等人的方法用生物素或類似的物質標記〔Proceedings of the 1981ICN-UCLA Symposium on Developmental Biology using Purified Genes held in Keystone,Colorado on March 15-20,1981Vol.XXIII 1981Pages 647-658 Academic Press;Editor Donald D.Brown et al or even enzyme-labelled by the method of A.D.B.Malcolm et al,Abstracts of the604 th Biological Society Meeting,Cambridge,England(Meeting of 1 July 1983)〕。
根據本發明的另一特征,其提供了一種參考一個或多個對照物對基因組DNA的試驗樣品進行特性鑒定的方法,該方法包括用一種或多種限制性酶切斷樣品DNA,該限制性酶不至于將相應于串聯重復的序列切至任何相關程度;用一個多核苷酸或多核苷酸探針探查這些DNA片段,上述多核苷酸或多核苷酸探針含有一個對于單一的小隨體區或高可變位點為特異的并且是同源的核苷酸序列,其相符程度足可使該核苷酸序列能雜交到含有來自上述單一小隨體區或高可變位點之小隨體的相應DNA片段上;檢測已雜交的DNA片段;將已雜交的片段與一個或多個上述的對照物進行比較,其中1)所述的小隨體區或高可變位點具有至少為3(100)的等位基因變異;
2)所述的區域或位點可以用能夠參考一個以上多態性小隨體區或高可變位點以鑒定DNA的多核苷酸探針來檢測。
本發明還涉及對試驗樣品進行特性鑒定的相應方法,在該試驗樣品中上述區域或位點具有與至少3個等位基因變異相對的至少為3的多態性程度。
本發明的方法最好是采用一種多核苷酸或按本發明之方法制備的多核苷酸,或者采用上文中限定的本發明的多核苷酸探針來實施。
樣品DNA最好是人的DNA。
為了幫助讀者理解,現就本說明書中的某些術語說明如下高可變的人、動物或植物DNA的某個被識別的位點或位點上的一個區域,如果它是以許多不同的形式(例如在長度或順序方面)出現,則稱之為高可變的。
小隨體由一個短的DNA序列串聯重復構成的人、動物或植物DNA的一個區域。所有重復單元可能不一定完全相同。
多態性的個體與個體之間或者在染色體配對的已知個體之間表現有變異性的基因或其它DNA片段,稱之為多態性的。
重復或串聯重復(序列)完全或不完全地順序重復的多核苷酸序列。通常一個被說成是串聯重復的序列應重復至少3次。
不完全重復(序列)就核苷酸的數目或種類而言,其不是嚴格重復,但可識別出某相符順序(Consensus Sequence)的重復。
%同源性(%相符)在比較兩個重復或串聯重復序列A和B時,將A中的堿基對數目減去B中為與A一致而必須替換、增加或刪去的堿基對數,然后表示以百分數表示,即得到百分同源性。據此可知,ATGC和AGC這兩個序列之間的百分同源性是75%。
相符核心(Consensus Core)(序列)在許多重復序列中,通常是在有2個或2個以上不同的小隨體的重復單元中,可以被鑒定為最接近之匹配的序列。
核苷酸(nt)和堿基對(bp)作為同義詞使用。兩者均可以指DNA或RNA。縮寫字C、A、G和T習慣上指的是(脫氧)胞苷、(脫氧)腺苷、(脫氧)鳥苷以及脫氧胸苷或尿苷。但是應當理解,縮寫字A、C、G和T可包括能與一般的核苷酸即(脫氧)腺苷、(脫氧)胞苷、(脫氧)鳥苷、及脫氧胸苷或尿苷進行堿基配對的其它堿基修變的核苷酸。這樣的堿基修變的核苷酸包括(脫氧)肌苷和(脫氧)氮雜鳥苷。
當本發明的多核苷酸或多核苷酸探針含有串聯重復的序列時,該串聯重復可以是完全重復的也可以是不完全重復的,或者是完全重復與不完全重復的混合體。在探針序列中較好有至少3個重復,最好是有至少7個重復序列。
本發明的探針可以單獨地或與其它位點特異的探針結合起來用于那些使用探針之混合物或合劑(Cocktail)的一系列試驗或單個試驗中,它們可以用于下列領域1.人的父系或母系檢驗。
2.在例如移民爭執和繼承糾紛中進行家族檢驗。
3.孿生兒的接合性試驗。
4.人的近交檢驗。
5.人的一般譜系分析。
6.鑒別與人的遺傳病有聯系的位點,從而可以構建特異的探針以檢查基因缺陷。
7.法醫學,例如(a)為取自被強奸之受害者的精液樣品打指紋印跡;
(b)將取自例如弄污的衣服上的血、毛發和精液樣品打指紋印跡,(c)鑒別人的尸體,(d)鑒定其它法醫組織樣品例如皮膚的遺傳特性。
8.細胞嵌合性(Cell Chimaerism)研究,例如在骨髓移植后追蹤供體對受體細胞的嵌合性。
9.家畜品種和譜系的分析/證明。(例如,這可以包括純種動物的常規控制和檢驗,以及在涉及賽馬和狗品種等的訴訟案件中檢驗譜系)。此外,還提供可能表明與經濟上重要的遺傳特性有聯系的基因標志。
10.經過培養的動物或植物細胞系的常規質量控制,核查純細胞系的污染物以及常規鑒定工作。
11.分析腫瘤細胞及因分子異常而產生的腫瘤。
12.可以予料,由此得到的多核苷酸或探針在植物育種中具有潛在的應用前景。但是,如下文中實施例3所述,本發明的位點特異性探針在法醫學中特別有用,且至少pλg3探針可以與胎兒血紅蛋白之遺傳穩定性的異源細胞形式共分離。這種探針還提供了在父系檢驗和有關方面的用途(見上述用途2和5)以及作為細胞嵌合性研究的有效方法。
圖1A顯示取自DNA指紋圖譜的一個特定高可變DNA片段的凝膠電泳圖譜,這個片段在本文中稱為“g片段”。圖1B借助克隆DNA的限制圖顯示出DNA g片段的組織。
圖2顯示高可變之g片段的DNA序列,特別著重強調了相符重復序列及其與英國專利公開NO2166445中“核心”序列的校準排列部分。
圖3顯示用pλg3檢測到的多態性DNA片段的孟德爾(Mendelian)遺傳特征;
圖4顯示通過雜交到pλg3上檢測到的小隨體等位基因的大小分布;
圖5顯示用于位點特異性高可變DNA探針的λMS重組體的篩分;
圖6顯示λMS系列小隨體和pλg3小隨體的相符重復序列單元;
圖7顯示用本文中稱為λMS32的探針檢測到的高可變位點的孟德爾(Mendelian)遺傳特征;
圖8顯示對用本文中稱為λMS43的探針檢測到的高可變位點處等位基因變異性的估計;
圖9顯示對人的DNA庫中高可變位點處等位基因長度變異的分析;
圖10顯示在一組用AluⅠ酶切的人-嚙齒動物體細胞雜交DNA中,用本文中稱作λMS32的探針檢測到的高可變位點的等位基因分離;
圖11顯示對位點特異性高可變探針之靈敏度的估價及其在強奸/殺人雙重犯罪案件的法醫學分析中的應用;
圖12顯示,通過與本發明之集合的小隨體探針雜交,檢測人DNA中的多個高可變位點。
本發明的多核苷酸、用本發明的方法制備的多核苷酸以及本發明的多核苷酸探針可以同含有一來自小隨體區或高可變位點之小隨體的DNA片段雜交,上述區域或位點可以用一多核苷酸探針鑒別出來,該探針是由選自下列的任一序列AGGAATAGAAAGGCGGGYGGTGTGGGCAGGGAGRGGC 3GTGGAYAGG 4TGGGAGGTGGRYAGTGTCTG 5GAATGGAGCAGGYGRCCAGGGGTGACTCA 6
GGGCTGGGGAGATGGTGGAGGAGGTGTTGG 7AGGCTGGGGAGATGGTGGAGGAAGAGTAC 8TCTGTGTAATGGGTATAGGGAGGGCCCCGGGAAGGGGGTGTGGYX 9(其中Y是C、T或U,X是G或C,R是A或G,T是T或U),或它們的串聯重復序列、或與它們互補的序列所構成的。
本發明的多核苷酸、用本發明的方法制備的多核苷酸以及本發明的探針均能與含有一個來自單一特定小隨體區或高可變位點之小隨體的DNA片段雜交,因而是位點特異的。一般地說,本發明的多核苷酸和探針在非常嚴格的雜交條件下是位點特異的。在這方面,本文中使用“位點特異的”一詞來表述多核苷酸或探針意思是該多核苷酸或探針在確保多核苷酸或探針只雜交到單一特定位點的雜交條件下才能使用。
但是應當理解到,在嚴格程度降低的雜交條件下使用時,本發明的位點特異探針可以參考一個以上多態性小隨體區或高可變位點來鑒別DNA,因而可以用于鑒定其它提供信息的基因位點。
從而,根據本發明的另一特征,其提供了制備能雜交到一個含有小隨體之DNA片段上的多核苷酸的方法,該小隨體對于基因組中的一個特定區域或位點是特異的,所述的區域或位點具有至少3(100)個等位基因變異(根據本文中的定義)。這一方法包括將基因組DNA的片段與上文中限定的多核苷酸探針雜交,克隆該通過雜交鑒定的DNA片段,由其制備能雜交到含有小隨體之DNA片段上的多核苷酸,該小隨體對于基因組中的一個特定區域或位點是特異的,所述的區域或位點具有至少3(100)個等位基因變異(根據本文中的定義);該方法應在使探針可以參考一個以上多態性小隨體區域或高可變位點鑒別DNA的雜交條件下有效地實施。
根據本發明的另一特征,其提供了一種分離形式或已克隆形式的多核苷酸,它包含一個對單一小隨體區或高可變位點為特異的核苷酸序列,并且該序列與之同源,其相符程度達到可使該核苷酸序列能雜交到用限制性核酸內切酶切斷樣品基因組DNA得到之相應的DNA片段上,所說的DNA片段含有一個來自所述小隨體區或高可變位點的小隨體,其中1)所述的區域或位點具有至少3(100)個等位基因變異(根據本文中定義);
2)所述的區域或位點可以用一個上文中限定的位點特異性多核苷酸探針檢測。
本發明還涉及相應的方法及相應的多核苷酸,其中所述的區域或位點具有至少為3的多態性程度。
本發明還涉及包含這樣的位點特異性多核苷酸的探針以及用這樣的多核苷酸及多核苷酸探針對DNA試驗樣品作遺傳特性鑒定的方法。
本發明的位點特異性多核苷酸和探針可以與含小隨體之DNA片段的小隨體是相似的,或者是與小隨體之側翼序列的相似性較差。
在本發明的多核苷酸和探針包含一個特定序列的串聯重復時,這樣的序列一般應重復至少3次,并且這些重復不一定必須是嚴格的重復。不是嚴格的重復在其它地方稱為不完全重復。不過這些重復應該可以看出來是被重復了的。一般地說,這意味著在所有重復單元之間平均有至少70%的同源性(相符性)。在全部重復單元之間,較好有至少80%,更好有至少85%,最好有90%的相符。然而可以理解到的是,在有些情況下,核苷酸序列或“重復單元”並不需要完完全全地重復。
重復單元的數目n至少是5,但最好是至少10。適合的n是10至40,但原則上n可以是任何數,甚至是由1至10000。
在本發明的多核苷酸和探針包含一特定序列的串聯重復時,任何位于側翼的序列基本上是不相干的。它們可被刪除或者可以以任何數的核苷酸存在,例如可多達50000個,不過用這樣長的探針去完成工作可能不如通常長度那樣敏感。然而象這樣大的多核苷酸仍可用作載體,可由其中切下用作探針的較小的多核苷酸。甚至當重復序列是ss-DNA形式時,這些位于側翼的序列可以構成ds-DNA或ss-DNA的一個部分。
本發明的多核苷酸和多核苷酸探針最好包含由上文中限定的序列式3至9中選出的某一序列或其互補序列,或者是其串聯重復(在所有串聯重復序列之間,平均有至少70%相符)或與之互補的序列。
本發明的一個優選的多核苷酸包含如上文所限定的序列式3的序列,或者其串聯重復或與之互補的序列。這樣的核苷酸序列是對位于染色體7上的常染色體的位點特異的。包含這樣一個序列的多核苷酸和多核苷酸探針在本文中被稱為pλg3。
本發明的另一優選的多核苷酸包含如上文所限定的序列式4的序列,或者其串聯重復或與之互補的序列。這樣的核苷酸序列是對位于染色體1上的位點特異的。包含這樣一個序列的多核苷酸或多核苷酸探針在本文中被稱為λMS1。
本發明的另一優選的多核苷酸包含如上文所限定的序列式5的序列,或者其串聯重復或與之互補的序列。這樣的核苷酸序列對位于染色體7上的位點是特異的。包含這樣一個序列的多核苷酸和多核苷酸探針在本文中稱為λMS31。
本發明的另一優選的多核苷酸包含如上文所限定的序列式6的序列,或其串聯重復或與之互補的序列。這樣的核苷酸序列是對位于染色體1上的位點特異的,包含這樣一個序列的多核苷酸和多核苷酸探針在本文中被稱為λMS32。
本發明的另一優選的多核苷酸包含如上文所限定的序列式7和8中選出的序列,或者是其串聯重復或與之互補的序列。這樣的核苷酸序列對位于染色體5上的位點是特異的。包含這樣一個序列的多核苷酸和多核苷酸探針在本文中被稱為λMS8。
本發明的另一優選的多核苷酸包含如上文所限定的序列式9的序列,或者是其串聯重復或與之互補的序列。這樣的核苷酸序列是對位于染色體12上的位點特異的。包含這樣一個序列的多核苷酸和多核苷酸探針在本文中被稱為λMS43。
如上所述,在重復單元之間通常有至少70%,較好是至少80%,更好是有至少85%,最好是有至少90%的相符。但特別優選的是序列式3至9中任一序列的準確重復。關于這一點應理解到的是,只要每個重復單元具有落入預期之序列式范圍內的序列,即可使后一要求得到滿足。因而並不需要每個重復單元都具有完全相同的序列。
在本發明的一個優選的實施方案中,其提供了一個鑒定試驗樣品供體與一個或多個對照試驗樣品供體是完全一致或是不同的方法。在該方法中,對照樣品均須作彼此類似地酶切,並將來自各不同樣品的雜交片段進行比較。
在本發明的另一優選實施方案中,提供了一種鑒定試驗樣品供體與一個或多個對照樣品供體之間家族關聯的方法,在該方法中,對照樣品均須作相似地酶切,並且就得自各個樣品的雜交片段進行比較。
可使用本發明的多核苷酸或探針實施上述方法,或可使用至少兩種本發明的多核苷酸或探針,完成一系列或單個使用上述多核苷酸或探針之混合物的試驗。
在本發明的另一優選實施方案中,其提供了一種診斷遺傳性疾病、異常或特征的方法,該方法包括使用至少一個如上文所限定的多核苷酸或多核苷酸探針以檢測試驗樣品,所述的探針是與特殊的遺傳性疾病,異常或特征有關聯的。
我們已于嚴格的雜交條件下,試驗了所有用作位點特異性探針的本發明的探針。
依據我們已試驗過的本發明的探針檢測的位點之極端特異性,並結合它們在Southern印跡雜交中顯示的靈敏性,其在個體鑒別中,特別是當如英國專利申請NO.8525252(公告號為216644)中所述及並提出權利要求
的可用于多位點DNA指紋分析之DNA不夠用時,本發明便提供一種特別有用的試驗工具。多位點DNA指紋圖可由0.5μg DNA分析得到,而位點特異性探針則至少更敏感一個數量級,並且使用少至1μl的血液樣品即可。
在需要檢驗甚至更少量的樣品的任何非尋常情況下,將本發明的方法與歐洲專利申請NO86302299.2(公告號為0201184)中所述的放大技術相結合,將會具有特別顯著的應用價值。
本發明能夠在人的基因組中鑒定出可提供遺傳信息的基因位點,並因而能夠制備位點特異性探針;而每個位點特異性探針對單一之信息性基因位點又是特異的。我們已特別鑒定了6個不同的信息性基因位點,這些位點在被檢人群中具有很高的雜合性(至少90%),並且是迄今已分離到的基因位點中最具多態性的;我們也已制備了適用于每個位點的位點特異性探針,並將其分別定名為pλg3、λMS1、λMS8、λMS31、λMS32和λMS43(如上文所規定的)。
用位點特異性探針檢測基因型的個體特異性程度可由每個位點處的異質性H來估計。一個位點處的平均等位基因頻率q可由式(1-H)求出,而且兩個隨機選擇的個體分享同一基因型的概率是q2(2-q)。這種兩個個體間假性關聯的概率變異可由λMS8的0.02到λMS31的0.0002,而且因q中的異質性將會減少這些概率數,故這只是一個保守的估計。所有6個小隨體探針的假性關聯之累積概率是~10-16,差不多與使用1個多位點探針檢測的兩個隨機選擇的DNA指紋圖之差數相同(見英國專利申請NO.8525252)。相反,就一個給定的高可變位點來說,兩個血親完全相同之或然率可由公式1/4(1+q)2得出。對于所有6個探針,血親關系完全相同之累積概率為0.0004,此可與使用一個多位點探針所測得的DNA指紋圖的~10-7相比較。
正如圖11C中分析之謀殺案例所顯示的,其中使用了由兩個用于DNA指紋圖分析的法醫樣品中回收到不足量的DNA,證明這些位點特異性高可變探針在法醫學中是特別有用的。用探針λMS1和λMS31檢測顯示有共同基因型的得自兩受害者的精液DNA,不同于采自嫌疑犯的精液DNA基因型。根據上述討論,我們可以計算出受害者X和Y被不同的無關者強奸的概率為2×10-7。相似地,兩個假定的強奸者是一級相關的,例如是兄弟的或然率為0.07。這就為X和Y是被同一個人強奸的提供了強有力的證據,后來通過對較大量法醫材料的DNA指紋圖分析進一步證實了這一結論。再者,由X和Y取得的精液污物幾乎肯定是來自于一個人,而不是兩個或多個性攻擊者。細察圖11C中污斑b的實例,它顯示出兩個受害者等位基因和兩個另外的強奸者等位基因。三個個體(兩個強奸者和一個受害者)的儲集物會顯示4個或4個以下可分辨之等位基因的或然率可由公式q2(55-210q+216q2)求出。由探針MS1的這一概率為0.02和由探針λMS31的這一概率為0.005,得出X被兩個人而不是一個人強奸的聯合概率為10-4。這就確實了X和Y是被一個人強奸的,並且顯示位點特異性探針-與多位點DNA指紋圖探針不同-可用于估計在一混合的DNA樣品中所呈現的個體數。
高可變DNA片段的蒙德爾遺傳特征也可使之用于確定例如父權爭異等家族關系問題。對于一個給定的位點特異性探針,孩子中的父系等位基因偶然存在于某個隨機選擇者中的概率可由2q-q2來估算。對于所有六個小隨體,得出非父親之假性結論的累積概率為
,此與使用兩個DNA指紋圖探針獲得的概率數差不多。相似地,作出真正父親的一級相關者(如兄弟)之結論的累積概率是0.02。因此依次使這些高可變位點特異性探針為確認有終止訴訟手續之申請的家族關系提供了一種十分有用的方法;但有些情況下,可因在這些不穩定的位點上突變成新的長度之等位基因,而導致錯誤的結論。有關這些高可變位點處的突變率尚不明瞭。
這些位點特異性探針的位點特異性和敏感性可使合并的探針用于產生多位點Southern印跡圖譜(圖12)。由5個合并的探針產生的這些“重建的DNA指紋圖”,要比用多位點探針所檢測的其對應圖譜簡單得多,而且會更適于在密度計掃描之后進行數字編碼。盡管個體間的小隨體有很高的變異性,但還有相當數目(18%)的片段是在無關北歐人之間共有的,這主要是因為來自不同位點之小隨體片段電泳共遷移的結果。這一水平的泳帶共享相似于由多位點探針產生的常規DNA指紋圖中所見到泳帶共享水平,后者在隨機選擇的個體間泳帶共享的水平為~25%。因為在混合的探針圖形中分辨出平均8.4個DNA片段,所以在一個個體中的所有這些片段存在于第二個隨機選擇的個體中的或然率可保守地估計為0.188.4=6×10-7。為此,這些圖形提供了一個高水平的個體特異性-雖然並不象使用多位點探針或繼后的與位點特異性探針雜交所能達到的那么高(參見上文)。合并的探針和個別位點特異性探針在研究細胞嵌合性,特別是對提供骨髓移植后追蹤記憶留跡(engraphment)的供體對受體標志是很有用的;DNA混合實驗(圖12)表明,使用這些探針可檢驗出低水平的嵌合性。
下列實施例中所用的溫度均為攝氏度(℃),且如英國專利公告2,166,445號中所述的探針33.6和33.15分別有下列的相符重復序列(A)AGGGCTGGAGG,和AGAGGTGGGCAGGTGG
實施例1該實施例敘述了DNA指紋圖中特定之小隨體片段的分離及性質一般方法按Jeffreys A.J.等人〔Nature316,76-79(1985)〕所述的方法由白血細胞中分離DNA,並按Jeffreys等人(Am.J.Hum.Genet.39,11-24)所述的方法由Epstein-Barr病毒轉染的、得自HPFH譜系之個體Ⅲ9的類淋巴母細胞系〔見Nilsson,K等,Int.J.Cancer8,443-450(1971)〕中分離DNA。按上述Jeffreys A.J.等人的文獻中所述方法完成限制性酶切和Southern印跡雜交。按Dretzen,G等人(Anal.Biochem,112,295-298(1981))所述的方法在DE81濾紙上電泳以分離雙股DNA探針片段,並按Feinberg,A.P.等人(Anal.Biochem.137,266-267,(1984))所述的隨機寡核苷酸預引發方法用32P標記之;再依照Jeffreys等人(Nature 314,67-73(1985))所述方法制備單股小隨體探針33.15。
克隆高可變片段g通過0.5%瓊脂糖凝膠電泳分離用Sau 3A酶切的600μg個體Ⅲ9類淋巴母細胞系DNA,並按Yang R.C.A.等人(Meth.Enzymol.,68,176-182,(1979))所述的方法在透析膜上經電洗脫收集有相應大小的部分。經過兩次制備性凝膠電泳后,片段g被純化1000倍(得率為150ng DNA)。將20ng如此部分純化的DNA連接于60ng用BamHI酶切后分離的λL47.1臂(見Loenen W.A.M.和Branmar,W.J,Gene 20,249-259(1980))上,于體外包裝並接種在大腸桿菌WL95(803,supE、supF、hsdRk-、hsdMk+、tonA、trpR-、metβ,P2溶源菌株)上(見Loenen的上述文獻及Jeffreys,A.J.等,J.Mol.Biol.156,487-503(1982))以收集重組體。通過與小隨體探針33.15的噬斑雜交方法篩選所得的1500個重組噬菌體庫。在大腸桿菌ED8910(803、supE、supF、recB21、recC22、hsdS)〔見Loenen的上述文獻〕上再接種並篩選4個陽性噬菌斑,之后用Blattner等人(Science194,161-169(1977))的方法制備重組噬菌體DNA。將重組噬菌體g3的Sau3A插入片段再克隆到pUC13的BamHI位點〔Vieira J.和Messing J.,Gene19,259-268(1982)〕中,並使之在大腸桿菌JM83,Δ(recA-srlR)306Tn10(見Matfield,M.(1983)Ph.D.thesis,University of Leicester〕的recA衍生株中增殖。
DNA序列分析超聲處理、按大小收集pλg3DNA並散彈槍式克隆到M13mp19〔見Yanis-Perron C.等Gene33,103-119(1985)〕的SmaⅠ位點中。為確定pλg3之隨機重復區域的DNA序列,用雙脫氧核苷酸鏈終止方法〔見Sanger F.等人,Proc.Nat.Acad.Sci.USA74,5463-5467(1977)和Biggin M.D.等人Proc.Natl.Acad.Sci.USA80,3963-3965(1983)〕分析12個隨機克隆的序列。這些克隆中有8個是由pλg3的隨機重復之小隨體區域得來的,並用于限定相符重復序列。通過與32P標記的側接探針a和B雜交(見下面圖1所述)檢測含5′和3′側翼區的M13克隆,並作序列分析以確認側翼區域序列以及小隨體的開始和終止點。
結果自DNA指紋圖中分離特定小隨體用小隨體探針33.15檢測受HPFH(胎兒血紅蛋白的遺傳穩定性)影響之Jeffreys等人〔Am.J.Hum.Genet.,39,11~24(1986)〕所述Gujarati家系的個體Ⅲ9及她的DNA指紋圖,其含有一8.2Kb多態性片段(片段“g”;圖1A),該片段傾向于與前述文獻〔Am.J.Hum.Genet.39,11-24(1986)〕所述的家系之其它成員共分離。經過兩次制備凝膠電泳由其它小隨體片段中純化出這一DNA片段。
圖1圖解顯示了通過凝膠電泳進行純化的電泳圖譜。用Sau3A酶切Jeffreys等人所述家系中個體Ⅲ9的DNA,並經制備凝膠電泳收集6-9Kb片段(部分1)。再次電泳分離這些片段以得到部分2-5。用Sau3A酶切Ⅲ9DNA的各等分部分並將每一部分通過0.8%瓊脂糖作電泳分離,之后與小隨體探針33.15進行Southern印跡雜交。傾向于與HPFH共分離的片段g(8.2Kb)在部分3中被純化了大約1000倍。
將在Sau3A消化產物中檢測出的、並按上述方法純化得到的富含片段“g”約1000倍的部分克隆到上述Loenen及Brammar文獻中所述的λL47.1中,之后在P2溶源性rec+大腸桿菌上增殖,以選擇重組噬菌體。經與探針33.15雜交以篩選所得克隆庫。得到四個很小(直徑小于0.1mm)的陽性噬菌斑,但能夠以低效率(0-8pfu/噬菌斑)重新接種于recB、recC大腸桿菌上,以產生正常大小的噬菌斑(直徑1mm)。進一步定性兩個克隆(即λg1和λg3),並顯示分別含有7.7和7.8Kb的Sau3A插入片段。這些克隆都是從g泳帶得來的(見下述),但分別比g帶短0.5和0.4kb。因為生長于recB、recC大腸桿菌上的λg1或λg3中沒有Sau3A插入片段的大小不均一性,所以我們斷定插入的部分已于它們在rec+大腸桿菌中最初的增殖期間由各克隆中丟失。
用Blattner方法〔見Science194,161-169(1977)〕制備的λg1和λg3的得率很低(只有λL47.1重組DNA之正常得率的1%),此再次表明這類小隨體克隆的異常生長性質。故將Sau3A插入部分再克隆到pUC13〔見Vieira,J.和Messing J.,Gene19,259-268(1982)〕中並在大腸桿菌JM83的recA衍生株〔見Matfield M.,Ph.D thesis,University of Leicester(1983)〕中增殖,以使插入部分的重排降至最小。所得亞克隆即pλg3(見圖1B),含有-7.1KbSau3A插入部分,其比g3中的插入部分短0.7Kb。
小隨體片段g的組織通過限制性酶切圖(圖1B)和DNA序列分析(圖2)測定pλg3中小隨體片段的結構。
圖1B中顯示了DNA片段g的組織。用限制性內切酶AluⅠ(A)、DdeⅠ(D)、HaeⅢ(H)、MboⅡ(M)、PstⅠ(P)和Sau3A(S)酶切繪制pλg3中Sau3A插入部分的基因圖。其中沒有HinfⅠ或RsaⅠ的切點。7.14Kb插入部分含有37bp序列(見圖2)的171次串聯重復外加747Kb的側接DNA。5′側翼區域含有倒轉之Alu“組件”(畫影線顯示)的開始部分。圖中顯示了側翼探針a和b之唯一序列的原點。
圖2顯示了高可變片段g的DNA序列。圖中將5′和3′側翼區及小隨體之起始和終止部分的序列連同小隨體之三個隨機區域的重復序列一起顯示出來。倒位的Alu“組件”之開始部分以下面畫線的大寫字母顯示,而5′側翼區域中的幾個簡單序列區則未在下面畫線。顯示了37bp小隨體重復單元的相符序列(Con),並給出了各個重復單元與這一相符的差異。區域C中的第二個重復單元含有一HaeⅢ切點(下面未畫線的),故該區域跨越小隨體中的固有HaeⅢ位點(圖1B)。還以英國專利公開2,166,445號中所述相似方式顯示相符重復序列與“核心”序列連成一線。
克隆pλg3含有一個除有單一的固有HaeⅢ位點外缺乏其它限制性切點的6.3Kb小隨體。該小隨體是由37bp單元的171次重復序列構成的,此37bp單元包含序列GTGGGCAGG;這個序列恰好符合于先前鑒定為幾個不同的人類小隨體所共享之11-16bp核心序列(見英國專利公開2,166,445號及本文圖2)的最無變化部分。重復序列不是完全同源的;對來自小隨體內之幾個隨機選擇的區域的序列分析表明其中有有限量的重復序列變異。最多的變異包括可產生一33bp重復單元之再集合的4bp缺失,這種變異散布于一個以上的重復單元中。一個變異片段(區域C中的A→C顛換)產生出唯一的固有HaeⅢ位點並因此可能僅見于一個重復單元中。小隨體的開始和終未重復單元比固有重復顯然更能與該序列歧異。
pλg3中的小隨體側接有含正常密度之限制性切點的非重復DNA(圖1B)。5′側翼區的開始部分是由倒轉的Alu組件之頭組成的。由雜交探針a和b限定的其余之5′和3′側翼區(圖1B)是獨特的序列DNA並只雜交到總DNA(未顯示數據)中的這一位點上。5′側翼區則含有大量的簡單序列DNA〔多嘌呤和(ACC)n〕(圖2)。
小隨體片段g檢測單一的多態性位點為檢驗是否完整克隆的小隨體片段能用作雜交探針以特異地確定人DNA中的相應位點,可于人DNA競爭物存在下,將pλg3的Sau3A插入片段與用HinfⅠ(DNA指紋圖法常規使用的限制性內切酶)酶切的人DNA雜交(圖3)。
圖3顯示了用pλg3檢測之多態DNA片段的孟德爾遺傳特征。用HinfⅠ酶切8μg人DNA的樣品並通過0.8%瓊脂糖凝膠電泳分離之。在6%聚乙二醇和50μg/ml堿剪切的人胎盤DNA競爭物存在下,于65℃在1×SSC中將酶解產物與pλg3的Sau3A插入片段作Southern印跡雜交,並于雜交后于65℃在0.2×SSC中洗滌。pλg3在所顯示的所有個體中均檢出一個雜合的單一位點。等位基因(由字母標示之)的遺傳特征是孟德爾式的。
在高強度洗滌條件下(0.2×SSC,65°),在所有被檢的個體中檢測出一個或兩個雜交的片段。pλg3檢測出了先前試驗的Ⅲ9的親屬中的8.2Kb片段,進一步證實泳帶g已被克隆(資料未顯示)。在較低強度洗滌條件下(1×SSC,65℃),則檢測出其它不太清楚地雜交的多態性DNA片段。
在高強度洗滌條件下由pλg3檢測到的DNA片段是作為孟德爾遺傳方式之單一位點的等位基因被分離的。這個位點不是性聯的,而且沒有很明顯地顯示出來,但在所研究的兩個大家系中表現有不完全的性聯(被試驗的61個子代,在
=0.43時
=0.18;資料未示出);因此它表現為一個常染色體位點,並已定位在染色體7上(見表1)。
該小隨體位點處的極端多態性變異用得自pλg3的插入片段篩選取自79個隨機選擇之英國白種人DNA的HinfⅠ酶解產物,通過一長35Cm的、濃度為0.7%的瓊脂糖,首先對單一的、之后對14個人的儲集樣品(每人1μgDNA)進行電泳分析,以得到最大程度的等位基因分辨能力。圖4中顯示了由這個群體樣品中檢出的不同等位基因的長度,連同每個等位基因中重復單元的估計數及等位基因頻率。據此圖4顯示出小隨體等位基因大小的分布情況。最短的共有等位基因中小隨體的長度是使用側接的單拷貝探針a和b(圖1),通過純合子中這個片段的基因圖測定的(數據未示出)。每個等位基因的重復數是近似的數目,且取決于小隨體中37對33bp的比例。除去短的共有等位基因外,其余的等位基因被取樣檢驗一次(42個等位基因)、二次(12個等位基因)、三次(12個等位基因)或四次(5個等位基因)。如果所有這些等位基因都是同樣罕見的,則這一分布與預測的(q=0.0081,2〔4d.f.〕=4.0)結果並沒有顯著差異,因此與存在于人群中的一個共有短等位基因(q=0.165)和103個同等罕見的等位基因(每個等位基因q=0.0081)的簡單模式是一致的。
在這個人群樣品中,可分辨出至少77個不同的等位基因,同時每個等位基因的重復數為14至525左右。該人群樣品中的純合子都是最短等位基因的純合子。上述對等位基因數及罕見等位基因之平均頻率的估計是受凝膠分辨能力限制的,該樣品中不同長度等位基因的真實數目可能更大些。
等位基因長度的分布似乎並不是完全隨機的,但有可分為三類的證據(圖4),即分為短(14-16次重復)、中(41-68次重復)和長(107-525次重復)等三類等位基因。對于定位于人胰島素基因中5′端的高可變區來說,先前已在白種人中記錄有等位基因長度的雙峰分布〔見Bell,G.I.等人,Nature 295,31-35(1982)〕,但這種雙峰分配在黑人中卻不明顯〔Lebo,R.V.等人,Proc.Nat.Acad.Sci.USA80,4804-4812(1983)〕。
片段g的分離表明,DNA指紋圖法中大的和高度多態性的DNA片段原則上能夠適合于進行分子克隆,從而提供了適用于研究個別高可變區的位點特異性探針。雖然片段g可被克隆到噬菌體入中,但所得之克隆在rec+大腸桿菌上卻顯示了不正常生長性質。這將導致來自常規放大之人類基因庫之小隨體克隆的缺失。已克隆的小隨體當再克隆到recA大腸桿菌中的pUC13內時或于再克隆期間都是不穩定的,與片段g比較,最后的重組體pλg3已丟失了大約30%的單元。因此pλg3的物理圖(圖1)並不完全反映片段g的組織。
已克隆的DNA片段具有預期之小隨體結構,證實片段g不是由較長隨體DNA衍生的。盡管在每個重復單元中均存在有“核心”序列。且在5′側接區域中存在Alu序列的一部分,但在“競爭物”人DNA存在下,該已克隆的片段g可起到位點特異性探針的作用。pλg3不足以有效地檢測其它含有核心的小隨體,是由于在每個重復單元中存在有其它的非核心DNA,其可能干擾與其它小隨體交叉雜交(見英國專利公告2166445號)。
已克隆的小隨體表現有極端的長度多態性,這可能是由于每個等位基因中重復單元之數目及37和33bp重復類型之比例這兩方面的等位基因變異所至。在158個染色體的隨機人群樣品中,可分辨出一個共有的和至少76個罕見的等位基因。這個位點要比迄今已定性的大多數或所有已克隆之人類高可變區都具有更大多態性(包括選擇最初用于定義“核心”序列之相對短的已克隆小隨體〔見美國專利公告2,166,445號〕)。這一位點上的雜合性至少是96.6%,同時大多數雜合子是由短的共有等位基因產生的。
通過改變重復次數如通過DNA復制期間的滑動或由“核心”序列(一公認的重組信號)驅動的不等交換可產生這個位點上的新的等位基因。在中性突變隨機漂移假說下,參數4NeV(θ)(其中Ne是有效群體大小,V是每個配子突變為一新的長度等位基因的突變率)可使用無限等位基因模型(infinite allele model)〔見Ewens,W.J.,Theor.Popul.Biol.3,87-112(1972)〕十分準確地由某群體樣品中記錄的不同等位基因數目估算出來。我們估算這個位點的θ是60-90(同時依據是否包括共有的短等位基因)。因為人的Ne是~104V,故在這個位點上突變為新長度等位基因的突變率約為每個配子0.002。因為所檢出的等位基因數目是受凝膠分辨能力限制的,而且沒有一個無限數目的潛在的可分辨等位基因,所以上述的V值實際上是一個低估的數值。這個位點上小隨體的平均長度是5Kb,因而每Kb小隨體的突變(重組)率為>4×10-4,此與對其它較短的含核心小隨體所估算的每Kb為10-4,以及人DNA的平均減數分裂重組率為每Kb約10-5差不多〔參見Jeffreys,A.J.等,Nature314,67-73(1985)〕。可見,在這個小隨體位點上新等位基因的產生率是非常高的,此與本發明人先前提出的這些富含核心區域可能是重組熱點這一觀點是一致的。短等位基因的突變率相對低些,此可解釋為什么群體中最短等位基因漂移雖已達到一個顯著的頻率、但在此過程中卻未受到不等交換的破壞。
業已證明,DNA指紋圖法對于個體鑒定及確證家族關系(如在父親身份和移民爭執中)是一種十分有效的方法。該方法的準確度是由一條帶被兩個隨機選擇的個體共享的低平均概率X決定的。對于英國白種人,就大于4Kb之DNA指紋圖HincⅠ片段來說;經驗上估計X為0.2。當出現帶在兩個個體之間共有的情況下(即由于某條帶有相似的遷移率和放射自顯影強度,而導致一個個體的一條帶與第二個個體中的帶相匹配),便弄不清該共享的帶是否代表某一小隨體位點的相同等位基因。圖4所示的等位基因分布使我們能夠計算出這些>4Kb之等位基因的X;對于這個特定的小隨體位點來說,X=0.016,其比由多位點DNA指紋圖估計的值低一個數量級。如果這一克隆的小隨體是呈現于DNA指紋圖中的典型位點上的,則在無關DNA指紋圖間共享的大多數帶即是由于不同小隨體片段的偶然共遷移所致。這一重要的實踐結果在于,在不能排除的案例-一例如在父親身份爭議中,就孩子中的所有父系帶明確地存在于假定之父親的DNA指紋圖中的概率來說,據先前的計算其假性包涵的概率是很低的(X=0.2),而這又只是對真實概率(X=0.016)的一個粗略地過高估算。
使用DNA指紋圖探針33.6和33.15,有可能記錄到在大的人類血親中有多達34個分散的常染色體位點。對于大多數已檢出的位點,在一組較大的(>4Kb)已分辨之DNA指紋圖片段中,只有兩個等位基因之一是可記錄(顯示)的,此提示小隨體等位基因之間存在有很大的長短差異,同時許多等位基因是位于DNA指紋圖的很難被分辨的(<4Kb)區域內。這種情況亦見諸于已克隆的小隨體;在這一位點上的HinfⅠ等位基因長度為1.7至20.4Kb,而且圖4中所示的等位基因頻率分布表明這個位點的等位基因在僅僅40%的個體之DNA指紋圖中得以分辨,同時還有14%的人沒有記錄到顯見的等位基因。
小隨體探針33.6和33.15共檢測到大約60個高可變位點,其中許多位點現已能適于克隆,以提供一個高度信息性的單一位點探針庫,例如可用于人的連鎖研究。使用完整的DNA指紋圖亦可能對單個大家族中的遺傳性疾病進行連鎖分析。如果一個被檢測的多態性片段表現與疾病共分離,即有必要克隆這個片段,以提供一個將連鎖分析擴展到其它受影響之家族的位點特異性探針。
在下面的實施例2中開始使用下述材料和方法。
a)克隆一選擇的大的小隨體由40個隨機選擇的個體各制得5μg血細胞DNA並合并之,用Sau3A完全酶解並在0.6%瓊脂糖凝膠中經制備電泳分離出5-15Kb片段,電洗脫后加于透析膜上透析。在第二個制備凝膠中電泳分離已純化的部分,以除去所有痕量污染的小Sau3A片段。將50ng5-15Kb部分連接于100ng用BamHⅠ酶解后分離之λL47.1臂〔Loenen和Brammar,Gene20,249-259(1980)〕上,體外包裝並構建成庫,用人小隨體探針33.6和33.15(見英國專利公告2,166,445號)篩選並按實施例1所述方法分離陽性噬菌斑,以得到MS系列重組噬菌體。
b)分離小隨體雜交探針用Sau3A酶解重組噬菌體DNA,並在低凝膠熔解溫度瓊脂糖(Sea Plaque)中經電泳由小載體片段中分離出大的插入片段。將含有插入物片段的凝膠條溶解于3倍體積水(65℃)中,並通過隨機寡核苷酸引發法〔Feinberg和Vogelstein,Anal.Biochem.137,266-267(1984)〕用32P標記含10ng插入物片段之各等分部份。
c)Southern印跡雜交按Jeffreys等人〔Am.J.Hum.Genet.39,11-24(1986)〕所述的方法限制性切斷基因組DNA樣品並進行電泳分離。將DNA轉移到Hybond-N(Amersham)上,用u/v照射以固定之並在0.5M磷酸鈉、7%SDS、1mM EDTA(pH7.2)中于65°預雜交5分鐘〔Church和Gilbert,Pro.Natl.Acad.Sci.USA81,1991-1995(1984)〕。于25μg/ml經剪切的單股人胎盤DNA競爭物存在下,將濾膜與0.5μg/ml32P標記的探針DNA(比活性為~109Cpm/ug DNA)雜交過夜。雜交后,于65°在40mM磷酸鈉、1%SDS(pH7.2)中洗濾膜,之后再于65°在0.1×SSC(15mM Nacl、15mM檬檸檬酸三鈉,pH7.0)、0.01%SDS中以高強度洗滌。于加強膜(intensifier screen)存在下,于-80°將濾膜放射自顯影3小時至1周。
d)測定MS小隨體的串聯重復序列用超聲波處理各MS重組DNA,選擇大小為0.3-0.6Kb的片段並散彈槍式地克隆到M13mp19的SmaⅠ位點〔Yanis-Perron,Vieira和Messing,Gene33,103-119(1985)〕中。與32P標記的MS插入物DNA作噬斑雜交以篩選重組的噬菌體。通過C-試驗〔Winter和Fields,Nucleic Acids Res.8,1965-1974(1980)〕成對地比較自給定的MS重組體分離的10個強陽性單鏈噬菌體DNA;多數DNA落入兩個互補的C-試驗組內,因此其很可能是由λMS插入片段之長的、隨機重復的區域來的。用雙脫氧核苷酸鏈終止方法〔Sanger,Nicklen and Coulson,(1977)Proc.Natl.Acad.Sci.USA74,5463-5467;Biggin,Gibson and,Hong,(1983)Proc,Natl.Acad.Sci.USA80,3963-3965〕測定得自兩個互補組的各兩個M13重組體的序列,以確定兩條鏈上每個MS重組體的相符重復序列。
實施例2a)分離-選擇的位點特異性高可變DNA探針實施例1中已述及了通過制備凝膠電泳分離,之后再克隆到噬菌體中這一克隆選自人DNA指紋圖譜之片段的實施方案。為分離較寬范圍的小隨體,可將選自40個隨機選擇之個體DNA的大小為6-15Kb的Sau3A片段克隆到BamHⅠ置換載體λL47.1〔Leonen and Brammar,“A bacteriophage lamda Vector for Cloning large DNA fragments made With several restricticn enzymes”Gene20,249-259(1980)〕中。因為人小隨體在其全長中顯示有顯著地等位基因變異(如實施例1中所證明的),所以使用合并的人DNA克隆大的Sau3A片段,應能使可克隆之高可變位點(其具有大的Sau3A等位基因)的數目達到最大。經與人小隨體探針33.15雜交,由含2000個重組體的文庫中分離出5個噬菌體並用探針33.6檢測出另外5個噬菌體,以得到MS系列的重組體(見表1)。
為確定是否每個λMS重組體都能用作高可變小隨體的位點特異性探針,在有人DNA競爭物存在下,將每個重組體的Sau3A插入片段與3個隨機選擇之個體的HinfⅠ酶解產物雜交,或與λMS32的AluⅠ酶解產物〔其小隨體串聯重復單元含有HinfⅠ位點(圖5)〕雜交。10個重組體中有8個雜交到各個被試者DNA中的一個或兩個大的可變DNA片段上。用探針33.6檢測到的重組體中有四個(λMS8、40、42和47)雜交到可變DNA片段之同一圖形上,因而展示它們是衍生自同一高可變位點(圖5,表1)。
圖5顯示篩選適用作位點特異性高可變DNA探針之λMS重組體的一個例子。按本文所述的材料和方法用HinfⅠ酶切2μg得自三個無關個體的DNA樣品,通過0.8%瓊脂糖凝膠作電泳分離並與32P標記的得自pλg3(實施例1)、λMS8和λMS40的Sau3A片段作Southern印跡雜交。雜交后在0.1×SSC中(65°)洗濾膜,並于加強膜存在下放射自顯影1天(左泳道)或1周(右泳道)。應注意到的是,λMS8和λMS40檢測出同一個高可變位點,而且如延長放射自顯影時間,則可檢測出其它幾個可變DNA片段。
其余的重組體λMS1、31、32和43衍生自不同的位點,但不包括先前定性的pλg3位點(見實施例1和圖5)。雖然這些λMS重組體都沒有產生多可變片段的DNA“指紋圖譜”,但經延長放射自顯影爆光時間可見大多數探針與其它多態DNA片段有微弱的交叉雜交(圖5)。
由探針33.15檢出的兩個λMS重組體即λMS3和λMS30,無論是否存在人DNA競爭物,均未能檢測到用HinfⅠ或Sau3A酶切之人DNA中的特異性位點。基于延長放射自顯影時間,兩個重組體均檢測出可變DNA片段之同樣不明顯的圖形(資料未示出)。我們沒有進一步研究這一缺乏位點特異性現象,也沒有進一步定性這兩個MS重組體。
因此,盡管以前有報導認為難于克隆大的且不穩定的人類小隨體〔如參見Nicholls等,Nucleic Acids Res.13,7569-7578(1985);Wyman等,Proc.Natl.Acad.Sci.USA77,6754-6758(1985)〕,但我們則已能夠證明,至少有些在DNA指紋圖譜中檢測出的最大的和極可變的DNA可適合于在噬菌體λ中克隆,條件是通過在recBC大腸桿菌宿主中增殖使插入片段得以穩定。
b)檢測已克隆之小隨體的重復序列單元測定來自每個λMS重組體之DNA插入物的隨機小片段的序列,以確定是否每個克隆的高可變位點均是由隨機重復的小隨體構成的(見材料和方法)。已顯示所有的λMS克隆主要是由長度范圍為,9bp(λMS1)至45bp(λMS43)的串聯重復單元構成的(圖6)。
圖6顯示了λMS系列小隨體的相符重復序列單元。測定每個已克隆小隨體的隨機小片段,以限定相符重復單元。每個相符重復單元中可變位置顯示為R,r=A或G;Y,y=C或T;N,n=任何堿基。MS8中的小隨體包含兩個共同散布的、29和30bp長的重復單元。圖2中還顯示了pλg3的相符重復序列。每個重復序列均與核心序列對齊,同時用大寫字母顯示配對者,還揭示了根據該核心與pλg3、λMS31和λMS32比較而檢出的一新的核心序列。
小隨體中的重復單元都不是完全同源的,此與在以前測定了序列的小隨體中所見到的重復單元之間的變異情況是一致的(見英國專利公告2,166,445號和本文實施例1)。特別值得注意的是,λMS8中的小隨體是由兩個緊密相關的、但有不同長度(29和30bp)的重復單元攙合排布構成的(圖6)。λMS重組體中小隨體的端點尚未確定。
據此,已分離了5個新的高可變位點,每個位點都主要包含一串聯重復的小隨體。正如己預期到的,pλg3、λMS1、λMS31和λMS32的串聯重復單元每個都含有核心序列(圖6)。然而,核心序列的拷貝是不完善的,而且比較這些小隨體的重復單元並沒有明確地限定與這些大的和極端變異的位點優先關聯的新核心序列。有可能是寬范圍的核心衍生物與大的小隨體相關聯。特別值得注意的是,由探針33.6〔其由核心序列之離散型式的串聯重復組成(見英國專利公告2,166,445號)〕檢測出的小隨體λMS8和λMS43含有高度離散型式的核心序列。另外,比較λMS8、λMS43和33.6並不能揭示優選與這三個位點相關聯的新的特異性序列(資料未示出)。很明顯,詳盡地探究與極端可變小隨體(特別是用探針33.6檢測出的小隨體)相關聯的其它序列特征,將需要分析更大量的克隆小隨體圖譜。
c)孟德爾遺傳特征及用克隆小隨體檢測之位點的變異性已分離的5個新的小隨體λMS1、8、31、32和43各檢測一個大的和可變的位點。通過分析由CEPH程序提供的大的水平譜系中的分離情況,已進一步證實了所有位點的孟德爾式遺傳特征(圖7)。
圖7顯示由λMS32探測之高可變位點的孟德爾式遺傳特征。用AluⅠ酶解采自CEPH家族1413的1μg DNA樣品並Southern印跡雜交到32P標記之λMS31的Sau3A插入片段上。這個家族的DNA樣品在該位點處是全部帶有信息性的。
通過分析在隨機選擇之英國人之間共享的等位基因頻率,已估計了適于每一探針之等位基因的變異性程度(圖8)。圖8提供了對MS43探測之高可變位點處等位基因變異性的估計,用HinfⅠ酶解的采自20個隨機選擇之英國人的1μg DNA樣品並與λMS43作Seuthern印跡雜交。所有個體都是雜合性的,此表明在這個高可變位點處雜合性水平是很高的(H>0.86,P>0.95)。將每一個體中的等位基因與6個最接近的鄰居的等位基因進行比較(基于放射自顯影)來估算個體間共享之等位基因數,從而更精確地估計雜合性水平。例如,個體5中的較大等位基因似乎存在于7中,但不存在于個體2,3,4,6和8中。相似地,個體5中的較小等位基因並不存在于2-4或6-8中。對于所有被檢的個體,s=0.11,由此可估算出平均等位基因頻率q=1-(1-s)1/2=0.056,且雜合性為(1-q)=94%。由于受凝膠電泳分辨能力的限制,這只是對雜合性的一個最保守的估算。
所有位點都是高可變的,其雜合性范圍為90%(λMS8)至99%(λMS31)(見表1)。比較在15和150個個體中分辨出的等位基因譜,進一步分析了等位基因長度變異的程度(圖9)。圖9顯示了對人DNA庫中高可變位點處等位基因長度變異的分析結果。用AluⅠ(用于λMS32)或HinfⅠ(用于所有其余的探針)酶解采自某單一個體(a)、15個人的樣品池(b)和150個人的樣品池(c)的10μg DNA樣品並與所指出的位點特異性高可變探針作Southern印跡雜交。所有個體都是隨機選擇的北歐人。單一個體的樣品包含于樣品池b內,所有池b內的樣品又都包含于池c內。應指出的是,λMS43探測到由標記為0之短HinfⅠ等位基因代表的第二可變區;尚未對這個區域作進一步定性。
對于最小可變位點λMS8,在15個人的樣品池中可分辨出2個長度為5.3和7.2Kb的優勢等位基因,外加7個較低頻率等位基因。兩個優勢等位基因的出現並不是由于在這15個人中的抽樣誤差造成的,這一點可通過它們在150個個體中具有相似的優勢並且有較大范圍的低頻率等位基因存在得以證明。相似地,λMS43(94%雜合性)顯示有7個被15和150個個體共享的較大等位基因,連同許多較小等位基因。相反,對于最可變的位點λMS1、31和32以及pλg3,其估算的雜合性為97-99%,未顯示有以相等強度被兩個個體池共享的、具顯著群體頻率的等位基因(上文所述的pλg3的最短1.6Kb等位基因除外),因此這些位點的等位基數目很可能是很大的。例如,在150個個體的樣品池中可分辨出至少50個不同的λMS32等位基因;由于凝膠電泳分辨力的限制,這只是對等位基因總數的一個最小估算。
白種人中,等位基因在這些高可變位點之間的長度分布也是不同的(見圖9和表1)。大多數λMS31的等位基因,在5.5-9.3Kb這一相對窄的長度范圍內分布相當均勻,而λMS1的等位基因則變化很大,長度范圍為2-20Kb。在有些情況下,有證據顯示等位基因長度分布的不均一性;特別是λMS43顯示有如上面實施例1中所述的5-6Kb和8-14Kb這兩類占優勢的等位基因長度范圍,且pλg3顯示有1.6-1.7、2.8-3.6和5-15Kb這樣三類長度范圍。
如上面所指出的,已探測到的位點是極端可變的,並確實是迄今從人DNA中分離之位點中最具多態性的。
d)高可變位點的染色體分配高可變位點特異性探針沒有一個雜交到嚙齒動物DNA上,因此可在人一嚙齒動物體細胞雜種中追蹤到這些位點的分離(見圖10和表2)。6個位點分配于4個不同的常染色體上,其中染色體1和7各攜帶兩個高可變位點。
圖10顯示了在用AluⅠ酶切之人一嚙齒動物體細胞雜種DNA的泳道中,由λMS32探測出之高可變位點的分離情況。這一位點與人染色體1共分離(見表2)。引人注意的是,雜種細胞系MOG2C2攜帶有λMS32和λMS1兩者的兩個等位基因(資料未示出)。這一現象強有力地提示兩親代的人染色體1的拷貝已被保留于雜種中,而且,因所有其它陽性雜種在每一位點上只含有單個等位基因,這就為λMS1和λMS32的同線性提供了有力的證據。雜種F4SC13c112含有染色體1p但是λMS32卻為陰性;因此認為λMS32暫時定位于染色體1q上。
圖10中所用的編號分別是1.人2 16.人12.侖鼠 17.大鼠3.小鼠 18.DUR4,3
4.FG10 19.FIR55.PCT BA18 20.C4A6.1α9498 21.DUR4R37.SIF4A24EI 22.3W4c158.SIF15P5 23.克隆219.CTP34B4 24.WILF110.TWIN19D12 25.F4SC13c111.TWIN19F9 26.SIF4A3112.TWIN19F6 27.FST9/1013.TWIN19C5 28.HORL411B614.MOG2C2 29.HORP9.515.MOG2E5表2顯示人一嚙齒動物體細胞雜種中高可變位點的染色體分配情況。
表2中所列體細胞雜種序號分別是1,DUR4.3;2,FIR5;3,C4A;4,DUR4R3;5,3W4c15;6,克隆21;7,WILF.1;8,F4SC13c112;9,SIF4A31;10,FST9/10;11,HORL411B6;12,HORP9.5;13,FG10;14,PCTBA18;15,1α9498;16,SIF4A24E1;17,SIF15P5;18,CTP34B4;19,TWIN19D12;20,TWIN19F9;21,TWIN19F6;22,TWIN19C5;23,MOG2C2;24,MOG2E5且表中所使用之符號的意義是+,存在有染色體或高可變位點;-,沒有染色體或位點;M,只于某些細胞中存在染色體或用Southern印跡雜交法只能微弱地檢測出的位點;N,未檢測染色體或結果不肯定,未檢測位點;P,存在短臂;D,因7/X轉位而存在染色體7Pter→q22。給出了每個位點特異性高可變探針之推斷的染色體分配,連同明確地提供信息的細胞雜種部分,這些雜種對于存在或不存在完整的染色體或高可變位點來說都是一致的。對于每個高可變探針,用這一分析法除一個外所有染色體均被多重排除。
λMS1雜交到含染色體1p的雜種8(F4SC13c112)上,提示λMS1是位于1p上。相反λMS32則沒有雜交到雜種8上,提示其定位于1q上。pλg3沒雜交到含染色體7pter→q22的雜種2(FIR5)上。再者,雜種JDA13.1和含7pter→q31.3的JDA3及7q31.3→qter對于pλg3分別是陰性或陽性的(資料未給出),pλg3被定位于7q31.3→qter。反之,λMS31雜交到FIR5和JDA13.1上但未雜交到JDA3上,此提示,其定位于7pter→q22。對大的CEPH血親關系者中所作連鎖分析進一步證實了這一缺乏束集(Clustering)的情況;分析表明,在各對同線性標志之間均沒有明顯的連鎖關系(對于每對在>0.35時Z>-2,資料未示出)。
所有6個克隆的小隨體位點,包括實施例1中所述的pλg3,都是常染色體的和分散的;所發現之小隨體的兩同線性對中,均未顯示明顯地成對連鎖。這種常染色體定位和束集缺乏與以前所作DNA指紋圖譜的分離分析結果完全一致,其顯示由多核心探針探測之大量高可變DNA片段均衍生自多數的、分散的常染體位點,但不能從DNA指紋圖譜中推斷出個別片段的染色體定位。
正如所預料的,如果迄今已定位的已克隆小隨體隨機分散于人基因組上,則很可能是得自于大的人常染色體(表1)。在沒有精確地區域性定位之情況下,這些小隨體仍有可能是優先定位在著絲粒和端粒上,它們富集了有簡單序列的衛星DNA。然而,對小鼠之重組的純系細胞菌株中DNA指紋圖譜片段所作分離分析表明,鼠的小隨體並沒有優先與著絲粒或端粒結合,而且很可能是它們的人DNA對應物也有相似地分散情況。
實施例3小隨體探針的敏感性及法醫學應用業經試驗過的串聯重復之小隨體探針是非常靈敏的,此大概是因為雜交探針和靶小隨體DNA之重復性質所致。雜交過夜后得到的Southern印跡放射自顯影信號在探針DNA濃度>0.1ng/ml時達到飽和(資料未顯示),而且能夠很容易地從60ng或更少的人基因組DNA得到信號(見圖11A)。相似地,依據被試個體的基因型,這些探針能探測2%或更少的某一個體DNA與其它個體DNA的混合物(見圖11B)。
這些位點特異性小隨體探針的敏感性和變異性使之尤為適用于法醫學。圖11C顯示出對取自兩個遭強奸並被殺害之受害者身上的精液污斑所作分析,其中由第二個受害者身上回收的DNA如用常規的DNA指紋圖譜分析法(其每次試驗至少用0.5μg DNA)(見UK專利公告2,166,445號)檢測是不夠用的。
為此,圖11示出對位點特異性探針之敏感性的估價以及其在強奸/兇殺雙重犯罪案例之法醫學分析方面的應用。圖11A中顯示用降低量的、經HinfⅠ酶切的人DNA與32P標記的MS1之插入片段作Southern印跡雜交,于加強膜存在下濾膜放射自顯影1周。圖11B是以所指出的比例將降低量的個體A的DNA與4μg個體B的DNA混合,並依圖11A所示與λMS1作Southern印跡雜交。圖11C中所示受害者X和Y是被強奸並繼而被殺害的。嫌疑犯Z被指控殺害了Y,並經法醫學驗證提示X和Y是被同一個人殺害的。由下列法醫學標品中分離DNA並進行分析a,死后兩天采取的頭發;b,由X的陰毛上回收的精液與陰道液的混合物;c,由嫌疑犯Z身上采集的新鮮血液;d,Y死后一天采集的心臟內血液;e,用陰道拭子自Y陰道內采集的帶有精液、血液和陰道材料的標本;f,從Y的裙子上采集的帶有精液和血液的污斑材料,樣品a和b已于4℃干燥儲存了三年,樣品d和e已于4℃干燥儲存了兩個月,且樣品f也于4℃干燥儲存了兩個月。依Gill、Jeffreys和Werrett的方法〔Nature318,577-579(1985)〕提取DNA,用HinfⅠ酶切,並與32P標記的λMS1插入片段作Southern印跡雜交。除樣品e(0.1μg DNA)和樣品f(0.04μg DNA)外,其它各份樣品均分析0.8μg DNA。于加強膜存在下,放射自顯影一周。注意到精液污斑b、e和f各含兩個不屬于受害者的雜交DNA片段。另外,樣品b含有得自陰道DNA的受害者的等位基因。b、e和f中的精液等位基因是不能區分的,提示X和Y確實是被同一個人強奸的。嫌疑犯Z的等位基因並不與精液污斑的等位基因相符合。
這些結果進一步經與λMS31雜交(資料未示出)並通過對大量法醫材料的DNA指紋圖譜分析得以證實。根據這一證據,檢察官撤消了對嫌疑犯Z提出的刑事訴控。
實施例4集合的小隨體探針鑒于這些小隨體在Southern印跡雜交中的敏感性,從而可將探針池(集合物)用于自同時存在的幾個位點檢出可變DNA片段,圖5中顯示了使用包含5個探針(pλg3、λMS1、λMS8、λMS31和λMS43)的探針池檢測之結果。理論上,可被5個探針檢出之不同DNA片段的數目是Σ15]]>(1+Hi),其中Hi是第i個探針的雜合性。就這5個探針來說,每個人應平均被檢出9.78個片段。實踐中,則可分辨出8.4±1.2(S.D)條大于2Kb的帶(被試者為40個隨機選擇的個體)。這種丟失可分辨帶的情況部分原因是由于排除了小的(1.6Kb)和相對常見的(共有的)pλg3等位基因(實施例1,每一個體平均丟失0.33條帶),但更主要的還是由于不同的小隨體等位基因的電泳共遷移。
多位點Southern印跡圖形是高度個體特異的,只有18%(S.D±11%)的DNA片段是由隨機選擇之北歐人個體對之間共享的(試驗了40對)。同胞之間,共享之片段的水平增到~57%(試驗了10對)。
在父/母/子三元組中,所有子代的片段均可追蹤到父母親(圖12)。每個子代都含有3.4±0.5(S.D)個屬父系起源的DNA片段,以及同等數目之母系特異的DNA片段(試驗了10個父/母/子三元組)。
如上屬所指出的,圖12顯示了經與合并的小隨體探針雜交,可檢測出人DNA中的多個高可變位點。用HinfⅠ酶切4μg得自隨機選擇的英國人(1-6)、同胞對(7、8和9、10)以及父/子/母家庭組(11、12、13和14、15、16)的樣品,通過0.8%瓊脂糖凝膠作電泳分離,直到所有小于2Kb的片段都從凝膠中泳出。將酶解產物與來自pλg3、λMS1、λMS8、λMS31和λMS43的各2ng DNA插入片段作Southern印跡雜交;在借助隨機寡核苷酸引發法用32P標記之前,合并各插入片段。帶之標記強度的變異可能是因個別探針的標記和雜交效率不同所導致的。
權利要求
1.制備能夠雜交到含有一小隨體之DNA片段上的多核苷酸的方法,所說的小隨體是對基因組中的特定區域或位點特異的,上述區域或位點具有至少為3(100)的等位基因變異(如說明書所定義的)。該方法包括克隆一個通過將基因組DNA的片段與一多核苷酸探針雜交而鑒定的DNA片段,該多核苷酸探針能夠參考一個以上的多態性小隨體區域或高可變位點以鑒別DNA;由之制備能夠雜交到一含小隨體之DNA片段上的多核苷酸,該小隨體對于基因組中的某特定區域或位點是特異的,而所說的區域或位點具有至少為3(100)的等位基因變異(如說明書中所定義的)。
2.根據權利要求
1的方法,其中所說的DNA片段,其含有一源自小隨體區域高可變位點的小隨體,所說的區域或位點具有至少為3的等位基因變異(如說明書中所定義的)。
3.制備能雜交到含有一小隨體之DNA片段上的多核苷酸的方法,所說的小隨體是對基因組中的特定區域或位點特異的,上述區域或位點具有至少為3的多態性程度(如說明書中所定義的)。該方法包括克隆一個通過將基因組DNA的片段與一多核苷酸探針雜交而鑒定出的DNA片段,該多核苷酸探針能夠參考一個以上的多態性小隨體區域高可變位點以鑒別DNA;由之制備能夠雜交到一含小隨體之DNA片段上的多核苷酸,該小隨體對于基因組中的某特定區域或位點是特異的,所說的區域或位點具有至少為3的多態性程度(如說明書中所定義的)。
4.根據上述任一權利要求
的方法,其中多核苷酸探針包含同時包括有己標記或標志組件的、至少含3個串聯重復(在所有串聯重復之序列間平均至少有70%的同源性)序列的多核苷酸,這些序列與基因組的小隨體區是同源的,其相似程度為能使探針雜交到用限制性核苷酸內切酶切斷樣品DNA所得到的一相應之DNA片段上,其中a)每次重復都含有一個核心,該核心與來自不同之基因位點的多個小隨體中存在之有相似長度的相符核心區至少有70%的同源性(即70%相符);b)該核心長度為6至16個核苷酸;c)對該核心沒有貢獻的重復單元中核苷酸的總數不超過15個。
5.根據上述權利要求
之任一項的方法,其中多核苷酸探針包含序列(包括其互補序列)(A)AGGGCTGGAGG(其中T是T或U,(A)可有可無),或序列(包括其互補序列)AGAGGTGGGCAGGTGG(其中T是T或U)的至少三次串聯重復;所有串聯重復的序列之間至少有70%相符合。
6.根據權利要求
5的方法,其中多核苷酸探針包含有選自AGGAATAGAAAGGCGGGYGGTGTGGGCAGGGAGRGGC 3GTGGAYAGG 4TGGGAGGTGGRYAGTGTCTG 5GAATGGAGCAGGYGRCCAGGGGTGACTCA 6GGGCTGGGGAGATGGTGGAGGAGGTGTTGG 7AGGCTGGGGAGATGGTGGAGGAAGAGTAC 8TGTGTGTAATGGGTATAGGGAGGGCCCCGGGAAGGGGGTGTGGYX 9(其中Y是C、T或U,X是G或C,R是A或G,T是T或U)的任何一個序列或其串聯重復,或與之互補的序列。
7.根據權利要求
1-5中任一項的方法,其中所說的片段含有一得自小隨體區或高可變位點的小隨體,該區域或位點可用含有序列式3之序列或其串聯重復、或其互補序列的多核苷酸探針檢測出來,該方法是在能有效地鑒定單一位點的雜交條件下實施的。
8.根據權利要求
1-5中任一項的方法,其中所說的片段含有一來自小隨體區或高可變位點的小隨體,所說的區域或位點可用包含選自序列式4至9的任一序列或其串聯重復,或與之互助之序列的多核苷酸探針檢測出來,該方法是于能有效地鑒定某單一位點的雜交條件下實施的。
9.根據前述權利要求
中之任一項的方法,其中多核苷酸序列是與含小隨體之DNA片段中的小隨體同源的,且相符程度為能使該核苷酸序列與之雜交。
10.一被分離或克隆形式的多核苷酸,它包含有對單一小隨體區或高可變位點特異的並與之同源的核苷酸序列,其相符程度為能使該核苷酸序列雜交到用限制性核苷酸內切酶切斷樣品基因組DNA所得到的相應DNA序列上,所說的DNA片段包含一來自所說的小隨體區或高可變位點的小隨體,其中1)所說的區域或位點具有至少為3(100)的等位基因變異(根據說明書中的定義);2)所說的區域或位點可用包含有序列(包括其互補序列)(A)AGGGCTGGAGG 1(其中T是T或U,(A)可有可無)或序列(包括其互補序列)AGAGGTGGGCAGGTGG 2(其中T是T或U)之至少三次串聯重復的多核苷酸探針檢測出來。
11.根據權利要求
10的多核苷酸,其中DNA片段含有來自小隨體區域或高可變位點的一小隨體,所說的區域或位點具有至少為3(500)的等位基因變異(根據說明書中所述的定義)。
12.一被分離或克隆形式的多核苷酸,它包含有對單一小隨體區或高可變位點特異的並且與之同源的核苷酸序列,其相符程度足能使該核苷酸序列雜交到用某限制性核酸內切酶切斷樣品基因組DNA所得到的相應DNA片段上,所說的DNA片段含有一來自所說之小隨體區或高可變位點的小隨體,其中1)所說的區域或位點具有至少為3的多態性程度(如說明書中所定義的);2)所說的區域或位點可用含有序列(包括其互補序列)(A)AGGGCTGGAGG 1(其中T是T或U,(A)可有可無)或序列(包括其互補序列)AGAGGTGGGCAGGTGG 2(其中T是T或U)的至少三次串聯重復的多核苷酸探針檢測出來。
13.根據權利要求
10-12中任一項的多核苷酸,其中DNA片段含有來自一小隨體區或高可變位點的小隨體,所說的區域或位點可特異地被含有選自AGGATAGAAAGGCGGGYGGTGTGGGCAGGGAGRGGC 3GTGGAYAGG 4TGGGAGGTGGRYAGTGTCTG 5GAATGGAGCAGGYGRCCAGGGGTGACTCA 6GGGCTGGGGAGATGGTGGAGGAGGTGTTGG 7AGGCTGGGGAGATGGTGGAGGAAGAGTAC 8TGTGTGTAATGGGTATAGGGAGGGCCCCGGGAAGGGGGTGTGGYX 9(其中Y是C、T或U,X是G或C,R是A或G,T是T或U)的任何一個序列或其串聯重復或其互補序列的多核苷酸探針鑒定出來。
14.根據權利要求
10-12中任一項的多核苷酸,其中所說的DNA片段含有一來自小隨體區或高可變位點的小隨體,所說的區域或位點可由含有序列式3之序列或其串聯重復序列的多核苷酸探針檢測出來。
15.根據權利要求
10-12之任一項的多核苷酸,其中所說的DNA片段含有一來自小隨體區或高可變位點的小隨體,所說的區域或位點可用含有選自序列式4至9中任一序列之串聯重復序列的多核苷酸探針檢測出來。
16.根據權利要求
10-15中任一項的多核苷酸,其中核苷酸序列是與DNA片段的小隨體同源的,其相符程度為能使該核苷酸序列與之雜交。
17.根據權利要求
14的多核苷酸,其中核苷酸序列包含序列式3的序列或其串聯重復(所有呈串聯重復的序列之間平均至少有70%是一致的)。
18.根據權利要求
15的多核苷酸,其中核苷酸序列包含選自序列式4至9的任一序列或其串聯重復(所有呈串聯重復的序列之間平均至少有70%是一致的)或與之互補的序列。
19.根據權利要求
17或18的多核苷酸,其中所有呈串聯重復的序列之間平均至少有80%是一致的。
20.根據權利要求
19的多核苷酸,其中所有呈串聯重復的序列之間平均至少有90%是一致的。
21.根據權利要求
20的多核苷酸,其中串聯重復的序列是準確重復的。
22.制備多核苷酸的工藝,其首先是按照權利要求
1-9之任一項中所限定的方法制備多核苷酸,或者說制備權利要求
10-21之任一項中所限定的多核苷酸,該工藝包括用微生物學手段復制己克隆的材料。
23.制備多核苷酸的工藝,其首先是按照權利要求
1-9之任一項中所限定的方法制備多核苷酸,或者是經直接合成制備權利要求
10-21之任一項中所限定的多核苷酸。
24.多核苷酸探針,其包含權利要求
10-21之任一項中所限定的多核苷酸,或者按照權利要求
1-9之任一項中所限定的方法制備的多核苷酸,所說的多核苷酸具有一標記的或標志組件。
25.根據權利要求
24的多核苷酸,其中多核苷酸整個是單股形式的。
26.制備權利要求
24或25中所限定之多核苷酸的方法,其包括標記或標志如權利要求
10-21之任一項中所述的、或按照權利要求
1-9之任一項中所限定的方法制備的多核苷酸。
27.制備能夠雜交到一DNA片段上之多核苷酸的方法,該DNA片段含有一對基因組中特殊區域或位點特異的小隨體,所說的區域或位點具有至少為3(100)的等位基因變異(如說明書中所定義的)。該方法包括克隆一通過以基因組片段與某多核苷酸探針雜交而鑒定的DNA片段,所說的多核苷酸探針是如權利要求
24或25中所要求的,或是按權利要求
26的方法制備的,進而由之制備一能夠雜交到含小隨體之DNA片段上的多核苷酸,該小隨體是對基因組上某特殊區域或位點特異的,所說的區域或位點具有至少為3(100)的基因基因變異(如說明書中所定義的);該方法是于能使探針參考一個以上多態性小隨體區或高可變位點以鑒別DNA的雜交條件下實施的。
28.一被分離或克隆形式的多核苷酸,其包含一對單一小隨體區或高可變位點特異的、並且與之同源的核苷酸序列,其同源相符程度為能使該核苷酸序列雜交到用限制性核酸內切酶切斷樣品基因組DNA所得到的相應之DNA片段上,所說的DNA片段含有一得自所說之小隨體區或高可變位點的小隨體,其中1)所說的區域或位點具有至少為3(100)的等位基因變異(如說明書中所定義的),並且2)所說的區域或位點是可用權利要求
24或25中所述的多核苷酸探針或者按權利要求
26之方法制備的多核苷酸探針檢測的。
29.對權利要求
27中限定之方法,或權利要求
28中所述的多核苷酸的修變,其中所說的區域或位點具有至少為3的多態性之程度。
30.參考一個或多個對照物定性基因組DNA之試驗樣品的方法,該方法包括使用一種或多種不至于切斷相應于串聯重復之序列中任何相關限度的限制酶切斷樣品DNA;用多核苷酸或多核苷酸探針探查該DNA片段-所說的多核苷酸或多核苷酸探針含有對單一小隨體區或高可變位點特異的並與之同源的核苷酸序列,其序列相符程度應能使該核苷酸序列雜交到含得自所說單一小隨體區或高可變位點之小隨體的相應DNA片段上;檢測已雜交的DNA之片段,並將已雜交的片段與所說的一個或多個對照物進行比較,其中1)所說的小隨體區或高可變位點具有至少為3(100)的等位基因變異,並且2)所說的區域位點是可以用能夠參考一個以上多態性小隨體區或高可變位點鑒定DNA的多核苷酸探針探測到的。
31.參考一個或多個對照物以定性基因組DNA之試驗樣品的方法,該方法包括用一種或多種不至于切斷相應于串聯重復之序列到任何相關程度的限制酶切斷樣品DNA;用一多核苷酸或多核苷酸探針探查該DNA片段-所說的多核苷酸或多核苷酸探針含有對單一小隨體區或高可變位點特異的並與之同源的核苷酸序列,其序列相符程度應能使該核苷酸序列雜交到含有得自所說單一小隨體區或高可變位點之小隨體的相應DNA片段上;檢測已雜交的DNA之片段並將已雜交的片段與所說的一個或多個對照物進行比較,其中1)所說的小隨體區或高可變位點具有至少為3個的多態性程度;並且2)所說的區域或位點是可以用能夠參照一個以上多態性小隨體區或高可變位點鑒定DNA的多核苷酸探針探測到的。
32.根據權利要求
30或31的方法,其中所用的多核苷酸或多核苷酸探針是由權利要求
10-21中之任一項所限定的或者是依照權利要求
1-9之任一項的方法制備的。
33.根據權利要求
30-32之任一項的方法,其中樣品DNA是人DNA。
34.根據權利要求
30-33之確證試驗樣品供體與一個或多個對照樣品供體為完全一致或不一致的方法,其中對照樣品是作了相似地酶切的,並將得自各個樣品的雜交片段進行比較。
35.根據權利要求
30-33的確證試驗樣品供體與一個或多個對照樣品供體之間家族關聯的方法,其中對照樣品是經過了相似地酶切的,並將得自各個樣品的雜交片段進行比較。
36.根據權利要求
30-35之任一項的方法,其中探查是使用至少兩個如權利要求
24或25中所述的多核苷酸探針完成的,使用所說的探針進行一系列試驗或單一試驗。
37.根據權利要求
30或31的診斷遺傳性疾病、異常或特性的方法,其包括用至少一個如權利要求
22或33中所述的多核苷酸探針探查試驗樣品,所說的探針-其並不一定攜帶被標記或標志組件-是與特殊的遺傳性疾病、異常或特性相聯系的。
38.基本上如本申請之說明書所述的並根據任一個實施例的多核苷酸探針。
39.基本上如本申請之說明書所述的並根據pλg3、λMS1、λMS31、λMS32、λMS8(1)、λMS32、λMS8(1)、λMS8(2)和λMS43中之一的多核苷酸探針。
40.基本上如本申請說明書所述的遺傳定性的方法。
專利摘要
可使用其中每一個都是對信息性基因位點特異的多核苷酸探針來定性基因組DNA的試驗樣品。可使用能根據一個以上多態性小隨體區或高可變位點鑒定DNA的探針制備這樣的探針。本發明的多核苷酸和探針可用于遺傳定性、父親或母親身份試驗,特別是可用于法醫學中。
文檔編號G01N33/50GK87102927SQ87102927
公開日1988年4月27日 申請日期1987年3月18日
發明者亞歷克·約翰·杰弗里斯 申請人:帝國化學工業公司導出引文BiBTeX, EndNote, RefMan