專利名稱::作為標記物用在乳腺癌風險評估、診斷、預后和治療中的在CHR5p12和10q26上的遺傳變異體的制作方法
技術領域:
:本發明涉及評估對乳腺癌的易感性的方法。本發明包括通過評價已經發現與乳腺癌的增加或降低的易感性相關的一些標記物或單體型(h即lotypes)來診斷對乳腺癌的增加的易感性的方法,以及診斷對乳腺癌的降低的易感性或診斷針對癌癥的保護的方法。本發明還涉及評估診斷患有乳腺癌的個體的預后的方法,評估對乳腺癌治療劑或乳腺癌治療的反應的可能性的方法,以及監控診斷患有乳腺癌的個體的治療進展的方法。在一個方面,本發明涉及一種診斷對人類個體中乳腺癌的易感性的方法,所述方法包括確定從所述個體獲得的核酸樣品中染色體5pl2或染色體10q26上至少一個多態標記物(polymorphicmarker)的至少一個等位基因的存在或缺乏,其中所述至少一個等位基因的存在指示對乳腺癌的易感性。本發明還涉及一種通過確定來自所述個體的核酸樣品中染色體5pl2上或染色體10q26上至少一個多態標記物的至少一個等位基因的存在或缺乏來確定對乳腺癌的易感性的方法,其中至少一個等位基因的存在的確定指示對乳腺癌的易感性。在另一個方面,本發明涉及一種確定人類個體中對乳腺癌的易感性的方法,包括確定在至少一個多態標記物中至少一個風險中的等位基因是否存在于來自所述個體的基因型數據組(genotypedataset)中,其中所述至少一個多態標記物選自染色體5pl2內的標記物,并且其中所述至少一個風險中的等位基因的存在的確定指示個體中對乳腺癌的增加的易感性。本發明進一步涉及一種用于確定人類個體中對乳腺癌的易感性的方法,包括確定至少一個多態標記物的至少一個等位基因是否存在于由所述個體獲得的核酸樣品中或者存在于來自所述個體的基因型數據組中,其中至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,并且其中至少一個等位基因的存在指示對于個體的乳腺癌的易感性。在一個實施方式中,所述基因型數據組包括關于標記物同一性(身份,identity)的信息,以及所述個體的等位基因狀態,即,對于所述標記物由所述個體攜帶的關于兩個等位基因同一性的信息。所述基因型數據組可以包括關于一個或多個標記物的等位基因信息,包括兩個以上標記物、三個以上標記物、五個以上標記物、一百個以上標記物等。在一些實施方式中,所述基因型數據組包括來自所述個體的整個_基因組評估的基因型信息,其可以包括幾十萬個標記物,或者甚至一百萬或更多標記物。在一些實施方式中,至少一個多態標記物與FGF10基因、HCN1基因、MRPS30基因、和/或FGFR2基因相關。在一些這樣的實施方式中,所述至少一個多態標記物與FGF10基因、HCN1基因、MRPS30基因、和/或FGFR2基因在連鎖不平衡中。在一些其他實施方式中,所述至少一個多態標記物選自NCBIBuild34中,位于跨越位置44,666,047和44,976,797的染色體區段內的標記物的組以及其在連鎖不平衡中的標記物。在另一實施方式中,所述至少一個多態標記物選自由在表1和表3中列出的多態標記物組成的組,以及其在連鎖不平衡中的標記物。在一些實施方式中,所述至少一個多態標記物選自表12、表13和表14中列出的標記物。在一個實施方式中,所述至少一個多態標記物選自如在SEQIDNO:1-237中列出的標記物。在一個實施方式中,在與標記物rs4415084連鎖不平衡中的標記物選自表12中列出的標記物。在另一實施方式中,在與標記物rsl0941679連鎖不平衡中的標記物選自表13中列出的標記物。在另一實施方式中,在與標記物rsl219648連鎖不平衡中的標記物選自表14中列出的標記物。在一些實施方式中,進行評估個體中至少一個單體型的頻率的進一步的步驟。在這樣的實施方式中,兩個或更多個標記物,包括三個、四個、五個、六個、七個、八個、九個或十個或更多個標記物可以被包括在所述單體型中。在一個實施方式中,所述單體型包括在染色體5pl2區中的標記物。在另一實施方式中,所述單體型包括染色體10q26區中的標記物。在一些實施方式中,所述單體型包括在與rs4415084連鎖不平衡中的標記物。在一些其他實施方式中,所述單體型包括在與rsl0941679連鎖不平衡中的標記物。在一些其他實施方式中,所述單體型包括在與rsl219648連鎖不平衡中的標記物。在賦予乳腺癌的風險的標記物中,如此處描述的,可以與對于乳腺癌的其他遺傳標記物組合。因此,在一些實施方式中,包括另外的步驟,包括確定不與表12、表13和表14中列出的標記物中的任何一個連鎖不平衡的對于乳腺癌的至少一個風險中的變異體的至少一個風險中的等位基因是否存在于包含來自人類個體的基因組DNA的樣品中或來自人類個體的基因型數據組中。換言之,在基因組中的其它位置中的遺傳標記物可以與本發明的標記物組合使用,以便基于多遺傳因子來確定乳腺癌的總風險。不在連鎖不平衡中(不在LD中)的標記物的選擇可以基于對于連鎖不平衡的合適的測量,如這里進一步描述的。在一些實施方式中,不在連鎖不平衡中的標記物對于LD測量r2具有在小于0.2的標記物之間的值。在一些其他實施方式中,不在LD中的標記物對于r2具有在小于0.15的標記物之間的值,包括小于0.10、小于0.05、小于0.02和小于0.01。用于確立標記物不在LD中的其他合適的分界值(cutoffvalue)(包括橋接任何這些值的值)被預期。10在一些實施方式中,確定如這里描述的多重標記物(多個標記物,multiplemarkers)以確定乳腺癌的總風險。因此,在一些實施方式中,包括另外的步驟,所述步驟包括確定至少兩個多態標記物中的每一個中的至少一個等位基因是否存在于包括來自人類個體的基因組DNA的樣品中或來自人類個體的基因型數據組中,其中所述至少兩個多態標記物中的至少一個等位基因的存在指示對于乳腺癌的增加的易感性。在一個實施方式中,所述標記物選自rs4415084(SEQIDNO:235)、rsl0941679(SEQIDNO:236)和rsl219648(SEQIDNO:237),及其連鎖不平衡中的標記物。基于本發明的標記物的風險評估也可以與用于從個體中獲得的核酸樣品中或來自所述個體的基因型數據組中對于乳腺癌的至少一個高外顯遺傳因子(遺傳因素)的存在或缺乏的評估結合。所述對于乳腺癌的高外顯遺傳因子可以例如為BRCA1突變、BRCA2突變、TP53突變或PTEN突變。總之,BRCA1和BRCA2中的突變可以解釋家族乳腺癌的15-20%的風險,并且這些可以解釋2-3%之間的偶發的乳腺癌患者[Gorski,etal.,(2005),BreastCancerResTreat,92,19-24;(2000),BrJCancer,83,1301-8]。TP53和PTEN基因中的已知突變解釋約5%的乳腺癌的總遺傳風險[Easton,(1999),BreastCancerRes,1,14-7]。在一個實施方式中,高外顯遺傳因子是BRCA2999de15。本發明的遺傳標記物也可以與非遺傳信息結合以確立個體的總風險。因此,在一些實施方式中,包括進一步的步驟,包括分析非遺傳信息以進行個體的風險評估、診斷、或預后。所述非遺傳信息可以為關于個體的疾病狀態的任何信息或可以影響個體的乳腺癌的總風險的估計的其他信息。在一個實施方式中,所述非遺傳信息選自年齡、性別、種族劃分、社會經濟情況、先前的疾病診斷、受治療者(受試者)的醫療史、乳腺癌的家族史、生物化學測量、以及臨床測量。在另一個方面,本發明涉及一種在先前診斷有乳腺癌的個體中評估至少發展第二原發腫瘤(第二原發性腫瘤,primarytumor)的風險的方法,所述方法包括確定在由所述個體獲得的核酸樣品中至少一個多態標記物的至少一個等位基因的存在或缺乏,其中所述至少一個多態標記物選自由表12、表13和表14中列出的多態標記物組成的組,以及在與其連鎖不平衡中的標記物,其中所述至少一個等位基因的存在指示至少發展第二原發腫瘤的風險。可替換地,本發明涉及一種確定在先前診斷有乳腺癌的個體中至少發展第二原發腫瘤的風險的方法,所述方法包括確定至少一個多態標記物的至少一個等位基因是否存在于由所述個體獲得的核酸樣品中,或者存在于來自所述個體的基因型數據組中,其中至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的標記物,并且其中至少一個等位基因的存在指示至少發展第二原發腫瘤的風險。在一個這樣的實施方式中,所述至少一個多態標記物選自表12、表13和表14中列出的標記物。本發明還涉及一種用于確定人類個體中乳腺癌的遺傳指征(geneticindicator)的裝置,包括計算機可讀存儲器;以及存儲在計算機可讀存儲器上的程序;其中所述程序適于在處理器上執行以對于至少一個人類個體分析關于至少一個選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)的多態標記物,以及在與其連鎖不平衡中的標記物的標記物和/或單體型信息,并基于所述標記物或單體型信息產生輸出,其中所述輸出包括作為人類個體的乳腺癌的遺傳指征的至少一個標記物或單11體型的個體風險測量。在一個實施方式中,所述至少一個多態標記物選自在表12、表13和表14中列出的標記物。在一個實施方式中,所述程序進一步包括與至少一個標記物等位基因和/或單體型相關的乳腺癌的風險測量,其中所述風險測量基于診斷有乳腺癌的多個個體中至少一個多態標記物和/或單體型的至少一個等位基因的頻率與多個參考個體中至少一個多態標記物和/或單體型的至少一個等位基因的頻率的指征(指示符,indicator)的比較,并且其中人類個體的所述個體風險是基于個體對于至少一個標記物等位基因和/或單體型的攜帶者狀態與對于至少一個標記物等位基因和/或單體型的風險測量的比較。例如,與對照相比,所述風險測量在一些實施方式中可以是在患有乳腺癌的個體群中,對于乳腺癌由風險中的變異體的每個拷貝提供的風險的測量。基于這樣的參考數據,通過確定在特定標記物處他的/她的基因型狀態并基于其計算個體的風險可以估計對于特定個體的風險。如果所述個體在他的/她的基因組中攜帶所述遺傳風險變異體的一個拷貝,則計算的風險可以基于由所述風險變異體的單一拷貝提供的風險。如果所述個體攜帶所述遺傳風險變異體的兩個拷貝,即,所述個體對于風險中的變異體是純合的,則與對照相比,對于所述個體的風險評估可以基于基于個體群的風險。通常,對于純合子攜帶者的風險將是平方的變異體的單一拷貝的風險。用于基于在特定標記物處基因型狀態來報告或估計個體的風險的其他方法也是可能的,并且在本發明的范圍內。在另一個方面,本發明涉及一種鑒定用于評估對乳腺癌的易感性的標記物的方法,所述方法包括鑒定在與rsl0941679(SEQIDN0:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDN0:237)中的至少一個連鎖不平衡中的至少一個多態標記物;確定診斷有乳腺癌或具有對乳腺癌的易感性的個體的樣品的基因型狀態;以及確定對照個體的樣品的基因型狀態;其中與對照樣品中至少一個等位基因的頻率相比,診斷有乳腺癌或具有對乳腺癌的易感性的個體中至少一個多態性中的至少一個等位基因的頻率中的顯著性差異指示用于評估對乳腺癌的易感性的至少一個多態性。顯著性差異可以在乳腺癌患者和對照中的一些多態標記物處等位基因計數的統計分析上被評估。在一個實施方式中,顯著性差異是基于乳腺癌患者與對照之間小于0.05的計算的P-值。在一個實施方式中,與對照樣品中至少一個等位基因的頻率相比,診斷有乳腺癌或具有對乳腺癌的易感性的個體中的至少一個多態性中至少一個等位基因的頻率的增加是用于評估對乳腺癌的增加的易感性的至少一個多態性的指征。在另一個實施方式中,與對照樣品中至少一個等位基因的頻率相比,診斷有乳腺癌或具有對乳腺癌的易感性的個體中的至少一個多態性中至少一個等位基因的頻率的減少是用于評估對乳腺癌的減少的易感性或針對乳腺癌的保護的至少一個多態性的指征。本發明還涉及一種對由人類個體獲得的核酸樣品進行基因型測定(基因型鑒定,genotyping)的方法,包括確定至少一個多態標記物的至少一個等位基因是否存在于來自個體樣品的核酸樣品中,其中所述至少一個標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的標記物,并且其中所述樣品中至少一個等位基因的存在的確定指示個體中對乳腺癌的易感性。在一個實施方式中,rs4415084(SEQIDNO:235)中的等位基因T、rsl0941679(SEQIDNO:236)中的等位基因G和/或rsl219648(SEQIDNO:237)中的等位基因G的存在的確定指示個體中乳腺癌的增加的易感性。在一個實施方式中,基因型測定包括通過聚合酶鏈反應(PCR),利用在至少一個多態標記物側翼的核苷酸引物對來擴增包括至少一個多態標記物的核酸的區段。在另一個實施方式中,基因型測定利用選自等位基因-特異性探針雜交、等位基因_特異性引物延伸、等位基因_特異性擴增、核酸測序、5'_外切核酸酶消化、分子標志分析(molecularbeaconassay)、寡核苷酸連接分析法(oligo皿cleotideligationassay)、粒度分析(sizeanalysis)、單鏈構象分析和微陣列技術的方法來進行。在一個實施方式中,所述微陣列技術是分子倒位探針陣列技術(MolecularInversionProbearraytechnology)或珠陣列(BeadArray)技術。在一個實施方式中,所述方法包括等位基因_特異性探針雜交。在另一個實施方式中,所述方法包括微陣列技術。一個優選的實施方式包括以下步驟(l)在用于寡核苷酸探針與核酸特異性雜交的條件下,使所述核酸的拷貝與檢測寡核苷酸探針和增強子寡核苷酸探針接觸;其中(a)所述檢測寡核苷酸探針的長度為5-100個核苷酸,并特異性雜交于其核苷酸序列由SEQIDNO:1-237中的任何一個給出的核酸的第一區段;(b)所述檢測寡核苷酸探針包括在其3'末端處的可檢測標記(detectablelabel)和在其5'末端處的猝滅部分;(c)所述增強子寡核苷酸的長度為5-100個核苷酸,并互補于相對于所述寡核苷酸探針位于5'的核苷酸序列的第二區段,使得當兩個寡核苷酸雜交至所述核酸時,所述增強子寡核苷酸相對于所述檢測寡核苷酸探針被定位于3';以及(d)單一堿基間隙存在于所述第一區段與所述第二區段之間,使得當所述寡核苷酸探針和所述增強子寡核苷酸探針均雜交至所述核酸時,單一堿基間隙存在于所述寡核苷酸之間;(2)用核酸內切酶處理所述核酸,所述核酸內切酶當所述檢測探針被雜交至所述核酸時將從所述檢測探針的3'末端剪切所述可檢測標記以釋放游離的(自由的)可檢測標記;以及(3)測量游離的可檢測標記,其中所述游離的可檢測標記的存在指示所述檢測探針特異性雜交至所述核酸的第一區段,并且指示作為所述檢測探針的互補物的多態位點的序列。本發明的進一步的方面涉及一種評估個體對于乳腺癌治療劑的反應的可能性的方法,包括確定至少一個多態標記物的至少一個等位基因是否存在于由所述個體獲得的核酸樣品中,或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,其中所述至少一個標記物的至少一個等位基因的存在指示對所述治療劑的陽性反應可能性。本發明在另一方面涉及一種預測診斷有乳腺癌的個體的預后的方法,所述方法包括確定至少一個多態標記物的至少一個等位基因是否存在于由所述個體獲得的核酸樣品中,或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,其中所述至少一個等位基因的存在指示所述個體中乳腺癌的較壞預后。本發明的又一方面涉及一種監測經歷乳腺癌治療(處理)的個體的治療進展(處理進展)的方法,所述方法包括確定至少一個多態標記物的至少一個等位基因是否存在于由所述個體獲得的核酸樣品中,或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的標記物,其中所述至少一個等位基因的存在指示所述個體的治療結果。在一個實施方式中,所述治療是通過手術進行的治療、通過放射療法進行的治療、或通過藥物給予進行的治療。本發明還涉及寡核苷酸探針在制備用于診斷和/或評估人類個體中對乳腺癌的易感性的試劑中的應用,其中所述探針雜交于具有如在SEQIDNO:1-237中的任何一個中列出的核苷酸序列的核酸的區段,其中所述探針的長度是15-500個核苷酸。在一些實施方式中,所述探針的長度是約16至約IOO個核苷酸。在一些其他實施方式中,所述探針的長度是約20至約50個核苷酸。在一些其他實施方式中,所述探針的長度是約20至約30個核苷酸。本發明還涉及計算機可讀介質。在一個方面,本發明涉及一種其上存儲了以下的介質用于至少一個多態標記物的標識符(identifier);在多個診斷有乳腺癌的個體中所述至少一個多態標記物的至少一個等位基因的頻率的指征(指示符,indictor);以及在多個參考個體中所述至少一個多態標記物的至少一個等位基因的頻率的指征;其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的多態標記物。在一個實施方式中,所述多態標記物選自在表12、表13和表14中列出的標記物。在另一個實施方式中,所述介質進一步包括關于多個個體的家系的信息。乳腺癌的表型的各種診斷和類別在本發明的范圍內。在其最廣泛的意義上,本發明涉及任何乳腺癌表型。在一些實施方式中,乳腺癌包括乳腺癌的任何臨床診斷,包括但不限于侵襲性導管(invasiveductal),侵襲性小葉(invasivelobular),管狀、或作為其他方式侵襲的或混合侵襲的,髓,DCIS(原位導管癌),LCIS(原位小葉癌),或另外的非侵襲的,侵襲性乳腺癌,包括階段0、階段1、階段2(包括階段2a和階段2b)、階段3(包括階段3a、階段3b和階段3c)和階段4乳腺癌。在一些實施方式中,所述乳腺癌表型選自全乳腺癌、多原發乳腺癌、和早期發作乳腺癌。在一些實施方式中,本發明的標記物與具有乳腺癌的家族史的個體中乳腺癌的風險相關。在一個這樣的實施方式中,總計的家族史(summedfamilyhistory)(FHS)是與乳腺癌相關的表型。在另一個實施方式中,與本發明的變異體相關的乳腺癌是雌激素受體(ER)陽性和/或孕酮受體(PR)陽性乳腺癌。在一個實施方式中,所述與本發明的變異體相關的乳腺癌是雌激素受體(ER)陽性的。在另一個實施方式中,與本發明的變異體相關的乳腺癌是孕酮受體(ER)陽性的。在一個這樣的實施方式中,這里描述的與對乳腺癌的增加的風險或易感性相關的標記物提供ER-陽性的和/或PR-陽性的乳腺癌的增加的風險或易感性。因此,在一些實施方式中,本發明的風險中的變異體的至少一個的存在是個體中ER陽性或PR陽性乳腺癌的預兆。在本發明的方法的一些實施方式中,在所述方法中確定的易感性是增加的易感性。在一個這樣的實施方式中,增加的易感性的特征在于至少1.10的相對風險(RR)。在另一個實施方式中,增加的易感性的特征在于至少1.20的相對風險。在另一個實施方式中,增加的易感性的特征在于至少1.30的相對風險。在另一個實施方式中,增加的易感性的特征在于至少1.40的相對風險。在又一個實施方式中,增加的易感性的特征在于至少1.50的相對風險。在另外的實施方式中,增加的易感性的特征在于至少1.70的相對風險。在又一個實施方式中,增加的易感性的特征在于至少2.0的相對風險。其他實施方式的特征在于至少1.10、1.11、1.12、1.13、1.14、1.15、1.16、1.17、1.18、1.19、1.20、1.21、1.22、1.23、1.24、1.25、1.26、1.27、1.28、1.29、1.30、1.31、1.32、1.33、1.34、1.35的相對風險。橋接任14何這些上述值的風險的其他數值也是可能的,并且這些也在本發明的范圍內。在本發明的方法的一些實施方式中,在所述方法中確定的易感性是減少的易感性。在一個這樣的實施方式中,減少的易感性的特征在于小于0.9的相對風險(RR)。在另一個實施方式中,減少的易感性的特征在于小于0.8的相對風險(RR)。在另一個實施方式中,減少的易感性的特征在于小于O.7的相對風險(RR)。在又一個實施方式中,減少的易感性的特征在于小于0.5的相對風險(RR)。其他分界(截止,cutoffs),如小于0.89、0.88、0.87、0.86、0.85、0.84、0.83、0.82、0.81、0.80、0.79、0.78、0.77、0.76、0.75、0.74、0.73、0.72、0.71、0.70等的相對風險在本發明的范圍內。本發明還涉及試劑盒。在一個這樣的方面中,本發明涉及一種用于評估人類個體中對乳腺癌的易感性的試劑盒,所述試劑盒包括選擇性檢測所述個體的基因組中染色體5p12或10q26上至少一個多態標記物的至少一個等位基因所必需的試劑,其中所述至少一個等位基因的存在指示對乳腺癌增加的易感性。在另一個方面,本發明涉及一種用于評估人類個體中對乳腺癌的易感性的試劑盒,所述試劑盒包括用于選擇性檢測所述個體的基因組中至少一個多態標記物的至少一個等位基因的試劑,其中所述多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的多態標記物,并且其中所述至少一個等位基因的存在指示對乳腺癌的易感性。在一個實施方式中,所述至少一個多態標記物選自表12、表13和表14中列出的標記物。試劑盒試劑在一個實施方式中可以包括至少一種連續寡核苷酸(contiguousoligonucleotide),所述寡核苷酸雜交于包括所述至少一個多態標記物的個體的基因組的片段。在另一個實施方式中,所述試劑盒包括至少一對寡核苷酸,所述寡核苷酸雜交于從所述受治療者獲得的基因組區段的相反鏈,其中每個寡核苷酸引物對被設計成選擇性擴增包括一個多態性的個體的基因組的片段,其中所述多態性選自由如表12、表13和表14中限定的多態性組成的組,并且其中所述片段的大小為至少20個堿基對。在一個實施方式中,所述寡核苷酸與所述個體的基因組完全互補。在另一個實施方式中,所述試劑盒進一步包含緩沖劑和用于擴增所述區段的酶。在另一個實施方式中,所述試劑進一步包括用于檢測所述片段的標簽。在一個優選的實施方式中,所述試劑盒包括長度為5-100個核苷酸的檢測寡核苷酸探針;長度為5-100個核苷酸的增強子寡核苷酸探針;以及核酸內切酶;其中所述檢測寡核苷酸探針特異性地雜交于其核苷酸序列在SEQIDN0:l-237的任何一個中列出的核酸的第一區段,并且其中所述檢測寡核苷酸探針包括在其3'末端的可檢測標記和在其5'末端的猝滅部分(quenchingmoiety);其中所述增強子寡核苷酸的長度是5_100個核苷酸并與相對于所述寡核苷酸探針在5'的核苷酸序列的第二區段互補,使得當兩個寡核苷酸均雜交至所述核酸時,所述增強子寡核苷酸相對于檢測寡核苷酸探針位于3';其中單一堿基間隙存在于所述第一區段與第二區段之間,使得當所述寡核苷酸探針和增強子寡核苷酸探針均雜交至所述核酸時,單一堿基間隙存在于所述寡核苷酸之間;并且其中當所述檢測探針雜交至所述核酸時,用核酸內切酶處理所述核酸將從所述檢測探針的3'末端剪切所述可檢測標記以釋放自由的可檢測標記。根據本發明的試劑盒還可以用在本發明的其他方法中,包括評估先前診斷有乳腺15癌的個體中至少發展第二原發腫瘤的風險的方法,評估個體對于乳腺癌治療劑的反應的可能性的方法,以及監測診斷有乳腺癌并被提供對于所述疾病的治療的個體的治療進展的方法。這里描述的與乳腺癌相關的標記物均可以用在本發明的各個方面中,包括這里描述的方法、試劑盒、應用、裝置、程序(procedures)。在一些實施方式中,本發明涉及染色體5pl2內的標記物的應用。在一些其他實施方式中,本發明涉及染色體10q26內的標記物。在一些實施方式中,本發明涉及表1或表3中列出的標記物,以及在與其連鎖不平衡中的標記物。在一些其他實施方式中,本發明涉及在表3中列出的標記物。在一些其他實施方式中,本發明涉及標記物rsl0941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648,以及在與其連鎖不平衡中的標記物。在一些優選的實施方式中,本發明涉及標記物rs4415084、rsl0941679和rsl219648,以及在與其連鎖不平衡中的標記物。在一些其他優選的實施方式中,本發明涉及如這里在表12、表13和表14中列出的標記物。在其他優選的實施方式中,本發明涉及rs4415084及在與其連鎖不平衡中的標記物(例如,如在表12中列出的標記物)。在其他優選的實施方式中,本發明涉及rsl0941679及在與其連鎖不平衡中的標記物(例如,如在表13中列出的標記物)。在其他優選的實施方式中,本發明涉及rsl219648及在與其連鎖不平衡中的標記物(例如,如在表14中列出的標記物)。在一個實施方式中,本發明涉及標記物rs4415084。在另一個實施方式中,本發明涉及rs10941679。在另一個實施方式中,本發明涉及rsl219648。在一些實施方式中,提供乳腺癌的增加的風險的至少一個標記物等位基因選自rsl0941679等位基因G、rs7703618等位基因T、rs4415084等位基因G、rs2067980等位基因G、rsl0035564等位基因G、rsl1743392等位基因T、rs7716600等位基因A、和rsl219648等位基因G。在這些實施方式中,所述等位基因(風險中的等位基因)的存在指示乳腺癌的增加的風險。在本發明的一些實施方式中,連鎖不平衡是利用連鎖不平衡測量r2和|D'|確定的,其給出了兩個遺傳元件(例如,多態標記物)之間的連鎖不平衡(LD)的程度的定量測量。對于特定標記物的這些測量的一些數值指示處于連鎖不平衡中的標記物,如這里進一步描述的。在本發明的一個實施方式中,標記物之間的連鎖不平衡(即,指示處于連鎖不平衡中的標記物的LD值)被限定為r2>0.1。在另一個實施方式中,連鎖不平衡被限定為r2>0.2。其他實施方式可以包括連鎖不平衡的其他限定,如r2>0.25、r2>0.3、r2>0.35、r2>0.4、r2>0.45、r2>0.5、r2>0.55、r2>0.6、r2>0.65、r2>0.7、r2>0.75、r2>0.8、r2>0.85、r2>0.9、r2>0.95、r2>0.96、r2>0.97、r2>0.98、或r2>0.99。在一些實施方式中,連鎖不平衡也可以被限定為|D'I>0.2,或限定為|D'|>0.3、|D'>0.4、|D'|>0.5、|D'|>0.6、|D'|>0.7、|D'|>0.8、|D'|>0.9、|D'|>0.95、|D'IX).98或lD'|>0.99。在一些實施方式中,連鎖不平衡被限定為滿足r2和D'I的兩個標準,如r2〉0.2和|D'|>0.8。1~2和|0'|的值的其他組合也是可能的并且在本發明的范圍內,包括但不限于上面列出的這些參數的值。根據下面的本發明的優選實施方式的更特別的描述,本發明的前述和其他目的、16特征以及優點將顯而易見。圖1示出了來自冰島1組(同齡組,Cohort)的5pl2上關聯數據的圖。上圖示出了來自1660個乳腺癌患者和11,563個對照的冰島1組的源自IlluminaH即300數據的關聯信號的P值,其根據它們的物理位置(NCBIBuild34)繪出。來自限定區域中6個同等類的關鍵SNP的信號被標記A-F。在下圖中示出了重組熱點(recombinationhotspots)的位置、染色體帶、已知基因的外顯子和重組率。在底部繪制了來自H即M即PhaseII數據(釋放19)的成對一值。點的強度與成對一值的大小成比例。重組熱點和重組率利用McVeanetal.2004(參見文本)描述的方法獲得。具體實施例方式本發明披露了被發現與乳腺癌相關的多態變異體和單體型。染色體5pl2上多態標記物處特定的等位基因已經被發現與乳腺癌相關。這樣的標記物和單體型用于診斷目的,用于預測藥物反應的方法,以及用于預測治療進展(treatmentprogress)的方法,如這里進一步詳細描述的。本發明的另外的應用包括利用本發明的多態標記物來評估通過手術或放射進行的乳腺癌治療的反應的方法,以及用在本發明的方法中的試劑盒。定義除非另有指明,否則核酸序列在5'到3'方向從左到右書寫。說明書內陳述的數字范圍包括限定所述范圍的數字并包括限定范圍內的每個整數或任何非整數部分。除非另外定義,否則這里使用的所有技術和科學術語具有與本發明所屬領域的普通技術人員通常理解的相同的含義。下面的術語,在本發明的上下文中,將具有如指出的含義如這里描述的,"多態標記物",有時稱為"標記物"指的是基因組多態位點。每個多態標記物具有至少兩個在多態位點處的特定等位基因的序列變異特征。因此,與多態標記物的遺傳關聯(geneticassociation)指的是存在與那個特定多態標記物的至少一個特定等位基因的關聯。所述標記物可以包括在基因組中發現的任何變異體類型的任何等位基因,包括單核苷酸多態性(SNP)、小或微隨體、易位和拷貝數量變異(插入、缺失、重復)。多態標記物可以為群體中任何可測量的頻率。對于疾病基因的繪圖(作圖),具有大于5_10%的群體頻率的多態標記物通常最有用。然而,多態標記物也可以具有較低的群體頻率,如1-5%頻率,或甚至更低的頻率,尤其是拷貝數量變異(CNV)。所述術語在本發明的上下文中將包括具有任何群體頻率的多態標記物。"等位基因"指的是染色體上給定基因座(位置)的核苷酸序列。多態標記物等位基因由此指的是染色體上所述標記物的組成(即,序列)。來自個體的基因組DNA對于任何給定的多態標記物包含兩個等位基因,代表每個染色體上標記物的一個拷貝。這里所用的核苷酸的序列編碼為A=1、C=2、G=3、T=4。對于微隨體等位基因,CEra樣品(Centred'EtudesduPolymorphismeHumain,genomicsrepository,CEPH樣品1347-02)被用作參考,這個樣品中每個微隨體的較短等位基因被設定為O,而其他樣品中的所有其他等位基因相對于這個參考被計數。因此,例如,等位基因i比CEra樣品中的較短等位基因長ibp,等位基因2比CEra樣品中的較短等位基因長2bp,等位基因3比CEra樣品中的較低等位基因長3bp,等等,并且等位基因-1比CEra樣品中的較短等位基因短lbp,等位基因-2比CEra樣品中的較短等位基因短2bp,等等。"單核苷酸多態性"或"SNP"是當在基因組中特定位置處的單核苷酸在物種(species)的數量之間或在個體中成對的染色體之間不同時所存在的DNA序列變異。大多數SNP多態性具有兩個等位基因。在這個情況下,每個個體對于多態性的一個等位基因是純合的(即,個體的兩個染色體拷貝在SNP位置處具有相同的核苷酸),或者所述個體是雜合的(即,個體的兩個姐妹染色體包含不同的核苷酸)。如這里報道的SNP命名是指由NationalCenterforBiotechnologicalInformation(NCBI)為每個獨特的SNP分配的正式參考SNP(rs)ID識別標簽。如這里描述的序列核苷酸多義性是如由IUPAC-IUB提議的。這些編碼與由EMBL、GenBank、和PIR數據庫所用的編碼一致。<table>tableseeoriginaldocumentpage18</column></row><table>其中多于一個序列在群體(自然群體或合成群體,例如,合成分子的庫)中是可能的核苷酸位置在這里被稱為"多態位點"。如這里所描述的,"變異體"指的是不同于參考DNA的DNA的區段。如這里所定義的,"標記物"或"多態標記物"是變異體。不同于參考物的等位基因被稱為"變異體"等位基因。"微隨體"是在特定位點具有長度是2-8個核苷酸的堿基的多個小重復的多態標記物(如CA重復),其中重復長度的數目在一般群體中變化。"indel"是包括典型地僅幾個核苷酸長的小的插入或缺失的多態性的常見形式。如這里所描述的,"單體型"指的是一條DNA內基因組DNA的區段,其特征在于沿著所述區段排列的等位基因的特定組合。對于二倍體有機體如人類,單體型包括對于每個多態標記物或基因座的等位基因對的一個數量。在一些實施方式中,單體型可以包括兩個或更多個等位基因,三個或更多個等位基因,四個或更多個等位基因,或五個或更多個等位基因。如這里所描述的,術語"易感性"包括增加的易感性和降低的易感性。因此,本發明的特定多態標記物和/或單體型的特征可以為乳腺癌的增加的易感性(即,增加的風險),如由大于1的相對風險(RR)所表征的,或如由大于1的優勢比(讓步比,oddsratio)(OR)所表征的。可替換地,本發明的標記物和/或單體型的特征為乳腺癌的降低的易感性(即,降低的風險),如由小于1的相對風險所表征的,或由小于1的優勢比所表征的。單體型此處在標記物名稱的上下文中描述,并且所述單體型中的標記物的等位基因,如,"Trs4415084"指的是所述單體型中標記物rs4415084的T等位基因,并且這個命名相當于"rs4415084等位基因T"和"T-rs4415084"。此外,單體型中的等位基因編碼是關于個體標記物的,BP,1=A、2=C、3=G和4=T。如這里所描述的,術語"易感性"指的是個體朝向某一狀態(如,某一特性、表型或疾病,如乳腺癌)的發展或朝向比平均個體較不能夠抵抗特定狀態的傾向。所述術語包括增加的易感性和降低的易感性。因此,如這里描述的本發明的多態標記物和/或單體型處的特定等位基因的特征可以為乳腺癌的增加的易感性(即,增加的風險),如通過對于特定等位基因或單體型的大于1的相對風險(RR)或優勢比(OR)所表征的。可替換地,本發明的標記物和/或單體型的特征是乳腺癌的降低的易感性(即,降低的風險),如通過小于1的相對風險所表征的。術語"和/或"在本發明的上下文中將被理解為表示通過它連接的術語的一個或兩個被涉及。換言之,所述術語這里將意味著"一個或另一個或兩個"。如這里所描述的,術語"查詢表(查找表)"是一種這樣的表,其使一種形式的數據與另一形式相關,或使一種或多種形式的數據與所述數據相關的預測的結果相關,諸如表型或特性。例如,查詢表可以包括對于至少一個多態標記物的等位基因數據與特定特性或表型之間的關聯,諸如特定疾病的診斷,包含特定等位基因數據的個體可能顯示所述特性或表型,或比不包含特定等位基因數據的個體更可能顯示所述特性或表型。查詢表可以為多維的,即,它們可以同時包含關于單一標記物的多個等位基因的信息,或它們可以包含關于多標記物的信息,并且它們還可以包含其他因素,如關于疾病診斷、種族信息、生物標記物、生物化學測量、治療方法或藥物等的細節。"計算機可讀介質"是可以利用商業上可獲得的或定制的界面通過計算機訪問的信息存儲介質。示例性的計算機可讀介質包括存儲器(如,RAM、ROM、閃存等)、光存儲介質19(如,CD-ROM)、磁存儲介質(如,計算機硬驅動器、軟盤等)、穿孔卡、或其他商業上可獲得的介質。信息可以在感興趣的系統與介質之間、在計算機之間、或在計算機與用于存儲或存儲的信息的獲取的計算機可讀介質之間傳輸。這樣的傳輸可以是電的,或通過其他可利用的方法,如IR鏈接、無線連接等。"核酸樣品"是一種從包含核酸(DNA或RNA)的個體獲得的樣品。在一些實施方式中,即,在特定多態標記物和/或單體型的檢測中,核酸樣品包含基因組DNA。這樣的核酸樣品可以從包含基因組DNA的任何來源獲得,包括如血液樣品、羊水樣品、腦脊液樣品、或來自皮膚、肌肉、口腔或芥末粘膜、胎盤、胃腸道或其他器官的組織樣品。術語"乳腺癌治療劑"指的是可以用于改善或防止與乳腺癌相關的癥狀的藥劑。如這里所描述的,術語"乳腺癌-相關的核酸"指的是已經被發現與乳腺癌相關的核酸。這包括但不限于,這里描述的標記物和單體型以及在與此強連鎖不平衡(LD)中的標記物和單體型。如這里所描述的,術語"乳腺癌"指的是乳腺癌的任何臨床診斷,包括乳腺癌的任何和全部特定亞表型。例如,乳腺癌有時被分類為雌激素受體(ER)陽性乳腺癌或雌激素受體陰性乳腺癌;乳腺癌有時也被分類為孕酮受體(PR)陽性或陰性的。此外乳腺癌有時被診斷為侵襲性導管、侵襲性小葉、管狀、或其他侵襲性的或混合侵襲性的。乳腺癌還可以被分類為髓DCIS(原位導管癌)或LCIS(原位小葉癌),或另外的非侵襲性的。侵襲性乳腺癌還可以被定義為階段0、階段1、階段2(包括階段2a和階段2b)、階段3(包括階段3a、階段3b和階段3c)或階段4乳腺癌。在本發明的上下文中,"乳腺癌"可以包括乳腺癌的這些亞表型中的任何一個,并且還包括乳腺癌的任何其他臨床可應用的亞表型。術語"所有的乳腺癌"或"所有的BC"指的是診斷有乳腺癌的所有個體。術語"介質誘因"乳腺癌或"MedPre"乳腺癌指的是乳腺癌的亞表型。這個表型的定義要求先證者(proband)滿足以下標準中的至少一個該先證者是在3個減數分裂事件(3M)的遺傳距離內包含3個或更多個受影響的親屬的乳腺癌病例群的成員。該先證者是在3M內相關的受影響的對的成員,其中一個在50歲或更年輕時被診斷。該先證者是在3M內相關的受影響的對的成員,其中一個被診斷患有任何類型的第二原發腫瘤。該先證者已經被診斷有任何類型的第二原發腫瘤。如這里所描述的,術語"多原發乳腺腫瘤"或"MPBC"指的是其中除了第一乳腺癌診斷之外,至少一個原發腫瘤也被診斷的病例,并且兩個腫瘤均臨床確認或通過組織學確認,獨立于原發腫瘤,同時發生或在第一乳腺癌后發生,并且存在于對側或同側乳房中。如這里所描述的,術語"家族史得分"或"FHS"基于對于具有疾病的先證者受乳腺癌影響的親屬的數量來定義。對于每個先證者,對于每個受影響的一級親屬(first-degreerelative)給予1的得分,對于每個受影響的二級親屬,給予0.5的得分,并且對于每個三級親屬給予O.25的得分。由此在所有受影響的親屬上獲得的總數代表總合的家族史(summedfamilyhistory)得分或FHS。如這里所描述的,術語"雌激素受體陽性乳腺癌"或"ER-陽性乳腺癌"指的是被確定對于雌激素受體陽性的腫瘤。在本發明的上下文中,大于或等于10fmol/mg的ER水平和/或大于或等于10X陽性細胞核的免疫組織化學觀測結果被認為是ER陽性的。不滿足ER陽性的標準的乳腺癌這里被定義為"ER-陰性"或"雌激素受體陰性"。如這里所描述的,術語"孕酮受體陽性乳腺癌"或"PR-陽性乳腺癌"指的是被確定對于孕酮受體陽性的腫瘤。在本發明的上下文中,大于或等于10fmol/mg的PR水平和/或大于或等于10X陽性細胞核的免疫組織化學觀測結果被認為是PR陽性的。不滿足PR陽性的標準的乳腺癌這里被定義為"PR-陰性"或"孕酮受體陰性"。如這里所描述的,術語"染色體5pl2"指的是染色體5上NCBI(NationalCenterforBiotechnologyInformation)Build34的位置44,094,392與46,393,984之間的區域。如這里所描述的,術語"FGF10"或"FGF10基因"指的是人類染色體5p上的成纖維細胞生長因子10基因。如這里所描述的,術語"MRPS30"或"MRPS30基因"指的是人類染色體5p上的線粒體核糖體蛋白S30基因。該基因還被稱為程序化細胞死亡蛋白9(PDCD9),并編碼線粒體S28亞單位。如這里所描述的,術語"FGFR2"或"FGFR2基因"指的是人類染色體10q26上的成纖維細胞生長因子受體2基因。該基因還被稱為蛋白酪氨酸激酶受體類似物(like)14(TK14)、角質形成細胞生長因子受體(KGFR)、和成纖維細胞生長因子受體BEK。通過根據本發明診斷有乳腺癌的個體群的關聯分析,已經發現染色體5pl2上的一些多態標記物處的一些等位基因與乳腺癌相關。對于與癌癥相關的變異體的基因組_廣泛的分析顯示乳腺癌與染色體5的區域的關聯,所述區域在位置44,094,392與46,393,984(NCBIBuild34坐標)之間,在這里稱為染色體5pl2區。在該區域中特定標記物被發現與乳腺癌的增加的風險相關。通過利用Ill咖inaH咖anHap300微陣列技術對大約1,600個冰島乳腺癌患者和11,563個對照者進行基因型測定,發現染色體5p上的大量標記物顯示與乳腺癌相關(表1)。尤其是,標記物rs4415084的T等位基因和標記物rs7703618的G等位基因被發現與乳腺癌增加的風險相關。標記物rs7703618的關聯在第二冰島同齡組中被重復,表明關聯信號確實是重要的。冰島發現同齡組與公眾CGEMS數據組的比較顯示與rs4415084的關聯也在該同齡組中重復。實際上,與該標記物的關聯信號(在冰島發現同齡組中p值9.02E-06)在基因組_廣泛水平上是重要的(在Bonferroni校正后),其中當兩個數據組合并時名義p值為1.38E-07。該SNP在單獨CGEMS數據組中具有2.21E-03的不顯著的P值,但是在冰島群中重復所述初始發現。標記物rsl0941679,其與標記物rs4415084(D'=0.99,r2=0.51)相關,具有甚至更強的與乳腺癌的相關性(0R=1.19,p值為2.2E-06)。后續分析已經表明在來自瑞典、荷蘭、西班牙和美國的同齡組中,所述信號歸因于rs4415084和rsl0941679(參見表6)。本發明還示出在Chr5p12區中等位基因異質性的證據,并且六個同等類別(由關鍵標記物rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392和rs7716600表示)已經被鑒定。進一步的分析已經確定觀察到的關聯信號主要由標記物rs4415084和rsl0941679說明。在通過本發明鑒定的區中存在三個著名的已知基因,其具有與乳腺癌相關的標記物和單體型。這些基因是FGFIO、MRPS30、和HCN1,連同不良表征的基因L0C441070。這些基因中的兩個,FGF10和MRPS30,是涉及乳腺癌誘因的強迫候選者。因此,FGFIO是乳房的正常胚胎發育所必需的[HowardandAshworth,(2006),PLoSGenet,2,e112],并且FGF10已經作為癌基因在通過匪TV插入性誘變的小鼠乳腺癌模型中被涉及,并且FGF10在約10%的人類乳腺癌中被過度表達[Theodorou,etal.,(2004),Oncogene,23,6047-55]。FGF10基因通過重組熱點從關聯信號的主要集簇(mainclusters)被分離。然而,控制FGF10的調節的關鍵元件可以存在于其中強關聯信號發生的區中。可替換地,該關聯信號可以在FGF10基因本身內伴隨致病突變的連鎖不平衡中。MRPS30基因,還稱為程序化細胞死亡蛋白9(PDCD9),編碼線粒體28S核糖體亞單位。該基因是Gallusgallus前凋亡蛋白p52的哺乳動物對應部分(配對物)。還顯示它在哺乳動物細胞中誘導凋亡并活化應激反應的JNKl途徑。該蛋白似乎通過Bcl-2途徑至少部分地在凋亡中起作用[Sun,etal.,(1998),Gene,208,157-66;Carim,etal.,(1999),CytogenetCellGenet,87,85_8;CavdarKoc,etal.,(2001),FEBSLett,492,166-70]。雖然它還沒有在乳腺癌中預先被涉及,但是其在上面的途徑中的涉及提示MRPS30中的所述遺傳變異體可以在改變乳腺癌風險中被涉及。還發現染色體10上的FGFR2基因座處的標記物rsl219648提供乳腺癌的風險(表6),其特別與ER陽性腫瘤相關(表10)。還發現與rsl219648的關聯在結節陽性腫瘤中比在結節陰性腫瘤中更重要,并且所述關聯對于具有乳腺癌家族史的個體更強大。用于標記物和單體型的評估當比較個體時群體內的基因組序列是不同的。相反,在基因組中的許多位置,基因組表現出個體之間的序列變異性。序列的這樣的變異通常被稱為多態性,并且在每個基因組內存在許多這樣的位點。例如,人類基因組表現出平均每500個堿基對發生的序列變異。最常見的序列變異體由在基因組內單一堿基位置處的堿基變異組成,并且這樣的序列變異體或多態性通常被稱為單一核苷酸多態性("SNP")。這些SNP被認為通過單一突變事件產生,因此通常可能在每個SNP位點存在兩個可能的等位基因;最初的等位基因和突變的(替換的)等位基因。由于自然遺傳漂變和可能的還有選擇壓力,最初的突變導致以任何給定群體中其等位基因的特定頻率為特征的多態性。許多其他類型的序列變異體在人類基因組中被發現,包括小隨體和微隨體,以及插入、缺失、倒位(也稱為拷貝數量變異(CNV))。多態微隨體在特定位點具有多個小的堿基重復(如CA重復,在互補鏈(complimentarystrand)上的TG),其中重復長度的數量在總群體中變化。大體上,序列的每個版本在多態位點方面代表多態位點的特定等位基因。所有的序列變異體可以被稱為多態性,存在于以所討論的序列變異體為特征的特定多態位點處。大體上,多態性可以包括任何數量的特定等位基因。因此在本發明的一個實施方式中,多態性的特征在于在任何給定群體中兩個或多個等位基因的存在。在另一個實施方式中,多態性的特征在于三個或更多個等位基因的存在。在另一個實施方式中,多態性的特征在于四個或更多個等位基因、五個或更多個等位基因、六個或更多個等位基因、七個或更多個等位基因、九個或更多個等位基因。或十個或更多個等位基因。所有這樣的多態性可以被用在本發明的方法和試劑盒中,因此在本發明的范圍內。由于它們的豐度,SNP說明人類基因組中大多數序列變異。迄今,超過6百萬SNP已經被石角認(//www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)。然而,CNV正在受到增加的關注。這些大規模的多態性(典型地lkb或更大)說明影響裝配的人類基因組的實質比例的多態變異;已知的CNV覆蓋超過15X的人類基因組序列(Estivill,XArmengol;L.,PIoSGenetics3:1787-99(2007).A//projects.tcag.ca/variation/)。然而大多數這些多態性是非常稀少的,并且平均僅影響每個個體的基因組序列的一部分。CNV已知通過破壞基因劑量來影響基因表達、表型變異和適應,還已知造成疾病(微缺失和微重復紊亂)并提供常見復合體疾病的風險,包括HIV-1感染和腎小球性腎炎(Redon,R.,etal.Nature23:444-454(2006))。因此可能的是,先前描述的或未知的CNV代表與乳腺癌相關的這里描述的標記物在連鎖不平衡中的造成原因的變異體。用于檢測CNV的方法包括比較基因組雜交(CGH)和基因型測定(基因型鑒定,genotyping),包括使用基因型測定陣列(genotypingarrays),如由Carter描述的(NatureGenetics39:S16-S21(2007))。基因組變異體的數據庫(httD:〃oroiects.tcag.ca/variation/)包含最新的關于所述的DNV的位置、類型和大小的信息。所述數據庫目前包含超過15,000個CNV的數據。在一些情況中,參考被制備成在多態位點處的不同等位基而無需選擇參考等位基因。可替換地,參考序列可以被稱為用于特定的多態位點。參考等位基因有時被稱為"野生型"等位基因并且它通常被選擇為第一測序的等位基因或來自"未影響的"個體的等位基因(例如,沒有表現出性狀或疾病表型的個體)。如這里提及的用于SNP標記物的等位基因涉及堿基A、C、G、或T,此時它們存在于所采用的SNP測定(分析)中的多態位點處。這里使用的SNP的等位基因編碼如下1=A、2=C、3=G、4=T。然而本領域技術人員將認識到通過分析或閱讀相對的DNA鏈,互補等位基因在每一種情況中可以被測量。因此,對于特征為A/G多態性的多態位點(多態標記物),采用的測定可以被設計成特異性地檢測可能的兩個堿基,即,A和G中的一個或兩個的存在。可替換地,通過設計被設計成檢測DNA模板上相反鏈的測定,可以測量互補堿基T和C的存在。定量地(例如,關于相對風險),相同的結果將從任何一個DNA鏈(+鏈或-鏈)的測量獲得。典型地,參考序列涉及用于特定的序列。與參考不同的等位基因有時被稱為"變異體"等位基因。如這里所用的,變異體序列是指與參考序列不同但是以其他方式基本上類似的序列。這里描述的在多態遺傳標記物處的等位基因是變異體。變異體可以包括影響多肽的改變。當與參考核苷酸序列比較時,序列差異可以包括單一核苷酸或多于一個核苷酸的插入或缺失,導致移碼;至少一個核苷酸的改變,導致編碼的氨基酸的改變;至少一個核苷酸的改變,導致未成熟的終止密碼子的產生;幾個核苷酸的缺失,導致由所述核苷酸編碼的一個或多個氨基酸的缺失;一個或幾個核苷酸的插入,如通過不相等的重組或基因轉換,導致閱讀框的編碼序列的中斷;序列的所有或部分的重復;轉座;或核苷酸序列的重排。這樣的序列改變可以改變由核酸編碼的多肽。例如,如果核酸序列中的改變造成移碼,則該移碼可以導致編碼的氨基酸的改變,和/或可以導致未成熟的終止密碼子的產生,造成截短的多肽的產生。可替換地,與疾病或性狀相關的多態性可以為一個或多個核苷酸中的同義改變(即,不導致氨基酸序列改變的改變)。例如,這樣的多態性可以改變剪接位點(splicesites),影響mRNA的穩定性或轉運,或以其他方式影響編碼的多肽的轉錄或翻譯。它還可以改變DNA以增加結構改變,如擴增或缺失,在軀體水平發生的可能性。由參考核苷酸序列編碼的多肽是具有特定參考氨基酸序列的"參考"多肽,并且由變異體等位基因編碼的多肽被稱為具有變異體氨基酸序列的"變異體"多肽。單體型指的是DNA的區段,其特征在于沿著所述區段排列的等位基因的特定組合。對于二倍體有機體,如人類,所述單體型可以包括對于每個多態標記物或基因座的等位基因對中的一種成員。在一些實施方式中,單體型可以包括兩個或多個等位基因、三個或多個等位基因、四個或多個等位基因、或者五個或多個等位基因,每個等位基因對應于沿著所述區段的特定多態標記物。單體型可以包括在多態位點具有特定等位基因的不同多態標記物的組合,例如SNP和微隨體。因此單體型包括在不同遺傳標記物處的等位基因的組合。檢測特異性多態標記物和/或單體型可以通過本領域中已知的用于檢測多態位點處的序列的方法來實現。例如,可以使用用于SNP和/或微隨體標記物的存在的基因型測定(genotyping)的標準技術,如基于熒光的技術(Chen,X.etal.,GenomeRes.9(5):492-98(1999)),利用PCR、LCR、巢式(nested)PCR和其他用于核酸擴增的技術。用于SNP基因型測定的可獲得的特定商業方法包括,但不限于,T叫Man基因型測定分析和SNPIex平臺(AppliedBiosystems)、凝膠電泳(AppliedBiosystems)、質譜分析(例如,來自Sequenom的MassARRAY系統)、微測序方法、實時PCR、Bio-Plex系統(BioRad)、CEQ和SNPstream系統(Beckman)、陣列雜交技術(例如,AffymetrixGeneChip;Perlegen)、BeadArray技術(例如,IlluminaGoldenGate和Infinium分析)、陣列標簽技術(例如,Parallele)、以及基于核酸內切酶的熒光雜交技術(Invader;ThirdWave)。一些可獲得的陣列平臺(包括AffymetrixSNP陣列6.0和IlluminaCNV370-Duo和1MBeadChips)包括標記一些CNV的SNP。這允許經由包括在這些平臺中的代理SNP檢測CNV。因此,通過利用本領域技術人員可獲得的這些或其他方法,多態標記物處(包括微隨體、SNP或其它類型的多態標記物)的一個或多個等位基因可以被鑒定。在這里描述的一些方法中,處于對乳腺癌的增加的易感性(即,增加的風險)的個體是這樣的個體,其中在一個或多個多態標記物或單體型處的提供對乳腺癌增加的易感性的至少一個特定等位基因被鑒定(即,風險中的標記物等位基因或單體型)。在一個方面,風險中的標記物或等位基因是提供乳腺癌的顯著增加的風險(或易感性)的標記物或單體型。在一個實施方式中,與標記物或單體型相關的顯著性通過相對風險(RR)來測量。在另一個實施方式中,與標記物或單體型相關的顯著性通過優勢比(0R)來測量。在進一步的實施方式中,顯著性通過百分比來測量。在一個實施方式中,顯著增加的風險作為至少1.10,包括但不限于至少1.11、至少1.12、至少1.13、至少1.14、至少1.15、至少1.16、至少1.17、至少1.18、至少1.19、至少1.20、至少1.21、至少1.22、至少1.23、至少1.24、至少1.25、至少1.30、至少1.35、至少1.40、至少1.50、至少1.60、至少1.70、1.80、至少1.90、至少2.0、至少2.5、至少3.0、至少4.0、和至少5.0的風險(相對風險和/或優勢比)被測量。在一個特別的實施方式中,至少l.15的風險(相對風險和/或優勢比)是顯著的。在另一個特別的實施方式中,至少l.17的風險是顯著的。在又一個實施方式中,至少1.20的風險是顯著的。在另外的實施方式中,至少約1.25的相對風險是顯著的。在另一進一步的實施方式中,風險的顯著增加是至少約1.30是顯著的。然而,其他分界也是預期的,例如,至少1.16、1.18、1.19、1.21、1.22等,并且這樣的分界也在本發明的范圍內。在另一個實施方式中,風險的顯著增加是至少約10%,包括但不限于約15%、約20%、約25%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%、和約100%。在一個特別的實施方式中,風險的顯著增加是至少15%。在其他實施方式中,風險的顯著增加是至少17%、至少20%、至少22%、至少24%、至少25%、至少30%、至少32%和至少35%。然而,被本領域技術人員認為適于表征本發明的其他分界或范圍也是預期的,并且這些也在本發明的范圍內。在一些實施方式中,風險的顯著增加通過P-值來表征,如小于0.05、小于0.01、小于1X10—3(0.001)、小于1X10—4(0.0001)、小于1X10—4(0.00001)、小于1X10—5(0.000001)、小于1X10—6(0.0000001)、小于1X10—7(0.00000001)、或小于1X10—8(0.000000001)的p-值。本發明的風險中的多態標記物或單體型是這樣的標記物或單體型,其中與其在比較組(對照)中的存在頻率相比,至少一個標記物或單體型的至少一個等位基因更經常地存在于處于疾病或性狀(受影響的)的風險中或診斷有所述疾病或性狀的個體中,使得所述標記物或單體型的存在指示對疾病或性狀(如,乳腺癌)易感性。對照組在一個實施方式中可以為群體樣品,即,來自一般群體的隨機樣品。在另一個實施方式中,對照組由無疾病的個體(即,沒有診斷有乳腺癌的個體)的組來表示。這樣的無疾病的對照在一個實施方式中可以通過一個或多個特定疾病相關癥狀的缺乏來表征。在另一個實施方式中,無疾病的對照組的特征在于一個或多個疾病-特異性風險因素的缺乏。在一個實施方式中,這樣的風險因素為至少一個環境風險因素。代表性的環境因素是天然產物、礦物或其他化學制品,其已知影響、或預期影響發展特異性疾病或性狀的風險。其他環境風險因素是與生活方式相關的風險因素,包括但不限于食物和飲酒習慣、主要居住地的地理位置以及職業風險因素。在另一個實施方式中,所述風險因素是至少一個遺傳風險因素。用于關聯的簡單檢驗的實例是二乘二表(twobytwotable)上的Fisher-精確檢驗。考慮到染色體的同齡組,二乘二表用染色體的數量構建,其包括標記物或單體型的兩個、標記物或單體型的一個但不包括標記物或單體型的另一個和標記物或單體型中沒有一個。本領域技術人員已知的關聯的其他統計檢驗也被預期并且也在本發明的范圍內。在本發明的其他實施方式中,對于疾病或性狀具有降低的易感性(S卩,降低的風險)的個體是這樣的個體,其中提供對于所述疾病或性狀的降低的易感性的一個或多個多態標記物或單體型處的至少一個特定等位基因被鑒定。提供降低的風險的所述標記物等位基因和/或單體型也被稱為保護性的。在一個方面,所述保護性標記物或單體型是提供疾病或性狀的顯著降低的風險(或易感性)的標記物或單體型。在一個實施方式中,顯著降低的風險作為小于0.90,包括但不限于小于0.85、小于0.80、小于0.75、小于0.7、小于0.6、小于0.5、小于0.4、小于0.3、小于0.2和小于0.1的相對風險被測量。在一個特別的實施方式中,顯著降低的風險小于0.90。在另一個實施方式中,顯著降低的風險小于0.85。在又一個實施方式中,顯著降低的風險小于0.80。在另一個實施方式中,風險(或易感性)的降低為至少10%,包括但不限于至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少80%、至少85%、至少90%、至少95%和至少98%。在一個特別的實施方式中,風險的顯著降低為至少約15%。在另一個實施方式中,風險的顯著降低為至少約20%。在另一個實施方式中,風險的顯著降低為至少約25%。然而,本領域技術人員認為適合表征本發明的其他分界或范圍也被預期,并且那些也在本發明的范圍內。本領域技術人員將認識到對于具有被研究的群體中存在的兩個等位基因的多態標記物(如SNP),并且,其中一個等位基因被發現與對照相比在群體中在具有性狀或疾病的個體的組中頻率增加,標記物的另一等位基因將被發現與對照相比,在具有性狀或疾病的個體的組中頻率降低。在這樣的情況中,標記物的一個等位基因(被發現在具有性狀或疾病的個體中頻率增加的等位基因)將為風險中的等位基因,而另一等位基因將為保護性等位基因。與疾病或性狀(例如,乳腺癌)相關的遺傳變異體可以單獨使用以預測對于給定基因型的疾病的風險。對于雙等位基因標記物,如SNP,存在3個可能的基因型對于風險中的變異體的純合子、雜合子、以及風險中的變異體的非攜帶者。與多個基因座處的變異體相關的風險可以用于評估綜合風險(overallrisk)。對于多個SNP變異體,存在k個可能的基因型k二3nX2P;其中n為常染色體基因座的數量,而p為生殖染色體(gonosomal)(性染色體)基因座的數量。綜合風險評估計算通常假定不同遺傳變異體的相對風險相乘,即,與特定基因型組合相關的綜合風險(例如,RR或0R)是對于每個基因座處基因型的風險值的乘積。如果與具有匹配的性別和種族的參考群體相比,表達的風險是對于每個個人,或對于每個個人的特定基因型的相對風險,則組合的風險是基因座特定風險值的乘積_并且其也對應于與所述群體相比的綜合風險評估。如果個人的風險是基于與風險中的等位基因的非攜帶者的比較,則組合的風險對應于這樣的評估,其比較在所有基因座處具有給定基因型的組合的個人和在這些基因座的任何一個處沒有攜帶風險變異體的個體的組。任何風險中的變異體的非攜帶者的組具有最低的評估的風險并具有與其自身相比(即,非攜帶者)l.O的組合風險,但是與所述群體相比具有小于1.0的綜合風險。應當注意到,非攜帶者的組可以潛在地非常小,尤其對于大量的基因座,并且在該情況下,其關聯性相應地小。乘法模型是節儉的模型,其通常相當好地適合復合性狀的數據。與相乘的偏差很少描述在對于常見疾病的常見變異體的上下文中,并且如果報道,通常僅是建議性的,因為通常需要非常大的樣品大小以能夠展示基因座之間的統計相互作用。通過實例的方式,讓我們考慮已經描述與前列腺癌相關的八個變異體的總禾口(Gudmundsson,J.,etal.,NatGenet39:631-7(2007),Gudmundsson,J.,etal.,NatGenet39:977-83(2007);Yeager,M.,etal,NatGenet39:645-49(2007),Am皿dadottir,L,elal.,NatGenet38:652-8(2006);Haiman,CA.,etal.,NatGenet39:638-44(2007))。這些基因座中的七個是常染色體,并且剩余的基因座在染色體X上。于是理論上基因型組合的總數是3TX21=4374。這些基因型類別中的一些是非常少的,但仍是可能的,并應當被考慮用于綜合風險評估。可能的是在多個遺傳變異體的情況中應用的乘法模型在結合非遺傳風險變異體時也將有效,假定所述遺傳變異體不明確地與"環境"因素相關。換言之,遺傳和非遺傳風險中的變異體可以在乘法模型下被評估以估計組合的風險,假定所述非遺傳和遺傳風險因素并不相互作用。利用相同的定量方法,與乳腺癌相關的多個變異體相關的組合的或綜合風險可以被評估。連鎖不平衡重組的自然現象,其在每個減數分裂事件期間對于每個染色體對平均發生一次,代表一種這樣的方式,其中自然提供序列中的變異(和因此的生物學功能)。已經發現重組在基因組中不隨機發生;相反,在重組率的頻率中存在大的變異,導致高重組頻率的小區(也稱為重組熱點)和低重組頻率的較大區,其通常稱為連鎖不平衡(LD)塊(Myers,S.etal.,BiochemSocTrans34:526-530(2006)Jeffreys,AJ.,etal.,NatureGenet29:217-222(2001);May,C.A.,etal.,NatureGenet31:272—275(2002))。連鎖不平衡(LD)指的是兩個遺傳元件的非隨機分配。例如,如果特定遺傳元件(例如,多態標記物的等位基因,或單體型)以O.50(50%)的頻率在群體中發生,并且另一元件以O.50(50%)的頻率發生,則具有兩個元件的個人的預測的發生率是O.25(25%),假定所述元件隨機分布。然而,如果發現兩個元件以大于O.125的頻率一起發生,則所述元件被稱為處于連鎖不平衡中,因為它們傾向于以比它們獨立的發生頻率(例如,等位基因或單體型頻率)將預測的比率高的比率一起遺傳。粗略地說,LD通常與兩個元件之間的重組事件的頻率相關。在群體中等位基因或單體型頻率可以通過基因型測定群體中的個體和確定群體中每個等位基因或單體型的發生頻率來確定。對于二倍體的群體,例如,人類群體,對于每個遺傳元件(例如,標記物,單體型或基因),個體將通常具有兩個等位基因。許多不同的測量已經被提出用于評估連鎖不平衡的強度(LD;在Devlin,B.&Risch,N.,Genomics29:311-22(1995)中綜述)。大多數捕獲雙等位基因位點的對之間的關聯的強度。LD的兩個重要的成對測量值是一(有時表示為口A2)和|D'I(Lewontin,R.,Genetics49:49-67(1964);Hill,W.G.&Robertson,A.Theor.Appl.Genet.22:226-231(1968))。兩個測量值的范圍從0(沒有不平衡)到l("完全"不平衡),但是它們的解釋稍微不同。|D'I以這樣的方式定義,S卩,如果可能的單體型中的僅兩個或三個出現,則它等于1,并且如果全部四個可能的單體型出現,則它<i。因此,<i的Id'I值表示歷史重組可能已經發生在兩個位點之間(再發生突變也可以造成Id'I<i,但是對于單一核苷酸多態性(SNP),這通常被認為可能性比重組小)。測量值一代表兩個位點之間的統計相關性,并且如果僅兩個單體型出現,則采取1的值。r2測量值可論證地是用于關聯繪制的最相關的測量值,因為r2與檢測易感性基因座和特定SNP之間的關系所必需的樣品大小之間存在簡單的相反關系。這些測量值針對成對的位點被定義,但是對于一些應用,確定多強的LD穿過包含許多多態位點的整個區可能是期望的(例如,測試是否LD的強度在基因座中或群體中顯著不同,或者在特定模式下在區域中是否存在比預測的更多或更少的LD)。測量跨越區域的LD不是直接的,但是一種途徑是使用測量值r,其在群體遺傳學中被開發。粗略地說,r測量在特定群體模型中多少重組對產生在數據中可見到的LD將是必需的。這種類型的方法也可以對確定LD數據是否提供重組熱點的存在的證據的問題潛在地提供統計上嚴格的途徑。對于這里描述的方法,基因區段(如SNP標記物)之間的顯著的一值可以為至少0.l,如至少O.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99或1.0。在一個優選的實施方式中,顯著的r2值可以為至少0.2。可替換地,如這里描述的連鎖不平衡指的是特征為至少0.2,如0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、0.99的|D'|值的連鎖不平衡。因此,連鎖不平衡代表不同標記物的等位基因之間的相關性。其通過相關系數或ID'|(一直到1.O,并且|D'I直到1.0)來測量。連鎖不平衡可以在單一人類群體中被確定,如這里限定的,或者它可以在包括來自多于一個人類群體的個體的樣品的采集中被確定。在本發明的一個實施方式中,LD在來自一個或多個HapMap群體的樣品中被確定(Caucasian,african,Japanese,Chinese),如限定的(http:〃www.h即map.org)。在一個這樣的實施方式中,LD在H即M即樣品的CEU群體中被確定。在另一個實施方式中,LD在YRI群體中被確定。在另一個實施方式中,LD在歐洲群體中被確定。在又一個實施方式中,LD在冰島群體中被確定。如果基因組中所有的多態性在群體水平是相同的,則它們中每一個將需要在關聯研究中被調查。然而,由于多態性之間的連鎖不平衡,緊密連接的多態性是強相關的,其減少在觀察顯著的關聯的關聯研究中需要被研究的多態性的數量。LD的另一結果是許多多態性由于這些多態性是強相關的事實可以產生關聯信號。基因組LD圖已經跨越所述基因組被產生,并且這樣的LD圖已經被提出用作用于繪制疾病-基因的框架(Risch,N.&Merkiangas,K,Science273:1516-1517(1996);Maniatis,N.,etal.,ProcNatlAcadSciUSA99:2228-2233(2002);Reich,DEetal,Nature411:199-204(2001))。現在已經確定人類基因組的許多部分可以被分成系列的包含幾個常見單體型的離散的單體型塊;對于這些塊,連鎖不平衡數據幾乎沒有提供表明重組的證據(參見,例如,Wall.,J.D.andPritchard,J.K.,NatureReviewsGenetics4:587-597(2003);Daly,M.etal.,NatureGenet.29:229-232(2001);Gabriel,S.B.etal.,Science296:2225-2229(2002);Patil,N.etal.,Science294:1719-1723(2001);Dawson,E.etal.,Nature418:544-548(2002);Phillips,M.S.etal.,NatureGenet.33:382-387(2003))。存在兩個用于定義這些單體型塊的主要方法塊可以被定義為具有有限的單體型多樣性的DNA的區(參見,例如,Daly,M.etal.,NatureGenet.29:229-232(2001);Patil,N.etal.,Science294:1719-1723(2001);Dawson,E.etal.,Nature418:544-548(2002);Zhang,K.etal.,Proc.Natl.Acad.Sci.USA99:7335-7339(2002)),或者定義為具有廣泛的歷史重組的過渡帶之間的區,利用連鎖不平衡鑒定(參見,例如,Gabriel,S.B.etal.,Science296:2225-2229(2002);Phillips,M.S.etal.,NatureGenet.33:382-387(2003);Wang,N.etal.,Am.J.Hum.Genet.71:1227-1234(2002);Stumpf,M.P.,andGoldstein,D.B.,Curr.Biol.13:1-8(2003))。近來,跨過人類基因組的重組率和相應的熱點的精密-標度圖已經被產生(Myers,S.,etal.,Science310:321-32324(2005);Myers,S.etal.,BiochemSocTrans34:526530(2006))。所述圖顯示跨過基因組的重組中的巨大變異,其中在熱點區中重組率高達10-60cM/Mb,而在間隔區重組率接近O,其由此代表有限的單體型多樣性和高LD的區。該圖因此可以用于將單體型塊/LD塊限定為被重組熱點側翼包圍的區。如這里所用的,術語"單體型塊"或"LD塊"包括通過上面描述的特征種的任何一個或本領域技術人員所用的限定這樣的區的其他可替換的方法所限定的塊。因此已經變的顯然是,對于任何給定的觀察到的與基因組中多態標記物的關聯,可能基因組中的另外的標記物也表現出關聯。這是跨越基因組的LD的不平均分布的自然結果,如通過重組率的較大的變異所觀察到的。用于檢測關聯的標記物因此在某種意義上28代表用于與給定疾病或性狀相關的基因組區(即,單體型塊或LD塊)的"標簽"。一個或多個引起結果的(功能性)變異體或突變可以存在于發現與疾病或性狀相關的區內。所述功能性變異體可以為另一SNP,串聯(銜接)重復多態性(如小隨體或微隨體),轉座因子(轉座元件)、或拷貝數量的變異,如倒位、缺失或插入。與這里描述的變異體在LD中這樣的變異體可以提供比用于檢測關聯的標簽標記物觀察到的更高的相對風險(RR)或優勢比(OR)。本發明由此涉及用于檢測與疾病的關聯的標記物,如這里描述的,以及與所述標記物連鎖不平衡中的標記物。因此,在本發明的一些實施方式中,與本發明的標記物和/或單體型在LD中的標記物,如這里描述的,可以用作代理標記物(surrogatemarkers)。該代理標記物在一個實施方式中具有比最初發現與疾病相關的標記物或單體型更小的相對風險(RR)和/或優勢比(OR)值,如這里所描述的。在其他實施方式中,該代理標記物具有比針對最初發現與疾病相關的標記物初始確定的那些具有更大的RR或OR值,如這里所描述的。這樣的實施方式的一個實例將是與最初發現與疾病相關的更常見的變異體(>10%群體頻率)在LD中稀少的、或相對稀少(<10%等位基因群體頻率)的變異體,如這里描述的變異體。鑒定和使用如這里描述的用于檢測由本發明的發明人發現的關聯的這樣的標記物可以通過本領域技術人員熟知的常規方法來進行,并且因此在本發明的范圍內。單體型頻率的確定患者和對照組中單體型的頻率可以利用預期-最大化算法來估計(DempsterA.etal.,J.R.Stat.Soc.B,39:1-38(1977))。可以處理錯失的基因型和與相位(phase)的不確定性的該算法的實施可以被使用。在零假設下,患者和對照被認為具有相同的頻率。利用可能性方法,可替換的假設被測試,其中可以包括這里描述的標記物的候選風險中的單體型)被允許在患者中具有比對照更高的頻率,而其他單體型的頻率的比被假定在兩個組中相同。在兩個假設下可能性被分別最大化,并且相應的1-df可能性比統計量被用于評估統計顯著性。為了尋找易感性區中,例如LD塊區中,風險中的和保護性的標記物和單體型,研究了所述區中基因型化(genotyped)的標記物的所有可能的組合的關聯。組合的患者和對照組可以被隨機分成兩個組,大小上等于患者和對照的原始組。隨后重復標記物和單體型分析并且確定記錄的最顯著的P值。可以重復該隨機化方案,例如,超過100次以構建p值的經驗分布。在優選的實施方式中,<0.05的p值是顯著的標記物和/或單體型關聯的指征。單體型分析單體型分析的一個一般方法涉及利用應用于NEstedM0dels(GretarsdottirS.,etal.,Nat.Genet.35:131-38(2003))的基于似然的推論。所述方法在程序NEMO中實施,其考慮許多多態標記物、SNP和微隨體。該方法和軟件被特別設計用于病例_對照研究,其中目的是鑒定提供不同的風險的單體型基團。它還是用于研究LD結構的工具。在NEM0中,最大似然估計、似然比率和P-值借助于EM算法來直接計算,用于觀測數據,作為錯失(漏失)-數據問題處理它。即使基于對于觀測的數據直接計算的似然的似然比率檢驗,其已經捕獲由于相(phase)中的不確定性的信息損失和錯失的基因型,可以被依賴以產生有效的p值,但是仍然感興趣的是知道多少信息由于信息不完全已經丟失。用于單體型分析的信息測量描述29在Nicolae禾口Kong(TechnicalReport537,DepartmentofStatistics,UniversityofStatistics,UniversityofChicago;Biometrics,60(2):368-75(2004))中,作為限定用于連鎖分析的信息測量的自然延伸,并且在NEMO中實施。對于單一標記物與疾病的關聯,Fisher精確檢驗可以用于計算每個個體等位基因的兩側P值。通常,除非特別指出,否則所有的P值未調整的呈現用于多重比較。呈現的頻率(對于微隨體、SNP和單體型)是與攜帶者頻率相反的等位基因頻率。為了最小化由于作為家族招募的患者的相關性的任何偏倚(bias),一級和二級親屬可以從患者列表中刪除。此外,通過延伸先前描述的方差調整程序用于同胞群(Risch,N.&Teng,J.(GenomeRes.,8:1273-1288(1998))以便它可以用于一般家族關系,并代表用于比較的調整的和未調整的P值,可以重復所述檢驗用于關聯校正患者中任何殘余的關聯性。基因組對照的方法(Devlin,B.&Roeder,K.Biometrics55:997(1999))也可以用于調整個體的相關性和可能的分層。差異通常如預期的非常小。為了評估對于多個檢驗校正的單一標記物關聯的顯著性,我們可以利用相同的基因型數據進行隨機檢驗。患者和對照的同齡組可以被隨機化并且重做關聯分析多次(例如,直到500,000次),并且p值是復制的部分,其產生對于一些標記物等位基因的P值,其低于或等于我們利用最初的患者和對照同齡組觀察到的P值。對于單一標記物和單體型分析,相對風險(RR)和群體特異風險(PAR)可以被計算(假定乘法模式(模型))(單體型相對風險模型)(Terwilliger,J.D.&0tt,J.,H亂Hered.42:337-46(1992)andFalk,CT.&Rubinstein,P,Arm.Hum.Genet.51(Pt3):227-33(1987)),即,個人攜帶的兩個等位基因/單體型的風險相乘。例如,如果RR是A相對于a的風險,則個人純合子AA的風險將是雜合子Aa的風險的RR倍,并且將是純合子aa的風險的RR2倍。乘法模式具有簡化分析和計算的優點_在受影響的群體內以及對照群體內,單體型是獨立的,即,在Hardy-Weinberg平衡中。因而,受影響的和對照的單體型計數均具有多項分布,但是在可替換的假設下具有不同的單體型頻率。特別地,對于兩個單體型,hi和hj,風險GO/風險(hj)=(fi/Pi)/(fj/Pj),其中f和p分別指受影響的群體中和對照群體中的頻率。雖然如果真實模式不是相乘的,存在一些力量損失,但是損失傾向于輕微,除了極端情況外。最重要地,P值總是有效的,因為它們相對于零假設計算。在一個關聯研究中檢測的關聯信號可以在第二個組(同齡組)(理想地來自相同或不同種族的不同群體(例如,相同或不同國家的不同區))中被復制。復制研究的優點是在復制研究中進行的測試的數量,并由此被應用的統計測量嚴格性較低。例如,對于利用300,000個SNP的用于特定疾病或性狀的易感性變異體的基因組_范圍的研究,進行的300,000個測試(對于每個SNP—個)的校正可以被進行。由于在典型使用的陣列上許多SNP相關聯(即,在LD中),因此它們不是獨立的。由此,所述校正是保守的。然而,應用該校正因素需要小于0.05/300,000=1.7X10—7的觀察到的P值,因為應用該保守檢驗的要考慮的顯著性的信號產生自單一的研究組。明顯地,在P值小于該保守閾值的情況下,在基因組-范圍的關聯研究中發現的信號是真正的基因作用的測量值,并且在另外的組(同齡組)中的復制從統計角度來看不是必需的。然而,由于校正因素取決于進行的統計檢驗的數量,因此如果來自初始研究的一個信號(一個SNP)在第二個病例-對照組中被復制,則對于顯著性的合適的統計檢驗是對于單一統計檢驗的那個,即,P值小于O.05。在一個或甚至幾個另外的病例-對照組中的復制研究具有的增加的優點是提供增加的群體中關聯信號的評估,由此同時確認初始發現并提供大體上在人類群體中被測試的遺傳變異體的綜合顯著性的評估。來自幾個病例-對照組的結果也可以被結合以提供潛在作用的綜合評估。通常用于結合來自多個基因關聯研究的結果的方法是Mantel-Haenszel模式(MantelandHaenszel,JNatlCancerInst22:719-48(1959))。所述模式被設計成處理其中關聯產生自不同的群體的情況,可能具有不同的遺傳變異體的群體頻率的每個,被結合。所述模式結合這樣的結果,其假定變異體對疾病的風險的影響,通過OR或RR測量,在所有的群體中是相同的,而變異體的頻率在群體之間可能不同。結合來自幾個群體的結果具有增加的優勢,即,檢測實際的潛在關聯信號的綜合能力被增加,原因是由結合的組(同齡組)提供的增加的統計能力。此外,個體研究中的任何缺陷,例如由于病例和對照的不相等匹配或群體分層,在來自多個組(同齡組)的結果被結合時將傾向于平衡,再次提供真實的潛在遺傳作用的更好估計。風險評估和診斷在任何給定的群體內,存在發展疾病或性狀的絕對風險,定義為個人在指定時期發展特定疾病或性狀的機會。例如,婦女的乳腺癌的終生絕對風險為九分之一。也就是說,每九個中的一個婦女在她們生命的某個點將發展乳腺癌。風險通常通過考察非常大量的人而不是在特定個體處測量。風險通常根據絕對風險(AR)和相對風險(RR)表示。相對風險用來比較與兩個變異體相關的風險或兩個不同的人群的風險。例如,它可以用來比較具有某個基因型的人群與具有不同的基因型的另一人群。對于疾病,2的相對風險意味著一個群具有的發展疾病的機會是另一群的兩倍。表達的風險對于個人,或個人的特定基因型通常是與具有匹配的性別或種族的群體相比較的相對風險。同樣性別和種族的兩個個體的風險可以以簡單的方式比較。例如,如果,與所述群體相比,第一個個體具有相對風險1.5,而第二個具有相對風險O.5,則與第二個個體相比,第一個個體的風險是1.5/0.5=3。如這里描述的,一些多態標記物和包含這樣的標記物的單體型被發現用于乳腺癌的風險評估。風險評估可以涉及用于診斷對乳腺癌的易感性的標記物的應用。多態標記物的特定等位基因被發現在患有乳腺癌的個體中比在沒有診斷有乳腺癌的個體中更常見。因此,這些標記物等位基因具有用于檢測個體中乳腺癌或對乳腺癌的易感性的預測價值。包含風險中的標記物,如本發明的標記物的單體型塊或LD塊內的標簽標記物可以用作單體型塊或LD塊內其他標記物和/或單體型的代理。具有等于1的r2值的標記物是風險中的變異體的完美的代理,即,對于一個標記物的基因型完全預測另一個的基因型。具有小于1的較小一值的標記物也可以為用于風險中的變異體的代理,或者可替換地代表具有與風險中的變異體一樣高的相對風險值的變異體或者具有可能甚至比風險中的變異體更高的相對風險的變異體。鑒定的風險中的變異體本身可以不是功能性變異體,但是在該情況下與真正的功能性變異體在連鎖不平衡中。所述功能性變異體可以例如為串聯重復(銜接重復,tandemr印eat),如小隨體或微隨體、轉座元件(如,Alu元件)、或結構改變、如缺失、插入或倒位(有時還稱為拷貝數量變異,或CNV)。本發明包括評估用于如這里披露的標記物的這樣的代理標記物。這樣的標記物被注解、繪圖和列在公共數據庫中,如本領域技術人員熟知的,或者可以可替換地被容易地鑒定,所述鑒定是通過對個體的組中本發明的標記物鑒定的區或區的一部分進行測序,并鑒定序列的所得到的組中的多態性。因此,本領域技術人員可以容易地且無需過度實驗基因型代理在與如這里描述的標記物和/或單體型連鎖不平衡中的標記物。在與檢測的風險中的變異體LD中的標簽或代理標記物,對于檢測個體中與乳腺癌或對乳腺癌的易感性的關聯也具有預測價值。這些在與本發明的標記物LD中的標簽或代理標記物也可以包括在單體型中區別的其他標記物,因為這些類似地具有用于檢測對乳腺癌的易感性的預測價值。在一些實施方式中,本發明可以通過評估包含來自個體的基因組DNA的樣品的與乳腺癌相關的這里描述的變異體的存在來實施。這樣的評估包括以下步驟利用技術人員熟知的和這里進一步描述的方法來檢測至少一個多態標記物的至少一個等位基因的存在或缺乏,以及基于這樣的評估的結果,確定樣品來源的個體是否處于乳腺癌的增加或降低的風險中(增加或降低的易感性)。可替換地,本發明可以利用包括關于這里描述的與乳腺癌相關的至少一個多態標記物(或者在與這里所示的與乳腺癌相關的至少一個標記物連鎖不平衡中的標記物)的基因型狀況的信息的數據組(dataset)來實施。換言之,包含關于這樣的基因狀況的信息的數據組,例如形式為在某一多態標記物或多個標記物(例如,一些風險中的等位基因的存在或缺乏的指征)處的基因型計數,或對于一個或多個標記物的實際基因型,可以被查詢與乳腺癌相關的由本發明的發明人所示的一些多態標記物處一些風險中的等位基因的存在或缺乏。如這里所示的,對于與乳腺癌的增加的風險相關的變異體(例如,標記物等位基因)的陽性結果指示數據組來源的個體處于乳腺癌的增加的易感性(增加的風險)。在本發明的一些實施方式中,多態標記物通過參考對于多態標記物的基因型數據與包括多態性的至少一個等位基因與乳腺癌之間的關聯的查詢表而與乳腺癌關聯。在一些實施方式中,所述表包括對于一個多態性的關聯。在其他實施方式中,所述表包括對于多個多態性的關聯。在兩種情況中,通過參考給出標記物與乳腺癌之間的關聯的指征的查詢表,對于乳腺癌的風險,或對于乳腺癌的易感性,可以在樣品來源的個體中被鑒定。在一些實施方式中,所述關聯作為統計測量值被報道。所述統計測量值可以作為風險測量值被報道,如相對風險(RR)、絕對風險(AR)或優勢比(0R)。本發明的標記物,如,染色體5pl2和染色體10q26上的多態標記物,例如,表12、表13和表14中示出的標記物,例如,標記物rs7703618、rs4415084、rs2067980、rs10035564、rsl1743392、rs7716600、rsl0941679、rsl219648,可以用于單獨或組合用于風險評估和診斷目的。因此,甚至在其中通過個體的標記物的風險增加相對中等的情況下,即,大約10-30%,所述關聯也可以具有顯著的含義。因此,相對常見的變異體可以對于綜合風險具有顯著的貢獻(群體特異風險高),或標記物的組合可以用于限定個體的組,其基于標記物的組合的風險,處于發展所述疾病的顯著組合的風險中。例如,組合的風險可以基于來自染色體5pl2和染色體10q26上的標記物的基因型結果來評估,如標記物rsl0941679和標記物rsl219648。可替換地,與這些標記物中的任何一個在LD中的標記物可以被評估。已知提供乳腺癌的風險的其他標記物也可以與這里描述的標記物一起被評估,如染色體2ql4上的標記物(例如,標記物rs4848543或在與其連鎖不平衡中的標記物),染色體2q35上的標記物(例如,標記物rsl3387042,或在與其連鎖不平衡中的標記物),以及染色體16上的標記物(例如,標記物rs3803662,或在與其連鎖不平衡中的標記物)。32因此,在本發明的一個實施方式中,多個變異體(標記物和/或單體型)用于綜合風險評估。這些變異體在一個實施方式中選自如這里披露的變異體。其他實施方式包括本發明的變異體結合已知用于診斷對乳腺癌的易感性的其他變異體的應用。對于任何兩個或多個標記物的結果可以在這樣的分析中被組合,如對于三個標記物、四個標記物、五個標記物、六個標記物、七個標記物、八個標記物、九個標記物、或十個或更多個標記物的結果。在這樣的實施方式中,多個標記物和/或單體型的基因型狀況在個體中被確定,并且所述個體的狀況與相關變異體的群體頻率,或者臨床健康受治療者,如年齡_匹配的和性別_匹配的受治療者中的變異體的頻率相比較。本領域已知的方法,如多變量分析或聯合風險分析,可以隨后用來確定基于多基因座處基因型狀況提供的綜合風險。基于這樣的分析的風險的評估可以隨后用在本發明的方法和試劑盒中,如這里描述的。如上面描述的,人類基因組的單體型塊結構具有這樣的影響,即在與疾病或性狀原始相關的變異體連鎖不平衡中的大量的變異體(標記物和/或單體型)可以用作用于評估與疾病或性狀的關聯的代理標記物。這樣的代理標記物的數量將依賴于諸如所述區中的歷史重組率、所述區中的突變頻率(即,所述區中多態位點或標記物的數量)、以及所述區中LD的程度(LD塊的大小)的因素。這些標記物通常位于所討論的LD塊或單體型塊的物理界限內,如利用這里描述的方法,或通過本領域技術人員已知的其他方法限定的。然而,有時標記物和單體型關聯被發現延伸到如所限定的單體型塊的物理界限之外。在那些情況中,這樣的標記物和/或單體型也可以用作用于物理上位于如所限定的單體型塊內的標記物和/或單體型的代理標記物和/或單體型。因此,與本發明的標記物和單體型在LD中的標記物和單體型(典型地特征為r2大于0.1,如r2大于0.2,包括r2大于0.3,還包括r2大于O.4)也在本發明的范圍內,即使它們物理上位于如所限定的單體型塊的界限之外。這包括這里描述的標記物(例如,表1和表3,例如,rs4415084、rsl0941679、rsl219648),但是還包括與表1和表3中列出的標記物的一個或多個在強LD中(特征為r2大于0.1或0.2和/或ID'I>0.8)的其他標記物。對于這里描述的SNP標記物,在患者中發現與過量的等位基因(風險中的等位基因)相對的等位基因被發現在乳腺癌中頻率降低。LD中和/或包含這樣的標記物的這些標記物和單體型由此對于乳腺癌是保護性的,B卩,它們為攜帶這些標記物和/或單體型的個體提供發展乳腺癌的降低的風險或易感性。本發明的一些變異體,包括一些單體型,在一些情況下包括不同遺傳標記物的組合,如SNP和微隨體。檢測單體型可以通過用于檢測多態位點處的序列的本領域已知的方法和/或這里描述的方法來實現。此外,一些單體型或標記物的組與疾病表型之間的關聯可以利用標準技術來校驗。用于關聯的簡單測試的代表性實例為在二乘二表上的Fisher精確檢驗。在特定實施方式中,發現與乳腺癌相關的標記物等位基因或單體型(例如,如在表1和表3中列出的標記物等位基因,如在表12、表13和表14中列出的標記物,SEQIDNO:1-237)是這樣的標記物等位基因或單體型,其中所述標記物等位基因或單體型與其在健康個體(對照)中存在的頻率相比,在處于乳腺癌風險(受影響的)個體中以更大的頻率存在,其中,所述標記物等位基因或單體型的存在指示乳腺癌或對乳腺癌的易感性。在其他實施方式中,在與發現與乳腺癌相關的一個或多個標記物連鎖不平衡中的風險中的標記物是標簽標記物,其與它們在健康個體(對照)中存在的頻率相比,以更大的頻率存在于處于乳腺癌風險中的個體(受影響的)中,其中所述標簽標記物的存在指示對乳腺癌的增加的易感性。在另外的實施方式中,在與發現與乳腺癌相關的一個或多個標記物連鎖不平衡中的風險中的標記物等位基因(即,提供增加的易感性)是包含一個或多個等位基因的標記物,所述等位基因與其在健康個體(對照)中存在的頻率相比,在處于乳腺癌風險的個體中以更大頻率存在,其中,所述標記物的存在指示對乳腺癌的增加的易感性。研究群體在通常意義上,本發明的方法和試劑盒可以用于包含來自任何來源,即,任何個體的基因組DNA的樣品。在優選的實施方式中,所述個體為人類個體。所述個體可以為成年人、兒童、或胎兒。本發明還用于評估作為目標群體的成員的個體中的標記物和/或單體型。這樣的目標群體在一個實施方式中為處于發展疾病的風險中的群體或個體群,這是基于其他遺傳因素、生物標記物、生物物理參數(例如,體重、BMD、血壓)、或一般健康和/或生活方式參數(例如,癌癥史、乳腺癌史、先前的疾病診斷、癌癥的家族史、乳腺癌的家族史)。本發明提供了包括來自特定年齡亞群的個體的實施方式,如那些超過40歲的年齡,超過45歲的年齡,或超過50、55、60、65、70、75、80、或85歲的年齡的亞群。本發明的其他實施方式涉及其他年齡組,如年齡小于85,如小于80歲,小于75歲,或小于70、65、60、55、50、45、40、35、或30歲的個體。其他實施方式涉及具有在上面描述的年齡范圍的任何一個中疾病的發作時的年齡的個體。還預期年齡的范圍在一些實施方式中可以是相關的,如在超過45歲但小于60歲時發作的年齡。然而其他年齡范圍也是預期的,包括由上面列出的年齡值包括的所有年齡范圍。本發明進一步涉及任何一個性別的個體,雄性或雌性。在一些實施方式中,它涉及雄性受治療者的評估。在優選的實施方式中,它涉及雌性受治療者的評估。冰島人群是北歐世系的高加索人群。在最近幾年內已經公布了大量報道冰島人群中遺傳連鎖和關聯的結果的研究。這些研究中的許多表明在其他人群中變異體的復制,其最初在冰島人群中因為與特定疾病相關而被鑒定(Styrkarsdottir.,U.,etal.NEnglJMedApr292008(Epubaheadofprint);Thorgeirsson,T.,etal.Nature452:638-42(2008);Gudmundsson,J.,etal.NatGenet.40:281-3(2008);Stacey,S.N.,etal.,NatGenet.39:865-69(2007);Helgadottir,A.,etal.,Science316:1491-93(2007);Steinthorsdottir,V.,etal.,NatGenet.39:770-75(2007);Gudmundsson,J.,etal.,NatGenet.39:631-37(2007);Frayling,TM,NatureReviewsGenet8:657-662(2007);Amundadottir,LT.,etal.,NatGenet.38:652-58(2006);Grant,S.F.,etal.,NatGenet.38:320-23(2006))。因此,冰島人群中的遺傳發現通常在其他人群中被復制,包括來自非洲和亞洲的人群。被發現與乳腺癌相關的本發明的標記物被認為在其他人類群體中表現出類似的關聯。包括個體的人類群體的特定實施方式由此也是預期的并在本發明的范圍內。這樣的實施方式涉及來自一個或多個人類群體的人類受治療者,所述群體包括但不限于,高加索人群、歐洲人群、美洲人群、歐亞人群、亞洲人群、中亞/南亞人群、東亞人群、中東人群、非洲人群、西班牙人群、和大洋州人群。歐洲人群包括但不限于,瑞典人、挪威人、芬蘭人、俄國人、丹麥人、冰島人、愛爾蘭人、凱爾特人、英國人、蘇格蘭人、荷蘭人、比利時人、法國人、德國人、西班牙人、葡萄牙人、意大利人、波蘭人、保加利亞人、斯拉夫人、塞爾維亞人、波斯尼亞人、捷克人、希臘人和土耳其人群體。此外在其他實施方式中,本發明可以在特定人類群體中被實施,所述群體包括班圖人、曼丁哥人、約魯巴人、桑人、姆布蒂俾格米人、奧克尼群島、Adygel、俄國人、撒丁尼亞人、托斯卡納人、莫扎比特(Mozabite)、貝多因人、德魯茲人(Druze)、巴勒斯坦人、俾路支人(Balochi)、布拉灰人(Brahui)、莫克蘭人(Makrani)、信德人(Sindhi)、帕坦人、布魯肖人(Burusho)、哈扎拉人(Hazara)、維吾爾人(Uygur)、卡拉什人(Kalash)、漢族人、傣族人、達斡爾人(Daur)、赫哲人(Hezhen)、拉祜族人、苗族人(Miao)、鄂倫春人(Oroqen)、禽族人、土家族人(Tujia)、土族人(Tu)、錫伯族人(Xibo)、彝族人、蒙古人、納西族人(Naxi)、柬埔寨人、日本人、雅庫特人、美拉尼西亞人、巴布亞人、卡日天安人(Karitianan)、蘇瑞人(Surui)、哥倫比亞人(Colmbian)、瑪雅人和比馬人。在一些實施方式中,本發明涉及包括黑種非洲人世系的群體,如包括非洲人譜系或血統的個人的群體。黑種非洲人世系可以通過作為非洲人_美洲人、非洲_美洲人、黑種美洲人自我報道來確定,其是黑色人種的成員或黑人人種的成員。例如,非洲人美洲人或黑種美洲人是那些生活在北美并在非洲的黑人人種群體的任何一個中具有起源的個人。在另一個實例中,黑種非洲人世系的自我報道的個人可以具有至少一個黑種非洲人世系的雙親或至少一個黑種非洲人世系的祖父母。個體受治療者中的人種分布也可以通過遺傳分析來確定。世系的遺傳分析可以利用非連鎖的微隨體標記物進行,如在Smithetal.(AmJHumGenet74,1001-13(2004))中闡述的那些。在一些實施方式中,本發明涉及在特定群體中的標記物和/或單體型,如上所述。本領域技術人員將認識到連鎖不平衡(LD)的測量當被應用于不同的群體時將產生不同的結果。這是由于不同的人類群體的不同的群體歷史以及可以導致在特定基因組區中LD中的差異的不同的選擇壓力。本領域技術人員還熟知一些標記物,如,SNP標記物,在一個群體中是多態的,但是在另一群體中不是多態的。然而本領域技術人員將可利用地應用所述方法并如這里教導的在任何給定的人類群體中實施本發明。這可以包括本發明的LD區中多態標記物的評估,以便鑒定那些在特定群體內產生最強的關聯的標記物。因此,本發明的風險中的變異體可以位于不同的單體型背景上并以不同的頻率在各種人類群體中。然而,利用本領域已知的方法和本發明的標記物,本發明可以在任何給定的人類群體中實施。預測乳腺癌的遺傳風險的模型乳腺癌風險評估的目標是提供一種用于所有婦女的個人化的醫療管理策略的發展的合理的框架,目標是提高高風險婦女中的存活率和生命質量,同時最小化成本、不必要的介入和較低風險的婦女中的焦慮。風險預測模型試圖估計在具有給定的先天風險特征(例如,家族史、在前的良性乳腺損傷、先前乳腺腫瘤)的組的個體中對于乳腺癌的風險。在臨床實踐中最常采用的乳腺癌風險評估模型通過考慮家族史來估計遺傳風險因素。該風險評估是基于具有一個或多個先前診斷有乳腺癌的近親屬的個體的增加的風險的觀察。他們并不考慮復雜系譜結構。這些模型具有的另外的不利之處在于不能夠區別具有乳腺癌易于突變的基因的攜帶者和非攜帶者。更復雜的風險模型具有處理特定家族史的更好機制并具有考慮對于BRCA1和BRCA2突變的攜帶者狀況的能力。例如,疾病發生率和攜帶者評估算法的乳腺和卵巢分析(BreastandOvarianAnalysisofDiseaseIncidenceandCarrierEstimationAlgorithm)(BOADICEA)(Antoniouetal.,2004)基于個體系譜結構通過系譜分析程序MENDEL考慮家族史。關于已知BRCAl和BRCA2狀況的信息也被考慮。BOADICEA和所有其他目前使用的乳腺癌風險模型的主要限制在于它們并不結合來自其他誘因基因的基因型信息。目前的模型強烈依賴于家族史以用作補償缺乏風險的非-BRCA遺傳定子的知識的代理。因此,可利用的模型限于其中存在已知的疾病家族史的情況。較低外顯率的乳腺癌誘因基因可能在群體中相對常見,并且可能沒有顯示如BRCAl和BRCA2基因那樣強的驅動家族簇集的傾向。具有相對高的誘因等位基因的遺傳負荷的患者可能顯示很少或沒有顯示疾病的家族史。因此存在構建模型的需要,其并入通過基于基因的測試直接獲得的遺傳易感性數據。除了更精確地形成模型外,這將減少對家族史參數的依賴性并輔助風險識別(風險預測,風險分布,riskprofiling)延伸入其中家族史不是這樣的關鍵因素的更廣泛的風險中的群體中。將改善的遺傳風險模型整合入乳腺癌原發預防的臨床管理中臨床原發預防選擇目前可以被分類為化學預防(或激素)治療和預防性手術。鑒定為高風險的患者可以被指定長期過程的化學預防治療。該概念在心血管藥物領域中被充分接受,但是現在僅開始影響臨床腫瘤學。最廣泛使用的腫瘤學化學預防法是他莫昔芬(Tamoxifen),一種選擇性雌激素受體調節劑(SERM)。最初用作針對乳腺癌復發的輔助療法,現在他莫昔芬已經證明作為乳腺癌預防藥劑的功效[Cuzick,etal.,(2003),Lancet,361,296-300][Martino,etal.,(2004),Oncologist,9,116-25]。FDA已經批準在一些高風險婦女中使用他莫昔芬作為化學預防藥劑。不幸的是,長期使用他莫西芬增加子宮內膜癌的風險約2.5倍,靜脈血栓形成的風險約2.0倍。肺栓塞、中風、和白內障的風險也被增加[Cuzick,etal.,(2003),Lancet,361,296-300]。因此,他莫昔芬用于減少乳腺癌發生率的優點不可能被容易地轉化為總的死亡率的相應降低。稱為雷洛昔芬(Raloxifene)的另一SERM在預防性模式中可能更有效,并且不帶來對于子宮內膜癌的相同風險。然而,在長期用雷洛昔芬治療的患者中血栓形成的風險仍被提高[Cuzick,etal.,(2003),Lancet,361,296-300;Martino,etal.,(2004),Oncologist,9,116-25]。此外,他莫昔芬和雷洛昔芬均具有與它們相關的生命質量問題。為了在化學預防性模式中進行SERM治療的合理的風險益處分析,存在的臨床需要是鑒定處于乳腺癌的最大風險中的個體。假定乳腺癌的風險的實質部分是遺傳的,則在這點上存在對于量化個體的風險的遺傳測試的清楚的臨床需要。可以預期起源于可能變得可利用的任何未來的癌癥化學-預防性治療的類似問題,如芳香酶抑制劑。此外,隨著化學預防治療變得更安全,存在對鑒定遺傳易患病的,但是沒有與BRCAI&2突變攜帶者相關的大量提高的風險的患者的增加的需要。鑒定為處于乳腺癌的高風險的患者被考慮預防性手術;雙側乳房切除術或卵巢切除術或兩者。清楚地,這樣的激烈處理僅被推薦用于被感知處于極高風險的患者。實踐中,這樣的風險目前僅在攜帶BRCA1、BRCA2或已知涉及稀有的乳腺癌誘因綜合癥的基因中的突變的個體中鑒定,如Li-Fra咖eni綜合癥中的p53,Cowden's綜合癥中的PTEN。BRCA1和BRCA2突變的外顯率的估計傾向于當它們來自多病例家族時比當它們來自基于群體的估計時高。這是因為不同的突變-攜帶家族表現出對乳腺癌的不同外顯率(參見例如[Thorlacius,etal.,(1997),AmJHumGenet,60,1079-84])。有助于該變異的主要因素之一是至今未知的誘因基因的作用,其影響修飾BRCAl和BRCA2突變的外顯率。因此,攜帶BRCAl或BRCA2基因中的突變的個體的絕對風險在修飾基因的存在和作用的知識缺乏的情況下不能被精確地量化。由于對于BRCAl和BRCA2攜帶者的治療選擇可能是嚴格的,因此在這點上重要的是用最大可能的精確度來量化個體BRCA攜帶者的風險。因此,存在的需要是鑒定影響修飾BRCAl和BRCA2攜帶者中乳腺癌的外顯率的誘因基因并基于這些基因發展改善的風險評估模型。此外,存在這樣的個體,其被察覺到處于非常高的乳腺癌風險中,可能是因為乳腺癌的強家族史,但是其中已知誘因基因中沒有突變可以被鑒定。在這樣的情況下考慮預防性手術是困難的,因為人們不能夠測試所述個體以發現是否她已經遺傳了高外顯率誘因基因。因此,個體的風險不能被精確地評估。因此,存在的清楚的臨床需求是鑒定仍然未發現的任何高外顯率誘因基因并發展在最初預防策略中使用的相關遺傳測試。這樣的基因可以例如為這里披露的與乳腺癌的風險相關的基因(例如,FGF10、MRPS30和/或FGFR2基因)。雖然這里所示的與乳腺癌的風險相關的變異體是相當常見的,并且提供乳腺癌的相對低的風險,但是非常可能的是較高風險的變異體存在于這些基因中的一個或多個內。因此,預期FGF10、MRPS30和/或FGFR2基因中的一個或多個內或與FGF10、MRPS30和/或FGFR2基因中的一個或多個相關的高風險遺傳變異體可以用于確定個體是否是乳腺癌的高風險(和高外顯率)遺傳因子的攜帶者。早期診斷臨床篩查乳腺癌在大多數西方國家中由定期臨床乳房檢查(CBE)和X-射線乳房X線照相術組成。存在良好的證據表明當在良好的乳房X線照相篩查程序的環境中使用時CBE幾乎沒有增加的益處。在英國,年齡在50歲與70歲之間的婦女被邀請每三年進行篩查乳房X線照相術。美國的情況依賴衛生保健提供者變化,然而,美國癌癥協會建議從40歲起每年進行乳房X線照相篩查(mammographicscreening)。乳房X線照相篩查已經證明在減少超過50歲的被篩查的婦女中的死亡率中的有效性。未必遺傳測試將永遠用作減少獲取現有的乳房X線照相篩查程序的方式。然而,乳房X線照相篩查不是沒有缺點,但是可以設想遺傳測試應當用于選擇用于增加的篩查程序的人。乳房X線照相篩查的缺點之一是它至今對于50歲年齡以下的篩查的婦女不可能展示對提高的生存的顯著影響。乳房X線照相術在50歲以下的婦女中有效性較低的一個原因是在較年輕的婦女中乳腺組織的密度更高,使得腫瘤的乳房X線照相檢測更困難。然而,易患病的個體中的乳腺癌傾向于在早期年齡組中發生,并且在高乳腺密度與乳腺癌風險之間存在清楚的關聯。因此,在用于具有高誘因的個體的乳房X線照相篩查中存在伴隨簡單的增加的問題,因為他們將通過在最高風險的組中不是最理想地進行的技術來管理。最近的研究已經表明對比-增強的磁共振成像(CE-MRI)更敏感,并在該高風險組中比乳房X線照相篩查更早期地檢測腫瘤[Warner,etal.,(2004),Jama,292,1317-25;Leach,etal.,(2005),Lancet,365,1769-78]。CE-MRI策略在結合常規X-射線乳房X線照相術使用時運行特別良好[Leach,etal.,(2005),Lancet,365,1769-78]。因為CE-MRI需要導致高成本的專家中心,5Q歲以下的篩查必須限于最高風險的那些個體。目前的CE-MRI檢查限定那些具有37BRCA1、BRCA2或p53突變或非常強的疾病家族史的個體進入。該篩查形式到較廣范圍的高風險患者的延伸將由基于基因的風險預測工具的提供極大地輔助。存在良好的支持該觀念的證據,S卩,早期發作的乳腺癌和在遺傳易患病的婦女中發生的癌癥比年老者中的癌癥生長更快,易患病的強度較小的婦女中的癌癥生長更快。這來自較年輕的婦女中較高間隔率癌癥的觀察,即,在充分篩查的群體中篩查訪問之間的間隔中發生的癌癥在較年輕的婦女中更高。因此,存在這樣的建議,即,篩查間隔,通過任何方法,對于較年輕的女性應當減少。這里存在的矛盾是利用更昂貴的方法的更頻繁的篩查似乎對于其中乳腺癌的總率比較低的年齡組是必需的。這里存在清楚的臨床需要來鑒定那些年輕個體,其是最強地容易早期發展疾病,并把他們引入更昂貴和廣泛的篩查方案。這里披露的提供乳腺癌風險的變異體可以用于處于特別高的發展乳腺癌風險的個體的鑒定。這樣的個體可能從早期和侵入性篩查程序中更受益,以便最大化癌癥的早期鑒定的可能性。治療目前,原發乳腺癌通過手術、佐劑化學療法、放射療法、隨后通過長期激素療法來治療。通常使用三種或四種療法的組合。伴隨疾病的相同階段的乳腺癌患者對佐劑化學療法可以具有非常不同的反應,導致總的治療結果的廣泛的變化。意見一致的指導方針(Consensusguidelines)(theStGalen和NIH標準)已經被開發用于確定乳腺癌患者對佐劑化學療法治療的適當性。然而,甚至轉移(新陳代謝)的最強的臨床和組織預測者也不能精確地預測乳腺腫瘤的臨床反應[Goldhirsch,etal.,(1998),JNatlCancerInst,90,1601—8;Eifel,etal.,(2001),JNatlCancerInst,93,979-89]。化學療法或激素療法僅減少轉移的風險大約1/3,然而,接受該治療的70-80%的患者在沒有它的情況下也將存活。因此,大多數的乳腺癌患者目前被提供無效或非必需的治療。對于預后測量的開發中的改進存在清楚的臨床需要,所述預后測量將允許臨床醫師制定更適當地將最佳受益的那些患者的治療。合理的是預期識別(預測)個體的遺傳誘因將揭示與它們的治療結果相關的信息并由此輔助合理的治療計劃。本發明的標記物,提供乳腺癌的風險,被預期用在該背景中。幾個先前的結果例證了該概念作為BRCA突變攜帶者的乳腺癌患者當用佐劑化學療法治療時似乎顯示出更好的臨床反應率和存活[Ch即puis,etal.,(2002),JMedGenet,39,608-10;Goffin,etal.,(2003),Cancer,97,527-36]。BRCA突變攜帶者對用于卵巢癌的鉑化學療法比非攜帶者表現出提高的反應[Cass,etal.,(2003),Cancer,97,2187-95]。類似的考慮可以應用于其中涉及的基因未知的易患病的患者。例如,滲入小葉乳腺癌(infiltratinglobularbreastcarcinoma)(ILBC)已知具有強家族成分,但是涉及的遺傳變異體還沒有被鑒定。具有ILBC的患者對常見的化學療法方案表現出較弱的反應[Mathieu,etal.,(2004),EurJCancer,40,342-51]。遺傳誘因模型不僅可以輔助治療策略的個性化,而且可以在這些策略的設計中起整體的作用。例如,BRCA1和BRCA2突變體腫瘤細胞已經被發現由于它們缺陷的DNA修復途徑而對聚(ADP-核糖)聚合酶(PARP)抑制劑非常敏感[Farmer,etal.,(2005),Nature,434,917-21]。這已經剌激了著眼于它們在BRCA攜帶者患者中特異性的應用的靶向PARP的小分子藥物的發展。從該實例可以清楚的是,遺傳誘因的知識可以鑒定藥物靶標(drugtargets),這導致與遺傳風險識別(預測)結合使用的個人化的化學治療方案的發展。類似地,本發明的標記物可以輔助耙向,例如,FGF10、MRPS30和/或FGFR2基因中的一個或多個的新型藥物的鑒定。癌癥化學療法眾所周知對正常組織尤其是高度增殖造血和腸上皮細胞區室具有劑量限制性副作用。可以預期基于遺傳的個體差異存在于正常組織對細胞毒性藥物的敏感性中。這些因素的理解可以輔助合理的治療計劃和被設計成保護正常組織免于化學療法的不利作用的藥物的開發。遺傳識別(geneticprofiling)也可以有助于改善的放射治療方法在經歷標準的放射治療方案的乳腺癌患者的組中,部分患者將經歷與正常可以忍受的輻射劑量的不利反應。急性反應包括紅斑、濕性脫屑(moistdesquamation)、水腫和放射性肺炎(radiationpne咖atitis)。包括毛細管擴張、水腫、肺纖維化和乳房纖維化的長期反應可以在放射治療后許多年發生。急性和長期反應均是發病率的重要來源并可能是致命的。在一個研究中,87%的患者被發現對放射治療具有一些不利的副作用,而11%具有嚴重的不利反應(LENT/S0MAGrade3-4);[Hoeller,etal.,(2003),IntJRadiatOncolBiolPhys,55,1013-8]。經歷對放射治療的不利反應的可能性主要是由于正常組織反應中的構成性個體差異,并且存在這些具有強遺傳成分的懷疑。幾個已知的乳腺癌誘因基因(例如,BRCA1、BRCA2、ATM)影響DNA雙鏈斷裂修復的途徑。DNA雙鏈斷裂是放射治療誘導的主要細胞毒性損害。這已經導致涉及通過攜帶屬于這些途徑的基因中的變異體對乳腺癌遺傳易患病的個體也可能處于遭受來自放射治療的過度的正常組織損害的較高風險。可以預期這里描述的提供乳腺癌的風險的遺傳變異體,例如通過FGF10、MRPS30和/或FGFR2基因中的一個或多個,可能用于鑒定處于對放射治療的不利反應的特定風險處的個體。群體中構成性放射敏感個體的存在意味著對于大多數患者群體的放射治療劑量率必須被限制,以便將不利反應的頻率保持在可接受的水平。因此,存在對可靠試驗的臨床需要,該可靠試驗可以鑒定處于提高的對于放射治療的不利反應風險中的個體。這樣的試驗將指出用于放射敏感的個體的保守或可替換的治療,而允許增加的放射治療劑量用于相對放射抵抗的大多數患者。已經估計通過試驗將乳腺癌患者簡單地分成放射敏感的、中間的和放射抵抗的類別而成為可能的劑量增加將導致局部腫瘤控制中大約35%的增加以及隨之的存活率的改進[Burnet,etal.,(1996),ClinOncol(RCollRadiol),8,25-34]。暴露于電離輻射是證明的有助于乳腺癌中腫瘤發生的因素[DumitrescuandCotarla,(2005),JCellMolMed,9,208-21]。已知的乳腺癌誘因基因編碼細胞對輻射誘導的DNA損傷的應答的途徑成分(pathwaycomponents)[NarodandFoulkes,(2004),NatRevCancer,4,665-76]。因此,存在這樣的擔憂,即,在放射治療領域內通過正常組織的輻射,第二原發乳腺腫瘤的風險可能被增加。對于BRCA攜帶者似乎沒有來自放射治療的任何可測量的增加的風險,然而它們對于第二原發腫瘤的風險已經特別高。存在證據表明第二原發腫瘤的風險在用放射治療處理的ATM和CHEK2基因的乳腺癌誘導等位基因的攜帶者中增力口[Bernstein,etal.,(2004),BreastCancerRes,6,R199—214;Broeks,etal.,(2004),BreastCancerResTreat,83,91-3]。預期來自放射治療(以及可能地,來自密集的乳房X線照相篩查)的第二原發腫瘤的風險將通過處理計劃階段期間從患者獲得精確的遺傳風險特征(geneticriskprofiles)而更好地限定。39第二預防大約30%診斷有1期或2期乳腺癌的患者將經歷它們的原始腫瘤的原位_局部(loco-regional)或遠緣轉移復發(distantmetastaticrecurrence)。當已經實施乳房_保存手術時,已經具有原發乳腺癌的患者也處于診斷有第二原發腫瘤的極大增加的風險中,在對側乳房或在同側乳房中。第二預防指的是用于預防復發或第二原發腫瘤發展的方法。目前使用的方法包括長期用他莫昔芬或另一SERM治療,單獨或可替換地使用芳香酶抑制劑,風險_減少的對側乳房的乳房切除術,以及風險_減少的卵巢切除術(在處于家族乳腺-卵巢癌風險中的患者中)。關于使用他莫昔芬的考慮已經在上面討論。利用風險-減少的手術選擇,清楚的是風險需要盡可能被量化,以便進行有見識的(informed)成本受益分析。存在一些指征,S卩,具有已知的對乳腺癌的遺傳誘因的患者比大多數患者進展更差。與非攜帶者相比,攜帶CHEK2基因1100delC變異體的患者具有估計的2.8-倍增加的遠緣轉移的風險和3.9-倍增加的疾病復發的風險[deBock,etal.,(2004),JMedGenet,41,731-5]。患有BRCA1結-陰性腫瘤的患者具有比不攜帶BRCA1突變的類似患者更大的轉移風險[Goffin,etal.,(2003),Cancer,97,527-36;Moller,etal.,(2002),IntJCancer,101,555-9;Eerola,etal.,(2001),IntJCancer,93,368-72]。遺傳識別可以因此用于幫助評估局部復發和轉移的風險,從而指導第二預防性治療的選擇。基于這里描述的變異體的遺傳識別可以在這點上使用。在一些實施方式中,這樣的識別(profiling)可以基于這里描述的一個或多個變異體。在其他實施方式中,這樣的識別可以包括一個或幾個其他已知的乳腺癌的遺傳風險因素。這樣的風險因素可以是充分確認的高外顯率風險因素,或者它們可以為一個或多個常見的先前已經描述的較低外顯率的風險因素(風險因子)(例如,染色體2ql4上的標記物(例如,標記物rs4848543或在與其連鎖不平衡中的標記物),染色體2q35上的標記物(例如,標記物rs13387042,或在與其連鎖不平衡中的標記物),以及染色體16上的標記物(例如,標記物rs3803662,或在與其連鎖不平衡中的標記物)。通常,具有原發腫瘤診斷的患者以0.7%的恒定年度發生率處于第二原發腫瘤的風險中[PetoandMack,(2000),NatGenet,26,411-4]。具有BRCA突變的患者對于第二原發腫瘤的風險顯著大于多數乳腺癌患者,其中絕對風險在40-60%的范圍內[Eastern,(1999),BreastCancerRes,1,14-7]。BRCA突變的攜帶者具有對于第二原發腫瘤的極大增加的風險[Stacey,etal.,(2006),PLoSMed,3,e217;Metcalfe,etal.,(2004),JClinOncol,22,2328-35]。在CHEK2基因中具有突變的患者具有估計的對側乳腺癌的5.7倍增加的風險[deBock,etal.,(2004),JMedGenet,41,731-5]。BARD1Cys557Ser變異體的攜帶者是2.7倍更可能診斷有第二原發腫瘤[Stacey,etal.,(2006),PLoSMed,3,e217]。遺傳風險識別可以用于評估患者中第二原發腫瘤的風險并將告知預防性測量應當是怎樣的侵入性的決定。本發明的方法診斷和篩查方法在一些實施方式中,本發明涉及通過檢測更頻繁地出現在乳腺癌受治療者或對于乳腺癌易感的受治療者中的遺傳標記物處的特定等位基因,來診斷或輔助診斷乳腺癌或對乳腺癌的易感性的方法。在特定的實施方式中,本發明是一種通過檢測至少一個多態標記物(例如,這里描述的標記物)的至少一個等位基因來確定對乳腺癌的易感性的方法。在其他實施方式中,本發明涉及一種通過檢測至少一個多態標記物的至少一個等位基因來診斷對乳腺癌的易感性的方法。本發明描述了這樣的方法,其中特定標記物的特定等位基因或單體型的檢測指示對乳腺癌的易感性。這樣的預測或預言分析也可以用來確定在與乳腺癌相關的癥狀發作前患者的預防性治療。在一些實施方式中,本發明涉及診斷的臨床應用方法,例如,通過醫學專業人員進行的診斷。在其他實施方式中,本發明涉及通過外行進行的易感性的診斷或確定方法。所述外行可以為基因型測定服務(genotypingservice)的顧客。所述外行也可以為基因型服務提供者,其在來自個體的DNA樣品上進行基因型分析,以便基于所述個體(即,所述顧客)的基因型狀態,提供與特定性狀或疾病的遺傳風險因素相關的服務。基因型測定技術(genotypingtechnologies)中的最近的技術進展,包括SNP標記物的高通量基因型測定,如分子倒位探針陣列技術(例如,AffymetrixGeneChip)和BeadArray技術(例如,IlluminaGoldenGate和Infinium測定),使得個體以相對低成本具有他們的直到一百萬SNP同時被評估的自己的基因組成為可能。所得到的基因型信息(其可以由個體獲得)可以與關于與多種SNP相關的疾病或性狀風險的信息相比較,包括來自公共文獻和科技出版物的信息。如這里描述的疾病_相關的等位基因的診斷應用可以由此例如由個體進行,這是通過健康專業人員基于臨床測試結果進行他的/她的基因型數據分析,或者由第三方進行,包括基因型服務提供者。所述第三方還可以為解釋來自顧客的基因型信息以提供與特定遺傳風險因素(包括這里描述的遺傳標記物)相關的服務的服務提供者。換句話說,遺傳風險的易感性的診斷或確定可以基于關于個體的基因型狀況的信息和關于由特定遺傳風險因素(如,特定SNP)提供的風險的知識,由健康專業人員、遺傳顧問、提供基因型測定服務的第三方、提供風險評估服務的第三方或由外行(例如,所述個體)來進行。在本發明的上下文中,術語"診斷"、"診斷易感性"和"確定易感性"意味著涉及任何可利用的診斷方法,包括上述那些。在一些實施方式中,包含來自個體的基因組DNA的樣品被收集。這樣的樣品可以例如為口腔拭樣(buccalswab)、唾液樣品、血液樣品、或包含基因組DNA的其他合適的樣品,如這里進一步描述的。隨后利用技術人員可利用的任何常見技術,如高通量陣列技術來分析基因組DNA。來自這樣的基因型測定的結果被存儲在便利的數據存儲單元中,如數據載體,包括計算機數據庫、數據存儲盤,或通過其他便利的數據存儲裝置被存儲。在一些實施方式中,所述計算機數據庫是對象數據庫、關系數據庫或關系后數據庫(post-relationaldatabase)。所述基因型數據隨后被分析一些變異體的存在,所述變異體已知為特定人類狀況的易感變異體,如這里描述的遺傳變異體。基因型數據可以利用任何便利的數據查詢方法從所述數據存儲單元檢索。計算個體的由特定基因型提供的風險可以基于比較所述個體的基因型與對于所述基因型的先前確定的風險(例如,表達為相對風險(RR)或優勢比(OR)),例如對于特定疾病或性狀(如乳腺癌)的風險中的變異體的雜和攜帶者。對于所述個體計算的風險可以為與具有匹配的性別和種族的平均群體相比,個人或個人的特定基因型的相對風險。平均群體風險可以利用來自參考群體的結果被表達為不同基因型的風險的加權平均值,并且然后可以進行計算相對于所述群體的基因型組的風險的合適計算。可替換地,對于個體的風險是基于特定基因型的比較,如標記物的風險中的等位基因的雜合攜帶者與風險中的等位基因的非攜帶者的比較。在一些實施方式中,利用群體平均值可能是更方便的,因為它提供了對于使用者容易解釋的測量值,即,基于他的/她的基因型,給出與群體的平均值相比個體的風險的測量值。對于消費者,估計的計算的風險可以經由網站,優選安全的網站獲得。在一些實施方式中,服務提供者將在提供的服務中包括以下所有的步驟從消費者提供的樣品分離基因組DNA、進行分離的DNA的基因型測定、基于所述基因型數據計算遺傳風險、以及向消費者報告風險。在一些其他實施方式中,所述服務提供者將在服務中包括個體的基因型數據的解釋,即,基于個體的基因型數據對于特定遺傳變異體的風險評估。在一些其他實施方式中,所述服務提供者可以包括這樣的服務,其包括基因型測定服務和基因型數據的解釋,起始于來自所述個體(消費者)的分離的DNA的樣品。對于多風險變異體的綜合風險可以利用標準方法來進行。例如,假定乘法模型,即,假定個體風險變異體的風險相乘以建立綜合效果,允許用于多個標記物的綜合風險的直接計算。此外,在一些其他實施方式中,本發明涉及診斷或輔助診斷對乳腺癌的降低的易感性的方法,所述方法是通過檢測看起來在乳腺癌患者中比在沒有診斷有乳腺癌的個體中或一般群體中頻率較少的特定遺傳標記物等位基因或單體型。如這里描述和例證的,特定標記物等位基因或單體型(例如,染色體5pl2和10q26上的標記物,例如如表12、表13和表14中列出的標記物和單體型,例如標記物rs4415084、rsl0941679和rs1219648,以及在與其連鎖不平衡中的標記物)與乳腺癌相關。在一個實施方式中,所述標記物等位基因或單體型是提供對乳腺癌的顯著風險或易感性的標記物等位基因或單體型。在另一個實施方式中,本發明涉及一種診斷人類個體中對乳腺癌的易感性的方法,所述方法包括確定從所述個體獲得的核酸樣品中至少一個多態標記物的至少一個等位基因的存在或缺乏,其中所述至少一個多態標記物選自由表12、表13和表14中列出的多態標記物,以及在與其連鎖不平衡中的標記物組成的組。在另一個實施方式中,本發明涉及診斷人類個體中對乳腺癌的易感性的方法,所述方法是通過篩查如在表12、表13或表14中列出的至少一個標記物等位基因或單體型,或在與其連鎖不平衡中的標記物。在另一個實施方式中,所述標記物等位基因或單體型與其在健康受治療者(對照,如群體對照)中其存在的頻率相比,在具有或對乳腺癌易感的(受影響的)受治療者中以更高頻率存在。在一些實施方式中,所述至少一個標記物等位基因或單體型的關聯的顯著性的特征在于P值<0.05。在其他實施方式中,關聯的顯著性的特征在于較小的p值,如〈0.01、<0.001、<0.0001、<0.00001、<0.000001、<0.0000001、<0.00000001或<0.000000001。在這些實施方式中,至少一個標記物等位基因或單體型的存在指示對乳腺癌的易感性。這些診斷方法涉及檢測與乳腺癌相關的至少一個標記物等位基因或單體型的存在或缺乏。這里描述的單體型包括在各種遺傳標記物(如,SNP,微隨體,或其他遺傳變異體)處等位基因的組合。構成特定單體型的特定遺傳標記物等位基因的檢測可以通過多種這里描述的和/或本領域已知的方法進行。例如,遺傳標記物可以在核酸水平上(例如,通過直接核苷酸測序或通過本領域技術人員已知的其他方式)被檢測,或者如果遺傳標記物影響由乳腺癌-相關的核酸編碼的蛋白質的編碼序列(例如,通過蛋白質測序或通過利用識別這樣的蛋白質的抗體的免疫測定),可以在氨基酸水平上被檢測。本發明的標記物等位基因或單體型對應于與乳腺癌相關的基因組DNA序列的片段。這樣的片段包括所討論的多肽標記物或單體型的DNA序列,但是也可以包括在與所述標記物或單體型強LD(連鎖不平衡)中的DNA區段。在一個實施方式中,這樣的區段包括在與所述標記物或單體型LD中的區段(如通過大于0.1的r2值和/或ID'I>0.8確定的)。在一個實施方式中,對乳腺癌易感性的診斷可以利用雜交方法實現(參見CurrentProtocolsinMolecularBiology,Ausubel,F.etal.,eds.,JohnWiley&Sons,包括所有的補充物)。基因組DNA、RNA或cDNA的來自測試受治療者或個體的的生物樣品("測試樣品")從懷疑患有乳腺癌、具有對乳腺癌的易感性、或易患乳腺癌的受治療者("測試受治療者")獲得。所述受治療者可以為成年人、兒童或胎兒。所述測試樣品可以來自包含基因組DNA的任何來源,如血液樣品、羊水樣品、腦脊液樣品、或來自皮膚、肌肉、口腔或結膜粘膜、胎盤、胃腸道或其他器官的組織樣品。來自胎兒細胞或組織的DNA的測試樣品可以通過合適的方法獲得,如通過羊膜穿剌或絨毛膜絨毛取樣。DNA、RNA、或cDNA樣品隨后被檢查。特定標記物等位基因的存在可以通過對特定等位基因特異性的核酸探針的序列-特異性雜交來顯示。更多特定標記物等位基因或特定單體型的存在可以通過利用幾個序列-特異性核酸探針來顯示,每個對于特定等位基因是特異性的。在一個實施方式中,單體型可以通過對于所述特定單體型特異性的單一核酸探針來顯示(即,特異性雜交到包含以所述單體型為特征的特定標記物等位基因的DNA鏈)。序列-特異性探針可以直接雜交到基因組DNA、RNA、或cDNA。如這里所用的,"核酸探針"可以為雜交到互補序列的DNA探針或RNA探針。本領域技術人員將知道如何設計這樣的探針以便序列特異性雜交僅在如果特定等位基因存在于來自測試樣品的基因組序列中時將發生。本發明也可以被簡化為利用任何便利的基因型測定方法實施,包括用于測定特定多態標記物的基因型的商業上可獲得的技術和方法。為了診斷對乳腺癌的易感性,雜交樣品可以通過使包含乳腺癌-相關的核酸的測試樣品如基因組DNA樣品與至少一個核酸探針接觸來形成。用于檢測mRNA或基因組DNA的探針的非限制性實例是能夠雜交到這里描述的mRNA或基因組DNA序列的標記的核酸探針。所述核酸探針可以為,例如,全長核酸分子,或其一部分,如長度為至少15、30、50、100、250或500個核苷酸的寡核苷酸,其足以在嚴格的條件下特異性地雜交于合適的mRNA或基因組DNA。例如,所述核酸探針可以包括包含表12、表13和表14中列出的標記物(SEQIDNO:1-237)的核苷酸序列的全部或部分,或包含FGF10、MRPS30、HCN1或FGFR2基因的核苷酸序列或其片段,如這里描述的,可選地包含這里描述的標記物的至少一個等位基因,或者這里描述的至少一個單體型,或者所述探針可以為這樣的序列的互補序列。在特定的實施方式中,所述核酸探針為這樣的核苷酸序列的一部分,其為包含表12、表13和表14中的任何一個中列出的標記物(SEQIDNO:1-237)的核苷酸序列,或者包含FGF10、MRPS30、HCN1和FGFR2基因的核苷酸序列或其片段,如這里描述的,可選地包含這里描述的標記物的至少一個等位基因,或者一個多態標記物的至少一個等位基因或包含這里描述的至少一個多態標記物的單體型,或者所述探針可以為這樣的序列的互補序列。用在本發明的診斷分析(diagnosticassays)中的其他合適的探針在這里描述。雜交可以通過本領域技術人員熟知的方法進行(參見,例如,CurrentProtocolsinMolecularBiology,Ausubel,F.etal.,eds.,JohnWiley&Sons,包括所有的補充物)。在一個實施方式中,雜交指的是特異性雜交,即,沒有錯配的雜交(精確的雜交)。在一個實施方式中,用于特異性雜交的雜交條件是高度嚴格的。特異性雜交,如果存在,利用標準方法來檢測。如果特異性雜交存在于核酸探針與測試樣品中的核酸之間,則所述樣品包含互補于存在于所述核酸探針中的核苷酸的等位基因。所述方法(過程)可以重復用于本發明的任何標記物,或者構成本發明的單體型的標記物,或者多重探針可以同時用于每次檢測多于一個的標記物等位基因。還可以設計包含特定單體型的多于一個標記物等位基因的單一探針(例如,包含互補于構成特定單體型的標記物的2、3、4、5或全部的等位基因的探針)。樣品中單體型的特定標記物的檢測表明所述樣品的來源具有特定單體型(如,單體型)并因此對于乳腺癌是易感的。在一個優選的實施方式中,利用包含在其3'末端的熒光部分或基團和在其5'末端的猝滅劑(quencher)的檢測寡核苷酸探針和增強子寡核苷酸的方法被采用,如Kutyavinetal.(NucleicAcidRes.34:el28(2006))描述的。所述熒光部分可以為GigHarborGreen或YakimaYellow,或者其他合適的熒光部分。所述檢測探針被設計成雜交到包含要被檢測的SNP多態性的短核苷酸序列。優選地,所述SNP在從末端殘基到距離所述檢測探針的3'端-6個殘基的任何地方。所述增強子為雜交到3'相對于檢測探針的DNA模板的短寡核苷酸探針。所述探針被設計成使得單一核苷酸間隙存在于檢測探針與增強子核苷酸探針之間(在兩者均連接到模板時)。所述間隙形成被核酸內切酶,如核酸內切酶IV識別的合成無堿基(abasic)位點。所述酶從完全互補的檢測探針剪切下染料,但是不剪切包含錯配的檢測探針。因此,通過測量釋放的熒光部分的熒光,可以進行由檢測探針的核苷酸序列限定的特定等位基因的存在的評估。所述檢測探針可以為任何合適的大小,雖然優選所述探針較短。在一個實施方式中,所述探針的長度為5-100個核苷酸。在另一個實施方式中,所述探針的長度為10-50個核苷酸,并且在另一個實施方式中,所述探針的長度為12-30個核苷酸。所述探針的其他長度是可能的并在本領域普通技術人員的范圍內。在一個優選的實施方式中,包含SNP多態性的DNA模板在檢測前通過聚合酶鏈反應(PCR)來擴增。在這樣的實施方式中,擴增的DNA用作用于檢測探針和增強子探針的模板。檢測探針、增強子探針、和/或用于通過PCR擴增模板的引物的一些實施方式包括修飾的堿基的應用,包括修飾的A和修飾的G。修飾的堿基的應用可以用于調節核苷酸分子(探針和/或引物)與模板DNA的解鏈溫度,例如用于提高包含低百分比的G或C堿基的區域中的解鏈溫度,其中可以使用能夠與其互補的T形成三個氫鍵的修飾的A,或者用于降低包含高百分比的G或C堿基的區中的解鏈溫度,例如通過利用在雙鏈DNA分子中與其互補的C堿基形成兩個氫鍵的修飾的G堿基。在優選的實施方式中,修飾的堿基用在檢測核苷酸探針的設計中。本領域技術人員已知的任何修飾的堿基可以在這些方法中被選擇,并且基于這里的教導和如技術人員已知的從商業來源可獲得的已知堿基,合適的堿基的選擇完全在技術人員的范圍內。此外,或可替換地,除了這里描述的雜交方法中的核酸探針之外或代替所述核酸探針,還可以使用肽核酸(PNA)探針。PNA是具有肽樣的無機骨架,如N-(2-氨基乙基)甘氨酸單位的DNA模擬物,具有經由亞甲基羰基鏈接附著于所述甘氨酸氮的有機堿基(A、G、C、T或U)(參見,例如,Nielsen,P.,etal.,Bioconjug.Chem.5:3-7(1994))。PNA探針可以被設計成特異性雜交于懷疑包含與乳腺癌相關的一個或多個標記物等位基因或單體型的樣品的分子。PNA探針的雜交由此可以診斷乳腺癌或對乳腺癌的易感性。在本發明的一個實施方式中,包含從所述受治療者獲得的基因組DNA的測試樣品被收集,并且聚合酶鏈反應(PCR)被用于擴增包含本發明的一個或多個標記物或單體型的片段。如這里描述的,與乳腺癌相關的特定標記物等位基因或單體型的鑒定可以利用各種方法(例如,序列分析,通過限制性消化進行的分析,特異性雜交,單鏈構象多態性分析(測定)(SSCP)、電泳分析等)來實現。在另一個實施方式中,診斷通過表達分析來實現,例如通過利用定量PCR(動力熱循環)。該技術可以,例如,利用商業上可獲得的技術,如TaqMan(A卯liedBiosystems,FosterCity,CA)。所述技術可以評估由與乳腺癌相關的核酸編碼的多肽或剪接變異體的表達或組成的改變的存在。此外,所述變異體的表達可以被量化為物理上或功能上的差異。在本發明的另一方法中,如果等位基因導致限制性位點相對于參考序列的形成或消除,則通過限制性消化進行的分析可以用來檢測特定等位基因。限制性片段長度多態性(RFLP)分析可以例如如在CurrentProtocolsinMolecularBiology上文中描述的來進行。相關DNA片段的消化模式表明樣品中特定等位基因的存在或缺乏。序列分析還可以用于檢測與乳腺癌相關的特異性等位基因或單體型(例如,表12、表13和表14中的多態標記物(SEQIDNO:1-237)和在與其連鎖不平衡中的標記物)。因此,在一個實施方式中,特定標記物等位基因或單體型的存在或缺乏的確定包括從受治療者或個體獲得的DNA或RNA的測試樣品的序列分析。PCR或其他合適的方法可以用于擴增與乳腺癌相關的核酸的一部分,并且特異性等位基因的存在隨后可以通過對樣品中基因組DNA的多態位點(或者單體型中的多個多態位點)進行測序而直接加以檢測。等位基因-特異性寡核苷酸也可以用于檢測與乳腺癌相關的核酸中特定等位基因的存在(例如,表12、表13和表14中的多態標記物,和在與其連鎖不平衡中的標記物),這是通過使用具有等位基因-特異性寡核苷酸(AS0)探針的擴增的寡核苷酸的斑點印跡雜交(斑點雜交)(參見,例如,Saiki,R.etal.,Nature,324:163-166(1986))。"等位基因_特異性寡核苷酸"(這里也稱為"等位基因_特異性寡核苷酸探針")是大約1050個堿基對或大約1530堿基對的寡核苷酸,其特異性雜交于與乳腺癌相關的核酸,并且其包含在多態位點處(例如,這里描述的標記物或單體型)的特異性等位基因。對于與乳腺癌相關的一個或多個特定核酸特異性的等位基因-特異性寡核苷酸探針可以利用標準方法來制備(參見,例如,CurrentProtocolsinMolecularBiology,上文)。PCR可以用來擴增期望的區。包含擴增的區的DNA可以利用標準方法進行斑點印跡(參見,例如,CurrentProtocolsinMolecularBiology,上文),并且所述印跡可以與寡核苷酸探針接觸。所述探針與所述擴增的區的特異性雜交的存在可以隨后被檢測。等位基因-特異性寡核苷酸探針與來自受治療者的DNA的特異性雜交是與癌癥,包括乳腺癌相關的多態位點處的特異性等位基因的指征(參見,例如,Gibbs,R.etal.,NucleicAcidsRes.,17:2437-2448(1989)和W093/22456)。在加入這樣的類似物如閉鎖的核酸(LNA)的情況下,引物和探針的大小可以被減小到8個堿基。LNA是新類別的雙環DNA類似物,其中呋喃糖環中的2'和4'位置經由0-亞甲基(氧-LNA)、S-亞乙基(硫代-LNA)、或氨基亞甲基(氨基-LNA)部分被連接。對于這些LNA變異體的全部共同的是朝向互補的核酸的親和力,其迄今為止對于DNA類似物是最高報道的。例如,特定的全部氧-LNA九聚物已經顯示當在與互補的DNA或RNA的復合體中時分別具有64t:和74°C的解鏈溫度(Tm),與對于相應的DNA九聚物的DNA和RNA的28°C相對。Tm的顯著增加也當LNA單體與標準DNA或RNA單體組合使用時獲得。對于引物和探針,依賴于LNA單體被包括的地方(例如,3'端,5'端,或中間),Tm可以被顯著地提高。在另一個實施方式中,互補于來自受治療者的靶核酸序列區段的寡核苷酸探針的陣列可以用于鑒定與乳腺癌相關的核酸(例如,表12、表13和表14中的多態標記物(SEQIDNO:1-237),以及在與其連鎖不平衡中的標記物)中的多態性。例如,可以使用寡核苷酸陣列。寡核苷酸陣列典型地包括多個不同的寡核苷酸探針,其在不同的已知位置偶聯至底物的表面。這些寡核苷酸陣列,還描述為"GenechipsTM"在本領域中通常已經被描述(參見,例如,美國專利第5,143,854號、PT專利公開第WO90/15070和92/10092號)。這些陣列通常可以利用機械合成方法或光直接合成方法,其并入光刻方法和固相寡核苷酸合成方法的組合,或者通過本領域技術人員已知的其他方法來生產(參見,例如,Bier,F.F.,etal.AdvBiochemEngBiotechnol109:433-53(2008);Hoheisel,J.D.,NatRevGenet7:200-10(2006);Fan,J.B.,etal.MethodsEnzymol410:57-73(2006);Raqoussis,J.&Elvidge,G.,ExpertRevMolDiagn6:145-52(2006);Mockler,T.C.,etalGenomics85:1_15(2005),以及其中列舉的參考文獻,其每個的全部教導以引用方式并入本文中)。用于多態性檢測的寡核苷酸陣列的制備和應用的許多另外的描述可以例如在US6,858,394、US6,429,027、US5,445,934、US5,700,637、US5,744,305、US5,945,334、US6,054,270、US6,300,063、US6,733,977、US7,364,858、EP619321、和EP373203中找到,其全部教導以引用方式并入本文中。本領域技術人員可獲得的核酸分析的其他方法可以被用來檢測與乳腺癌相關的多態位點處的特定等位基因。代表性的方法包括,例如,直接手工測序(ChurchandGilbert,Proc.Natl.Acad.Sci.USA,81:1991-1995(1988);Sanger,F.,etal.,Proc.Natl.Acad.Sci.USA,74:5463-5467(1977);Beavis,etal.,U.S.PatentNo.5,288,644);自動化的熒光測序;單鏈構象多態性分析(SSCP);鉗制變性凝膠電泳(clampeddenaturinggelelectrophoresis)(CDGE);變性梯度凝膠電泳(DGGE)(Sheffield,V.,etal.,Proc.Natl.Acad.Sci.USA,86:232-236(1989)),遷移率變動分析(Orita,M.,etal.,Proc.Natl.Acad.Sci.USA,86:2766-2770(1989)),限制性內切酶分析(Flavell,R.,etal.,Cell,15:25-41(1978);Geever,R.,etal.,Proc.Natl.Acad.Sci.USA,78:5081—5085(1981));異源雙鏈體分析;化學錯配剪切(CMC)(Cotton,R.,etal.,Proc.Natl.Acad.Sci.USA,85:4397-4401(1985));核糖核酸酶保護分析(Myers,R.,etal.,Science,230:1242-1246(1985);識別核苷酸錯配的多肽如E.colimutS蛋白的應用;以及等位基因特異性PCR。在本發明的另一個實施方式中,在其中本發明的遺傳標記物或單體型導致多肽的組成或表達改變的那些情況中,乳腺癌或對乳腺癌的易感性的診斷可以通過檢驗由與乳腺癌相關的核酸編碼的多肽的表達和/或組成來進行。因此,在其中本發明的遺傳標記物或單體型導致多肽的組成或表達改變的那些情況中(例如FGF10、MRPS30、HCN1和FGFR2基因中的一個或多個),對乳腺癌的易感性的診斷可以通過檢驗這些多肽之一或由與乳腺癌相關的核酸編碼的另一多肽的表達和/或組成來進行。顯示與乳腺癌的關聯的本發明的單體型和標記物可以通過它們對這些附近的基因中的一個或多個的影響起作用。影響這些基因的可能的機制包括,例如,對轉錄的影響、對RNA剪接的影響、改變mRNA的可替換的剪接形式的相對量、對RNA穩定性的影響、對從細胞核到細胞質的轉運的影響、以及對翻譯的效率和準確度的影響。因此,在另一個實施方式中,顯示與乳腺癌的關聯的本發明的變異體(標記物或單體型)影響附近基因的表達。熟知的是影響基因表達的調節元件可以位于距離基因的啟動子區的第十或甚至成百的kb(千對堿基)的位置。通過分析本發明的至少一個多態標記物的至少一個等位基因的存在或缺乏,由此可以評估這樣的附近基因的表達水平。由此預期本發明的標記物或單體型的檢測可以用于評估FGF10、MRPS30、HCN1和FGFR2基因中的一個或多個的表達。各種方法可以用于檢測蛋白表達水平,包括酶聯免疫吸附分析(ELISA)、蛋白質印跡、免疫沉淀反應和免疫熒光法。來自受治療者的測試樣品被評估由與乳腺癌相關的核酸編碼的多肽的表達改變和/或組成改變的存在。由與乳腺癌相關的核酸編碼的多肽的表達改變可以為,例如,定量的多肽表達(即,產生的多肽的量)中的改變。由與乳腺癌相關的核酸編碼的多肽的組成改變是定性的多肽表達(例如,突變體多肽的表達或不同剪接變異體的表達)中的改變。在一個實施方式中,對乳腺癌的易感性的診斷通過檢測由與乳腺癌相關的核酸編碼的特定剪接變異體或剪接變異體的特定模式(例如,編碼FGFIO、MRPS30、和HCN1基因的核酸)來進行。兩種這樣的改變(定量和定性)也均可以存在。如這里所使用的,多肽表達或組成中的"改變"指的是與對照樣品中多肽的表達或組成相比,測試樣品中表達或組成的改變。對照樣品是對應于測試樣品(即,來自相同類型的細胞)的樣品,并且來自不受乳腺癌影響和/或沒有對乳腺癌的易感性的受治療者。在一個實施方式中,對照樣品來自不具有如這里描述的標記物等位基因或單體型的受治療者。類似地,與對照樣品相比,測試樣品中一個或多個不同的剪接變異體的存在,或測試樣品中顯著不同量的不同剪接變異體的存在可以指示對乳腺癌的易感性。在其中等位基因相對于對照樣品中的參考改變剪接位點的情況下,與對照樣品相比,測試樣品中多肽表達或組成的改變可以是特異性等位基因的指征。檢驗由核酸編碼的多肽的表達或組成的各種方式對本領域技術人員來說是已知的并可以被使用,包括分光鏡檢查、比色法、電泳、等電點聚焦、和免疫測定(例如,Davidetal.,U.S.Pat.No.4,376,110)如免疫印跡(參見,例如,CurrentProtocolsinMolecularBiology,particularlych即ter10,上文)。例如,在一個實施方式中,可以使用能夠結合到由與乳腺癌相關的核酸編碼的多肽的抗體(例如,具有可檢測標記的抗體)。抗體可以為多克隆或單克隆的。可以使用完整抗體,或其片段(例如,Fv、Fab、Fab'、F(ab')2)。關于所述探針或抗體,術語"標記的"旨在包括通過將可檢測的物質偶聯(即,物理地連接)至所述探針或抗體來直接標記所述探針或抗體,以及通過與被直接標記的另一試劑反應來間接標記所述探針或抗體。間接標記的實例包括利用標記的二級抗體(例如,熒光標記的二級抗體)和用生物素末端-標記DNA探針使得其可以用熒光標記的抗生蛋白鏈菌素檢測而檢測初級抗體。在該方法的一個實施方式中,將測試樣品中由與乳腺癌相關的核酸編碼的多肽(例如,FGF10、MRPS30、和HCN1)的水平或量與對照樣品中的多肽的水平或量進行比較。高于或低于對照樣品中多肽的水平或量,使得差異在統計學上顯著的測試樣品中的多肽的水平或量是由所述核酸編碼的多肽的表達改變的指征,并且診斷負責造成表達差異的特定等位基因或單體型。可替換地,將測試樣品中多肽的組成與對照樣品中多肽的組成進行比較。在另一個實施方式中,測試樣品和對照樣品中多肽的水平或量和組成可以被評估。在另一個實施方式中,對乳腺癌的易感性的診斷通過檢測本發明的至少一個標記物或單體型(例如,表12、表13和表14中列出的標記物的相關等位基因(SEQIDNO:1-237),以及在與其連鎖不平衡中的標記物)連同另外的基于蛋白質的、基于RNA的或基于DNA的分析來進行。本發明的方法還可以結合受治療者的家族史和風險因素(例如,環境風險因素、生活方式風險因素)的分析來使用。試劑盒可用于本發明的方法中的試劑盒包括這里描述的方法的任何一個中使用的組分(components),包括例如,用于核酸擴增的引物、雜交探針、限制性酶(例如,用于RFLP分析)、等位基因_特異性寡核苷酸、結合到由如這里描述的本發明的核酸編碼的改變的多肽(例如,包含本發明的至少一個多態標記物和/或單體型的基因區段)或結合到由如這里描述的本發明的核酸編碼的非改變的(天然)多肽的抗體,用于擴增與乳腺癌相關的核酸的裝置、用于分析與乳腺癌相關的核酸的核酸序列的裝置、用于分析由與乳腺癌相關的核酸編碼的多肽的氨基酸序列的裝置等。所述試劑盒可以例如包括必需的緩沖劑、用于擴增本發明的核酸的核酸引物(例如,如這里描述的一個或多個多態標記物)、以及用于利用這樣的引物和必需的酶(例如,DNA聚合酶)擴增的片段的等位基因-特異性檢測的試劑。此外,試劑盒可以提供用于與本發明的方法結合使用的分析的試劑,例如,用于乳腺癌診斷分析的試劑。在一個實施方式中,本發明是用于分析來自受治療者的樣品以檢測受治療者中乳腺癌或對乳腺癌的易感性的存在的試劑盒,其中所述試劑盒包括選擇性檢測個體的基因組中本發明的至少一個多態性的至少一個等位基因所必需的試劑。在特定的實施方式中,所述試劑包括至少一個連續寡核苷酸,所述寡核苷酸雜交到包含本發明的至少一個多態性的所述個體的基因組的片段。在另一個實施方式中,所述試劑包括至少一對寡核苷酸,其雜交到從受治療者獲得的基因組區段的相反鏈,其中每個寡核苷酸引物對被設計成選擇性擴增包括至少一個多態性的個體的基因組的片段,其中所述多態性選自由如表12、表13和表14中(SEQIDNO:1-237)列出的多態性,以及在與其連鎖不平衡中的多態標記物組成的組。在又一個實施方式中,所述片段的大小為至少20個堿基對。這樣的寡核苷酸或核酸(例如,寡核苷酸引物)可以利用作為乳腺癌的指征的多態性(例如,SNP或微隨體)側翼的核酸序列的部分來設計。在另一個實施方式中,所述試劑盒包括能夠等位基因-特異性檢測與乳腺癌相關的一個或多個特異性多態標記物或單體型的一個或多個標記的核酸,以及用于檢測所述標記(label)的試劑。合適的標記包括,例如,放射性同位素、熒光標記、酶標記、酶輔因子標記、磁性標記、自旋標記、表位標記。在特定的實施方式中,待通過所述試劑盒的試劑檢測的多態標記物或單體型包括選自由表12、表13和表14中的標記物組成的組中的一個以上標記物、兩個以上標記48物、三個以上標記物、四個以上標記物、或五個以上標記物。在另一個實施方式中,待檢測的所述標記物選自標記物rs10941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648。在另一個實施方式中,待被檢測的所述標記物或單體型包括來自在與表12、表13和表14中列出的標記物組成的標記物的組中的至少一個強連鎖不平衡(如通過大于0.2的r2值限定的)中的標記物的組中的至少一個標記物。在又一個實施方式中,待被檢測的標記物或單體型包括至少一個選自由標記物rs10941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648,以及在與其連鎖不平衡中的標記物組成的標記物的組中的至少一個標記物。在一個優選的實施方式中,用于檢測本發明的標記物的試劑盒包括檢測寡核苷酸探針(其雜交到包含待檢測的SNP多態性的模板DNA的區段)、增強子寡核苷酸探針和核酸內切酶。所述檢測寡核苷酸探針包括在其3'末端的熒光部分或基團和在其5'末端的猝滅劑,并且采用增強子寡核苷酸,如Kutyavinetal.(NucleicAcidRes.34:el28(2006))所描述的。所述熒光部分可以為GigHarborGreen或YakimaYellow,或其他合適的熒光部分。檢測探針被設計成雜交到包括待被檢測的SNP多態性的短核苷酸序列。優選地,所述SNP在從來自檢測探針的3'端的末端殘基到-6殘基的任何地方。增強子為雜交到3'相對于所述檢測探針的DNA模板的短寡核苷酸探針。所述探針被設計成使得在兩者均結合到模板時在檢測探針與增強子核苷酸探針之間存在單一的核苷酸間隙。所述間隙造成被核酸內切酶,如核酸內切酶IV識別的合成無堿基位點。所述酶從完全互補的檢測探針切下染料,但是不能切下包含錯配的檢測探針。因此,通過測量釋放的熒光部分的熒光,由檢測探針的核苷酸序列限定的特定等位基因的存在的評估可以被進行。所述檢測探針可以為任何合適的大小,雖然優選地,所述探針較短。在一個實施方式中,所述探針的長度為5-100個核苷酸。在另一個實施方式中,所述探針的長度為10-50個核苷酸,并且在另一個實施方式中,所述探針的長度為12-30個核苷酸。所述探針的其他長度是可能的并在本領域普通技術人員的技術范圍內。在優選的實施方式中,包含SNP多態性的DNA模板在檢測前通過聚合酶鏈反應(PCR)來擴增,并且用于這樣的擴增的引物被包括在試劑盒(reagentkit)中。在這樣的實施方式中,擴增的DNA用作用于檢測探針和增強子探針的模板。用于通過PCR進行的模板擴增的檢測探針、增強子探針、和/或引物的一些實施方式包括使用修飾的堿基,包括修飾的A和修飾的G。修飾的堿基的應用可以用于調節所述核苷酸分子(探針和/或引物)與模板DNA的解鏈溫度,例如,用于在包含低百分比的G或C堿基的區域增加解鏈溫度,其中可以使用具有與其互補的T形成三個氫鍵的能力的修飾的A,或者用于降低包含高百分比的G或C堿基的區域中的解鏈溫度,例如通過利用與它們的互補的C堿基在雙鏈DNA分子中僅形成兩個氫鍵的修飾的G堿基。在優選的實施方式中,修飾的堿基在檢測核苷酸探針的設計中被使用。在這些方法中可以選擇技術人員已知的任何修飾的堿基,并且基于這里的教導和如技術人員已知的可從商業來源獲得的已知堿基,合適的堿基的選擇完全在技術人員的范圍內。在這樣的實施方式之一中,標記物或單體型的存在指示對乳腺癌的易感性(增加的易感性或降低的易感性)。在另一個實施方式中,所述標記物或單體型的存在是對乳腺癌治療藥劑的反應的指征。在另一個實施方式中,所述標記物或單體型的存在是乳腺癌預后49的指征。在又一個實施方式中,所述標記物或單體型的存在指示乳腺癌治療的進展。這樣的治療可以包括通過手術、藥物或通過其他方式(如生活方式改變)進行的干涉。治療藥劑本發明的變異體(例如,本發明的標記物和/或單體型,如表12、表13和表14中列出的標記物,如,rs4415084、rsl0941679、rs1219648)可以用來鑒定用于乳腺癌的新型治療靶標。例如,包含與乳腺癌相關的變異體(標記物和/或單體型)的基因,或在與乳腺癌相關的變異體(標記物和/或單體型)連鎖不平衡中的基因(例如,FGFIO、MRPS30、HCN1和FGFR2基因中的一個或多個),或它們的產物,以及直接或間接由這些變異體基因或它們的產物調節或直接或間接與這些變異體基因或它們的產物相互作用的基因或它們的產物,可以靶向用于治療藥劑的開發以治療乳腺癌,或防止或延遲與乳腺癌相關的癥狀的發作。治療藥劑例如可以包括小非蛋白和非核酸分子、蛋白質、肽、蛋白片段、核酸(DNA、RNA)、PNA(肽核酸)、或它們的衍生物或模擬物(其可以調節所述耙基因或它們的基因產物的功能和/或水平)中的一個或多個。本發明的核酸和/或變異體,包含本發明的一個或多個變異體的核酸(例如,具有如SEQIDNO:1-237中的任何一個中列出的序列的核酸,或其片段)或包含它們的互補序列的核酸可以用作反義構建體(constructs)以控制細胞、組織或器官中的基因表達。與反義技術相關的方法對技術人員是熟知的,并且在AntisenseDrugTechnology:Principles,Strategies,andApplications,Crooke,ed.,MarcelDekkerInc.,NewYork(2001)中描述和綜述。通常,反義核酸分子被設計成互補于由基因表達的mRNA的區,使得反義分子雜交到mRNA,由此阻斷mRNA翻譯為蛋白質。反義寡核苷酸的幾個類別對于本領域技術人員來說是已知的,包括剪切物和阻斷物。前者結合到靶RNA位點,活化細胞內核酸酶(例如,核糖核酸酶H或核糖核酸酶L),其剪切靶RNA。阻斷物結合到靶RNA,通過核糖體的位阻抑制蛋白質翻譯。阻斷物的實例包括核酸、嗎啉化合物、閉鎖的核酸和膦酸甲酯(Thompson,DrugDiscoveryToday,7:912-917(2002))。反義寡核苷酸直接用作治療藥劑,并且還用于確定和確認基因功能,例如通過基因敲除或基因拆除(knock-down)實驗。反義技術被進一步描述在Laveryetal.,Curr.Opin.DrugDiscov.Devel.6:561-569(2003),St印hensetal,Curr.Opin.Mo1.Ther5:118-122(2003),Kurreck,Eur.J.Biochem.270:1628-44(2003),Diasetal.,Mol.CancerTer.1:347-55(2002),Chen,MethodsMol.Med.75:621-636(2003),Wangetal.,Curr.CancerDrugTargets1:177-96(2001),和Be騰tt,AntisenseNucleicAcidDrug.Dev.12:215-24(2002)中。這里描述的變異體可以用于選擇和設計對于特定變異體特異性的反義試劑。利用這里描述的關于變異體的信息,可以設計特異性靶向包含本發明的一個或多個變異體的mRNA分子的反義寡核苷酸或其他反義分子。以這樣的方式,包含本發明的一個或多個變異體(標記物和/或單體型)的mRNA分子的表達可以被抑制或阻斷。在一個實施方式中,所述反義分子被設計成特異性結合所述靶核酸的特定等位基因形式(即,一個或幾個變異體(等位基因和/或單體型)),從而抑制起源于該特異性等位基因或單體型的產物的翻譯,但是其不結合在靶核酸分子的特定多態位點處的其他或可替換的變異體。因為反義分子可以用于使mRNA失活以便抑制基因表達,由此抑制蛋白質表達,因此所述分子可以用于治療疾病或障礙,如乳腺癌。所述方法可以涉及通過包含互補于所述mRNA中的一個或多個區的核苷酸序列的核糖核酸酶進行的剪切,其消弱待翻譯的mRNA的能力。這樣的mRNA區包括,例如,蛋白質編碼區,尤其是對應于催化活性的蛋白質編碼區,底物和/或配體結合位點,或蛋白質的其他功能結構域。RNA干涉(RNAi)現象在最近十年已經被活躍地研究,因為它最初在C.elegans中發現(Fireetal.,Nature391:806-11(1998)),并且近年來,它在人類疾病治療中的潛在應用被活躍地追蹤(在Kim&Rossi,NatureRev.Genet.8:173-204(2007)中綜述)。RNA干涉(RNAi),又稱為基因沉默,是基于利用雙鏈RNA分子(dsRNA)以關閉特異性基因。在細胞中,細胞質雙鏈RNA分子(dsRNA)被細胞復合體加工為小干涉RNA(siRNA)。siRNA指導蛋白質-RNA復合體耙向耙mRNA上的特定位點,導致mRNA的剪切(Thompson,DrugDiscoveryToday,7:912-917(2002))。siRNA分子的長度通常為約20、21、22或23個核苷酸。因此,本發明的一個方面涉及分離的核酸分子,以及那些分子在RNA干涉中的應用,S卩,作為小干涉RNA分子(siRNA)。在一個實施方式中,所述分離的核酸分子的長度為18-26個核苷酸,優選長度為19-25個核苷酸,更優選長度為20-24個核苷酸,并且更優選長度為21、22或23個核苷酸。用于RNAi-介導的基因沉默的另一途徑起源于內源性編碼的初始微RNA(pri-miRNA)轉錄物,其在細胞中被加工以產生前體miRNA(前-miRNA)。這些miRNA分子從細胞核被輸出到細胞質,在那里它們經歷加工以產生成熟的miRNA分子(miRNA),其通過識別mRNA的3'非翻譯區中的靶位點引導翻譯抑制,以及通過加工P-體引導隨后的mRNA降解(在Kim&Rossi,NatureRev.Genet.8:173-204(2007)中綜述)。RNAi的臨床應用包括合成siRNA雙鏈體的并入,其優選大小為約20_23個核苷酸,并優選具有2個核苷酸的3'重疊。基因表達的拆除通過用于靶mRNA的序列-特異性設計建立。用于這樣的分子的最佳設計和合成的幾個商業位點對于本領域技術人員來說是已知的。其他應用提供了較長的siRNA分子(典型地長度為25_30個核苷酸,優選約27個核苷酸),以及小發卡RNA(shRNA,典型地長度為約29個核苷酸)。后者被自然地表達,如在Amarzguiouietal.(FEBSLett.579:5974-81(2005))中描述的。化學合成的siRNA和shRNA是用于體內加工的底物,并且在一些情況下提供比較短設計更強大的基因_沉默(Kimetal.,NatureBiotechnol.23:222-226(2005);Siolasetal.,NatureBiotechnol.23:227-231(2005))。通常,siRNA提供基因表達的瞬時沉默,因為它們的細胞內濃度通過隨后的細胞分裂被稀釋。相反,表達的shRNA介導長期穩定的靶轉錄物的拆除,只要shRNA的轉錄發生(Marquesetal.,NatureBiotechnol.23:559-565(2006);Br翻elkampetal.,Science296:550-553(2002))。由于RNAi分子,包括siRNA、miRNA和shRNA,以序列-依賴性方式起作用,因此本發明的變異體(例如,表12、表13和表14中列出的標記物和單體型)可以用于設計這樣的RNAi試劑,所述RNAi試劑識別包含特異性等位基因和/或單體型(例如,本發明的等位基因和/或單體型)的特異性核酸分子,同時不識別包含其他等位基因或單體型的核酸分子。這些RNAi試劑可以由此識別并破壞靶核酸分子。如同反義試劑一樣,RNAi試劑可以用作治療藥劑(即,用于關閉疾病-相關的基因或疾病-相關的基因變異體),但是也可以用于表征和確認基因功能(例如,通過基因敲除或基因拆除實驗)。RNAi的遞送可以通過本領域技術人員已知的一系列方法來進行。利用非_病毒遞送的方法包括膽固醇、穩定的核酸-脂質顆粒(SNALP)、重-鏈抗體片斷(Fab)、適配子(即tamers)和納米顆粒。病毒遞送方法包括使用慢病毒(lentivirus)、腺病毒和腺相關病毒。siRNA分子在一些實施方式中被化學修飾以提高它們的穩定性。這可以包括在核糖的2'位的修飾,包括2'-0-甲基嘌呤和2'-氟代嘧啶,其提供了對核糖核酸酶活性的抗性。其他化學修飾是可能的并且對于本領域技術人員來說是已知的。下面的參考文獻提供了RNAi的進一步總結,以及利用RNAi靶向特異性基因的可會g性Kim&Rossi,Nat.Rev.Genet.8:173-184(2007),Chen&Rajewsky,Nat.Rev.Genet.8:93-103(2007),Reynolds,etal.,Nat.Biotechnol.22:326-330(2004),Chietal.,Proc.Natl.Acad.Sci.USA100:6343-6346(2003),Vickersetal.,J.Biol.Chem.278:7108-7118(2003),Agarni,Curr.Opin.Chem.Biol.6:829-834(2002),Lavery,etal.,Curr.Opin.DrugDiscov.Devel.6:561-569(2003),Shi,TrendsGenet.19:9-12(2003),Shueyetal.,DrugDiscov.Today7:1040-46(2002),McMa皿setal.,Nat.Rev.Genet.3:737-747(2002),Xiaetal.,Nat.Biotechnol.20:1006-10(2002),Plasterketal.,curr.Opin.Genet.Dev.10:562-7(2000),Bosheretal.,Nat.CellBiol.2:E31-6(2000),以及Hunter,Curr.Biol.9:R440_442(1999)。導致增加的對于乳腺癌發展的誘因或風險的遺傳缺陷,或造成乳腺癌的缺陷,可以通過給予攜帶缺陷的受治療者并入在遺傳缺陷的位點供應正常/野生型核苷酸的修復序列的核酸片段而永久校正。這樣的位點-特異性修復序列可以包括(concompass)RNA/DNA寡核苷酸,其運行以促進受治療者的基因組DNA的內源性修復。修復序列的給予可以通過合適的載體進行,如與聚乙烯亞胺(polyethelenimine)的復合體,包在陰離子脂質體中,病毒載體如腺病毒載體,或其他適于促進給予的核酸的細胞內攝取的藥物組合物。所述遺傳缺陷隨后可以被克服,因為嵌合的寡核苷酸誘導正常序列并入受治療者的基因組中,導致正常/野生型基因產物的表達。置換被擴增(propagated),由此提供永久的修復和與疾病或病癥相關的癥狀的緩解。本發明提供了用于鑒定可以用于治療乳腺癌的化合物或藥劑的方法。因此,本發明的變異體被用作用于鑒定和/或開發治療藥劑的靶標。在一些實施方式中,這樣的方法包括分析藥劑或化合物調節包括本發明的至少一個變異體(標記物和/或單體型)的核酸或者所述核酸的編碼的產物的活性和/或表達的能力。這包括,例如,FGF10、MRPS30、HCN1和FGFR2基因中的一個或多個,以及它們的基因產物。這又可以用于鑒定抑制或改變編碼的核酸產物的不期望的活性或表達的藥劑或化合物。用于進行這樣的實驗的分析可以在基于細胞的系統中或無細胞系統中進行,如本領域技術人員已知的。基于細胞的系統包括天然表達感興趣的核酸分子的細胞,或者已經被遺傳修飾以便表達某一期望的核酸分子的重組細胞。患者中的變異體基因表達可以通過包含變異體的核酸序列的表達被評估(例如,包含本發明的至少一個變異體的基因,其可以被轉錄到包含至少一個變異體的RNA中,并進而翻譯成蛋白質),或者通過由于影響正常轉錄物的表達的水平或模式的變異體(例如在基因的調節或控制區中的變異體)的正常/野生型核酸序列的改變的表達而評估。用于基因表達的分析包括直接核酸分析(mRNA)、用于表達的蛋白質水平的分析,或者途徑如信52號途徑中涉及的并行化合物(collateralcompounds)的分析。此外,響應于信號途徑而被上調或下調的基因的表達也可以被分析。一個實施方式包括將報告基因如螢光素酶可操作性地連接至感興趣的基因的調節區。在一個實施方式中,基因表達的調節劑當細胞與候選化合物或藥劑接觸以及mRNA的表達被確定時可以被鑒定。在候選化合物或藥劑存在下,將mRNA的表達水平與所述化合物或藥劑缺乏時的表達水平進行比較。基于該比較,用于治療乳腺癌的候選化合物或藥劑可以作為那些調節變異體基因的基因表達的化合物或藥劑而被鑒定。當mRNA的表達或編碼的蛋白質在候選化合物或藥劑存在的情況下比其缺乏的情況下統計學上顯著更大時,候選化合物或藥劑作為核酸表達的剌激劑或上調劑被鑒定。當核酸表達或蛋白質水平在候選化合物或藥劑存在的情況下比其缺乏的情況下顯著更少時,所述候選化合物作為核酸表達的抑制劑或下調劑被鑒定。本發明進一步提供了利用通過藥物(化合物和/或藥劑)篩查鑒定的化合物作為基因調節劑(即,基因表達的剌激劑和/或抑制劑)的治療方法。評估對治療藥劑反應可能性的方法,監測治療進展的方法以及用于用于治療乳腺癌的方法如本領域已知的,個體對特定治療(例如,治療藥劑或治療方法)具有不同的反應。差異反應的基礎可以是部分遺傳決定的。藥物基因組學致力于由于改變的藥物配置和/或藥物的異常或改變的作用,遺傳變異(例如,本發明的變異體(標記物和/或單體型))如何影響藥物反應的問題。因此,差異反應的基礎可以是部分遺傳決定的。由于影響藥物反應的遺傳變異的臨床結果在一些個體(例如,本發明的遺傳變異體的攜帶者或非攜帶者)中可能導致藥物毒性,或者藥物的治療失敗。因此,本發明的變異體可以決定治療藥劑和/或方法作用于身體的方式,或者身體代謝所述治療藥劑的途徑。因此,在一個實施方式中,多態位點處的特定等位基因或單體型的存在指示對特定治療形式的不同反應率。這意味著診斷有乳腺癌,并且攜帶本發明的多態處的某一等位基因或單體型(例如,本發明的風險中和保護性的等位基因和/或單體型)的患者將更好或更壞地響應于用于治療所述疾病的特定治療、藥物和/或其他治療。因此,標記物等位基因或單體型的存在或缺乏將會輔助決定什么治療應當用于所述患者。例如,對于新診斷的患者,本發明的標記物或單體型的存在可以被評估(例如,通過測試來自血液樣品的DNA,如這里描述的)。如果所述患者對標記物等位基因或單體型是陽性的(即,標記物的至少一個特異性等位基因,或單體型存在),則醫師建議一種特別的療法,而如果患者對標記物的至少一個等位基因或單體型是陰性的,則可以建議不同的療程(其可以包括建議沒有直接的治療,除了連續監測疾病進展,被進行)。因此,患者的攜帶狀況可以用于幫助確定是否特定治療形式應當被給予。價值存在于以下可能性內能夠早期診斷疾病,選擇最合適的治療,以及為臨床醫師提供關于疾病的預后/侵蝕性的信息,以便能夠應用最合適的治療。如這里進一步描述的,目前用于乳腺癌的臨床預防選擇主要是化學預防(chemopreventive)(化學治療,或激素治療)和預防性手術。最常見的化學預防劑是他莫昔芬和雷洛昔芬;其他選擇包括其他選擇性雌激素受體調節劑(SERM)和芳香酶抑制劑。治療選擇還包括放射治療,對于其部分患者經歷不利癥狀。如這里描述的,本發明的標記物可以用來評估對這些治療選擇的反應,或者預測利用這些治療選擇的任何一個的治療進展。因此,遺傳識別可以用于基于個體的基因狀況來選擇合適的治療策略,或者它可以用于預測特定治療選擇的結果,由此用在治療選擇或可利用的治療選擇的結合的策略選擇中。本發明還涉及監測用于乳腺癌的治療的進展或效果的方法。這可以基于本發明的標記物和單體型的基因型和/或單體型狀況進行,即,通過評估如這里描述的至少一個多態標記物的至少一個等位基因的缺乏或存在,或通過監測與本發明的變異體(標記物和單體型)相關的基因的表達來進行。風險基因mRNA或編碼的多肽可以在組織樣品(例如,外周血樣品,或活組織檢查樣品)中被測量。表達水平和/或mRNA水平由此可以在治療前和治療期間被確定以監測其效果。可替換地,或伴隨地,如這里出現的用于乳腺癌的至少一個風險變異體的基因型和/或單體型狀態在治療前和治療期間被確定以監測其效果。可替換地,通過確定mRNA和或多肽水平,可以監測與本發明的標記物和單體型相關的生物網絡或代謝途徑。這可以例如通過監測治療前和治療期間采集的樣品中屬于所述網絡和/或途徑的幾個基因的表達水平或多肽來進行。可替換地,屬于生物網絡或代謝途徑的代謝物可以在治療前和治療期間被確定。治療的效果通過比較治療期間表達水平/代謝物水平的觀察到的變化與來自健康受治療者的相應數據來確定。在另外的方面中,本發明的標記物可以用來提高臨床試驗的能力和效果。因此,作為本發明的風險中的變異體的攜帶者的個體,即,作為提供發展乳腺癌的增加的風險的至少一個多態標記物的至少一個等位基因的攜帶者的個體,將更可能響應于特定治療模式(藥征,modality)。在一個實施方式中,攜帶途徑和/或代謝網絡中的基因的風險中的變異體的個體(對于其,靶向特定治療(如小分子藥物))更可能是治療的響應者。在另一個實施方式中,攜帶基因(其表達和/或功能通過所述風險中的變異體被改變)的風險中的變異體的個體更可能是靶向所述基因、其表達或其基因產物的治療模式的響應者。在另外的方面中,本發明的標記物和單體型可以用于靶向用于特定個體的藥物藥劑的選擇。治療模式的個性化的選擇,生活方式的改變或兩者的結合,可以通過本發明的風險中的變異體的利用而實現。因此,對于本發明的特定標記物的個體的狀態的知識,可以用于選擇靶向被本發明的風險中的變異體影響的基因或基因產物的治療選擇。變異體的一些組合可以適用于治療選項的一個選擇,而其他基因變異體組合可以耙向其他治療選項。這樣的變異體的組合可以包括一個變異體、兩個變異體、三個變異體、或四個或更多變異體,當需要時以具有臨床可靠的準確度確定治療模式的選擇。計算機-實施的方面本發明還涉及這里描述的與乳腺癌相關的多態標記物和單體型的計算機_實施的應用。這樣的應用可以用于存儲、操作或以其他方式分析用在本發明的方法中的基因型數據。一個實例涉及將來自個體的基因型信息儲存在可讀介質上,以便能夠將所述基因型信息提供給第三方。所述第三方可以為基因型數據來源的個體。第三方也可以為用于分析基因型信息的服務提供者,例如,基于在特定遺傳標記物處的個體的基因型計算遺傳風險的服務提供者。在一個這樣的實施方式中,所述服務提供者從基因型服務提供者接受基因型信息,并將所述基因型信息存儲在可讀介質上用于隨后的分析。在另一實施方式中,所述基因型提供者也是所述服務提供者,即,相同的一方從來自個體的DNA樣品產生基因型,將所述基因型數據存儲在可讀介質上,并提供關于所述基因型數據的風險評估或其他解釋的服務。另外的解釋可以例如包括評估或預測個體的世系,或所述個體與參考個體之間的系54譜關系。所述參考個體可以例如為朋友、親屬或所述個體希望比較他的/她的基因型的任何其他人。在一個特別的實施方式中,所述基因型數據用于得出關于有助于對乳腺癌的增加的易感性的遺傳風險因素的信息,并基于這樣的比較報告結果。在一個方面中,本發明涉及計算機可讀介質。一般地說,這樣的介質具有存儲以下的能力(i)用于至少一個多態標記物或單體型的鑒定者信息;(ii)患有乳腺癌的個體中的所述至少一個標記物的至少一個等位基因的頻率,或單體型的頻率的指征;以及參考群體中的所述至少一個標記物的至少一個等位基因的頻率,或單體型的頻率的指征。所述參考群體可以為個體的無疾病的群體。可替換地,所述參考群體為來自總的群體的隨機樣本,并由此代表全體群體。頻率指征可以為計算的頻率、等位基因和/或單體型拷貝的計數、或適于特定介質的實際頻率的正規化或以其他方式操作的值。關于所述個體的另外的信息可以存儲在介質上,如世系信息,關于性別、身體素質或特征(包括身高和體重)的信息、生物化學測量值(如血壓、血液脂質水平等),或在特定個體的基因型狀況的范圍中期望存儲或操作的其他有用信息。本發明進一步涉及一種適于確定或操作用于確定人類個體中對乳腺癌的易感性的遺傳數據的裝置。這樣的裝置可以包括計算機可讀的存儲器、用于操作存儲在計算機可讀的存儲器上的數據的程序、以及用于產生包括遺傳數據的測量值的輸出的程序。這樣的測量值可以包括這樣的值,如等位基因或單體型頻率、基因型計數、性別、年齡、基因型信息、用于優勢比(0R)或相對風險(RR)的值、群體特異風險(PAR)、或原始基因型數據的直接統計量或基于根據遺傳數據的計算的其他有用信息。這里顯示的與乳腺癌的增加的易感性(如,增加的風險)相關的標記物和單體型,在一些實施方式中,可用于解釋和/或分析基因型數據。因此在一些實施方式中,乳腺癌的風險中的等位基因的鑒定,如這里是出的,或者與這里示出的與乳腺癌相關的標記物的任何一個在LD中的多態標記物處的等位基因,是所述基因型數據起源的個體處于乳腺癌的增加的風險中的指征。在一個這樣的實施方式中,對于這里示出的與乳腺癌相關的至少一個多態標記物或在與其連鎖不平衡中的標記物的基因型數據被產生。所述基因型數據隨后對于所述數據起源的個體是可獲得的,例如經由經過因特網可進入的用戶界面,連同基因型數據的解釋,例如以對于疾病(如乳腺癌)的風險測量值(如絕對風險(AR)、風險比(RR)或優勢比(0R))的形式。在另一個實施方式中,在來自個體的基因型數據組中鑒定的風險中的標記物被評估并來自由數據組中這樣的風險中的變異體的存在提供的風險的評估的結果例如經由安全的網絡界面,或者通過其他通訊方式使得對于所述個體是可獲得的。這樣的風險評估的結果可以以數字形式(例如,通過風險值,如絕對風險、相對風險、和/或優勢比,或通過與參考相比的風險的百分比增加),通過繪圖方式,或通過適合向基因型數據來源的個體闡明風險的其他方式報道。在特定的實施方式中,風險評估的結果對于第三方,如醫師,其他衛生保健工作者或遺傳顧問是可獲得的。用在本發明多個方面中的標記物上述應用可以均借助本發明的標記物和單體型來實施,其已經在關于評估對乳腺癌的易感性的方法中更詳細地描述。因此,這些應用通常可以歸納為利用如這里限定的Chr5pl2和Chrl0q26基因組區內的標記物來實施,包括如表12、表13和表14中列出的標記物,以及在與其連鎖不平衡中的標記物。在一個實施方式中,用在本發明的多個方面和實施方式中的標記物選自表12、表13和表14中列出的標記物(SEQIDNO:1-237)。在一個實施方式中,所述標記物選自標記物rs10941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsll743392、rs7716600、和rs1219648,以及在與其連鎖不平衡中的標記物。在另一實施方式中,所述標記物選自標記物rsl0941679、rs7703618、rs4415084、rs2067980、rsl0035564、rsl1743392、rs7716600和rsl219648。在另一實施方式中,所述標記物選自rs10941679,以及在與其連鎖不平衡中的標記物。在一個實施方式中,所述標記物選自表13中列出的標記物。在另一實施方式中,所述標記物選自標記物rs4415084,以及在與其連鎖不平衡中的標記物。在另一實施方式中,所述標記物選自表12中列出的標記物。在另一實施方式中,所述標記物選自標記物rs1219648,以及在與其連鎖不平衡中的標記物。在另一實施方式中,所述標記物選自表14中列出的標記物。在另一實施方式中,所述標記物為rs4415084。在另一實施方式中,所述標記物為rsl0941679。在另一實施方式中,所述標記物為rsl219648。在另一實施方式中,所述標記物為rs4415084或rsl0941679。在另一實施方式中,提供乳腺癌的增加的風險或易感性的標記物等位基因選自rsl0941679等位基因G、rs7703618等位基因T、rs4415084等位基因G、rs2067980等位基因G、rsl0035564等位基因G、rsl1743392等位基因T、rs7716600等位基因A、和rsl219648等位基因G。核酸和多肽這里描述的核酸和多肽可以用在本發明的方法和試劑盒中,如上文中描述的。如這里所使用的,"分離的"核酸分子是這樣的核酸分子,其從通常在所述基因或核苷酸序列側翼的核酸分離(如在基因組序列中)和/或已經從其他轉錄的序列完全或部分純化(例如,如在RNA庫中的)。例如,本發明的分離的核酸可以關于其中它天然存在的復合體細胞環境,或在通過重組技術產生時的培養基,或化學合成時的化學前體或其他化學制品而被基本上分離。在一些實例中,分離的物質將形成組合物(例如,包含其他物質的粗提物)、緩沖系統或試劑混合物的一部分。在其他情況中,所述物質可以被純化到實質的同質性,例如,如通過聚丙烯酰胺凝膠電泳(PAGE)或柱色譜法(如,HPLC)所確定的。本發明的分離的核酸分子可以包括存在的所有大分子種類的至少約50%,至少約80%或至少約90%(在摩爾基礎上)。關于基因組DNA,術語"分離的"也可以指從基因組DNA天然相關的染色體分離的核酸分子。例如,所述分離的核酸分子可以包含少于約250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、lkb、0.5kb或0.lkb的核苷酸,其在所述核酸分子來源的細胞的基因組DNA中的核酸分子的側翼。所述核酸分子可以被融合到其他編碼或調節序列并仍被認為是分離的。因此,包含在載體中的重組DNA被包括在如這里所用的"分離的"定義內。并且,分離的核酸分子包括異源宿主細胞或異源有機體中的重組DNA分子,以及溶液中部分或基本上純化的DNA分子。"分離的"核酸分子還包括本發明的DNA分子的體內和體外RNA轉錄物。分離的核酸分子或核苷酸序列可以包括化學合成或通過重組方式合成的核酸分子或核苷酸序列。這樣的分離的核苷酸序列例如可用于編碼的多肽的生產,作為探針用于分離同源序列(例如,從其他哺乳動物種類),用于基因作圖(例如,通過與染色體原位雜交),或用于檢測基因在組織(例如,人類組織)中的表達,如通過RNA印跡分析或其他雜交技術。本發明還涉及這樣的核酸分子,其在高嚴格性雜交條件(如用于選擇性雜交)下雜交至這里描述的核苷酸序列(例如,特異性地雜交到包含與這里描述的標記物或單體型相關的多態位點的核苷酸序列的核酸分子)。這樣的核酸分子可以通過等位基因-或序列-特異性雜交(例如,在高嚴格性條件下)而檢測和/或分離。用于核酸雜交的嚴格性條件和方法對于技術人員來說是熟知的(參見,例如,CurrentProtocolsinMolecularBiology,Ausubel,F.etal,JohnWiley&Sons,(1998),andKraus,M.andAaronson,S.,MethodsEnzymol.,200:546-556(1991),將其全部教導以引用方式并入本文中)。兩個核苷酸或氨基酸序列的百分比同一性可以通過對準(序列對比,排列,aligning)所述序列用于最佳比較目的來確定(例如,間隙可以被引入第一序列的序列中)。然后比較相應位置處的核苷酸或氨基酸,并且兩個序列之間的百分比同一性是由序列分享的相同位置的數目的函數(即,%同一性=相同位置的#/位置的總#乂100)。在一些實施方式中,用于比較目的的對準的序列的長度是參考序列的長度的至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%。所述兩個序列的實際比較可以通過熟知的方法來實現,例如,利用數學算法。這樣的數學算法的非限制性實例描述在Karlin,S.andAltschul,S.,Proc.Natl.Acad.Sci.USA,90:5873-5877(1993)中。這樣的算法被并入NBLAST和XBLAST程序(版本2.0)中,如在Altschul,S.etal.,NucleicAcidsRes.,25:3389-3402(1997)中描述的。當利用BLAST和G即pedBLAST程序時,可以使用相應的的程序(如,NBLAST)的缺省參數。參見萬維網絡上的站點ncbi.nlm.nih.gov。在一個實施方式中,用于序列比較的參數可以被設置為得分(score)=100、字長(wordlength)=12,或可以被改變(例如,W=5或W=20)。其他實例包括Myers和Miller的算法,CABI0S(1989),ADVANCE和ADAM,如在Torellis,A.andRobotti,C,Comput.Appl.Biosci.10:3-5(1994)中描述的;以及在Pearson,W.andLipman,D.,Proc.Natl.Acad.Sci.USA,85:2444-48(1988)中描述的FASTA。在另一個實施方式中,兩個氨基酸序列之間的百分比同一性可以利用GCG軟件包中的GAP程序來實現(Accelrys,Cambridge,UK)。本發明還提供了分離的核酸分子,其包含這樣的片斷或部分,所述片斷或部分在高度嚴格性條件下雜交到包括以下或由以下組成的核酸包括表12、表13和表14中列出的多態標記物的核苷酸序列(SEQIDNO:1-237),以及FGF10、MRPS30、HCN1和FGFR2基因的核苷酸序列;或者包括或由以下組成的核苷酸序列包括表12、表13和表14中列出的多態標記物的核苷酸序列(SEQIDNO:1-237),以及FGF10、MRPS30、HCN1和FGFR2基因的核苷酸序列的核苷酸序列的互補物,其中所述核苷酸序列包括在這里描述的標記物和單體型中所包括的至少一個多態等位基因。本發明的核酸片段的長度為至少約15、至少約18、20、23或25個核苷酸,并且可以為30、40、50、100、200、500、1000、10,000或更多個核苷酸。本發明的核酸片段在如這里描述的那些分析中被用作探針或引物。"探針"或"引物"是以堿基-特異性方式雜交到核酸分子的互補鏈的寡核苷酸。除了DNA和RNA之外,這樣的探針和引物包括多肽核酸(PNA),如在Nielsen,P.etal.,Science254:1497-1500(1991)中描述的。探針或引物包括雜交到核酸分子的至少約15、典型地約20-25,并且在一些實施方式中約40、50或75個連續核苷酸的核苷酸序列的區。在一個實施方式中,所述探針或引物包括這里描述的至少一個多態標記物的至少一個等位基因或至少一個單體型,或其互補物。在特定的實施方式中,探針或引物可以包括100或較少的核苷酸;例如,在一些實施方式中,6到50個核苷酸,或者,例如,12到30個核苷酸。在其他實施方式中,所述探針或引物與連續的核苷酸序列或與連續的核苷酸序列的互補物是至少70%相同的、至少80%相同的、至少85%相同的、至少90%相同的、或至少95%相同的。在另一實施方式中,所述探針或引物能夠選擇性雜交到連續核苷酸序列或所述連續核苷酸序列的互補物。通常,所述探針或引物進一步包括標記,例如放射性同位素、熒光標記、酶標記、酶輔因子標記、磁標記、自旋標記、表位標記。本發明的核酸分子,如上面描述的那些,可以利用本領域技術人員熟知的標準分子生物學技術來鑒定和分離。擴增的DNA可以被標記(如,放射性同位素標記的)并用作探針用于篩查來自人類細胞的cDNA庫。CDNA可以來自mRNA并包含在合適的載體中。相應的克隆可以被分離,DNA可以在體內切除后獲得,并且克隆的插入物可以在一個或兩個方向上通過本領域公認的方法測序以鑒定編碼適當的分子量的多肽的正確的閱讀框。利用這些或類似的方法,多肽和編碼多肽的DNA可以被分離、測序和進一步表征。通常,本發明的分離的核酸序列可以用作Southern凝膠上的分子量標記物,并被用作染色體標記物,其被標記以繪制相關的基因位置。所述核酸序列還可以用于與患者中的內源性DNA序列進行比較以鑒定乳腺癌或對乳腺癌的易感性,以及作為探針,以便雜交和發現相關的DNA序列或從樣品減去已知的序列(例如,減法雜交(subtractivehybridization))。所述核酸序列可以進一步用于衍生引物用于基因指紋識別,以利用免疫技術發展抗_多肽抗體,和/或作為抗原以發展抗-DNA抗體或引發免疫反應。抗亍本還提供了特異性結合一種形式的基因產物但不結合另一種形式的基因產物的多克隆抗體和/或單克隆抗體。結合包含多態位點或多個位點的變異體或參考基因產物的部分的抗體也被提供。如這里所用的術語"抗體"指的是免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即,包含特異性結合抗原的抗原_結合部位的分子。特異性結合至本發明的多肽的分子是結合至所述多肽或其片段的分子,但是基本上不結合樣品(例如,生物樣品)中的其他分子,其天然包含多肽。免疫球蛋白分子的免疫活性部分的實例包括F(ab)和F(ab')2片段,其可以通過用酶如胃蛋白酶處理抗體而產生。本發明提供了結合至本發明的多肽的多克隆和單克隆抗體。如這里所用的,術語"單克隆抗體"或"單克隆抗體組合物"指的是僅包含一個種類的能夠與本發明的多肽的特定表位免疫反應的抗原結合部位的抗體分子群。由此單克隆抗體組合物通常表現出對于其與之免疫反應的本發明的特定多肽的單一結合親和力。多克隆抗體可以通過用期望的免疫原,如本發明的多肽或其片段免疫合適的受治療者而如上所述制備。免疫的受治療者中的抗體效價可以通過標準技術,如用酶聯免疫吸附分析(ELISA)利用固定的多肽隨時間進行監測。如果期望,針對所述多肽的抗體分子可以從哺乳動物(例如,從血液)分離并通過熟知的技術(如蛋白A色譜)進一步純化以獲得IgG部分。在免疫后合適的時間,例如,當抗體效價最高時,產生抗體的細胞可以從受治療者獲得并用于通過標準技術來制備單克隆抗體,如KohlerandMilstein,Nature256:495-497(1975)最初描述的雜交瘤技術、人類B細胞雜交瘤技術(Kozboretal.,Immunol.Today4:72(1983))、EBV-雜交瘤技術(Coleetal.,MonoclonalAntibodiesandCancerTherapy,AlanR.Liss,1985,Inc.,pp.77-96)或三源雜交瘤(trioma)技術。用于產生雜交瘤的技術是熟知的(參見,generallyCurrentProtocolsinlmm皿ology(1994)Coliganetal.,(eds.)JohnWiley&Sons,Inc.,NewYork,NY)。簡單地,永生細胞系(典型地,骨髓瘤)被融合到來自用如上所述的免疫原免疫的哺乳動物的淋巴細胞(典型地,脾細胞),并且篩選所獲得的雜交瘤細胞的培養上清液以鑒定產生結合本發明的多肽的單克隆抗體的雜交瘤。用于融合淋巴細胞和永生細胞系的許多熟知方案中的任何一個可以用于產生針對本發明的多肽的單克隆抗體的目的(參見,例如,CurrentProtocolsinImmunology,supra;Galfreetal.,Nature266:55052(1977);R.H.Kenneth,inMonoclonalAntibodies:ANewDimensionInBiologicalAnalyses,PlenumPublishingCorp.,NewYork,NewYork(1980);以及Lerner,YaleJ.Biol.Med.54:387-402(1981))。此外,普通技術人員將認識到存在許多這樣的方法的變化,其也將是有用的。制備單克隆抗體-分泌雜交瘤的替換方式,針對本發明的多肽的單克隆抗體可以被鑒定并通過篩選具有所述多肽的重組體組合的免疫球蛋白庫(例如,抗體噬菌體展示庫)分離,從而分離結合所述多肽的免疫球蛋白庫成員。用于產生和篩選噬菌體展示庫的試劑盒是商業上可獲得的(例如,PharmaciaRecombinantPhageAntibodySystem,CatalogNo.27_9400_01;禾口StratageneSurfZAPPhageDisplayKit,CatalogNo.240612)。此外,特別適于在產生和篩選抗體展示庫中使用的方法和試劑的實例可以在例如美國專利第5,223,409號;PCT公開第W092/18619號;PCT公開第W091/17271號;PCT公開第W092/20791號;PCT公開第W092/15679號;PCT公開第W093/01288號;PCT公開第W092/01047號;PCT公開第W092/09690號;PCT公開第W090/02809號;Fuchsetal.,Bio/Technology9:1370-1372(1991);Hayetal.,Hum.Antibod.Hybridomas3:81-85(1992);Huseetal.,Science246:1275-1281(1989);和Griffithsetal.,EMBOJ.12:725-734(1993)中被發現。此外,重組抗體,如嵌合體和人源化的單克隆抗體,包括人類和非人類部分,其可以利用標準重組DNA技術制備,在本發明的范圍內。這樣的嵌合和人源化單克隆抗體可以通過本領域已知的重組DNA技術來產生。通常,本發明的抗體(例如,單克隆抗體)可以用于通過標準技術如親和色譜法或免疫沉淀反應來分離本發明的多肽。多肽-特異性抗體可以促進天然多肽從細胞的純化和在宿主細胞中表達的重組產生的多肽的純化。此外,對于本發明的多肽特異性的抗體可以用于檢測所述多肽(例如,在細胞裂解液、細胞上清液或組織樣品中)以便評估所述多肽的豐度和表達模式。抗體可以用于作為臨床測試過程的部分診斷性地監測組織中的蛋白水平,例如,用于例如測定給定治療方案的效力。所述抗體可以被偶聯到可檢測的物質以促進其檢測。可檢測的物質的實例包括各種酶、輔基、熒光物質、發光物質、生物熒光物質以及放射性物質。合適的酶的實例包括辣根過氧化物酶、堿性磷酸酶、P-半乳糖苷酶、或乙酰膽堿酯酶;合適的輔基復合體的實例包括抗生蛋白鏈菌素/生物素和抗生物素蛋白/生物素;合適的熒光物質的實例包括傘形酮、熒光素、熒光素異硫氰酸鹽、羅丹明、二氯三嗪基胺熒光素、丹磺酰氯或藻紅蛋白;發光物質的實例包括魯米諾;生物熒光物質的實例包括螢光素酶、螢光素、和水母發光蛋白,而合適的放射性物質的實例包括1251、1311、353或311。抗體還可以用在藥物基因組(pharmacogenomic)分析中。在這樣的實施方式中,針對由根據本發明的核酸編碼的變異體蛋白的抗體,如由包含本發明的至少一個多態標記物的核酸編碼的變異體蛋白,可以用于鑒定需要修改的治療模式的個體。抗體可以進一步用于評估疾病狀態中(如疾病的活性階段中)或具有與所述蛋白質的功能相關的疾病(尤其是乳腺癌)的誘因的個體中變異體蛋白的表達。對于由包括如這里所述的至少一個多態標記物或單體型的核酸編碼的本發明的變異體蛋白特異性的抗體可以用于篩查所述變異體蛋白的存在,例如篩查對于乳腺癌的誘因,如通過所述變異體蛋白的存在表示的。抗體可以用于其他方法中。因此,抗體連同通過電泳遷移率、等電點、胰蛋白酶或其他蛋白酶消化的分析而用作用于評估蛋白質的工具,如本發明的變異體蛋白,或用在本領域技術人員已知的其他身體分析中。抗體還可以用在組織分型中。在一個這樣的實施方式中,特異性變異體蛋白與在特異性組織類型中的表達有關,并且對于變異體蛋白特異性的抗體然后可以用于鑒定特異性組織類型。蛋白質,包括變異體蛋白的亞細胞定位,也可以利用抗體來確定,并且可以用于評估各種組織中的細胞中所述蛋白質的異常亞細胞定位。這樣的應用可以用在遺傳測試中,但是也可以用在檢監測特定的治療模式中。在其中治療針對校正所述變異體蛋白的表達水平或存在或所述變異體蛋白的異常組織分布或發育表達的情況中,對于所述變異體蛋白或其片段特異性的抗體可以用于監測治療效力。抗體被進一步用于抑制變異體蛋白功能,例如通過阻斷變異體蛋白結合到結合分子或伙伴。這樣的應用也可以被用在治療環境中,其中治療涉及抑制變異體蛋白的功能。抗體可以例如用于阻斷或競爭性抑制結合,從而調節(即,激動(agonizing)或拮抗)所述蛋白質的活性。針對包含特定功能所需的位點的特異性蛋白片段或針對與細胞或細胞膜相關的完整蛋白的抗體可以被制備。對于體內給予,抗體可以與另外的治療性運載物(payload)相連,所述治療性運載物為例如放射性核素、酶、免疫原表位、或細胞毒性劑,包括細菌毒素(白喉或植物毒素,如蓖麻毒素)。抗體或其片段的體內半衰期可以通過與聚乙二醇結合的聚乙二醇化(pegylation)而增加。本發明進一步涉及用于利用這里描述的方法中的抗體的試劑盒。這包括,但不限于,用于檢測測試樣品中變異體蛋白的存在的試劑盒。一個優選的實施方式包括抗體如標記或可標記的抗體以及用于檢測生物樣品中的變異體蛋白的化合物或試劑,用于確定樣品中變異體蛋白的量或存在和/或缺乏的裝置,以及用于比較樣品中變異體蛋白的量與標準的裝置,以及試劑盒的使用說明書。現在將通過下面的非限制性實施例來說明本發明。實施例1.染色體5pl2上與乳腺癌的風險相關的變異體的鑒定介紹乳腺癌易感性基因BRCA1和BRCA2中的突變占乳腺癌風險的家族構成(familialcomponent)的15-25%[Easton,(1999),BreastCancerRes,l,14-7;Balmain,etal.,(2003),NatGenet,33Suppl,238-44]。許多乳腺癌的風險的基因成分還未表征并被認為起因于個別地,可以是非常常見的較少外顯變異體的組合[Pharoah,etal.,(2002),NatGenet,31,33-6]。對于較少外顯乳腺癌風險變異體的許多研究已經利用候選基因、病例-對照關聯方法被實施。來自這些研究的發現經常被證明難以復制[BreastCancerAssociation,(2006),JNatlCancerInst,98,1382-96]。最近通過利用動力充分的多中心分析已經顯示在兩個基因CASP8和TGFB1中的常見錯義變異體與乳腺癌風險相關[Cox,etal.,(2007),NatGenet,39,352-8]。這些報道強調在目標是鑒定提供乳腺癌風險的適度增加的常見變異體時,具有足夠的復制的大規模研究的重要性。結果染色體5pl2上的區中多個IlluminaSNP與冰島中乳腺癌的增加的風險相關為了廣泛地尋找與乳腺癌易感性相關的常見SNP的等位基因,我們利用IlluminaH咖anHap300微陣列技術進行了基因組范圍(genomeiide)的SNP關聯研究。基因型測定在大約1,600個冰島乳腺癌患者和11,563個對照上進行。該發現樣品組被指定為"冰島1"。在去除不能質量控制檢查的SNP后,311,524個SNP剩余并被測試與乳腺癌的關聯。所述結果被調節用于個體間的相關性和利用基因組對照的方法的潛在群體分層[DevlinandRoeder,(1999),Biometrics,55,997-1004](參見方法)。信號通過P值分級。來自染色體5pl2上的相同區域的SNP的組占頂端50個級別的39個。由位于5pl2中的SNP占有的最高級別是級別5到9。包含這些SNP的感興趣的區從大約染色體5坐標44,094,392bp(標記物rs7704166的位置;這里所有的坐標是來自NCBIBuild34)延伸到著絲粒前最后的IlluminaSNP的位置;即,在46,393,984bp的rsl0941803。來自該區中IlluminaSNP的基因型測定的結果被呈現在表1中并在圖1中用圖表示出。為了進一步研究與高級的SNP之一相關的信號,chr5pl2上的標記物rs7703618,我們產生并證實了用于該SNP的Centaurus分析。所述Centaurus分析被指定SG05S3065.cl。該SNP分析被用于測定大約591個冰島乳腺癌患者和1314個對照的獨立的樣品的基因型。該獨立的樣品被指定為冰島2。如表2中所示,SNP在冰島2樣品中顯示出與乳腺癌的顯著的關聯,證實用冰島1的原始觀察。我們因此在獨立的冰島2樣品中復制了在冰島1樣品中觀察到的原始發現。對于冰島l&冰島2的聯合P值接近這樣的水平,其在對于測試的311,524個SNP采用保守的Bonferroni校正后將被認為是基因組范圍顯著的[Skol,etal.,(2006),NatGenet,38,209-13]。在CGEMS數據中確定的與染色體5pl2的關聯在與CGEMS的聯合分析后是基因組范圍顯著的美國國家癌癥研究所(U.S.NationalCancerInstitute)的CancerGeneticsMarkersofSusc印tibility(CGEMS)項目已經向公眾域發布了對于乳腺癌易感性的基因組范圍的SNP關聯研究上的數據,所述研究基于利用Illumina平臺用大約530,000個SNP測定基因型的1145個患者和1142個對照。這些數據在https:〃caintegrator.nci.nih.gov/cgems/可獲得。CGEMS項目在5pl2區中沒有發現基因組范圍的顯著信號。然而,我們注意到在來自冰島的數據(冰島1同齡組)和CGEMS數據組被聯合分析時,一個SNP,即rs4415084,具有1.38E-07的P值,即,在Bonferroni校正后是基因組范圍顯著的。該SNP在CGEMS數據組中具有2.21E-03的不顯著的P值,聯合值的基因組范圍的顯著性主要由9.02E-06的冰島1P值攜帶。因此,CGEMS數據,雖然本身一點不顯著,但是提供了我們我們的與染色體5pl2的關聯的原始觀察的證據。許多H即M即(非Illumina)SNP標記物通過它們與在5pl2區中顯示關聯的IlluminaSNP的關聯而顯示出BC風險關聯我們預期在這個基因座處可能存在等位基因異質性,即,可能在5pl2區中存在超過一個潛在的風險中的變異體,其與測試的IlluminaSNP組不同程度的相關并在不同的群體中以不同的頻率存在。這是基于這樣的觀察,即,在最顯著的標記物的集簇的遠側似乎存在顯著信號(參見圖1)。此外,我們注意到在一些情況中,在冰島l材料中關聯信號非常強,但是在CGEMS數據中并不強例如,上面描述的rs4415084SNP在冰島1中產生非常強的信號,但是在CGEMS數據中沒有產生。類似地,在冰島中被成功地檢測用于復制的SNP,rs7703618,產生6.93E-06的P值,而在CGEMS數據組中僅為2.37E_02。假設在5pl2區中可能存在等位基因異質性,我們限定H即M即SNP的組,其通過它們與我們在冰島1數據組中觀察到的信號的關聯,可以用于檢測5pl2區中所有的致病突變。為了鑒定這樣的H即M即SNP的組,我們首先鑒定SNP的類,其在冰島1數據組中產生10E-3或更小的P值。隨后我們將這個組分成相等(等價)的類,特定相等類(等價類)的成員被限定為它們之間具有X).8的r2值的兩個SNP。這導致6個相等類的組,我們指定其為A到F。對于每個相等類,我們從在類中產生最顯著的信號的SNP開始(我們標記其為"關鍵"SNP),隨后通過參考H即M即數據,我們鑒定所有的H即M即SNP,其以0.2或更大的r2值與關鍵SNP相關,并且本身沒有表現在Ill咖inaH即300芯片上。因此,利用冰島1數據,我們在幾個不同的相等類中觀察到信號,該事實本身提供了等位基因異質性的證據。這些H即M即SNP也能夠,通過它們與我們鑒定的一個或多個相等類中的SNP的關聯,用于檢測我們原來觀察到的相同的乳腺癌風險關聯。關鍵SNP及它們與H即M即SNP的關聯的列表在表4中示出。FGF10和MRPS30是5pl2區中最可能的候選基因圖l示出了加在重組熱點、染色體帶、已知基因、和重組率的圖上的5pl2區中獲得的關聯信號的圖。重組熱點和重組率被確定,如由McVean等人描述的[McVean,etal.,(2004),Science,304,581-4]。也示出了所述區中H即M即SNP之間的r2值的代表。可以看出在所述區中存在三個著名的已知基因FGFIO、MRPS30和HCN1,連同一個不良表征的基因L0C441070。這些中的兩個,FGF10和MRPS30是用于乳腺癌誘因中涉及的強制候選物。如由Howard禾口Ashworth綜述的[HowardandAshworth,(2006),PLoSGenet,2,ell2],FGFIO是乳房的正常胚胎發育所必需的。FGF10在通過匪TV插入誘變的小鼠乳腺癌模型中作為癌基因被涉及,并且FGF10在人類乳腺癌中被過度表達約10%[Theodorou,etal.,(2004),Oncogene,23,6047-55]。如從圖1中可以看到的,FGFIO基因通過重組熱點與關聯信號的主要集簇分離。然而,控制FGFIO的調節的關鍵元件可以存在于其中強關聯信號發生的區中。可替換地,關聯信號可以與FGF10基因本身內的致病突變處于連鎖不平衡中。MRPS30編碼線粒體28S核糖體亞單位。它還稱為程序化細胞死亡蛋白9(PDCD9)。這是Gallusgallus前凋亡蛋白p52的哺乳動物對應物(counterpart)。它已經顯示在哺乳動物細胞中誘導凋亡并活化應激反應性JNK1途徑。所述蛋白似乎至少部分通過Bcl-2途徑在凋亡中起作用[Sun,etal.,(1998),Gene,208,157-66;Carim,etal.,(1999),CytogenetCellGenet,87,85-8;CavdarKoc,etal.,(2001),FEBSLett,492,166-70]。雖然它在乳腺癌中先前還沒有被涉及,但是它在上面途徑中的涉及表明MRPS30中的遺傳變異體可以在修改乳腺癌風險中被涉及。方法患者和對照選擇62這項研究的資助由NationalBioethicsCommitteeofIceland禾口IcelandicDataProtectionAuthority給予。乳腺癌診斷的記錄從IcelandicCancerRegistry(ICR)獲得。ICR包含從1955年1月1日的冰島中診斷有侵襲性乳腺腫瘤和導管或小葉癌原位的所有病例。具有進入ICR的診斷直到2005年12月末的住在冰島的所有人均適合參加所述研究。ICR包含在這個期間診斷的4603名個體的記錄。包含所有存活的患者(大約2840個)的流行同齡組適合招募入所述研究。我們獲得來自2210個患者的被告知的同意、血液樣品、和診斷信息,參與率為大約78%。對于rs7703618的基因型測定在總共2190個患者上是成功的。這個患者組的募集的進一步的細節先前已經被報道[Stacey,etal.,(2006),PLoSMed,3,e217]。12,904個冰島對照由846名隨機選自冰島系譜數據庫(IcelandicGenealogicalDatabase)的個體和12,058名來自在deC0DE的其他正在進行的基因組范圍的關聯研究的個體。排除在ICR中診斷有乳腺癌的個體。男性和女性性別均被包括。Illumina基因型測定DNA樣品根據制造商的說明在11l咖inaInfini咖HumanH即300SNP珠微陣列(Illumina,SanDiego,CA,USA)上進行,包含源自InternationalH即M即項目的階段I的317,503個SNP。這個芯片在UtahCEPH(CEU)HapM即樣品中提供約75%的基因組覆蓋,對于常見SNP,r28[BarrettandCardon,(2006),NatGenet,38,659-62]。芯片上SNP的總數中,5979個被認為是不適合的,因為它們是單態的(即,組合的患者和對照組中次要等位基因頻率小于O.001),或者具有低(<95%)產率或者在對照中顯示出從Hardy-Weinberg平衡的非常顯著的畸變(P〈1X10—,。所有的這些問題SNP從分析中被去除。因此311,524個SNP被用在關聯分析中。具有低于98X的SNP的總呼叫率(callrate)的任何芯片也從基因組范圍的關聯分析被排除。CentaurusSNP基因型測定Centa訓s分析[Kutyavin,etal.,(2006),NucleicAcidsRes,34,e128]被設計用于rs7703618并通過基因型測定H即M即CEU樣品和比較所述基因型與公開的數據來證實。所述分析伴隨H即M即數據產生<1.5%錯配。表5示出了對于這里討論的關鍵SNP的序列上下文。表6示出了用于被開發用于這個研究中的基因型測定的標記物rs7703618的Centaurus分析的描述。統計方法我們計算SNP等位基因的優勢比(OR),假定乘法模型,即,假定個人攜帶的兩個等位基因的相對風險相乘。對于標記物,等位基因頻率而不是攜帶者頻率被呈現。相關的P值借助標準似然比x2統計被計算,如在NEMO軟件包中實施的[Gretarsdottir,etal.,(2003),NatGenet,35,131-8]。計算置信區間,假定OR的估計具有對數正態分布。—些冰島患者和對照在組內和組間是相關的,造成x2檢驗統計量具有大于1的平均值以及大于0.6752的中位值。我們利用基因組對照的方法[DevlinandRoeder,(1999),Biometrics,55,997-1004],通過計算對于基因組范圍的SNP組的觀察到的乂2統計量的平均值估計對于冰島1的膨脹因子(膨脹系數,inflationfactor),其說明相關性和潛在的群體分層。對于冰島2,其還沒有用標記物的基因組范圍的組分類,膨脹因子通過冰島系譜的模擬基因型估計[Grant,etal.,(2006),NatGenet,38,320-3]。估計的膨脹因子對于冰島1為1.105,而對于冰島2為1.11。對于冰島1和冰島2樣品組的聯合分析的估計的膨脹因子為1.08,通過模擬獲得。所有的P值作為雙側被報道。表1:5pl2區中對于Ill咖inaSNP的關聯結果<table>tableseeoriginaldocumentpage64</column></row><table>SNP等位基因位置Wd34P值OR病例頻率病例對照頻率對照rs6885754A448115549.68E-011.00716600.014"5500.013rs7712949T448158461-19E-051.19316590.392115470.350rs11746980A448233791.98E-.405"5610.365rs16901964T448287561.97E-051.18816590.390115600.350rs727305C448415431.51E-051.19116600.390115160.349rs10462081A448461662.13E-051.18716570,390115570.350rs13183209A448492501.92E-.390"5550.350rs13159598G448514273.31E-051,18216440.402115130.363rs3761648G448535808.57E-061.20215890,387108440-344rs13174122G3.63E"05"8116580:390114980.351rs11746506T448580672.12E-051.18716600,389"5610.350rs12188871A448595051.50E-051.19116570,390115320.349rs96377B3G448651471.74E"051,19016550,389115200.349rs4457089T448672372,06E-051,18716600.389115600.349rs6867533T448727936.23E-061.20016410.398113550.355re689635t)C448780722.09E-051.1871卿0.389"5590.350rs1371025C448797342.06E-051.18.349rs6451775G448822892.21E-051.187■0.389"5610.350rs729599C448877612.21E-051,18716600,389115610.350rs987394T448918792.16E~051.18716600,389"5580.349rs4440370A448988532.17E-051.18716590.389115590,350rs4492"9A449011157.18E061.20016450.387113400.345re7703497A449025292.12E-051.18716590.38911559D.349rs4395640T449146018.63E-061.19716520.395"497.0.353rs7716600A449205063.12E-051.21416600.241115600.208rs4412123T449217891.10E-051,19216600.409"5600.367rs7705343G449250781.31E-051,580.368rs4129642G449436301-11E-051.19416550.396115180.355rs9790879C449453861.27E-051.19116590,409"5610.368rs10462084G449468502.31E-011.06716590,155115620,147rs9791056T449493927.66E-061.19716600.396115620.354rs6880275T449544367.76E-061.19816480.395"4840.353rs6870136G449561637.51E-061.19716600,396115590.354rs6881563C449583547.28E-061.19816600.396115610.354rs7703618G44恥00806.93E-061.19816590,396115570.354rs10077B14C449622901.24E-051.19116590.407"5610.366rs6451783G449637949.41E>061.19516600.395115630.353rs4298259G449662129.35E"061.19516600,395115620.353rs7728431T449681809.96E-061.19516600,394115590,353rs12517690A449847949.56E-061.19516600.395115620.353re3935213A450069453力9E-021.11216590.182115610.167rs6866995C450223483.77E-021.112■0.182115630.167rs206798DG450278189.89E-041.20016600,155"5550.132rs3923826C451182782.49E-021.13716600.870115620,855rs11743309A451678892.15E-011,06716600.836115590,826rs12654948T452112161.28E-011.09416510.878"2600細rs12515820G452389704.07E-021.12616600.135,115580.122rsl2515179C452925964.86E-021.12016600.138115620.125rs10512876G452951057.73E-011,02516600.055"5610.054rs1D035564G452980011.79E-041,114770.25Brs131咖87C453112695.28E-021.127化590.117115630.105rs4866929A453120909.34E-021.06816600.484115600,468re981782丁453312192.28E-041.15916010.458107060.421等位基因位置Wd34P值OR病例頻率病例對照頻率對照rs981782T453312191.05E-011,066細0.470115620.454rs9790873C453370153.61E-021.13316600.128115540.115rs9292918G453465364.21E-031.16116560,176115460.155rs6的5055A453669092.34E-031.17216600.177115510.155rs6888352A453714162.72E-031.16916590.177"5510.155rs994092G453812602.49E-031.17116590.177115570.155rs10473384A453893112.34E-031.1721659o.m115600.155rs1501357G454103762.61E-031.17016600,177'115630.155rs12517615C454122896.70E-021,19016470.047112860.040rs1501362T454237082.85E-031.16716600.179115580.157rs6451798T454333553,11E-031.16616600.179115600,157rs6414906C454518229.05E-031.11216580,375115600.351rs13162651C454554015.54E-021.08116550.375113630.357fs1483310G454598597.27E-021,17816550,051114130.044rs12659024T454631919.87E-011.00116580.080115490,080rs6892290G454726381.08E-021,10916600.375115600,351rs6451801A454849341.02E-021.11016600.375'"5600.351rs13354798C455025781.16E>021,10816600.377115630.353rs12651887T455159241.19E-011.07616570.225115490.212rs1471683A455249267.07E-021,08816600.232115620.217rs2337414A456141701.12E-011.10016600.884115620.874rs1852598G456484772.93E-011.04916600.245115620.237rs11743392T456604764.43E-041.15016140.490108260.455rs1534391T457145396.74E-021.11716520.884"3960.873rs2879074C457617101.10316600.384115600.361rs4380674C458148982.50E-011.05316600.259115630.249rs7447717A458157531.29E-021.10516600.384"5590.361rs4388219A458262511.41E-011.06316600.328115550.315rs10941703C458273731.02E-011.06916600.364115610.349rs10941704G458290072.99E力11.04916570.245115310.236rs4551074T458382542.15E-011.05716600.260115610.249rs13155321G;158420479-36E-021,07116600.367115590.351rs7733616C458442241.59E-011.06316300.2恥113720.278rs10069793G458486526.09E-021.07916500.367"4650.349rs13176359T45859776272E-011.05016600.267115520,258rs4866973A458621872.03E-011.05916570.259115300.248rs4242126A458718742.80E-011,05116600.245115610.236rs6865429G458760099.87E-021,06916590.366115610.351rs10461763G458847085.07E-011.07516590.034115570.032rs7730617A458858041.53E-011.06316590.294115570.281rs13175559C459001281.10E-011.0671660,0,368115600.353rs11951003A459026301.09E-011.06716590.368"5590.353rs43319"G459048761.55E-011.06016270.360112970.347rs13340341T459064371.53E-011.06016600.363115560.349rs12109205G459221792.53E-011.05116600,288115590.278rs4368738T459382891.67E^011,06116590,294115610.281rs9637799G459481095.03E011,07516600.034"5600.032rs6862657A459514981.03E~011,06916560.366115330.351rs7443189A459584686.0犯-011.05716540,034115190.032rs11948152C460001281.89E^011.05416440,580113770.567rs7443384G460063941.01E-011.07016600.345115620.330rs7701444C460143631.05E-011,068化600.369115610.354rs13352566丁460424032.03E-011.05916480.260114200'24966<table>tableseeoriginaldocumentpage67</column></row><table>所示的是SNP名稱,風險等位基因的身份、位置(在NCBIBuild34坐標中)、對于乳腺癌關聯的P值和優勢比(OR)、分別在乳腺癌病例和對照組中測試的個體的數量和等位基因頻率。表2.在獨立的冰島乳腺癌病例/對照樣品中來自SNPrs7703618的信號的復制<table>tableseeoriginaldocumentpage67</column></row><table>表3.在相等類A-F中關于關鍵SNP中具有>0.2的r2值的HapM即SNP。SNP1是相等類A-F的每個中具有最低P值的Ill咖inaSNP。SNP2是與SNP1相關的H即M即SNP。D'是穿過SNPl和SNP2的等位基因的所有組合的平均D'值。R2是兩個SNP之間的相關系數的平方。p-min是在SNPl和SNP2的等位基因之間觀察到的對應于最強的連鎖不平衡的P值。<table>tableseeoriginaldocumentpage67</column></row><table><table>tableseeoriginaldocumentpage68</column></row><table><table>tableseeoriginaldocumentpage69</column></row><table><table>tableseeoriginaldocumentpage70</column></row><table><table>tableseeoriginaldocumentpage71</column></row><table><table>tableseeoriginaldocumentpage72</column></row><table>SNPA=rs4415084rs4415084rs77096610.8430.2649.59E-08rs4415084rs68949740.8430.2649.59E-08rs4415084rs68853070.8430.2649.59E-08rs4415084rs45338940.8430.2649.59E-08rs4415084rsl25216390.8430.2649.59E-08rs4415084rsl20549760.8430.2649.59E-08rs4415084rs77310990.8390.2641.12E-07rs4415084rs77016790.8410.2631.15E-07rs4415084rs68626550.7390.2623.65E-08rs4415084rsl00597450.7390.2623.65E-08rs4415084rs64517960.8400.2551.80E-07rs4415084rs39230550.8400.2551.80E-07rs4415084rsl5013610.8400.2551.80E-07rs4415084rsl3929730.8400.2551.80E-07rs4415084rs68663540.7340.2545.71E-08rs4415084rs46392380.7360.2545.70E-08rs4415084rsl23745070.7360.2545.70E-08rs4415084rsl00669530.7360.2545.70E-08rs4415084rs43717610.8390.2522.37E-07rs4415084rsl00545210.7330.2498.38E-0873<table>tableseeoriginaldocumentpage74</column></row><table><table>tableseeoriginaldocumentpage75</column></row><table><table>tableseeoriginaldocumentpage76</column></row><table>SNPA=rs4415084rs7703618rsl00532471.0001.0002.19E-35rs7703618rsl00404881.0001.0002.19E-35rs7703618rsl00400821.0001.0001.50E-34rs7703618rsl4388271.0000.9642.55E-33rs7703618rs77116971.0000.9292.12E-31rs7703618rsll9588081.0000.9297.53E-32rs7703618rsl00440961.0000.9297.53E-32rs7703618rs73805591.0000.9297.53E-32rs7703618rs45184091.0000.9297.53E-32rs7703618rs43290281.0000.9292.12E-31rs7703618rsl4388211.0000.9297.53E-32rs7703618rsl4388201.0000.9297.53E-32rs7703618rsl33621321.0000.9297.53E-32rs7703618rsl31602591.0000.9297.53E-32rs7703618rsl0613101.0000.9297.53E-32rs7703618rsl05128651.0000.9297.53E-32rs7703618rsl0487581.0000.9297.53E-32rs7703618rs77165711.0000.9294.57E-31rs7703618rs92929131.0000.9281.15E-31rs7703618rs73808781.0000.9283.22E-3177SNPA=rs4415084rs7703618rsl31777111.0000.9281.15E-31rs7703618rsl00433441.0000.9284.91E-31rs7703618rsll9498471.0000.9281.75E-31rs7703618rs97908960.9620.8587.84E-27rs7703618rs9203280.9230.7641.31E-23rs7703618rs45714800.9220.7312.33E-22rs7703618rsll9481860.8830.7231.25E-21rs7703618rsl00515920.8830.7231.25E-21rs7703618rs77358810.9210.7087.34E-22rs7703618rs77235390.9210.7087.34E-22rs7703618rs7141300.9210.7087.34E-22rs7703618rs68615600.9210.7087.34E-22rs7703618rs64517700.9210.7087.34E-22rs7703618rs44196000.9210.7087.34E-22rs7703618rs44150850.9210.7087.34E-22rs7703618rs43217550.9210.7087.34E-22rs7703618rs22180810.9210.7087.34E-22rs7703618rsl4388250.9210.7087.34E-22rs7703618rsl31569300.9210.7087.34E-22rs7703618rsl25150120.9210.7087.34E-2278<table>tableseeoriginaldocumentpage79</column></row><table><table>tableseeoriginaldocumentpage80</column></row><table><table>tableseeoriginaldocumentpage81</column></row><table>SNPA=rs4415084rs7703618rsl3929730.7860.2671.07E-07rs7703618rs45668050.9030.2661.31E-07rs7703618rsl25204300.9060.2665.16E-08rs7703618rsl4059180.6360.2658.95E-08rs7703618rsl31834340.9070.2625.17E-08rs7703618rs74460900.8350.2591.68E-07rs7703618rs44936820.8330.2591.97E-07rs7703618rs77201040.8310.2582.29E-07rs7703618rs43084900.8310.2582.75E-07rs7703618rs77114440.9010.2544.18E-07rs7703618rs68934940.8310.2502.47E-07rs7703618rsl25231570.8310.2502.47E-07rs7703618rsll9545980.8310.2502.47E-07rs7703618rs68641490.8270.2492.79E-07rs7703618rsl25144140.8230.2474.51E-07rs7703618rsl25201240.5910.2476.18E-07rs7703618rs68767730.8220.2466.39E-07rs7703618rsl31875650.6030.2461.02E-06rs7703618rs77114460.8210.2467.62E-07rs7703618rs23374830.6230.2462.67E-0782<table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table>SNPA=rs4415084rs2067980rs64517960.7790.4347.64E-10rs2067980rs39230550.7790.4347.64E-10rs2067980rsl5013610.7790.4347.64E-10rs2067980rsl3929730.7790.4347.64E-10rs2067980rs68741270.7780.4309.74E-10rs2067980rs77092620.7760.4081.92E-09rs2067980rs9303950.7740.3834.51E-09rs2067980rs64517950.6400.3508.08E-08rs2067980rsll9481861.0000.3298.10E-11rs2067980rsl00515921.0000.3298.10E-11rs2067980rs68611500.5770.3243.93E-07rs2067980rsl04733870.7430.2984.83E-07rs2067980rsl69020861.0000.2944.OOE-10rs2067980rs77116971.0000.2914.65E-10rs2067980rs77165711.0000.2881.57E-09rs2067980rsl09416790.7590.2881.55E-07rs2067980rsl00433441.0000.2866.31E-10rs2067980rs73805591.0000.2836.59E-10rs2067980rs45184091.0000.2836.59E-10rs206798Qrs43290281.0000.2831.89E-0985SNPA=rs4415084rs2067980rsl4388211.0000.2836.59E-10rs2067980rsl4388201.0000.2836.59E-10rs2067980rsl33621321.0000.2836.59E-10rs2067980rsl31602591.0000.2836.59E-10rs2067980rsll9588081.0000.2836.59E-10rs2067980rsl0613101.0000.2836.59E-10rs2067980rsl05128651.0000.2836.59E-10rs2067980rsl0487581.0000.2836.59E-10rs2067980rsl00440961.0000.2836.59E-10rs2067980rs92929131.0000.2807.66E-10rs2067980rs73808781.0000.2802.18E-09rs2067980rsl31777111.0000.2807.66E-10rs2067980rsll9498471.0000.2788.92E-10rs2067980rs77217310.7360.2761.54E-06rs2067980rs97908961.0000.2751.04E-09rs2067980rsl4833090.7530.2702.69E-07rs2067980rsl4833060.7530.2702.69E-07rs2067980rsl33587180.7530.2702.69E-07rs2067980rsl00730550.7530.2702.69E-07rs206798Qrsl04724Q40.7500.2685.28E-0786<table>tableseeoriginaldocumentpage87</column></row><table>SNPA=rs4415084rs2067980rs44150851.0000.2542.71E-09rs2067980rs43217551.0000.2542.71E-09rs2067980rs22180811.0000.2542.71E-09rs2067980rs21650101.0000.2547.25E-09rs2067980rsl4388251.0000.2542.71E-09rs2067980rsl31569301.0000.2542.71E-09rs2067980rsl25150121.0000.2542.71E-09rs2067980rsl21871961.0000.2542.71E-09rs2067980rs44525660.8130.2545.19E-07rs2067980rsl00400820.9060.2521.42E-07rs2067980rs37474790.9000.2523.55E-07rs2067980rs9203291.0000.2513.15E-09rs2067980rsl8219361.0000.2513.15E-09rs2067980rsl09416781.0000.2513.15E-09rs2067980rsl08056851.0000.2513.15E-09rs2067980rs77174590.9050.2491.51E-07rs2067980rs68933190.9050.2491.51E-07rs2067980rs68759330.9050.2491.51E-07rs2067980rs68722540.9050.2491.51E-07rs206798Qrs64517780.9050.2491.51E-0788SNPA=rs4415084rs2067980rs43732870.9050.2491.51E-07rs2067980rsl8664060.9050.2491.51E-07rs2067980rsl4388220.9050.2491.51E-07rs2067980rsl4388190.9050.2491.51E-07rs2067980rsl31891200.9050.2491.51E-07rs2067980rsl31556980.9050.2491.51E-07rs2067980rsl31547810.9050.2491.51E-07rs2067980rsl04620800.9050.2491.51E-07rs2067980rsl00656380.9050.2491.51E-07rs2067980rsl00590860.9050.2491.51E-07rs2067980rsl00575210.9050.2491.51E-07rs2067980rsl00532470.9050.2491.51E-07rs2067980rsl00415180.9050.2491.51E-07rs2067980rsl00404880.9050.2491.51E-07rs2067980rsl00398660.9050.2491.51E-07rs2067980rs68752870.9040.2492.50E-07rs2067980rs44921181.0000.2493.66E-09rs2067980rs21650091.0000.2493.66E-09rs2067980rsl25226261.0000.2493.66E-09rs206798Qrsl25137490.9030.2483.02E-0789<table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table><table>tableseeoriginaldocumentpage92</column></row><table>SNPA=rs4415084rsl0035564rsl69020861.0000.8946.99E-30rsl0035564rs92929140.9540.8748.22E-24rsl0035564rs77116970.9590.8228.14E-25rsl0035564rs39350861.0000.8192.75E-26rsl0035564rsl05128751.0000.8192.75E-26rsl0035564rs73805590.9590.7941.31E-24rsl0035564rs45184090.9590.7941.31E-24rsl0035564rsl4388210.9590.7941.31E-24rsl0035564rsl4388200.9590.7941.31E-24rsl0035564rsl33621320.9590.7941.31E-24rsl0035564rsl31602590.9590.7941.31E-24rsl0035564rsll9588080.9590.7941.31E-24rsl0035564rsl0613100.9590.7941.31E-24rsl0035564rsl05128650.9590.7941.31E-24rsl0035564rsl0487580.9590.7941.31E-24rsl0035564rsl00440960.9590.7941.31E-24rsl0035564rs43290280.9580.7933.59E-24rsl0035564rs77165710.9580.7924.90E-24rsl0035564rsl31777110.9590.7921.92E-24rsl0035564rs92929130.9590.7923.86E-2493<table>tableseeoriginaldocumentpage94</column></row><table>SNPA=rs4415084rsl0035564rsl00575210.8800.7211.72E-21rsl0035564rsl00532470.8800.7211.72E-21rsl0035564rsl00415180.8800.7211.72E-21rsl0035564rsl00404880.8800.7211.72E-21rsl0035564rsl00398660.8800.7211.72E-21rsl0035564rsl25137490.8800.7213.45E-21rsl0035564rs68759330.8800.7203.43E-21rsl0035564rs77360920.8800.7192.46E-21rsl0035564rs68710520.8800.7192.46E-21rsl0035564rsl00700370.8800.7192.46E-21rsl0035564rs77085060.8800.7193.76E-21rsl0035564rs46423770.8770.7184.69E-21rsl0035564rsl26519490.8590.7183.09E-17rsl0035564rs37474790.8770.7176.57E-21rsl0035564rs68943240.8770.7166.70E-21rsl0035564rs44570880.8770.7166.70E-21rsl0035564rsl00385540.8770.7166.70E-21rsl0035564rs68682320.8740.7151.28E-20rsl0035564rsl00400820.8770.7149.58E-21rsl0035564rsll9517600.8750.7061.16E-1995<table>tableseeoriginaldocumentpage96</column></row><table><table>tableseeoriginaldocumentpage97</column></row><table><table>tableseeoriginaldocumentpage98</column></row><table><table>tableseeoriginaldocumentpage99</column></row><table>SNPA=rs4415084rsl0035564rsl25146151.0000.3646.12E-12rsl0035564rs68741270.8650.3573.92E-10rsl0035564rsl31875650.7470.3571.02E-09rsl0035564rs46137181.0000.3566.97E-14rsl0035564rs26254940.7660.3549.14E-11rsl0035564rs25802580.7660.3549.14E-11rsl0035564rsl3517200.7660.3549.14E-11rsl0035564rsl21101370.7660.3549.14E-11rsl0035564rsl00736360.7660.3549.14E-11rsl0035564rsl00437920.7660.3549.14E-11rsl0035564rsl25201240.7220.3517.29E-10rsl0035564rs45668051.0000.3503.68E-11rsl0035564rsl25204301.0000.3492.49E-11rsl0035564rs64517960.8630.3455.58E-10rsl0035564rs39230550.8630.3455.58E-10rsl0035564rsl5013610.8630.3455.58E-10rsl0035564rsl3929730.8630.3455.58E-10rsl0035564rs25891620.7560.3406.65E-10rsl0035564rsl31834341.0000.3402.99E-11rsl0035564rs744609Q0.9220.3396.66E-10100<table>tableseeoriginaldocumentpage101</column></row><table><table>tableseeoriginaldocumentpage102</column></row><table><table>tableseeoriginaldocumentpage103</column></row><table><table>tableseeoriginaldocumentpage104</column></row><table><table>tableseeoriginaldocumentpage105</column></row><table>SNPA=rs4415084rsll743392rs68602001.0000.4835.74E-18rsll743392rsl31875651.0000.4791.77E-16rsll743392rsl25201241.0000.4755.19E-17rsll743392rs74444050.9510.4611.77E-15rsll743392rsl00392830.9510.4611.77E-15rsll743392rs74439760.9510.4603.54E-15rsll743392rs68951910.9500.4603.12E-15rsll743392rs68784250.9500.4603.12E-15rsll743392rsl04620970.9500.4603.12E-15rsll743392rs68821390.9500.4445.53E-15rsll743392rsl31561980.9490.4441.11E-14rsll743392rsl00414780.9480.4383.12E-14rsll743392rs64518430.9480.4383.57E-14rsll743392rsl00421990.9470.4338.75E-14rsll743392rsl25209380.9480.4294.12E-14rsll743392rs77091310.9480.4283.36E-14rsll743392rs74455720.9480.4283.36E-14rsll743392rs68847160.9480.4283.36E-14rsll743392rs43025980.9480.4283.36E-14rsll743392rs42779240.9480.4283.36E-14106<table>tableseeoriginaldocumentpage107</column></row><table>SNPA=rs4415084rsll743392rsl26975230.8510.3781.23E-11rsll743392rsl26906780.8510.3781.23E-11rsll743392rsl26569530.8510.3781.23E-11rsll743392rs77187851.0000.3623.18E-14rsll743392rs77195001.0000.2761.59E-11rsll743392rs25891811.0000.2761.59E-11rsll743392rs43673081.0000.2761.59E-11rsll743392rs42823231.0000.2761.59E-11rsll743392rsl00417721.0000.2761.59E-11rsll743392rsl00417671.0000.2761.59E-11rsll743392rs42837981.0000.2742.54E-11rsll743392rsl31885851.0000.2706.52E-11rsll743392rs46263461.0000.2653.64E-11rsll743392rsl33616091.0000.2654.42E-11rsll743392rs49758891.0000.2606.07E-11rsll743392rsl8525951.0000.2606.07E-11rsll743392rsl02143691.0000.2606.07E-11rsll743392rs77002521.0000.2558.24E-11rsll743392rsl4833081.0000.2558.24E-11rsll743392rs96865801.0000.2558.24E-11108SNPA=rs4415084rsll743392rs77249711.0000.2558.24E-11rsll743392rs77197031.0000.2558.24E-11rsll743392rs77147131.0000.2558.24E-11rsll743392rs77034051.0000.2558.24E-11rsll743392rs74472321.0000.2558.24E-11rsll743392rs68986461.0000.2558.24E-11rsll743392rs68947841.0000.2558.24E-11rsll743392rs68942731.0000.2558.24E-11rsll743392rs68869501.0000.2558.24E-11rsll743392rs45605541.0000.2551.63E-10rsll743392rs44525661.0000.2551.16E-10rsll743392rs44373831.0000.2558.24E-11rsll743392rs44076371.0000.2558.24E-11rsll743392rs23379541.0000.2558.24E-11rsll743392rsl69022211.0000.2558.24E-11rsll743392rsl69022171.0000.2558.24E-11rsll743392rsl33599151.0000.2558.24E-11rsll743392rsl33574271.0000.2558.24E-11rsll743392rsl31593621.0000.2551.16E-10rsll743392rsl21091551.0000.2558.24E-11109<table>tableseeoriginaldocumentpage110</column></row><table><table>tableseeoriginaldocumentpage111</column></row><table><table>tableseeoriginaldocumentpage112</column></row><table><table>tableseeoriginaldocumentpage113</column></row><table><table>tableseeoriginaldocumentpage114</column></row><table><table>tableseeoriginaldocumentpage115</column></row><table>SNPA=rs4415084rs7716600rs64517701.0000.3921.56E-13rs7716600rs44196001.0000.3921.56E-13rs7716600rs44150851.0000.3921.56E-13rs7716600rs43217551.0000.3921.56E-13rs7716600rs22180811.0000.3921.56E-13rs7716600rs21650101.0000.3924.15E-13rs7716600rsl4388251.0000.3921.56E-13rs7716600rsl31569301.0000.3921.56E-13rs7716600rsl25150121.0000.3921.56E-13rs7716600rsl21871961.0000.3921.56E-13rs7716600rs44631881.0000.3907.67E-13rs7716600rs9203291.0000.3891.95E-13rs7716600rsl8219361.0000.3891.95E-13rs7716600rsl09416781.0000.3891.95E-13rs7716600rsl09416771.0000.3895.16E-13rs7716600rsl08056851.0000.3891.95E-13rs7716600rs44921181.0000.3852.44E-13rs7716600rs21650091.0000.3852.44E-13rs7716600rsl25226261.0000.3852.44E-13rs771660Qrsl69019371.0000.3783.20E-13116<table>tableseeoriginaldocumentpage117</column></row><table>rs7716600rs28771630.7740.2195.99E-07rs7716600rsl09416650.7740.2195.99E-07rs7716600rs73565970.7630.2141.35E-06rs771660Qrsl04733540.7600.2071.87E-06表4:關鍵SNP的序列范圍。關鍵SNPA:rs4415084deC0DE名稱SG05S3092(SEQIDNO:235)caggttatgctacttccctggaggacctctcaaaaggaagctgtttgttctatttctttctcatctgtcccaggactaggtattgcattaggagatcccttgcttcccactgctgcttttaaatcatttcatttccttcttcccttcattcttcccaaatgcaaggtctttcaactttcatttcgtgctacactctgccctttattgctgctctctggaatttgtggtcactgtccctcatacactgaaaactcacatacctctacctctagccctgttgtattcctgatgacttgagca[C/T]ccaagggagtgatacatacagcactggtcaatcatttctttacctgccacacatacagcaatctttaatttcaatagccttagccactcattcccaaataatgcttggatcatgcacattatcatgagtaaatacacccatgtctgaaatcctgatttcaagtacttcccaatttttctgtcttttctttactttcagetcacagaaacaattcttecaccatattaaaaactctaatccaattcacttgttccaccactttttttatteattattctctcctgtctttactttcttcct關鍵SNPB:rs7703618decODE名稱SG05S3065(SEQIDNO:140)gtg3gg3C3C3g3gcc3肌cc3tttc3cc3g3gggctg3gt朋ctct肌tctggc3gg3tg3ttetcctec3C3ggttgc朋tggcccctg肌3tttgg3cgc3ctttgtg3g3g3cc3gtgtcteg3t朋ct3gg肌cteggtaaatgttggagagctgcttcccttcatttctgtcattgtctgtttcatttcctttgcattgtttgttgatctgta118ttaaacaaaaatgaaagcaaaccttgtatctgagtctccatttttaccaatcctcacatttatggttcagtgtcttagtct[A/G]gtttcgaataacaagaaccttttgtacttggaagtataaaacttgatagcagcaacattattgatat肌tttcttcctct^g肌ttcate肌ctg3teg3ct肌tettgg3g肌3g肌3tgc肌ttt^ttgctg肌3gtctgtttc3gtttectggtcttgt肌teg3ggte肌3ttcte肌c^cttgggg3gctttggtg3g肌tt^朋teggtgggtg關鍵SNPC:rs2067980deC0DE名稱SG05S3114(SEQIDNO:160)gaatatgacgtcatataggcattaatttccatgttatgaattcaccagtaaaattgtttaaacagaga3gte^c肌gacggt肌tgttettc3ggt肌肌gteg3g3ggg肌肌g3肌tettgg肌cc3gttc3gc^cc3肌atggtgccagagcccaagcatgagttettaaaggctggtggttcctctctcctgacccatteccattcttatctctgatgctccaggctgtcagtttctttcttttttgaccatatacaggtaaggaaagcccatttatgagctattttatttcca[A/G]gttttaaaaatgtcaattgatataggctatgatctacagtaatgcttaatctattgaagtttttgc3tc3肌ttcc3tctt^g3tgc^gcctg肌gcccattt肌tgcc肌3tgte^tec肌gtgctegtttc3肌gggC肌g3ttC3肌g3肌g3C3肌C3g肌g3肌3gtetttt肌ttgCtetcte肌3g肌ggCtgtgttcttgggtg^tggctcc關鍵SNPD:rsl0035564deC0DE名稱SG05S31043C^t^gtttttegtg3tetteg3tttttttcatttttgg^g肌g肌C3g3肌肌gtgte肌肌g3tgg肌t^teteg肌肌tggtegctgg3gg3ttc3肌g肌g^ctc3cttttetcatgtc肌3gct肌肌tete肌ttgteg3ttttgc3tetgtec肌tg3gc3g肌3C3C3tegctg肌g肌3g肌gtgtgcte肌te肌t肌3tg肌gtattaatgattgagcagagtcttagaaagttggacatgttaagagcattgaatctatttagcctttcatgccatgcccaaa[A/G]tcagaattttaacctatactaggactttaagacaaaaaataggcaaacaaaatcacaaagtgttacaattgacatatgcagtgaattgtttcccttaaaaacaacattttttttttagttatatcactactataaaatttattcttcaacaggcaactaaacgtaatctggtttaatctttttttataaaggaacattttaaagtaattcttttctcctaacagaccatctattttcctctaaatctctttagctttaatatctattttagcgataaacagtgcatgaaataaacagctc關鍵SNPE:rsll743392deC0DE名稱SG05S3093aatctttcaaatatattcatctctcacttatttagggactgattatccaatttgtgaactatccctgtggcttctcctcttttctctaatgatttctcctctgcctatttccttaaatcgttttaatactaaatgagctgcatg肌肌C3g肌肌g肌gCt肌3gC3gC^肌tttg3t3C3tete肌C3gtectgC^肌g肌tttC3tttgtgCtC3tatgtttttgaattttcaattttctgttaccccacttccatatttcacactccagattatgtcaccccacccaactcccaa[C/T]aatttgaaattcaaatttggaaattcatctattggttcatttagttggaaactgcatattcacaggtgg3g3gtgg肌tetetttc肌肌cc3C3g3g肌肌肌肌肌肌acgt肌ttc肌cttcgtt^tttgttttt肌ttttcc肌3gctgg肌3ttgtctctetetctc肌ttg3tg3gtttctg3gcte^肌c3肌3c肌肌c3肌3c肌肌catcatttcctgtaaccagatttcactgctttcattctaagcaagatgatataaataacaatgagtagtcaagtatttattc關鍵SNPF:rs7716600(SEQIDNO:125)SG05S3097aggcctaatggttgtatatatatatttttttatttggtagcagaaaagactttaaaatatgttgatgtttgcgaggtaaagcatctatgtagggcattactatcaaggctttttttttctgcttgagtctatattacaaacattttattatgtctctgctgagattaatttaaatgtgcaaattttcaattcctaatataaagataaaatgtaaagttg3tcc3肌肌tec肌肌肌3gtg3t肌肌cttegtttgt肌teteg3ctc3tetetc3tetttttegttctetttcaatgct[A/G]tctagaatttttatcattgctttttacctgaagattcaaattgttttggcatcagtcgggaaatcatctc^g肌3tecggctec3gct肌ttgctetttctec3c肌3tt^c肌gc肌gctete肌ctggcatgtggg3ttttttttttttttttttctctgagacaaggtttcactctctctcccagacgggagtgcagtggtaccatcttggttcagggc表5:SNP和Centaurus分析描述SNP名稱SG05S3065或rs7703618繪圖信息(Build34)Chr5:44.960080+類型CENTAURUS的分析SG05S3065.cl,檢驗的狀態正向引物GCAAACCTTGTATCTGAGTCTCCAT反向引物GTGACCTGATAAGCAAGAATACCTVic探針CTTA*GTCTGGTFam探針TCT*T*A*GTCTAGT增強子TCGAATAACAAGAACC*表明如在[Kutyavin,etal.,(2006),NucleicAcidsRes,34,e128]中描述的修飾的堿基。實施例2.染色體5pl2上關聯信號的精修、與臨床變量的關聯和在染色體10q26上FGFR2基因座的研究我們已經在染色體5pl2上鑒定的信號定位至表現出低重組的染色體5pl2_ll的較大的延伸處。從該區域,我們選擇了來自IlluminaHap300芯片組的10個SNP,CentaurusSNP分析產生的[Kutyavin,etal.,(2006),NucleicAcidsRes,34,el28],并將它們分類在來自冰島的另外的樣品中和來自瑞典、荷蘭、西班牙和美國的復制樣品中。總共,歐洲世系的5028個病例和32090個對照被研究。所述區中最強關聯的IlluminaSNP是rs4415084,T等位基因產生1.16的組合優勢比(OR)和6.4X10—1Q的P值,其符合用于基因組范圍顯著性的Bonferroni標準(表6)。在單獨的復制樣品中,rs4415084產生1.14的OR(P=7.5X10—5)。為了精修該信號,我們分類了另外的11個SNP,其不在Illumina芯片上,但是與產生基本信號的H即300SNP在LD中。來自這些SNP的數據在表6和表7中呈現。最強的綜合信號(OR1.19,P=2.9X10—")起源于rsl0941679的G等位基因,與rs4415084相關的非IlluminaSNP(D'=0.99,r2=0.51,冰島群體中,表8)。等位基因G-rsl0941679比T_rs4415084不常見并最完整地包含在T_rs4415084背景上。然而,在多變量分析中,T-rs4415084在校正后對于G_rsl0941679保持名義的顯著性(P=0.042),并且反之亦然(P=0.0017,表9)。因此,盡管高度相關,但是沒有SNP完全解釋在5pl2處觀察到的信號。我們推斷T-rs4415084和G_rsl0941679均提供乳腺癌的風險。多變量分析揭示來自SNPrs7703618的信號能夠完全被T-rs4415084或G-rs10941679解釋(表9)。我們檢查了患者的醫學記錄,如果它們是可獲得的,并分析了來自冰島和復制樣品組對于5pl2處兩個風險變異體和在染色體10上FGFR2基因座處標記物rsl219648的組合的數據。所有三個變異體提供比ER陰性腫瘤顯著更大的雌激素受體(ER)陽性乳腺癌風險(表6和表10)。類似的優先風險對于孕激素陽性腫瘤對于5pl2變異體也被看到(表10)。我們先前報道了2q35和16ql2上的易感性變異體與ER陽性腫瘤特別相關[Stacey,etal.,(2007),NatGenet]。目前的發現增加了對這樣的概念的進一步支持,即,ER陽性和ER陰性腫瘤具有對于它們的風險的不同的遺傳成分。5pl2SNP還顯示出與較低組織級別的關聯,其通過在多變量分析中與ER狀況的關聯被解釋。FGFR2SNP在結節陽性腫瘤中比結節陰性腫瘤中更頻繁。沒有與腫瘤階段或組織病理學的顯著關聯(表IO)。在診斷中沒有變異體顯示出與年齡的顯著關聯。FGFR2SNP與乳腺癌的家族史有關,與先前的報道一致[Huijts,etal.,(2007),BreastCancerRes,9,R78;Easton,etal.,(2007),Nature447:1087-93]。類似的傾向(雖然不是統計學上顯著的)對于5pl2SNP被觀察到(表11)。方法患者和對照選擇來自研究受治療者的血液樣品和醫學信息的收集被進行告知的同意和按照DeclarationofHelsinki的倫理審查委員會(ethicalreviewboard)批準。:乳腺癌診斷的記錄從IcelandicCancerRegistry(ICR)獲得。ICR包含從1955年1月1日在冰島診斷的侵襲性乳腺腫瘤和導管或小葉癌原位的所有病例。具有進入ICR的診斷直到2006年12月末的冰島所有活著的流行病例適合參與所述研究。ICR包含這個期間診斷的4785名個體的記錄。同意、樣品和成功的基因型從大約2277個患者獲得。其中,基因型對于1791個患者從111咖inaHap300芯片獲得,而對于486個患者從Centaurus分析獲得。26,199個冰島對照由選自在deC0DE正在進行的基于Illumina的基因組范圍的關聯研究的個體組成。在ICR中具有乳腺癌的診斷的個體被排除。男性和女性均被包括。在冰島對照(以及下面描述的外來復制對照組)中,在表6列出的SNP的頻率中性別之間沒有顯著差異。因此,我們認為這些對照組在研究中提供了SNP的群體頻率的合理代表。西班牙:西班牙研究患者在2006年3月與2007年8月之間從OncologyD印artmentofZaragozaHospital被募集。基因型測定(genotyping)在大約642個患者上滿意地進行。1540個成功測定基因型的對照已經因為疾病而不是癌癥加入了Zaragoza的UniversityHospital。對照在抽取血液樣品前被詢問以排除先前的癌癥。所有的患者和對照是歐洲人種族。:瑞典樣品組由家族和連續患者系列組成。家族乳腺癌募集組由347名乳腺癌患者組成,其已經涉及到KarolinskaUniversityHospital,Stockholm的癌基因建議門診以進行乳腺癌的家族史的調查。每個患者來自不同的家族。符合對于BRCA突變篩查的目前標準的所有病例已經測試是陰性的。連續乳腺癌募集組包括482名連續募集的患者,其從1998年10月至lj2000年5月在D印artmentsof0ncologyatHuddingeandS6deritospitals(覆蓋南斯德哥爾摩的群體)被手術處理原發侵襲性乳腺癌。家族史在募集的患者的選擇中沒有被考慮。對照是1302名獻血者和448名兩個性別的無癌個體。所有的對照在KarolinskaUniversityHospital,Stockholm被收集。對于測試的SNP中的121任何一個均沒有家族和連續系列之間的顯著異質性的證據。:在2005-2006期間診斷有乳腺癌的女性患者從由ComprehensiveCancerCentreEastinNijmegen,theNetherlands進行的地區癌癥登記處選擇。該癌癥中心保持基于群體的癌癥登記并覆蓋荷蘭東部,具有1.3百萬居民的區域。70歲前診斷有乳腺癌的所有患者被邀請參與所述研究。ComprehensiveCancerCentreEast從癌癥登記處的所有患者收集臨床和病理數據。這些標準癌癥登記數據通過從治療患者的醫院中的醫療文件提取而補充更詳細的數據。對照在2002-2003中的調查中由RadboudUniversityNijmegenMedicalCenter收集。這個調查,NijmegenBiomedicalStudy,是基于Nijmegen的群體的年齡-分層的隨機樣品。來自這個組的2034個對照個體,通過與患者群體的頻率的年齡-匹配,被選擇并測定基因型。美國多種族組多種族群組研究(MultiethnicCohortstudy)(MEC)由夏威夷和洛杉磯的超過215,000名男性和女性組成(還有另外的來自加利福尼亞其他地方的非洲-美國人)。所述組主要包括非洲美國人、當地夏威夷人、日本美國人、拉丁美洲人和歐洲美國人,其在1993年和1996年之間通過完成26頁的自我-管理的調查表進入所述研究,所述調查表詢問關于飲食習慣、人口統計因素、個人行為、先前醫療狀況的歷史、常見癌癥的家族史、以及對于女人的生產史和外源激素使用的詳細的信息。參與者登記年齡在45歲與75歲之間。MEC中的偶發癌癥通過與覆蓋夏威夷和洛杉磯地區的基于群體的癌癥監督、流行病學和最終結果(Surveillance,EpidemiologyandEndResults)(SEER)登記處和覆蓋所有加利福尼亞的加利福尼亞州癌癥登記處的組連鎖(cohortlinkage)來鑒定。開始于1994年,血液樣品從偶發乳腺癌病例和MEC參與者的隨機樣品收集以用作組中遺傳分析的對照池。巢式乳腺癌病例_對照研究中的合適的病例由到2002年12月31日加入MEC中后診斷的具有偶發侵襲性癌癥的女性組成。對照是在進入所述組前沒有乳腺癌并直到2002年12月31日沒有診斷的參與者。對照基于種族/性別和年齡(在5年間隔內)與病例是頻率匹配的。尼日利亞:我們從來自尼日利亞伊巴丹的689個偶發乳腺癌病例和469個對照獲得基因型。病例在呈遞中被連續募集并隨后在D印artmentsofSurgeryandRadiotherapy,UniversityCollegeHospital,Ibadan,Nigeria中被組織學石角認。這個醫院供應3百萬人的服務范圍并且是所述區中其他醫院的腫瘤學分派中心。基于群體的對照從鄰近所述醫院的社區隨機募集。在社區會診過程后,對照受治療者被邀請參加為所述研究目的設立的診所。對照是募集時無癌的并超過18歲。基因型測定大約1791個冰島患者和26199個對照在IlluminaH即300SNP陣列上被測定基因型,如先前所描述的[Stacey,etal.,(2007),NatGenet39:865-9]。所有其他基因型測定利用NanongenCentaurus分析進行[Kutyavin,etal.,(2006),NucleicAcidsRes,34,el28],其被產生用于SNP,在表7中示出。引物序列函索獲得。CentaurusSNP分析通過基因型測定H即M即CEU樣品以及比較所述基因型與公開的數據來證實。如果它們顯示與H即M即數據>1.5%的錯配,則分析被拒絕。大約10%的冰島病例樣品在Illumina和Nanogen平臺上被基因型測定,并且觀察到的錯配率低于0.5%。所有的基因型測定在deCODEGenetics設備上進行。所有的物理坐標根據NCBIBuild35給出。臨床參數雌激素和孕酮受體狀況來自在醫療檔案中報道的免疫組織化學或免疫試驗(免疫分析)結果。>10fmol/mg的受體水平或^10%陽性細胞核的免疫組織化學觀察被認為是陽性的。根據AmericanjointCommitteeonCancer,6thEdition確定階段。組織亞型從如下的SNOMED-M(或相當的ICD0)編碼來確定"侵襲性導管癌"8500/3,8521/3;"DCIS"(導管癌原位和相關原位癌)8500/2,8050/2,8201/2,8501/2,8503/2,8507/2,8522/2;"侵襲性小葉癌":8520/3;"LCIS"(小葉癌):8520/2;"導管或Mucinous":8211/3,8480/3,8481/3;"髓樣癌"8510/3,8512/3;"混合侵襲性"8522/3,8523/3,8524/3,8541/3,8543/3;"其他侵襲性":8050/3,8141/3,8200/3,8260/3,8323/3,8401/3,8490/3,8501/3,8503/3,8504/3,8530/3,8540/3。具有下面的非特異性編碼的腫瘤從組織病理類型的分析中被排除8000/3,8010/2,8010/3,8010/6,8020/3,8140/2,8140/3,8230/3。組織級別根據Nottingham(Elston-EllismodificationoftheScarff_Bloom_Richardson)系統被指定。結節狀況被分析用于階段1到IIIB,并基于通過腋窩淋巴結解剖法和/或前哨淋巴結活組織檢查獲得的病例分級。SwedenFamilal樣品組沒有用在臨床參數的分析中。統計分析我們計算對于每個SNP等位基因的0R,假定乘法模型;S卩,假定個人攜帶的兩個等位基因的相對風險相乘。對于標記物等位基因頻率和OR被示出。相關的P值用標準似然比x2統計量計算,如在NEMO軟件包中實施的(GretarsdottirS.,etal.,Nat.Genet.35:131-38(2003))。置信區間被計算,假定OR的估計具有對數_正態分布。對于在強LD中的SNP,無論何時一個SNP的基因型從個體缺失,相關的SNP的基因型用于通過如先前所述的似然方法歸因(impute)基因型(GretarsdottirS.,etal.,Nat.Genet.35:131-38(2003))。這確保對于不同SNP呈現的結果是基于相同數量的個體,允許OR和P_值的有意義的比較。多病例-對照復制組的聯合分析利用Mantel-Haenszel模型進行,其中所述組被允許對于等位基因或基因型具有不同的群體頻率但是被假定具有相同的相對風險。通過假定等位基因頻率在零假設下在所有組中相同,但是每個組在備選假設下具有不同的等位基因頻率來進行異質性的測試。病例的多個組的聯合分析利用擴展的Mantel-Haenszel模型進行,其對應于利用組指征(組指示符,groupindicator)作為共變量的多分類有序反應變量logistic回歸(polytomouslogisticregression)。對于領lj試的SNP中的任何一個均沒有復制樣品組之間異質性的證據。診斷中風險變異體與年齡的關聯和與組織學級別的關聯通過參數值與每個個體攜帶的風險等位基因的拷貝數之間的線性回歸來測試。為了分析家族史,我們對于每個基因型通過改編我們先前描述的方法(AmundadottirL.T.,etal.,PLoSMed.1:e65(2004))以適應基因型_特異性家族相對風險(gfRRgt)來計算對于一級親屬的家族相對風險。對于每個SNP基因型,我們測定gfRRgt為123其中r為具有基因型gt的乳腺癌患者的一級親屬的數量(計數乘以倍數那些個體,所述個體與超過一個具有基因型gt的患者相關),而a是具有基因型gt的乳腺癌患者的一級親屬的數量,其本身受乳腺癌影響。在分母中,n為群體的大小,而x為受疾病影響的群體中人的數量(來自ICR記錄)。為了比較一個基因型的觀察到的gfRRgt與另一個,我們計算了比率gfRR^/gfRR^。這些后面的比率的顯著性通過模擬來確定對于每個gfRRgt的對照組從對于所討論的SNP基因型測定的乳腺癌患者的組隨機抽取。對照組是與每個相應的觀察到的gfRRgt組相同的大小,并在IcelandicGenealogicalDatabase中列出的雙親的數量上是匹配的(0、1或2)。計算對照組gfRRgtl/gfRRgt2比率的一萬個重復倍,并且P值通過計數對于對照組的比率每隔多久匹配或超出觀察的gfRRgtl/gfRRgt2來確定。我們通過假定Hardy-Weinber平衡,估計群體中的基因型頻率來計算基因型特異的0R。沒有觀察到顯著的與多重性(multiplicity)的偏差。基因座之間的潛在相互作用利用等位基因計數的相關性檢驗和通過攜帶者和非攜帶者的病例-對照關聯來檢驗。沒有觀察到顯著的相互作用。—些冰島患者和對照彼此相關,在組內和組之間,造成x2統計量具有>1的平均值。我們通過冰島人系譜通過模擬基因型估計膨脹因子(inflationfactor),如先前描述的(GrantS.F.,etal.,NatGenet38:320-3(2006)),并由此校正對于冰島OR的x2統計量。估計的膨脹因子對于冰島人的完整組(病例和對照)是1.08,而對于用在臨床表型分析中的所有其他亞組較小,但是^1。表6.5pl2和10q26基因座中SNP與對于乳腺癌的風險的關聯<table>tableseeoriginaldocumentpage125</column></row><table>數量_頻率位置SNP等位基因樣品組病例對照病例對照0Ra95。/oCIP*a等位基因Odd比在乘法模型下計算。V斤有的P值是雙側的并已經被調整用于水島病例和對照的相關性和其他潛在分層。e水島凄t據一皮組合Illumina和Centaurus分片斤-來源的復制數據組。d為了對于"非水島人"、"所有樣品,,和ER組的組合的數據的分析,OR和P4直利用Mantel-Haenszel方法計算,并且頻率作為個體組的頻率的筒單(算術)方式。eCGEMS數據僅為了比較目的被顯示并且不包括在任何計算中。10q26rs121恥482270<table>tableseeoriginaldocumentpage126</column></row><table><table>tableseeoriginaldocumentpage127</column></row><table><table>tableseeoriginaldocumentpage128</column></row><table><table>tableseeoriginaldocumentpage129</column></row><table><table>tableseeoriginaldocumentpage130</column></row><table><table>tableseeoriginaldocumentpage131</column></row><table><table>tableseeoriginaldocumentpage132</column></row><table><table>tableseeoriginaldocumentpage133</column></row><table><table>tableseeoriginaldocumentpage134</column></row><table><table>tableseeoriginaldocumentpage135</column></row><table><table>tableseeoriginaldocumentpage136</column></row><table><table>tableseeoriginaldocumentpage137</column></row><table><table>tableseeoriginaldocumentpage138</column></row><table><table>tableseeoriginaldocumentpage139</column></row><table><table>tableseeoriginaldocumentpage140</column></row><table><table>tableseeoriginaldocumentpage141</column></row><table><table>tableseeoriginaldocumentpage142</column></row><table><table>tableseeoriginaldocumentpage143</column></row><table><table>tableseeoriginaldocumentpage144</column></row><table>表12.用于標記物rs4415084的代理標記物。選擇與HapMapCEU數據組(http:〃www.hapmap.org)中的rs4415084具有大于0.2的r2值、lMb間隔,在所述標記物側翼的標記物。示出的是相關SNP的名稱、與rs4415084的r2和D'值、和相應的P值、以及代理標記物在NCBIBuild36中的位置和包含對于所述標記物的側翼序列的序列id的參考。<table>tableseeoriginaldocumentpage145</column></row><table><table>tableseeoriginaldocumentpage146</column></row><table><table>tableseeoriginaldocumentpage147</column></row><table><table>tableseeoriginaldocumentpage148</column></row><table><table>tableseeoriginaldocumentpage149</column></row><table><table>tableseeoriginaldocumentpage150</column></row><table><table>tableseeoriginaldocumentpage151</column></row><table><table>tableseeoriginaldocumentpage152</column></row><table><table>tableseeoriginaldocumentpage153</column></row><table><table>tableseeoriginaldocumentpage154</column></row><table><table>tableseeoriginaldocumentpage155</column></row><table><table>tableseeoriginaldocumentpage156</column></row><table><table>tableseeoriginaldocumentpage157</column></row><table><table>tableseeoriginaldocumentpage158</column></row><table><table>tableseeoriginaldocumentpage159</column></row><table><table>tableseeoriginaldocumentpage160</column></row><table><table>tableseeoriginaldocumentpage161</column></row><table><table>tableseeoriginaldocumentpage162</column></row><table>發現SNP相關SNPR2D,P-值在Bld36中的位置SEQIDNO:rsl0941679rsl00440960.8372220.41.49E-50rsl0941679rsl00415180.8415730.4348942.26E-51rsl0941679rsl25176900.8415730.4348942.26E-52rsl0941679rs68752870.8332880.4199683.75E-53rsl0941679rsll9588080.8372220.41.49E-54rsl0941679rs20679800.7670840.3047484.34E-0845018074160rsl0941679rsll9481860.6345930.2665431.36E-0745087191171rsl0941679rsl31834340.6854810.2433589.99E-0745110390175rsl0941679rsl00515920.6345930.2665431.36E-0745126063177表14.用于標記物rsl219648的代理SNP標記物。選擇與HapM即CEU數據組(http:〃麗w.h即map.org)中的rsl219648具有大于0.2的r2值、lMb間隔,在所述標記物側翼的標記物。示出的是相關SNP的名稱、與rs1219648的一和D'值、和相應的P值、以及代理標記物在NCBIBuild36中的位置和包含對于所述標記物的側翼序列的序列id的參考。發現SNP相關SNPR2D'P-值在Bld36中的位置SEQIDNO:rsl219648rs375081710.4878055.60E-220rsl219648rsll20001410.9643929.67E-331rsl219648rs291278010.9654182.47E-342rsl219648rs298157910.9654182.47E-343rsl219648rsl07880610.9663873.53E-354163<table>tableseeoriginaldocumentpage164</column></row><table>權利要求一種用于確定人類個體中對乳腺癌的易感性的方法,包括確定至少一個多態標記物的至少一個等位基因是否存在于從所述個體獲得的核酸樣品中或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rs10941679(SEQIDNO236)、rs4415084(SEQIDNO235)、和rs1219648(SEQIDNO237)、以及在與其連鎖不平衡中的標記物,并且其中所述至少一個等位基因的存在指示所述個體對乳腺癌的易感性。2.根據權利要求1所述的方法,其中,所述至少一個多態標記物選自表12、表13和表14中列出的標記物。3.根據權利要求1或權利要求2所述的方法,其中,所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)。4.根據前述權利要求中任一項所述的方法,進一步包括評估所述個體中至少一個單體型的頻率。5.根據前述權利要求中任一項所述的方法,其中,由所述至少一個等位基因或單體型的存在提供的所述易感性是增加的易感性。6.根據權利要求6所述的方法,其中,所述rs4415084(SEQIDNO:235)中等位基因T、rsl0941679(SEQIDNO:236)中等位基因G和/或rsl219648(SEQIDNO:237)中等位基因G的存在指示所述個體中對乳腺癌增加的易感性。7.根據權利要求5或6所述的方法,其中,所述至少一個等位基因或單體型的存在指示具有至少1.15的相對風險(RR)或優勢比(OR)的對乳腺癌的增加的易感性。8.根據權利要求5或6所述的方法,其中,所述至少一個等位基因或單體型的存在指示具有至少1.16,包括至少1.17、至少1.18、至少1.19、至少1.20、至少1.21、至少1.22、至少1.23、至少1.24、至少1.25、至少1.26、至少1.27、至少1.28、至少1.29和至少1.30的相對風險(RR)或優勢比(OR)的增加的易感性。9.根據權利要求1-4中任一項所述的方法,其中,由所述至少一個等位基因或單體型的存在提供的所述易感性是降低的易感性。10.根據前述權利要求中任一項所述的方法,進一步包括確定不與表12、表13和表14中列出的所述標記物中的任何一個連鎖不平衡的對于乳腺癌的至少一個風險中的變異體的至少一個風險中的等位基因是否存在于包含來自人類個體的基因組DNA的樣品中或存在于來自人類個體的基因型數據組中。11.根據權利要求1-9中任一項所述的方法,包括確定在至少兩個多態標記物的每一個中的至少一個等位基因是否存在于包含來自人類個體的基因組DNA的樣品中或存在于來自人類個體的基因型數據組中,其中在所述至少兩個多態標記物中的所述至少一個等位基因的存在指示對乳腺癌增加的易感性。12.根據前述權利要求中任一項所述的方法,進一步包括確定對于乳腺癌的至少一個高外顯遺傳因子在從所述個體獲得的核酸樣品中或來自所述個體的基因型數據組中的存在或缺乏的步驟。13.根據權利要求12所述的方法,其中,所述高外顯遺傳因子是在BRCA1、BRCA2、TP53和/或PTEN中的突變。14.根據前述權利要求中任一項所述的方法,進一步包括分析非遺傳信息以進行所述個體的風險評估、診斷、或預后。15.根據權利要求14所述的方法,其中,所述非遺傳信息選自年齡、性另ij、種族、社會經濟狀態、先前疾病診斷、受治療者的醫療史、乳腺癌的家族史、生物化學測量、以及臨床測16.根據權利要求11-15中任一項所述的方法,進一步包括計算組合的風險。17.—種確定在先前診斷有乳腺癌的個體中至少發展第二原發腫瘤的風險的方法,所述方法包括確定至少一個多態標記物的至少一個等位基因是否存在于從所述個體獲得的核酸樣品中,或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,并且其中所述至少一個等位基因的存在指示至少發展第二原發腫瘤的風險。18.根據權利要求17所述的方法,其中,所述至少一個多態標記物選自表12、表13和表14中列出的所述標記物。19.一種用于評估人類個體中對乳腺癌的易感性的試劑盒,所述試劑盒包括用于選擇性檢測所述個體的基因組中至少一個多態標記物的至少一個等位基因的試劑,其中所述多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,并且其中所述至少一個等位基因的存在指示對乳腺癌的易感性。20.根據權利要求19所述的試劑盒,其中,所述至少一個多態標記物選自表12、表13和表14中列出的所述標記物。21.根據權利要求19或權利要求20所述的試劑盒,其中,所述試劑包括雜交到包括所述至少一個多態標記物的所述個體的基因組的片段的至少一個連續寡核苷酸、緩沖劑以及可檢測的標記。22.根據權利要求19-21中任一項所述的試劑盒,其中,所述試劑包括雜交到從所述受治療者獲得的基因組核酸區段的相反鏈的至少一對寡核苷酸,其中每個寡核苷酸引物對被設計成選擇性地擴增包括一個多態標記物的所述個體的基因組的片段,并且其中所述片段的大小為至少30個堿基對。23.根據權利要求21或權利要求22所述的試劑盒,其中,所述至少一個寡核苷酸完全互補于所述個體的所述基因組。24.根據權利要求19-23中任一項所述的試劑盒,其中,所述試劑盒包括a.長度為5-100個核苷酸的檢測寡核苷酸探針;b.長度為5-100個核苷酸的增強子寡核苷酸探針;以及c.核酸內切酶;其中所述檢測寡核苷酸探針特異性雜交到其核苷酸序列在SEQIDNO:1-237的任何一個中列出的所述核酸的第一區段,并且其中所述檢測寡核苷酸探針包括在其3'末端的可檢測的標記和在其5'末端的猝滅部分;其中所述增強子寡核苷酸的長度為5-100個核苷酸并互補于相對于所述寡核苷酸探針為5'的所述核苷酸序列的第二區段,使得當兩個寡核苷酸均雜交到所述核酸時,所述增強子寡核苷酸相對于所述檢測寡核苷酸探針位于3';其中單一堿基間隙存在于所述第一區段與所述第二區段之間,使得當所述寡核苷酸探針和所述增強子寡核苷酸探針均雜交到所述核酸時,單一堿基間隙存在于所述寡核苷酸之間;以及其中在所述檢測探針雜交到所述核酸時,用所述核酸內切酶處理所述核酸將從所述檢測探針的3'末端剪切所述可檢測的標記以釋放游離的可檢測的標記。25.—種用于確定人類個體中對于乳腺癌的遺傳指征的裝置,包括計算機可讀存儲器;以及存儲在所述計算機可讀存儲器上的程序;其中所述程序適于在處理器上被執行以分析對于至少一個人類個體關于至少一個多態標記物的標記物和/或單體型信息,所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及與在其連鎖不平衡中的標記物,并產生基于所述標記物或單體型信息的輸出,其中所述輸出包括作為對于所述人類個體的乳腺癌的遺傳指征的所述至少一個標記物或單體型的個體風險測量。26.根據權利要求25所述的裝置,其中,所述程序進一步包括與所述至少一個標記物等位基因和/或單體型相關的乳腺癌的風險測量,其中所述風險測量基于多個診斷有乳腺癌的個體中至少一個多態標記物的至少一個等位基因和/或單體型的頻率與多個參考個體中至少一個多態標記物的至少一個等位基因和/或單體型的頻率的指征的比較,并且其中對于所述人類個體的個體風險是基于所述個體對于所述至少一個標記物等位基因和/或單體型的攜帶者狀態與對于所述至少一個標記物等位基因和/或單體型的所述風險測量的比較。27.根據權利要求25或26所述的裝置,其中,所述至少一個多態標記物選自表12、表13和表14中列出的所述標記物。28.—種用于評估對乳腺癌的易感性的標記物的鑒定方法,所述方法包括a.鑒定在與rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)中的至少一個連鎖不平衡中的至少一個多態標記物;b.確定診斷有乳腺癌或具有對乳腺癌的易感性的個體的樣品的基因型狀態;以及c.確定對照個體的樣品的所述基因型狀態;其中與所述對照樣品中所述至少一個等位基因的所述頻率相比,診斷有乳腺癌或具有對乳腺癌的易感性的個體中至少一個多態性中至少一個等位基因的頻率的顯著差異指示被用于評估對乳腺癌的易感性的所述至少一個多態性。29.根據權利要求28所述的方法,其中,與所述對照樣品中所述至少一個等位基因的頻率相比,診斷有乳腺癌或具有對乳腺癌的易感性的個體中的所述至少一個多態性中所述至少一個等位基因頻率的增加指示被用于評估對乳腺癌的增加的易感性的所述至少一個多態性。30.根據權利要求28或權利要求29所述的方法,其中,與所述對照樣品中所述至少一個等位基因的頻率相比,診斷有乳腺癌或具有對乳腺癌的易感性的個體中所述至少一個多態性中所述至少一個等位基因的頻率降低指示用于評估對乳腺癌的降低的易感性或針對乳腺癌的保護的所述至少一個多態性。31.—種對從人類個體獲得的核酸樣品進行基因型測定的方法,包括確定至少一個多態標記物的至少一個等位基因是否存在于來自所述個體樣品的核酸樣品中,其中所述至少一個標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDN0:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,并且其中所述樣品中所述至少一個等位基因的存在的確定指示所述個體中對乳腺癌的易感性。32.根據權利要求31所述的方法,其中,rs4415084(SEQIDNO:235)中等位基因T、rsl0941679(SEQIDNO:236)中等位基因G和/或rsl219648(SEQIDNO:237)中等位基因G的存在的確定指示所述個體中乳腺癌的增加的易感性。33.根據權利要求31或32所述的方法,其中,基因型測定包括利用位于所述至少一個多態標記物側翼的核苷酸引物對,通過聚合酶鏈反應(PCR)來擴增包括所述至少一個多態標記物的核酸的區段。34.根據權利要求31-33中任一項所述的方法,其中,基因型測定利用選自等位基因-特異性探針雜交、等位基因-特異性引物延伸、等位基因-特異性擴增、核酸測序、5'-核酸外切酶消化、分子標志分析、寡核苷酸連接分析、大小分析、單鏈構象分析以及微陣列技術的方法來進行。35.根據權利要求34所述的方法,其中,所述方法包括等位基因-特異性探針雜交。36.根據權利要求34所述的方法,其中所述方法是微陣列技術。37.根據權利要求31-35中任一項所述的方法,包括1)在用于所述寡核苷酸探針與所述核酸的特異性雜交的條件下,使所述核酸的拷貝與檢測寡核苷酸探針和增強子寡核苷酸探針接觸;其中,a)所述檢測寡核苷酸探針的長度是5-100個核苷酸并且特異性地雜交到其核苷酸序列由SEQIDNO:1-237中的任一個給出的核酸的第一區段;b)所述檢測寡核苷酸探針包括在其3'末端處的可檢測的標記和在其5'末端處的猝滅部分;c)所述增強子寡核苷酸的長度是5-100個核苷酸并且互補于相對于所述寡核苷酸探針在5'的所述核苷酸序列的第二區段,使得當兩個寡核苷酸雜交到所述核酸時,所述增強子寡核苷酸相對于所述檢測寡核苷酸探針位于3';以及d)單一堿基間隙存在于所述第一區段與所述第二區段之間,使得當所述寡核苷酸探針和所述增強子寡核苷酸探針均雜交到所述核酸時,單一堿基間隙存在于所述寡核苷酸之間;2)用核酸內切酶處理所述核酸,當所述檢測探針被雜交到所述核酸時,所述核酸內切酶將從所述檢測探針的3'末端剪切所述可檢測的標記以釋放游離的可檢測的標記;以及3)測量游離的可檢測的標記,其中所述游離的可檢測的標記的存在表明所述檢測探針特異性雜交到所述核酸的所述第一區段,并表明作為所述檢測探針的互補物的所述多態位點的所述序列。38.—種評估個體對乳腺癌治療劑的反應的可能性的方法,包括確定至少一個多態標記物的至少一個等位基因是否存在于從所述個體獲得的核酸樣品中或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的標記物,其中所述至少一個標記物的所述至少一個等位基因的存在指示對所述治療劑的陽性反應的可能性。39.—種預測診斷有乳腺癌的個體的預后的方法,所述方法包括確定至少一個多態標記物的至少一個等位基因是否存在于從所述個體獲得的核酸樣品中,或存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237)、以及在與其連鎖不平衡中的標記物,其中所述至少一個等位基因的存在指示所述個體中所述乳腺癌的較壞預后。40.—種監測經歷對于乳腺癌的治療的個體的治療進展的方法,所述方法包括確定至少一個多態標記物的至少一個等位基因是否存在于從所述個體獲得的核酸樣品中,或者存在于來自所述個體的基因型數據組中,其中所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的標記物,其中所述至少一個等位基因的存在指示所述個體的治療結果。41.根據權利要求38-40中任一項所述的方法,其中,所述至少一個多態標記物選自表12、表13和表14中列出的所述標記物。42.寡核苷酸探針在制備用于診斷和/或評估對人類個體中乳腺癌的易感性的試劑中的應用,其中所述探針雜交到具有如在SEQIDNO:1-237的任一個中列出的核苷酸序列的核酸的區段,其中所述探針的長度為15-500個核苷酸。43.—種計算機可讀介質,在所述計算機可讀介質上儲存有a.用于至少一個多態標記物的標識符;b.診斷有乳腺癌的多個個體中所述至少一個多態標記物的至少一個等位基因的頻率的指征;以及c.多個參考個體中所述至少一個多態標記物的所述至少一個等位基因的頻率的指征;其中,所述至少一個多態標記物選自rsl0941679(SEQIDNO:236)、rs4415084(SEQIDNO:235)、和rsl219648(SEQIDNO:237),以及在與其連鎖不平衡中的多態標記物。44.根據權利要求43所述的介質,其中,所述多態標記物選自表12、表13和表14中列出的所述標記物。45.根據權利要求43或44所述的介質,進一步包括關于所述多個個體的世系的信息。46.根據前述權利要求中任一項所述的方法、試劑盒、應用、介質或裝置,其中,所述至少一個等位基因的存在是雌激素受體陽性或孕酮受體陽性乳腺癌的預兆。47.根據前述權利要求中任一項所述的方法、試劑盒、應用、介質或裝置,其中,標記物之間的連鎖不平衡的特征在于所述連鎖不平衡測量值r2和/或ID'I的特定數值。48.根據前述權利要求中任一項所述的方法、試劑盒、應用、介質或裝置,其中,標記物之間的連鎖不平衡的特征在于至少0.2的r2值。49.根據前述權利要求中任一項所述的方法、試劑盒、應用、介質或裝置,其中,所述人類個體是包括歐洲世系的世系。全文摘要本發明涉及作為乳腺癌的易感性變異體的Chr5p12和Chr10q26上的一些遺傳變異體。描述了利用這樣的變異體的疾病管理方法,包括診斷對乳腺癌的增加和/或降低的易感性,預測對治療的反應的方法和預測預后的方法。本發明進一步涉及用在本發明的方法中的試劑盒。文檔編號C12Q1/68GK101772578SQ200880100074公開日2010年7月7日申請日期2008年5月21日優先權日2007年5月25日發明者安德烈·馬諾列斯庫,帕特里克·薩利姆,西蒙·斯塔塞申請人:解碼遺傳學私營有限責任公司