專利名稱:用于乳腺癌風險評估的方法
技術領域:
本發明涉及用于評估人類女性受試者發生乳腺癌表型的總體風險的方法和系統。具體地,本發明涉及結合臨床風險評估和遺傳風險評估以改進風險分析。
背景技術:
像其它常見癌癥一祥,乳腺癌表現出家族性聚集。很多流行病學研究已經證實,總體而言,該疾病在乳腺癌患者的一級親 屬中約為常人的兩倍。家族研究,特別是雙胞胎研究,表明大多數(如果不是全部)的這種聚集具有遺傳基礎。例如,Peto和Mack (2000)估計,一個患病女性的MZ雙胞胎的乳腺癌風險約比病例姊妹的風險高四倍。已經鑒定出ー些乳腺癌易感性(susceptibility)基因,最重要的是BRCAl和BRCA2。這些基因中的突變引起乳腺癌的高風險(截止到70歲,分別約為65%和45%的等級)。基于群體的系列乳腺癌病例的突變篩查已經顯示,僅有約15%的乳腺癌家族性風險能用這些基因中的突變來解釋。其它已知的乳腺癌易感性基因(TP53、PTEN、ATM、CHEK2)對于家族性風險僅有很小的貢獻(因為素因性的(predisposing)突變很少和/或者僅引起較小的風險)。因此,總的來說,估計已知的乳腺癌易感性基因解釋不多于20%的家族性風險。風險中的遺傳變異可能源自于罕見的高度外顯性(penetrant)突變(例如在BRCAl和BRCA2中的那些)或源自引起更多中等風險的變異。一些證據強烈表明,高度外顯性突變不是其余的乳腺癌家族性風險的主因。首先,多個病例家族的突變篩查已經發現,大多數具有很強家族史的病例(例如,四個或更多個患病親屬)具有BRCAl或BRCA2突變。其次,盡管在過去九年中做出了大量努力,但遺傳連鎖研究尚未鑒定出任何其它的連鎖基因座(loci)。再次,大系列乳腺癌家族的分離分析在調節BRCAl和BRCA2之后,沒有發現另外的主要的顯性乳腺癌易感性等位基因的證據。在ー個大型分析中,Antoniou等人(2009)發現,大部分乳腺癌的最簡約模型(parsimonious model)是多基因模型,相當于大量較小影響的基因座倍增性結合。因此,技術所需的是另外的用于評估女性受試者中乳腺癌易感性的方法。
發明內容
本發明涉及用于評估人類女性受試者發生乳腺癌表型的總體風險的方法。令人驚訝的是,作者發現,將單核苷酸多態性與臨床風險評估相結合提供超過單獨使用臨床風險評估的優勢。因此,在第一個方面,本發明提供用于評估人類女性受試者發生乳腺癌表型的總體風險的方法,其包括進行女性受試者的臨床風險評估;進行女性受試者的遺傳風險評估,其中遺傳風險評估包括,在從女性受試者獲得的生物樣品中檢測至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在;和將臨床風險評估與遺傳風險評估結合,以獲得人類女性受試者發生乳腺癌表型的總體風險。本發明也可用于將已經使用臨床風險評估進行分析的受試者重新分類。因此,另一方面,本發明提供確定通過臨床風險評估來分析的人類女性受試者發生乳腺癌表型的總體風險是否應該重新分類的方法,該方法包括將臨床風險評估與遺傳風險評估結合,以獲得人類女性受試者發生乳腺癌表型的總體風險,其中遺傳風險評估包括,在從女性受試者獲得的生物樣品中檢測至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在;和確定將臨床風險評估與遺傳風險評 估結合是否引起受試者發生乳腺癌表型風險的重新分類。在一個實施方式中,該方法的凈重新分類改進(net reclassificationimprovement, NRI)大于0. 01,更優選大于0. 05,甚至更優選大于0. 08。在另ー個實施方式中,NRI為約0. 09。在一個實施方式中,通過臨床風險評估所確定的5年風險在約I. 5% 約2%之間。在該實施方式中,優選該方法的凈重新分類改進(NRI)大于0. 1,更優選大于0. 12,甚至更優選大于0. 15。在另ー個實施方式中,NRI為約0. 195。合適的臨床風險評估程序的例子包括,但不限干,Gail模型、Claus模型、Claus表格、BOADICEA> Jonker 模型、Claus Extended Formula、Tyrer-Cuzick 模型、和 Manchester評分系統。優選地,使用Gail模型獲得臨床風險評估。在一個實施方式中,臨床風險評估包括,從女性獲得關于以下一種或多種的信息乳腺癌、導管癌或小葉癌的病史、年齡、第一次月經期的年齡、第一次生育的年齡、乳腺癌的家族史、之前乳腺活檢的結果、和人種/種族。優選地,該方法包括檢測至少三種、四種、五種、六種、七種、八種、九種、或十種已知與乳腺癌表型相關的單核苷酸多態性的存在。更優選地,該方法包括檢測七種、八種、九種、或十種已知與乳腺癌表型相關的單核苷酸多態性的存在。在ー個優選實施方式中,單核苷酸多態性選自rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、和rs3817198、或與其中ー種或多種處于連鎖不平衡的單核苷酸多態性。在另ー個優選的實施方式中,單核苷酸多態性選自rs2981582、rs3803662、 rs889312、 rsl3387042、 rsl3281615、 rs4415084、 rs3817198、 rs4973768、rs6504950、和rsll249433、或與其中一種或多種處于連鎖不平衡的單核苷酸多態性。對于這兩個實施方式,優選該方法包括檢測至少三種、四種、五種、六種、七種、八種、九種、或十種單核苷酸多態性的存在,更優選檢測七種、八種、九種、或十種單核苷酸多態性的存在。在一個實施方式中,在沒有協變量的對數加性模型下,通過邏輯回歸單獨地檢驗單核苷酸多態性與乳腺癌的關聯。在另ー個實施方式中,組合檢驗單核苷酸多態性與乳腺癌的關聯。優選地,將臨床風險評估與遺傳風險評估結合包括將風險評估相乗。女性可以是任何人種,例如高加索人(caucasian)、黒人、澳大利亞土著人種(australoid)、或蒙古人種(mongoIoid)。在一個優選的實施方式中,女性是高加索人。優選地,該女性是絕經后的。令人驚訝的是,本發明者已經發現,將單核苷酸多態性分析與臨床風險評估結合在之前已做過乳腺活檢的女性中提供明顯的益處。因此,在ー個優選實施方式中,該女性己經做過乳腺活檢。本發明者也已經發現,將單核苷酸多態性分析與臨床風險評估結合,在臨床風險評估表明其具有發生乳腺癌風險的女性的可能的重新分類中提供明顯的益處。因此,在另ー個優選實施方式中,臨床風險評估的結果表明應該對該女性進行更頻繁的篩查和/或預防性的抗乳腺癌治療。在另ー個實施方式中,如果使用本發明的方法確定受試者具有發生乳腺癌的風險,則該受試者更可能是反應性雌激素抑制而不是非反應性的。
另ー方面,本發明提供用于評估人類女性受試者發生乳腺癌表型的總體風險的系統,其包括用于進行女性受試者的臨床風險評估的系統指令;用于進行女性受試者的遺傳風險評估的系統指令;和用于將臨床風險評估與遺傳風險評估結合以獲得人類女性受試者發生乳腺癌表型的總體風險的系統指令。優選地,該系統是計算機執行的系統。在一個實施方式中,該系統還包括一組標志物探針或引物,其被設置以在從女性受試者獲得的生物樣品中檢測至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在;檢測器,其被設置為檢測ー種或多種來自這組標志物探針或引物、或由這組標志物探針或引物所產生的擴增子的信號輸出,從而鑒定至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在或不存在。在一個實施方式中,該檢測器檢測ー種或多種光發射,其中該光發射指單核苷酸多態性的存在或不存在。在另ー個實施方式中,該系統包括從女性受試者得到的生物學樣品。在另ー個實施方式中,該樣品包括基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA或擴增的RNA。在又一方面,本發明提供包含至少兩組用于擴增兩種或更多種核酸的引物的試劑盒,其中該兩種或更多種核酸包括選自rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950、和 rsll249433 的單核苷酸多態性,或與其一種或多種處于連鎖不平衡的單核苷酸多態性。適合于本發明試劑盒的引物的例子提供于表6中。該試劑盒還可包括進行擴增反應所需要的其它試劑,例如緩沖液、核苷酸和/或聚合酶,以及用于從樣品中提取核酸的試劑。另ー方面,本發明提供包括至少兩種核酸的遺傳陣列,其中核酸獨立地包括選自 rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950、和rsll249433的單核苷酸多態性,或與其一種或多種處于連鎖不平衡的單核苷酸多態性。優選地,該陣列包括代表各SNP的各個已知等位基因的核酸。另ー方面,本發明提供用于確定人類女性受試者對常規診斷檢測乳腺癌的需要的方法,包括使用本發明的方法來評估受試者發生乳腺癌表型的總體風險。
又一方面,本發明提供ー種在人類女性受試者中篩查乳腺癌的方法,該方法包括使用本發明的方法來評估受試者發生乳腺癌表型的總體風險,并且如果該受試者被評估為具有發生乳腺癌的風險,則對她們進行乳腺癌常規篩查。合適的乳腺癌篩查方法的例子包括,但不限干,人工乳腺檢查和乳房X線照相術(mammography)。另ー方面,本發明提供ー種用于確定人類女性受試者對預防性抗乳腺癌治療的需求的方法,包括使用本發明的方法來評估受試者發生乳腺癌表型的總體風險。
又一方面,本發明提供一種用于在人類女性受試者中預防乳腺癌的方法,該方法包括使用本發明的方法來評估受試者發生乳腺癌表型的總體風險,并且如果受試者被評估為具有發生乳腺癌的風險,則對她們施用抗乳腺癌治療。合適的抗乳腺癌治療的例子包括,但不限于,他莫昔芬(tamoxifen)或雷洛昔芬(raloxifene)給藥。在一個實施方式中,該治療抑制雌激素。又一方面,本發明提供一種將ー組人類女性受試者分層(stratify)以進行候選治療的臨床試驗的方法,該方法包括使用本發明的方法來評估受試者發生乳腺癌表型的個人總體風險,和使用評估結果來選擇更可能對治療反應的受試者。明顯的是,所述方法、試劑盒和系統的至少ー些特征可以結合一起使用。例如,用于檢測調節劑(modulators)的系統可以用來實踐調節劑檢測的方法。用于鑒定乳腺癌表型易感性與多態性之間的關聯的系統可以用于實踐本文中的方法。試劑盒可以用來實踐本文中的方法。因此,系統、方法和試劑盒的所述特征可以應用到本文中不同的系統、方法和試劑盒。貫穿本說明書,詞語“包括”、或其變體例如“包含”或“含有”將被理解為意指包含所述元件、整體(integer)或步驟,或ー組元件、整體或步驟,但不排除任何其它元件、整體或步驟,或ー組元件、整體或步驟。以下通過下列非限制性的實施例并參考附圖對本發明進行描述。
圖I示出Hosmer-Lemeshow檢驗的結果以評估10-SNP風險評分的校準。Ml示出結合的7-SNP和IO-SNP風險評分的接受者操作特征曲線(receiveroperating characteristic curvesノ。
具體實施例方式一般技術和定義除非另外具體定義,用于本文中的所有技術和科學術語都將被認為具有與本領域(例如,在細胞培養、乳腺癌分析、分子遺傳學、免疫學、免疫組織化學、蛋白質化學和生物化學領域)普通技術人員通常理解的意義相同的意義。除非另外指出,用于本發明的重組蛋白、細胞培養和免疫學技術是本領域技術人員公知的標準規程。這些技術通過以下來源中的文獻描述和解釋,例如,J. Perbal,A Practical Guide to Molecular Cloning, John Wiley and Sons (1984), J. Sambrook等人,Molecular Cloning A Laboratory Manual, Cold Spring Harbour LaboratoryPress (1989), T. A. Brown (編輯),Essential Molecular Biology A Practical Approach,Volumes land 2, IRL Press (1991), D. M. Glover and B. D. Hames (編輯),DNA Cloning A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996),和 F. M. Ausubel 等人(編輯),Current Protocols in Molecular Biology, Greene Pub. Associates andWiley-Interscience (1988,包括所有至今的更新),Ed Harlow and David Lane (編輯)Antibodies A Laboratory Manual, Cold Spring Harbour Laboratory, (1988), andJ. E. Coligan 等人(編輯)Current Protocols in Immunology, John ffiley&Sons (包括所有至今的更新)。
應該理解本發明并不限于特定的實施方式,當然其可以改變。也應該理解本文中使用的術語僅出于描述特定的實施方式的目的,而不是意在限制。除非上下文中另外清楚地指出,否則用于此說明書和所附權利要求中的単數和単數形式的術語,例如“ー個/一種”(a、an)和“該/所述(the) ”任選地包括復數的所指對象。因此,例如,提及“一種探針”任選地包括多個探針分子;相似地,依據上下文,作為實質的物質,使用術語“ー種核酸”任選地包括很多拷貝的該核酸分子。本文中使用的“乳腺癌表型”是指在個體中表現出發生乳腺癌傾向的表型。表現出乳腺癌傾向的表型可以,例如,在一組給定的環境條件下(飲食、身體活動方式、地理位置等),在具有該表型的個體中比在相關一般群體的成員中表現出更高的癌癥將會形成的可能性。本文中使用的“生物樣品”是指任何來自于或者可從人類患者得到的樣品,例如,來自患者的體液(血液、唾液、尿液等)、活檢、組織、和/或廢物。因此,組織活檢、糞便、痰(sputum)、唾液、血液、淋巴、淚液、汗液、尿液、陰道分泌物等可以容易地對其篩查SNP,基本上含有合適核酸的任何有興趣組織也能被篩查。這些樣品通常在知情同意之后通過標準醫學實驗室方法取自于患者。這些樣品可以是以直接取自于患者的形式,或者可以至少部分被處理(純化)以除去至少ー些非核酸的材料。“多態性”是可變的基因座;即,在ー個群體內,在多態性處的核苷酸序列具有多于ー種的形式或等位基因。多態性的ー個例子是“單核苷酸多態性”,其是基因組中單個核苷酸位置處的多態性(特定位置處的核苷酸在個體或群體之間可變)。本文中使用的術語“SNP”或“單核苷酸多態性”是指個體之間的遺傳變異;例如,生物體DNA中可變的單一含氮堿基位置。本文中使用的“SNP”是復數的SNP。當然,當提及本文的DNA時,該提及可包括DNA的衍生物,例如其擴增子、RNA轉錄物等。術語“等位基因”是指在ー個特定基因座處出現或在此處編碼的兩種或更多種不同核苷酸序列中的ー種,或由這樣的基因座所編碼的兩種或更多種不同多肽序列中的一種。例如,第一種等位基因可以出現在一條染色體上,而第二種等位基因出現在第二條同源染色體上,例如,正如對于雜合個體的不同染色體、或群體中的不同純合或雜合個體之間的不同染色體所出現的。當等位基因與性狀相關聯(linked)并且當等位基因的存在是該性狀或性狀形式將在含有該等位基因的個體中出現的指示物時,該等位基因與該性狀“正”相關。當等位基因與性狀相關聯并且當該等位基因的存在是該性狀或性狀形式將不會在含有該等位基因的個體中出現的指示物時,該等位基因和性狀“負”相關。
當標志物多態性或等位基因可以在統計上與表型關聯(正相關或負相關)時,其與特定表型(乳腺癌易感性等)“相關”或“關聯”。用于確定多態性或等位基因是否在統計上關聯的方法為本領域技術人員公知。也就是說,特定的多態性在病例群體(例如,乳腺癌患者)中要比在對照群體(例如,不具有乳腺癌的個體)中更常出現。該關聯通常被推斷為在本質上是原因性的,但其不必是——表型下的性狀與基因座的簡單遺傳相關(與之關聯)足以讓相關/關聯產生。短語“連鎖不平衡”(LD)用來描述兩個鄰近的多態性基因型之間的統計相關性。通常來說,LD是指,假設配子之間哈迪-溫伯格平衡(Hardy-Weinberg equilibrium)(統計獨立)時兩個基因座處的隨機配子的等位基因之間的相關性。LD通過Lewontin的相關參數(D,)或通過Pearson相關系數(r)量化(De vlin和Risch,1995)。LD值為I的兩個基因座被認為是處于完全的LD。在另ー個極端,LD值為0的兩個基因座被稱為處于連鎖平衡。連鎖不平衡是根據用于單倍型頻率估計的期望最大化算法(EM)的應用來計算的(Slatkin和Excoffier,1996)。鄰近基因型/基因座的根據本發明的LD值選為0. I以上,優選0.2以上,更優選0. 5以上,更優選0. 6以上,再更優選0. 7以上,優選0. 8以上,更優選0. 9以上,理想的為約I. O。“等位基因頻率”是指等位基因在個體內、品系內、或品系群體內的ー個基因座出現的頻率(比例或百分比)。例如,對于等位基因“A”,基因型“AA”、“Aa”、或“aa”的二倍體個體具有分別為I. 0,0. 5、或0. 0的等位基因頻率。可以通過將來自品系或群體的個體樣品的等位基因頻率平均來估計該品系或群體(例如,病例或對照)內的等位基因頻率。相似地,可以通過將組成群體的品系的等位基因頻率平均來計算品系群體內的等位基因頻率。如果個體在一個給定基因座處僅有一種類型的等位基因(例如,二倍體個體在兩條同源染色體各自的ー個基因座處具有一個拷貝的相同等位基因),則該個體為“純合的”。如果在ー個給定基因座處存在多于ー個的等位基因型(例如,具有兩種不同等位基因各自的一種拷貝的二倍體個體),則該個體為“雜合的”。術語“同質性”表示群體的成員在ー個或多個特定基因座處具有相同的基因型。相反,術語“異質性”用來表示群體內的個體在一個或多個特定基因座處的基因型不同。“基因座/座位”(locus)是染色體位置或區域。例如,多態性基因座是多態性核酸、性狀決定子、基因或標志物所在的位置或區域。在一個另ー個實施例中,“基因的基因座”是能夠找到特定基因的物種基因組中的特定染色體部位(區域)。“標志物”、“分子標志物”或“標志物核酸”是指在鑒定基因座或連鎖基因座時用作參考點的核苷酸序列或其編碼產物(例如,蛋白質)。標志物可從基因組核苷酸序列、或從表達的核苷酸序列(例如,從RNA、nRNA、mRNA、cDNA等)、或從編碼的多肽獲得。該術語也指與標志物序列互補或在其側翼的核酸序列,例如,用作能夠擴增標志物序列的探針或引物對的核酸。“標志物探針”是可用于鑒定標志物基因座的存在的核酸序列或分子,例如,與標志物基因座序列互補的核酸探針。當核酸,例如根據Watson-Crick堿基配對原則在溶液中特異性地雜交時,其為“互補的”。“標志物基因座”是能夠用來追蹤第二連鎖基因座的存在的基因座,例如,編碼或對表型性狀的群體變異有作用的連鎖或相關的基因座。例如,標志物基因座可以用來監測等位基因在ー個基因座例如QTL的分離,該等位基因在遺傳上或物通上與標志物基因座連鎖。因此,“標志物等位基因”、或者“標志物基因座的等位基因”是在群體的標志物基因座處發現的多個多態性核苷酸序列中的ー個,該群體對于該標志物基因座為多態性的。一方面,本發明提供與目標表型(例如乳腺癌易感性/抗性)相關的標志物基因座。預計各個被鑒定的標志物與對相關表型起作用的遺傳元件(例如QTL)具有緊密的物理和遺傳鄰近性(產生物理和/或遺傳連鎖)。對應于群體成員之間遺傳多態性的標志物可以用本領域已確立的方法進行檢測。這些方法包括,例如,基于PCR的序列特異性擴增方法、限制性片段長度多態性(RFLP)的檢測、同エ酶標志物的檢測、等位基因特異性雜交(ASH)的檢測、單核苷酸延伸的檢測、基因組的擴增可變序列的檢測、自主(self-sustained)序列復制的檢測、簡單序列重復(SSRs)的檢測、單核苷酸多態性(SNP)的檢測、或擴增的片段長度多態性(AFLPs)的檢測。
在核酸擴增的上下文中的術語“擴增”,是為產生額外拷貝的選定核酸(或其轉錄形式)的任何過程。典型的擴增方法包括多種基于聚合酶的復制方法,包括聚合酶鏈式反應(PCR)、連接酶介導的方法例如連接酶鏈式反應(LCR)和基于RNA聚合酶的擴增(例如,通過轉錄)方法。“擴增子”是擴增出的核酸,例如,通過任何可用的擴增方法(例如,PCR、LCR、轉錄等)通過擴增模板核酸而生成的核酸。 當使用給定核酸的序列構建出特定核酸、或當使用給定的核酸構建出特定核酸時,該特定核酸“得自”該給定核酸。“基因”是基因組中的一個或多個核苷酸序列,其共同編碼ー個或多個被表達的例如RNA或多肽的分子。該基因可以包括編碼序列,該序列轉錄為RNA,RNA之后可被翻譯為多妝序列,并可以包括幫助基因復制或表達的相關結構序列或調節序列。“基因型”是ー個個體(或一組個體)在一個或多個遺傳基因座的基因組成。基因型由個體的一個或多個已知基因座的等位基因確定,一般由從其親代遺傳的等位基因的編譯(compilation)所確定。“單倍型”是個體在單條DNA鏈上多個遺傳基因座處的基因型。通常來說,通過單倍型描述的遺傳基因座是在物理上和遺傳上連鎖的,即,在同一條染色體鏈上。標志物、探針、或引物“組”是指標志物探針、弓I物的集合或小組、或由其得到的數據,其用于共同目的,例如,鑒定具有特定基因型(例如,發生乳腺癌的風險)的個體。對應于標志物、探針或引物、或衍生自其使用的數據常常被儲存在電子介質中。盡管ー組中的成員各自具有在特定目的方面的應用,但是選自該組和亞組(其包括某些,但并非所有的標志物)的單獨標志物也有效地實現特定目的。上述的多態性和基因、和相應的標志物探針、擴增子或引物可以以物質核酸的形式,或以包含核酸序列信息的系統指令的形式包括在本文的任何系統中。例如,該系統可以包括對應于本文所述的基因或多態性(或擴增其一部分)的引物或擴增子。在上述的方法中,該標志物探針或引物組任選地檢測多個所述基因或遺傳基因座中的多個多態性。因此,例如,該標志物探針或引物組檢測這些多態性或基因或者任何其它本文定義的多態性、基因或基因座的各種中的至少ー種多態性。任何這樣的探針或引物可以包括任何這樣的多態性或基因、或其互補核酸、或其轉錄產物(例如,通過例如轉錄或剪接從基因組序列產生的nRNA或mRNA形式)的核苷酸序列。在本文中使用的“邏輯回歸”(logistic regression)是指通過將數據擬合至邏輯曲線來預測事件發生的可能性的方法。本領域的技術人員將會理解怎樣在本發明的背景中使用該方法。本文中使用的“Hosmer-Lemeshow檢驗”是指用于測量擬合度缺乏的統計方法。使用該檢驗的方法在領域內公知(Hosmer Dff, Lemeshow S. Applied Logistic Regression.New York ffiley ;1989 Section 5. 2. 2)。本文中用到的“接受者操作特征曲線”是指ニ元分類系統的敏感度相對于(I-特異性)在其鑒別閾值變化時的圖表。ROC也可以通過將真陽性部分(TPR=真陽性率)相對于假陽性部分(FPR=假陽性率)作圖來對等地表示。也已知為相關操作特征曲線,因為其是兩個操作特征(TPR和FPR)隨著標準變 化的比較。ROC分析對獨立地從成本環境或類別分布(并在將其具體化之前)選擇可能最佳的模型以及去除非最佳模型提供了工具。ROC分析以直接和自然的方式與作出診斷決策的成本/利益分析相關。ROC曲線首先是由電子工程師和雷達工程師在ニ戰中開發的,用來檢測戰場中的敵人目標,因此也已知為信號檢測理論,之后很快就被引入到心理學中以解釋信號的感知性檢測。自那之后,ROC分析已經被用于醫學、放射學、和其它領域數十年,并且不久以前已經被引入像機器學習和數據挖掘等其它領域。本領域的技術人員將清楚在本發明背景中的使用方法。本文中使用的術語“將臨床風險評估與遺傳風險評估結合來獲得總體風險”是指依賴于兩種評估結果的任何合適的數理分析。例如,臨床風險評估和遺傳風險評估的結果可以相加,更優選相乗。本文中使用的術語“乳腺癌常規篩查”和“更頻繁的篩查”是相對的術語,并且是基干與建議給不具有鑒定出的發生乳腺癌風險的受試者的篩查水平的比較。臨床風險評估任何合適的臨床風險評估程序可以用于本發明中。優選地,臨床風險評估不包括對女性在ー個或多個基因座處進行基因分型。在一個實施方式中,臨床風險評估流程包括從女性獲得關于以下一種或多種的信息乳腺癌、導管癌或小葉癌的病史、年齡、例如第一次月經期年齡的月經史、第一次生育的年齡、乳腺癌或其它癌癥的家族史包括診斷時的親屬年齡、之前乳腺活檢的結果、ロ服避孕藥的使用、體重指數、酒精消耗史、吸煙史、運動史、飲食和人種/種族。臨床風險評估程序的例子包括,但不限干,Gail模型(Gail等人,1989,1999 和 2007 ;Costantino 等人,1999 ;Rockhill 等人,2001)、Claus 模型(Claus 等人,1994和 1998)、Claus 表格、BOADICEA (Antoniou 等人,2002 和 2004)、Jonker 模型(Jonker 等人,2003)、Claus Extended Formula (van Asperen 等人,2004)、Tyrer-Cuzick 模型(Tyrer 等人,2004)'Manchester評分系統(Evans等人,2004)等。在ー個優選實施方式中,臨床風險評估程序是Gail模型。Gail模型是構成乳腺癌風險評估工具的基礎的統計模型,以Mitchell Gail博士,NCI癌癥流行病學和遺傳學部的生物統計處(Biostatistics Branch of NCI ' sDivision of Cancer Epidemiology and Genetics)的高級研究員而命名。該模型使用女性自己的個人病史(之前乳腺活檢的數目和在任何之前的乳腺活檢樣品中非典型性增生的存在)、其自身生殖史(月經開始的年齡和第一次生育孩子的年齡)、和她的ー級親屬(母親、姐妹、女兒)的乳腺癌史來預計她在特定時間階段內發生浸潤性乳腺癌的風險。來自乳腺癌檢測示范項目(BCDDP)和來自NCI的監測、流行病學和最終結果(NCI' sSurveillance, Epidemiology, and End Results, SEER)項目的數據被用于開發該模型,其中乳腺癌檢測示范工程是NCI和美國癌癥協會的聯合乳腺癌篩查研究,280,000名35 74歲婦女參與其中。對于非裔美國女性的估計是基于來自女性避孕劑和生殖經歷(Women' sContraceptive and Reproductive Experiences, CARE)研究的數據和來自 SEER 數據的數據。CARE參加者包括1,607名具有浸潤性乳腺癌的女性和1,637名沒有浸潤性乳腺癌的女性。Gail模型已經在大量白種女性中檢驗,并已經顯示其提供對乳腺癌風險的準確估計。也就是說,該模型對于白種女性已經得到“驗證”。也已在來自婦女健康倡導(Women' sHealth Initiative)的數據中針對非裔美國婦女對其加以檢驗,該模型運行良好,但可能在先前活檢的非裔美籍女性中低估風險。還需要針對西班牙女性、亞洲女性和其它亞群體驗證該模型,并且結果應該由衛生保健提供者針對具有特殊風險因素的女性來給予說明,例如對胸部進行放射來治療何杰金氏病(Hodgkin ' s disease)的女性和增加乳腺癌風險的基因突變的攜帯者。研究者正在進行其它的研究,包括對于少數民族的研究,來收集更多數據以檢驗和改進該模型。遺傳風險評估通過在兩個或更多個基因座針對已知與乳腺癌表型相關的單核苷酸多態性分析受試者的基因型來進行遺傳風險評估。技術人員將會理解,每ー個SNP具有大于I. 0的與乳腺癌相關的優勢比(odds ratio),更優選大于I. 02。這樣的SNP的例子包括,但不限于,指定為 rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950、rsll249433、rsl0941679、rs2180341、rs3744448、rsl6943468、rsl011970、rs2380205、rsl0995190、rs704010 和 rs614367 的那些(參見表 I),或與其中一種或多種處于連鎖不平衡的單核苷酸多態性。表I.與乳腺癌表型相關的SNP的例子.
權利要求
1.一種用于評估人類女性受試者發生乳腺癌表型的總體風險的方法,包括 進行所述女性受試者的臨床風險評估; 進行所述女性受試者的遺傳風險評估,其中所述遺傳風險評估包括,在來源于所述女性受試者的生物樣品中,檢測至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在;和 結合所述臨床風險評估與所述遺傳風險評估,以獲得人類女性受試者發生乳腺癌表型的總體風險。
2.一種確定通過臨床風險評估所分析的人類女性受試者發生乳腺癌表型的總體風險是否應該重新分類的方法,所述方法包括 結合所述臨床風險評估與遺傳風險評估,以獲得人類女性受試者發生乳腺癌表型的總體風險,其中所述遺傳風險評估包括,在來源于所述女性受試者的生物樣品中,檢測至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在,和 確定將所述臨床風險評估與所述遺傳風險評估結合是否引起所述受試者發生乳腺癌表型的總體風險的重新分類。
3.根據權利要求2所述的方法,其中所述方法的凈重新分類改進(NRI)大于0.01。
4.根據權利要求2所述的方法,其中所述方法的凈重新分類改進(NRI)大于0.05。
5.根據權利要求2所述的方法,其中由所述臨床風險評估確定的5年風險在約I. 5% 約2%之間。
6.根據權利要求5所述的方法,其中所述方法的凈重新分類改進(NRI)大于0.I。
7.根據權利要求I 6中任一項所述的方法,其中進行所述臨床風險評估使用選自Gail 模型、Claus 模型、Claus 表格、BOADICEA> Jonker 模型、Claus Extended Formula、Tyrer-Cuzick模型、和Manchester評分系統的模型。
8.根據權利要求I 7中任一項所述的方法,其中進行所述臨床風險評估包括從所述女性獲得關于以下一種或多種的信息乳腺癌、導管癌或小葉癌的病史、年齡、第一次月經期的年齡、第一次生育的年齡、乳腺癌的家族史、之前乳腺活檢的結果、和人種/種族。
9.根據權利要求7或權利要求8所述的方法,其中所述臨床風險評估使用Gail模型獲得。
10.根據權利要求I 9中任一項所述的方法,其包括檢測至少三種、四種、五種、六種、七種、八種、九種或十種已知與乳腺癌表型相關的單核苷酸多態性的存在。
11.根據權利要求I 9中任一項所述的方法,其包括檢測七種、八種、九種或十種已知與乳腺癌表型相關的單核苷酸多態性的存在。
12.根據權利要求I 11中任一項所述的方法,其中所述單核苷酸多態性選自rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、和 rs3817198、或與其一種或多種處于連鎖不平衡的單核苷酸多態性。
13.根據權利要求I 11中任一項所述的方法,其中所述單核苷酸多態性選自rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950、和rsll249433、或與其一種或多種處于連鎖不平衡的單核苷酸多態性。
14.根據權利要求12或權利要求13所述的方法,其包括檢測至少三種、四種、五種、六種、七種、八種、九種或十種所述單核苷酸多態性的存在。
15.根據權利要求12或權利要求13所述的方法,其包括檢測七種、八種、九種或十種所述單核苷酸多態性的存在。
16.根據權利要求I 15中任一項所述的方法,其中在沒有協變量的對數加性模型下,通過邏輯回歸單獨地檢驗所述單核苷酸多態性與乳腺癌的相關。
17.根據權利要求I 16中任一項所述的方法,其中對所述單核苷酸多態性結合檢測其與乳腺癌的相關。
18.根據權利要求I 17中任一項所述的方法,其中結合所述臨床風險評估與所述遺傳風險評估包括將所述風險評估相乘。
19.根據權利要求I 18中任一項所述的方法,其中所述女性是高加索人。
20.根據權利要求I 19中任一項所述的方法,其中所述女性已經做過乳腺活檢。
21.根據權利要求I 20中任一項所述的方法,其中所述臨床風險評估的結果表明應該對所述女性進行更頻繁的篩查和/或預防性抗乳腺癌治療。
22.根據權利要求I 21中任一項所述的方法,其中如果確定所述受試者具有發生乳腺癌的風險,所述受試者更可能是反應性雌激素抑制而不是非反應性的。
23.一種用于評估人類女性受試者發生乳腺癌表型的總體風險的系統,包括 用于進行所述女性受試者的臨床風險評估的系統指令; 用于進行所述女性受試者的遺傳風險評估的系統指令;和 用于結合所述臨床風險評估與所述遺傳風險評估以獲得人類女性受試者發生乳腺癌表型的總體風險的系統指令。
24.根據權利要求23所述的系統,其為計算機執行的系統。
25.根據權利要求23或權利要求24所述的系統,其還包括 一組標志物探針或引物,其被設置以在來源于所述女性受試者的生物樣品中,檢測至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在; 檢測器,其被設置以檢測一種或多種來自所述標志物探針或引物組或由所述標志物探針或引物組產生的擴增子的信號輸出,從而鑒定至少兩種已知與乳腺癌表型相關的單核苷酸多態性的存在或不存在。
26.根據權利要求23 25中任一項所述的系統,其中所述單核苷酸多態性選自rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、和 rs3817198、或與其一種或多種處于連鎖不平衡的單核苷酸多態性。
27.根據權利要求23 26中任一項所述的系統,其中所述標志物探針或引物組檢測一種或多種指定為 rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950和rsll249433的單核苷酸多態性,或與其一種或多種處于連鎖不平衡的單核苷酸多態性。
28.根據權利要求23 27中任一項所述的系統,其中所述檢測器檢測一種或多種光發射,其中所述光發射指示所述單核苷酸多態性的存在或不存在。
29.根據權利要求23 28中任一項所述的系統,其中所述系統包括來源于所述女性受試者的生物樣品。
30.根據權利要求29所述的系統,其中所述樣品包括基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA或擴增的RNA。
31.一種試劑盒,包括至少兩組用于擴增兩種或更多種核酸的引物,其中所述兩種或更多種核酸包括選自 rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950和rsll249433的單核苷酸多態性,或與其一種或多種處于連鎖不平衡的單核苷酸多態性。
32.一種遺傳陣列,包括至少兩種核酸,所述核酸獨立地包括選自rs2981582、rs3803662、rs889312、rsl3387042、rsl3281615、rs4415084、rs3817198、rs4973768、rs6504950和rsl 1249433的單核苷酸多態性,或與其一種或多種處于連鎖不平衡的單核苷酸多態性。
33.一種用于確定人類女性受試者對常規診斷檢測乳腺癌的需要的方法,其包括使用根據權利要求I 22中任一項所述的方法來評估所述受試者發生乳腺癌表型的總體風險。
34.一種在人類女性受試者中篩查乳腺癌的方法,所述方法包括使用根據權利要求I 22中任一項所述的方法來評估所述受試者發生乳腺癌表型的總體風險,并且如果所述受試者被評估為具有發生乳腺癌的風險則對她們常規篩查乳腺癌。
35.一種用于確定人類女性受試者對預防性抗乳腺癌治療的需要的方法,其包括使用根據權利要求I 22中任一項所述的方法來評估所述受試者發生乳腺癌表型的總體風險。
36.一種用于在人類女性受試者中預防乳腺癌的方法,所述方法包括使用根據權利要求I 22中任一項所述的方法來評估所述受試者發生乳腺癌表型的總體風險,并且如果所述受試者被評估為具有發生乳腺癌的風險則對她們施用抗乳腺癌治療。
37.根據權利要求36所述的方法,其中所述治療抑制雌激素。
38.一種將一組候選治療的臨床試驗的人類女性受試者分層的方法,所述方法包括使用根據權利要求I 22中任一項所述的方法來評估所述受試者發生乳腺癌表型的個人總體風險,并且使用評估結果來選擇更可能對所述治療反應的受試者。
全文摘要
本發明涉及用于評估人類女性受試者發生乳腺癌表型的總體風險的方法和系統。具體地,本發明涉及將臨床風險評估與遺傳風險評估結合以改善風險分析。
文檔編號C12Q1/68GK102712949SQ201080033130
公開日2012年10月3日 申請日期2010年6月1日 優先權日2009年6月1日
發明者B.沃爾澤, D.A.海因茲 申請人:遺傳技術有限公司