作為診斷標志物的新miRNA的制作方法
【專利說明】作為診斷標志物的新miRNA
[0001] 本發明涉及新的miRNA標志物及其用途。具體地,本發明涉及可用于疾病(特別 是神經元病癥,如阿爾茨海默氏病(AD))的診斷或治療的新的miRNA標志物。
[0002] 發明背景
[0003] 最近,分子診斷學的重要性已經日趨增加。已發現步入疾病的臨床診斷中(尤其 是,傳染性病原體的檢測、基因組的突變的檢測、患病細胞的檢測和疾病的誘因的風險因子 的鑒定)。
[0004]尤其是,通過確定組織中的基因表達,核酸分析在疾病的研宄和診斷中打開非常 有希望的新的可能性。
[0005] 待檢測的感興趣核酸包括基因組DNA、表達的mRNA和其他RNA諸如微小 RNA(簡稱miRNA)。miRNA是具有多種生物功能的新一類小RNA(A.Keller等人,Nat Methods. 20118(10) :841-3)。它們是見于真核細胞中的短的(平均具有20-24個核苷酸) 核糖核酸(RNA)分子。已在哺乳動物中鑒定了幾百個不同種類的微小RNA(S卩,幾百個不同 的序列)。它們對于轉錄后基因調控是重要的,并與靶信使RNA轉錄物(mRNA)上的互補序 列相結合,這可導致翻譯阻抑或靶物降解和基因沉默。因此,它們還可用作研宄、診斷和治 療目的的生物標志物。
[0006] 定義
[0007] 除非另外定義,本文所用的技術和科學術語與本發明所屬領域技術人員所通常理 解的含義相同。
[0008] 術語"核酸分子"是指具有確定的序列的多核苷酸分子。它包含DNA分子、RNA分 子、核苷酸類似物分子以及它們的組合,如摻入了核苷酸類似物的DNA分子或RNA分子。
[0009] 術語"標志物"或"生物標志物"指可檢測其存在或濃度并與已知狀況(比如疾病 狀態)或與臨床結果(比如對治療的應答)相關聯的生物分子,例如,核酸、肽、蛋白、激素 等。
[0010] 術語"評估生理和/或病理狀況"包括分類患有或有風險形成病理狀況的患者的 樣品,篩選病理狀況的存在或形成病理狀況的風險,預測形成病理狀況的風險,或預測患有 或有風險形成病理狀況的患者中的病理狀況結果。
[0011] 如本文所用,術語"預測病理狀況或疾病的結果"意指包括經歷給定治療的患者的 結果預測和未經治療的患者的預后兩者。
[0012] 本發明的含義中的"結果"是在疾病的進程中獲得的限定狀況。此疾病結果可以 例如是臨床狀況諸如"疾病的復發"、"疾病的消退"、"對治療的應答",疾病階段或等級或類 似狀況。
[0013] "風險"被理解為受試者或患者發生或達到某種疾病結果的可能性。在本發明的上 下文中,術語"風險"并不意在指就患者的健康而言攜帶任何積極含義或消極含義,而僅指 發生或形成既定事件或狀況的或然性或可能性。
[0014] 術語"臨床數據"指與患者的健康狀況相關的可用數據和信息的總體,包括但不限 于年齡、性別、重量、絕經期/激素狀況、疾病發生學數據、既往病例(anamnesis)數據、通過 體外診斷方法諸如血檢或尿檢獲得的數據、通過成像方法獲得的數據,比如X-射線、計算 機斷層攝影術、1則、?£!\鄧6(^、超聲、電生理學數據、遺傳分析、基因表達分析、活組織檢查 評估、手術內發現。
[0015]如本文所用的,術語患者的"樣品的分類"指所述樣品與至少兩類的至少一種的關 聯。這些種類可以是例如"高風險"和"低風險",高、中等和低風險;其中風險是在某個時 期中發生某個事件的似然性,例如,疾病的發生、疾病的進程等。它可進一步意為疾病的有 利的或不利的臨床結果、對給定治療的反應性或非反應性等的種類。分類可通過利用算法 (尤其是判別函數)來進行。算法的簡單例子是根據第一定量參數的分類,例如,高于或低 于某個閾值的感興趣核酸的表達水平。患者樣品的分類可用于預測疾病的結果或發生疾病 的風險。代替利用感興趣的單一核酸的表達水平,可使用感興趣的若干核酸的組合評分。此 外,可將另外的數據與第一定量參數組合使用。所述另外的數據可以是來自患者的臨床數 據,比如性別、年齡、患者的重量、疾病分級等。
[0016]"判別函數"是用于分類對象或事件的一組變數的函數。因此,判別函數允許根據 可從患者、樣品或事件可獲得的數據或參數將所述患者、樣品或事件分類為一個種類或多 個種類。該分類是本領域技術人員熟知的統計學分析的標準手段。例如,根據從所述患者、 樣品或事件中獲得的數據可將患者分類為"高風險"或"低風險"、"需要治療"或"不需要治 療"或其它種類。分類不限于"高對低",而是可以實施分類成多個種類、分級等。允許分類 的判別函數的例子包括但不限于由支持向量機(supportvectormachine,SVM)、k-最近鄰 (k-nearest-neighbor,kNN)、(樸素(naive))貝葉斯模型定義的判別函數,或分段定義的 函數,諸如例如在子集發現、決策樹、數據的邏輯分析(LAD)等中的。
[0017]術語"表達水平"指例如感興趣核酸的確定的水平表達。術語"表達水平的模式 (pattern)"指與來自參照核酸(例如來自對照)相比較,或與計算的平均表達值(例如在 DNA芯片分析中)相比較的確定的表達水平。模式不限于兩種基因的比較,而且還涉及基因 與參照基因或樣品的多重比較。某個"表達水平的模式"也可作為結果并通過下文公開的 感興趣的若干核酸的比較和測量來確定,并展示出這些轉錄物彼此的相對豐度。表達水平 還可相對于不同組織,患者對健康對照等中的表達來評價。
[0018] 本發明的含義中的"表達水平的參照模式"應理解為可用于與另一表達水平模式 相比較的任何表達水平模式。在本發明的一個優選的實施方案中,表達水平的參照模式是 例如在充當參照組的一組健康或患病個體中觀察到的平均表達水平模式。
[0019] 在本發明的上下文中,"樣品"或"生物樣品"是源自生物學生物體或已同生物學生 物體相接觸的樣品。生物樣品的例子是:細胞、組織、體液、活組織檢查樣本、血液、尿液、唾 液、痰液、血漿、血清、細胞培養上清液,和其他。
[0020] "探針"是能夠與特定生物分子特異性結合或相互作用的分子或物質。術語"引 物"、"引物對"或"探針"應具有分子生物學領域技術人員已知的這些術語的常規含義。在 本發明的優選的實施方案中,"引物"、"引物對"和"探針"指具有下述序列的寡核苷酸或多 核苷酸分子,所述序列與待檢測或定量的靶分子或靶序列的區域相同、互補、作為該區域的 同源物、或同源,從而引物、引物對或探針可特異性地與靶分子結合,所述靶分子例如,待檢 測或待定量的靶核酸、RNA、DNA、CDNA、基因、轉錄物、肽、多肽或蛋白。如本文所理解的,弓丨 物可自身發揮探針功能。如本文所理解的,"探針"還可包含例如引物對和內部標記探針的 組合,其是許多商品化qPCR方法中所常見的。
[0021]"miRNA"是短的、天然存在的RNA分子,并應具有本領域技術人員所理解的一般含 義。"源自miRNA的分子"是以化學方法或酶促方法獲自miRNA模板的分子,比如cDNA。
[0022] 術語"陣列"指裝置(例如,芯片裝置)上可尋址的位置的排列。位置的數目可從 幾個變化到至少幾百或幾千個。每個位置代表獨立的反應位點。陣列包括但不限于核酸陣 列、蛋白陣列和抗體陣列。"核酸陣列"指含有核酸探針(比如寡核苷酸、多核苷酸或基因的 較大部分)的陣列。陣列上的核酸優選為單鏈的。"微陣列"指生物芯片或生物學芯片,即 具有至少約100/cm2密度的含固定探針的離散區域的區域陣列。
[0023] "基于PCR的方法"指包含聚合酶鏈式反應PCR的方法。這是通過利用一種、兩種 或更多種引物在體外酶促復制指數擴增核酸(例如DNA或RNA)的方法。對于RNA擴增,可 使用逆轉錄作為第一步。基于PCR的方法包含動力學或定量PCR(qPCR),其特別適宜于分 析表達水平)。當其實現表達水平的確定時,可例如使用基于PCR的方法以檢測給定mRNA 的存在,其通過(1)在逆轉錄酶的協助下將完整的mRNA庫(所謂的轉錄物組)逆轉錄為 cDNA,并(2)在相應的引物的協助下檢測給定cDNA的存在進行。該方法通常稱作逆轉錄酶 PCR(rtPCR)。術語"基于PCR的方法"包含端點PCR應用及應用特別的熒光團或嵌入染料 的動力學/實時PCR技術,所述熒光團或嵌入染料發射熒光信號作為擴增的靶標的函數,并 允許進行靶標的監測和定量。定量方法可以根據外部標準曲線是絕對的或相對于比較性內 部標準品。
[0024] 術語"下一代測序"或"高通量測序"指使測序方法平行化,一次產生幾千個或 幾百萬個序列的高通量測序技術。例子包括大規模平行標簽測序(MassivelyParallel SignatureSequencing,MPSS)、Polony測序、454 焦磷酸測序、Illumina(Solexa)測 序、SOLiD測序、離子半導體測序、DNA納米球測序、Helioscope(TM)單分子測序、單分子 SMRT(TM)測序、單分子實時(RNAP)測序、納米孔DNA測序。<