專利名稱:肝癌高表達基因peg10、其編碼蛋白及其應用的制作方法
技術領域:
本發明涉及生物技術領域,具體地,本發明涉及一種主要在人類肝癌組織中高表達的印跡基因PEG10及其編碼蛋白;此外,本發明還涉及PEG10基因的應用。
背景技術:
1986年著名生物學家諾貝爾獎獲得者RenatoDulbecco在Science雜志上率先提出“人類基因組計劃”(Human Genomic Pr山ect,簡稱HGP),該建議的提出引發了科學界長達三年的激烈爭論。1990年10月美國政府決定出資30億美元正式啟動“人類基因組計劃”,預期到2005年拿到人體的全部基因序列(共約30億個核苷酸全序列);隨后研究其相互作用和基因功能,從而揭開人類全部遺傳信息之謎,使人類對自身的認識達到一個新的高度。
人類基因組計劃可以說是人類有史以來最為偉大的認識自身的世紀工程之一。1997年底,有人提出HGP的最終目標應該是提供生物學周期表,這個周期表的“元素”就是決定人類一切性狀的10-14萬個基因。完成30億個堿基的測序只不過為這個目標打下了結構上的基礎(即結構基因組學),而比較基因組學(包括其編碼的蛋白質)和整個基因組的功能研究(功能基因組學)在基因組的價值發現上才能直接發揮其重要作用。隨著基因組學的發展,人們設計和創造了許多重要的生物分子,廣泛用于制藥、農業、食品、化工、化妝品、環境、能源等各領域,不僅會推動科學的進步,還將產生驚人的經濟效益,從而引發產業革命,以基因組學為基礎的生命科學工業已經形成。人類有限的基因資源正在做著一次性分配,獲取基因效率最高和數量最多的企業,有望利用其基因專利來壟斷未來生物和制藥工業市場。比爾.蓋茨曾說下一個創造出更大財富的人將出現在基因領域。
隨著基因組計劃的迅猛發展,攻克包括肝癌在內的惡性腫瘤在不久的將來將成為現實。我國是原發性肝細胞肝癌(primaryhepatocellularcarcinoma,HCC)的高發地區,其死亡率已占我國部分農村和城市的第一、二位,是嚴重影響我國人民健康的重大疾病,每年世界上有38.6萬人死于肝癌,而其中的45%是在中國。目前認為,肝癌的發生、發展,亦和其它惡性腫瘤一樣,是多基因、多因素參與的復雜過程,包括體細胞基因突變、抑癌基因的丟失、癌基因的激活和過表達等等,許多癌基因、抑癌基因,及相關基因的異常激活或失活是肝癌發生的分子基礎。從理論上講,應該有更多的基因參與其中,但目前已發現的許多基因,其詳盡功能仍不十分清楚。目前已證明與人類肝癌相關的癌基因或異常表達基因包括;pTEN、p21、p27、p73、p15、p53、RBl、APC、nm23、P16、MXR7、IGF-I、TGFO、HGF-R(C-met)/HGF、c-fins(CSF-IR)、c-erbB-1(EGF-R)/c-erbB-2(neu)、Ras、Raf、c-myc、c-ets-2等等,但沒有一個為肝癌特異性表達基因,因此,尋找新的肝癌異常表達或缺失基因,從基因水平認識肝細胞的生長、分化、再生和癌變的分子機理,并闡明其信號傳遞過程與途徑,不僅有重要的生物學意義,而且對于肝癌的早期基因診斷和信息治療,均具有重大的臨床應用意義和經濟開發價值,在人類基因組的研究中也能占領新的制高點。
隨著分子生物學技術的迅猛發展,尋找、分離基因的新方法不斷出現,主要有以下四種1、從eDNA或mRNA出發的方法利用細胞基因表達的差異宋分離致病基因是一類重要方法,目前進展較快。包括cDNA消減雜交法、mRNA差異顯示技術、EST(Expressed sequence tags)差異雜交篩選等;2、從分析蛋白質入手;根據蛋白的位置、結合特點或部分功能出發,先分離所需蛋白,再得到相應的基因。包括免疫沉淀法、雙向電泳法、酵母雙雜交系統法等;3、從尋找基因組DNA片段出發尋找到與目標基因座位緊密連鎖的遺傳標記或部分功能信息,從而確定某性狀相關的基因在基因組中某區段的位置,然后再利用不同方法找到該區段染色體內的表達序列,最終克隆到目的基因。包括復雜探針篩庫法、Northern雜交法、剪接位點篩選法、CpG島篩選法、種間同源序列雜交法、PCR直選法、外顯子捕獲、一致序列克隆法等;4、從全基因組出發根據有關基因的效應直接分離該基因的克隆,而不必事先探知其生化功能或圖譜定位,也不需要假設基因的數目或其相互作用方式,包括基因組錯配掃描及代表性差別分析等。上述尋找新基因的方法各有利弊,使用哪一種方法,應根據各自實驗室的條件與優勢,揚長避短,采取切實可行的方法。
1992年美國學者LiangPeng等首次應用mRNA差別顯示技術分離和鑒定不同組織和細胞間的基因表達,使用該方法,人們已經發現了大量的未知基因,如Liang等,用該方法比較正常乳腺和乳腺癌的mRNA,發現了全長600bp的S1基因Chen等(ChenSL,MaroulakouIG,GreenJE,et al.Isolation and characterizationofnovelgene expressed inmultiple cancers,Oncogene,199612(4)741-751)用該方法發現了一個新基因N8,全長2.4kb,定位于8q13染色體上,在肺癌組織中過表達;日本學者Shibabara等(ShibaharaK;AsanoM;IshidaY;Aoki T;KoikeT;Ho山OT,IsolationofanovelmousegeneMA-3thatiSinduceduponprogrammed celldeath,Gene,1995Dec,166(2)297-301)用該方法分離到一個引起細胞程序性死亡的新基因MA-3,等等。但是DDPCR技術目前尚存在一些不足,近年來雖然一些學者已在這方面做了許多改進,如引物設計的合理性、如何減少假陽性等,但仍需不斷完善,相信DDPCR技術的不斷完善,將會在生命科學領域中成為十分有用的工具。
因此,為治療和診斷目的研究和開發在肝癌中高表達的基因和/或蛋白具有重要意義。本領域迫切需要新的在肝癌中高表達的基因和/或蛋白。
印跡基因PEG10,定位于人類染色體7q21上,PEG10位于SGCE基因附近,其小鼠同族體最近顯示被印跡。因此在人類染色體7q21中很可能存在一類新的印跡基因群。兩種預知的公開閱讀框架(ORF1 and ORF2)的分析顯示ORF1和ORF2相對于一些脊椎動物的蛋白質是同源的。有胎盤的PEG10在早期缺氧階段是低調節的,在懷孕的11-12周內是高活性的。PEG10的外因表達對致瘤活性有作用。PEG10蛋白質與媒介SIAH1相關聯,PEG10的過量表達降低了媒介SIAH1的細胞死亡。結構顯示,印跡基因PEG10在人類肝細胞的肝臟再生及抑癌中會起到重要的作用。
鑒于印跡基因PEG10的重要功能,研究和開發印跡基因PEG10具有重要意義。
發明內容
本發明要解決的技術問題之一是提供一種在肝癌中高表達的印跡基因PEG10(Paternally Expressed 10)。
本發明要解決的技術問題之二是提供一種人蛋白PEG10。
本發明要解決的技術問題之三是提供PEG10基因作為肝癌診斷標志物的應用。
本發明從肝癌組織中獲得一基因片段,進而通過基因克隆技術克隆了一個與PEG10正相關新基因全長cDNA序列,該基因序列與原發性肝細胞肝癌高度相關。令人感興趣的是該基因在肝癌中的表達高達66%,而癌旁肝組織不表達或表達極低。該基因編碼一568個氨基酸的蛋白質,定位于細胞漿。
為了解決上述技術問題,本發明通過如下技術方案實現在本發明的一個方面,提供了一種分離出的DNA分子,該分子包括編碼具有人PEG10蛋白質活性的多肽的核苷酸序列,所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位DNA分子的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列雜交。較佳地,所述的序列編碼具有SEQ ID NO.2所示的氨基酸序列的多肽。更佳地,所述的序列具有SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列。
在本發明的另一方面,提供了一種分離出的人PEG10蛋白質多肽,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。較佳地,該多肽是具有SEQ ID NO.2序列的多肽。
在本發明的另一方面,還提供了一種載體,它包含上述的DNA分子。
在本發明的另一方面,還提供了一種用上述載體轉化的宿主細胞。
在本發明的另一方面,還提供了一種具有人PEG10蛋白質活性的多肽的制備方法,該方法包括(1)將編碼具有人PEG10蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人PEG10蛋白表達載體,所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人PEG10蛋白的重組細胞;(3)在適合表達人PEG10蛋白多肽的條件下,培養步驟(2)中的重組細胞;(4)分離出具有人PEG10蛋白活性的多肽。
較佳地,在該方法中使用的核酸序列具有SEQ ID NO.1中第1-1707位的序列。
本發明還提供了與PEG10蛋白多肽特異性結合的抗體。
在本發明中,“分離的”DNA是指,該DNA或片段已從天然狀態下位于其兩側的序列中分離出來,還指該DNA或片段已經與天然狀態下伴隨核酸的組份分開,而且已經與在細胞中伴隨其的蛋白質分開。
在本發明中,術語“人PEG10蛋白(或多肽)編碼序列”指編碼具有人PEG10蛋白活性的多肽的核苷酸序列,如SEQ ID NO.1中第1-1707位核苷酸序列及其簡并序列。該簡并序列是指,位于SEQ ID NO.1序列的編碼框第1-1707位核苷酸中,有一個或多個密碼子被編碼相同氨基酸的簡并密碼子所取代后而產生的序列。由于密碼子的簡并性,所以與SEQ ID NO.1中第1-1707位核苷酸序列同源性低至約70%的簡并序列也能編碼出SEQ ID NO.2所述的序列。該術語還包括能在中度嚴緊條件下,更佳的在高度嚴緊條件下與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列雜交的核苷酸序列。其中,“嚴緊條件”是指核苷酸序列在膜上雜交后的洗膜條件。例如,在本領域中,低嚴緊度洗膜可以在雜交管中倒入150ml左右洗液,放入雜交膜,室溫持續搖動20分鐘左右,而高嚴緊度洗膜可以是在雜交管中倒入200ml左右洗液,放入雜交膜,50℃搖床中持續搖動20分鐘左右。該術語還包括與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列的同源性至少70%,較佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
該術語還包括能編碼具有與人PEG10相同功能的蛋白的、SEQ ID NO.1中開放閱讀框序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-90個,較佳地1-60個,更佳地1-20個,最佳地1-10個)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加數個(通常為60個以內,較佳地為30個以內,更佳地為10個以內,最佳地為5個以內)核苷酸。
在本發明中,術語“人PEG10蛋白或多肽”指具有PEG10蛋白活性的SEQ ID NO.2序列的多肽。該術語還包括具有與天然的人PEG10相同功能的SEQ ID NO.2序列的變異形式。這些變異形式包括(但并不限于)若干個(通常為1-50個,較佳地1-30個,更佳地1-20個,最佳地1-10個)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一個或數個(通常為20個以內,較佳地為10個以內,更佳地為5個以內)氨基酸。例如,在本領域中,用性能相近或相似的氨基酸進行取代時,通常不會改變蛋白質的功能。又比如,在C末端和/或N末端添加一個或數個氨基酸通常也不會改變蛋白質的功能。該術語還包括PEG10蛋白的活性片段和活性衍生物。
本發明人PEG10多肽的變異形式包括同源序列、保守性變異體、等位變異體、天然突變體、誘導突變體、在高或低的嚴緊條件下能與人PEG10 DNA雜交的DNA所編碼的蛋白、以及利用抗人PEG10多肽的抗血清獲得的多肽或蛋白。本發明還提供了其他多肽,如包含人PEG10多肽或其片段的融合蛋白。除了幾乎全長的多肽外,本發明還包括人PEG10多肽的可溶性片段。通常,該片段具有人PEG10多肽序列的至少約10個連續氨基酸,通常至少約30個連續氨基酸,較佳地至少約50個連續氨基酸,更佳地至少約80個連續氨基酸,最佳地至少約100個連續氨基酸。
在本發明中,“人PEG10保守性變異多肽”指與SEQ ID NO.2的氨基酸序列相比,有至多10個,較佳地至多8個,更佳地至多5個氨基酸被性質相似或相近的氨基酸所替換而形成多肽。這些保守性變異多肽最好根據表1進行替換而產生。
表1
發明還包括人PEG10蛋白或多肽的類似物。這些類似物與天然的人PEG10多肽的差別可以是氨基酸序列上的差異,也可以是不影響序列的修飾形式上的差異,或者兼而有之。這些多肽包括天然或誘導的遺傳變異體。誘導變異體可以通過各種技術得到,如通過輻射或暴露于誘變劑而產生隨機誘變,還可通過定點誘變法或其他已知分子生物學的技術。類似物還包括具有不同于天然L-氨基酸的殘基(如D-氨基酸)的類似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的類似物。應理解,本發明的多肽并不限于上述例舉的代表性的多肽。
修飾(通常不改變一級結構)形式包括體內或體外的多肽的化學衍生形式如乙酰化或羧基化。修飾還包括糖基化,如那些在多肽的合成和加工中或進一步加工步驟中進行糖基化修飾而產生的多肽。這種修飾可以通過將多肽暴露于進行糖基化的酶(如哺乳動物的糖基化酶或去糖基化酶)而完成。修飾形式還包括具有磷酸化氨基酸殘基(如磷酸酪氨酸,磷酸絲氨酸,磷酸蘇氨酸)的序列。還包括被修飾從而提高了其抗蛋白水解性能或優化了溶解性能的多肽。
在本發明中,可選用本領域已知的各種載體,如市售的載體,包括質粒,粘粒等。在生產本發明的人PEG10多肽時,可以將PEG10編碼序列可操作地連于表達調控序列,從而形成人PEG10蛋白表達載體。
如本文所用,“可操作地連于”指這樣一種狀況,即線性DNA序列的某些部分能夠影響同一線性DNA序列其他部分的活性。例如,如果信號肽DNA作為前體表達并參與多肽的分泌,那么信號肽(分泌前導序列)DNA就是可操作地連于多肽DNA;如果啟動子控制序列的轉錄,那么它是可操作地連于編碼序列;如果核糖體結合位點被置于能使其翻譯的位置時,那么它是可操作地連于編碼序列。一般,“可操作地連于”意味著相鄰,而對于分泌前導序列則意味著在閱讀框中相鄰。
在本發明中,術語“宿主細胞”包括原核細胞和真核細胞。常用的原核宿主細胞的例子包括大腸桿菌、枯草桿菌等。常用的真核宿主細胞包括酵母細胞、昆蟲細胞和哺乳動物細胞。較佳地,該宿主細胞是真核細胞,如CHO細胞、COS細胞等。
本發明還提供了對人PEG10特異的抗體,包括多克隆抗體和單克隆抗體。
在本發明中,可以使用一系列本領域已知的方法來制備針對PEG10特異的抗體。例如,將提純的人PEG10基因產物或它的抗原片段注射入動物體內以產生多克隆抗體。同樣,表達人PEG10或它的抗原片段的細胞也可以用來對動物致免疫而產生抗體。根據本發明制備的抗體也可以是單克隆抗體,這些單克隆抗體可以用雜交瘤技術制各(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本發明的抗體包括可以阻抑人PEG10功能的抗體,也可以是不影響人PEG10功能的抗體。每一類抗體都可以通過對人PEG10基因產物的片段或功能域致免疫而產生,而人PEG10基因產物及其片段可以用重組方法產生或用多肽合成儀進行合成。與非修飾形式的PEG10基因產物結合的抗體,可以通過用在原核細胞例如E.coli中產生的基因產物來免疫動物而得到。與翻譯后修飾形式如糖基化或磷酸化蛋白或多肽結合的抗體,可以通過用在真核細胞如酵母或昆蟲細胞中產生的基因產物的來免疫動物而得到。
本發明的人PE610抗體可以用來鑒定表達人PEG10蛋白或多肽的細胞,如JurkatT細胞。例如,可以用一種可檢測的分子例如熒光素異硫氰酸(FITC)來標記PEG10特異抗體,然后讓人PEG10特異抗體與細胞樣品接觸,再用熒光顯微鏡或流式細胞儀檢測出與PEG10特異抗體結合的細胞。
除了在細胞表面檢測人PEG10外,還可以用Western印跡技術分析該蛋白質。細胞裂解液可以從培養細胞或取自病人的組織標本如腎上腺中提取,并溶解在含有去污劑的裂解緩沖液中。然后用SDS聚丙烯酰胺凝膠電泳分離細胞提取物(同時將提純的人PEG10多肽作為陽性對照),接著通過電泳雜交將其轉移到硝酸纖維素上。為了用Western印跡免疫探測PEG10多肽,可以使用典型的抗體結合檢測方法,例如放射自顯影或堿性磷酸酶檢測方法。并可使用免疫接種血清或不相關的單克隆抗體作為非特異反應的對照。
還可用Nothern印跡法技術分析PEG10基因產物的表達,即分析人PEG10的RNA轉錄物在細胞中的存在與否和數量。
人PEG10 DNA的Nothern印跡分析和人PEG10特異抗體的Western印跡分析可以聯合使用,以證實人PEG10在生物樣本中的表達。人PEG10 DNA還可以用于Southern印跡分析或原位雜交分析,以將該基因定位于染色體上,并可進行遺傳連鎖分析以找出其它可能的疾病相關基因。
本發明的人PEG10核苷酸全長序列或其片段通常可以用PCR擴增法、重組法或人工合成的方法獲得。對于PCR擴增法,可根據本發明所公開的有關核苷酸序列,尤其是開放閱讀框序列來設計引物,并用市售的cDNA庫或按本領域技術人員已知的常規方法所制備的cDNA庫作為模板,擴增而得有關序列。當序列較長時,常常需要進行兩次或多次PCR擴增,然后再將各次擴增出的片段按正確次序拼接在一起。
一旦獲得了有關的序列,就可以用重組法來大批量地獲得有關序列。這通常是將其克隆入載體,再轉入細胞,然后通過常規方法從增殖后的宿主細胞中分離得到有關序列。
此外,還可用人工化學合成的方法來合成有關序列。在本申請之前,現有技術已完全可以通過先合成多個多核苷酸小片段,然后再進行連接而獲得編碼本發明人PEG10蛋白的的核酸序列。然后,可將該核酸序列引入本領域中各種現有的DNA分子(如載體)和細胞中。此外,還可通過化學合成將突變引入本發明蛋白序列中。
除了用重組法產生之外,本發明蛋白的片段還可用固相技術,通過直接合成肽而加以生產(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在體外合成蛋白質可以用手工或自動進行。例如,可以用Applied Biosystems的431A型肽合成儀(Foster City,CA)來自動合成肽。可以分別化學合成本發明蛋白的各片段,然后用化學方法加以連接以產生全長的分子。
利用本發明的人PEG10蛋白,通過各種常規篩選方法,可篩選出與人PEG10發生相互作用的物質或,如受體、抑制劑或拮抗劑等。
本發明人PEG10蛋白及其抗體、抑制劑、拮抗劑或受體等,當在治療上進行施用(給藥)時,可提供不同的效果。通常,可將這些物質配制于無毒的、惰性的和藥學上可接受的水性載體介質中,其中pH通常約為5-8,較佳地pH約為6-8,盡管pH值可隨被配制物質的性質以及待治療的病癥而有所變化。配制好的藥物組合物可以通過常規途徑進行給藥,其中包括(但并不限于)肌內、腹膜內、皮下、皮內、或局部給藥。
本發明還提供了PEG10基因作為肝癌診斷標志物的應用。本發明PEG10基因是一種肝癌高表達基因,PEG10在肝癌中的表達率高達66%,而在癌旁肝組織的表達率和表達水平極低。因此,PEG10基因可作為肝癌診斷標志物,使得對其進行深入地研究有可能定量化肝癌的檢測指標,為進一步的臨床推廣做貢獻。此外,PEG10多核苷酸、PEG10蛋白及其抗體,以及PEG10蛋白相關的拮抗劑、激動劑等可為治療包括肝癌等多種疾病提供新的治療途徑,因而具有巨大的應用前景。
圖1是通過RT-PCR驗證本發明印跡基因PEG10在肝癌/癌旁組織中的表達圖,N為癌旁組織,C為癌組織,β-actin作為內對照。
具體實施例方式
下面結合附圖和實施例對本發明作進一步詳細的說明。應理解,這些實施例僅用于說明本發明而不用于限制本發明的范圍。下列實施例中未注明具體條件的實驗方法,通常按照常規條件,例如Sambrook等人,分子克隆實驗室手冊(New YorkColdSpring Harbor Laboratory Press,1989)中所述的條件,或按照制造廠商所建議的條件。
實施例11.組織分離(Tissue isolation)來源于HBV陽性并表達甲胎蛋白的原發性肝癌的手術病人(RT-PCR證實AFP在肝癌均為陽性而癌旁為陰性)。手術切除的肝臟一經離體,迅速切取病灶及周圍5公分外癌旁組織,放入液氮中(-80℃)保存。癌和癌旁的診斷均以病理診斷為最終依據。
2.總RNA的抽提試劑盒抽提RNA試劑采用TRIzol reagent(GIBCO/BRL),該試劑是基于酸性酚一步抽提法生產的。用于抽提RNA所用的器皿和水均要進行無RNA酶處理,以保證實驗中無RNA酶的環境。
3.RNA的抽提步驟將碾杵和勻漿器等器皿在200℃干烤4h,去除RNA酶,冷卻;加入液氮中預冷,將組織從液氮中迅速取出,碾成粉末;用刮匙將組織放入預先加入TRIzol試劑的勻漿器中,勻漿數分鐘;將勻漿后的液體轉入無RNA酶的離心管中,加入氯仿后,4℃離心分層;將上層水相轉入一無RNA酶的離心管中,加異丙醇,4℃離心沉淀RNA;用75%乙醇洗滌沉淀2次;用無RNA酶的去離子水溶解沉淀。抽提的RNA質量鑒定紫外分光光度計測定260/280比值(比值均在1.7~2.0);并在MOPS甲醛變性膠中觀察有無降解。
4.cDNA的合成取總RNA2μg,OligodT161μL,70℃保溫3min,立即冰上變性5min。加入5×buffer,DTT和50mg/L的dNTP各2μL及1μL的逆轉錄酶,充分混勻后,42℃2h。模板使用終濃度通常為1μg/100μL。
5.RT-PCR擴增設計引物,PEG10前向引物為5’-TGCTTCTGGCAACTTCATTG-3’,后向引物為5’-TCAAATGACAGCACCTCTCG-3’;Beta-actin前向引物為5’-TCACCCACACTGTGCCCATCTACGA-3’,后向引物為5’-CAGCGGAACCGCTCATTGCCAATGG-3’。以β-actin作內對照,反應混合物中各成分為β-actin(F)、β-actin(R)、PEG10(F)、PEG10(R)、10×Buffer、MgCl2、dNTP、Taq DNA聚合酶、cDNA模板分別為0.2、0.2、0.4、0.4、1.0、1.0、0.2、0.1和5μLcDNA模板,最后補充ddH2O使反應體系為10μL。PCR的反應條件是94℃變性5min;然后每個循環94℃30s、53℃30s、72℃30s,共30個循環;最后72℃延伸7min。
6.結果結果如圖1所示利用RT-PCR技術在32對肝癌及癌旁組織中檢測PEG10基因的表達差異,發現在32例中有24例PEG10基因明顯升高,即PEG10基因在肝癌組織中的表達率高達66%。
實施例2人PEG10多肽的制備和提純在該實施例中,將全長的PEG10編碼序列或片段構建入商品化的蛋白質融合表達載體之中,以表達和提純重組蛋白。
將人PEG10多肽以GST融合蛋白的形式在大腸桿菌中進行原核表達。
1.原核表達載體的構建,以及轉化大腸桿菌根據人PEG10的全長編碼序列(SEQ ID NO.1),設計擴增出完整編碼閱讀框的引物(分別對應于編碼序列5’和3’端的約20個以上核苷酸),并在正反引物上分別引入限制性內切酶位點(這根據選用的pGEX-2T載體而定),以便構建表達載體。以實施例1中獲得的擴增產物為模板,經PCR擴增后,將人PEG10基因在保證閱讀框正確的前提下克隆至pGEX-2T載體(Pharmacia,Piscataway,NJ)。鑒定好的表達載體利用CaCl2方法轉入大腸桿菌DH5α,篩選鑒定得到含有pGEX-2T-PEG10表達載體的工程菌DH5α-pGEX-2T-PEG10。
2.表達GST-PEG10重組蛋白的工程菌的分離鑒定挑取單菌落的DH5α-pGEX-2T-PEG10工程菌于3ml含100μg/ml氨芐青霉素的LB培養基中振搖培養過夜,按1∶100的濃度吸取培養液于新的LB培養基(含100μg/ml氨芐青霉素)中培養約3小時,至OD600達0.5后,加入IPTG至終濃度1mmol/L繼續于37℃分別培養0,1,2,3小時。取培養時間不同的1ml菌液離心,在細菌沉淀物中加入裂解液(2×SDS上樣緩沖液50μl,蒸餾水45μl,二巰基乙醇5μl),混懸細菌沉淀,沸水浴中煮5分鐘,10000rpm離心1分鐘,上清加入12%SDS-PAGE膠中電泳。染色后觀察預期分子量大小的蛋白量隨IPTG誘導時間增加而增加的菌株即為表達GST-PEG10融合蛋白的工程菌。
3.GST-PEG10融合蛋白的提取純化按上述方法誘導表達GST-PEG10融合表達蛋白的工程菌DH5α-pGEX-2T-PEG10。誘導后的細菌離心沉淀,按每400ml菌加入20ml PBS重懸細菌,超聲破碎細菌。破菌完全的超聲液按每毫升加入20微升的量加入PBS飽和的50%谷胱苷肽Sepharose4B,37℃振搖結合30分鐘,10000rpm離心10分鐘沉淀結合了GST-PEG10的谷胱苷肽Sepharose 4B,棄上清。按每毫升超聲液所得沉淀加入100μl PBS的量清洗兩次,而后按每毫升超聲液所得沉淀加入10μl還原型谷胱苷肽洗脫液,室溫置10分鐘,10000rpm離心10分鐘,上清即為洗脫的融合蛋白。重復洗脫兩次。洗脫的上清保存于-80℃,并進行SDS-PAGE電泳,檢測純化效果。在31kDa處的蛋白質條帶即為人PEG10蛋白。
序列表<110> 上海人類基因組研究中心<120> 肝癌高表達基因PEG10、其編碼蛋白及其應用<130> NP-10015<160> 2<210> 1<211> 6861<212> DNA<213> 智人(Homo sapiens)<220>
<221> CDS<222> (1)..(1707)<400> 11 ATGTGCCACA AACTGACGGA TGGGCGCTTC AGTGGCGCTA CAATCCAGAA CGAGGAGCAG61 CGATATAGGA GCTGCAGACA GAAAACTGAA TTGCGCTTTA CATGCGCTGC AAAATCTGAG121 CTGCAGAAGA GTAGCACTAC AAAAAACGCT ACAAAAACGA TGCGATTAGC CAGCCCGACA181 ACAGCGCTTC ATTGCGCTGC GAGGCACATG AACTGCAGAG CGCCTCCTCC TACAGCGCCT241 CCTCAGAGCC GCCTCCCCTG CAGCGCCGTG ACCCAGAGTC CTTGTGCTAC CATGCGGCCT301 TCGCAGGCCC GTGCGCCCAG CTCGAGAGCA CGTGACTTCT GGATCCAGGA CCATCGGTCT361 GAGGCCCCGC ATGAGTTAGT AGGGAGGGGT AGTGCCCTGC TAGTGTCGGG GCGCCATGGT421 GATGTTCGGA GGGCGCAGCA CGCAGACCAG GGTTCGGATG GGACGCTGTG GTGTCTTTTT481 GGGTCGGTCG GGTGGTATAG GGCGATAAAT AAGCGGGTTT TGAAAACAAA AAAAAGAAGG541 AGTGGAAGAG GGGGCCAGGA TCCAGGCCTC CATCCCCACA GAAGTGAAGC TACAGCTGGG601 AGGTCTCCTC CCACCCCAAC CGTCACCCTG GGTCCCGACT GCCCACCTCC TCCTCCTCCC661 CCTCCCCCCA ACAACAACAA CAACAACAAC TCCAAGCACA CCGGCCATAA GAGTGCGTGT721 GTCCCCAACA TGACCGAACG AAGAAGGGAC GAGCTCTCTG AAGAGATCAA CAACTTAAGA781 GAGAAGGTCA TGAAGCAGTC GGAGGAGAAC AACAACCTGC AGAGCCAGGT GCAGAAGCTC841 ACAGAGGAGA ACACCACCCT TCGAGAGCAA GTGGAACCCA CCCCTGAGGA TGAGGATGAT901 GACATCGAGC TCCGCGGTGC TGCAGCAGCT GCTGCCCCAC CCCCTCCAAT AGAGGAAGAG961 TGCCCAGAAG ACCTCCCAGA GAAGTTCGAT GGCAACCCAG ACATGCTGGC TCCTTTCATG1021 GCCCAGTGCC AGATCTTCAT GGAAAAGAGC ACCAGGGATT TCTCAGTTGA TCGTGTCCGT1081 GTCTGCTTCG TGACAAGCAT GATGACCGGC CGTGCTGCCC GTTGGGCCTC AGCAAAGCTG1141 GAGCGCTCCC ACTACCTGAT GCACAACTAC CCAGCTTTCA TGATGGAAAT GAAGCATGTC
1201 TTTGAAGACC CTCAGAGGCG AGAGGTTGCC AAACGCAAGA TCAGACGCCT GCGCCAAGGC1261 ATGGGGTCTG TCATCGACTA CTCCAATGCT TTCCAGATGA TTGCCCAGGA CCTGGATTGG1321 AACGAGCCTG CGCTGATTGA CCAGTACCAC GAGGGCCTCA GCGACCACAT TCAGGAGGAG1381 CTCTCCCACC TCGAGGTCGC CAAGTCGCTG TCTGCTCTGA TTGGGCAGTG CATTCACATT1441 GAGAGAAGGC TGGCCAGGGC TGCTGCAGCT CGCAAGCCAC GCTCGCCACC CCGGGCGCTG1501 GTGTTGCCTC ACATTGCAAG CCACCACCAG GTAGATCCAA CCGAGCCGGT GGGAGGTGCC1561 CGCATGCGCC TGACGCAGGA AGAAAAAGAA AGACGCAGAA AGCTGAACCT GTGCCTCTAC1621 TGTGGAACAG GAGGTCACTA CGCTGACAAT TGTCCTGCCA AGGCCTCAAA GTCTTCGCCG1681 GCGGGAAACT CCCCGGCCCC GCTGTAGAGG GACCTTCAGC GACCGGGCCA GAAATAATAA1741 GGTCCCCACA AGATGATGCC TCATCTCCAC ACTTGCAAGT GATGCTCCAG ATTCATCTTC1801 CGGGCAGACA CACCCTGTTC GTCCGAGCCA TGATCGATTC TGGTGCTTCT GGCAACTTCA1861 TTGATCACGA ATATGTTGCT CAAAATGGAA TTCCTCTAAG AATCAAGGAC TGGCCAATAC1921 TTGTGGAAGC AATTGATGGG CGCCCCATAG CATCGGGCCC AGTTGTCCAC GAAACTCACG1981 ACCTGATAGT TGACCTGGGA GATCACCGAG AGGTGCTGTC ATTTGATGTG ACTCAGTCTC2041 CATTCTTCCC TGTCGTCCTA GGGGTTCGCT GGCTGAGCAC ACATGATCCC AATATCACAT2101 GGAGCACTCG ATCTATCGTC TTTGATTCTG AATACTGCCG CTACCACTGC CGGATGTATT2161 CTCCAATACC ACCATCGCTC CCACCACCAG CACCACAACC GCCACTCTAT TATCCAGTAG2221 ATGGATACAG AGTTTACCAA CCAGTGAGGT ATTACTATGT CCAGAATGTG TACACTCCAG2281 TAGATGAGCA CGTCTACCCA GATCACCGCC TGGTTGACCC TCACATAGAA ATGATACCTG2341 GAGCACACAG TATTCCCAGT GGACATGTGT ATTCACTGTC CGAACCTGAA ATGGCAGCTC2401 TTCGAGATTT TGTGGCAAGA AATGTAAAAG ATGGGCTAAT TACTCCAACG ATTGCACCTA2461 ATGGAGCCCA AGTTCTCCAG GTGAAGAGGG GGTGGAAACT GCAAGTTTCT TATGATTGCC2521 GAGCTCCAAA CAATTTTACT ATCCAGAATC AGTATCCTCG CCTATCTATT CCAAATTTAG2581 AAGACCAAGC ACACCTGGCA ACGTACACTG AATTCGTACC TCAAATACCT GGATACCAAA2641 CATACCCCAC ATATGCCGCG TACCCGACCT ACCCAGTAGG ATTCGCCTGG TACCCAGTGG2701 GACGAGACGG ACAAGGAAGA TCACTATATG TACCTGTGAT GATCACTTGG AATCCACACT2761 GGTACCGCCA GCCTCCGGTA CCACAGTACC CGCCGCCACA GCCGCCGCCT CCACCACCAC2821 CACCGCCGCC GCCTCCATCT TACAGTACCC TGTAAATACC TGTCATGTCC TTCAGGATCT2881 CTGCCCTCAA AATTTATTCC TGTTCAGCTT CTCAATCAGT GACTGTGTGC TAAATTTTAG2941 GCTACTGTAT CTTCAGGCCA CCTGAGGCAC ATCCTCTCTG AAACGGCTAT GGAAGGTTAG3001 GGCCACTCTG GACTGGCACA CATCCTAAAG CACCAAAAGA CCTTCAACAT TTTCTGAGAG3061 CAACAGAGTA TTTGCCAATA AATGATCTCT CATTTTTCCA CCTTGACTGC CAATCTAACT3121 AAAATAATTA ATAAGTTTAC TTTCCAGCCA GTCCTGGAAG TCTGGGTTTT ACCTGCCAAA3181 ACCTCCATCA CCATCTAAAT TATAGGCTGC CAAATTTGCT GTTTAACATT TACAGAGAAG3241 CTGATACAAA CGCAGGAAAT GCTGATTTCT TTATGGAGGG GGAGACGAGG AGGAGGAGGA3301 CATGACTTTT CTTGCGGTTT CGGTACCCTC TTTTTAAATC ACTGGAGGAC TGAGGCCTTA3361 TTAAGGAAGC CAAAATTATC GGTGCAGTGT GGAAAGGCTT CCGTGATCCT CTCGCTGCAC3421 CCTTAGAAAC TTCACCGTCT TCAAACTCCA TTTCCATGGT TCTGTTAATT CTCAAGGAGC3481 AGCAACTCGA CTGGTTCTCC CAGGAGCAGG AAAAACCCTT GTGACATGAA ACATCTCAGG3541 CCTGAAAAGA AAGTGCTCTC TCAGATGGAC TCTTGCATGT TAAGACTATG TCTTCACATC3601 ATGGTGCAAA TCACATGTAC CCAATGACTC CGGCTTTGAC ACAACACCTT ACCATCATCA3661 TGCCATGATG GCTTCCACAA AGCATTAAAC CTGGTAACCA GAGATTACTG GTGGCTCCAG3721 CGTTGTTAGA TGTTCATGAA ATGTGACCAC CTCTCAATCA CCTTTGAGGG CTAAAGAGTA3781 GCACATCAAA AGGACTCCAA AATCCCATAC CCAACTCTTA AGAGATTTGT CCTGGTACTT
3841 CAGAAAGAAT TTTCATGAGT GTTCTTAATT GGCTGGAAAA GCACCAGCTG ACGTTTTGGA3901 AGAATCTATC CATGTGTCTG CCTCCATATG CATCTGGGCA TTTCATCTTC AGTCCCCTCA3961 TTAGACTGTA GCATTAGGAT GTGTGGAGAG AGGAGAAATG ATTTAGCACC CAGATTCACA4021 CTCCTATGCC TGGAAGGGGG ACATCTTTGA AGAAGAGGAA TTAGGGCTGT GGACACTGTC4081 TTGAGGATGT GGACTTCCTT AGTGAGCTCC ACATTACTTG ATGGTAACCA CTTCAAAAGG4141 ATCAGAATCC ACGTAATGAA AAAGGTCCCT CTAGAGGATG GAGCTGATGT GAAGCTGCCA4201 ATGGATGAAA AGCCTCAGAA AGCAACTCAA AGGACTCAAA GCAACGGACA ACACAAGAGT4261 TGTCTTCAGC CCAGTGACAC CTCTGATGTC CCCTGGAAGC TTTGTGCTAA CCTGGGACTG4321 CCTGACTTCC TTTAGCCTGG TCCCTTGCTA CTACCTTGAA CTGTTTTATC TAACCTCTCT4381 TTTTCTGTTT AATTCTTTGC TACTGCCATT GACCCTGCTG CAGGATTTGT GTCATTTTCC4441 TGCCTGGTTG CTGAGACTCC ATTTTGCTGC CACACACAGA GATGTAAGAG GCAGGCTTTA4501 ATTGCCAAAG CACAGTTTGA GCAGTAGAAA ACAACATGGT GTATATCTCA AATTGCCTGA4561 CATGAAGAGG AGTCTAACGG TGAAGTTTCA CTTTTCATCA GCATCATCTT TCACATGTTC4621 ATTATCATCT GCTCTTATTC TTGCATGTTT AAACACTTAA AATTTTTAGT ATAATTTTTA4681 GTGTGTTTTG AAGTGGTGAC TAGGCTTTCA AAAACTTCCA TTGAATTACA AAGCACTATC4741 CAGTTCTTAT TGTTAAACTA AGTAAAAATG ATAAGTAACA TAGTGTAAAA TATTCCTTTA4801 CTGTGAACTT CTTACAATGC TGTGAATGAG AGGCTCCTCA GAACTGGAGC ATTTGTATAA4861 TAATTCATCC TGTTCATCTT CAATTTTAAC ATCATATATA ATTTCAATTC TATCAATTGG4921 GCCTTTAAAA ATCATATAAA AGGATATAAA ATTTGAAAAG AGAAACCTAA TTGGCTATTT4981 AATCCAAAAC AACTTTTTTT TTCCTTCAAT GGAATCAGAA AGCTTGTCAA TCACTCATGT5041 GTTTTAGAGT AATTACTTTT AAAATGGTGC ATTTGTGCTT CTGAACTATT TTGAAGAGTC5101 ACTTCTGTTT ACCTCAAGTA TCAATTCATC CTCCATACAT TTGAATTCAA GTTGTTTTTT5161 TGTCAAATTT ACAGTTGTCA ATTGATCTTC AAGCTGCAGG GTGCCTAGAA ATGGGCCGTT5221 GTCTGTAGCC CTGGCATGTG CACACGGACA TTTGCCACCA CTGCAAGCAA AAGTCTGGAG5281 AAGTTCACCA ACGACAAGAA CGATTAGGGA AAATATGCTG CTGTGGGTTA ACAACTCAGA5341 AAGTCCCTGA TCCACATTTG GCTGTTTACT AAAGCTTGTG ATTAACTTTT TGGCAGTGTG5401 TACTATGCTC TATTGCTATA TATGCTATCT ATAAATGTAG ATGTTAAGGA TAAGTAATTC5461 TAAATTTATT ATTCTATAGT TTTGAAGTTT GGTTAAGTTT CCTTTCACTC AATTGATTTA5521 TTTTGTTGTT AATCAAATTT ATGTTAATTG GATCCTTTAA ATTTTTTTTG GCATTTTCCA5581 ACAAAAATGG CTTTATTCAT AAGAAAGGAA AAAAATCAAT GGAATTTGAT ATCTAAAGAA5641 GTTAGAAAGG GAGCAAAATA AAAAACATAA AGGAGATAGA TGAATTAGTA AGCAAATCAG5701 TAGTCGAGTT TTTCAAACTG GCAAAATTAA TTAATTGACT TTTAGCCCAA ATTTACATTG5761 TTAATTAAAT CAAGAAGGAA GAAGATCTAA GAGCTCCCAT TGATAGGCAA GCCTAGAGAG5821 AACTAGCTAA ATTTATCATG CTAGGATATT GAAACACAGA AAGTTTACAT ACATTTATGA5881 AGGGTCAATT TAGTTTGGAC AGTGAGGTAT TTGTCTTAGT GGAAAAAAGG AGAATTAGTC5941 TGATCAAATC GTGAAGTAAT ACAGTGAACT TGCAGGTGCA CAAAATAAGA GGGCCACATC6001 TATATGGTGC AGTCTGGAAT TCTGTTTAAG TTTGTAGGTA CCTCTTGGAC TTCTGAATTG6061 ATCCAGTTGT CATCCACCAC AGACATCTCA CATCAGATAC AGTTCCAAGA TTGACAACAG6121 AGAACAACCT GCTGGAAAGA CCTGGGCAGA AATGGAGAGC CCTGCGGGAA CCATGCTACA6181 TTTTCATCTA AAGAGAGAAT GCACATCTGA TGAGACTGAA AGTTCTTTGT TGTTTTAGAT6241 TGTAGAATGG TATTGAATTG GTCTGTGGAA AATTGCATTG CTTTTATTTC TTTGTGTAAT6301 CAAGTTTAAG TAATAGGGGA TATATAATCA TAAGCATTTT AGGGTGGGAG GGACTATTAA6361 GTAATTTTAA GTGGGTGGGG TTATTTAGAA TGTTAGAATA ATATTATGTA TTAGATATCG6421 CTATAAGTGG ACATGCGTAC TTACTTGTAA CCCTTTACCC TATAATTGCT ATCCTTAAAG
6481 ATTTCAAATA AACTCGGAGG GAACTGCAGG GAGACCAACT TATTTAGAGC GAATTGGACA6541 TGGATAAAAA CCCCAGTGGG AGAAAGTTCA AAGGTGATTA GATTAATAAT TTAATAGAGG6601 ATGAGTGACC TCTGATAAAT TACTGCTAGA ATGAACTTGT CAATGATGGA TGGTAAATTT6661 TCATGGAAGT TATAAAAGTG ATAAATAAAA ACCCTTGCTT TTACCCCTGT CAGTAGCCCT6721 CCTCCTACCA CTGAACCCCA TTGCCCCTAC CCCTCCTTCT AACTTTATTG CTGTATTCTC6781 TTCACTCTAT ATTTCTCTCT ATTTGCTAAT ATTGCATTGC TGTTACAATA AAAATTCAAT6841 AAAGATTTAG TGGTTAAGTG C<210> 2<211> 568<212> PRT<213> 智人(Homo sapiens)<400> 21 MCHKLTDGRF SGATIQNEEQ RYRSCRQKTE LRFTCAAKSE LQKSSTTKNA51 TKTMRLASPT TALHCAARHM NCRAPPPTAP PQSRLPCSAV TQSPCATMRP101 SQARAPSSRA RDFWIQDHRS EAPHELVGRG SALLVSGRHG DVRRAQHADQ151 GSDGTLWCLF GSVGWYRAIN KRVLKTKKRR SGRGGQDPGL HPHRSEATAG201 RSPPTPTVTL GPDCPPPPPP PPPNNNNNNN SKHTGHKSAC VPNMTERRRD251 ELSEEINNLR EKVMKQSEEN NNLQSQVQKL TEENTTLREQ VEPTPEDEDD301 DIELRGAAAA AAPPPPIEEE CPEDLPEKFD GNPDMLAPFM AQCQIFMEKS351 TRDFSVDRVR VCFVTSMMTG RAARWASAKL ERSHYLMHNY PAFMMEMKHV401 FEDPQRREVA KRKIRRLRQG MGSVIDYSNA FQMIAQDLDW NEPALIDQYH451 EGLSDHIQEE LSHLEVAKSL SALIGQCIHI ERRLARAAAA RKPRSPPRAL501 VLPHIASHHQ VDPTEPVGGA RMRLTQEEKE RRRKLNLCLY CGTGGHYADN551 CPAKASKSSP AGNSPAPL
權利要求
1.一種分離出的DNA分子,其特征在于,它包括編碼具有人PEG10蛋白質活性的多肽的核苷酸序列,而且所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度嚴緊條件下與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列雜交。
2.如權利要求1所述的DNA分子,其特征在于,所述的序列編碼具有SEQ ID NO.2所示的氨基酸序列的多肽。
3.如權利要求1所述的DNA分子,其特征在于,該序列具有SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列。
4.一種分離出的人PEG10蛋白多肽,其特征在于,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性變異多肽、或其活性片段,或其活性衍生物。
5.如權利要求4所述的多肽,其特征在于,該多肽是具有SEQ ID NO.2序列的多肽。
6.一種載體,其特征在于,它包含權利要求1所述的DNA。
7.一種由權利要求6所述載體轉化的宿主細胞,其特征在于,包括原核細胞和真核細胞。
8.一種具有人PEG10蛋白質活性的多肽的制備方法,其特征在于,包括如下步驟(1)將編碼具有人PEG10蛋白活性的多肽的核苷酸序列可操作地連于表達調控序列,形成人PEG10蛋白表達載體,所述的核苷酸序列與SEQ ID NO.1中從核苷酸第1-1707位的核苷酸序列有至少70%的同源性;(2)將步驟(1)中的表達載體轉入宿主細胞,形成人PEG10蛋白的重組細胞;(3)在適合表達人PEG10蛋白多肽的條件下,培養步驟(2)中的重組細胞;(4)分離出具有人PEG10蛋白活性的多肽。
9.一種能與權利要求4所述的人PEG10蛋白多肽特異性結合的抗體,其特征在于,包括多克隆抗體和單克隆抗體。
10.PEG10基因作為肝癌診斷標志物的應用。
全文摘要
本發明公開了一種肝癌高表達基因PEG10,本發明還公開了PEG10基因的 編碼蛋白,此外,本發明還公開了PEG10基因作為肝癌診斷標志物的應用。本發明PEG10基因是一種肝癌高表達基因,PEG10在肝癌中的表達率高達66%,而在癌旁肝組織的表達率和表達水平極低。因此PEG10多核苷酸、PEG10蛋白及其抗體,以及PEG10蛋白相關的拮抗劑、激動劑等可為治療包括肝癌等多種疾病提供新的治療途徑,因而具有巨大的應用前景。
文檔編號C07K14/435GK1952130SQ20051003068
公開日2007年4月25日 申請日期2005年10月20日 優先權日2005年10月20日
發明者黃健, 韓澤廣, 林昀 申請人:上海人類基因組研究中心