中文字幕无码日韩视频无码三区

一個鋅指蛋白家族的人類新基因znf329的制作方法

文檔(dang)序(xu)號(hao):3569360閱讀:473來源:國(guo)知(zhi)局
專利名稱:一個鋅指蛋白家族的人類新基因znf329的制作方法
技術領域
本發明涉及鋅指蛋白家族的人類新基因ZNF329及其克隆、在成人各組織和人體胚胎發育的不同階段的表達,以及該基因在不同物種間同源基因的同源程度,以探索利用該基因進行人類疾病的診斷及治療。
背景技術
鋅指蛋白家族一般具有該家族的特征性結構----鋅指蛋白結構域,是最先在果蠅中被確立的、為中樞神經系統和肌肉等組織分化所必需的調控因子(POSTIGO AA,SHEPPARD A M,MUCENSKI M L,et al.EuropeanMolecular Biology Organization of Journal,1997,16(13)3924-3834)。已知zfh-1基因在早期果蠅胚胎的中胚層以及晚期胚胎的多種中胚層衍生結構中表達,其中包括背側內臟、性腺支持細胞和成肌細胞等;此外還主要在發育時的中樞神經系統運動神經元中表達。研究表明,Zfh-1蛋白是果蠅中調節肌細胞和性腺細胞分化的轉錄抑制因子;zfh-1基因參與調節果蠅的尾部中胚層(CVM)的早期分化;參與調節表達eve基因的心臟前體細胞(EPC)的形成;還與tinman基因一同調節包括性腺中胚層在內的外側中胚層的進一步分化(LAI Z C,FORTONI M E,RUBIN C M et al,Mechanism of Development,1991,34(1-2)123-124;POSTIGO AA,DEAN D C.Proceeding NationalAcademic Science USA.2000,1997(12)6391-6396;KUSCH T,REUTER R.Development,1999,126(18)3991-4003;SU M T,FUJIOKA M,GOTO T,etal,Development,1999,126(14)3241-3251).
zfh-1在脊椎動物中的同源基因也有相似的功能。如ZEB基因的表達產物ZEB-1和ZEB-2蛋白,在包括肌肉、中樞神經系統、T淋巴細胞等組織中均有表達,而最近發現ZEB蛋白包含兩個獨立的區域,分別調節哺乳動物肌細胞和淋巴細胞的分化(POSTIGO AA,DEAN D CDevelopment,1999,19(12)7961-7971)。
小鼠的zfp-35基因則是精子發生中粗線期精母細胞發育的上游調節基因(CUNLIFFE V,KOOPMAN P,MCLAREN A et al,European MolecularBiology Organization of Joural,1990,9(1)197-205)。而人類鋅指基因ZNF家族已被發現參與調節某些腫瘤的形成(OGURI T,KATOHO,TAKAHASHI T et al,Gene,1998,222(1)61-67.)。

發明內容
本發明旨在提供一個鋅指蛋白家族的人類新基因ZNF329全部cDNA序列,并分析它在人體各組織和胚胎不同發育階段的表達,在染色體上的定位,以及不同物種間同源基因的同源度分析。
本發明利用果蠅zfh-1基因的cDNA序列在基因組序列數據庫中檢索,得到了該cDNA的各種人類同源序列所編碼的氨基酸序列,在其中發現了一個新的蛋白質,由此得到了ZNF329的部分cDNA序列,以該序列為基礎,利用RACE試劑盒和數據庫檢索,獲得5’端和3’端序列,從而獲得全長cDNA序列。
本發明根據該序列設計引物,以正常人胎盤組織cDNA為模板,通過PCR擴增獲得該基因的開放閱讀框序列,并將開放閱讀框克隆到TOPO TA載體上并測序,測序結果與計算機檢索結果完全吻合。以開放閱讀框的酶切片段為探針,與正常成人組織的總RNA膜進行Nothern雜交,結果表明ZNF329mRNA全長2.9kb,且在大腦組織有較強表達。在開放閱讀框5’端設計引物,利用TakaRa公司的5’端RACE試劑盒,以大腦組織的mRNA為模板,做5’端RACE,獲得該基因的5’端序列。以胎盤組織cDNA為模板,利用獲得的5’端序列設計5’引物,利用數據庫檢索得到的3’端同源EST序列設計3’端引物,PCR擴增得到ZNF329全長cDNA,克隆到TOPO TA cloning載體(由Invitroten公司提供)上并測序(圖1)。該基因cDNA全長2918bp,其中5’端非翻譯區為260bp,編碼區為542bp,編碼542個氨基酸組成的蛋白質,3’端非翻譯區為1092bp(圖2),其近5’端有一個起始密碼子ATG,近3’端有一個終止密碼子TGA以及末端的加尾信號ATAAA。
該基因位于第19染色體的BAC CTD2623H2上,共有5個外顯子,跨越基因組24.6kb。用遺傳學標記進行精確定位,發現該BAC定位于19q13.4區域。根據數據庫最新資料,這一區域是缺失畸變易發區。目前已有結果表明,有一個與甲狀腺癌相關的抑癌基因位于該區域。同時,這一區域還是鋅指蛋白基因富集區,至少有6個以上的鋅指蛋白基因位于該區域。
以ZNF329cDNA作探針,與成人免疫組織的mRNA膜雜交,發現該基因在肝臟、胸腺、淋巴結和脾臟中均有表達,而且在肝臟中的表達最強。說明該基因在免疫功能方面可能起著重要的作用。
另外,以開放閱讀框的酶切片段為探針,同時與人體胚胎5個不同發育時期的總RNA模雜交,結果表明該基因在胚胎發育的不同階段存在表達差異,從18周胚胎到26周胚胎,在大腦中都有較強的表達,在肝臟中只有第26周沒有表達信號。在腸的表達是從25周開始的,26周也有表達,但是在此之前的18周、19周和2l周的胚胎中都沒有表達。ZNF329在18周胚胎的腎中表達,但是在19周和2l周無表達,在25周有較弱表達,在6周又有較強表達(圖3)。這些結果表明,ZNF329的表達存在空間和時間差異性,在人體發育的早期階段的不同組織起著不同的作用。
用該基因編碼的蛋白質檢索蛋白質數據庫,得到了該基因在不同物種中的同源基因。ZNF329與小鼠RIKEN基因具有最高的同源度,547個氨基酸中有75%的同源,與小鼠另一個基因也有較高的同源度,483個氨基酸中77%同源。與狗bc3基因的同源度為52%(477個氨基酸),人類的鋅指蛋白家族的其他幾個基因ZNF1111,ZNF180,ZNF,以及蛋白flj12586與ZNF329的同源度分別為55%(418),47%(554),100%(374),57%(382)(圖5)。ZNF329具有鋅指蛋白家族基因特征的結構域Cys2/His2結構(Tommerup N,VissingH,Genomics 1995 May 20;27(2)259-264.。研究表明,具有Cys2/His2結構的基因往往是轉錄調控因子,表明ZNF329也可能是一種轉錄因子。
本發明的優點1、提供了全新的ZNF329基因的全長cDNA序列,它的編碼產物屬于鋅指蛋白。
2、ZNF329基因的蛋白序列具有鋅指蛋白家族的特征Cys2/His2結構域,這種結構域是DNA的結合位點,具有該結構的基因往往參與轉錄調節,表明ZNF329的編碼蛋白能夠作為轉錄因子,在細胞的增殖和分化中起作用,有可能成為基因工程的產品。
3、ZNF329在正常人組織中廣泛表達,顯示該基因在細胞內具有重要的作用,也可以為疾病的診斷提供指標。
4、NF329在人體胚胎不同發育階段有不同的表達,表明該基因參與人體的早期發育,為疾病的早期基因治療提供了可能。
本發明通過以下附圖和實施例作進一步闡述,但并不限制本發明的范圍。


圖1.ZNF329的cDNA序列圖2.ZNF329的編碼蛋白圖3.在人體胚胎不同發育階段的Northern雜交圖3a 18周胚胎1肝2腸 3腎上腺 4心臟 5肺 6舌 7大腦8小腦9腎10肌肉11胃 12脾有陽性信號的組織1肝 5肺 7大腦 8小腦 9腎圖3b 19周胚胎1肝 2腸 3心臟 4肺 5腎 6肌肉 7胃有陽性信號的組織 1肝 7大腦 8小腦圖3c 21周胚胎1肝 2腸 3腎上腺 4心臟 5肺 6大腦 7小腦8腎 9肌肉 10胃有陽性信號的組織1肝 3腎上腺 5肺 6大腦 7小腦圖3d 25周胚胎1肝 2腸 3心臟 4肺 5腎 6肌肉 7胃有陽性信號的組織1肝 2腸 3心臟 4肺 6肌肉圖3e 26周胚胎1肝 2腸 3腎上腺 4心臟 5肺6舌 7大腦8腎9肌肉10胃有陽性信號的組織2腸 3腎上腺 5肺 6舌 7大腦 8腎圖4.在人體免疫系統組織的Northern雜交1脾 2淋巴結 3胸腺 4外周血 5骨髓 6胎兒肝圖5.ZNF329編碼的蛋白在不同物種間的同源性比較實施例1 ZNF329全長cDNA的克隆與測序1、ZNF329開放閱讀框的克隆以胎盤組織的cDNA為模板,利用部分cDNA序列設計引物,PCR擴增得到該基因開放閱讀框序列,經T載體克隆并測序。
引物序列Z1S5-TGA ATG GAT CCC TCT GCC TTT C-3Z1AS5-ACC ATT ATG TTT CCA TGG GTT GCT C-32、利用TakaRa公司的5’端RACE試劑盒做ZNF329基因的5’端RACE以開放閱讀框序列設計RACE引物5’端磷酸化RT primer5-TTG CCT CAA GTG TCC CTC C-3primer A15-TCG ATG GTT GCT GGA CAT T-3primer S15-TTA GGT GAT GGT TGG GAC TG-3primer A25-TGG TTG CTG GAC ATT AGC C-3primer S25-CCA GGA GGG ACA CTT GAG G-3上述引物均由上海生工公司合成。
本實驗中取大腦組織mRNA 5ug為模板。具體操作按該公司protocol進行。
3、ZNF329全長cDNA的克隆以胎盤組織的cDNA為模板,利用5’端RACE獲得的5’端序列設計5’引物,利用數據庫檢索得到的3’端同源EST序列設計3’端引物,PCR擴增得到ZNF329全長cDNA,T載體克隆并測序(圖1)。該基因cDNA全長2918bp,其中5’端非翻譯區為260bp,編碼區為542bp,編碼542個氨基酸組成的蛋白質,3’端非翻譯區為1092bp(圖2),其近5’端有一個起始密碼子ATG,近3’端有一個終止密碼子TGA以及末端的加尾信號ATAAA。
引物序列5’端引物(Z2S)5-TAA ATG CCT GCG CGT CCG CCC-3
3’端引物(Z2AS)5-CCA GTC CCC AAA GAA AAC C-3實施例2 Northern雜交1組織總RNA的提取(按王雁云等,一種快速的總RNA提取方法,生命科學研究,5(1)88-90(2001)進行)。
2總RNA的電泳及轉膜,均按《現代分子生物學實驗技術》介紹的方法進行(盧圣棟主編,第二版)。
3Northern雜交將固定有人各種組織的總RNA的尼龍膜,放在雜交袋中,加入變性10ml68℃預熱的快速雜交液(Clontech公司),68℃預雜交的30分鐘,加入變性的同位素標記的ZNF329cDNA探針,42℃雜交過夜。2XSSC,0.05%SDS洗膜,42℃洗兩次,15分鐘/次。0.1XSSC,0.1%SDS 42℃洗兩次,15分鐘/次。
4.-80℃曝光12小時,洗出X光片即得圖3.4。
權利要求
1.一個鋅指蛋白家族的人類新基因ZNF329,其特征在于該人類新基因ZNF329的cDNA核苷酸序列與氨基酸序列如下>znf329的cDNA序列exon1TAA 34 AAT GCC TGC GCG TCC GCC CCG AGG CAA GTC CAC GCC AGG GTA ATG4849AAT AAC CCG GTA CCC GCG GCC GCC CCA GCG TTG GGC GGG GGA AGC9394TCG GGG ACT CCG CGC ACG CGC ACA TCC TTG TCC CGG CAG CCG CGC138exon2139 AAG CGC AAT CGC CCG GAA CAT GGC TGC CGC CGG CCG CCA ACC/ GAT 183184 GGC TGG AGC CGT GTG GAT GGG CAT AAA TGG CTA ATG TCC AGC AAC228229 CAT CGA TGT CAA GTA TCC ACA CAC CTG GCC TGA ATG GAT CCC TCT273exon3274 GCC TTT CAG A/GA GTT TGG GAT ATG AGA TTG AAA ATG ACG ACT CGG 318319 AAT TTT CCT GAG AGA GAA GTA CCC TGT GAT GTA GAA GTG GAA AGA363364 TTC ACA AGG GAA GTT CCC TGC TTG TCC AGT TTA GGT GAT GGT TGG408409 GAC TGT GAG AAC CAG GAG GGA CAC TTG AGG CAA TCA GCT TTA ACT453454 CTG GAG AAA CCA GGG ACT CAG GAA GCA ATT TGT GAA TAT CCT GGT498499 TTT GGG GAG CAT TTG ATT GCA AGC TCA GAC CTT CCA CCG TCT CAG543544 AGA GTT CTG GCA ACA AAT GGT TTC CAT GCA CCT GAC TCA AAT GTT588589 AGT GGT CTG GAT TGT GAC CCC GCC TTA CCC AGC TAT CCT AAA AGT633634 TAT GCA GAT AAG AGA ACT GGT GAC AGT GAT GCC TGT GGA AAA GGC678679 TTC AAC CAT TCC ATG GAA GTT ATT CAT GGA AGA AAT CCA GTG AGA723exon4724 GAG AAG CCC T/AT CAT TTT ACC TCT CTT GGT CAT CAG AAA ATA ATG 768769 AAA AGA GGC AAG AAA TCG TAT GAA GGT AAG AAT TTT GAG AAC ATC813814 TTT ACT CTG AGC TCA TCG CTT AAT GAA AAC CAG AGA AAT CTC CCT858859 GGA GAG AAA CAA TAT AGA TGT ACT GAA TGT GGC AAA TGC TTC AAA903904 CGG AAC TCT TCT CTT GTT TTG CAT CAC CGA ACT CAC ACC GGA GAG948949 AAG CCT TAT ACT TGT AAT GAG TGT GGA AAG TCC TTC TCC AAG AAC993(后續)994 TAC AAC CTG ATT GTG CAT CAA AGA ATC CAC ACA GGA GAG AAG CCC 10381039 TAT GAA TGC AGT AAA TGT GGG AAA GCT TTC AGT GAT GGC TCA GCT 10831084 CTG ACA CAG CAC CAG AGA ATT CAC ACA GGC GAG AAA CCT TAT GAA 11281129 TGC CTA GAG TGT GGA AAA ACC TTC AAC CGA AAT TCA TCC TTA ATT 11731174 TTG CAC CAA AGA ACT CAT ACA GGG GAA AAA CCA TAT AGA TGT AAC 12181219 GAA TGT GGG AAA CCC TTC ACT GAC ATC TCC CAC CTT ACA GTG CAT 12631264 CTC AGA ATC CAC ACC GGT GAG AAG CCC TAT GAG TGT AGC AAA TGT 13081309 GGA AAG GCT TTC CGG GAC GGC TCG TAC CTC ACC CAG CAT GAG AGG 13531354 ACT CAC ACT GGA GAA AAG CCC TTT GAG TGT GCA GAG TGC GGG AAA 13981399 TCC TTC AAC AGA AAC TCT CAC CTC ATT GTG CAT CAA AAG ATC CAT 14431444 TCT GGG GAG AAA CCC TAT GAA TGT AAA GAA TGT GGC AAG ACT TTC 14881489 ATC GAG AGT GCG TAC CTC ATC AGG CAT CAG AGG ATT CAT ACT GGC 15331534 GAG AAG CCC TAT GGC TGC AAC CAG TGT CAG AAA CTT TTC AGG AAT 15781579 ATC GCT GGC CTC ATT AGG CAC CAG AGG ACT CAT ACT GGT GAG AAG 16231624 CCC TAT GAG TGT AAT CAG TGT GGC AAA GCC TTC AGG GAC AGC TCC 16681669 TGT CTG ACC AAG CAC CAG AGA ATT CAC ACT AAG GAG ACC CCA TAT 17131714 CAG TGT CCA GAA TGT GGG AAG TCC TTC AAG CAG AAC TCT CAC CTG 17581759 GCA GTA CAT CAG AGA CTC CAT AGC AGG GAG GGT CCC AGC CGG TGT 18031804 CCT CAG TGT GGA AAA ATG TTC CAA AAG AGC TCA TCC CTT GTT CGA 18481849 CAT CAA AGA GCA CAC CTG GGA GAG CAA CCC ATG GAA ACA TAA TGG 18931894 TTG GGG GCC ACA TGA GTC TTC CAG TTC ACT CTC ACT CCT GTG TTT 19381939 AGG AGG CGT GTC TTA GAT CTG ACT CCT CTC TGG TCA GTA GAA AAG 19831984 AAT CCT TTA AGC TAT CCA GTG AAT TGA TGA ATG TGA GAC ATT GCT 20282029 GAG CCA CAC TGT TAA GTC TGC TCA TTG GGG AAC TCC AGA GAC AAC 20732074 TTA GGA TGA GGG CAG AAA AGT CTT TGG GGA TGA TTC AGT CTG TAC 21182119 CAG ACA TGA CAA CAC ACA CAC TGG AAT GAA ATG TGC AAA CAT GGG 21632164 GGT GAC ACC ACA GAG AGA ACC TGT GAA TGC ATT CAG AAC ATG ATT 22082209 GGA ATG AAG AGC CCT GTA GTA GGG AGT TTC CAC CTT GTA CGT AAG 22532254 CAA ACA CTG AAT CAA CTT TTT TTT TTT TTT CGG ACA GAG TCT CAC 2298(后續)2299 TGT GCA GTG GCA TGA TCT CCA CTC ACA GCA ACC TCT GCC TCC CAG 2343exon52344 GTT CAA GCA GTT CTC CTG CC/T CAG CCT GGC CAG CAT GGT GAA ACC 23882389 CCA TCT CTA CCA AAA ATA CAG GAA ATT ATC TGG GCA TAG TAG TGT 24332434 GTG CCT GTA ATC CCA GCT ACT TGG GAA GCT GAG GCA GGA GAA TTG 24782479 CTT GAA CCT GGG AGG TGG AGG TTG CAG TGA GCT AAG ATC GCA CCA 25232524 CTG CAC TCC AGC CTG GGT GAC AGA GCG AGA CTC CAT TTC AAA AAA 25682569 AAA GAC TGA AAC AAG CTT GTG CTA AGA TGG AAA GGG CTG CTT CTA 26132614 ACA GAT GTG GTT TGT TGC TTT AGT TGT TGA AGC AAA AAT ACT GAG 26582659 TTG TTA TGT TTA TGT TAT CAC CCC ACC ACT ACC TCC ATG GTT GTT 27032704 CAT TTA GGA TGC TTC TAA TTC AGC CAC TGT GAA CCA TTA TAA AGG 27482749 TTT TAT TGC CAT GTT GAA AAT GTT TAT AAT ATG GCA AAA AGG GGC 27932794 ATC AAA TAG AAG ATT TAC TAT TAT TCC AGC CAT GTA AAA ATA TGT 28382839 GCA CAT ATG GAT GTA TGT TGA AAG TGG ATG ATG GAG AAA TAA AAT 28832884 GTG GTT TTC TTT GGG GAC TGG AAA AAA AAA AAA AAA 2919>znf329的編碼蛋白1 Met Asp Pro Ser 45 Ala Phe Gln Arg Val Trp Asp Met Arg Leu Lys Met Thr Thr Arg 1920Asn Phe Pro Glu Arg Glu Val Pro Cys Asp Val Glu Val Glu Arg 3435Phe Thr Arg Glu Val Pro Cys Leu Ser Ser Leu Gly Asp Gly Trp 4950Asp Cys Glu Asn Gln Glu Gly His Leu Arg Gln Ser Ala Leu Thr 6465Leu Glu Lys Pro Gly Thr Gln Glu Ala Ile Cys Glu Tyr Pro Gly 7980Phe Gly Glu His Leu Ile Ala Ser Ser Asp Leu Pro Pro Ser Gln 9495Arg Val Leu Ala Thr Asn Gly Phe His Ala Pro Asp Ser Asn Val 109110 Ser Gly Leu Asp Cys Asp Pro Ala Leu Pro Ser Tyr Pro Lys Ser 124125 Tyr Ala Asp Lys Arg Thr Gly Asp Ser Asp Ala Cys Gly Lys Gly 139140 Phe Asn His Ser Met Glu Val Ile His Gly Arg Asn Pro Val Arg 154155 Glu Lys Pro Tyr His Phe Thr Ser Leu Gly His Gln Lys Ile Met 169(后續)170 Lys Arg Gly Lys Lys Ser Tyr Glu Gly Lys Asn Phe Glu Asn Ile 184185 Phe Thr Leu Ser Ser Ser Leu Asn Glu Asn Gln Arg Asn Leu Pro 199200 Gly Glu Lys Gln Tyr Arg Cys Thr Glu Cys Gly Lys Cys Phe Lys 214215 Arg Asn Ser Ser Leu Val Leu His His Arg Thr His Thr Gly Glu 229230 Lys Pro Tyr Thr Cys Asn Glu Cys Gly Lys Ser Phe Ser Lys Asn 244245 Tyr Asn Leu Ile Val His Gln Arg Ile His Thr Gly Glu Lys Pro 259260 Tyr Glu Cys Ser Lys Cys Gly Lys Ala Phe Ser Asp Gly Ser Ala 274275 Leu Thr Gln His Gln Arg Ile His Thr Gly Glu Lys Pro Tyr Glu 289290 Cys Leu Glu Cys Gly Lys Thr Phe Asn Arg Asn Ser Ser Leu Ile 304305 Leu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Arg Cys Asn 319320 Glu Cys Gly Lys Pro Phe Thr Asp Ile Ser His Leu Thr Val His 334335 Leu Arg Ile His Thr Gly Glu Lys Pro Tyr Glu Cys Ser Lys Cys 349350 Gly Lys Ala Phe Arg Asp Gly Ser Tyr Leu Thr Gln His Glu Arg 364365 Thr His Thr Gly Glu Lys Pro Phe Glu Cys Ala Glu Cys Gly Lys 379380 Ser Phe Asn Arg Asn Ser His Leu Ile Val His Gln Lys Ile His 394395 Ser Gly Glu Lys Pro Tyr Glu Cys Lys Glu Cys Gly Lys Thr Phe 409410 Ile Glu Ser Ala Tyr Leu Ile Arg His Gln Arg Ile His Thr Gly 424425 Glu Lys Pro Tyr Gly Cys Asn Gln Cys Gln Lys Leu Phe Arg Asn 439440 Ile Ala Gly Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 454455 Pro Tyr Glu Cys Asn Gln Cys Gly Lys Ala Phe Arg Asp Ser Ser 469470 Cys Leu Thr Lys His Gln Arg Ile His Thr Lys Glu Thr Pro Tyr 484485 Gln Cys Pro Glu Cys Gly Lys Ser Phe Lys Gln Asn Ser His Leu 499500 Ala Val His Gln Arg Leu His Ser Arg Glu Gly Pro Ser Arg Cys 514515 Pro Gln Cys Gly Lys Met Phe Gln Lys Ser Ser Ser Leu Val Arg 529530 His Gln Arg Ala His Leu Gly Glu Gln Pro Met Glu Thr
全文摘要
本發明涉及鋅指蛋白家族基因。本發明的一個鋅指蛋白家族的人類新基因ZNF329,它的cDNA全長2918bp,編碼542個氨基酸組成的蛋白質;該基因位于第19染色體的BAC2623H
文檔編號C07H21/04GK1341717SQ0112868
公開日2002年3月27日 申請日期2001年10月17日 優先權日2001年10月17日
發明者吳秀山, 朱傳炳, 戴琦, 袁婺洲, 李永清, 王躍群, 羅開梅, 曾偉奇 申請人:湖南師范大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1