專利名稱:哺乳動物的特洛德樣基因和蛋白質的制作方法
相互參照的相關申請本申請要求了1996年5月30日提交的臨時專利申請60/018,684的優先權。
關于聯邦政府贊助的研究或開發的聲明不適用。
背景技術:
本發明涉及骨形態生成蛋白領域,更具體地涉及BMP-1/Tld基因家族中的基因。
哺乳動物如小鼠和人骨骼的形成,是通過一系列骨形態生成蛋白(BMP)來控制的。在參與成骨的7種已知BMP中,6種(稱為BPM-2到BMP-7)屬于TGF-β超家族。第7種BMP(稱為BMP-1)并不類似于TGF-β,而是衍生自不同的基因家族。BMP-1基因家族成員通常有下列結構域蝦紅素樣金屬蛋白酶結構域,一個或多個在其它蛋白中被認為與Ca++結合的EGF樣基序和許多CUB結構域,CUB結構域是介導補體成分Clr/Cls中蛋白之間相互作用的基序,也已明確它存在于各種參與發育過程的蛋白中。Wozney,J.M.等在Science 242:1528-1534(1988)中描述了BMP-1的核苷酸序列。
其它非哺乳類動物中發現的蛋白質中也存在哺乳動物BMP-1結構域的結構。這些蛋白質包括果蠅屬特洛德(tolloid)(Tld)(Shimell,M.J.,Cell 67:469-481(1991))、特洛德樣果蠅屬基因產物(Tlr-11或tolkin)(Nguyen,T.,Dev.Biol.166:569-586(1994)和Finelli,A.L.,等,Genetics 141:271-281(1995))、海膽BMP-1同系物(suBMP-1)(Hwang,S.-P.,等,Development 120:559-568(1994))、兩種相關的海膽發育基因產品SpAN和BP10(Reynolds,S.D.,等,Development 114:769-786(1992)和Lepage,T.,等,Development 114:147-164(1992))、Xenopus BMP-1(xBMP-1)(Maeno,M.等,Gene 134:257-261(1993)和哺乳動物特洛德(mTld)(Takahara,K.等,J.Biol.Chem.269:32572-32578(1994))。在傳閱評述金屬蛋白酶蝦紅素家族的文章(Bond.J.S.和R.J.Benynon,Protein Science 4:1247-1261在1249頁(1995))中只是簡單地提到了從非洲爪蟾屬(Xenopus)獲得的特洛德樣基因(xolloid),但沒有公開關于基因本身的數據。編碼這些蛋白質的基因的一些核酸序列是已知的。盡管靠兩個不同的可變剪接的mRNA分子,哺乳動物BMPl基因編碼了BMP-1蛋白和mTld蛋白。本段中提到的論文均結合入本文作參考。
發明概述本發明概括地描述了一種新的哺乳動物特洛德樣基因產物(mTll)及其關聯基因,該基因與mTld以及其它已知的BMP-1相關蛋白和基因不同。并且報道了小鼠和人的基因版本。
本發明的一個目的是提供涉及脊椎動物中胞外基質沉積(如成骨)的基因和基因產物。
本發明的另一個目的是為合理開發抑制特洛德樣基因活性治療纖維變性、結疤、瘢痕瘤、外科粘連等的藥物提供靶分子。
本發明還有一個目的是提供一種重組DNA構建物、以及該構建物所編碼的、用來加速傷口和骨折愈合的蛋白質。
本發明還有一個目的是提供對小鼠染色體8中央部分作圖的標記基因。
本發明另一個目的是提供對人染色體4的4q32-4q33區域作圖的標記基因。
本發明還有一個目的是提供探測哺乳動物細胞中非BMP-1骨形態生成蛋白基因的探針的核苷酸序列。
本發明的一個特征是所述小鼠基因的3'非翻譯區含有新的簡單重復序列。
本發明的其它目的、特征和優點在參照附圖進行下列詳細敘述時將會更為清晰。
附圖簡述
圖1提供了小鼠mTll cDNA的圖譜,包括5'和3'非翻譯部分。排列在mTllcDNA下方的行列是用來比較的一些相關基因的cDNA克隆的示意圖,它們按照與mTll相同的比例來繪制。基因產物結構域對應的cDNA部分用高亮度表示。帶點方框、濃陰影方框、條紋方框、淡陰影方框以及黑色方框分別表示信號肽、前區(proregion)、金屬蛋白酶、CUB和EGF結構域。白色方框表示不同蛋白質獨有的結構域。波浪線表示5'和3'非翻譯區。縮寫含義是:mTld,哺乳動物tolloid;mBMP-1哺乳動物BMP-1;xBMP-1,非洲爪蟾屬BMP-1;suBMP-l,海膽BMP-1;Tld,果蠅屬tolloid;Tlr-1,果蠅屬tolloid相關基因;SpAN和BP10,相關的海膽發育基因。限制性酶包括Bg,BglⅡ;C,ClaⅠ;E,EcoRⅠ;H,HincⅡ;N,NcoⅠ;S,SmaⅠ;St,StuⅠ。
圖2將公開的mTll基因的氨基酸序列與mTld基因的氨基酸序列進行序列對比。圖中顯示了兩種蛋白質共同的結構域結構。結構域如圖1所示。采用GAP程序(Genetics Computer Group,Madison,Wisconsin)進行序列對比,GAP重量為3.0、GAP長度重量為0.1,并附帶推定信號肽序列的手工對比。半胱氨酸用方框框出,潛在的天冬酰胺(Asn)糖基化連接位點用下劃線表示,金屬肽內切蛋白酶活性位點基序HEXXH用點線方框框出。
圖3顯示了小鼠染色體8中心部分的示意圖。圖譜管理程序(Map Manager)(Manly K.,"A Macintosh Program for Storage and Analysis of Experimental GeneticMapping Data,"Mammalian Genome 4:301-313(1993))比較了Tll與其它來自TJLBSS反交板(backcross panel)的基因座的分離數據,進行連接分析,產生了此圖譜。TJL BSS反交板數據從Jackson Laboratories Public DataBase(//www.jax.org/Resources/documents/cmdata)獲得。
發明詳述這樣從小鼠分離獲得基本純的哺乳動物特洛德樣(mTll)cDNA制品從小鼠系BMP-1tmlblh的胚胎成纖維細胞制備cDNA文庫,用小鼠BMP-1基因中約330堿基對的AatⅡ-DrdⅠ限制性片段作探針,在低嚴格性條件下進行篩選(如下文實施例所述)。BMP-1tmlblh是剔除了BMP-1基因(KO)的小鼠,它是缺失BMP-1基因的等位基因純合子小鼠。SEQ ID NO:1中所示的探針與BMP-1tmlblh基因剔除小鼠所缺失的BMP-1基因360堿基對片段對應。由于cDNA文庫中沒有BMP-1,因此在DNA序列水平上篩選不能回收只與BMP-1相關的序列,回收的是與BMP-1不同的序列。
在篩選中,基因組只有一個區域未被回收(見圖1)。最初篩選中獲得的KO3和KO7-2的重疊性cDNA克隆視為基本純的制品,它包括了大多數但并非全部編碼序列。篩選用標準程序在低嚴格性條件下進行(Ausubel,F.M.,等,CurrentProtocols in Molecular Biology,Wiley,New York(1987)CA)。其余編碼序列通過高嚴格性條件對胚胎成纖維細胞cDNA文庫進行再次篩選獲得,從而揭示了另一個延伸至基因5'非翻譯部分的克隆(KO8-2)。獲得的KO8-2顆粒也視為基本純的制品。
本領域普通技術人員可以象發明者那樣將分開的克隆序列連接在一起,產生SEQ ID NO:2中所示的全長cDNA。本文提供的SEQ ID NO:2是一個有5'和3'側翼非翻譯序列的3039堿基對的開放讀框。開放讀框編碼哺乳動物特洛德樣蛋白質(稱為mTll)。這里所示的序列表示三個cDNA克隆(KO3,KO7-2和KO8-2)組合的核酸序列。在mTll基因的3'非翻譯區中,有一個是以前沒有報道過的簡單重復序列(SSR)。SSR有如下序列(GT)20GC(GT)7GC(GT)7GCAT(GT)3GCAT(GT)3(SEQ ID NO:2中的核苷酸4148-4239).SEQ ID NO:2中的序列數據可從Genbank Accession Number U34042獲得。
如果DNA制品中已經除去了90%以上任何有DNA的宿主細胞的細胞物質,則認為任何來源的含有mTll基因序列的DNA分子制品是基本上純的。例如,細胞物質可利用商品純化試劑盒(如購自Qiagen的試劑盒(Chatsworth,CA))從核酸制劑中除去。較佳的是,核酸制品中超過10%的核酸分子含有全部或部分mTll基因或其部分。更佳的是,超過50%,甚至還要佳的是超過90%的核酸分子含有mTll基因全部或部分序列。
注意到其它與mTll有關的基因以及BMP-l家族的其它成員用可以比較的篩選方法從BMP-1/mTld和mTll均缺失的雙缺失胚胎cDNA文庫中分離獲得。這種雙缺失突變動物可將擁有兩個基因座之一的雜合動物交配而制得。
小鼠mTll基因圖示位于染色體8中心近D8Bir22處(1994年染色體8委員會報告中位于31號位置)(Ceci,J.D.,"Mouse Chromosome 8,"Mammalian Genome5:S124-S138(1994))。這同一個染色體大區是四個會導致明顯發育異常的基因缺損圖譜位點,四種異常是Hook(Hk)、腎上皮質素發育異常(Acd)、Quinky(Q)和成比例型侏儒(Proportional dwarf)(pdw)。相反,BMP-1圖示位于小鼠染色體14(Ceci,J.D.,等,"An interspecific backcross linkage map of the proximal half of mousechromosome 14,"Genomics 6:673-678(1990))。
圖2顯示所提到的鼠mTll蛋白質結構域結構,系從與小鼠特洛德蛋白質產物的序列相似性預測而得。由于它與其它特洛德樣蛋白質有相似性,預計公開的mTll基因編碼的產物將是在發育和自身穩定過程(如傷口愈合)中起關鍵作用的蛋白酶。此蛋白質可能參與了胞外基質前體變成大分子結構的成熟過程。當給予組織有效量的該蛋白質時,也許此蛋白質在生長因子體內外的激活中起作用,也許會促進發育和自身穩定過程。另一方面,如果mTll蛋白質的功能被抑制,則這些過程本身也會抑制,在輸送有效量抑制劑時,可有利地利用該性質以防止纖維變性和過度疤痕或其它傷口愈合異常。通過在選定的已知與人類在相同的生化或生理學上相似的家畜和模型動物上,進行此蛋白質用量范圍的測試,可以容易地確定輸送至靶位點以激活發育和自身穩定性所需該蛋白質的有效量。例如,在皮膚傷口愈合的試驗中,豬皮是人皮的合適模型。同樣,也可確定Tll蛋白質抑制劑的有效量。有效量是指能比未處理傷口有效地減少纖維變性、結疤或瘢痕瘤發生的傷口給藥量,纖維變性、結疤或瘢痕瘤程度的評價根據臨床或獸醫上所接受的標準而定。這種測試最好在通常被視為與人皮膚有關的模型體系中進行。
由于此蛋白質在動物組織中的含量通常非常少,因此BMP體系蛋白質的工作能力受到抑制。本文證明了,以前未知的基因mTll可以克隆入含有(在合適宿主細胞內)有效轉錄啟動子的合適的表達載體中,繼而導入合適的宿主細胞并在其中表達,并以天然構型純化,所有這些均采用常規方法(參見下文)。這樣表達的蛋白質可保留在宿主細胞內,或可以分泌到胞外生長培養基中(如果在構建物上提供合適的信號序列的話)。蛋白質可用常規的方法從細胞或生長培養基中純化獲得。
合適的轉錄啟動子是載體pFASTBacl(該載體可購自Gibco-BRL)上發現的桿狀病毒極遲啟動子。另一個合適的啟動子是桿狀病毒立即早期啟動子,如在pAcPIEl載體(Novagen,Madison,WⅠ)上發現的啟動子。任何其它有利的表達元件如增強子、終止子等本領域已知的元件可包括在合適的表達載體中。合適的宿主可以是昆蟲組織培育細胞,如細胞系Sf21、Sf9、或High Five(Invitrogen,sanDiego,CA)。
含有小于全部編碼序列的該基因的合適部分也可有利地克隆入合適的載體中,以形成基因重組構建物。應當理解,根據本發明制得的構建物不必含有整個mTll基因座或編碼區,但應含有能編碼所需功能的一個或多個部分,或含有該基因其它有用性能(如與所需基因組序列互補)的部分。本領域普通技術人員應當理解,mTll蛋白質(以及編碼mTll蛋白質的相應的遺傳物質)在大小和序列上的某些變化不會干擾其功能。在構建含有全部或部分mTll基因的基因構建物以及其編碼的蛋白質時,這些經修飾的形式可用已知的有利方法進行工程化。
只要所產生的蛋白質保留了與家族其它成員相關的所需功能,認為這些改變、修飾、添加和缺失均在本發明的范圍內。如果蛋白質在層粘連蛋白-5斷裂標準試驗中保留了切斷活性,則蛋白質是感受態蛋白。也希望蛋白質能保留對前膠原的C-蛋白酶活性(如Kessler,E.,等在Science 271:360-362(1996)中關于BMP-1所述,該內容結合入本文作參考)。本領域技術人員對這些測定方法伴有的必要的控制是熟悉的。或者,希望蛋白質由于這種變化而喪失某些功能,這類情況也包括在本發明的范圍內。
這樣制得的基本純的蛋白質制品被確定為制品,其中mTll蛋白質的層粘連蛋白-5斷裂活性不受制品中存在的其它蛋白質或分子的影響。根據蛋白質打算采用的場合,mTll蛋白質在基本純的蛋白質制品中的量至少應為10%,至少50%為佳,至少75%為更佳,至少95%為最佳。通過用親和標記物對蛋白質作標記,并使制品通過對標記物有親和性的柱,可增加此蛋白質制品中感興趣的蛋白質。也可采用一種加工標記物,經適當加工形成的蛋白質(缺少斷裂前區)可從加載有粗品的柱中洗脫獲得。
以DNA序列預測的mTll翻譯產物(SEQ ID NO:3)預計分子量為114,532(pⅠ6.15)。如果翻譯產物在圖2所示的前區和蛋白酶結構域邊界處斷裂,則成熟的蛋白酶的預測分子量為98,007(pⅠ6.18)。
當將鼠mTll蛋白質序列與其它特洛德樣基因進行比較時,兩個哺乳動物蛋白質(mTld和mTll)的前區與兩個果蠅屬蛋白質(Tld或Tlr-1)的前區間沒有明顯的同源性。mTll的蛋白酶結構域與Tld有66%相似(47%相同),與Tlr-1有69%相似(52%相同)。mTll與兩個果蠅屬蛋白質的序列相似性比與mTld的相似性稍高,而兩個哺乳動物蛋白質中的一個與兩個果蠅屬蛋白質中的一個無明顯關。通過采用Sehwartz和Dayhoff的劃痕系統(scoring system)(atlas of Protein Sequenceand Structure,Dayhoff,M.O.,ed.,National Biomedical Research Foundation,Washington,D.C.,p.353-358(1979)),如果排列的氨基酸對的相似性臨界值大于0.5,則表示氨基酸對是“相似的”。
mTll mRNA轉錄物看來不會是可變剪接而成的,因為用該編碼區內部的克隆KO3片段(SEQ ID NO:2,核苷酸1113-2745)作為探針只檢測到有一個轉錄物,而且因為在cDNA文庫篩選時只分離得到單一的mTll cDNA。
在成年人的大腦和腎臟中發現有相當強的mTll mRNA表達,在肺和骨骼肌的RNA中表達水平稍低,在心臟和睪丸的RNA中表達水平非常低。對于脾臟或肝臟則沒有明顯的信號。在Northern印跡法暴光60小時后,肝臟測出非常微弱的信號,但脾臟沒有檢測到信號。
mTll的mRNA表達方式與以前報道的BMP-1轉錄物和mTld轉錄物不同。在交配后7天發現胚胎總的RNA表達水平很低,發育11天時mRNA水平稍有增加,15天時有相當高水平的峰值,然后在胚胎17天時降低。相反,發現BMP-1和mTld轉錄物在胚胎7天時的水平比胚胎11天時的高。用同一印跡法來檢測mTll、BMP-1和mTld轉錄水平。
在交配后9.5-11.5天期間胚胎發育中檢測到有mTll mRNA轉錄物。如以前mTld RNA觀察所見,在整個間充質內觀察到mTll信號,在未來骨和神經管腹部上方區域的水平較高。在以前對mTld觀察時發現有信號的前側菱腦的相同部位上發現有強信號,這與底板中的mTll表達一致。在發育的脊椎間結締組織上方發現有規律性強表達。在發育的肺的間充質中發現有高的mTll信號,相反,在肝臟中沒有表達或表達水平非常低,這反映了Northern印跡分析成年小鼠肺和肝臟中mTll mRNA的相對量。在交配13.5天后的胚胎旁矢截面中,發現在舌、鼻發育過程中的間充質成中、頜骨和發育腸襻的粘膜下層中有表達。在發育的心臟房室瓣膜上方發現有mTll表達。
在發育的小鼠組織中mTll和mTld mRNA分布的主要區別是在發育大腦第四腦室底板前庭區域的神經上皮上方所見,在該處不同切面上始終發現有強的mTll表達,而沒有發現mTld或BMP表達。在腦室和新生期大腦導水管的神經上皮襯里上方的許多切片中發現有mTll RNA表達。在丘腦內和側腦室神經上皮襯里中的特殊核上也發現有mTll表達。在成年腦中,小腦顆粒層中發現有強的mTll表達。在新生期和成年小鼠腦的其它結構上也發現有較弱的mTll表達。人腦各部位RNA的Northern印跡法分析也檢測到在人小腦中有相當強的mTll信號。
注意到的mTll mRNA和先前報道的mTll分布之間的另一個區別是在發育的脊髓中,在該處mTll表達比先前報道的mTld更廣,它超越底板伸展至脊髓的更背側。在其它發育組織中,mTll和mTld轉錄物的分布是相互重疊的。
特別可以預計到的是,通過采用選擇的包括上述小鼠基因mTll-特異性部位的探針,來探測適當動物細胞的cDNA文庫,可從其它動物中分離獲得mTll基因的等價物。通過比較小鼠mTll編碼區與RMP-1/mTld編碼區的核酸序列,并選擇與BMP-1不等價的mTll基因部分,可獲得小鼠mTll基因的mTll特異性部分。作為有效的探針,所選的序列應不含會與許多基因組位點交叉雜交的重復序列。探針長度應至少約200堿基。已經認識到,BMP-1家族該基因在編碼蛋白質前區和C端17個氨基酸的區域中是最具可變性的,因此希望可以從mTll基因的這些區域分離獲得合適的探針。在SEQ ID NO:2中,此區域對應于C端部分的大約堿基3599-3650,和前區的大約堿基701-1051之間的序列。這樣的片段可通過切口翻譯、末端標記或其它本領域已知的合適方法來轉變成探針。也應理解,可用分子生物學中熟知的技術來體外合成所需的片段(或實際上是整個基因)。
這已通過采用人源DNA來得以實現。為了獲得人源mTll序列,用長度為677bp的小鼠mTll cDNA克隆KO3的NdeⅠ-Eco72Ⅰ片段(對應于CUB4的一部分和CUB5全部以及羧基端)來篩選人胎盤基因組DNA文庫。分離獲得含有人TLL基因最后三個外顯子的基因組克隆151-2。然后用長度為339bp的小鼠mTll cDNAKO7-2的TapⅠ片段(對應于部分前區)來篩選相同的人基因組DNA文庫,從而分離得到基因組克隆5-2和8,這兩個克隆均含有TLL基因5'端的第一個外顯子。合成獲得對應于5'和3'非翻譯區序列的寡核苷酸引物,和從人胎兒軟骨RNA合成的cDNA一起使用,對TLL編碼區的其余部分進行長距離PCR擴增。正向引物為5'-TCTTG CAGTC AGTTG CTTTG CTGG-3'(SEQ ID NO:10)。反向引物為5'-TAGTG CGGCC GCACA TTCCT TTGTG TTC-3'(SEQ ID NO:11)。
人mTll的核酸序列見SEQ ID NO:4。該基因編碼的蛋白質見SEQ ID NO:5。基因(或其部分)可以小鼠基因的相同方式使用,但其它優點是可用于基因治療和診斷等,因為它不必象小鼠mTll基因那樣需要使基因適用于人體使用。
因為mTll缺陷也許會導致人體遺傳異常,故需確定人TLL基因的染色體位置。將一個長度為527bp的cDNA PCR產物(對應于人TLL基因的最后3個外顯子)與EcoRⅠ-消化的基因組DNA(來自一組人-小鼠細胞雜交體)的Southern印跡雜交。發現在5.1和9.5kb人條帶呈強雜交,以及對來自30個雜交系(從17個不相關的人細胞系和4個小鼠細胞系衍生獲得)DNA進行檢測(Takahara,K.,等,J.Biol.Chem.269:26280-26285(1994))表明,TLL的分離與人染色體4的分布有關。在檢測的細胞雜交體中,一個保留了人染色體4易位的雜交體進一步將TLL定位在染色體4的長臂上。細胞雜交體55R16沒有完整的染色體4,但是保留了1I/4易位11qter-11p13∷4q25-4qter。這些結果將TLL定位在4q25-4qter區。用Trask,B.,Methods Cell Biol.35:1-35(1992)的方法,在人細胞分裂中期染色體伸展體(spread)上進行熒光原位雜交(FISH),對TLL基因獨立作圖。用洋地黃毒苷-11-dUTP(Boehringer Mannheim)隨機引導(Feinberg,A.P.和B.Vogelstein,B.Anal.Biochem.132:6-13(1983)),對含有TLL第一個外顯子和大小約為16kb插入片段的人基因組DNA克隆8作標記,并將其用作FISH分析的探針。獲得圖象并如上所述(Takahara,K.,等,同上)進行分析。在檢測的16/18(88.8%)的中期伸展體中只在4q32-4q33上發現有雙倍熒光信號,在10/18的中期伸展體的染色體上發現有雙熒光信號,而在其它染色體上沒有信號,這將TLL定位在該區域中。
通過選擇預計能側接mTll基因(或基因任何部分)的特異性引物,也可用PCR來擴增對應于mTll區的基因組部分。該基因的兩個特異性部分可用作合適的探針。在基因編碼區外選擇引物是無效的,因為非編碼部分降低的選擇性壓力會導致小鼠和其它動物在這些區域中發生更大的差異。特別應注意的是,應對人和模型動物(如小鼠)BMP家族的此類基因進行特別搜尋,以尋求它們與人畸形的關系(參見例如"The Chicken With a Duck's Feet:It's All in the Biochemical Signal,"TheNew York Times,National Edition,p.B6(1 996年5月21日))。
也可特別預計到,mTll基因編碼的大量蛋白質可在宿主細胞中表達(或從宿主細胞中分泌出),純化至基本純的制品,并用于隨后的功能測定。在這樣的一個功能試驗中,將描述表達蛋白質的功能特征。預計蛋白質的功能包括金屬蛋白酶活性、C-蛋白酶活性和層粘連蛋白-5加工活性,以及激活TGF-β樣蛋白的活性,鑒于其總體結構在結構域水平上與已知的蛋白質相似,因此這些預計是合理的。
在另一個試驗中,此蛋白質可用來篩選抑制蛋白質活性的推定試劑。如果mTll能救活BMP-1剔除小鼠,則它用類似修飾或消除BMP-1蛋白功能的方式,來改變mTll蛋白功能的任何治療系統,將是重要的。因此,任何一組這樣的試劑都必需以mTll蛋白質進行篩選。在這樣的試驗中,所有支持mTll功能的試驗成分可在合適的鹽和pH條件下一同加入,并與一組蛋白質功能推定抑制劑結合使用。采用已建立的蛋白質功能測定方法(在結合人本文其它處作為參考的文獻中有所描述),將可以確定任何被測試劑是否能抑制蛋白質活性,從而使其成為以治療劑量用于抑制纖維變性、減少結疤和減少瘢痕瘤的候選試劑。采用來自BMP-1基因家族的相關蛋白質正在進行這種篩選努力。參見Kessler,同上。
現在也有可能用所公開的蛋白質或其片段來進行合理的藥物設計。在設計時,對蛋白質或片段進行X-射線結晶圖分析,以確定它們的活性位點和可與推定治療劑相互作用的位點。
目前表明BMP-1編碼的蛋白質可在C端附近斷裂前膠原。人們早就認為這種膠原產生所必需的C端-蛋白酶活性存在于未知的蛋白質中。因此利用C端蛋白酶活性作為膠原相關疾病的治療劑具有很高的商業價值。由于mTll是唯一的與BMP-1密切相關(根據cDNA文庫篩選的結果)的其它哺乳動物基因,因此也特別期望,mTll編碼的蛋白質是另一種C端蛋白酶,進一步講,通過將基因導入重組載體中進行體外生產治療性蛋白,可用mTll基因來生產這種C端蛋白酶,并在遺傳疾病治療中直接給藥。人的基因特別適用于這些應用。
在討論了下列非限制性實施例后可更好地理解本發明。
實施例BMP-1/mTld-無效小鼠胚胎cDNA文庫如Hogan等("Manipulatingthe Mouse Embryo:A Laboratory Manual,2nd Ed.,"pp.260-261,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1 994))所述的制備小鼠胚胎成纖維細胞(MEF)。從已制成與BMP-1/mTld基因的無效等位基因(即不表達BMP-1/mTld蛋白質)純合的胚胎制得10塊150mm的MEF平板,使MEF生長至鋪滿(在DMEM中,10%胎牛血清),3天后用50μg/ml抗壞血酸鹽處理18小鼠,收集,并用FastTrack試劑盒(Invitrogen)分離獲得42μg聚腺苷酸化mRNA。然后用SuperScript Choice系統(Gibco-BRL),用5μg等份聚腺苷酸來合成有EcoRⅠ末端的雙鏈cDNA。然后將該cDNA與EcoRⅠ-切開的λgt10臂連接,并用GigapakⅡGold包裝提取物(Stratagene)進行包裝。5μg聚腺苷酸提供了約2.2×10-6PFU的未擴增的文庫。隨機挑選的克隆的平均插入片段大小為2.9kb。
DNA序列分析將限制性片段亞克隆人pBluescriptⅡKS+,用雙脫氧鏈終止法從雙鏈模板獲得序列(如Lee S.-T.,等在"Construction of a full-length cDNA encoding human pro-alpha 2(Ⅰ)collagen and its expression in pro-alpha 2(Ⅰ)-deficient W8 rat cells,"J.Biol.Chem.263:13414-13418(1988)中描述的)。用T3和T7引物對亞克隆的末端進行測序,通過引入缺失或采用與插入序列互補的引物使亞克隆固有部分得以測序。兩條鏈的測序證實了本文報道的mTll序列。
聚合酶鏈反應(PCR)PCR反應這樣進行在480循環變溫加熱儀(Perkin-Elmer Corp.)中在94℃下使引物(每種引物為0.2μM)變性3分鐘,然后以94℃/1分鐘、57℃/1分鐘、72℃/1.5分鐘循環35次,最后在72℃下培育8分鐘。最終體積為100μl 10mMTris-HCl(pH8.3)、50mM KCl、1.5mMMgCl2、0.01%(w/v)明膠、dNTP各0.2mM和2.5單位的Tαq聚合酶(Perkin-Elmer Corp.)用于原位雜交的組織切片用于原位雜交的固定在載玻片上的組織切片由G.E.Lyons(Wisconsin-Madsion大學)提供。如Lyons等在"The expression of myosin genes in developingskeletal muscle,"J.Cell Biol.111:1465-1476(1990)中所述的方法固定包埋小鼠組織。簡言之,將組織固定在4%多聚甲醛磷酸鹽緩沖液中,脫水,并用石蠟油浸潤。將一系列5-7μm厚的切片固定在明膠化載玻片上。1-3個切片固定在載玻片上,在二甲苯中去石蠟油、并且再水化。對切片用蛋白酶K消化,后固定,用三乙醇胺/7酸酐處理,清洗并脫水。
用于原位雜交的探針將mTll特異性探針(對應于1104bp的mTll 3'非翻譯區的部分)用于原位雜交。由于3'非翻譯區與BMP-1或mTld序列沒有相似性,因此探針不會與BMP-1或mTld RNA交叉雜交。
為了保證探針不與其它有類似于長SSR(這種長SSR在mTll 3'非翻譯區中心部分(核苷酸4148-4239))的重復序列的RNA轉錄物雜交,根據生產商條件(Stratagene)制備兩個分離的核糖探針(對應于SSR上游或下游的3′-UT序列),用35S-UTP(>1000Ci/mmol/Amersham Corp.)作標記,并聯合以增強原位雜交信號。用堿將探針水解成平均為70堿基大小。
對于SSR下游的3'非翻譯序列,用正向引物5'-CCAGC TTAAC CTGTTCACAC-3'(SEQ ID NO:6)和反向引物5'-AACT CTAC TTCCA CTTCA TC-3′(SEQID NO:7)制備399bp的PCR產物(SEQ ID NO:2核苷酸4283-4681)。將PCR產物連接入pCRⅡT-A載體(Invitrogen)的克隆位點。使pCRⅡ多接頭中HindⅢ位點處的模板線形化,并用RNA聚合酶T7轉錄,制得均勻標記的反義核糖探針。同時使pCRⅡ多接頭中XhoⅠ位點處線形化,并用RNA聚合酶SP6轉錄,制得有義對照核糖探針。
對于SSR上游的3'非翻譯序列,用正向引物5'-TCAGA ACAGA AAGGAATGTG-3′(SEQ ID NO:8)和反向引物5'-GACCA CTATT CCACA TCACC-3'(SEQID NO:9)制備420bp的PCR產物(SEQ ID NO:2核苷酸3666-4085),并連接入pCRⅡT-A的克隆位點。使pCRⅡ多接頭中XhoⅠ位點處線形化并用RNA聚合酶SP6轉錄,制得反義核糖探針,而使pCRⅡ多接頭中HindⅢ位點處線形化并用RNA聚合酶T7轉錄,制得有義對照核糖探針。
原位雜交和清洗步驟使切片在52℃50%去離子的甲酰胺、0.3M NaCl、20mM Tris-HCl、pH4.5、5mM EDTA、10mM NaPO4、10%硫酸葡聚糖、1份Denhardt's溶液、50μg/ml酵母總RNA、25μmol/ml硫代ATP(Boehringer-Mannheim)和50-75,000cpm/μl35S標記的cRNA探針中雜交過夜。使組織在65℃的50%甲酰胺、2×SSC、10mM二硫蘇糖醇中嚴格清洗;在磷酸鹽緩沖鹽水中漂清;并用20μg/mlRNaseA37℃處理30分鐘。隨后在37℃2×SSC和0.1×SSC中清洗15分鐘后,使載玻片脫水,將其浸在KodakNTB-2核示蹤乳液中,并在4℃、有干燥劑的不透光箱子中暴光一周。照片顯影采用Kodak D-19。用Zeiss Axiophot顯微鏡的亮視野和暗視野鏡片分析載玻片。
Northern和Southern印跡分析純化獲得長1633bp的EcoRⅠ片段(SEQ ID NO:2,核苷酸1113-2745)(對應于cDNA克隆KO3的5'端)(圖1),并用作Northern印跡分析的探針。該片段含有對應于大多數蛋白酶結構域的序列;所有CUB1、CUB2和EGF1的結構域;和CUB3結構域的大部分。用凝膠純化上述用于原位雜交試驗的339bp的PCR產物,并將其用作Southern印跡分析的探針。用隨機引導法(Feinberg和Vogelstein,"Atechnique for radiolabeling DNA restriction endonuclease fragments to high specificactivity:Addendum,"Anal.Biochem.137:266-267(1984))對兩個探針作放射性標記至比活為4-6×109cpm/μg,并在Quichhyb(Stratagene)中68℃雜交成印跡1小時。使Northern印跡(從Clontech獲得)在68℃、2×SSC、0.1%SDS洗滌兩次10分鐘,然后在68℃、以0.1×SSC、0.1%SDS洗滌兩次15分鐘。Southern印跡在68℃、以2×SSC、0.1%SDS洗滌兩次10分鐘,然后在68℃、以0.1×SSC、0.1%SDS中洗滌兩次20分鐘。
mTll基因的亞克隆和表達BMP-1、mTld和mTll的成熟活性形式的氨基酸序列是相似的。只是每種蛋白質的C端沒有同源性。C端序列的這種獨特性已經被用來生產一系列可區別三種蛋白質形式的多克隆抗體。在小鼠mTll中,使合成的肽Ac-CYIRYKSIRYPETMHAKN-OH(對應于mTll最后的17個氨基酸)與蛋白質載體鑰孔血蘭素連接,懸浮在鹽水中,與等體積弗氏佐劑混合乳化,注入兩只兔子每只背部皮下3-4處。在加強免疫后12周和16周,放血取血清。不象小鼠和人之間的BMP-1和mTld的C端氨基酸序列較為保守,小鼠和人mTll的C端氨基酸序列是不同的。也許這是由于動物間的差異,小鼠mTllC端肽在兔子中產生的抗體滴度比BMP-1和mTldC端肽高出3倍。為了產生人mTllC端特異性抗體,將采用肽Ac-CHIRYKSIRYPDTTHTK K-OH。這些抗體有商業用途,可用于試驗顯示細胞、組織和哺乳動物有機體(包括但不局限于模型動物體系如嚙齒類動物和靈長類動物和人)中mTll蛋白質的產生和定位。由于對骨形態生成蛋白的了解進展迅速,因此區別各組分的能力不僅在研究方面重要,而且在監測BMP體系疾病患者的BMP體系組分水平和分布上也很重要。這些疾病可能包括,例如小鼠和人體的纖維變性疾病。此外,由于TLL基因的缺陷,還可能會有遺傳性發育異常。采用本文所述的抗體和核酸探針就可確定mTll在這些遺傳異常中起的作用。顯然,mTll蛋白質在BMP體系中是很重要的,因為它明顯很好地取代了小鼠兩個染色體上均缺失的BMP-1等位基因BMP-1。這些小鼠在懷孕的全過程能夠存活,但是在臍區會發育形成持久的小腸疝。這些小鼠在出生后不久就會死亡,推測是由于缺失BMP-1/mTld基因。然而,它們不表現出肉眼可見的模式形成(pattern formation)紊亂、膠原纖維形成紊亂或總體發育紊亂。沒有某些BMP-1/mTld樣活性,就不可能有這樣清晰的發育順序或甚至是膠原纖維形成。我們已經發現,BMP-1缺失小鼠胚胎成纖維細胞中有這樣的C端蛋白酶形式的活性。這些活性看來是由mTll提供的,而且看來沒有其他密切相關的基因。
序列表(1)一般信息(ⅰ)申請人Greenspan.Daniel STakahara.KazuhikoHoffman.Guy G(ⅱ)發明名稱哺乳動物的特洛德樣蛋白質(ⅲ)序列數目13(ⅳ)通信地址(A)收件人Quarles & Brady(B)街道l South Pinckney Street(C)城市Madison(D)州WI(E)國家US(F)郵編53703(V)計算機可讀形式(A)記錄介質類型軟盤(B)計算機IBM PC兼容型(C)操作系統PC-DOS/MS-DOS(D)軟件PatentIn Release #1.0,Version#1.30(ⅵ)本申請資料(A)申請號(B)申請日(C)分類(ⅷ)律師/代理人信息(A)NAMEBerson,Bennett J(B)登記號37094(C)參考/案卷號960296.93839(ⅸ)通訊信息(A)電話608-251-5000(B)電傳608-251-9166(2)SEQ ID NO:1的信息(ⅰ)序列特征(A)長度330堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸探針"(ⅹⅰ)序列描述SEQ ID NO:1:ACGTCCAGAC CGGAGCGGGT GTGGCCCGAT GGGGTCATCC CGTTTGTGAT TGGAGGGAAT 60TTCACAGGCA GCCAGAGGGC AGTCTTCCGG CAGGCCATGA GACACTGGGA GAAGCATACC 120TGTGTCACCT TCTTGGAGCG CACAGATGAG GACAGCTATA TTGTATTCAC CTACCGACCC 180TGCGGGTGCT GCTCCTACGT GGGTCGCCGA GGTGGGGGCC CCCAGGCCAT CTCCATCGGC 240AAGAACTGTG ACAAGTTTGG CATCGTGGTC CATGAGCTGG GCCATGTCAT TGGCTTCTGG 300CACGAGCACA CGCGGCCCGA CCGCGACCGC 330(2)SEQ ID NO:2的信息(ⅰ)序列特征(A)長度4771堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ⅱ)分子類型DNA(基因組)(ⅸ)特征(A)名稱/關鍵CDS(B)位置611..3652(D)其它信息/產物="小鼠mTll蛋白質"(ⅹⅰ)序列描述SEQ ID NO:2:CACACCCCTT TGCTCTCCGG GCAGTCGGGA GCTTCCCTAG CTTCGGCAGG CTTTTAAGGT 60CTGGCGGCGT AGAAATGCCT ATCCCCCACC CCCTTCCTCG GTCTCCCCTT TCAGTTCAGA 120TGTGCTGATG TGCAGACCGG ATTCATCTTC CCCGAGCAGC GGCGGTGGCA GCGGCGGGCG 180CAGGCGGCTG CAGCTCGCTC TCGGCCGCGG GGTCCTGACA GCGGCGGGGG CGCGGCGCGG 240GAGCCGGAGC TCCGGTGGCA GCTGAGCCCG CCGTGCGCCT CTCGCCGCGG CCGGTCGTGA 300TCGCGGGAAG TTCGACCGCT GGAAGGACGA CCTAGACCGA GCCGGGTTGG CTGCGGCTGC 360CCTGCGCCGA GCTCCTCACC TGCCTTCCGC CCACCCGCGG GCCCCCGGCC AAGTTCCCCA 420GCATCCGGGG GAGACAGGGA GACATTTGCC CTCTCTAGCG TCCTGAAGAC ATCCGCATGT 480CTCCGGACAC CTGAACATTC AGGTCTTTCC GAGGAGCTTC CCAGTCGGGA TAAGAACACT 540GTCCCTAGAG CCCCGCATAT CCACGCGGCC CTCCGGGTCT GGTCCCCTCC TTTTCCTCTA 600GGGGAGGAGG ATG GGT TTG CAA GCG CTC TCC CCG AGG ATG CTC CTG TGG 649Met Gly Leu Gln Ala Leu Ser Pro Arg Met Leu Leu Trp1 5 10TTG GTG GTC TCG GGT ATT GTT TTC TCC CGG GTG CTG TGG GTC TGC GCT697Leu Val Val Ser Gly Ile Val Phe Ser Arg Val Leu Trp Val Cys Ala15 20 25GGC CTC GAT TAT GAT TAC ACT TTT GAT GGG AAC GAA GAG GAC AAA ACG745Gly Leu Asp Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr30 35 40 45GAG CCT ATA GAT TAC AAG GAC CCG TGC AAA GCT GCT GTG TTT TGG GGT793Glu Pro Ile Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly50 55 60GAC ATC GCC TTA GAT GAT GAA GAC TTA AAT ATC TTC CAA ATA GAC AGG841Asp Ile Ala Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg65 70 75ACA ATT GAC CTG ACC CAG AGC CCC TTT GGA AAA CTT GGA CAT ATT ACA889Thr Ile Asp Leu Thr Gln Ser Pro Phe Gly Lys Leu Gly His Ile Thr80 85 90GGT GGC TTT GGA GAC CAT GGC ATG CCA AAG AAG CGA GGG GCA CTC TAC937Gly Gly Phe Gly Asp His Gly Met Pro Lys Lys Arg Gly Ala Leu Tyr95 100 105CAA CTT ATA GAG AGG ATC AGA AGA ATT GGC TCT GGC TTG GAG CAA AAT985Gln Leu Ile Glu Arg Ile Arg Arg Ile Gly Ser Gly Leu Glu Gln Asn110 115 120 125AAC ACG ATG AAG GGA AAA GCA CCT CCA AAA TTG TCA GAG CAA AGT GAG 1033Asn Thr Met Lys Gly Lys Ala Pro Pro Lys Leu Ser Glu Gln Ser Glu130 135 140AAA AAT CGA GTT CCC AGA GCT GCT ACC TCA AGA ACG GAA AGG ATA TGG 1081Lys Asn Arg Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp145 150 155CCT GGG GGT GTC ATT CCT TAT GTC ATA GGA GGA AAC TTT ACT GGC AGC 1129Pro Gly Gly Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser160 165 170CAG AGA GCC ATG TTC AAG CAG GCC ATG AGA CAC TGG GAA AAG CAC ACC 1177Gln Arg Ala Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr175 180 185TGT GTG ACG TTC ACT GAG AGA AGT GAT GAA GAA AGT TAT ATT GTG TTC 1225Cys Val Thr Phe Thr Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe190 195 200 205ACC TAC AGG CCT TGT GGA TGC TGC TCC TAT GTT GGT CGG CGG GGA AAT 1273Thr Tyr Arg Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn210 215 220GGC CCT CAG GCC ATC TCT ATT GGC AAG AAC TGT GAC AAG TTT GGA ATT 1321Gly Pro Gln Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile225 230 235GTT GTT CAT GAA CTG GGC CAC GTG ATA GGC TTC TGG CAT GAA CAT ACC 1369Val Val His Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr240 245 250CGC CCA GAC CGA GAC AAC CAT GTC ACC ATC ATT AGA GAG AAC ATC CAG 1417Arg Pro Asp Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln255 260 265CCA GGT CAA GAG TAC AAT TTT CTA AAG ATG GAG CCT GGA GAA GTG AAC 1465Pro Gly Gln Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn270 275 280 285TCT CTT GGG GAA AGA TAT GAT TTT GAC AGT ATC ATG CAC TAC GCC AGG 1513Ser Leu Gly Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg290 295 300AAC ACC TTC TCA AGA GGG ATG TTT TTA GAC ACA ATA CTC CCC TCC CGT 1561Asn Thr Phe Ser Ar9 Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg305 310 315GAT GAT AAT GGC ATT CGT CCT GCA ATT GGT CAA CGG ACC CGG TTA AGC 1609Asp Asp Asn Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser320 325 330AAA GGA GAC ATT GCA CAA GCA AGA AAG CTG TAT CGA TGC CCA GCA TGT 1657Lys Gly Asp Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys335 340 345GGA GAA ACC CTG CAA GAA TCC AGT GGC AAC CTT TCT TCC CCA GGA TTC 1705Gly Glu Thr Leu Gln Glu Ser Ser Gly Asn Leu Ser Ser Pro Gly Phe350 355 360 365CCA AAT GGC TAC CCT TCC TAC ACA CAC TGC ATC TGG AGA GTG TCT GTG 1753Pro Asn Gly Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val370 375 380ACC CCG GGA GAA AAG ATT GTC TTG AAT TTT ACC ACA ATG GAC CTT TAC 1801Thr Pro Gly Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr385390 395AAA AGT AGT TTG TGC TGG TAT GAT TAC ATT GAA GTA AGA GAT GGT TAC 1849Lys Ser Ser Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr400 405 410TGG AGG AAG TCA CCT CTC CTT GGT AGA TTC TGT GGG GAC AAA GTG GCT 1897Trp Arg Lys Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Val Ala415 420 425GGA GTT CTT ACA TCT ACG GAC AGC AGA ATG TGG ATT GAG TTT CGT AGC 1945Gly Val Leu Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser430 435 440 445AGC AGT AAC TGG GTA GGA AAA GGG TTT GCA GCT GTC TAT GAA GCG ATT 1993Ser Ser Asn Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile450 455 460TGT GGA GGG GAG ATA AGG AAA AAC GAA GGG CAG ATT CAG TCT CCC AAT 2041Cys Gly Gly Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn465 470 475TAC CCC GAT GAC TAC CGA CCA ATG AAG GAG TGT GTA TGG AAA ATA ATG 2089Tyr Pro Asp Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Met480 485 490GTG TCC GAG GGC TAC CAT GTT GGA CTG ACC TTT CAG GCC TTT GAG ATC 2137Val Ser Glu Gly Tyr His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile495 500 505GAA AGA CAT GAC AGC TGT GCC TAT GAC CAC CTA GAA GTT CGA GAT GGA 2185Glu Arg His Asp Ser Cys Ala Tyr Asp His Leu Glu Val Arg Asp Gly510 515 520 525GCC AGT GAG AAC AGC CCT TTG ATA GGA CGG TTC TGT GGT TAT GAC AAA 2233Ala Ser Glu Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys530 535 540CCT GAA GAT ATA AGG TCT ACT TCC AAC ACC CTG TGG ATG AAG TTT GTC 2281Pro Glu Asp Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val545 550 555TCT GAC GGG ACT GTG AAC AAG GCA GGG TTT GCT GCG AAC TTT TTT AAA 2329Ser Asp Gly Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys560 565 570GAG GAA GAT GAG TGT GCC AAA CCT GAC CGA GGA GGC TGT GAA CAG AGG 2377Glu Glu Asp Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg575 580 585TGT CTT AAC ACA CTA GGC AGC TAC CAG TGT GCC TGT GAG CCT GGC TAT 2425Cys Leu Asn Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr590 595 600 605GAA CTG GGG CCA GAC AGA AGA AGC TGT GAA GCT GCT TGC GGA GGA CTT 2473Glu Leu Gly Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu610 615 620CTG ACG AAG CTC AAT GGC ACC ATA ACC ACC CCC GGC TGG CCC AAA GAG 2521Leu Thr Lys Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu625 630 635TAC CCT CCA AAC AAA AAC TGT GTG TGG CAA GTG ATC GCG CCA AGC CAG 2569Tyr Pro Pro Asn Lys Asn Cys Val Trp Gln Val Ile Ala Pro Ser Gln640 645 650TAC AGA ATC TCT GTG AAG TTT GAG TTT TTT GAA TTG GAA GGC AAT GAA 2617Tyr Arg Ile Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu655 660 665GTT TGC AAA TAC GAT TAC GTG GAG ATC TGG AGC GGC CCT TCC TCT GAG 2665Val Cys Lys Tyr Asp Tyr Val Glu Ile Trp Ser Gly Pro Ser Ser Glu670 675 680 685TCT AAA CTG CAT GGC AAG TTC TGT GGC GCT GAC ATA CCT GAA GTG ATG 2713Ser Lys Leu His Gly Lys Phe Cys Gly Ala Asp Ile Pro Glu Val Met690 695 700ACT TCC CAT TTC AAC AAC ATG AGG ATT GAA TTC AAG TCA GAC AAC ACT 2761Thr Ser His Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr705 710 715GTA TCC AAG AAG GGC TTC AAA GCA CAT TTT TTC TCA GAT AAG GAT GAG 2809Val Ser Lys Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu720 725 730TGT TCA AAG GAT AAT GGT GGC TGT CAG CAT GAG TGT GTC AAC ACG ATG 2857Cys Ser Lys Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met735 740 745GGA AGT TAC ACG TGT CAG TGC CGG AAT GGA TTC GTG TTG CAT GAG AAC 2905Gly Ser Tyr Thr Cys Gln Cys Arg Asn Gly Phe Val Leu His Glu Asn750 755 760 765AAG CAT GAT TGC AAG GAA GCC GAG TGT GAA CAG AAG ATA CAC AGC CCA 2953Lys His Asp Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro770 775 780AGT GGT CTC ATC ACC AGT CCC AAC TGG CCA GAC AAG TAT CCA AGC AGG 3001Ser Gly Leu Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg785 790 795AAA GAG TGC ACG TGG GTG ATC AGT GCC ATT CCT GGC CAC CGC ATC ACA 3049Lys Glu Cys Thr Trp Val Ile Ser Ala Ile Pro Gly His Arg Ile Thr800 805 810TTA GCC TTC AAT GAG TTT GAG GTT GAA CAA CAT CAA GAA TGT GCT TAT 3097Leu Ala Phe Asn Glu Phe Glu Val Glu Gln His Gln Glu Cys Ala Tyr815 820 825GAT CAC TTG GAA ATT TTT GAT GGA GAA ACG GAG AAG TCA CCA ATA CTT 3145Asp His Leu Glu Ile Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu830 835 840 845GGC CGA CTA TGT GGC AGC AAG ATA CCA GAT CCC CTC ATG GCT ACT GGG 3193Gly Arg Leu Cys Gly Ser Lys Ile Pro Asp Pro Leu Met Ala Thr Gly850 855 860AAT GAA ATG TTT ATT CGG TTT ATT TCT GAT GCC TCT GTT CAA AGA AAA 3241Asn Glu Met Phe Ile Arg Phe Ile Ser Asp Ala Ser Val Gln Arg Lys865 870 875GGC TTT CAA GCT ACA CAT TCC ACA GAG TGT GGT GGT CGA TTG AAA GCA 3289Gly Phe Gln Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala880 885 890GAG TCA AAG CCT AGA GAC CTG TAC TCC CAT GCT CAG TTr GGT GAT AAT 3337Glu Ser Lys Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn895 900 905AAC TAC CCA GGA CAA CTG GAC TGT GAA TGG TTG TTG GTG TCA GAA CGA 3385ASh Tyr Pro Gly Gln Leu Asp Cys Glu Trp Leu Leu Val Ser Glu Arg910 915 920 925GGA TCT CGA CTT GAA TTG TCC TTC CAG ACA TTC GAA GTA GAA GAA GAA 3433Gly Ser Arg Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu930 935 940GCT GAC TGT GGC TAT GAC TAT GTT GAA GTC TTT GAT GGT CTC AGT TCA 3481Ala Asp Cys Gly Tyr Asp Tyr Val Glu Val Phe Asp Gly Leu Ser Ser945 950 955AAA GCT GTG GGT CTT GGT AGA TTC TGT GGG TCA GGG CCA CCA GAA GAA 3529Lys Ala Val Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu960 965 970ATC TAT TCA ATT GGA GAT GTG GCT TTG ATT CAT TTC CAC ACA GAT GAC 3577Ile Tyr Ser Ile Gly Asp Val Ala Leu Ile His Phe His Thr Asp Asp975 980 985ACT ATC AAC AAG AAA GGA TTT TAT ATA AGA TAT AAA AGT ATA AGA TAC 3625Thr Ile Asn Lys Lys Gly Phe Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr990 995 10001005CCG GAA ACG ATG CAT GCC AAG AAC TAA TGCCGACCCT CCCTCAGAAC 3672Pro Glu Thr Met His Ala Lys Asn*1010AGAAAGGAAT GTGCATATGG AAAGAAGACA TTTTTAAAAT AGACAATATT AATACAATTG 3732TTTTATATAA TGAATTTGAG CAAAAGAAAC CTGCAAGATT AGAGTTATCT CTGAAGTGAA 3792AGAGAACTTT CCAGAAAACC TGATTGGCAT TGCAAGGATG TTTGAAAGTC ATGCTTGTTC 3852AAGGAAGATT AACAGCTTGA AATAGATGCT TCACATTTTG GACAGTTCAT TTAATGAGCT 3912GTGATTCTCT GGAGTGATTT CTTGACTACT TTTCCAAGAT CTGGGGACGT AGAAATGATG 3972GGACGGATCA TAGCTTGGAA ACCCACTTCT TGGGTCTTAG CATGTTTGCT TAGACTCTGT 4032AGGTCAGACA CAGTGTAAAC CAAATTCATG TAAGGTGATG TGGAATAGTG GTCTTTGGAA 4092GGTGGTTCAT CATTTAAATG TAGGTTTGTG CTTGTGTGTA TGTTCACATA TGCAAGTGTG 4152TGTGTGTGTG TGTGTGTGTG TGTGTGTGTG TGTGTGCGTG TGTGTGTGTG TGCGTGTGTG 4212TGTGTGTGCA TGTGTGTGCA TGTGTGTTTG GAAACTGGAA TATTTCATCT TCATTATTTT 4272CAAATGCAGG CCAGCTTAAC CTGTTCACAC AAATGATTTT GTGACCACTT CATTGTATCT 4332GTATCTTGAG AAGTTTGAAA TATCTATAGT GTCTACAATG CAGTTAATCC CTAGATATCG 4392GATAATACCC AGTTCACTAG TAAACTCATT TCTCTCTGGG GAAGTGCTGA ATAGTCTCCA 4452AATTCAAGAA ACTCACCATG TCTTATAAAC CTTTAAGATA AAATTCCAAC GAGGTGTGTG 4512CAGCCATCTT CCAAATGACT GCCTGGATGT TTCTTAGTCC AGTTACTACT GCTGCTGCTA 4572TTGGTCTTTC TTTTATTGTT AATGTGTTGA TATGTTGTTA TTATTATGGT TATTATTATT 4632GATGTTGTTA CTATATTTAA AAATGATGAG ATGAAGTGGA AGTAGAGTTT GGGAGAAATG 4692AAATCTCTCT TTTTTGTTCT CTTCTTGAAA TTCAGTTTCA AAAAATACAA TATTGGGTGG 4752CAAAAAAAAA AAAAAAAAA 4771(2)SEQ ID NO:3的信息(ⅰ)序列特征(A)長度1014氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述:SEQ ID NO:3:Met Gly Leu Gln Ala Leu Ser Pro Arg Met Leu Leu Trp Leu Val Val1 5 10 15Ser Gly Ile Val Phe Ser Arg Val Leu Trp Val Cys Ala Gly Leu Asp20 25 30Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Pro Ile35 40 45Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala50 55 60Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Iie Asp65 70 75 80Leu Thr Gln Ser Pro Phe Gly Lys Leu Gly His Ile Thr Gly Gly Phe85 90 95Gly Asp His Gly Met Pro Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile100 105 110Glu Arg Ile Arg Arg Ile Gly Ser Gly Leu Glu Gln Asn Asn Thr Met115 120 125Lys Gly Lys Ala Pro Pro Lys Leu Ser Glu Gln Ser Glu Lys Asn Arg
130 135140Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly145 150 155 160Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala165 170 175Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr180 185 190Phe Thr Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg195 200 205Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln210 215 220Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His225 230 235 240Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp245 250 255Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln260 265 270Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly275 280 285Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe290 295 300Ser Arg Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn305 310 315 320Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp325 330 325Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr240 345 350Leu Gln Glu Ser Ser Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly255 360 365Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly370 375 380Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser385 390 395 400Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys405 410 415Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Val Ala Gly Val Leu420 425 430Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Asn435 440 445Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly450 455 460Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp465 470 475 480Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Met Val Ser Glu485 490 495Gly Tyr His Val Gly Leu Thr Phe Gln Ala Phe Glu Ile Glu Arg His500 505 510Asp Ser Cys Ala Tyr Asp His Leu Glu Val Arg Asp Gly Ala Ser Glu515 520 525Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp530 535 540Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly545 550 555 560Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp565 570 575Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn580 585 590Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly595 600 605Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys610 615 620Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro625 630 635 640Asn Lys Asn Cys Val Trp Gln Val Ile Ala Pro Ser Gln Tyr Arg Ile645 650 655Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys660 665 670Tyr Asp Tyr Val Glu Ile Trp Ser Gly Pro Ser Ser Glu Ser Lys Leu675 680 685His Gly Lys Phe Cys Gly Ala Asp Ile Pro Glu Val Met Thr Ser His690 695 700Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys705 710 715 720Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys725 730 735Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr740 745 750Thr Cys Gln Cys Arg Asn Gly Phe Val Leu His Glu Asn Lys His Asp755 760 765Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu770 775 780Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys785 790 795 800Thr Trp Val Ile Ser Ala Ile Pro Giy His Arg Ile Thr Leu Ala Phe805 810 815Asn Glu Phe Glu Val Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu820 825 830Glu Ile Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu
835 840 845Cys Gly Ser Lys Ile Pro Asp Pro Leu Het Ala Thr Gly Asn Glu Het850 855 860Phe Ile Arg Phe Ile Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln865 870 875 880Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys885 890 895Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro900 905 910Gly Gln Leu Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg915 920 925Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys930 935 940Gly Tyr Asp Tyr Val Glu Val Phe Asp Gly Leu Ser Ser Lys Ala Val945 950 955 960Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser965 970 975Ile Gly Asp Val Ala Leu Ile His Phe His Thr Asp Asp Thr Ile Asn980 985 990Lys Lys Gly Phe Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Glu Thr995 10001005Met His Ala Lys Asn*1010(2)SEQ ID NO:4的信息(ⅰ)序列特征(A)長度3919堿基對(B)類型核酸(C)鏈型雙鏈(D)拓撲結構線性(ⅱ)分子類型DNA(基因組)(ⅵ)來源(A)生物體Homo sapiens(ⅸ)特征(A)名稱/關鍵CDS(B)位置648..3689(D)其它信息/產物="人mTll蛋白質"(ⅹⅰ)序列描述SEQ ID NO:4:CTCACACTTT TGCTCTCTTG CAGTCAGTTG CTTTGCTGGC TTCTGCAGGC TTTTAAGGTC 60TCGCGGCGTA GAAATGCCTG GCCCCCACCC CCTTCCTCGG TCTCCCCTTT CAATTCAGAT 120GTGCTGATGT GCAGACCGGA TTCATCTTCT CGGAGCTGCG GCGGCGGCTT TGGGCTCAGG 180CGGCGGCGGC TCGCGCTCGG CCGCGGAGTC CTGGCAGCAG CGGGGACGCG GCGCGGGAGT 240CCGAGCTCTG GTGGCAGCTG AGCCCGCGGG GCGCCGCTCG CCGAGCCGCG GCCGCGGGAA 300GTTCGGCAGC CAGAAGGACG ACCTGGCAGG CTGCGAGCGC CAGCGCCGCC AGAGCCGAGT 360TTGCCTGCGC CCTCCCCGCC TCCGAGTGCA GAGTTCCTTA CCTGCCCTCC GCCCACCCGT 420GGGCCCCTAG CCAACTTCTC CCTGCGACTG GGGGTAACAG GCAGTGCTTG CCCTCTCTAC 480TGTCCCGGCG GCATCCACAT GTTTCCGGAC ACCTGAGCAC CCCGGTCCCG CCGAGGAGCC 540TCCGGGTGGG GAGAAGAGCA CCGGTGCCCC TAGCCCCGCA CATCAGCGCG GACCGCGGCT 600GCCTAACCTC TGGGTCCCGT CCCCTCCTTT TCCTCCGGGG GAGGAGG ATG GGG TTG656Met Gly Leu1015GGA ACG CTT TCC CCG AGG ATG CTC GTG TGG CTG GTG GCC TCG GGG ATT704Gly Thr Leu Ser Pro Arg Met Leu Val Trp Leu Val Ala Ser Gly Ile0GTT TTC TAC GGG GAG CTA TGG GTC TGC GCT GGC CTC GAT TAT GAT TAC752Val Phe Tyr Gly Glu Leu Trp Val Cys Ala Gly Leu Asp Tyr Asp Tyr5ACT TTT GAT GGG AAC GAA GAG GAT AAA ACA GAG ACT ATA GAT TAC AAG800Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Thr Ile Asp Tyr Lys01065GAC CCG TGT AAA GCC GCT GTA TTT TGG GGC GAT ATT GCC TTA GAT GAT848Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala Leu Asp Asp0GAA GAC TTA AAT ATC TTT CAA ATA GAT AGG ACA ATT GAC CTT ACG CAG896Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Ile Asp Leu Thr Gln5AAC CCC TTT GGA AAC CTT GGA CAT ACC ACA GGT GGA CTT GGA GAC CAT 944Asn Pro Phe Gly Asn Leu Gly His Thr Thr Gly Gly Leu Gly Asp His0GCT ATG TCA AAG AAG CGA GGG GCC CTC TAC CAA CTT ATA GAC AGG ATA992Ala Met Ser Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile Asp Arg Ile5AGA AGA ATT GGC TTT GGC TTG GAG CAA AAC AAC ACA GTT AAG GGA AAA 1040Arg Arg Ile Gly Phe Gly Leu Glu Gln Asn Asn Thr Val Lys Gly Lys01145GTA CCT CTA CAA TTC TCA GGG CAA AAT GAG AAA AAT CGA GTT CCC AGA 1088Val Pro Leu Gln Phe Ser Gly Gln Asn Glu Lys Asn Arg Val Pro Arg0GCC GCT ACA TCA AGA ACG GAA AGA ATA TGG CCT GGA GGC GTT ATT CCT 1136Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly Val Ile Pro5TAT GTT ATA GGA GGA AAC TTC ACT GGC AGC CAG AGA GCC ATG TTC AAG 1184Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala Met Phe Lys0CAG GCC ATG AGG CAC TGG GAA AAG CAC ACA TGT GTG ACT TTC ATA GAA 1232Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr Phe Ile Glu5AGA AGT GAT GAA GAG AGT TAC ATT GTA TTC ACC TAT AGG CCT TGT GGA 1280Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg Pro Cys Gly01225TGC TGC TCC TAT GTA GGT CGG CGA GGA AAT GGA CCT CAG GCA ATC TCT 1328Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln Ala Ile Ser0ATC GGC AAG AAC TGT GAT AAA TTT GGG ATT GTT GTT CAT GAA TTG GGT 1376Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His Glu Leu Gly5CAT GTG ATA GGC TTT TGG CAT GAA CAC ACA AGA CCA GAT CGA GAT AAC 1424His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp Arg Asp Asn0CAC GTA ACT ATC ATA AGA GAA AAC ATC CAG CCA GGT CAA GAG TAC AAT 1472His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln Glu Tyr Asn5TTT CTG AAG ATG GAG CCT GGA GAA GTA AAC TCA CTT GGA GAA AGA TAT 1520Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly Glu Arg Tyr01305GAT TTC GAC AGT ATC ATG CAC TAT GCC AGG AAC ACC TTC TCA AGG GGG 1568Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe Ser Arg Gly0ATG TTT CTG GAT ACC ATT CTC CCC TCC CGT GAT GAT AAT GGC ATA CGT 1616Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn Gly Ile Arg5CCT GCA ATT GGT CAG CGA ACC CGT CTA AGC AAA GGA GAT ATC GCA CAG 1664Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp Ile Ala Gln0GCA AGA AAG CTG TAT AGA TGT CCA GCA TGT GGA GAA ACT CTA CAA GAA 1712Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr Leu Gln Glu5TCC AAT GGC AAC CTT TCC TCT CCA GGA TTT CCC AAT GGC TAC CCT TCT 1760Ser Asn Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly Tyr Pro Ser01385TAC ACA CAC TGC ATC TGG AGA GTT TCT GTG ACC CCA GGG GAG AAG ATT 1808Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly Glu Lys Ile0GTT TTA AAT TTT ACA ACG ATG GAT CTA TAC AAG AGT AGT TTG TGC TGG 1856Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser Leu Cys Trp5TAT GAC TAT ATT GAA GTA AGA GAC GGG TAC TGG AGA AAA TCA CCT CTC 1904Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys Ser Pro Leu0CTT GGT AGA TTC TGT GGG GAC AAA TTG CCT GAA GTT CTT ACT TCT ACA 1952Leu Gly Arg Phe Cys Gly Asp Lys Leu Pro Glu Val Leu Thr Ser Thr5GAC AGC AGA ATG TGG ATT GAG TTT CGT AGC AGC AGT AAT TGG GTA GGA 2000Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Asn Trp Val Gly01465AAA GGC TTT GCA GCT GTC TAT GAA GCG ATC TGT GGA GGT GAG ATA CGT 2048Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly Glu Ile Arg0AAA AAT GAA GGA CAG ATT CAG TCT CCC AAT TAT CCT GAT GAC TAT CGC 2096Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp Asp Tyr Arg5CCG ATG AAA GAA TGT GTG TGG AAA ATA ACA GTG TCT GAG AGC TAC CAC 2144Pro Met Lys Glu Cys Val Trp Lys Ile Thr Val Ser Glu Ser Tyr His0GTC GGG CTG ACC TTT CAG TCC TTT GAG ATT GAA AGA CAT GAC AAT TGT 2192Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His Asp Asn Cys5GCT TAT GAC TAC CTG GAA GTT AGA GAT GGA ACC AGT GAA AAT AGC CCT 2240Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Thr Ser Glu Asn Ser Pro01545TTG ATA GGG CGT TTC TGT GGT TAT GAC AAA CCT GAA GAC ATA AGA TCT 2288Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp Ile Arg Ser0ACC TCC AAT ACT TTG TGG ATG AAG TTT GTT TCT GAC GGA ACT GTG AAC 2336Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly Thr Val Asn5AAA GCA GGG TTT GCT GCT AAC TTT TTT AAA GAG GAA GAT GAG TGT GCC 2384Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp Glu Cys Ala0AAA CCT GAC CGT GGA GGC TGT GAG CAG CGA TGT CTG AAC ACT CTG GGC 2432Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn Thr Leu Gly5AGT TAC CAG TGT GCC TGT GAG CCT GGC TAT GAG CTG GGC CCA GAC AGA 2480Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly Pro Asp Arg01625AGG AGC TGT GAA GCT GCT TGT GGT GGA CTT CTT ACC AAA CTT AAC GGC 2528Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys Leu Asn Gly0ACC ATA ACC ACC CCT GGC TGG CCC AAG GAG TAC CCT CCT AAT AAG AAC 2576Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro Asn Lys Asn5TGT GTG TGG CAA GTG GTT GCA CCA ACC CAG TAC AGA ATT TCT GTG AAG 2624Cys Val Trp Gln Val Val Ala Pro Thr Gln Tyr Arg Ile Ser Val Lys0TTT GAG TTT TTT GAA TTG GAA GGC AAT GAA GTT TGC AAA TAT GAT TAT 2672Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys Tyr Asp Tyr5GTG GAG ATC TGG AGT GGT CTT TCC TCT GAG TCT AAA CTG CAT GGC AAA 2720Val Glu Ile Trp Ser Gly Leu Ser Ser Glu Ser Lys Leu His Gly Lys01705TTC TGT GGC GCT GAA GTG CCT GAA GTG ATC ACA TCC CAG TTC AAC AAT 2768Phe Cys Gly Ala Glu Val Pro Glu Val Ile Thr Ser Gln Phe Asn Asn0ATG AGA ATT GAA TTC AAA TCT GAC AAT ACT GTA TCC AAG AAG GGC TTC 2816Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys Lys Gly Phe5AAA GCA CAT TTT TTC TCA GAC AAA GAT GAA TGC TCT AAG GAT AAT GGT 2864Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys Asp Asn Gly0GGA TGT CAG CAC GAA TGT GTC AAC ACG ATG GGG AGC TAC ATG TGT CAA 2912Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr Met Cys Gln5TGC CGT AAT GGA TTT GTG CTA CAT GAC AAT AAA CAT GAT TGC AAG GAA 2960Cys Arg Asn Gly Phe Val Leu His Asp Asn Lys His Asp Cys Lys Glu01785GCT GAG TGT GAA CAG AAG ATC CAC AGT CCA AGT GGC CTC ATC ACC AGT 3008Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu Ile Thr Ser0CCC AAC TGG CCA GAC AAG TAC CCA AGC AGG AAA GAA TGC ACT TGG GAA 3056Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys Thr Trp Glu5ATC AGC GCC ACT CCC GGC CAC CGA ATC AAA TTA GCC TTT AGT GAA TTT 3104Ile Ser Ala Thr Pro Gly His Arg Ile Lys Leu Ala Phe Ser Glu Phe0GAG ATT GAG CAG CAT CAA GAA TGT GCT TAT GAC CAC TTA GAA GTA TTT 3152Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu Glu Val Phe5GAT GGA GAA ACA GAA AAG TCA CCG ATT CTT GGA CGA CTA TGT GGC AAC 3200Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu Cys Gly Asn01865AAG ATA CCA GAT CCC CTT GTG GCT ACT GGA AAT AAA ATG TTT GTT CGG 3248Lys Ile Pro Asp Pro Leu Val Ala Thr Gly Asn Lys Met Phe Val Arg0TTT GTT TCT GAT GCA TCT GTT CAA AGA AAA GGC TTT CAA GCC ACA CAT 3296Phe Val Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln Ala Thr His5TCT ACA GAG TGT GGC GGA CGA TTG AAA GCA GAA TCA AAA CCA AGA GAT 3344Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys Pro Arg Asp0CTG TAC TCA CAT GCT CAG TTT GGT GAT AAC AAC TAC CCA GGA CAG GTT 3392Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro Gly Gln Val5GAC TGT GAA TGG CTA TTA GTA TCA GAA CGG GGC TCT CGA CTT GAA TTA 3440Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg Leu Glu Leu01945TCC TTC CAG ACA TTT GAA GTG GAG GAA GAA GCA GAC TGT GGC TAT GAC 3488Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys Gly Tyr Asp0TAT GTG GAG CTC TTT GAT GGT CTT GAT TCA ACA GCT GTG GGG CTT GGT 3536Tyr Val Glu Leu Phe Asp Gly Leu Asp Ser Thr Ala Val Gly Leu Gly5CGA TTC TGT GGA TCC GGG CCA CCA GAA GAG ATT TAT TCA ATT GGA GAT 3584Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser Ile Gly Asp0TCA GTT TTA ATT CAT TTC CAC ACT GAT GAC ACA ATC AAC AAG AAG GGA 3632Ser Val Leu Ile His Phe His Thr Asp Asp Thr Ile Asn Lys Lys Gly5TTT CAT ATA AGA TAC AAA AGC ATA AGA TAT CCA GAT ACC ACA CAT ACC 3680Phe His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr Thr His Thr20025AAA AAA TAA CACCAAAACC TCTGTCAGAA CACAAAGGAA TGTGCATAAT 3729Lys Lys *GGAGAGAAGACATATTTTTT TTAAAACTGA AGATATTGGC ACAAATGTTT TATACAAAGA 3789GTTTGAACAAAAAATCCCTG TAAGACCAGA ATTATCTTTG TACTAAAAGA GAAGTTTCCA 3849GCAAAACCCTCATCAGCATT ACAAGGATAT TTGAACTCCA TGCTTGATGG TATTAATAAA 3909GCTGGTGAAA3919(2)SEQ ID NO:5的信息(ⅰ)序列特征(A)長度1014氨基酸(B)類型氨基酸(D)拓撲結構線性(ⅱ)分子類型蛋白質(ⅹⅰ)序列描述SEQ ID NO:5:Met Gly Leu Gly Thr Leu Ser Pro Arg Met Leu Val Trp Leu Val Ala1 5 10 15Ser Gly Ile Val Phe Tyr Gly Glu Leu Trp Val Cys Ala Gly Leu Asp20 25 30Tyr Asp Tyr Thr Phe Asp Gly Asn Glu Glu Asp Lys Thr Glu Thr Ile35 40 45Asp Tyr Lys Asp Pro Cys Lys Ala Ala Val Phe Trp Gly Asp Ile Ala50 55 60Leu Asp Asp Glu Asp Leu Asn Ile Phe Gln Ile Asp Arg Thr Ile Asp65 70 75 80Leu Thr Gln Asn Pro Phe Gly Asn Leu Gly His Thr Thr Gly Gly Leu85 90 95Gly Asp His Ala Met Ser Lys Lys Arg Gly Ala Leu Tyr Gln Leu Ile100 105 110Asp Arg Ile Arg Arg Ile Gly Phe Gly Leu Glu Gln Asn Asn Thr Val115 120 125Lys Gly Lys Val Pro Leu Gln Phe Ser Gly Gln Asn Glu Lys Asn Arg130 135 140Val Pro Arg Ala Ala Thr Ser Arg Thr Glu Arg Ile Trp Pro Gly Gly145 150 155 160Val Ile Pro Tyr Val Ile Gly Gly Asn Phe Thr Gly Ser Gln Arg Ala165 170 175Met Phe Lys Gln Ala Met Arg His Trp Glu Lys His Thr Cys Val Thr180 185 190Phe Ile Glu Arg Ser Asp Glu Glu Ser Tyr Ile Val Phe Thr Tyr Arg195 200 205Pro Cys Gly Cys Cys Ser Tyr Val Gly Arg Arg Gly Asn Gly Pro Gln
210 215 220Ala Ile Ser Ile Gly Lys Asn Cys Asp Lys Phe Gly Ile Val Val His225 230 235 240Glu Leu Gly His Val Ile Gly Phe Trp His Glu His Thr Arg Pro Asp245 250 255Arg Asp Asn His Val Thr Ile Ile Arg Glu Asn Ile Gln Pro Gly Gln260 265 270Glu Tyr Asn Phe Leu Lys Met Glu Pro Gly Glu Val Asn Ser Leu Gly275 280 285Glu Arg Tyr Asp Phe Asp Ser Ile Met His Tyr Ala Arg Asn Thr Phe290 295 300Ser Arg Gly Met Phe Leu Asp Thr Ile Leu Pro Ser Arg Asp Asp Asn305 310 315 320Gly Ile Arg Pro Ala Ile Gly Gln Arg Thr Arg Leu Ser Lys Gly Asp325 330 335Ile Ala Gln Ala Arg Lys Leu Tyr Arg Cys Pro Ala Cys Gly Glu Thr340 345 350Leu Gln Glu Ser Asn Gly Asn Leu Ser Ser Pro Gly Phe Pro Asn Gly355 360 365Tyr Pro Ser Tyr Thr His Cys Ile Trp Arg Val Ser Val Thr Pro Gly370 375 380Glu Lys Ile Val Leu Asn Phe Thr Thr Met Asp Leu Tyr Lys Ser Ser385 390 395 400Leu Cys Trp Tyr Asp Tyr Ile Glu Val Arg Asp Gly Tyr Trp Arg Lys405 410 415Ser Pro Leu Leu Gly Arg Phe Cys Gly Asp Lys Leu Pro Glu Val Leu420 425 430Thr Ser Thr Asp Ser Arg Met Trp Ile Glu Phe Arg Ser Ser Ser Ash435 440 445Trp Val Gly Lys Gly Phe Ala Ala Val Tyr Glu Ala Ile Cys Gly Gly450 455 460Glu Ile Arg Lys Asn Glu Gly Gln Ile Gln Ser Pro Asn Tyr Pro Asp465 470 475 480Asp Tyr Arg Pro Met Lys Glu Cys Val Trp Lys Ile Thr Val Ser Glu485 490 495Ser Tyr His Val Gly Leu Thr Phe Gln Ser Phe Glu Ile Glu Arg His500 505 510Asp Asn Cys Ala Tyr Asp Tyr Leu Glu Val Arg Asp Gly Thr Ser Glu515 520 525Asn Ser Pro Leu Ile Gly Arg Phe Cys Gly Tyr Asp Lys Pro Glu Asp530 535 540Ile Arg Ser Thr Ser Asn Thr Leu Trp Met Lys Phe Val Ser Asp Gly545 550 555 560Thr Val Asn Lys Ala Gly Phe Ala Ala Asn Phe Phe Lys Glu Glu Asp565 570 575Glu Cys Ala Lys Pro Asp Arg Gly Gly Cys Glu Gln Arg Cys Leu Asn580 585 590Thr Leu Gly Ser Tyr Gln Cys Ala Cys Glu Pro Gly Tyr Glu Leu Gly595 600 605Pro Asp Arg Arg Ser Cys Glu Ala Ala Cys Gly Gly Leu Leu Thr Lys610 615 620Leu Asn Gly Thr Ile Thr Thr Pro Gly Trp Pro Lys Glu Tyr Pro Pro625 630 635 640Asn Lys Asn Cys Val Trp Gln Val Val Ala Pro Thr Gln Tyr Arg Ile645 650 655Ser Val Lys Phe Glu Phe Phe Glu Leu Glu Gly Asn Glu Val Cys Lys660 665 670Tyr Asp Tyr Val Glu Ile Trp Ser Gly Leu Ser Ser Glu Ser Lys Leu675 680 685His Gly Lys Phe Cys Gly Ala Glu Val Pro Glu Val Ile Thr Ser Gln690 695 700Phe Asn Asn Met Arg Ile Glu Phe Lys Ser Asp Asn Thr Val Ser Lys705 710 715 720Lys Gly Phe Lys Ala His Phe Phe Ser Asp Lys Asp Glu Cys Ser Lys725 730 735Asp Asn Gly Gly Cys Gln His Glu Cys Val Asn Thr Met Gly Ser Tyr740 745 750Met Cys Gln Cys Arg Asn Gly Phe Val Leu His Asp Asn Lys His Asp755 760 765Cys Lys Glu Ala Glu Cys Glu Gln Lys Ile His Ser Pro Ser Gly Leu770 775 780Ile Thr Ser Pro Asn Trp Pro Asp Lys Tyr Pro Ser Arg Lys Glu Cys785 790 795 800Thr Trp Glu Ile Ser Ala Thr Pro Gly His Arg Ile Lys Leu Ala Phe805 810 815Ser Glu Phe Glu Ile Glu Gln His Gln Glu Cys Ala Tyr Asp His Leu820 825 830Glu Val Phe Asp Gly Glu Thr Glu Lys Ser Pro Ile Leu Gly Arg Leu835 840 845Cys Gly Asn Lys Ile Pro Asp Pro Leu Val Ala Thr Gly Asn Lys Met850 855 860Phe Val Arg Phe Val Ser Asp Ala Ser Val Gln Arg Lys Gly Phe Gln865 870 875 880Ala Thr His Ser Thr Glu Cys Gly Gly Arg Leu Lys Ala Glu Ser Lys885 890 895Pro Arg Asp Leu Tyr Ser His Ala Gln Phe Gly Asp Asn Asn Tyr Pro900 905 910Gly Gln Val Asp Cys Glu Trp Leu Leu Val Ser Glu Arg Gly Ser Arg
915 920 925Leu Glu Leu Ser Phe Gln Thr Phe Glu Val Glu Glu Glu Ala Asp Cys930 935 940Gly Tyr Asp Tyr Val Glu Leu Phe Asp Gly Leu Asp Ser Thr Ala Val945 950 955 960Gly Leu Gly Arg Phe Cys Gly Ser Gly Pro Pro Glu Glu Ile Tyr Ser965 970 975Ile Gly Asp Ser Val Leu Ile His Phe His Thr Asp Asp Thr Ile Asn980 985 990Lys Lys Gly Phe His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr995 10001005Thr His Thr Lys Lys *1010(2)SEQ ID NO:6的信息(ⅰ)序列特征(A)長度20堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:6:CCAGCTTAAC CTGTTCACAC 20(2)SEQ ID NO:7的信息(ⅰ)序列特征(A)長度20堿基對(B)類型核酸(C)鏈型單鏈
(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:7:AACTCTACTT CCACTTCATC 20(2)SEQ ID NO:8的信息(ⅰ)序列特征(A)長度20堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:8:TCAGAACAGA AAGGAATGTG 20(2)SEQ ID NO:9的信息(ⅰ)序列特征(A)長度20堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:9:GACCACTATT CCACATCACC 20(2)SEQ ID NO:10的信息(ⅰ)序列特征(A)長度24堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述SEQ ID NO:10:TCTTGCAGTC AGTTGCTTTG CTGG 24(2)SEQ ID NO:11的信息(ⅰ)序列特征(A)長度28堿基對(B)類型核酸(C)鏈型單鏈(D)拓撲結構線性(ⅱ)分子類型其它核酸(A)描述/描述="寡核苷酸引物"(ⅹⅰ)序列描述:SEQ ID NO:11TAGTGCGGCC GCACATTCCT TTGTGTTC 28(2)SEQ ID NO:12:的信息(ⅰ)序列特征(A)長度18氨基酸
(B)類型氨基酸(C)鏈型(D)拓撲結構線性(ⅱ)分子類型肽(ⅹⅰ)序列描述SEQ ID NO:12:Cys Tyr Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Glu Thr Met His Ala1 5 10 15Lys Asn(2)SEQ ID NO:13:的信息(ⅰ)序列特征(A)長度18氨基酸(B)類型氨基酸(C)鏈型(D)拓撲結構線性(ⅱ)分子類型肽(ⅹⅰ)序列描述SEQ ID NO:13:Cys His Ile Arg Tyr Lys Ser Ile Arg Tyr Pro Asp Thr Thr His Thr1 5 10 15Lys Lys
權利要求
1.一種基本純化的DNA分子制品,所述DNA分子包含SEQ ID NO:2核苷酸1052至3649之間的序列。
2.一種基因構建物,所述構建物按5'到3'順序包括一個在宿主細胞中有活性的轉錄啟動子和一個包含SEQ ID NO:2核苷酸1052至3649之間核苷酸序列的DNA片段。
3.一種治療創口的方法,所述方法包括下列步驟在合適的宿主細胞中提供一個基因構建物,所述構建物包含一個在宿主細胞中有活性的轉錄啟動子以及一個含有SEQ ID NO:2核苷酸1052至3649之間核苷酸序列的DNA片段,以使所述核苷酸序列編碼蛋白質和以有效量對創口給藥,使該創口比未經治療的創口更迅速地愈合。
4.一種基本純的蛋白質制品,所述蛋白質具有SEQ ID NO:3中氨基酸1至1013之間的氨基酸序列。
5.一種基本純化的DNA分子制品,所述DNA分子包含SEQ ID NO:4核苷酸1089至3686之間的核苷酸序列。
6.一種基因構建物,所述基因構建物按5'到3順序包括一個在宿主細胞中有活性的轉錄啟動子和一個含有SEQ ID NO:4中核苷酸1089至3686之間的核苷酸序列的DNA片段。
7.一種治療傷口的方法,所述方法包括下列步驟在合適的宿主細胞中提供一個基因構建物,所述構建物包含一個在宿主細胞中有活性的轉錄啟動子以及一個含有SEQ ID NO:4核苷酸1089至3686之間核苷酸序列的DNA片段,以使該核苷酸序列編碼蛋白質并將該蛋白質以有效量用于傷口,使該傷口比未經治療的傷口更迅速地愈合。
8.一種基本純的蛋白質制品,所述蛋白質有SEQ ID NO:5氨基酸1至1013之間的氨基酸序列。
全文摘要
提出了一種編碼與人或小鼠BMP-1/mTld不同的特洛德樣蛋白質的哺乳動物基因,所述基因在結構上與BMP-1基因家族的成員相似,但在不同的位置上,并編碼不同的蛋白質。該基因編碼的蛋白質可用以篩選推定的治療劑以抑制BMP-1基因家族的活性,防止結疤、纖維變性等。
文檔編號A61K48/00GK1220608SQ97195192
公開日1999年6月23日 申請日期1997年5月30日 優先權日1996年5月30日
發明者D·S·格林斯潘, 高原和彥, G·G·霍夫曼 申請人:威斯康星鋁研究基金會