專利名稱:牛表皮生長因子的核酸序列和蛋白質序列的制作方法
技術領域:
本發明涉及牛表皮生長因子的核酸和蛋白質序列。
背景技術:
近年來,高度競爭的市場和對環境的關注鼓勵研究者發展改善家畜和乳制品生產效率的技術。然而,對于動物福利問題以及食品生產更大的公眾關注提示,效率改善應該在不損害動物健康和福利的情況下完成。最近在許多動物系統中的發現提示,表皮生長因子(EGF)可以在家畜和乳制品生產中用作飼料添加劑,刺激腸細胞早熟以分泌合適譜系的消化酶;增加營養吸收;以及預防或治療腸感染。
EGF是由53個氨基酸組成的6kDa多肽,衍生自一種約1,200個氨基酸的前體蛋白質(Carpenter和Cohen,1979)。它天然存在于唾液、腸分泌物和其它體液中,并在初乳和乳中大量產生(Donovan和Odle,1994)。EGF刺激人胎兒胃的生長和成熟。由于大多數物種的初乳中EGF含量高,并且在腸內存在EGF受體,因此有人已經提出EGF(和其它生長因子)也對早期出生后胃腸發育有貢獻(Donovan和Odle,1994)。
EGF可能涉及調節營養攝入。在嚙齒動物體內,EGF增加電解質、葡萄糖和脯氨酸穿過空腸刷狀緣膜的轉運。在小豬體內,EGF通過增加蔗糖酶和麥芽糖酶的活性,同時不顯著影響乳糖酶和堿性磷酸酶的活性,促進腸細胞功能的成熟(歸于Wilson等的國際申請第WO 88/04180號)。因此,應用EGF作為飼料添加劑以促進生長是有利的。
腸型大腸桿菌病或家畜腹瀉病是由病原體大腸桿菌(Escherichiacoli)引起的細菌感染。家畜腹瀉病在新生的和年幼的家畜中普遍存在,對于農業經濟有相當影響。在有限區域內年幼動物過于擁擠通常伴隨著家畜腹瀉病爆發,其特征在于腹瀉、脫水和最后死亡。接受乳替代物的乳牛犢對于家畜腹瀉病比用母牛乳飼養的乳牛犢更敏感,由于感染引起的患病率高達75%。
由于目前缺乏針對家畜腹瀉病的疫苗,因此需要有效治療例如EGF。補充EGF改善感染輪狀病毒的小豬的腸功能(Zijlstra等,1994)。此外,口服給予EGF降低兔的腸感染率,并防止感染引起的體重增重損失(Buret等,1997)。歸于Buret等的美國專利第5,753,622號公開通過口服給予EGF或在動物飼料中間接給予EGF,治療家畜腹瀉病和其它病原性感染,以及增加體重增重的方法。在大多數這些以前的研究中,使用來自與受體不同物種的EGF;然而,原則上優選同一物種的EGF,以避免不希望的副效應。為在乳牛生產和肉牛生產中應用,優選使用牛EGF(bEGF)。
一種飼料添加劑或補充劑必須具有經濟性,才能得到生產者的廣泛應用。由于分子生物學和重組DNA技術的發展,有效生產大量用于研究、治療和工業應用的外源蛋白。可以將編碼所需蛋白的基因從不符合生產實際的生物轉移到微生物、植物或動物表達系統,其中最通常使用微生物表達外源蛋白,因為它們易于生長和容易進行遺傳操作。已經在酵母中表達人EGF,產率為40ng/mg蛋白(歸于Barr等的美國專利第5,096,825號),已經通過酵母巴斯德畢赤酵母(Pichia pastoris)生產小鼠EGF,產率為450μg/ml培養基(Clare等,1991)。
以前已經從小鼠、大鼠、豬、馬和人中克隆出編碼成熟EGF蛋白的互補DNA序列(Gray等,1983;Simpson等,1985;Kim等,2001;Stewart等,1994;Bell等,1986)。推導的氨基酸序列相互之間顯示55%到85%的同一性,關鍵結構殘基驚人地保守,尤其是三個甘氨酸(殘基18、36和39)、六個半胱氨酸殘基(殘基6、14、20、31、33和42)以及酪氨酸37。推測其它殘基上的變化造成用抗血清和核酸探針觀察到的物種間非常低的交叉反應性。已經從人、豬和小鼠中克隆出編碼所述前體蛋白的cDNA序列。
雖然以前已經如所述從不同來源克隆出編碼成熟EGF蛋白的cDNA序列,但以前還沒有從牛的來源獲得編碼成熟EGF蛋白的DNA序列。然而,bEGF可能在以下幾個方面有益于乳牛生產和肉牛生產促進生長;預防或治療腸感染;增加營養吸收;以及加速未成熟腸細胞的發育。對于所述潛在的商業應用,希望應用來自牛來源的EGF,以避免可能損害動物健康和福利的不希望的副效應。因此,需要獲得編碼成熟bEGF蛋白的DNA序列并在重組系統中成功產生bEGF。
一般地說,人序列和牛序列之間的同源性允許應用人探針或引物獲得對應的bEGF DNA序列。然而,發現編碼bEGF DNA和蛋白序列的序列與其它物種的所述序列有很大不同,這造成試圖克隆bEGF DNA序列時的最初困難,并解釋了為什么該序列仍然沒有得到成功克隆,盡管這樣的發明有誘人的商業應用。
發明簡述本發明提供編碼牛表皮生長因子(bEGF)的DNA序列以及所編碼的蛋白的序列。SEQ ID NO8和9分別描述所述bEGF基因的部分DNA序列以及所編碼的bEGF蛋白的推導氨基酸序列。SEQ ID NO10和11分別提供編碼所述成熟bEGF蛋白的DNA序列以及所述成熟bEGF蛋白的推導氨基酸序列。
因此,本發明廣泛地提供編碼bEGF多肽的分離的核酸,其中所編碼的多肽包含選自以下的氨基酸序列a)在SEQ ID NO9中描述的氨基酸序列;b)在SEQ ID NO11中描述的氨基酸序列;和c)與SEQ ID NO9中所述氨基酸序列或SEQ ID NO11所述氨基酸序列有至少55%、更優選至少60%、更優選至少65%、更優選至少70%、更優選至少75%、更優選至少80%、更優選至少85%、更優選至少90%、更優選至少95%、最優選至少99%同源性的在功能上等價的氨基酸序列。本發明還包括牛表皮生長因子分離的多肽的片段,其中所述片段包含與SEQ ID NO11所述氨基酸序列在功能上等價的多肽。
在本發明的再一方面,提供編碼bEGF多肽的分離的核酸,其中所述核酸包含選自以下的核苷酸序列a)在SEQ ID NO8中描述的核苷酸序列;b)在SEQ ID NO10中描述的核苷酸序列;和c)與SEQ ID NO9中所述氨基酸序列或SEQ ID NO10所述核苷酸序列有至少75%、更優選至少80%、更優選至少85%、更優選至少90%、更優選至少95%、最優選至少99%同源性的在功能上等價的核苷酸序列。本發明還包括編碼牛表皮生長因子多肽的分離的核酸的片段,其中所述片段包含與SEQ ID NO10所述核苷酸序列在功能上等價的核苷酸序列。
在又一方面,本發明提供包含編碼bEGF多肽的核酸分子的載體和細胞,以及生產所編碼的多肽的方法。
本發明還包括表達構建物,所述表達構建物構成與能夠在合適宿主中指導bEGF表達的控制序列有效連接的編碼bEGF的核酸。
本發明還包括已經用編碼所述bEGF多肽的DNA轉化以及表達所述DNA的宿主細胞,還包括生產所述轉化宿主細胞的方法。
本發明還包括針對所述bEGF多肽或其片段產生的單克隆抗體和多克隆抗體。
在家畜生產和乳品生產中,可以使用所述bEGF多肽或其功能等價片段作為家畜飼料中的補充劑,以促進生長;預防或治療腸感染,尤其是腸病原性大腸桿菌感染,如腸型大腸桿菌病、賈第鞭毛蟲病和家畜腹瀉病;增加營養吸收;以及刺激腸細胞早熟以分泌合適譜系的消化酶。
在另一個更廣的方面,本發明提供通過給予bEGF多肽改善動物生長的方法以及預防和治療動物腸感染的方法。因此,本發明提供包含選自以下的制備物的飼料添加劑a)由核酸編碼的bEGF多肽;b)由核酸編碼的bEGF多肽,其中所述bEGF多肽與惰性或活性成分組合;c)微生物或植物組織,其中所述微生物或所述植物組織表達由核酸編碼的bEGF多肽;和d)從所述微生物或所述植物組織獲得的培養基或提取物,其中所述培養基或所述提取物包含核酸編碼的bEGF多肽。
在又一個更廣的方面,本發明提供飼料組合物,所述飼料組合物包含與編碼bEGF的核酸所編碼的bEGF多肽組合或用所述bEGF多肽處理的飼料。
在本文和權利要求中,下面陳述的術語和詞組有下面定義。
“抗體”包括單克隆抗體和多克隆抗體。
“牛”指牛亞科(Bovinae)的物種,其中包括Bison bison(美洲野牛,水牛)、Bison bonasus(歐洲野牛)、Bos frontalis(大額牛)、Bos indicus(瘤牛)、Bos taurus(普通牛)、Boselaphus tragocamelus(藍牛羚)、Bubalusbubalis(水牛)、Syncerus caffer(非洲水牛,南非水牛)、Taurotragusderbianus(德氏大羚羊)、Taurotragus oryx(大羚羊)、Tragelaphus angasii(旋角羚)、Tragelaphus eurycerus、Tragelaphus imberbis(小彎角羚)、Tragelaphus scriptus(羚羊)、Tragelaphus spekii(澤羚)、Tragelaphusstrepsiceros(大彎角羚)。
“環化”指線性化DNA末端連接形成共價閉合環狀分子或“環狀DNA”。
“編碼序列”指編碼蛋白氨基酸序列或功能RNA(如tRNA或rRNA)的基因部分。
“互補”或“互補序列”指與另一個核苷酸序列按照沃森-克里克堿基配對規則形成氫鍵鍵合雙螺旋的核苷酸序列。例如,5′-AAGGCT-3′的互補堿基序列是3′-TTCCGA-5′。
“常規聚合酶鏈反應”指以指數方式擴增靶DNA片段的技術,由此將引物設計成為與DNA的相對鏈雜交,在兩個引物之間進行延伸。
“簡并的”或“簡并性”指遺傳密碼的特性,由此一個以上的密碼子可以確定一個特定的氨基酸。
“下游”指DNA或RNA中任何位點的3′側。
“腸型大腸桿菌病”指由腸產毒性(產生毒素的)大腸桿菌菌株引起的感染。所述大腸桿菌菌株附著在小腸表面并大量擴增,分泌導致嚴重消化改變的腸毒素,引起臨床上的腹瀉、脫水和高死亡率。
“腸病原性”指傾向于在腸道內產生疾病。
“外顯子”指編碼蛋白特定結構域的真核基因區段。
“表達”指基因轉錄成為結構RNA(rRNA,tRNA),或轉錄成為信使RNA(mRNA)并隨后翻譯成為蛋白。
與bEGF“功能等價”的氨基酸序列是這樣的氨基酸序列所述氨基酸序列通過一個或多個氨基酸取代進行修飾,或通過添加和/或缺失氨基酸進行修飾,或者其中一個或多個氨基酸受到化學修飾,但仍然保留bEGF的活性。“功能等價”的核苷酸序列是那些編碼在實質上具有bEGF相同生物活性的多肽的核苷酸序列。
“賈第鞭毛蟲病”指鞭毛原生動物(賈第鞭毛蟲屬(Giardia))感染或由鞭毛原生動物引起的疾病,其特征通常是腹瀉。
兩個核酸序列在下面情況下相互是“異源的”所述序列來自不同生物(不論所述生物是否同一物種),只要所述序列并不同時天然出現在同一生物的同一排列中。
兩個多核苷酸或多肽在下列情況下是“同源的”或“相同的”當所述核苷酸序列或所述兩個序列中的氨基酸殘基分別如本文所述按照最大對應性排列時相同。一般如下進行兩個或多個多核苷酸或多肽之間的序列比較在一個比較窗口上比較所述兩個序列的各部分,鑒定和比較具有序列相似性的局部區域。所述比較窗口通常從約20個到約200個連續的核苷酸或連續的氨基酸殘基。如下確定多核苷酸和多肽的“序列同一性百分率”或“序列同源性百分率”在一個比較窗口上比較兩個最佳排列的序列,其中所述比較窗口內的多核苷酸或多肽序列部分與用于最佳排列所述兩個序列的參考序列(不包含添加或缺失)相比可能包括添加或缺失(即缺口)。如下計算百分率(a)確定兩個序列中出現相同核酸堿基或氨基酸殘基的位置的數目,得到匹配位置數量;(b)用所述匹配位置的數目除以所述比較窗口中位置的總數;然后(c)該結果乘以100,產生序列同一性的百分率。
可以通過已知算法的計算機化實現形式或通過檢查來最佳排列序列以進行比較。從Ausubel等(1990)可以找到提供商業軟件和免費軟件的列表。容易得到的序列比較算法和多序列排列對比算法分別是Basic Local Alignment Search Tool(BLAST)(Altschul等,1997)和ClustalW程序。其它合適的程序包括Wisconsin Genetics軟件包(Genetics Computer Group(GCG),575 Science Dr.,Madison,WI)中的GAP、BESTFIT、FASTA和TFASTA。為更加肯定,在本文和權利要求中,氨基酸序列的“序列同一性百分率”或“序列同源性百分率”根據使用如本文所述BLASTP程序的默認值確定的最佳序列排列對比來確定。
如在下文將更詳細討論的,也可以通過DNA雜交分析測定核苷酸序列之間的同源性,其中雙鏈DNA雜種的穩定性依賴于出現的堿基配對的程度。高溫和/或低鹽含量的條件降低所述雜種的穩定性,可以對所述條件加以變化,以預防具有低于選定同源性程度的序列退火。
“宿主細胞”包括動物宿主細胞、植物宿主細胞、酵母宿主細胞、真菌宿主細胞、原生動物宿主細胞和原核宿主細胞。
“腸感染”指包括但不限于腸病原性大腸桿菌感染,例如腸型大腸桿菌病、賈第鞭毛蟲病和家畜腹瀉病。
“內含子”指基因中的間插序列。它被轉錄,但在mRNA翻譯前被切除。
“反向聚合酶鏈式反應”指用于擴增在已知序列的核心區側翼未知DNA序列的技術,由此用合適的限制酶消化DNA,然后環化,并設計引物以便延伸向外進行并使產物包含所述已知序列上游和下游的序列。
“分離的”指“通過人的勞動”從自然狀態改變。假如“分離的”組合物或物質天然存在,它已經受到改變或從其天然環境中取出,或者兩種情況都發生。例如,在生活動物體內天然存在的多核苷酸或多肽不是“分離的”,但從其天然狀態的共存材料中分離的同樣多核苷酸或多肽是“分離的”,與本文使用的所述術語一樣。
“家畜”包括,例如,乳牛和肉牛、豬、山羊和綿羊。該術語包括年幼和成年的動物。
“多核苷酸”或“核酸”指脫氧核糖核苷酸的線性序列(在DNA中)或核糖核苷酸的線性序列(在RNA中),其中一個核苷酸的戊糖的3′碳通過磷酸基團連接鄰近核苷酸的戊糖的5′碳。“多肽”或“核酸”可能包括DNA(其中包括cDNA、基因組DNA組和合成DNA)或RNA,DNA或RNA可以是雙鏈或單鏈的,如果是單鏈的,則可以是編碼鏈或非編碼(反義)鏈。
“多核苷酸構建物”指從天然基因分離的核酸分子,或者已經受到修飾而包含以非天然方式組合和并列的核酸區段的核酸分子。
兩個DNA序列在下面情況下“有效連接”所述連接的性質并不干擾所述序列實現它們相互之間的正常功能。例如,假如一個啟動子區能夠實現一個編碼序列的轉錄,則所述啟動子與所述編碼序列有效連接。
“多肽”指通過肽鍵連接的氨基酸線性聚合物。
“啟動子”指順式作用的DNA序列,一般長80-120個堿基對,位于基因起始位點的上游,RNA聚合酶可以結合所述序列并起始正確轉錄。
“重組”核酸分子,例如重組DNA分子,指在體外通過連接兩個或多個非同源DNA分子而形成的新型核酸序列(例如在其克隆位點或其多接頭內包含一個或多個外源DNA的插入片段的重組質粒)。
“家畜腹瀉病”指動物長時間的腹瀉。
“沉默改變”指包含例如不改動多核苷酸序列所編碼的氨基酸序列的改變。
“轉化”指通過外部應用來自不同基因型的另一細胞的純化的重組DNA,導致其被攝入并整合進接受者細胞的基因組,從而定向修飾所述細胞的基因組。在細菌中,重組DNA并不整合進細菌染色體,而是作為質粒自主復制。
“轉基因”指已經在種系中引入外源DNA的生物。
“轉基因植物”包括繼續攜帶所述外源DNA的所有后代、雜種和其雜交物,不論是有性繁殖或無性繁殖獲得,并且包括轉基因植物、植物組織和植物細胞。
“上游”指DNA或RNA中任何位點的5′側。
基因的“變體”或“變異”指編碼同樣蛋白的核苷酸序列或編碼具有bEGF活性的等價蛋白的核苷酸序列。
蛋白的“變體”或“變異”指bEGF蛋白或其片段的變體(包括衍生物或類似物)。所述變體可以與所述bEGF蛋白在氨基酸序列上由于任何組合的一個或多個取代、添加、缺失、融合和截短而有所不同。
“載體”指能夠在宿主細胞中自主復制并接受外源DNA的核酸分子。載體攜帶其自身的復制原點、一個或多個可以用于插入外源DNA的限制性內切核酸酶獨特識別位點、一般還有選擇標記例如編碼抗生素抗性的基因、以及常常有用于表達插入DNA的識別序列(如啟動子)。常用載體包括但不限于噬菌體、粘粒、桿狀病毒、反轉錄病毒載體和質粒載體。
附圖簡述
圖1A和1B是牛EGF的DNA編碼序列部分(SEQ ID NO8)與來自小鼠、豬和人的對應EGF序列的序列排列對比。所述EGF序列的來源是1)小鼠(Gray等,1983;GenBank登記號J00380)核苷酸3108-3539,SEQ ID NO24;和2)豬(Kim等,2001;GenBank登記號AF336151)核苷酸3172-3606,SEQ ID NO25;和3)人(Bell等,1986;GenBank登記號X04571)核苷酸3170-3607,SEQ ID NO26。
圖2顯示編碼成熟bEGF蛋白的DNA編碼序列(SEQ ID NO10)與對應小鼠序列(核苷酸3282-3440,SEQ ID NO27)、豬序列(核苷酸3346-3504,SEQ ID NO28)和人序列(核苷酸3347-3505,SEQ ID NO29)的排列對比。
圖3顯示推導的bEGF蛋白序列(SEQ ID NO9)與對應小鼠EGF蛋白序列(殘基919-1063,SEQ ID NO30)、豬EGF蛋白序列(殘基912-1056,SEQ ID NO31)和人EGF蛋白序列(殘基912-1057,SEQ IDNO32)的排列對比。
圖4是推導的成熟bEGF蛋白(SEQ ID NO11)與對應小鼠成熟EGF蛋白(殘基977-1029,SEQ ID NO33)、豬成熟EGF蛋白(殘基970-1022,SEQ ID NO34)和人成熟EGF蛋白(殘基970-1022,SEQ IDNO35)的排列對比。
優選實施方案的描述EGF是有53個氨基酸的小多肽,從更大的前體蛋白產生。所述前體蛋白由一個跨越110kb的DNA編碼,所述DNA中24個短外顯子被各種大小的多個內含子分開。切除所述內含子后,產生含約4,700堿基對的mRNA,所述mRNA編碼含約1,200個氨基酸的前體蛋白。通過切除所述前體蛋白的氨基酸殘基977到1029,產生成熟人EGF蛋白,所述切除的部分由外顯子20的3′最后95個核苷酸以及外顯子21的5′頭64個核苷酸編碼,對應于所述mRNA的核酸3347-3505(Bell等,1986)。
I.bEGF的核酸序列和多肽序列首先從牛血中分離基因組DNA(實施例1)。為克隆編碼bEGF的序列,在一個聚合酶鏈反應(PCR)中,在牛總基因組DNA存在下使用SEQ ID NO1和2的引物(實施例2)。SEQ ID NO1的引物包括人EGF cDNA序列的核苷酸3215-3237,因此位于成熟EGF蛋白編碼序列的上游。設計該引物,使得通過混合核苷酸堿基以適應潛在的簡并性。SEQ ID NO2的引物也有簡并性,包括人EGF cDNA序列的核苷酸3377-3400,因此在成熟區內。使用這兩個引物,獲得一個1456堿基對的片段(SEQ ID NO3),然后克隆并測序該片段。根據使用2.0版BLAST算法(Altschul等,1997)對DNA和蛋白質數據庫的類似性搜索顯示,該片段與小鼠和人EGF DNA序列有顯著同源性,包含外顯子19的56個堿基對、一個1320堿基對的內含子以及外顯子20的80個堿基對,其中包括編碼成熟EGF蛋白NH2末端的前十個氨基酸的30個堿基對。
發明人克隆編碼成熟EGF蛋白剩余部分的DNA序列的最初策略是使用一種從上述序列設計得到的牛特異性5′引物以及一種從其它物種在所述成熟區下游的序列設計得到的3′引物;然而,該策略并不成功,因為許多受測的引物組合可能不與bEGF序列退火和擴增bEGF序列。因此,懷疑當使用從其它物種的序列設計得到的引物時,不允許成功擴增在所述成熟區下游的bEGF序列。然后使用擴增未知側翼序列的反向PCR。在常規PCR中,設計引物與DNA相對的兩條鏈雜交,延伸在兩個引物之間進行。在反向PCR中,使DNA環化,設計引物使得延伸向外進行,產物包含已知序列上游和下游的序列(Ochman等,1988;Benkel和Fong,1996)。
為擴增如上獲得的bEGF序列上游和下游的DNA序列,在分別進行的反應中用特異性限制酶消化牛基因組DNA,然后稀釋到低濃度,進行連接(實施例3)。在低濃度下,有利于分子內連接,產生DNA環。選擇限制酶BamH I、EcoR I、Hind III和Sac I,因為它們都識別六堿基對序列;因此,消化時產生的平均序列大小是4kb,所述片段可以容易地用長范圍聚合酶進行擴增。此外,根據以前獲得的序列,在外顯子19和20之間的內含子5′末端附近有一個BamH I位點;因此,假如用BamH I消化基因組DNA,環化,然后用從所述BamH I位點下游序列設計的引物進行擴增,那么得到的片段包含從所述BamH I位點到內含子內下一個BamH I位點下游的序列(圖4)。在以前獲得的序列中沒有其它三種限制酶的識別位點;因此,擴增產物包含所述已知序列上游往上到第一個識別位點的序列以及所述已知序列下游往下到下一個限制位點的序列。
使用SEQ ID NO4和5的引物(分別是SEQ ID NO3的核苷酸1184-1204以及1070-1090)擴增用上述酶消化的DNA。然后以所述第一個反應的等分物作為模板,應用SEQ ID NO6和7的引物(SEQ IDNO3的核苷酸1413-1434和375-394)。設計這些引物擴增用SEQ IDNO4和5的引物擴增的序列內部的片段,該嵌套反應證實第一個反應中擴增的序列包含EGF序列。擴增用Sac I消化的DNA,在瓊脂糖凝膠上產生約7,500bp的單一帶,而該材料的嵌套擴增產生預期的更小的非常濃的帶。然后克隆并測序該產物(SEQ ID NO8;實施例3)。使用2.0版BLAST算法(Altschul等,1997)根據相似性搜索DNA和蛋白質數據庫,指出該DNA片段與其它物種的EGF序列有顯著同源性。該片段包括內含子的483個核苷酸、外顯子19、以前鑒定的含1,320個堿基對的內含子、外顯子20、一個含4.8千堿基的內含子和外顯子21的158個核苷酸。因此,該片段包含與以前鑒定的那些序列同源的序列,以及其它的序列,包括那些編碼牛成熟EGF蛋白剩余部分的序列。
人是唯一可以獲得EGF基因從外顯子19到21的基因組序列(包括內含子)的物種,所述基因組序列包括在從人染色體4獲得的127kb克隆中(Stone等,1998;GenBank登記號AC004050)。外顯子19在牛和人中有124個堿基對;外顯子20在牛中有145個堿基對,在人中有149個堿基對。由于本發明的牛克隆不包括外顯子21的完整序列,其大小不能與人外顯子21進行比較。內含子大小有更多差異,因為外顯子19和20之間的內含子在人中有1362個堿基對,在牛中有5171個堿基對。外顯子20和21之間的內含子在人中有4799個堿基對,在牛中有5171個堿基對。在牛內含子中看起來有SINE序列插入;然而,內含子序列的剩余部分顯示與人內含子有顯著同源性。
圖1顯示牛EGF序列與人、豬和鼠的EGF序列的排列對比。使用2.0版BLAST算法成對比較這些序列,牛核酸序列與人、豬和鼠核酸序列之間的總同源性分別是70%、73%和64%。這些序列不同區之間的同源性水平有所不同;例如,當僅比較成熟蛋白的核酸序列(圖2)時,牛序列(SEQ ID NO9)與人、豬和鼠序列之間的同源性分別是64%、66%和59%。然而,當僅比較成熟蛋白編碼序列上游的核酸序列時,牛序列與人、豬和鼠序列之間的同源性分別是82%、85%和72%。
如上獲得的bEGF基因外顯子序列編碼SEQ ID NO10的推導蛋白。圖3顯示所述推導的bEGF蛋白序列與人、豬和鼠EGF序列的排列對比。當使用2版BLAST算法成對比較時,牛推導蛋白序列與人、豬和鼠推導蛋白序列之間的總同源性是49%、51%和46%。考慮有相似特征的氨基酸(來自同一組)時,與人、豬和鼠的同源性分別是66%、69%和62%。與核酸序列的情況相同,序列不同區之間的同源性水平有所不同;例如,當僅比較成熟蛋白時(SEQ ID NO11是牛序列;圖4),牛蛋白序列與人、豬和鼠蛋白序列之間的同源性分別是39%、36%和36%(當考慮相似氨基酸時是65%、62%和60%)。然而,當僅比較成熟蛋白上游的序列時,牛序列與人、豬和鼠序列之間的同源性分別是66%、73%和61%(當考慮相似氨基酸時是78%、84%和73%)。
推導的成熟bEGF蛋白的計算分子量為6112.10Da,包含在其它物種中對于蛋白結構看起來重要的特定氨基酸,即位置17、36和39的甘氨酸(其它物種中位置18、36和39)以及酪氨酸37。在人EGF中,酪氨酸13、22和29相互接近(Cooke等,1987)。在推導的bEGF蛋白中,存在酪氨酸13和22,也是芳香族氨基酸的苯丙氨酸29,5半胱氨酸對應于其它已知EGF中的6。蛋白中的二硫鍵不是蛋白鏈獨特折疊的主要原因,而是增加已經穩定的構象的穩定性的裝置(Watson等,1985)。推導的bEGF蛋白也是鼠EGF的同源物,折疊識別指出一致分數為44.8證明了這一點。高于12的分數在超過80%的時間里得到正確預測(Fisher,2000)。
對序列SEQ ID NO8的分析揭示在外顯子19(成熟區的上游)有一個符合讀框的TGA密碼子。TGA是遺傳密碼中三個鏈終止密碼子之一,還可以編碼硒代半胱氨酸,即第二十一個氨基酸(Nasim等,2000;Tate等,1999)。在來自其它物種的EGF基因中,對應的密碼子是編碼半胱氨酸的TGC;因此,硒代半胱氨酸的存在將構成保守性取代。在本發明中,進行牛基因組DNA的DNA印跡分析,確定牛基因組中EGF基因的拷貝數(實施例4)。假如看起來僅存在一個拷貝,那么可以合理地假設獲得的序列來自有功能的EGF基因,并且前體蛋白是硒代蛋白。用限制酶BamH I、EcoR I、Hind III、Sac I和XbaI在分別進行的反應中消化牛基因組DNA。在瓊脂糖凝膠的不同道分離三十五μg每種消化物。將所述DNA轉移到尼龍膜,與用32P-dCTP標記的SEQ ID NO3的片段雜交,洗滌,然后對X射線底片曝光三天。所述引物與每種消化物的單一帶雜交,強烈提示在牛基因組中僅有EGF的一個拷貝。
因此,本發明的一方面是分離、純化或富集的包含SEQ ID NO9的序列核酸以及與其互補的序列。所述分離、純化或富集的核酸可以包含DNA,其中包括cDNA、基因組DNA和合成DNA。所述DNA可以是雙鏈的或單鏈的,如果是單鏈,則可以是編碼鏈或非編碼(反義)鏈。或者,所述分離、純化或富集的核酸可以包括RNA。
可以使用幾種方法分離包含SEQ ID NO9的序列的基因組DNA,所述方法例如用所述SEQ ID NO4和5的引物以及SEQ IDNO6或7的引物,對用Sac I消化的牛基因組DNA進行反向PCR。也可以根據牛序列設計其它引物組合,通過對用Sac I或其它限制酶消化的基因組DNA進行反向PCR,分離SEQ ID NO9的DNA。也可以通過常規PCR,例如使用SEQ ID NO6和14的引物分別作為正向引物和反向引物,獲得SEQ ID NO9的基因組序列。
其次,可以通過常規PCR,在分別進行的反應中擴增來自外顯子20和21的序列,從而分離包含SEQ ID NO9的序列的基因組DNA;例如使用SEQ ID NO6和12的引物分別作為正向引物和反向引物,擴增外顯子20。使用SEQ ID NO13和14分別作為正向引物和反向引物,擴增外顯子21,然后連接得到的兩個片段。
第三,可以用從SEQ ID NO8序列的片段制備的探針與基因組文庫在允許所述探針特異性雜交相關序列的條件下接觸,分離包含SEQ ID NO9的序列的基因組DNA。通過用放射性同位素、熒光染料或能夠催化可檢測產物形成的酶標記所述探針,可以檢測所述探針與相關序列的核酸的雜交。用于篩選基因組文庫的程序已經由Ausubel等(1990)和Sambrook等(1989)描述。
可以通過逆轉錄PCR分離編碼bEGF的互補DNA。在本發明中,分離編碼成熟bEGF蛋白的cDNA片段以及上游和下游的序列,證實獲得的基因組序列被轉錄(實施例5)。用SEQ ID NO14的引物逆轉錄牛腎mRNA。在逆反錄后,cDNA應用于使用SEQ ID NO16和14的引物分別作為正向和反向引物的PCR反應中。在瓊脂糖凝膠上觀察到幾種產物。從凝膠上切出一條稍大于400堿基對的帶,純化,并使用所述DNA作為兩個分別進行的PCR反應的模板,即一個反應分別使用SEQ ID NO16和12的引物作為正向和反向引物;另一個反應分別使用SEQ ID NO15和14的引物作為正向和反向引物。克隆和測序獲得的片段。發現組合的序列(SEQ ID NO17)與對應的基因組序列98%同源。差別(411個核苷酸中有6個核苷酸的差別)可能是由于使用來自不同動物的組織分離基因組DNA和RNA。當與從基因組序列推導的蛋白進行比較時,從cDNA序列推導獲得的成熟蛋白序列上有兩個氨基酸改變是明顯的,即在位置18用谷氨酰胺取代精氨酸,在位置32用谷氨酰胺取代組氨酸。
或者,通過篩選從表達EGF基因的牛組織構建的cDNA文庫,分離編碼bEGF的互補DNA序列。然后使所述cDNA文庫與包含EGF編碼序列或EGF編碼序列片段的探針在允許所述探針特異性雜交互補序列的條件下接觸。然后檢測和分離與所述探針雜交的互補DNA。然后通過蛋白質印跡分析或PCR分析鑒定表達EGF的牛組織。
可以通過常規DNA合成儀合成產生編碼成熟bEGF蛋白的序列(SEQ ID NO9),由此SEQ ID NO9的片段或部分可以用作產生對應全長序列的中間體。因此SEQ ID NO9的分離、純化或富集的核酸可以用于制備SEQ ID NO11的肽。
眾所周知并非全長的蛋白常常具有完整蛋白的功能。缺乏N末端部分、內部部分或C末端部分的截短蛋白可能保留全長蛋白的全部或部分生物學活性和/或酶促活性;例如,在COOH端缺乏最后五個氨基酸的人EGF保留其抑制胃酸分泌的能力,而缺乏多達三個N末端殘基的大鼠EGF具有天然蛋白的相同活性(Hollenberg和Gregory1980;Simpson等,1985)。因此,編碼保留完整bEGF蛋白活性的內部缺失或截短的bEGF蛋白的SEQ ID NO9的片段在本發明的范圍內。制備截短蛋白以及帶有內部缺失的蛋白的方法是本領域內已知的。可以使用例如DNA合成/細胞增殖測定來檢驗截短或內部缺失的bEGF的活性。
本發明的另一方面是編碼bEGF蛋白或片段的分離、純化或富集的核酸,所述bEGF片段包含成熟bEGF蛋白的至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸。這些核酸的編碼序列可以與bEGF蛋白的編碼序列相同,或者是不同的編碼序列,所述不同的編碼序列由于本領域內已知的遺傳密碼戎余性或簡并性(Lewin,1997)的結果,編碼bEGF蛋白或者包含bEGF蛋白的至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段。
所述編碼成熟bEGF蛋白的分離、純化或富集的核酸可以包括但不限于僅是成熟bEGF蛋白的編碼序列;成熟bEGF蛋白的編碼序列以及其它編碼序列,例如前導序列或前體蛋白序列;或者成熟bEGF蛋白的編碼序列和非編碼序列,例如內含子或編碼序列5′和/或3′的非編碼序列。
或者,可以使用定點誘變或其它已知技術(Ausubel等,1990)誘變bEGF的核酸序列,在成熟bEGF蛋白中引入沉默改變,即不改變所述多核苷酸所編碼的氨基酸序列的改變。為引入宿主生物優選的密碼子,由此增加包含編碼所述多肽的載體的宿主細胞生產所述多肽的水平,這樣的改變是合乎需要的。
可以在蛋白序列中制造某些氨基酸取代而不影響蛋白功能。因此,本發明也涉及帶有核苷酸改變的多核苷酸,所述核苷酸改變導致成熟bEGF蛋白中的氨基酸取代、添加、缺失、融合和截短。可以使用定點誘變、隨機化學誘變、外切核酸酶III缺失和其它重組DNA技術(Ausubel等,1990)引入所述核苷酸改變。得到的變體可能表現bEGF的生物學性質;例如,在位置13用苯丙氨酸取代酪氨酸對于人EGF結合其受體幾乎沒有影響(Tadaki和Niyogi,1993)。或者,所述核苷酸改變可以是天然等位基因變體,所述天然等位基因變體通過鑒定與探針特異性雜交的牛來源核酸而分離,所述探針包含SEQ IDNO9的至少20個、更優選至少30個、更優選至少40個、更優選至少50個、更優選至少60個、更優選至少70個、更優選至少80個、更優選至少90個、更優選至少100個、更優選至少110個、更優選至少120個、更優選至少130個、更優選至少140個、更優選至少150個、最優選至少159個連續堿基或與其互補的序列。
可以在低嚴謹條件、中等嚴謹條件或高嚴謹條件下進行雜交。簡要地說,首先將包含固定化變性核酸的聚合物膜在含0.9M NaCl,50mM NaH2PO4,pH 7.0,5.0mM Na2EDTA,0.5%SDS,10X Denhardt’s和0.5mg/ml聚核糖腺苷酸的溶液中45℃下預雜交30分鐘。然后在溶液中加入約2×107cpm(比活4-9×108cpm/μg)用32p末端標記的寡核苷酸探針。溫育12-16小時后,所述膜在含0.5%SDS的1X SET(150mM NaCl,20mM Tris-鹽酸,pH 7.8,1mM Na2EDTA)中室溫下洗滌30分鐘,然后在寡核苷酸探針的Tm-10℃下在新鮮1X SET中洗滌30分鐘。然后所述膜對放射自顯影底片曝光,檢測雜交信號。
通過改變雜交條件的嚴謹性,可以鑒定和分離對于所述探針有不同水平同源性的核酸。通過在低于所述探針熔解溫度(Tm)下的不同溫度進行雜交,可以改變嚴謹性,探針的熔解溫度可以使用下式計算對于長度大于100個核苷酸的探針,使用下式計算TmTm=81.5-16.6(log[Na+])+0.41(%G+C)-(600/N),其中N是所述探針的長度。假如在含有甲酰胺的溶液中進行雜交,可以使用等式Tm=81.5-16.6(log[Na+])+0.41(G+C數)-0.63(%甲酰胺)-(600/N)計算Tm,其中N是所述探針的長度。
可以在6X SSC,5X Denhardt’s試劑,0.5%SDS,100μg/ml變性的片段化鮭魚精子DNA;或者6X SSC,5X Denhardt’s試劑,0.5%SDS,100μg/ml變性的片段化鮭魚精子DNA,50%甲酰胺中進行預雜交。SSC和Denhardt’s溶液的配方可以在Sambrook等(1989)中找到。
通過在上述預雜交溶液中加入可檢測探針,進行雜交。當所述探針包含雙鏈DNA時,在加入所述預雜交溶液中前使其變性。所述膜與所述雜交溶液接觸足夠時間,允許所述探針與包含互補或同源序列的cDNA或基因組DNA雜交。對于長度超過200個核苷酸的探針,可以在Tm以下15-25℃進行雜交。對于更短的探針例如寡核苷酸探針,可以在Tm以下5-10℃進行雜交。對于在6X SSC中進行的雜交,優選在約68℃下進行雜交。對于在含50%甲酰胺的溶液中進行的雜交,優選在約42℃下進行雜交。所有前面的雜交條件都被認為是高嚴謹性。
雜交后,所述膜首先在2X SSC,0.1%SDS中室溫下洗滌15分鐘;然后用0.1X SSC,0.5%SDS在室溫下洗滌30分鐘到1小時;然后在0.1X SSC,0.5%SDS中雜交溫度下洗滌;最后用0.1X SSC在室溫下洗滌。對于寡核苷酸探針,推薦使用更短的洗滌時間。通過放射自顯影或其它常規技術鑒定已經與所述探針雜交的核酸。
為獲得與所述可檢測探針同源性降低的核酸,可以使用更低嚴謹性的條件;例如,在含約1M Na+濃度的雜交緩沖液中,雜交溫度以5℃的增量從68℃降到42℃。雜交后,用2X SSC,0.5%SDS在雜交溫度下洗滌所述膜。所述條件在50℃以上被認為是“中等”嚴謹性,在50℃以下被認為是“低”嚴謹性。
或者,可以在42℃下,在含甲酰胺的緩沖液例如6X SSC中進行雜交。在這種情況下,雜交溶液中的甲酰胺含量可以按5%的增量從50%降到0%,以鑒定與所述探針有更低水平同源性的克隆。雜交后,用6X SSC,0.5%SDS在50℃洗滌所述膜。所述條件在25%甲酰胺以上被認為是“中等”嚴謹性,在25%甲酰胺以下被認為是“低”嚴謹性。
因此,可以使用所述方法分離核酸,所述核酸包含與bEGF序列或者與包含其至少20個、更優選至少30個、更優選至少40個、更優選至少50個、更優選至少60個、更優選至少70個、更優選至少80個、更優選至少90個、更優選至少100個、更優選至少110個、更優選至少120個、更優選至少130個、更優選至少140個、更優選至少150個、最優選至少159個連續堿基的片段以及與其互補的序列有至少75%、至少80%、至少90%、至少95%或至少99%同源性的序列。可以使用2版BLASTN按默認參數測量同源性(Altschul等,1990)。此外,可以使用上述程序分離核酸,根據笫2版BLASTX測定,所述核酸編碼與bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的bEGF蛋白片段有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%同源性的多肽。
SEQ ID NO9的分離、純化或富集的核酸、與其互補的序列、或包含SEQ ID NO9的至少20個、更優選至少30個、更優選至少40個、更優選至少50個、更優選至少60個、更優選至少70個、更優選至少80個、更優選至少90個、更優選至少100個、更優選至少110個、更優選至少120個、更優選至少130個、更優選至少140個、更優選至少150個、最優選至少159個連續堿基的片段或者與其互補的序列可以用作探針,鑒定和分離編碼SEQ ID NO11的多肽或其變體的cDNA。在所述程序中,從表達bEGF基因的牛組織提取的RNA構建cDNA文庫,然后與包含編碼序列的探針在允許所述探針與互補序列雜交的條件下接觸,隨后檢測和分離所述互補序列。改變用于鑒定EGF cDNA的雜交條件的嚴謹性,就能夠鑒定和分離出與所述探針具有不同同源性水平的核酸。也可以在使用以牛RNA作為模板合成的cDNA的PCR反應中,用從所述編碼序列或其片段設計的引物分離變體cDNA。
本發明的另一方面是分離的或純化的bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段。可以如本文所述通過在重組宿主中表達bEGF DNA序列,獲得bEGF蛋白或其片段。
或者,可以通過常規肽合成儀合成生產bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段。所述片段可以作為通過肽合成生產對應全長bEGF蛋白的中間體。
或者,也可以使用從DNA構建物轉錄的mRNA獲得bEGF蛋白或其片段,所述DNA構建物包含與編碼bEGF蛋白或其片段的核酸連接的啟動子。可以在進行體外轉錄反應前線性化所述DNA構建物。然后轉錄的mRNA與合適的無細胞翻譯提取物如兔網織紅細胞提取物溫育,產生bEGF蛋白或其片段。
此外,可以通過生物化學富集或純化程序獲得bEGF多肽或其片段。可以通過蛋白水解消化和/或微測序確定潛在同源多肽或片段的序列。可以使用程序例如2版BLASTP,比較預期同源多肽或片段的序列與推導的bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段。
本發明還涉及bEGF蛋白的變體(包括衍生物或類似物)或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段的變體。所述變體在氨基酸序列上可能由于任何組合的一個或多個取代、添加、缺失、融合和截短而與bEGF蛋白不同。
所述變體可以是天然的或者用定點誘變、隨機化學誘變、外切酶III缺失程序和標準克隆技術在體外產生。或者,可以使用化學合成或修飾程序產生所述變體、片段、類似物或衍生物。
所述bEGF蛋白的變體可以是其中bEGF蛋白的一個或多個氨基酸殘基受到保守或非保守氨基酸殘基(優選保守氨基酸殘基)取代的變體,并且所述受到取代的氨基酸殘基可以是或者不是由遺傳密碼編碼的氨基酸殘基。保守取代涉及用具有相似特征的另一氨基酸取代多肽的中的給定氨基酸,典型的取代如下●用另一脂肪族氨基酸取代脂肪氨基酸例如丙氨酸、纈氨酸、亮氨酸和異亮氨酸;●用蘇氨酸取代絲氨酸,或者相反;●用另一酸性殘基取代酸性殘基如天冬氨酸或谷氨酸;用另一帶有酰胺基團的殘基取代帶有酰胺基團的殘基如天冬酰胺或谷氨酰胺;●用另一堿性殘基取代堿性殘基如賴氨酸或精氨酸;和●用另一芳香族殘基取代芳香族殘基如苯丙氨酸或酪氨酸。
其它變體是那些牛EGF蛋白的一個或多個氨基酸殘基包含取代基基團的變體。
還有其它變體是那些其中在多肽中融合添加的氨基酸,例如前導序列、分泌序列或者便利蛋白純化、富集或穩定的序列。
在一些實施方案中,所述片段、衍生物或類似物包括前體序列,以便可以通過切割所述前體部分產生有活性的肽,激活所述片段、衍生物或類似物。
本發明的另一方面是多肽或其片段,所述多肽或其片段與bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%同源性。
可以使用程序例如2版BLASTP以默認參數確定同源性,所述程序排列對比進行比較的多肽或片段,并確定它們之間同源性的程度。應當知道氨基酸“同源性”包括以前所述的保守氨基酸取代。可以通過使用本文討論的技術分離編碼它們的核酸,獲得與bEGF蛋白或其片段有同源性的多肽或片段。
也可以使用bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段產生特異性結合所述蛋白或片段的抗體。為檢測組織或體液樣品中的EGF,使所述樣品接觸所述抗體,然后或者通過用可檢測熒光標記、酶促標記或放射性同位素標記來標記所述抗體,或者用具有所述標記的第二抗體標記所述抗體,測定所述樣品的結合能力。用于檢測樣品中bEGF的已知測定包括ELISA、夾心法測定、放射免疫測定以及蛋白質印跡。
如下獲得針對bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段的多克隆抗體直接將所述蛋白或片段注射或給予動物。然后使獲得的抗體結合蛋白本身;因此,甚至可以用僅編碼所述蛋白片段的序列產生結合全長天然蛋白的抗體。然后可以使用所述抗體從表達所述蛋白的細胞中分離所述蛋白。
為制備單克隆抗體,可以使用提供通過連續細胞系培養產生抗體的任何方法,例如雜交瘤技術、trioma技術、人B細胞雜交瘤技術以及EBV雜交瘤技術。
因此,一般性針對bEGF蛋白或包含其至少7個、更優選至少10個、更優選至少15個、更優選至少20個、更優選至少25個、更優選至少30個、更優選至少35個、更優選至少40個、更優選至少45個、更優選至少50個、更優選至少51個、最優選至少52個連續氨基酸的片段的抗體可以用于檢測牛組織和體液中的EGF蛋白,以及從其它生物(優選反芻動物)篩選相似蛋白。從牛或其它反芻動物組織或體液提取蛋白后,使蛋白與所述抗體接觸,然后通過以前描述的任何程序檢測那些特異性結合的蛋白。
本發明的bEGF基因可以用于異源雜交以及允許從其它哺乳動物分離EGF編碼基因的PCR實驗。
II.過量表達bEGF蛋白可以將已經特征化的bEGF編碼序列引入多種表達系統以進行工業化生產。重組DNA技術已經便利有效生產肽激素例如EGF。可以使用工業化微生物菌株(例如黑曲霉(Aspergillus niger)、無花果曲霉(Aspergillus ficuum)、盛泡曲霉(Aspergillus awamori)、米曲霉(Aspergillus oryzae)、里氏木霉(Trichoderma reesei)、Mucor miehei、乳酸克魯維酵母(Kluyverromyces lactic)、巴斯德畢赤酵母(Pichiapastoris)、釀酒酵母(Saccharomyces cerevisiae)、大腸桿菌、枯草芽孢桿菌(Bacillus subtilis)或地衣芽孢桿菌(Bacillus licheniformis)或者植物宿主(如雙低油菜(canola)、大豆、玉米、番茄)生產bEGF。所有系統使用相似方法,由此裝配表達構建物以包括目的蛋白編碼序列以及控制序列如啟動子、增強子和終止子,以及需要包括的信號序列和選擇標記。
為獲得bEGF的細胞外表達,本發明的表達構建物利用分泌信號序列,如果希望進行胞質表達,則不需要該序列。啟動子和信號序列在宿主細胞內有功能,并且提供所述編碼序列產物的表達和分泌。包括轉錄終止子以保證有效轉錄。在所述表達構建物中也可以包括增加表達或蛋白純化的輔助序列。
可以在大腸桿菌和巴斯德畢赤酵母中表達牛EGF(實施例6)。如下制備僅包含成熟蛋白編碼序列的DNA片段分別用SEQ ID NO6和12的引物;SEQ ID NO13和14的引物擴增在5kb內含子兩側編碼成熟蛋白的序列,然后用接頭引物(SEQ ID NO15)連接所述兩種產物。將最終產物克隆進大腸桿菌和巴斯德畢赤酵母表達載體。
合適載體應該能夠在宿主細胞中自主復制并接受外源DNA。一個載體攜帶其本身的復制原點、可用于插入外源DNA的一個或多個限制性內切核酸酶單一識別位點,以及常常還有用于表達插入DNA的識別序列(如啟動子)。也可以包括選擇標記,以允許選擇攜帶所需構建物的細菌細胞;例如,合適的原核選擇標記包括那些賦予抗生素(如氨芐青霉素)抗性的選擇標記。可以選擇本領域技術人員已知的任何合適載體,常用載體包括但不限于噬菌體、粘粒、桿狀病毒、反轉錄病毒載體和質粒載體。提供下面質粒載體作為例子pEQ40,或者pET系列的質粒如pET26。然而,可以使用任何質粒載體,只要所述質粒載體在宿主中可復制并且有活力。
一旦已經組裝合適載體,可以利用多種技術將外源DNA引入宿主細胞。可以通過電穿孔將所述載體或表達構建物引入大腸桿菌,以及通過原生質體轉化或電穿孔引入巴斯德畢赤酵母。對于電穿孔,細胞用無菌水洗滌,然后重懸浮于低電導率溶液(如1M山梨糖醇溶液)。對所述細胞懸浮液應用高電壓電擊,在細胞膜上產生瞬時的孔,轉化DNA通過該孔進入細胞。在巴斯德畢赤酵母中,所述表達構建物通過同源重組整合進aox 1(乙醇氧化酶)位點,穩定地維持。通過應用所述表達構建物或載體攜帶的選擇標記鑒定攜帶所述載體或表達構建物的宿主細胞,然后通過雜交、PCR、抗體或其它技術證實目的基因的存在。可以在液體或半固體培養基上,通過例如分批發酵和連續發酵等技術培養轉化的微生物細胞。在針對最大投入產出比(product-to-cost ratio)優化的條件下,繁殖轉化細胞。通過操作培養參數例如溫度、pH、通氣和培養基組成,可以增加產物產量。小心操作和監測重組高表達大腸桿菌細胞的培養條件,可能導致培養物生物量和蛋白產量分別為150g(濕重)細胞/l以及5g不溶蛋白/l。可以使用低濃度蛋白酶抑制劑(如苯甲基磺酰氟或抑胃肽)減少過量表達的蛋白的蛋白水解,或者可以使用蛋白酶缺陷型宿主細胞減少或消除蛋白降解。對于微生物表達,可能也希望生產融合蛋白,以便利純化或保護bEGF免受蛋白水解降解。
發酵后,通過下游工藝例如離心和過濾從培養基中取出微生物細胞。假如所需產物是分泌型的,則可以從營養培養基中提取所需產物。在細胞內生產的情況下,收獲細胞,通過使用機械力、超聲處理、酶、化學試劑和/或高壓破碎細胞,釋放所述產物。在高表達大腸桿菌系統中出現的不溶產物的生產可能便利產物純化。通過離心從破碎的細胞中提取產物包涵體,用含低濃度變性劑(如0.5-6M尿素、0.1-1%SDS或0.5-4.0M胍-HCl)的緩沖液洗滌,除去污染蛋白。洗出的包涵體溶解于含6-8M尿素、1-2%SDS或4-6M胍-HCl的溶液中,然后通過在透析過程中緩慢除去變性劑,復性溶解的產物。
也可以在植物細胞如番茄或甘藍型油菜(Brassica napus)中表達牛EGF。將所述表達構建物插入能夠在根癌農桿菌(A.tumefaciens)中復制的二元載體,并帶動轉移進入植物細胞。將所得的構建物轉化進根癌農桿菌細胞,然后將所述表達構建物通過所述二元載體∷表達構建物的接合帶動轉移(conjugal mobilization)轉移進甘藍型油菜葉細胞。所述表達構建物隨機整合進所述植物細胞基因組。
選擇和篩選后,可以使用已知方法將轉化植物細胞再生成為整株植株,并培育和培養轉基因植物的品種系。通過研磨、勻漿和/或化學處理可以從收獲的部分或整株植株中提取牛EGF。種子特異性親脂性油體蛋白(oleosin)融合物通過將油體蛋白融合蛋白分配到雙低油菜(canola)種子榨出的油部分而與水溶性蛋白分離,從而便利純化(van Rooijen和Moloney,1994)。
如果需要,可以使用沉淀(如硫酸銨沉淀)、色譜(如凝膠過濾、離子交換、親和液體層析)、超濾、電泳、溶劑-溶劑萃取(如丙酮沉淀)或這些方法的組合從微生物、發酵和植物提取物中純化所述產物。
III.bEGF蛋白的活性可以使用例如DNA合成/細胞增殖測定測試所獲得的重組bEGF蛋白的活性,因為EGF是各種類型細胞的有絲分裂原(實施例7)。簡要地說,在24孔板中培養牛成纖維細胞到半匯合,然后在各個孔中加入重組bEGF(各種不同濃度)和人EGF(陽性對照)。加入bEGF后十八小時,在需要摻入所述新合成DNA的每個孔內加入氚化胸苷。八個小時后,收獲細胞,通過酸沉淀分離未摻入和已經摻入的胸苷。通過閃爍計數確定每個部分中放射性的量。與對照細胞相比摻入的氚化胸苷增加,說明重組bEGF刺激成纖維細胞中的DNA合成。使用該測定,還有可能比較人EGF和bEGF刺激牛細胞中DNA合成和增殖的效力。在相似測定中,加入bEGF后十八小時收獲細胞,計數并確定bEGF對于細胞增殖的效應。
IV.bEGF的配制和應用可以在需要bEGF活性的應用中直接使用bEGF蛋白或其功能等價片段、所有或部分轉化微生物培養物和植物、以及從所述培養物或植物獲得的提取物。所述應用包括促進生長、預防或治療腸感染、增加應用吸收、以及加速來成熟腸細胞的發育。
大部分家畜與人類不同,不能通過胎盤吸收免疫球蛋白,而是借助“滲漏的”不成熟的腸細胞結構攝取母體乳汁中的抗體。雖然這種攝取在出生后相當快速地獲得,但用成熟腸細胞取代不成熟腸細胞的時間可能很長;例如,該時間在小豬中為四周,在小牛中可能長達三個月。這個階段可能在畜牧業中產生各種問題,尤其是預防成熟型膳食的應用,使得新生動物依賴于哺乳獲得基本營養。
歸于Wilson等的國際公開第WO 88/04180號提供通過給予家畜EGF來促進消化酶早熟成熟和生長的方法。為增強乳牛或肉牛的生長,所給予的EGF理論上可能來自任何哺乳動物來源。一般相信EGF活性序列在物種之間非常保守。然而,如本發明展示的,bEGF活性序列與所有其它已知的哺乳動物EGF序列顯著不同。因此,為促進乳牛或肉牛的生長,假如使用替代來源的EGF,那么優選使用可能更有效影響牛消化生理并避免不希望的副效應的bEGF。也可以使用牛EGF促進其它家畜物種的生長,所述家畜物種優選反芻動物例如山羊和綿羊。
EGF可能參與調節營養攝入;例如,在嚙齒動物體內,EGF增加跨過空腸刷狀緣膜的電解質、葡萄糖和脯氨酸轉運。因此,本發明的bEGF也可使用比以前所述改變腸細胞結構所需時間更長的時期。應對bEGF在營養攝入上的潛在增加將會增加飼料效率并增強生長。
年幼動物的腸細胞必須保持在未成熟狀態足夠長的時間以允許轉移獲得母體免疫。因此,如果所需效應是加速所述腸細胞結構成熟,那么當小牛兩日齡、三日齡或四日齡時可以開始給予bEGF,持續僅兩到四天;或者如果所需效應是利用bEGF介導的營養攝取增加,則給予bEGF可以持續更長時間,例如四到六周。可能必須通過實驗確定在小牛體內獲得最佳效應給予bEGF的最佳時間。可以以幾種方法給予牛EGF,即通過如歸于Wilson等的國際
發明者S·比洛多-格西爾斯, S·J·約翰, L·B·西林格爾, B·F·本克爾, S 比洛多-格西爾斯, 本克爾, 約翰, 西林格爾 申請人:加拿大農業及農業食品部