專利名稱::體內摻入非天然氨基酸的正交翻譯組分的制作方法
技術領域:
:本發明屬于翻譯生物化學領域。本發明涉及利用正交(orthogonal)tRNA、正交氨酰-tRNA合成酶及正交tRNA/正交氨酰-tRNA合成酶對將非天然氨基酸摻入蛋白質的組合物和方法。本發明還涉及用這種對在細胞內產生蛋白質的方法以及用這種方法產生的蛋白質。
背景技術:
:在歷史上,對蛋白質結構和功能的研究依賴于利用天然氨基酸反應活性基團的特性和可得到的反應化學物質。不幸的是,從細菌到人類,每種已知生物(的蛋白質)都是由相同的二十種常見氨基酸編碼的(罕見的例外是硒代半胱氨酸(參見,例如,A.Bock等,(1991),MolecularMicrobiology5515-20)和吡咯賴氨酸(參見,例如,G.Srinivasan等,(2002),Science2961459-62)。R-基團的這種有限選擇性限制了對蛋白質結構和功能的研究,所述研究經天然氨基酸的化學特性證實,例如,用天然氨基酸制備高度靶向(某氨基酸)的蛋白質修飾而不靶向蛋白質中所有其它氨基酸的能力有限。此外,天然氨基酸的功能活性,如熒光、金屬螯合、氧化還原電勢、光囚禁(photocaging)等能力也有限。本領域目前使用的用于選擇性修飾蛋白質的修飾反應大多數涉及在親核和親電子反應伴侶之間形成靶向蛋白質氨基酸側鏈中天然發生的親核殘基的共價鍵,例如,α-鹵代酮與組氨酸或半胱氨酸側鏈的反應。這些情況下中的選擇性由蛋白質中親核殘基的數目和可達性決定。不幸的是,天然發生的蛋白質通常含有弱定位的(例如,不可接觸的)反應位點或多個反應靶點(例如,賴氨酸、組氨酸和半胱氨酸殘基),這導致修飾反應的選擇性弱、難以通過親核/親電子試劑制造高度尋靶的蛋白質修飾。此外,修飾位點通常限于賴氨酸、組氨酸或半胱氨酸天然發生的親核側鏈。其它位點的修飾是困難的或不可能的。本領域需要的是將非天然氨基酸摻入蛋白質以便修飾和研究蛋白質結構和功能的新的策略,其中所述非天然氨基酸具有未在天然發生的氨基酸中發現的新的特性,例如,生物特性。這的確是本領域的需要,以便產生以高度選擇性方式修飾蛋白質以及在生理條件下修飾蛋白質的蛋白質修飾反應的新的策略。本領域需要的是產生蛋白質修飾的新方法,其中所述修飾是高度特異的,例如,不使天然發生的氨基酸發生交叉反應或副反應的修飾。高度特異的蛋白質修飾策略的新化學可廣泛用于研究蛋白質的結構和功能。克服這些限制的一個策略是擴展遺傳密碼并加入相比生物所有組成成分(repertoire)具有不同物理、化學或生物特性的氨基酸。這種方法已被證實是可行的,可利用宿主細胞如真細菌大腸埃希氏菌(大腸桿菌)、酵母或哺乳動物細胞的體內蛋白質生物合成機制通過正交tRNA和相應的新正交氨酰-tRNA合成酶將非天然氨基酸加入蛋白質。這種方法描述于各種資料,例如,Wang等,(2001),Science292498-500;Chin等,(2002)JournaloftheAmericanChemicalSociety1249026-9027;Chin和Schultz,(2002),ChemBioChem111135-1137;Chin等,(2002),PNASUnitedStatesofAmerica9911020-11024;和Wang和Schultz,(2002),Chem.Comm.,1-10。也可參見題為“產生正交tRNA-氨酰-tRNA合成酶對的方法和組合物(METHODSANDCOMPOSITIONSFORTHEPRODUCTIONOFORTHOGONALTRNA-AMINOACYLTRNASYNTHETASEPARIS)”的國際公開WO2002/086075;題為“非天然氨基酸的體內摻入(INVIVOINCORPORATIONOFUNNATURALAMINOACIDS)”的WO2002/085923;題為“真核遺傳密碼的擴展(EXPANDINGTHEEUKARYOTICGENETICCODE)”的WO2004/094593;2004年7月7日提交的WO2005/019415;2004年7月7日提交的WO2005/007870;和2004年7月7日提交的WO2005/007624。本領域的確需要開發將非天然氨基酸摻入蛋白質的正交翻譯組分,其中所述非天然氨基酸能被摻入規定位置,且其中所述非天然氨基酸賦予摻入它們的蛋白質新的生物特性。還需要開發摻入非天然氨基酸的正交翻譯組分,所述非天然氨基酸具有能使該氨基酸成為特定修飾的靶以排除與蛋白質中其它位點的交叉反應或副反應的新化學特性。還特別需要能夠產生含有顯著量非天然氨基酸的蛋白質的蛋白質表達系統,所述含量能使該蛋白質用于治療用途和生物醫學研究。這里描述的本發明滿足了這些需要以及其它需要,通過以下描述這是顯而易見的。發明概述本發明提供了在體內(例如在宿主細胞內)響應選擇者密碼子(selectorcodon)如琥珀密碼子將非天然氨基酸摻入產生的多肽鏈的組合物和方法。這些組合物包含不與宿主細胞翻譯機制相互作用的正交-tRNA(O-tRNA)和正交氨酰-tRNA合成酶(O-RS)對。這就是說,宿主細胞內源性氨酰-tRNA合成酶不會將任何氨基酸(天然或非天然)加入到O-tRNA中。類似地,本發明提供的O-RS不以顯著水平或者某些情況下是可檢測水平用氨基酸(天然或非天然)加載任何內源性tRNA。這些新的組合物能夠產生大量含有翻譯摻入的非天然氨基酸的蛋白質。根據所摻入非天然氨基酸的化學特性,這些蛋白質具有廣泛用途,包括例如用于治療或生物醫學研究。一些方面,本發明提供了一種翻譯系統。這些系統包含第一正交氨酰-tRNA合成酶(O-RS)、第一正交tRNA(O-tRNA)和非天然氨基酸,其中所述第一O-RS用第一非天然氨基酸優先氨酰化第一O-tRNA。第一非天然氨基酸可選自p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素-丙氨酸、7-羥基-香豆素-丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸或p-異丙基硫代羰基-L-苯丙氨酸。該翻譯系統可采用衍生自各種來源的組分。一實施方案中,第一O-RS衍生自詹氏甲烷球菌(Methanococcusjannaschii)氨酰-tRNA合成酶,例如,野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。在其它實施方案中,O-RS衍生自大腸桿菌氨酰-tRNA合成酶,例如,野生型大腸桿菌亮氨酰-tRNA合成酶。用于該系統的O-RS包含選自以下的氨基酸序列SEQIDNO12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-54、57、59-63以及那些序列的保守變體。一些實施方案中,O-tRNA是琥珀抑制基因tRNA。一些實施方案中,O-tRNA包含SEQIDNO1或2或由其編碼。一些方面,翻譯系統還包含編碼感興趣蛋白質的核酸,其中所述核酸包含至少一種被所述O-tRNA識別的選擇者密碼子。一些方面,翻譯系統包含利用第二非天然氨基酸的第二正交對(即第二O-RS和第二O-tRNA),從而該系統現在能夠在多肽的不同選定位置摻入至少兩個不同的非天然氨基酸。在這種雙重系統中,第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且第二O-tRNA識別不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。一些實施方案中,翻譯系統位于宿主細胞中(并包括宿主細胞)。對所用宿主細胞沒有特別限制,只要O-RS和O-tRNA在它們的宿主細胞環境中保留它們的正交性即可。所述宿主細胞可以是真細菌細胞如大腸桿菌,或酵母細胞如釀酒酵母(Saccharomycescerevisiae)。所述宿主細胞可含有一種或多種編碼包括O-RS或O-tRNA在內的該翻譯系統組分的多核苷酸。一些實施方案中,編碼O-RS的多核苷酸包含SEQIDNO13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51、56或58的核苷酸序列。本發明還提供了產生在所選位置上含有一個或多個非天然氨基酸的蛋白質的方法。這些方法利用上述翻譯系統。通常,這些方法開始于提供翻譯系統的步驟,所述翻譯系統包含(i)選自以下的第一非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素-丙氨酸、7-羥基-香豆素-丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸和p-異丙基硫代羰基-L-苯丙氨酸;(ii)第一正交氨酰-tRNA合成酶(O-RS);(iii)第一正交tRNA(O-tRNA),其中所述O-RS用非天然氨基酸優先氨酰化O-tRNA;和(iv)編碼所述蛋白質的核酸,其中所述核酸包含至少一種被所述第一O-tRNA識別的選擇者密碼子。該方法然后在所述蛋白質的翻譯過程中響應所述選擇者密碼子將所述非天然氨基酸摻入所述蛋白質的所述所選位置,從而產生在所選位置含有所述非天然氨基酸的所述蛋白質。該方法可用各種試劑和步驟廣泛采用。一些實施方案中,提供了編碼O-RS的多核苷酸。一些實施方案中,提供了衍生自詹氏甲烷球菌氨酰-tRNA合成酶的O-RS,例如可提供野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。在其它實施方案中,提供了衍生自大腸桿菌氨酰-tRNA合成酶的O-RS,例如可提供衍生自野生型大腸桿菌亮氨酰-tRNA合成酶的O-RS。一些實施方案中,提供步驟包括提供含有以下氨基酸序列的O-RSSEQIDNO12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57、59-63所示氨基酸序列及其保守變體。在這些方法的一些實施方案中,提供翻譯系統的步驟包括通過定點誘變突變野生型氨酰-tRNA合成酶的氨基酸結合口袋,并選擇用所述非天然氨基酸優先氨酰化所述O-tRNA的所得O-RS。所述選擇步驟包括在定點誘變之后從含有許多所得氨酰-tRNA合成酶分子的集合中對所述O-RS進行陽性選擇和陰性選擇。一些實施方案中,提供步驟提供編碼O-tRNA的多核苷酸,例如,O-tRNA是琥珀抑制基因tRNA,或者O-tRNA包含SEQIDNO1或2所示多核苷酸序列或由其編碼。在這些方法中,提供步驟還包括提供含有被翻譯系統利用的琥珀選擇者密碼子的核酸。還可修飾這些方法以在蛋白質中摻入一個以上非天然氨基酸。在那些方法中,與第一翻譯系統結合使用第二正交翻譯系統,其中的第二系統具有不同的氨基酸和選擇者密碼子特異性。例如,提供步驟可包括提供第二O-RS和第二O-tRNA,其中的第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且其中的第二O-tRNA識別核酸中不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。產生具有非天然氨基酸的蛋白質的方法還可在宿主細胞內進行。此時需提供宿主細胞,其中的宿主細胞含有非天然氨基酸、O-RS、O-tRNA和核酸,且其中所述培養所述宿主細胞導致非天然氨基酸的摻入。一些實施方案中,提供步驟包括提供真細菌宿主細胞(例如,大腸桿菌)或酵母宿主細胞。一些實施方案中,提供步驟包括提供含有編碼O-RS的多核苷酸的宿主細胞。例如,編碼O-RS的多核苷酸可包含SEQIDNO13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51、56或58所示的核苷酸序列。一些實施方案中,提供翻譯系統的步驟通過提供細胞提取物完成。一些方面,本發明提供了翻譯系統,該系統用于摻入3-硝基-L-酪氨酸或p-硝基-L-苯丙氨酸。這些系統包含第一正交氨酰-tRNA合成酶(O-RS)、第一正交tRNA(O-tRNA)和非天然氨基酸,其中的第一O-RS用第一非天然氨基酸優先氨酰化第一O-tRNA,其效率至少為含有所述第一非天然氨基酸、所述第一O-tRNA和含有選自SEQIDNO7-10的氨基酸序列的O-RS的翻譯系統效率的50%。該翻譯系統可使用衍生自各種來源的組分。一些實施方案中,第一O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶,例如,野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。用于該系統的O-RS可包含選自SEQIDNO7-10所示氨基酸序列及其保守變體的氨基酸序列。一些實施方案中,O-tRNA是琥珀抑制基因tRNA。一些實施方案中,O-tRNA包含SEQIDNO1所示多核苷酸序列或由其編碼。一些方面,翻譯系統還包含編碼感興趣蛋白質的核酸,其中所述核酸具有至少一個被O-tRNA識別的選擇者密碼子。一些方面,翻譯系統包含利用第二非天然氨基酸的第二正交對(即第二O-RS和第二O-tRNA),從而該系統現在能夠在多肽的不同選定位置摻入至少兩個不同的非天然氨基酸。在這種雙重系統中,第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且第二O-tRNA識別不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。一些實施方案中,翻譯系統位于宿主細胞中(并包括宿主細胞)。對所用宿主細胞沒有特別限制,只要O-RS和O-tRNA在它們的宿主細胞環境中保留它們的正交性即可。所述宿主細胞可以是真細菌細胞如大腸桿菌。所述宿主細胞可含有一種或多種編碼包括O-RS或O-tRNA在內的該翻譯系統組分的多核苷酸。一些實施方案中,編碼O-RS的多核苷酸包含SEQIDNO11的核苷酸序列。本發明還提供了產生在所選位置上含有一個或多個非天然氨基酸的蛋白質的方法。這些方法利用上述翻譯系統。通常,這些方法開始于提供含有翻譯系統的宿主細胞的步驟,所述翻譯系統包含(i)第一非天然氨基酸,其為3-硝基-L-酪氨酸或p-硝基-L-苯丙氨酸;(ii)第一正交氨酰-tRNA合成酶(O-RS);(iii)第一正交tRNA(O-tRNA),其中的O-RS用非天然氨基酸優先氨酰化O-tRNA,其效率至少為含有所述非天然氨基酸、O-tRNA和含有選自SEQIDNO7-10的氨基酸序列的O-RS的宿主細胞效率的50%;和(iv)編碼蛋白質的核酸,其中所述核酸含有至少一種被O-tRNA識別的選擇者密碼子。然后使宿主細胞生長,并在所述蛋白質的翻譯過程中響應選擇者密碼子將所述非天然氨基酸摻入所述蛋白質的所選位置,其中,所述蛋白質中的所選位置對應于所述核酸中所述選擇者密碼子的位置,從而產生在所選位置含有所述非天然氨基酸的所述蛋白質。這些方法可用各種試劑和步驟廣泛采用。一些實施方案中,提供了編碼O-RS的多核苷酸。一些實施方案中,提供了衍生自詹氏甲烷球菌氨酰-tRNA合成酶的O-RS,例如可提供野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。一些實施方案中,提供步驟包括提供含有選自SEQIDNO7-10及其保守變體的氨基酸序列的O-RS。在這些方法的一些實施方案中,提供翻譯系統的步驟包括通過定點誘變突變野生型氨酰-tRNA合成酶的氨基酸結合口袋,并選擇用所述非天然氨基酸優先氨酰化所述O-tRNA的所得O-RS。所述選擇步驟包括在定點誘變之后從含有許多所得氨酰-tRNA合成酶分子的集合中對所述O-RS進行陽性選擇和陰性選擇。一些實施方案中,提供步驟提供編碼O-tRNA的多核苷酸,例如,O-tRNA是琥珀抑制基因tRNA,或者O-tRNA包含SEQIDNO1所示多核苷酸序列或由其編碼。在這些方法中,提供步驟還包括提供含有被翻譯系統利用的琥珀選擇者密碼子的核酸。還可修飾這些方法以在蛋白質中摻入一個以上非天然氨基酸。在那些方法中,與第一翻譯系統結合使用第二正交翻譯系統,其中的第二系統具有不同的氨基酸和選擇者密碼子特異性。例如,提供步驟可包括提供第二O-RS和第二O-tRNA,其中的第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且其中的第二O-tRNA識別核酸中不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。產生具有非天然氨基酸的蛋白質的方法還可在宿主細胞內進行。在這些實施方案中,宿主細胞含有非天然氨基酸、O-RS、O-tRNA和核酸,且其中所述培養所述宿主細胞導致非天然氨基酸的摻入。一些實施方案中,提供步驟包括提供真細菌宿主細胞(例如,大腸桿菌)或酵母宿主細胞。一些實施方案中,提供步驟包括提供含有編碼O-RS的多核苷酸的宿主細胞。例如,編碼O-RS的多核苷酸可包含SEQIDNO11所示的核苷酸序列。一些實施方案中,提供翻譯系統的步驟通過提供細胞提取物完成。本發明還提供了各種包含核酸和蛋白質的組合物。對該組合物的性質沒有特別限制,只要該組合物含有規定的核酸或蛋白質。本發明的組合物可含有任何數量任何性質的額外組分。例如,本發明提供了含有O-RS多肽的組合物,其中所述多肽含有SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57、59-63或其保守變體,其中的保守變體多肽用非天然氨基酸氨酰化同源正交tRNA(O-tRNA),其效率至少為含有O-tRNA、非天然氨基酸和含有選自SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-54、57或59-63的氨基酸序列的氨酰-tRNA合成酶的翻譯系統效率的50%。本發明還提供了編碼上述任何多肽的多核苷酸。一些實施方案中,這些多核苷酸可含有SEQIDNO11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51、56和58。一些實施方案中,多肽在細胞中。本發明還提供了含有SEQIDNO11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51、56或58所示核苷酸序列的多核苷酸組合物。一些實施方案中,本發明提供了含有所述多核苷酸的載體,如表達載體。一些實施方案中,本發明提供了含有上述載體的細胞。定義在詳細描述本發明前,需要說明本發明并不局限于某些特定的生物系統,本發明可以有各種變化。還應當說明本文所用的術語是為了描述特定的實施方案,并不意味著對本發明的限制。如本發明的說明書和附屬權利要求中使用,除非特別指明,單數形式“一個”、“一種”和“這種”也包括復數。因此,例如,“一個細胞”包括兩個或多個細胞;“一種多核苷酸”作為一種特定物質包括該多核苷酸的多個拷貝。除了在此處和說明書的其余部分所定義的,本文所用的所有科技術語都與本發明所屬領域普通技術人員共同理解的意義相同。正交本文所用的術語“正交”指一種分子(如正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))具有某細胞內源性組分的功能,但與該細胞或翻譯系統內的相應內源性分子相比其效力低,或者不具有該細胞內源性組分的功能。就tRNA和氨酰-tRNA合成酶而言,正交是指正交的tRNA或正交的氨酰tRNA合成酶具有內源性tRNA或內源性tRNA合成酶的功能,但與內源性tRNA或內源性tRNA合成酶相比無能或效力低,如低于20%、10%、5%或1%。該正交分子缺乏細胞內內源性互補分子的正常功能。例如,與內源性tRNA被內源性RS氨酰化相比,細胞內的正交tRNA被細胞的內源性RS氨酰化時其效率降低,甚至為零。在另外一個實施例中,與內源性的RS氨酰化內源性tRNA相比,正交的RS在感興趣細胞內氨酰化任何內源性tRNA時其效率降低,或者甚至為零。第二正交分子可以被引入到細胞內和第一正交分子一起發揮功能。例如,正交tRNA/RS對包括引入的互補組分,在細胞內一起行使功能時其效率與對照,如相應的內源性tRNA/RS對或活性正交對(如酪氨酰正交tRNA/RS對)相比可以達到45%、50%、60%、70%、75%、80%、90%、95%、99%或更高。正交酪氨酰-tRNA本文所用的術語正交酪氨酰-tRNA(酪氨酰-O-tRNA)是與感興趣翻譯系統正交的tRNA,該tRNA(1)與天然產生的酪氨酰tRNA相同或基本類似,(2)衍生自天然酪氨酰tRNA的天然突變或人工誘變,(3)由考慮到(1)或(2)的野生型或突變型酪氨酰tRNA序列的方法所產生,(4)與野生型或突變型亮氨酰或酪氨酰tRNA同源,(5)與表5中所列稱為亮氨酰或酪氨酰tRNA合成酶底物的典型tRNA同源,或(6)是表5中稱為亮氨酰或酪氨酰tRNA合成酶底物的典型tRNA的保守變體。亮氨酰或酪氨酰tRNA可以負載一個氨基酸,或非負載狀態。還需要說明“酪氨酰-O-tRNA”或“亮氨酰-O-tRNA”可任選經相關合成酶加載(氨酰化)除賴氨酸或亮氨酸以外的氨基酸,如非天然氨基酸。應理解本發明的亮氨酰或酪氨酰-O-tRNA確實可優選用于在翻譯時響應選擇者密碼子將任何必需的氨基酸,無論是天然的或是人工合成的,插入到正在延伸的多肽內。正交酪氨酰氨基酸合成酶本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是一種可以在感興趣翻譯系統內用氨基酸優先氨酰化酪氨酰-O-tRNA的合成酶。被酪氨酰-O-RS加載到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸,無論是天然的還是人工合成的,不限于本文所述的。該合成酶還任選可以與天然的酪氨酰氨基酸合成酶相同或同源,或者與表5中稱為酪氨酰-O-RS的合成酶相同或同源。例如,酪氨酰-O-RS可以是表5所列的酪氨酰-O-RS的保守變體,和/或與表5所列的酪氨酰-O-RS的序列至少有50%、60%、70%、80%、90%、95%、98%、99%或更高的相同性。類似地,正交亮氨酰氨基酸合成酶(亮氨酰-O-RS)是一種在感興趣翻譯系統內能用氨基酸優先氨酰化亮氨酰-O-tRNA的酶。被亮氨酰-O-RS加載到亮氨酰-O-tRNA上的氨基酸可以是任何氨基酸,無論是天然的還是人工合成的,不限于本文所述的。該合成酶還任選可以與天然的亮氨酰氨基酸合成酶相同或同源,或者與表5中稱為亮氨酰-O-RS的合成酶相同或同源。例如,該O-RS可以是表5所列的亮氨酰-O-RS的保守變體,和/或與表5所列的O-RS的序列至少有50%、60%、70%、80%、90%、95%、98%、99%或更高的相同性。同源(cognate)術語“同源”指能一起發揮功能的組分,如正交tRNA和正交氨酰-tRNA合成酶。此種組分也稱為互補組分。優先氨酰化在這里涉及正交翻譯系統,當O-RS用氨基酸加載O-tRNA的效率比其加載表達系統中其它任何內源性tRNA的效率都高時O-RS“優先氨酰化”同源O-tRNA。也就是說,當O-tRNA和其它任何給定的內源性tRNA以大致相同摩爾比例同時存在于翻譯系統內時,O-RS加載O-tRNA的頻率要高于其加載內源性tRNA的頻率。優選的是當O-tRNA和內源性tRNA以相同摩爾濃度存在于翻譯系統內時,被O-RS所加載的O-tRNA與O-RS所加載的內源性tRNA的相對比例較高,其結果導致O-RS只加載、或者幾乎只加載O-tRNA。當O-tRNA和O-RS以相同摩爾濃度存在時,被O-RS加載的O-tRNA和內源性tRNA之間的相對比例大于1∶1,優選至少約為2∶1,更優選的是5∶1,甚至10∶1、20∶1、50∶1、75∶1、95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。下述情況下所述O-RS“用非天然氨基酸優先氨酰化O-tRNA”(a)與內源性tRNA相比,O-RS更容易氨酰化O-tRNA,以及(b)與O-RS用任何天然氨基酸氨酰化O-tRNA相比,其中的氨酰化是非天然氨基酸特異性的。也就是說,當非天然氨基酸和天然氨基酸以等摩爾的量存在于含O-RS和O-tRNA的翻譯系統中時,O-RS用非天然氨基酸加載O-tRNA的頻率要高于用天然氨基酸加載O-tRNA的頻率。優選的是非天然氨基酸加載的O-tRNA與天然氨基酸加載的O-tRNA之間的相對比例較高。更優選的是O-RS只用或者幾乎只用非天然氨基酸加載O-tRNA。當非天然氨基酸和天然氨基酸以等摩爾的濃度存在于翻譯系統中時,非天然氨基酸加載的O-tRNA與天然氨基酸加載的O-tRNA之間的相對比例高于1∶1,優選至少約為2∶1,更優選的是5∶1,甚至10∶1、20∶1、50∶1、75∶1、95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。選擇者密碼子術語“選擇者密碼子”指在翻譯過程中能被O-tRNA識別但通常不被內源性tRNA識別的密碼子。O-tRNA反密碼子環能識別mRNA上的選擇者密碼子并能在多肽的該位點摻入此氨基酸,例如非天然氨基酸。選擇者密碼子包括無義密碼子,如終止密碼子,例如琥珀密碼子、赭石密碼子和乳白密碼子;四堿基或多堿基密碼子;稀有密碼子;天然或非天然堿基對產生的密碼子等。抑制基因tRNA抑制基因tRNA是一種可在給定的翻譯系統內改變信使RNA(mRNA)的閱讀的tRNA,例如通過將氨基酸摻入到多肽鏈內以響應選擇者密碼子的機制。例如,抑制基因tRNA可通讀終止密碼子(例如,琥珀、赭石或乳白密碼子)、四堿基密碼子、稀有密碼子等。抑制活性如本文采用的,術語“抑制活性”通常指tRNA(如抑制基因tRNA)翻譯閱讀通過某密碼子(如為琥珀密碼子或四堿基或多堿基密碼子的選擇者密碼子)的能力,否則導致翻譯終止或錯譯(如移碼)。抑制基因tRNA的抑制活性可以表示為與第二抑制基因tRNA或與對照系統如缺乏O-RS的對照系統相比所觀察到的翻譯讀通活性的百分數。本發明提供了定量測定抑制活性的各種方法。特定O-tRNA和ORS對感興趣的選擇者密碼子(如琥珀密碼子)的抑制百分率指,與陽性對照構建物相比,位于編碼某表達檢測標記的核酸中的該給定表達檢測標記(如LacZ),包括選擇者密碼子,在感興趣翻譯系統內的活性百分數,其中的感興趣的翻譯系統含有O-RS和O-tRNA,而陽性對照不含O-tRNA、O-RS和選擇者密碼子。因此,如果某缺乏選擇者密碼子的活性陽性對照標記構建物在一個給定翻譯系統內的活性是X,那么含有選擇者密碼子的被檢測構建物的抑制百分率為被檢測構建物在與陽性對照標記基本相同的表達環境條件下所顯示的X的百分比,其中該被檢測標記構建物所表達的翻譯系統也含有O-tRNA和O-RS。一般來說,表達被檢測標記的翻譯系統還包含能被O-RS和O-tRNA識別的氨基酸。任選地,抑制百分率的測定可以通過將該被檢測標記與“背景”或“陰性”對照標記構建物比較而精細確定,后者含有與被檢測標記相同的選擇者密碼子,但是該系統中不包含O-tRNA、O-RS和/或能被O-tRNA和/或O-RS識別的相關氨基酸。這種陰性對照可用于對該標記在感興趣翻譯系統中所產生的背景信號進行處理使抑制百分率測定標準化。抑制效率可通過本領域熟知的多種方法測定。例如,可利用β半乳糖苷酶報告分子試驗,如將衍生的lacZ質粒(該構建物在lacZ核酸序列中含有選擇者密碼子)和含有本發明的O-tRNA的質粒一起導入到合適生物(如可利用此正交組分的生物)的細胞內。也可導入相關合成酶(或者以多肽或編碼相關合成酶的多核苷酸形式)。將這些細胞在培養基內培養到所需的密度,如OD600達到約0.5時,采用BetaFluorTMβ-半乳糖苷酶檢測試劑盒(Novagen)進行β半乳糖苷酶試驗。抑制百分率可以計算為樣品相對于可比較對照,如衍生的lacZ構建物所顯示的活性的百分比,其中所述構建物在所需位置上含有相應的有義密碼子而不是選擇者密碼子。翻譯系統術語“翻譯系統”指可以將氨基酸摻入到正在延伸的多肽鏈(蛋白)中的各組分。翻譯系統的各組分包括核糖體、tRNA、合成酶、mRNA等。本發明的O-tRNA和/或O-RS也可以加入到體外或體內的翻譯系統中,或者作為翻譯系統的一部分,如非真核細胞如細菌(如大腸桿菌)或真核細胞如酵母細胞、哺乳動物細胞、植物細胞、藻類細胞、真菌細胞、昆蟲細胞等的翻譯系統。非天然氨基酸本文所用術語“非天然氨基酸”指20個常見天然氨基酸或硒代半胱氨酸或吡咯賴氨酸之外的任何氨基酸、修飾的氨基酸和/或氨基酸類似物,如圖1提供的17種非天然氨基酸。衍生自本文所用術語“衍生自”指從特定分子或生物、或者根據該特定分子或生物的信息分離的組分,或者利用該特定分子或生物的信息制備的組分。例如,衍生自第二多肽的多肽可包含與第二多肽的氨基酸序列相同或基本相同的氨基酸序列。對多肽而言,可通過例如天然發生的誘變、人工定點誘變或人工隨機誘變獲得衍生的種類。用來衍生多肽的誘變可以是故意定點的或是故意隨機的,或是這兩者的混合。誘變多肽以形成衍生自第一多肽的不同多肽可以是隨機事件(例如,由聚合酶失真(infidelity)造成),而衍生的多肽的鑒定可通過例如這里所述的合適的篩選方法完成。多肽的誘變通常需要操作編碼多肽的多核苷酸。陽性選擇或篩選標記本文所用的術語“陽性選擇或篩選標記”指可通過其存在(例如表達、活化等)來鑒定含有該性狀的細胞的標記,例如具有該陽性選擇標記的細胞與不具有此性狀的細胞相比較。陰性選擇或篩選標記本文所用的術語“陰性選擇或篩選標記”指可通過其存在(如表達、活化等)來鑒定不含有所選特性或性狀的細胞(如,與具有該特性或性狀的細胞相比較)。報告分子本文所用的術語“報告分子”是指可用于鑒定和/或篩選感興趣系統內靶組分的組分。例如,報告分子可以包括蛋白質,如能賦予抗生素抗性或敏感性的酶(如β-內酰胺酶、氯霉素乙酰轉移酶(CAT)等)、熒光選擇標記(如綠色熒光蛋白(如GFP)、YFP、EGFP、RFP等)、發光標記(如螢火蟲熒光素酶蛋白)、親和力篩選標記,或者陽性或陰性選擇標記基因如lacZ、β-gal/lacZ(β-半乳糖苷酶)、Adh(乙醇脫氫酶)、his3、ura3、leu2、lys2等。真核生物本文所用的術語“真核生物”指屬于真核生物界的生物。真核生物與原核生物的區別總體上在于它們通常是多細胞生物(但不排除單細胞生物,如酵母),存在膜包裹的核及其它膜包裹的細胞器,線形遺傳物質(即線形染色體),無操縱子,存在內含子、加帽信使(messagecapping)和poly-AmRNA,以及其它生化特征,如可鑒別的核糖體結構。真核生物包括,例如,動物(如哺乳動物、昆蟲、爬行動物、鳥類等)、纖毛蟲、植物(如單子葉植物、雙子葉植物、藻類等)、真菌、酵母、鞭毛蟲、微孢子蟲、原生生物等。原核生物本文所用的術語“原核生物”指屬于單蟲無核原生動物(也稱為Procarya)界的生物。原核生物與真核生物的區別通常在于,它們是單細胞生物,通過出芽或分裂進行無性生殖,缺乏膜包裹的核或其它膜包裹的細胞器,環形染色體,存在操縱子,無內含子、加帽信使和poly-AmRNA,以及其它生化特征,如可鑒別的核糖體結構。Prokarya包括真細菌和古菌(有時也稱為“古細菌”)亞界。藍細菌(藍綠藻)和支原體有時是單蟲無核原生動物界下的單獨類型。細菌本文所用的術語“細菌”和“真細菌”指不同于古菌的原核生物。類似地,古菌指不同于真細菌的原核生物。可通過許多形態學標準和生化標準區分真細菌和古菌。例如,以下差異可用來將生物歸為真細菌或古菌核糖體RNA序列、RNA聚合酶結構、存在或不存在內含子、抗生素敏感性、存在或不存在細胞壁肽聚糖和其它細胞壁組分、膜脂為分支或不分支的結構、以及存在/不存在組蛋白和組蛋白樣蛋白質真細菌的例子包括大腸埃希氏菌(Escherichiacoli)、嗜熱棲熱菌(Thermusthermophilus)和嗜熱脂肪芽胞桿菌(Bacillusstearothermophilus)。古菌的例子包括詹氏甲烷球菌(Methanococcusjannaschii)(Mj)、馬氏微球菌(Methanosarcinamazei)(Mm)、熱自養甲烷球菌(Methanobacteriumthermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcusmaripaludis)、坎氏甲烷嗜熱菌(Methanopyruskandleri)、鹽桿菌屬如沃氏鹽桿菌(Haloferaxvolcanii)和嗜鹽菌NRC-1(HalobacteriumspeciesNRC-1)、閃爍古生球菌(Archaeoglobusfulgidus)(Af)、激烈火球菌(Pyrococcusfurious)(Pf)、超嗜熱古菌(Ph)、超耐高溫熱棒菌(pyrobaculumaerophilum)、火球菌(Pyrococcusabyssi)、硫磺礦硫化葉菌(Sulfolobussolftaricus)(Ss)、硫化葉菌(Sulfolobustokodaii)、Aeuropyrumpernix(Ap)、噬酸熱原體(Thermoplasmaacidophilum)和火山熱原體(Thermoplasmavolcanium)。保守變體本文所用術語“保守變體”就翻譯組分而言指一種翻譯組分,如保守變體O-tRNA或保守變體O-RS,其功能與基礎組分O-tRNA或O-RS相似,但在序列上與參照O-tRNA或O-RS相比有所不同。例如,O-RS或保守變體O-RS可用非天然氨基酸如含有N-乙酰半乳糖胺部分的氨基酸氨酰化同源O-tRNA。在該例子中,所述O-RS及保守變體O-RS不具有相同的氨基酸序列。所述保守變體可具有,例如,一個、兩個、三個、四個、五個或更多變異,只要保守變體與相應的O-tRNA或O-RS互補。一些實施方案中,保守變體O-RS相比衍生出它的O-RS含有一個或多個保守性氨基酸取代。一些實施方案中,保守變體O-RS相比衍生出它的O-RS含有一個或多個保守性氨基酸取代,此外還保留了O-RS的生物學活性;例如,保守變體O-RS保留了衍生出它的親本O-RS分子至少10%,或者至少20%,至少30%,或至少40%的生物學活性。在一些優選的實施方案中,所述保守變體O-RS保留了衍生出它的親本O-RS分子至少50%的生物學活性。保守變體O-RS的保守性氨基酸取代可出現在該O-RS的任何結構域內,包括氨基酸結合口袋。選擇或篩選試劑本文所用的術語“選擇或篩選試劑”指可利用其存在從一群組分中選擇或篩選某些特定組分的試劑。例如,選擇或篩選試劑可包括但不限于營養素、抗生素、光的波長、抗體、表達的多核苷酸等。選擇試劑可以使用不同的濃度、強度等。響應本文所用的術語“響應”指本發明的tRNA識別選擇者密碼子并介導將結合于tRNA的非天然氨基酸摻入正在生長的多肽鏈的過程。編碼本文所用的術語“編碼”指利用多聚大分子或序列符號串上的信息指導產生第二分子或序列符號串的過程,所述第二分子或序列符號串與第一分子或序列符號串不同。如本文所述,該術語的使用范圍很寬,可用于許多方面。一方面,術語“編碼”描述DNA的半保守性復制過程,其中雙鏈DNA分子的一條鏈作為DNA依賴的DNA聚合酶的模板編碼出新合成的一條互補姊妹鏈。另一方面,術語“編碼”指利用一個分子中的信息指導產生化學性質與第一分子不同的第二分子的過程。例如,DNA分子可編碼RNA分子(如通過DNA依賴的RNA聚合酶參與的轉錄過程)。另外,RNA分子也可以編碼多肽,例如在翻譯過程中。當該術語用于描述翻譯過程時,該術語也可以擴展到編碼氨基酸的三聯密碼子。在某些方面,RNA分子也可編碼DNA分子,例如通過RNA依賴的DNA聚合酶參與的反轉錄過程。在另一個方面,DNA分子可編碼多肽,應當理解的是,在這種情況下,術語“編碼”是指轉錄和翻譯兩個過程。附圖簡述圖1A提供了各種非天然氨基酸的化學結構。圖2提供了在存在(泳道2)或不存在(泳道3)p-硝基-L-苯丙氨酸時累積的Z-結構域蛋白的染色SDS-PAGE分析照片。泳道1含有分子量標記。圖3提供摻入p-硝基-L-苯丙氨酸的Z-結構域蛋白的MALDI-TOF分析。預計質量7958,7826(第一個甲硫氨酸除外);觀察值7958,7828。圖4A提供了22TrpGCN4p1突變體(實線)以及22Trp和22p-硝基-L-苯丙氨酸GCN4p1突變體混合物(虛線)的熒光光譜。圖4B提供了55TrpGCN4p1突變體(實線)以及55Trp和22p-硝基-L-苯丙氨酸GCN4p1突變體混合物(虛線)的熒光光譜。圖5A提供了1,5-丹酰丙氨酸的化學結構。圖5B提供了結合有1,5-丹酰丙氨酸-AMP-酰胺的嗜熱棲熱菌亮氨酰-tRNA合成酶(LRS)活性位點的模型。作為隨機化區域一部分的突變體LRS克隆B8的活性位點殘基用條狀物表示。編號與大腸桿菌LRS相對應。圖6A和6B描述了突變體B8亮氨酰-tRNA合成酶編輯位點的再設計策略。圖6A提供了與模擬荷電tRNA3’-末端的2’-(L-正纈氨酰)-氨基-2’-脫氧腺苷復合的嗜熱棲熱菌亮氨酰-tRNA合成酶編輯位點的晶體結構。T252和V340用條狀物表示。圖6B提供了Ni-NTA純化的hSOD的SDS-PAGE分析,它具有用亮氨酰-tRNA合成酶克隆B8在33位引入的丹酰丙氨酸和兩個突變體V338A和T252A。上面的凝膠是考馬斯染色的照片。下面的凝膠是在302nm激發、在520nm發射的熒光圖象。L=分子量梯;UAA=非天然氨基酸。圖7A和7B描述了通過易錯PCR和選擇產生的大腸桿菌亮氨酰-tRNA合成酶克隆G2-6的增強的琥珀抑制效率。圖7A提供了嗜熱棲熱菌亮氨酰-tRNA合成酶的晶體結構(Cusack等,EMBOJ.,19(10)2351-2361)。標出了G2-6克隆中存在的合成結構域、編輯結構域、同源大腸桿菌合成酶中隨機化的氨基酸以及通過易錯PCR改變的氨基酸。圖7B提供了所表達的在33位含有o-硝基芐基絲氨酸的hSOD的考馬斯染色SDS-PAGE分析,采用設計的可摻入o-硝基芐基半胱氨酸的大腸桿菌亮氨酰-tRNA突變體合成酶克隆3H11和用o-硝基芐基絲氨酸有效抑制所涉及的突變體大腸桿菌亮氨酰-tRNA合成酶克隆G2-6。L=分子量梯;UAA=非天然氨基酸(oNBS)。圖8提供了通過365nm照射將囚禁的酪氨酸分子O-(2-硝基芐基)-L-酪氨酸光致脫囚禁(photodecaging)(光活化)的示意圖,導致切斷芐基化CO-鍵和迅速形成脫囚禁的(decaged)氨基酸。圖9提供了濃度曲線試驗,說明了觀察到的囚禁中的(caged)酪氨酸分子O-(2-硝基芐基)-L-酪氨酸的光致脫囚禁(光活化)。O-(2-硝基芐基)-L-酪氨酸的光致脫囚禁可用手提UV燈(365nm,距離10mm)照射0.2mM氨基酸水溶液證實。在特定時間點取出等份溶液用LC/MS分析。顯示了O-(2-硝基芐基)-L-酪氨酸(正方形)和相應的脫囚禁酪氨酸(圓形)的濃度。圖10提供了在存在或不存在O-(2-硝基芐基)-L-酪氨酸時用三種不同突變體合成酶表達的肌球蛋白74TAG的Gelcode藍染色的SDS-PAGE。圖11A和11B提供了74TAG突變體肌球蛋白的LC-MS/MS分析,顯示了74位的酪氨酸(胰蛋白酶(水解)肽HGVTVLTALGYILK)。圖12A和12B提供了與圖11A和11B類似的LC-MS/MS分析,但分析使用氚化的O-(2-硝基芐基)-L-酪氨酸,其中的J表示氚化的氨基酸(胰蛋白酶(水解)肽HGVTVLTALGJILK)。圖13提供了在THF和水中獲得的對-氰基苯丙氨酸IR譜的疊加圖。圖14A提供了與高斯曲線(虛線)擬合的對-氰基苯丙氨酸(實線)的本底減除譜。圖14B提供了與高斯曲線(虛線)擬合的間-氰基苯丙氨酸(實線)的本底減除譜。圖15提供了p-乙基硫代羰基-L-苯丙氨酸的合成過程。圖16提供了在第七個位置上含非天然氨基酸的突變體Z結構域蛋白的MALDI-TOF質譜分析結果。所有通過試驗獲得的質量數據與含有硫酯或羧酸基團的完整蛋白質的計算質量極好吻合。圖17提供了通過化學結合標記的蛋白質的原理圖。圖18A-18D提供了在340nm測得的LC/MS洗脫曲線(第一峰3;第二峰2)。圖18A顯示了使用3和2的1∶1甲醇混合物得到的曲線。圖18B顯示了使用3的PBS溶液得到的曲線(pH=7.4,反應時間1周)。圖18C顯示了用3的PBS溶液得到的曲線(pH=3.9,反應時間4天)。圖18D顯示了用稀硫酸溶液稀釋的3得到的曲線(pH=1.9,反應時間12小時)。所有反應都在室溫下勻速攪拌進行。圖19提供了含有二酮基非天然氨基酸p-(3-氧代丁酰基)-L-苯丙氨酸的合成過程。圖20提供了在存在或不存在p-(3-氧代丁酰基)-L-苯丙氨酸時表達的Z結構域蛋白的Gelcode藍染色的SDS-PAGE分析。分析顯示了用熒光素酰肼體外標記含有p-(3-氧代丁酰基)-L-苯丙氨酸的突變體Z結構域蛋白。wt=野生型。圖21提供了含有二酮基部分的各種加合物的合成過程。發明詳述本發明提供了受20種天然氨基酸限制的翻譯系統固有局限性的解決方案。所述解決方案包括利用正交翻譯系統將具有新型特性的非天然氨基酸程序性定點生物合成摻入到蛋白質中。我們在本文中描述了新的組合物(例如新的氨酰-tRNA合成酶)和新的方法,以便響應選擇者密碼子(例如,琥珀無義密碼子、TAG)將各種非天然氨基酸高效率特異性地通過基因摻入到蛋白質中。一些情況下,非天然氨基酸側鏈可被特異性地并區域選擇性地修飾。由于這些非天然氨基酸取代基的獨特反應化學,可高度選擇性地修飾要摻入它們的蛋白質。一些情況下,非天然氨基酸反應基的優點在于,它們對于體內系統是完全外來的,從而提高了反應選擇性。一些方面,可用允許進行體外和體內蛋白質偶聯反應并保留蛋白質生物學活性的相對溫和的反應條件進行修飾反應。對與蛋白質中非天然氨基酸偶聯的物質的特性沒有特別限制,且可以是任何所需實體(entity),例如,染料、熒光團、交聯劑、糖類衍生物、聚合物(例如,聚乙二醇衍生物)、光交聯劑(photocrosslinker)、細胞毒化合物、親和標記、生物素衍生物、樹脂、珠、第二蛋白或多肽(或其它)、多核苷酸(例如,DNA、RNA等)、金屬螯合劑、輔因子、脂肪酸、碳水化合物等。其它方面,摻入的非天然氨基酸賦予摻入了它們的蛋白質新的生物特性。例如,非天然氨基酸可以是熒光氨基酸、光囚禁的(photocaged)或光可活化的(photoactivatable)氨基酸、可作為供體或受體參與FRET對的氨基酸、氧化還原活性氨基酸、金屬螯合氨基酸等。一些方面,為證明(而非限制)本發明,這里公開的內容證實,非天然氨基酸部分可被摻入模型蛋白質。這并不是說所述非天然氨基酸只能被摻入這種模型蛋白質。從這里的公開內容顯見,非天然氨基酸可摻入任何感興趣的給定蛋白質,這對于用于治療和研究目的的蛋白質而言是有利的。我們開發了可在真細菌和酵母中發揮作用的新的正交tRNA/氨酰-tRNA合成酶對,它們可響應選擇者密碼子位點特異性摻入非天然氨基酸(例如,圖1提供的非天然氨基酸)。簡言之,我們已經鑒定了分別在大腸桿菌宿主細胞或酵母宿主細胞中用非天然氨基酸選擇性加載抑制基因tRNA的詹氏甲烷球菌(Methanococcusjanaschii)酪氨酰-tRNA合成酶和大腸埃希氏菌亮氨酰-tRNA合成酶的新的突變體。所涉及的這些tRNA-合成酶對可用來在蛋白質中位點特異性摻入各種非天然氨基酸。在蛋白質中摻入非天然氨基酸可以是程序性地,以便通過工程構造編碼感興趣蛋白質的多核苷酸而在任何所述位置進行摻入,所述多核苷酸含有作為摻入非天然氨基酸信號的選擇者密碼子。正交tRNA/氨酰-tRNA合成酶技術理解與正交tRNA和正交氨酰-tRNA合成酶對有關的活性有助于理解本發明的新的組合物和方法。有關正交tRNA和氨酰-tRNA合成酶技術的討論可見,例如,國際公開WO2002/085923、WO2002/086075、WO204/09459、WO2005/019415、WO2005/007870和WO2005/007624。也可參見Wang和Schultz的“遺傳密碼的擴展”(ExpandingtheGeneticCode),AngewandteChemieInt.Ed.,44(1)34-66(2005),其內容通過引用全文納入本文。為在遺傳密碼中加入額外的反應性非天然氨基酸,需要含有氨酰-tRNA合成酶和適當tRNA的新的正交對,它們可在宿主翻譯機制中有效發揮作用,但是否與翻譯系統“正交”仍在討論中,這意味著它可不依賴于翻譯系統的內源性合成酶和tRNA發揮作用。正交對的所需特性包括,僅編碼或識別特定密碼子如選擇者密碼子的tRNA不由任何內源性tRNA編碼,且氨酰-tRNA合成酶僅用一種特定的非天然氨基酸優先氨酰化(或“加載”)其同源tRNA。所述O-tRNA通常也不被內源性合成酶氨酰化。例如,在大腸桿菌中,正交對將包括不與任何內源性tRNA(例如,大腸桿菌中有40種)交叉反應的氨酰-tRNA合成酶和不被任何內源性合成酶(例如,大腸桿菌中有21種)氨酰化的正交tRNA。這里描述的本發明提供了在真細菌如大腸桿菌或者酵母中進行遺傳編碼并將非天然氨基酸摻入蛋白質的正交對,其中所述正交組分不與宿主細胞翻譯機制的內源性大腸桿菌或酵母組分交叉反應,但識別所需非天然氨基酸并響應選擇者密碼子(例如,琥珀無義密碼子、TAG)將其插入蛋白質。本發明提供的正交組分包括衍生自詹氏甲烷球菌酪氨酰tRNA-合成酶的正交氨酰-tRNA合成酶和突變體酪氨酰tRNACUA琥珀抑制基因,它們在真細菌宿主細胞中作為正交對。本發明還提供了衍生自大腸桿菌亮氨酰-tRNA-合成酶的正交組分和突變體大腸桿菌亮氨酰tRNACUA琥珀抑制基因,它們在酵母宿主細胞中作為正交對。在這些系統中,所述突變體氨酰-tRNA合成酶用其各自的非天然氨基酸而不用常見的20種氨基酸中的任何一種氨酰化所述抑制基因tRNA。本發明提供了鑒定和產生其它正交tRNA-氨酰-tRNA合成酶對,例如可用來將非天然氨基酸摻入蛋白質的O-tRNA/O-RS對的組合物和方法。本發明的O-tRNA/O-RS對能夠介導將非天然氨基酸如圖1所示的非天然氨基酸摻入由多核苷酸編碼的蛋白質,其中所述多核苷酸含有例如在體外被O-tRNA識別的選擇者密碼子。所述O-tRNA的反密碼子環識別mRNA上的選擇者密碼子并將其氨基酸(如圖1所示的非天然氨基酸)摻入多肽的該位點上。通常,本發明的正交氨酰-tRNA合成酶僅用一種特定的非天然氨基酸優先氨酰化(或加載)其O-tRNA。將非天然氨基酸(例如,圖1中提供的非天然氨基酸)位點特異性摻入蛋白質的能力有利于蛋白質的研究以及能夠工程構建具有新特性的蛋白質。例如,含有一種或多種非天然氨基酸的蛋白質的表達有助于通過特定的標記研究蛋白質,改變酶的催化功能,改變生物學活性或降低與基底的交叉反應性,將一種蛋白質與其它蛋白質、小分子或生物分子交聯,降低或消除蛋白質降解,提高蛋白質的體內半衰期(例如,將引入的反應位點PEG化或進行其它修飾)等。正交tRNA/正交氨酰-tRNA合成酶及它們組成的對適合產生含有一種或多種非天然氨基酸的蛋白質的翻譯系統通常描述于以下國際公開號中,例如,題為“METHODSANDCOMPOSITIONFORTHEPRODUCTIONOFORTHOGONALtRNA-AMINO-tRNASYNTHETASEPAIRS”的WO2002/086075;題為“非天然氨基酸的體內摻入”的WO2002/085923;2004年7月7日提交的題為“真核遺傳密碼的擴展”的WO2005/019415;2004年7月7日提交的WO2005/007870和2004年7月7日提交的WO2005/007624。上述各申請通過引用全文納入本文。還可參見Wang和Schultz的“遺傳密碼的擴展”,AngewandteChemieInt.Ed.,44(1)34-66(2005),其內容通過引用全文納入本文。這種翻譯系統一般都包括含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)以及非天然氨基酸的細胞(例如非真核細胞如大腸桿菌細胞或真核細胞如酵母細胞),其中O-RS可用非天然氨基酸氨酰化O-tRNA。本發明的正交對包括O-tRNA,如抑制基因tRNA、移碼tRNA等,以及O-RS。本發明還提供了其它各組分。通常,當正交對響應選擇者密碼子識別選擇者密碼子和加載氨基酸時,則該正交對被叫做“抑制”該選擇者密碼子。這就是說,不被翻譯系統(例如細胞)的內源性機制識別的選擇者密碼子通常不翻譯,這導致阻斷了從核酸翻譯產生多肽。本發明的O-tRNA識別選擇者密碼子,與包含或編碼于這里列出的序列所示的多核苷酸序列的O-tRNA相比,在同源合成酶存在時,本發明的O-tRNA為了響應選擇者密碼子而產生的抑制效率至少可達45%、50%、60%、75%、80%、90%或更高。O-RS可用感興趣的非天然氨基酸氨酰化O-tRNA。細胞利用O-tRNA/O-RS對將非天然氨基酸摻入到正在延伸的多肽鏈內,例如通過包含編碼感興趣多肽的多核苷酸的核酸,該多核苷酸含有能被O-tRNA識別的選擇者密碼子。在本發明的某些實施方案中,所述細胞可包含額外的O-tRNA/O-RS對,所述額外的O-tRNA由額外的O-RS用不同的非天然氨基酸加載。例如,一種O-tRNA可識別四堿基密碼子,而另一種可識別終止密碼子。或者,多種不同的終止密碼子或多種不同的四堿基密碼子可特異性識別不同的選擇者密碼子。在本發明的某些實施方案中,細胞如大腸桿菌細胞或酵母細胞含有正交tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、非天然氨基酸和含有編碼感興趣多肽的多核苷酸的核酸,所述多核苷酸含有被O-tRNA識別的選擇者密碼子。該翻譯系統也可以是無細胞系統,例如,任何市售的“體外”轉錄/翻譯系統與這里所述的O-tRNA/ORS對和非天然氨基酸的組合。一實施方案中,O-RS和O-tRNA聯合在一起的抑制效率至少是缺少O-RS時O-tRNA的抑制效率的5倍、10倍、15倍、20倍、25倍或更高。在一方面,O-RS和O-tRNA聯合在一起的抑制效率是本文序列表中所列正交合成酶對抑制效率的至少約35%、40%、45%、50%、60%、75%、80%、90%或更高。如上所述,本發明任選可在細胞或其它翻譯系統中包括多種O-tRNA/O-RS對,從而可以摻入一個以上的非天然氨基酸。例如,細胞還可以包含其它不同的O-tRNA/O-RS對和第二種非天然氨基酸,此另一種O-tRNA可識別第二選擇者密碼子,此另一種O-RS可用第二種非天然氨基酸優選氨酰化O-tRNA。例如,含有一種O-tRNA/O-RS對(其中O-tRNA可識別琥珀選擇者密碼子)的細胞還可以含有第二種正交對,其中第二O-tRNA可識別不同的選擇者密碼子,如乳白密碼子、四堿基密碼子等。理想的是,不同正交對衍生自不同來源,這樣有助于識別不同的選擇者密碼子。O-tRNA和/或O-RS可以是天然產生的,或可通過突變天然的tRNA和/或RS而產生,例如可從各種生物體之一產生tRNA庫和/或RS庫。例如,一種產生正交tRNA/氨酰-tRNA合成酶對的策略涉及輸入宿主細胞之外生物體或多種生物體來源的異源性(相對于該宿主細胞而言)tRNA/合成酶對到宿主細胞內。該候選異源合成酶的特性包括不能加載宿主細胞的任何tRNA,該候選異源tRNA的特性包括不能被宿主細胞的任何合成酶氨酰化。另外,該異源tRNA對于宿主細胞的合成酶而言是正交的。產生正交對的第二種策略是產生突變庫,然后從中篩選和/或選擇O-tRNA或O-RS。這些策略也可聯合使用。正交tRNA(O-tRNA)本發明的正交tRNA(O-tRNA)可以在體內或體外介導將非天然氨基酸摻入蛋白質內,所述蛋白質是由含選擇者密碼子的多核苷酸編碼的,這種選擇者密碼子可被O-tRNA識別。在某些實施方案中,本發明的O-tRNA與包含或編碼于這里所列序列的O-tRNA序列所示多核苷酸序列的O-tRNA相比,在相關合成酶存在的條件下,為了響應選擇者密碼子而產生的抑制效率至少可達45%、50%、60%、75%、80%、90%或更高。抑制效率可通過本領域熟知的多種試驗檢測。例如,可以利用β半乳糖苷酶報告分子試驗,如將衍生的lacZ質粒(該構建物含有選擇者密碼子和lacZ核酸序列)和含有本發明O-tRNA的質粒一起導入到含合適生物(如可利用正交組分的生物)的細胞內。也要導入相關合成酶(或者以多肽或編碼該相關合成酶的多核苷酸形式)。將細胞在培養基內培養到所需密度,如OD600約0.5時,采用BetaFluorTMβ-半乳糖苷酶檢測試劑盒(Novagen)進行β半乳糖苷酶試驗。抑制百分率可以計算為樣品相對于可比較對照(如衍生的lacZ構建物所顯示的活性值)的活性百分數,所述構建物在所需位置上含有有義密碼子而不是選擇者密碼子。本發明的O-tRNA的例子示于這里所列的序列。可參見本文表格、實施例和附圖中所顯示的典型O-tRNA和O-RS分子的序列。還可參見本文的“核酸和多肽序列及其變體”部分。該tRNA分子,如O-RSmRNA或O-tRNA分子中的胸腺嘧啶(T)被尿嘧啶(U)替換。也可以有其它的堿基修飾。本發明還包括與這里的特定O-tRNA相對應的O-tRNA的保守變體。例如,O-tRNA的保守變體包括的那些與特定O-tRNA(如這里的序列表中列出的)功能類似,并由于適當的自身互補性而保留tRNA的L型結構,但不含有與例如這里的序列表、附圖或實施例中所列相同的序列(需要的話還包括野生型tRNA分子之外的序列)。也可參見本文的“核酸和多肽序列及其變體”部分。含O-tRNA的組合物還可以包含正交氨酰-tRNA合成酶(O-RS),其中的O-RS用非天然氨基酸優先氨酰化O-tRNA。在某些實施方案中,含有O-tRNA的組合物還可以包含翻譯系統(如在體外或體內)。含有編碼感興趣多肽的多核苷酸的核酸,或者這些物質的一種或多種組合也可以存在于所述細胞內,其中所述多核苷酸含有能被O-tRNA識別的選擇者密碼子。參見本文的“正交氨酰-tRNA合成酶”部分。產生正交tRNA(O-tRNA)的方法也是本發明的特征。用該方法產生的O-tRNA也是本發明的特征。在本發明的某些實施方案中,O-tRNA可通過構建突變體庫來產生。突變體tRNA庫可用本領域已知的各種誘變技術構建。例如,突變體tRNA可通過定點誘變、隨機位點誘變、同源重組、DNA改組技術或其它遞推誘變(recursivemutagenesis)方法、嵌合體構建、或者它們的組合來產生。也可將其它的突變引入到特定位置上,如tRNA環或區域中的非保守區、保守區、隨機區或者混合區,如反密碼子環、接受臂、D臂或環、可變環、TΨC臂或環、tRNA分子的其它區域或其組合。一般來說,tRNA分子中的突變包括突變tRNA突變體庫內各成員的反密碼子環以使其能夠識別選擇者密碼子。該方法還可包括將一個額外的序列(CCA)加到O-tRNA的末端。一般來說,O-tRNA對感興趣生物的正交性相比起始材料(如tRNA序列群)有所改進,但保留了對所需RS的親和力。本發明的方法任選包括分析tRNA和/或tRNA合成酶序列的同源性以確定對特定生物具有正交性的潛在候選O-tRNA、O-RS和/或O-tRNA/O-RS對。可利用本領域已知的和本文所述的計算機程序都進行這種分析,如BLAST和pileup程序。在一個實施例中,為了篩選潛在的正交翻譯組分用于原核生物大腸桿菌,可選擇不顯示與原核生物具有罕見同源性的合成酶和/或tRNA。一般來說,可以通過陰性選擇第一物種的細胞群來獲得O-tRNA,該細胞可能含有O-tRNA群的成員。陰性選擇可去除含有可被細胞內源性氨酰-tRNA合成酶(RS)氨酰化的O-tRNA庫的成員細胞。這樣就可以得到對第一物種細胞具有正交性的tRNA庫。在某些實施方案中,進行陰性選擇時需要將選擇者密碼子引入到編碼陰性選擇標記的多核苷酸中,所述陰性選擇標記例如有能賦予抗生素抗性的酶如β內酰胺酶,能產生可檢測產物的酶如β半乳糖苷酶、氯霉素乙酰轉移酶(CAT),毒性產物如芽孢桿菌RNA酶引入到非必須位置上(還能產生功能性的芽孢桿菌RNA酶)等選擇。篩選還可任選通過在存在選擇試劑(比如抗生素,如氨芐青霉素)的培養基中培養細胞群來完成。在一個實施方案中,選擇試劑的濃度是變化的。例如,為測定抑制基因tRNA的活性,根據選擇者密碼子如無義密碼子(如終止子)或移碼突變的體內抑制使用一個選擇系統,引入到編碼負擇標記的多核苷酸(如β內酰胺酶基因(bla))。例如,構建在某個位置上含有選擇者密碼子的多核苷酸變體如bla變體。用這些多核苷酸轉化細胞,如細菌。如果存在無法被大腸桿菌內源性合成酶不能有效加載的正交tRNA,這種抗生素抗性如氨芐青霉素抗性應當或多或少使質粒不含轉化細菌。如果該tRNA不是正交的,或者能加載tRNA的異源合成酶在此系統內共表達,應可觀察到更高水平的抗生素抗性,如氨芐青霉素抗性。挑出那些無法在抗生素濃度約等于未用質粒轉化的細胞的LB瓊脂平板上生長的細胞,如細菌。如果存在毒性產物(如RNA酶或芽孢桿菌RNA酶),當一群候選tRNA的成員被宿主(如大腸桿菌)的內源性合成酶氨酰化時(即對于宿主如大腸桿菌的合成酶來說不是正交的),選擇者密碼子被抑制,所產生的毒性多核苷酸產物可導致細胞死亡。而含有正交tRNA或非功能性tRNA的細胞存活下來。在一個實施方案中,對能與所需生物正交的tRNA庫進行陽性選擇時,將選擇者密碼子置于陽性選擇標記中,例如抗藥性基因(如β內酰胺酶基因)編碼的陽性選擇標記中。在含有編碼或包含能與細胞正交的tRNA庫某成員的多核苷酸、編碼陽性選擇標記的多核苷酸和編碼同源RS的多核苷酸的細胞內進行陽性選擇。在某些實施方案中,第二群細胞含有陰性選擇不能去除的細胞。由于該多核苷酸在細胞內表達,使細胞可在含選擇試劑(如氨芐青霉素)的培養基內生長。然后選出能被共表達的相關合成酶氨酰化以及響應其選擇者密碼子而摻入氨基酸的tRNA。一般來說,這些細胞與含有非功能性tRNA或不能被感興趣合成酶有效識別的tRNA的細胞相比,抑制效應顯示升高。含有非功能性的tRNA或不能被感興趣合成酶有效識別的tRNA的細胞對該抗生素敏感。因此那些(i)不是宿主(如大腸桿菌)內源性合成酶的底物;(ii)能被感興趣合成酶氨酰化;以及(iii)在翻譯過程中具有功能的tRNA可在兩種篩選中保留下來。因此,根據要篩選的內容,相同的標記可以是陽性或陰性標記。這就是說,如果要選擇相同的標記就是陽性標記,而如果要選擇相反的標記就是陰性標記。在上面所述的方法中,所述選擇(如陽性選擇、陰性選擇或者陽性和陰性選擇)的嚴謹程度還包括改變篩選的嚴謹條件。例如,由于芽孢桿菌RNA酶是毒性很高的蛋白質,陰性選擇條件的嚴謹程度可通過將不同數感興趣選擇者密碼子引入到該酶基因內和/或通過使用可誘導啟動子來加以調控。在另一個實施例中,選擇試劑的濃度是可以改變的(如氨芐青霉素的濃度)。在本發明的一個方面,篩選條件的嚴謹程度是隨時變化的,因為在前幾輪篩選中感興趣活性較低。因此,在前幾輪中篩選標準的嚴謹程度較低,而在后幾輪篩選中需要更嚴謹的篩選標準。在某些實施方案中,陰性選擇、陽性選擇或者陽性和陰性選擇可重復多次。也可以使用多個不同的陰性選擇標記、陽性選擇標記或陽性和陰性選擇標記。在某些實施方案中,陽性選擇標記和陰性選擇標記可以相同。其它類型的選擇/篩選方法也可用于本發明中以產生正交性翻譯組分,如O-tRNA、O-RS和響應選擇者密碼子加載非天然氨基酸的O-tRNA/O-RS對。例如,陰性選擇標記、陽性選擇標記或陽性和陰性選擇標記可以是在適當反應物存在時能發熒光或催化發光反應的標記。在另一個實施方案中,標記的產物可通過熒光激活的細胞分選法(FACS)或發光檢測技術檢測。另外,標記還可以是親和選擇標記。參見Francisco,J.A.等,(1993)《產生和用熒光激活細胞分選法篩選外表面表達功能性抗體片段的大腸桿菌》(Productionandfluorescence-activatedcellsortingofEscherichiacoliexpressingafunctionalantibodyfragementontheexternalsurface).ProcNatlAcadSciUSA.9010444-8。產生重組正交tRNA的其它方法見于題為“用于產生正交tRNA-氨酰-tRNA合成酶對的方法和組合物”的國際專利申請WO2002/086075和題為“真核遺傳密碼的擴展”的WO2004/094593及2004年7月7日提交的WO2005/019415。還見于Forster等,(2003)ProgrammingpeptidomimeticsynthetasesbytranslatinggeneticcodesdesigneddenovoPNAS100(11)6353-6357;和Feng等,(2003),ExpandingtRNArecognitionofatRNAsynthetasebyasingleaminoacidchange,PNAS100(10)5676-5681。正交氨酰-tRNA合成酶(O-RS)本發明的O-RS在體外或體內能用非天然氨基酸優選氨酰化O-tRNA。可通過含O-RS的多肽和/或編碼O-RS或其片段的多核苷酸將本發明的O-RS提供給翻譯系統(如細胞)。例如,示范性的O-RS包含本文序列表和實施例中所列的氨基酸序列或其保守變體。在另一個實施例中,O-RS或其片段是由多核苷酸或其互補序列編碼的,該多核苷酸編碼含有本文序列表和實施例所列的氨基酸序列。參見本文表格和實施例中所列的示范性O-RS分子的序列。也可參見本文的“核酸和多肽序列及其變體”部分。鑒定可與O-tRNA一起應用的正交氨酰-tRNA合成酶(O-RS)的方法也是本發明的特征。例如,該方法包括選擇,如陽性選擇,第一物種的細胞群,該群中的個別細胞含有1)一組氨酰-tRNA合成酶(RS)的一個成員(如這組RS可包括突變體RS、第一物種之外物種來源的RS,或包括這二者);2)正交tRNA(O-tRNA)(如一個或多個物種來源的);以及3)編碼選擇標記(如陽性選擇標記)并含有至少一個選擇者密碼子的多核苷酸。篩選出那些與缺乏該組RS成員或RS成員數目少的細胞相比抑制效率升高的細胞。抑制效率可用本領域已知的和本文所述的方法測定。抑制效率升高的細胞所包含的活性RS可氨酰化O-tRNA。將來自第一物種的第一組tRNA被活性RS氨酰化的水平(體外或體內),與來自第二物種的第二組tRNA被活性RS氨酰化的水平相比較。氨酰化水平可通過檢測底物(例如標記的非天然氨基酸)來確定。通常選出氨酰化第二組tRNA的效率比氨酰化第一組tRNA更高的活性RS,從而獲得能與O-tRNA一起應用或更有效(優化)的正交氨酰-tRNA合成酶。用這種方法鑒定出的O-RS也是本發明的特征。許多試驗可用于確定氨酰化效率。這些方法可在體外或體內進行。例如,體外氨酰化試驗的描述可見Hoben和Soll(1985)MethodsEnzymol.11355-59中。氨酰化效率還可利用一個與正交翻譯組分相連的報告分子,和檢測能表達含有一個選擇者密碼子的多核苷酸編碼的蛋白質的細胞在該報告分子的水平來確定。見題為“非天然氨基酸的體內摻入”的WO2002/085923和題為“真核遺傳密碼的擴展”的WO2004/094593。O-RS可以被進一步修飾以改變該合成酶的底物特異性,以使該O-RS只能將所需要的非天然氨基酸而不是其它任何常見的20種氨基酸加載到O-tRNA上。產生對非天然氨基酸具有底物特異性的正交氨酰tRNA合成酶的方法包括突變該合成酶,例如在該合成酶的活性位點、編機制位點上突變合成酶,在不同的位點上組合合成酶的不同結構域等,然后通過篩選過程進行選擇。可用的一種策略是依據聯用陽性選擇然后陰性選擇。在陽性選擇過程中,抑制引入到陽性選擇標記非必需位置上的選擇者密碼子,可使細胞在陽性選擇壓力下存活下來。在同時存在天然氨基酸和非天然氨基酸時,存活細胞編碼的活性合成酶可利用天然或非天然氨基酸氨酰化正交的抑制基因tRNA。在陰性選擇過程中,抑制引入到陰性選擇標記非必需位置的選擇者密碼子,可去除具有天然氨基酸特異性的合成酶。經過陰性選擇和陽性選擇存活的細胞所編碼的合成酶只能用非天然氨基酸來氨酰化(加載)正交的抑制基因tRNA。然后對這些合成酶進行進一步的誘變,如DNA改組或其它遞推誘變方法。突變體O-RS庫可利用本領域已知的各種誘變技術來構建。例如,可通過定點誘變、隨機位點突變、同源重組、DNA改組或其它遞推誘變方法、嵌合構建、或者它們的組合來制備。例如,可從兩個或多個其它較小的趨異性較低的“亞庫”來構建突變體RS庫。本發明還包括RS的嵌合庫。應注意可任選構建各種生物(例如微生物如真細菌或古細菌)的tRNA合成酶庫,如具有天然多樣性的庫(見Short等人的美國專利No.6,238,884;Schallenberger等人的美國專利No.5,756,316;Petersen等人的美國專利No.5,783,431;Thompson等人的美國專利No.5,824,485;Short等人的美國專利No.5,958,672)并篩選其中的正交對。合成酶一旦通過陽性選擇和陰性選擇過程,可對這些合成酶進一步誘變。例如,分離編碼O-RS的核酸;從該核酸產生一組編碼突變的O-RS(如通過隨機誘變、位點特異性誘變、重組或它們的組合)的多核苷酸;這些步驟的每一步或者這些步驟的組合都可以重復進行直到獲得能夠用非天然氨基酸優先氨酰化O-tRNA的突變體O-RS。在本發明的一個方面,這些步驟可進行多次,如至少兩次。其它嚴謹程度的選擇/篩選條件也可用于本發明的方法中以產生O-tRNA、O-RS或O-tRNA/O-RS對。選擇或篩選條件的嚴謹程度在產生O-RS的一個步驟或兩個步驟中可以不同。這包括改變所用選擇/篩選試劑的濃度等。還可以進行額外輪次的陽性選擇和/或陰性選擇。選擇或篩選還可以包括氨基酸滲透性的一種或多種改變,翻譯效率的改變、翻譯精確度的改變等。一般來說,所述一種或多種改變的基礎是能利用正交的tRNA-tRNA合成酶對產生蛋白質的生物體的一種或多種基因中的突變。產生O-RS以及改變該合成酶的底物特異性的其它通用細節可參見題為“產生正交tRNA-氨酰-tRNA合成酶對的方法和組合物”的國際專利申請WO2002/086075和題為“真核遺傳密碼的擴展”的WO2004/094593。也可參見Wang和Schultz“遺傳密碼的擴展”AngewandteChemieInt.Ed.,44(1)34-66(2005),其內容通過引用全文納入本文。來源和宿主生物本發明的正交翻譯組分(O-tRNA和O-RS)可衍生自任何生物(或生物的組合)以用于任何其它種類的宿主翻譯系統,條件是所述O-tRNA/O-RS組分和宿主系統以正交方式工作。不要求正交對的O-tRNA和O-RS衍生自相同生物。一些方面,正交組分衍生自古菌基因(即古細菌)以用于真細菌宿主系統。例如,正交O-tRNA可衍生自古菌生物,例如,古細菌,如詹氏甲烷球菌、熱自養甲烷球菌,嗜鹽菌如沃氏鹽桿菌和鹽桿菌NRC-1,閃爍古生球菌,激烈火球菌,超嗜熱古菌,Aeuropyrumpernix,海沼甲烷球菌,坎氏甲烷嗜熱菌,馬氏微球菌(Mm),超耐高溫熱棒菌,火球菌(Pyrococcusabyssi),硫磺礦硫化葉菌(Ss),硫化葉菌(Sulflobustokodaii),噬酸熱原體,火山熱原體等,或者真細菌,如大腸桿菌、嗜熱棲熱菌(Thermusthermophilus)、嗜熱脂肪芽孢桿菌(Bacillusstearothermphilus)等,正交的O-RS可衍生自非真核生物(或生物混合物),例如古細菌,如詹氏甲烷球菌、熱自養甲烷球菌,嗜鹽菌屬如沃氏鹽桿菌和鹽桿菌NRC-1,閃爍古生球菌,激烈火球菌,超嗜熱古菌,Aeuropyrumpernix,海沼甲烷球菌,坎氏甲烷嗜熱菌,馬氏微球菌,超耐高溫熱棒菌,火球菌(Pyrococcusabyssi),硫磺礦硫化葉菌,硫化葉菌(Sulfolobustokodaii),噬酸熱原體,火山熱原體等,或者真細菌,如大腸桿菌、嗜熱棲熱菌、嗜熱脂肪芽孢桿菌等。在一個實施方案中,真核生物如植物、藻類、原生生物、真菌、酵母、動物(如哺乳動物、昆蟲、節肢動物等)等也可作為O-tRNA和O-RS的來源。O-tRNA/O-RS對的各個組分可以衍生自同一生物,也可以衍生自不同生物。在一個實施方案中,O-tRNA/O-RS對衍生自同一生物。或者O-tRNA/O-RS對的O-tRNA和O-RS也可以衍生自不同生物。可在體內或體外和/或所用的細胞(如真細菌細胞)中選擇或篩選O-tRNA、O-RS或O-tRNA/O-RS對以產生出含非天然氨基酸的多肽。對所用真細菌細胞沒有限制,例如可以是大腸埃希氏菌,嗜熱棲熱菌,嗜熱脂肪芽孢桿菌等。含有本發明翻譯組分的真細菌細胞組合物也是本發明的一個特征。也可參見2004年4月16日提交的題為“真核遺傳密碼的擴展”的國際申請公開號WO2004/094593,以在一種種類中篩選用于其它種類的O-tRNA和/或O-RS。一些方面,可在體內或體外和/或所用的細胞(如真核細胞)中選擇或篩選O-tRNA、O-RS或O-tRNA/O-RS對以產生出含有非天然氨基酸的多肽。對所用真核細胞沒有限制,例如可使用任何合適的酵母細胞,如釀酒酵母(S.cerevisiae)等。含有本發明翻譯組分的真核細胞組合物也是本發明的一個特征。可選擇釀酒酵母作為真核宿主種類,這種生物有許多優點。這種物種是單細胞的,具有快的世代時間,并在遺傳上較好表征。參見,例如,D.Burke等,(2000)MethodsinYeastGenetics.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY。此外,由于真核生物的翻譯機制高度保守(參見,例如,(1996)TranslationalControl.ColdSpringHarborLaboratory,ColdSpringHarbor,NY;Y.Kwok,&J.T.Wong,(1980),《用氨酰-tRNA合成酶作為系統發生探針確定的嗜鹽菌和真核生物之間的進化關系》(EvolutionaryrelationshipbetweenHalobacteriumcutirubrumandeukaryotesdeterminedbyuseofamino酰基-tRNAsynthetasesasphylogeneticprobes),CanadianJournalofBiochemistry58213-218;和(2001)TheRibosome.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY),可將摻入有在釀酒酵母中發現的非天然氨基酸的O-RS基因(例如,衍生自野生型大腸桿菌RS序列的O-RS基因)引入高級真核生物(例如哺乳動物細胞)中,并聯用相關的tRNA(參見,例如,K.Sakamoto等,(2002)《在哺乳動物細胞中將非天然氨基酸位點特異性摻入蛋白質》(Site-specificincorporationofunnaturalaminoacidintoproteinsinmammaliancells),NucleicAcidsRes.304692-4699;和C.Kohrer等,(2001),《將琥珀和赭石抑制基因tRNA引入哺乳動物細胞將氨基酸類似物位點特異性摻入蛋白質的常規方法》(ImportofamberandochresuppressortRNAintomammaliancellsageneralapproachtosite-specificinsertionofaminoacidanaloguesintoproteins),Proc.Natl.Acad.Sci.U.S.A.9814310-14315)來摻入非天然氨基酸。盡管正交翻譯系統(例如,含有O-RS、O-tRNA和非天然氨基酸)可利用培養的宿主細胞產生含有非天然氨基酸的蛋白質,但并不是說本發明的正交翻譯系統需要完整的有活力的宿主細胞。例如,正交翻譯系統可利用含有細胞提取物的無細胞系統。實際上,使用無細胞的體外轉錄/翻譯系統產生蛋白質是一種良好建立的技術。這些體外系統適用于用這里所述的正交翻譯系統組分產生含有非天然氨基酸的蛋白質,這也包括在本發明的范圍之內。選擇者密碼子本發明的選擇者密碼子擴大了蛋白質生物合成機的遺傳密碼框架。例如,選擇者密碼子包括獨特的三堿基密碼子,無義密碼子如終止密碼子,例如琥珀密碼子(UAG)、或乳白密碼子,非天然密碼子,至少一個四堿基密碼子,稀有密碼子等。可將一些選擇者密碼子導入到所需基因內,如一個、兩個、三個或三個以上選擇者密碼子。通過采用不同的選擇者密碼子,可利用多個正交tRNA/合成酶對通式位點特異性摻入多個非天然氨基酸(例如包括有至少一個非天然氨基酸)。在一個實施方案中,本發明的方法包括利用終止密碼子作為選擇者密碼子在體內將非天然氨基酸引入到細胞內。例如,產生可識別該終止密碼子的O-tRNA,然后被O-RS用非天然氨基酸氨酰化。這種O-tRNA不能被天然產生的宿主氨酰-tRNA合成酶所識別。可利用常規的定點誘變技術將終止密碼子引入到編碼感興趣多肽的多核苷酸的感興趣位點上。參見Sayers,J.R.等,(1988),“5′,3′外切核酸酶在基于硫代磷酸酯的寡核苷酸定點誘變中的引用(5′,3′Exonucleaseinphosphorothioate-basedoligonucleotide-directedmutagenesis)”NucleicAcidsRcs,791-802。當O-RS、O-tRNA和編碼感興趣多肽的核酸在體內組合時,非天然氨基酸因響應終止密碼子而被摻入,產生在該特定位置上含非天然氨基酸的多肽。本發明的一個實施方案中,用作選擇者密碼子的終止密碼子不是琥珀密碼子UAG和/或乳白密碼子UGA。一實施例中,將UAG和UGA都用作選擇者密碼子的遺傳密碼可編碼22個氨基酸,同時保留赭石無義密碼子UAA,UAA是最豐富的終止信號。體內摻入非天然氨基酸對宿主細胞不會產生顯著影響。例如,在非真核細胞如大腸桿菌內,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制基因tRNA)和釋放因子1(RF1)(RF1可結合UAG密碼子,而引起正在延伸的肽鏈從核糖體上釋放下來)之間的競爭,因此可通過提高O-tRNA(如抑制基因tRNA)的表達水平,或利用RF1缺陷株來調節抑制效率。在真核細胞內,由于UAG密碼子的抑制效率依賴于O-tRNA(如琥珀抑制基因tRNA)和真核釋放因子(如eRF)(eRF可結合終止密碼子,引起正在延伸的肽鏈從核糖體上釋放下來)之間的競爭,因此可通過提高O-tRNA(如抑制基因tRNA)的表達水平來調節抑制的效率。另外,也可存在其它化合物,例如還原劑二硫蘇糖醇(DTT)。非天然氨基酸也可以由稀有密碼子編碼。例如,當體外蛋白合成反應中的精氨酸濃度下降時,稀有的精氨酸密碼子AGG被證實可通過丙氨酸酰化的合成tRNA有效地摻入丙氨酸。見Ma等,Biochemistry,327939(1993)。在這種情況下,合成的tRNA可與天然的tRNAArg競爭,后者作為稀有成分存在于大腸桿菌內。另外,某些生物不能利用所有的三聯密碼子。藤黃微球菌(Micrococcusluteus)內的獨立密碼子AGA可用于在體外將氨基酸插入到轉錄/翻譯提取物內。見Kowal和Oliver,Nucl.Acid.Res.,254685(1997)。體內利用這些稀有密碼子可以產生出本發明的各組分。選擇者密碼子還包括擴充的密碼子,例如四堿基或多堿基密碼子,如四堿基、五堿基、六堿基或多堿基密碼子。四堿基密碼子的例子包括AGGA、CUAG、UAGA、CCCU等。五堿基密碼子的例子包括AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本發明的方法包括利用基于移碼抑制的擴充密碼子。四堿基或多堿基密碼子可用于將一個或多個非天然氨基酸如非天然氨基酸摻入到同一個蛋白質內。在其它的實施方案中,反密碼子環可以解碼至少一個四堿基密碼子、至少一個五堿基密碼子、至少一個六堿基密碼子等。由于有256個可能的四堿基密碼子,因此,利用四堿基或多堿基密碼子可在同一個細胞內編碼多個非天然氨基酸。見Anderson等,(2002)ExploringtheLimitsofCodonandAnticodonSize,ChemistryandBiology,9237-244;以及Magliery,(2001)ExpandingtheGeneticCodeSelectionofEfficientSuppressorsofFour-baseCodonsandIdentificationof″Shifty″Four-baseCodonswithaLibraryApproachinEscherichiacoli,J.Mol.Biol.307755-769。例如,用體外生物合成方法利用四堿基密碼子將非天然氨基酸摻入到蛋白質內。見Ma等,(1993)Biochemistry,327939;和Hohsaka等,(1999)J.Am.Chem.Soc.,12134。用CGGG和AGGU與兩個用化學方法酰化的移碼抑制基因tRNA,體外將2-萘基丙氨酸和賴氨酸的NBD衍生物同時摻入到鏈親和素內。見Hohsaka等,(1999)J.Am.Chem.Soc.,12112194。在一個體內研究中,Moore等人檢查了tRNALeu衍生物和NCUA反密碼子能否抑制UAGN密碼子(N可以是U、A、G或C),發現四聯密碼子UAGA可被含UCUA反密碼子的tRNALeu解碼,其效率為13~26%,在0或-1框架處幾乎不解碼。見Moore等,(2000)J.Mol.Biol.298195。在一個實施方案中,基于稀有密碼子或無義密碼子的擴充密碼子可用于本發明中,這些密碼子可減少在其它不希望的位點發生錯義通讀和移碼抑制。四堿基密碼子已在各種正交系統中被用作選擇者密碼子。參見,例如,WO2005/019415;WO2005/007870和WO2005/07624。也可參見Wang和Schultz的“遺傳密碼的擴展”,AngewandteChemieInt.Ed.,44(1)34-66(2005),其內容通過引用全文納入本文。盡管下面的例子采用了琥珀選擇者密碼子,但也可以使用四堿基或多堿基密碼子,需要將這里的例子修改為包括四堿基O-tRNA和修飾過的合成酶以包括與之前描述過的各種非天然氨基酸O-RS類似的突變。在一個給定的系統中,選擇者密碼子還包括一個天然的三堿基密碼子,該內源系統不能利用(或很少利用)這種天然的三堿基密碼子。例如,包括缺乏能識別天然三堿基密碼子的tRNA的系統和/或三堿基密碼子是稀有密碼子的系統。選擇者密碼子任選包括非天然堿基對。這些非天然堿基對進一步擴充了現有的遺傳字母表。一種額外的堿基對可將三聯密碼子的數目從64個增加到125個。三堿基對的特性包括穩定的選擇性堿基配對、可有效地被聚合酶高度精確地摻入到DNA內、以及在新生非天然堿基對合成后繼續有效地引物延伸。適合本發明方法和組合物的非天然堿基對的描述見Hirao等,(2002)Anunnaturalbasepairforincorporatingaminoacidanaloguesintoprotein,NatureBiotechnology,20177-182和Wu,Y.等,(2002)J.Am.Chem.Soc.12414626-14630。其它相關文獻將在下文列出。非天然核苷在用于體內時可以穿透生物膜,被磷酸化后形成相應的三磷酸鹽形式。另外,所增加的遺傳信息是穩定的,不含被細胞的酶破壞。Benner及其同事在先前曾嘗試利用與經典的Watson-Crick堿基對不同的氫鍵模式,最值得注意的是iso-C:iso-G對。見Switzer等,(1989)J.Am.Chem.Soc.,1118322和Piccirilli等,(1990)Nature,34333;Kool,(2000)Curr.Opin.Chem.Biol.,4602。一般來說,這些堿基會與天然堿基發生某種程度的錯配,并且不能用酶學方法復制。Kool及其同事的研究證明堿基之間的疏水性包裹相互作用可代替氫鍵,驅使堿基對的形成。見Kool,(2000)Curr.Opin.Chem.Biol.,4602,Guckian和Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。為嘗試開發出能滿足上述所有要求的非天然堿基對,Schultz、Romesberg及其同事系統地合成和研究了一系列的非天然疏水堿基。發現PICS:PICS自身配對比天然堿基對更穩定,可被大腸桿菌DNA聚合酶I的Klenow片段(KF)有效摻入到DNA內。見McMinn等,(1999)J.Am.Chem.Soc.,12111586和Ogawa等,(2000)J.Am.Chem.Soc.,1223274。3MN:3MN自身配對可由KF合成,其效力和選擇性足以使其行使生物學功能。見Ogawa等,(2000)J.Am.Chem.Soc.1228803。但是,這兩個堿基的作用是進一步復制的鏈末端。最近已開發了一種可用于復制PICS自身對的突變型DNA聚合酶。另外,7AI自身對也可被復制。見Tae等,(2001)J.Am.Chem.Soc.,1237439。一種新型的金屬堿基對Dipic:Py也被開發出來,該堿基對在結合Cu(II)時可形成穩定的堿基對。見Meggers等,(2000)J.Am.Chem.Soc.,1221071。由于擴充的密碼子和非天然密碼子本來就是與天然密碼子正交的,因此本發明的方法可利用這一特性來產生這些密碼子的正交tRNA。一種翻譯旁路系統也可用于將非天然氨基酸摻入到所需多肽內。在翻譯旁路系統中,可將一個大序列插入到基因內不能翻譯成蛋白質。該序列含有一種可作為提示信號的結構,誘導核糖體跳過該序列恢復摻入序列的下游翻譯。非天然氨基酸如本文所述,非天然氨基酸指除硒代半胱氨酸和/或吡咯賴氨酸和下列20種遺傳密碼編碼的α氨基酸之外的所有氨基酸、修飾氨基酸或氨基酸類似物α氨基酸是丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸、纈氨酸。α氨基酸的通用結構可用結構式I表示非天然氨基酸一般都具有結構式I的結構,其中R基團代表20種天然氨基酸中所用基團之外的任何取代基。見L.Stryer編的《生物化學》(Biochemistry)(第三版,1988,FreemanandCompany,NewYork)以了解20種天然氨基酸的結構。注意,本發明的非天然氨基酸可以是上述20種α氨基酸之外的天然化合物。一般來說,因為本發明的非天然氨基酸在側鏈上與天然氨基酸不同,因此非天然氨基酸可以與其它氨基酸(如天然或天然的)形成酰胺鍵,形成的方式與天然蛋白中的酰胺鍵一樣。但是,非天然氨基酸含有與天然氨基酸可區別的側鏈基團。這里特別感興趣的是圖1提供的非天然氨基酸。例如,這些非天然氨基酸包括但不限于p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羥基-香豆素氨基酸、硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸、p-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和p-硝基-L-苯丙氨酸。這些非天然氨基酸的L和D-對映體都可用于本發明。除了圖1的非天然氨基酸,其它非天然氨基酸可同時摻入感興趣多肽,例如,與本發明提供的正交對一起使用合適的第二O-RS/O-tRNA對。許多這種額外的非天然氨基酸和合適的正交對是已知的。見這里引用的參考文獻。例如,參見Wang和Schultz的“遺傳密碼的擴展”,AngewandteChemieInt.Ed.,44(1)34-66(2005),其內容通過引用全文納入本文。在其它的非天然氨基酸中,式I中的R基團可以是烷基-、芳基-、酰基-、肼、氰基-、鹵代-、酰肼、烯基、炔基、醚、硼烷、硼酸基、磷、膦酰基、膦、烯酮、亞胺、酯、羥胺、胺等,或上述基團的組合。感興趣的其它非天然氨基酸包括但不限于含光活化交聯接頭的氨基酸、自旋-標記氨基酸、熒光氨基酸、金屬結合氨基酸、含金屬的氨基酸、放射性氨基酸、含有新官能團的氨基酸、能與其它分子共價或非共價反應的氨基酸、光囚禁的和/或光促異構的(photoisomerizable)氨基酸、含生物素或生物素類似物的氨基酸、含酮基氨基酸、糖基化氨基酸、側鏈連有糖部分的氨基酸、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化學方法可切割或光可切割的氨基酸、與天然氨基酸相比具有延長側鏈的氨基酸(如超過約5個、約10個碳原子的聚醚或長鏈烴)、含碳連接糖的氨基酸、含氨基硫代酸的氨基酸、以及含一個或多個毒性結構部分的氨基酸。在另一方面,本發明提供了具有下式IV所示通用結構的非天然氨基酸具有這種結構的非天然氨基酸通常可為任何結構,其中R1是20種天然氨基酸之一(例如,酪氨酸或苯丙氨酸)中所用的取代基,R2是取代基。因此,這種類型的非天然氨基酸可視為天然氨基酸衍生物。非天然氨基酸除了可含圖1所示的新型側鏈以外,還任選可含有經修飾的骨架結構,如結構式II和III所示的結構式中,Z一般為OH、NH2、SH、NH-R′或S-R′;X和Y可以相同或不同,一般包括S或O,R和R′可相同也可不同,一般選自與上述結構式I所示的非天然氨基酸的R基團相同的組成物以及氫。例如,本發明的非天然氨基酸還可以在結構式II和III所示的氨基或羧基上含有取代基。這種類型的非天然氨基酸包括但不限于含有20個常見氨基酸相應的側鏈或非天然側鏈的α-羥酸、α-硫代酸、α-氨基硫代羧酸。另外,α碳原子上的取代基還包括L,D或α-α-雙取代的氨基酸,如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它的結構形式包括環形氨基酸,如脯氨酸類似物以及3、4、6、7、8和9元環脯氨酸類似物,β和γ氨基酸,如取代的β丙氨酸和γ-氨基丁酸。一些方面,本發明使用L-構型的非天然氨基酸。然而,這并不是說本發明僅限于使用L-構型的非天然氨基酸。應理解,這些非天然氨基酸的D-對映體也可用于本發明。酪氨酸類似物包括對位取代的酪氨酸、鄰位取代的酪氨酸和間位取代的酪氨酸,這些酪氨酸取代基團包括炔基、乙酰基、苯甲酰基、氨基、肼、羥氨基、巰基、羧基、異丙基、甲基、C6-C20直鏈或支鏈烴基、飽和或不飽和烴基、O-甲基、聚醚基、硝基等。另外,也可考慮多處取代的芳環。本發明的谷氨酰胺類似物包括但不限于α-羥基衍生物、γ-取代衍生物、環狀衍生物和酰胺基取代的谷氨酰胺衍生物。苯丙氨酸類似物的例子包括但不限于對位取代的苯丙氨酸、鄰位取代的苯丙氨酸和間位取代的苯丙氨酸,這些取代基包括炔基、羥基、甲氧基、甲基、丙烯基、醛基、硝基、硫醇基或酮基等。非天然氨基酸的具體例子包括但不限于p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羥基-香豆素氨基酸、硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸、p-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和p-硝基-L-苯丙氨酸。還包括p-炔丙氧基苯丙氨酸、3,4-二羥基-L-苯丙氨酸(DHP)、3,4,6-三羥基-L-苯丙氨酸、3,4,5-三羥基-L-苯丙氨酸、4-硝基-苯丙氨酸、p-乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-丙稀基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巰基-酪氨酸、三-O-乙酰基-GlcNAcβ-絲氨酸、L-多巴、含氟苯丙氨酸、異丙基-L-苯丙氨酸、p-疊氮基-L-苯丙氨酸、p-酰基-L-苯丙氨酸、p-苯甲酰基-L-苯丙氨酸、L-磷酸絲氨酸、膦酰絲氨酸、膦酰酪氨酸、p-碘代-苯丙氨酸、p-溴代苯丙氨酸、p-氨基-L-苯丙氨酸以及異丙基-L-苯丙氨酸等。各種非天然氨基酸的結構顯示在本文的圖1中。也可參見題為“真核遺傳密碼的擴展”的公開的國際申請WO2004/094593。非天然氨基酸的化學合成上述許多非天然氨基酸都可以從Sigma(USA)或Aldrich(Milwaukee,WI,USA)等公司購買到。那些不能從市場上購買到的非天然氨基酸可任選按照各種發表的或本領域技術人員已知的標準方法合成。有機合成技術可參見Fessendon和Fessendon的《有機化學》(OrganicChemistry)(1982,第二版,WillardGrantPress,BostonMass.);March的《高級有機化學》(AdvancedOrganicChemistry)(第三版,1985,WileyandSons,NewYork);以及Carey和Sundberg的《高級有機化學》(AdvancedOrganicChemistry)(第三版,A和B部分,1990,PlenumPress,NewYork)。其它描述非天然氨基酸合成的文獻包括題為“非天然氨基酸的體內摻入”的國際專利申請WO2002/085923;Matsoukas等,(1995)J.Med.Chem.,38,4660-4669;King,F.E.和Kidd,D.A.A.(1949)ANewSynthesisofGlutamineandofγ-DipeptidesofGlutamicAcidfromPhthylatedIntermediates.J.Chem.Soc.,3315-3319;Friedman,O.M.和Chatterrji,R.(1959)SynthesisofDerivativesofGlutamineasModelSubstratesforAnti-tumorAgents.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等(1988)AbsoluteConfigurationoftheEnantiomersof7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.和Frappier,F.(1991)GlutamineanaloguesasPotentialAntimalarials,Eur.J.Med.Chem.26,201-5;Koskinen,A.M.P.和Rapoport,H.(1989)Synthesisof4-SubstitutedProlinesasConformationallyConstrainedAminoAcidAnalogues.J.Org.Chem.54,1859-1866;Christie,B.D.和Rapoport,H.(1985)SynthesisofOpticallyPurePipecolatesfromL-Asparagine.ApplicationtotheTotalSynthesisof(+)-ApovincaminethroughAminoAcidDecarbonylationandIminiumIonCyclization.J.Org.Chem.19891859-1866;Barton等,(1987)SynthesisofNovelα-Amino-AcidsandDerivativesUsingRadicalChemistrySynthesisofL-andD-α-Amino-AdipicAcids,L-α-aminopimelicAcidandAppropriateUnsaturatedDerivatives.TetrahedronLett.434297-4308;以及Subasinghe等,(1992)Quisqualicacidanaloguessynthesisofbeta-heterocyclic2-aminopropanoicacidderivativesandtheiractivityatanovelquisqualate-sensitizedsite.J.Med.Chem.354602-7。還可參見2003年12月22日提交的題為“ProteinArrays(蛋白質陣列)”的國際專利申請WO2004/058946。非天然氨基酸的細胞攝取一般認為在設計和選擇非天然氨基酸,如用于摻入到蛋白質中的非天然氨基酸時要考慮的一個問題是細胞對非天然氨基酸的攝取。例如,α氨基酸帶有高密度電荷提示這些化合物不可能透過細胞膜。天然氨基酸是通過蛋白質轉運系統的收集而攝入到細胞內,但是這些轉運系統一般都有不同程度的氨基酸特異性。可進行一種快速篩選來評價哪種非天然氨基酸可被細胞攝取。見下列文獻中的毒性試驗2003年12月22日提交的題為“ProteinArrays(蛋白質陣列)”的國際專利申請WO2004/058946;以及Liu和Schultz(1999)Progresstowardtheevolutionofanorganismwithanexpandedgeneticcode.PNAS964780-4785。雖然用各種試驗不難分析攝取情況,但是,設計易于進入細胞攝取通路的非天然氨基酸的另外一種方法是提供生物合成通路來體內產生氨基酸。非天然氨基酸的生物合成細胞內已經存在許多生物合成通路可產生氨基酸和其它化合物。雖然某種特定非天然氨基酸的生物合成方法在自然界中如在細胞內可能不存在,但本發明提供了這樣的方法。例如,可以通過加入新的酶或者修飾現有的宿主細胞通路來產生非天然氨基酸的生物合成通路。加入的新酶可任選是天然產生的酶,或是人工改造的酶。例如,p-氨基苯丙氨酸(如上述WO2002/085923實施例中提到的)的生物合成依賴于加入其它生物的已知酶的組合物。可用含有這些酶基因的質粒轉化細胞而將這些酶的基因導入到細胞內。這些基因在細胞內表達時即提供了酶催化通路來合成所需要的化合物。可任選加入的這類酶的例子見下面實施例的描述。加入的酶的序列可在Genbank中找到。也可任選以同樣方式將人工修飾的酶加入到細胞內。以這種方式操縱細胞合成機制和物質來產生非天然氨基酸。許多方法確實都可用于在體外或體內產生生物合成通路所用的新型酶、改造現有的通路來產生非天然氨基酸。許多產生酶和生物合成通路其它組分的方法都可用于本發明來產生非天然氨基酸(或者產生具有新的底物特異性或其它感興趣活性的合成酶)。例如,可任選利用DNA改組來產生新的酶和/或這種酶的通路以在體外或體內產生非天然氨基酸(或產生新的合成酶)。見Stemmer(1994),RapidevolutionofaproteininvitrobyDNAshuffling,Nature370(4)389-391;以及Stemmer,(1994),DNAshufflingbyrandomfragmentationandreassemblyInvitrorecombinationformolecularevolution,Proc.Natl.Acad.Sci.USA.,9110747-10751。一種有關改組相關基因(如同源基因)家族的方法可快速產生具有所需特性的酶。這種“家族基因改組”方法的一個例子見Crameri等(1998)DNAshufflingofafamilyofgenesfromdiversespeciesacceleratesdirectedevolutionNature,391(6664)288-291中的描述。新型酶(不論生物合成通路的組分或合成酶)也可以通過DNA重組方法產生,這種方法稱為“產生雜交酶的漸進式截短技術”(ITCHY),如Ostermeier等,(1999)″AcombinatorialapproachtohybridenzymesindependentofDNAhomology″NatureBiotech171205中所述。這種方法也可用于產生酶或其它通路變體庫,這些酶或通路變體可作為一種或多種體外或體內重組方法的底物。見Ostermeier等(1999)″CombinatorialProteinEngineeringbyIncrementalTruncation,″Proc.Natl.Acad.Sci.USA,963562-67,和Ostermeier等(1999),″IncrementalTruncationasaStrategyintheEngineeringofNovelBiocatalysts,″BiologicalandMedicinalChemistry,72139-44。另外一種方法采用指數整體誘變來產生酶或其它通路變體庫,例如選出庫中能夠催化生物合成反應產生非天然氨基酸(或新的合成酶)的酶和通路變體。在這種方法中,感興趣序列中的小組殘基隨機地用于平行鑒定位置發生改變從而導致產生功能性蛋白質的各個氨基酸。適合用于本發明產生新的酶來產生非天然氨基酸(或新的合成酶)的這種方法的例子見于Delegrave和Youvan(1993)BiotechnologyResearch111548-1552的描述。在另一種方法中,利用摻入的(doped)或退化的寡核苷酸進行隨機或半隨機誘變來改造酶和/或通路組分,例如采用Arkin和Youvan(1992)″Optimizingnucleotidemixturestoencodespecificsubsetsofaminoacidsforsemi-randommutagenesis″Biotechnology10297-300或Reidhaar-Olson等,(1991)″Randommutagenesisofproteinsequencesusingoligonucleotidecassettes″MethodsEnzymol.208564-86所述的通用誘變方法。通常稱為“非隨機”誘變的另一種利用多核苷酸重新組裝和位點飽和誘變方法可用來產生酶和/或通路組分,然后篩選能夠自行一種或多種合成酶或生物合成通路的能(如在體內產生非天然氨基酸)的那些酶或組分。見Short的題為“基因疫苗和酶的非隨機產生”的專利申請WO00/46344。這種突變方法的一種取代方法包括重組生物的整個基因組并選擇產生的具有特定通路功能的子代(通常稱為“全基因組改組”)。這種方法也可用于本發明,如通過基因組重組和選擇能夠產生出非天然氨基酸(或其中間體)的生物(如大腸桿菌或其它細胞)。例如,下列文獻中所述的方法可用來設計通路以修飾細胞內現有的和/或新的通路,在體內產生非天然氨基酸Patnaik等(2002)″Genomeshufflingoflactobacillusforimprovedacidtolerance″NatureBiotechnology,20(7)707-712;以及Zhang等(2002)″Genomeshufflingleadstorapidphenotypicimprovementinbacteria″Nature,02-7,415(6872)644-646。現在已有一些其它技術可用來改造生物和代謝通路來產生所需化合物,這些方法也可用于產生非天然氨基酸。描述這種通路改造方法的文獻包括Nakamura和White(2003)″Metabolicengineeringforthemicrobialproductionof1,3propanediol″Curr.Opin.Biotechnol.14(5)454-9;Berry等(2002)″ApplicationofMetabolicEngineeringtoimproveboththeproductionanduseofBiotechIndigo″J.IndustrialMicrobiologyandBiotechnology28127-133;Banta等(2002)″OptimizinganartificialmetabolicpathwayEngineeringthecofactorspecificityofCorynebacterium2,5-diketo-D-gluconicacidreductaseforuseinvitaminCbiosynthesis″Biochemistry,41(20),6226-36;Selivonova等,(2001)″RapidEvolutionofNovelTraitsinMicroorganisms″AppliedandEnvironmentalMicrobiology,673645等等。一般來說,無論用什么方法,用本發明的經改造的生物合成通路所產生出的非天然氨基酸的濃度足以有效的生物合成蛋白質,例如可達到細胞內的天然含量,但對細胞的其它氨基酸的濃度不會產生顯著影響,或不會耗竭細胞內資源。以這種方式體內產生的濃度一般約為10mM到0.05mM。一旦細胞經過改造產生了特異性通路和產生非天然氨基酸所需的酶后,任選用于體內選擇以進一步優化用于核糖體蛋白合成和細胞生長的非天然氨基酸的產量。用于摻入非天然氨基酸的正交組分本發明提供了在體內響應選擇者密碼子,如琥珀終止密碼子、無義密碼子、四堿基或多堿基密碼子等產生能將非天然氨基酸(例如圖1中提供的非天然氨基酸)摻入到正在延伸的多肽鏈中的正交組分的方法和組合物。例如,本發明提供了正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)及兩者組成的對。這些正交對可用于將非天然氨基酸摻入到正在延伸的多肽鏈中。本發明的組合物包含正交氨酰-tRNA合成酶(O-RS),所述O-RS能利用以下氨基酸優先氨酰化O-tRNAp-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素丙氨酸、7-羥基-香豆素丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸、p-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸或p-硝基-L-苯丙氨酸。在某些實施方案中,O-RS包含含有SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57和59-63及其保守變體中的任何一種的氨基酸序列。在本發明的某些實施方案中,O-RS用特定的非天然氨基酸優先氨酰化任何內源性tRNA中的O-tRNA,其中的O-RS對O-tRNA有偏向(bias),且其中加載有非天然氨基酸的O-tRNA與加載有相同非天然氨基酸的內源性tRNA的比例大于1∶1,更優選地,其中的O-RS排他性地或者幾乎排他性地加載O-tRNA。含有O-RS的組合物還可以任選含有正交tRNA(O-tRNA),該O-tRNA可識別選擇者密碼子。一般來說,與包含或編碼于本文序列表(例如,SEQIDNO1)和實施例所列的多核苷酸序列的O-tRNA相比,在相關合成酶存在的條件下,本發明的O-tRNA為了響應選擇者密碼子而產生的抑制效率至少可達45%、50%、60%、75%、80%、90%或更高。在一個實施方案中,O-RS聯合O-tRNA所產生的抑制效率至少比缺少O-RS的O-tRNA所產生的抑制效率高5倍、10倍、15倍、20倍、25倍或更高。一方面,O-RS聯合O-tRNA所產生的抑制效率至少是詹氏甲烷球菌來源的正交酪氨酰-tRNA合成酶對或者衍生自大腸桿菌的正交亮氨酰-tRNA合成酶對所產生的抑制效率的45%。包含O-tRNA的組合物還可以包含細胞(例如真細菌細胞如大腸桿菌細胞等,或真核細胞如酵母細胞)和/或翻譯系統。本發明也提供包含翻譯系統的細胞(如真細菌細胞或酵母細胞),所述翻譯系統包含正交-tRNA(O-tRNA);正交氨酰-tRNA合成酶(O-RS)和非天然氨基酸,例如圖1所示的氨基酸。一般來說,O-RS能用非天然氨基酸優先氨酰化O-tRNA超過內源性tRNA,該O-RS對O-tRNA有偏向,故其中加載有非天然氨基酸的O-tRNA與加載有相同非天然氨基酸的內源性tRNA的比例大于1∶1,更優選該O-RS排他性地或者幾乎排他性地加載O-tRNA。O-tRNA可識別第一選擇者密碼子,O-RS能用非天然氨基酸優先氨酰化O-tRNA。在一個實施方案中,O-tRNA含有SEQIDNO1,SEQIDNO2所示的多核苷酸序列或其互補多核苷酸序列,或者由這些序列編碼。在一個實施方案中,該O-RS含有SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57、59-63中任何一個或其保守變體所示的氨基酸序列。本發明的細胞還可以包含其它不同的O-tRNA/O-RS對和第二種非天然氨基酸,例如,此O-tRNA可識別第二選擇者密碼子,此O-RS能用第二種非天然氨基酸優先氨酰化相應的O-tRNA。所述第二種氨基酸不同于第一非天然氨基酸。本發明的細胞可任選以包含含有感興趣多肽編碼多核苷酸的核酸,所述多核苷酸含有能被O-tRNA識別的選擇者密碼子。在某些實施方案中,本發明的細胞是真細菌細胞(如大腸桿菌)或酵母細胞,細胞內含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、非天然氨基酸和含有感興趣多肽編碼多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA識別的選擇者密碼子。在本發明的某些實施方案中,O-RS用非天然氨基酸優先氨酰化O-tRNA,其效率大于O-RS氨酰化任何內源性tRNA的效率。在本發明的某些實施方案中,本發明的O-tRNA含有本文序列表(例如,SEQIDNO1或SEQIDNO2)中和實施例中所示的多核苷酸序列或其互補的多核苷酸序列,或者被這些序列編碼。在本發明的某些實施方案中,O-RS含有序列表中所示的氨基酸序列或其保守變體。在一個實施方案中,O-RS或其片段被編碼本文序列表中和實施例中所示的氨基酸序列的多核苷酸序列或其互補的多核苷酸序列編碼。本發明的O-tRNA和/或O-RS可衍生自各種生物(如真核和/或非真核生物)。多核苷酸也是本發明的特征。本發明的多核苷酸包括人工的(如人造的和非天然產生的)多核苷酸,其中含有編碼本文序列表所示多肽的核苷酸序列,和/或與該多核苷酸序列互補的多核苷酸序列。本發明的多核苷酸還包括在高度嚴謹條件下能與上述多核苷酸在核酸全長上雜交的核酸。本發明的多核苷酸還包括與天然tRNA或其相應編碼核酸的序列具有至少75%、80%、90%、95%、98%或更高相同性的多核苷酸(但是本發明的多核苷酸不是天然tRNA或其相應的編碼核酸),所述tRNA可識別選擇者密碼子,如四堿基密碼子。與上述任何多核苷酸序列至少有80%、90%、95%、98%或更高相同性的人工多核苷酸序列,和/或含上述序列保守變體的多核苷酸也包括在本發明的多核苷酸范圍內。含本發明的多核苷酸的載體也是本發明的特征。例如,本發明的載體可以是質粒、粘粒、噬菌體、病毒、表達載體等。含本發明的載體的細胞也是本發明的特征。O-tRNA/O-RS對組分的產生方法也是本發明的特征。用這些方法產生的組分也是本發明的特征。例如,至少產生一種對細胞為正交的tRNA(O-tRNA)的方法包括制備突變體tRNA庫;突變tRNA突變庫每個成員的反密碼子環使其能識別選擇者密碼子,從而提供潛在的O-tRNA庫,用于陰性選擇第一物種的第一細胞群,所述細胞含有O-tRNA庫的成員。陰性選擇可去除含潛在O-tRNA庫成員的細胞,該潛在O-tRNA可被細胞內源性氨酰-tRNA合成酶(RS)氨酰化。由此提供了對第一物種的細胞為正交的tRNA庫,從而至少提供一種O-tRNA。也提供用本發明方法產生的O-tRNA。在某些實施方案中,本發明的方法還包括陽性選擇第一物種的第二細胞群,其中的細胞含有與第一物種的細胞正交的tRNA庫的成員、同源的氨酰-tRNA合成酶和陽性選擇標記。通過陽性選擇篩選出的那些細胞含有能被同源氨酰-tRNA合成酶氨酰化的tRNA庫的成員,在陽性選擇標記存在的情況下可出現預期的反應,從而可以獲得O-tRNA。在某些實施方案中,第二細胞群含有沒有被陰性選擇去除的細胞。本發明還提供了能用非天然氨基酸加載O-tRNA的正交-氨酰-tRNA合成酶的鑒定方法。例如,該方法包括篩選第一物種的細胞群,其中的細胞都含有1)一組氨酰-tRNA合成酶(RS)的成員(如一組RS可包括突變的RS、第一物種之外的物種來源的RS、或者二者都包括);2)正交-tRNA(O-tRNA)(如衍生自一個或多個物種);以及3)編碼陽性選擇標記并且至少包含一個選擇者密碼子的多核苷酸。選擇或篩選細胞(如宿主細胞)中與不含多種RS成員或所含成員數較少的細胞相比抑制效率提高的那些細胞。這些通過篩選得到的細胞含有能氨酰化O-tRNA的活性RS。用這種方法鑒定到的正交氨酰-tRNA合成酶也是本發明的特征。在細胞(例如真細菌細胞如大腸桿菌細胞等,或在酵母細胞)內產生所選位置含有非天然氨基酸的蛋白質的方法也是本發明的特征。例如,一種方法是在適當的培養基內培養細胞,其中的細胞含有核酸,該核酸至少含有一個選擇者密碼子,編碼一種蛋白,加入非天然氨基酸,在至少含有一個選擇者密碼子的核酸的翻譯過程中非天然氨基酸摻入到蛋白質的特定位置上,從而產生該蛋白質。細胞還含有在細胞內具有功能并且能識別選擇者密碼子的正交-tRNA(O-tRNA);以及用非天然氨基酸優先氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。用這種方法產生的蛋白質也是本發明的特征。本發明還提供了含有蛋白質的組合物,其中所述蛋白質包含,例如,p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素氨基酸、7-羥基-香豆素氨基酸、硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸、p-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸或p-硝基-L-苯丙氨酸。在某些實施方案中,蛋白質的氨基酸序列與已知蛋白如治療蛋白、診斷蛋白、工業用酶的氨基酸序列或其部分至少75%相同性。另外,組合物還可以包含藥學上可接受的載體。核酶和多肽序列及其變體如上文和下文所述,本發明提供了編碼例如O-tRNA和O-RS及多肽氨基酸序列的多核苷酸序列,例如O-RS,以及包含所述多核苷酸或多肽序列的組合物、系統和方法。所述序列的例子,如O-tRNA和O-RS的氨基酸和核苷酸序列也在本文中列出(見表5,例如SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57和59-63)。但是,本領域的技術人員應該了解本發明并不僅僅局限于這些序列,如實施例和列表中的序列。本領域的技術人員應當了解本發明還包括具有本文所述的功能,如編碼本文所述O-RS的保守變體的多核苷酸和多肽的相關序列。實施例1-16描述了能用非天然氨基酸(例如圖1提供的非天然氨基酸)氨酰化O-tRNA的正交合成酶種類(O-RS)的構建和分析。這些實施例描述了能摻入以下非天然氨基酸的O-RS種類的構建和分析p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素丙氨酸、7-羥基-香豆素丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸;p-異丙基硫代羰基-L-苯丙氨酸;3-硝基-L-酪氨酸和p-硝基-L-苯丙氨酸。本發明提供了多肽(O-RS)和多核苷酸,如O-tRNA、編碼O-RS或其片段的多核苷酸,用于分離氨酰-tRNA合成酶克隆的寡核苷酸等。本發明的多核苷酸包括那些編碼本發明的感興趣蛋白或多肽的含有一個或多個選擇者密碼子的多核苷酸。另外,本發明的多核苷酸還包括含有SEQIDNO11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51、56和58中所列核苷酸序列的多核苷酸;與它們互補的多核苷酸或者編碼這些多核苷酸序列的多核苷酸。本發明的多核苷酸還包括編碼含有SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57和59-63的O-RS氨基酸序列的多核苷酸。類似地,在高嚴謹條件下,可與上述多核苷酸在基本上全長核酸序列上雜交的人工核酸也包括在本發明的多核苷酸范圍內。在一個實施方案中,組合物包含本發明的多肽和賦形劑(如緩沖液、水、藥學上可接受的賦形劑等)。本發明還提供了可與本發明的多肽發生特異性免疫反應的抗體或抗血清。人工多核苷酸是人產生的,不是天然產生的多核苷酸。本發明的多核苷酸還包括人工的多核苷酸,這種多核苷酸與天然tRNA(但是天然tRNA除外)至少有75%、80%、90%、95%、98%或更高的相同性。多核苷酸還包括與天然tRNA的多核苷酸至少有75%、80%、90%、95%、98%或更高相同性(但不是100%相同)的人工多核苷酸。在某些實施方案中,載體(如質粒、粘粒、噬菌體、病毒等)含有本發明的多核苷酸。在一個實施方案中,所述載體是表達載體。在另一個實施方案中,所述表達載體包含與本發明的一種或多種多核苷酸操作性相連的啟動子。在另一個實施方案中,細胞包含攜帶本發明的多核苷酸的載體。本領域的技術人員將明白本發明還包括所公開序列的多種變體。例如,產生功能相同序列的公開序列的保守變體也包括在本發明的范圍內。認為核酸多核苷酸序列的一種公開序列雜交的變體也包括在本發明的范圍內。本文公開序列的獨特亞序列,例如可通過標準序列比較技術測定的獨特亞序列,也包括在本發明的范圍內。保守變體由于遺傳密碼的簡并性,“沉默取代”(即核酸序列中不會導致編碼多肽改變的取代)是編碼氨基酸的每個核酸序列所具有的特性。類似地,氨基酸序列中的一個或有限數目的氨基酸發生“保守氨基酸取代”指用具有高度相似性能的不同氨基酸取代,也不難鑒定是否與公開的構建物高度相似。每一個公開序列的這種保守變體也是本發明的特征。特定核酸序列的“保守變體”指那些編碼相同或基本上相同氨基酸序列的核酸,或者指雖然不編碼氨基酸序列、但序列基本上相同的核酸。本領域技術人員將認識到改變、添加或刪除編碼序列中的單個氨基酸或一小部分氨基酸(一般少于5%,更常見少于4%、2%或1%)是“保守修飾的變體”,所述改變可導致缺失氨基酸、加入氨基酸或以化學上相似的氨基酸取代原來的氨基酸。因此,本發明所列多肽序列的“保守變體”包括用具有相同保守取代基用的氨基酸取代小部分氨基酸,一般低于該多肽序列氨基酸總數的5%,更常見低于2%或1%。最后,加入序列不會改變核酸分子的編碼活性,例如加入無功能的序列成為該基礎氨基酸的保守變體。可提供功能相似氨基酸的保守取代表是本領域熟知的,其中一個氨基酸殘基被另一個具有相似化學特性(芳香族側鏈或帶正電荷的側鏈)的氨基酸取代,因此不會在實質上改變多肽分子的功能。下面列出了幾組具有相似化學特性的天然氨基酸,其中組內的取代都是“保守取代”。表1保守性氨基酸取代核酸雜交可用對比雜交鑒定本發明的核酸,包括本發明核酸的保守變體,這種對比雜交方法是一種區分本發明核酸的優選方法。另外,能在高、超高、超超高嚴謹條件下與SEQIDNO11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51、56和58所代表的那些核酸雜交的靶核酸也是本發明的特征。這類核酸的典型例子包括那些與一個給定核酸序列相比發生一個或幾個靜默核酸取代或保守核酸取代的核酸。當某測試核酸與某探針核酸雜交達到完全匹配靶核酸與探針的至少50%,即信噪比至少是探針與靶核酸雜交的一半,雜交條件為完全匹配的探針與完全匹配的互補靶核酸結合所產生的信噪比至少等于與不匹配靶核酸雜交所產生的信噪比的約5倍到10倍時,即說該測試核酸與該探針核酸特異性雜交。當核酸相遇時發生雜交,一般是在溶液中。核酸雜交是由于各種特性已知的物理-化學作用力,如氫鍵、溶劑排斥、堿基堆積等所致。有關核酸雜交的全面指南見Tijssen(1993)的《生物化學和分子生物學實驗技術-與核酸探針雜交》(LaboratoryTechniquesinBiochemistryandMolecularBiology-HybridizationwithNucleicAcidProbes)中第I部分第2章,“雜交原理和核酸探針試驗概述(Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays)”,(Elsevier,NewYork),以及《新編分子生物學實驗指南》(CurrentProtocolsinMolecularBiology),Ausubel等編,《新編實驗指南》(CurrentProtocols),GreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.合作出版,(2004年增刊)(“Ausubel”);Hames和Higgins(1995)編的GeneProbes1(基因探針1),牛津大學出版社IRL出版社,英國牛津(Hames和Higgins1)以及Hames和Higgins(1995)編的GeneProbes2(基因探針2),牛津大學出版社IRL出版社,英國牛津(Hames和Higgins2)詳細描述了DNA和RNA,其中包括寡核苷酸的合成、標記、檢測和定量方法。在DNA印跡或RNA印跡中,含有100個以上互補殘基的互補核酸在膜上雜交的嚴謹雜交條件的一個例子是50%甲醛、1mg肝素、42℃雜交過夜。嚴謹洗滌條件的一個例子是65℃用0.2×SSC洗滌15分鐘(見上述Sambrook對SSC緩沖液的描述)。常先用低嚴謹洗滌再用高嚴謹洗滌去除背景探針信號。低嚴謹洗滌的一個例子是40℃用2×SSC洗滌15分鐘。在特定雜交試驗中檢測到的信噪比高于無關探針所觀察到的5倍(或更高),表明檢測到特異性雜交。“嚴謹的雜交洗滌條件”就核酸雜交試驗如DNA印跡和RNA印跡而言是序列依賴性的,在不同的環境參數下該條件不同。有關核酸雜交的全面指南見上述的Tijssen(1993)和Hames和Higgins,1和2。任何測試核酸所用的嚴謹雜交和洗滌條件不難根據經驗確定。例如,在確定嚴謹雜交和洗滌條件時,可以逐漸提高雜交和洗滌條件的嚴謹程度(如,在雜交或洗滌過程中通過升高溫度、降低鹽濃度、增加洗滌劑的濃度和/或增加有機溶劑如甲醛的濃度),直到滿足了所選擇的一組標準。例如,在高嚴謹雜交和洗滌條件下,逐漸增加雜交和洗滌條件直到探針與互補靶核酸完全匹配,所產生的信噪比至少是探針與不匹配靶核酸雜交所產生的信噪比的5倍。對于一個特定探針來說,“十分嚴謹的”條件等于其熱解鏈點(Tm)。Tm是指50%的被檢測核酸與完全匹配的探針雜交時的溫度。一般來說,在一定的離子強度和pH條件下,本發明所選擇的“高嚴謹”雜交和洗滌條件比一個特定序列的Tm約低5℃。“超高嚴謹程度”的雜交和洗滌條件是指雜交和洗滌條件的嚴謹程度逐漸升高,直到探針與完全匹配的互補靶核酸結合所產生的信噪比至少達到探針與不匹配核酸雜交所觀察到的10倍。靶核酸在這種條件下與探針雜交,如果所產生的信噪比至少是完全匹配的互補靶核酸所產生的信噪比的1/2,那么就可以說靶核酸可以在超高嚴謹條件下與探針結合。類似地,可通過逐漸提高有關雜交試驗的雜交和/或洗滌條件來確定更高嚴謹水平。例如,提高雜交和洗滌條件的嚴謹性,直到探針與完全匹配的互補靶核酸結合所產生的信噪比至少高于探針與不匹配鈀核酸雜交所觀察到的10倍、20倍、50倍、100倍、500倍或更高。靶核酸在這種條件下與探針雜交,如果所產生的信噪比至少是完全匹配的互補靶核酸所產生的信噪比的1/2,那么就可以說靶核酸可以在超超高嚴謹條件下與探針結合。如果核酸編碼的多肽基本相同,即使在嚴謹條件下核酸不能彼此雜交,這兩個核酸也基本相同。這種情況發生在利用遺傳密碼所允許的最大簡并性產生核酸拷貝時。獨特的亞序列一方面,本發明提供了含獨特亞序列的核酸,這些亞序列位于選自本文所述的O-tRNA和O-RS序列的核酸內。與任何已知的O-tRNA或O-RS核酸序列相應的核酸相比,獨特亞序列都是獨特的。可利用BLAST進行核酸的排列,使用默認參數。任何獨特亞序列都可作為探針用于鑒定本發明的核酸。同樣,本發明還包括含獨特亞序列的多肽,這些獨特亞序列位于選自本文所述的O-RS序列的多肽內。在這里,與任何已知的多肽序列相應的多肽相比,獨特亞序列都是獨特的。本發明還提供了能在嚴謹條件下與獨特編碼寡核苷酸雜交的靶核酸,該寡核苷酸編碼選自O-RS序列的多肽內的獨特亞序列,其中的獨特亞序列與任何對照多肽(如本發明的合成酶來源的親本序列,如通過突變獲得)相應的多肽相比都是獨特的。獨特序列可通過上述方法確定。序列比較、相同性和同源性術語“相同的”或“相同性百分比”用于兩個或多個核酸或多肽序列的比較時是指兩個或多個序列或亞序列排列對比并比較其最大相似性時,這兩個或多個序列或亞序列是相同的,或者有特定百分比的氨基酸殘基或核苷酸是相同的,這種比較可利用下面所述的一種序列比較算法(或本領域技術人員所熟知的其它算法)或通過肉眼觀察來完成。術語“基本相同的”用于兩個或多個核酸或多肽(如編碼O-tRNA或O-RS的DNA,O-RS的氨基酸序列)的比較時是指兩個或多個序列或亞序列排列對比并比較其最大相似性時,這兩個或多個序列或亞序列至少有約60%、80%、90-95%、98%、99%或更多的核苷酸或氨基酸殘基是相同的,這種比較可利用序列比較算法或通過肉眼觀察來完成。不必參考其真實的祖先,一般認為這種“基本相同的”序列是“同源的”。“基本上相同”指在序列的一個區域內的比較,這個區域長度宜至少約為50個殘基,更優選至少約100個殘基,最優選二序列至少約含150個殘基基本上相同,或者在兩個序列的全長上進行比較。當蛋白和/或蛋白序列衍生自共同的親代蛋白或蛋白序列時,不論是天然的還是人造的,這些蛋白和/或蛋白序列是“同源的”。同樣,當核酸和/或核酸序列衍生自共同的親代核酸或核酸序列時,不論是天然的還人造的,這些核酸和/或核酸序列是“同源的”。例如,任何天然核酸都可用現有的誘變方法修飾使其包含一個或多個選擇者密碼子。當該誘變的核酸表達時,其編碼的多肽含有一個或多個非天然氨基酸。當然,該突變過程可能改變一個或多個標準密碼子,從而使產生的突變蛋白中也有一個或多個標準氨基酸的改變。同源性一般是根據兩個或多個核酸或蛋白質(或其序列)的序列相同性推算出來的。用于確定序列之間同源性的相似性精確百分比隨所比較的蛋白質和核酸而不同,但常規上至少有25%的序列相似才能確定同源性。更高水平的序列相同性,如30%、40%、50%、60%、70%、80%、90%、95%、99%或更高,也可用于確定同源性。確定序列相同性百分比的方法(如BLASTP和BLASTN,使用默認參數)見本文的描述,這些方法都是現有的。為了進行序列比較并確定其同源性,一般需要把一個序列看作參考序列,被檢測序列與之比較。在使用序列比較算法時,將被測序列與參考序列輸入到計算機內,如果需要,設定亞序列匹配值和序列算法程序的參數。序列比較算法就可以根據設定的程序參數計算出被測序列相對于參考序列的序列相同性百分比。進行序列比較的理想序列排列對比方法可用下列算法完成局部同源性算法,Smith&Waterman,Adv.Appl.Math.2482(1981);同源性排列對比算法,Needleman&Wunsch,J.Mol.Biol.48443(1970);相似性檢索方法,Pearson&Lipman,Proc.Nat′l.Acad.Sci.USA852444(1988),以及這些算法的計算機程序(WisconsinGeneticsSoftwarePackage內的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI),或者通過肉眼檢查(見CurrentProtocolsinMolecularBiology,Ausubel等編,CurrentProtocols,由GreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.合資出版,2004年增刊)。適于確定序列相同性和序列相似性百分比的算法的一個例子是BLAST算法,該算法的描述見Altschul等,J.Mol.Biol.215403-410(1990)。執行BLAST分析的軟件公眾可通過國家生物技術信息中心的網站(www.ncbi.nlm.nih.gov/)下載。這種算法包括先通過鑒定查詢序列中長度為W的短字符來確定高評分序列對(HSP),所述短字符在與序列數據庫中相同長度的字符排列對比時可匹配或滿足某些正閾值評分T。T稱為相鄰字符評分閾值(Altschul等,同上)。這些初始的相鄰字符采樣數(hits)作為種子啟動檢索來尋找含有這些字符的HSP。然后字符采樣數在每一序列的兩個方向上擴展,直到累積排列對比評分升高。用參數M(匹配殘基對的獎賞分數;總是大于0)和N(錯配殘基的懲罰分數;總是小于0)來計算核苷酸序列的累積評分。對于氨基酸來說,可利用計分矩陣來計算累積評分。字符采樣數在每個方向上的延伸停止于下列時刻累積排列對比評分從其曾達到的最大數值開始回落時;由于累積了一個或多個負評分殘基排列對比使累積評分達到0或0以下時;或者達到序列的末端時。BLAST算法的參數W、T和X決定了算法的靈敏度和速度。BLASTN程序(用于核苷酸序列)的默認參數為字長(W)=11,期望值(E)=10,終止值=100,M=5,N=-4,兩條鏈進行比較。對于氨基酸序列來說,BLASTP程序的默認參數為字長(W)=3,期望值(E)=10,使用BLOSUM62計分矩陣(見Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA8910915)。除了能夠計算序列相同性百分比以外,BLAST算法還可以進行兩個序列之間相似性的統計分析(見Karlin和Altschul,Proc.Nat′l.Acad.Sci.USA905873-5787(1993))。BLAST算法所提供的一個相似性數據是最小總概率(P(N)),這一數據說明了兩個核苷酸或氨基酸序列之間相匹配的可能性。例如,如果將被測核酸與參考核酸比較后得到的最小總概率約在0.1以下、優選約0.01以下、最優選的是約0.001以下,則這個核酸被認為與參考序列是相似的。誘變和其它分子生物學技術本發明的和用于本發明的多核苷酸和多肽可以用分子生物學技術進行操縱。描述分子生物學技術的綜合性教科書包括Berger和Kimmel的《分子克隆技術指南》(GuidetoMolecularCloningTechniques)第152卷“酶學方法”,AcademicPress,Inc.,SanDiego,CA(Berger);Sambrook等人的《分子克隆實驗手冊》(MolecularCloning-ALaboratoryManual)(第三版)1-3卷,冷泉港實驗室,紐約冷泉港,2001(″Sambrook″)和《現代分子生物學操作指南》(CurrentProtocolsinMolecularbiology),F.M.Ausubel等人編,《現代操作指南》(CurrentProtocols),GreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.,共同投資出版,(2003年增補)(″Ausubel″)。這些教科書描述了誘變、載體的使用、啟動子以及許多其它相關主題,如與基因產生有關的主題,包括可用于制備含有非天然氨基酸、正交tRNA、正交合成酶和它們組成的正交對的選擇者密碼子。本發明可利用各種類型的誘變來突變tRNA分子、產生tRNA庫、產生合成酶庫、將編碼非天然氨基酸的選擇者密碼子摻入感興趣蛋白或多肽中。這些技術包括但不限于定點誘變、隨機位點誘變、同源重組、DNA重組或其它的遞推誘變方法、嵌合體構建、利用含尿嘧啶的模板進行誘變、寡核苷酸定點突變、硫代磷酸酯修飾的DNA誘變、利用缺口雙鏈體DNA進行誘變等。其它合適的方法包括點錯配修復、利用修復缺陷宿主株的誘變、限制性選擇和限制性純化、缺失誘變、全基因合成誘變、雙鏈斷裂修復等。涉及嵌合體構建的誘變也包括在本發明范圍內。在一個實施方案中,可利用已知的有關天然分子或者改變的或突變的天然分子的信息,如序列、序列比較、物理特性、晶體結構等指導誘變。宿主細胞可用本發明的多核苷酸或包含本發明多核苷酸的構建物(如本發明的載體)進行遺傳工程改造(如轉化、轉導或轉染),所述載體可以是克隆載體,也可以是表達載體。例如,可將正交tRNA、正交tRNA合成酶及其衍生蛋白質的編碼區操作性連接于在所需宿主細胞內具有功能的基因表達調節元件。典型的載體包含轉錄和翻譯終止子、轉錄和翻譯起始序列和用于調節特定靶核酸表達的啟動子。載體任選包含基因表達盒,該盒中至少含有一個獨立的終止子序列,允許表達盒在真核或原核宿主、或者二者內(如穿梭載體)復制的序列以及用于原核和真核系統的選擇標記。載體應適合在原核或真核細胞內,優選在二者內表達和/或整合。見Giliman和Smith,Gene881(1979);Roberts等,Nature,328731(1987);Schneider,B.等,ProteinExpr.Purif.643510(1995);Ausubel,Sambrook,Berger(這三篇文獻同上)。載體可以是質粒、細菌、病毒、裸多核苷酸或偶聯多核苷酸形式。可用以下標準方法將載體導入到細胞和/或微生物內,包括電穿孔(From等,Proc.Natl.Acad.Sci.USA82,5824(1985));病毒載體感染;用小珠或微粒基質中或表面上含核酸的小顆粒高速轟擊穿透(Klein等,Nature327,70-73(1987))等。開發了能在大腸桿菌中響應琥珀終止密碼子(UAG)將非天然氨基酸位點特異性插入蛋白質的高度有效且通用的單質粒系統。在這種新的系統中,詹氏甲烷球菌(M.jannaschii)抑制基因tRNAtyr(CUA)和酪氨酰-tRNA合成酶對由可與大多數大腸桿菌表達載體兼容的單個質粒編碼。構建在proK啟動子和終止子控制下的單順反子tRNA操縱子以使二級結構和tRNA加工最佳。引入合成酶glnS啟動子的突變形式導致抑制效率和保真度顯著提高。通過tRNA基因的多拷貝以及通過該合成酶上的特定突變(D286R)也可提高抑制效率(Kobayashi等,“StructuralbasisfororthogonaltRNAspecificitiesoftyrosyl-tRNAsynthetasesforgeneticcodeexpansion”,Nat.Struct.Biol.,10(6)425-432)。高效且精確地摻入幾種不同的非天然氨基酸也證實了最佳系統的通用性,所述非天然氨基酸在研究蛋白質功能和結構中的特有用途之前已被證實。ATCC提供了可用于克隆的細菌和噬菌體的目錄,如ATCC出版的《細菌和噬菌體的ATCC目錄》(TheATCCCatalogueofBacteriaandBacteriophage)(1996),Gherna等(編)。用于測序、克隆和分子生物學其它方面的其它基礎方法及其理論闡述見于Sambrook(同上)、Ausubel(同上)和Watson等(1992)科學美國人叢書第二版重組DNA(RecombinantDNASecondEditionScientificAmericanBooks),NY。另外,幾乎所有核酸(以及幾乎所有的標記核酸,無論是標準的還是非標準的)都可以從各個公司里購買或訂購,如MidlandCertifiedReagentCompany(Midland,TXmcrc.com)、TheGreatAmericanGeneCompany(Ramona,CA,網址是www.genco.com)、ExpressGenInc.(Chicago,IL,網址是www.expressgen.com)、OperonTechnologiesInc.(Alameda,CA)等。經遺傳改造的宿主細胞可用經過適當改變以便于進行下列操作的常規營養培養基進行培養篩選、活化啟動子或篩選轉化子。這些細胞還可以培養成轉基因生物。有關細胞分離和培養(如用于亞序列核酸分離)的其它有用文獻包括Freshney(1994)《動物細胞培養-基本操作技術》(CultureofAnimalCells,aManualofBasicTechnique),第三版,Wiley-Liss,NewYork及其引用的參考文獻;Payne等(1992)《在液體系統中進行植物細胞培養和組織培養》(PlantCellandTissueCultureinLiquidSystems),JohnWiley&Sons,Inc.,NewYork,NY;Gamborg和Phillips(編)(1995)《植物細胞、組織和器官培養》(PlantCell,TissueandOrganCulture),FundamentalMethodsSpringerLabManual,Springer-Verlag(BerlinHeidelbergNewYork)以及Atlas和Parks(編)《微生物學培養基手冊》(TheHandbookofMicrobiologicalMedia)(1993),CRCPress,BocaRaton,FL。感興趣的蛋白和多肽在細胞內產生特定位置上為非天然氨基酸的蛋白質的方法也是本發明的特征。例如,一種方法是在適宜的培養基內培養細胞,其中的細胞含有至少包含一個選擇者密碼子并能編碼一個蛋白質的核酸;提供非天然氨基酸;其中的細胞還包含在細胞內具有功能并能識別選擇者密碼子的正交-tRNA(O-tRNA)和用非天然氨基酸優先氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。用這種方法產生的蛋白也是本法發明的特征。在某些實施方案中,相比任何內源性tRNA,O-RS在表達系統內傾向于氨酰化同源O-tRNA。當O-tRNA和O-RS以等摩爾濃度存在時,被O-RS加載的O-tRNA和內源性tRNA的相對比例大于1∶1,優選至少約2∶1,更優選5∶1,再優選10∶1,再優選20∶1,再優選50∶1,再優選75∶1,再優選95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。本發明還提供了含有蛋白質的組合物,其中所述蛋白質含有非天然氨基酸。在某些實施方案中,蛋白所包含的氨基酸序列與治療蛋白、診斷蛋白、工業用酶或其片段的序列至少有75%的相同性。本發明的組合物和利用本發明的方法產生出的組合物也可以存在于細胞內。因此本發明的O-tRNA/O-RS對或其單個組分可被用于宿主系統的翻譯機制中,從而將非天然氨基酸摻入到蛋白質內。國際專利申請WO2004/094593(申請日為2004年4月16日,名稱為“真核遺傳密碼的擴展”)和WO2002/085923(題為“非天然氨基酸的體內摻入”)描述了這一過程,本文已納入作為參考。例如,當O-tRNA/O-RS對被引入到宿主如大腸桿菌細胞或酵母細胞內后,O-tRNA/O-RS對在體內響應選擇者密碼子后可將例如下述非天然氨基酸摻入到蛋白質內p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素丙氨酸、7-羥基-香豆素丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸、p-異丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸或p-硝基-L-苯丙氨酸。加入系統的非天然氨基酸可以是合成的氨基酸,如苯丙氨酸或酪氨酸的衍生物,這是作為外源性物質加入到培養基內的。另外,本發明的組合物既可以用于體內翻譯系統,也可以用于體外翻譯系統。利用本發明的細胞可以大規模地合成含非天然氨基酸的蛋白質。一方面,組合物可以包含至少10μg、50μg、75μg、100μg、200μg、250μg、500μg、1mg、10mg或更多含非天然氨基酸的蛋白質,或者含有蛋白質的量能夠達到體內蛋白合成方法的要求(本文提供了重組蛋白產生和純化方法的詳細描述)。另一方面,組合物中所含的蛋白質濃度可以是每升細胞裂解物、緩沖液、藥學上可接受的緩沖液或其它液體懸液中至少含10μg、50μg、75μg、100μg、200μg、250μg、500μg、1mg、10mg或更高(如以1nL到100L的體積)。在細胞內大量產生(例如大于其它方法,如體外翻譯,在一般情況下所能達到的規模)至少含至少一個非天然氨基酸的蛋白質也是本發明的特征。摻入非天然氨基酸可導致蛋白質結構和/或功能的確定變化,如大小、酸性、親核性、氫鍵、疏水性、蛋白酶靶位點的易接近性、對基序的靶向性(如蛋白質陣列)摻入標記物或反應基團等。含有非天然氨基酸的蛋白質的催化或物理性能可能增強,或者獲得全新的催化或物理性能。例如,下列特性可任選通過在蛋白質內摻入非天然氨基酸而改變毒性、生物分布、結構特性、分光光度特性、化學和/或光化學特性、催化能力、半衰期(如血清半衰期)、與其它分子反應的能力(共價或非共價)。包含至少攜帶一個非天然氨基酸的蛋白質的組合物可用作新型治療蛋白、診斷蛋白、催化酶、工業用酶、結合蛋白(如抗體)以及蛋白質結構和功能的研究。見Dougherty,(2000)UnnaturalAminoAcidsasProbesofProteinStructureandFunction,CurrentOpinioninChemicalBiology,4645-652。在本發明的一些方面,組合物所包含的蛋白質至少含有1、2、3、4、5、6、7、8、9、10個或更多個非天然氨基酸。這些非天然氨基酸可以相同或不同,如在該蛋白質的1、2、3、4、5、6、7、8、9、10或更多個不同的位點上含有1、2、3、4、5、6、7、8、9、10或更多個不同的非天然氨基酸。另一方面,組合物包含一個蛋白質,這個蛋白質至少有一個但不是全部的特定氨基酸被非天然氨基酸取代。對于一個給定的含多個非天然氨基酸的蛋白質來說,其中的非天然氨基酸可以是相同的,也可以是不同的(如蛋白質包含兩個或多個不同類型的非天然氨基酸,或者包含兩個相同的非天然氨基酸)。對于一個給定的含兩個以上非天然氨基酸的蛋白質來說,其中的非天然氨基酸可以是相同的,也可以是不同的,或者其中有多個非天然氨基酸是相同的,但是至少有一個不同非天然氨基酸。一般來說,包含非天然氨基酸(及任何相應的編碼核酸,如包含一個或多個選擇者密碼子的核酸)的任何蛋白質都可用本發明的組合物和方法產生。不必嘗試鑒定成千上萬種已知蛋白質,任何蛋白質都可經修飾而含一個或多個非天然氨基酸的形式,例如可通過已建立的突變方法將一個或多個適合的選擇者密碼子摻入到相關的翻譯系統中。已知蛋白質序列的常用數據庫包括GenBankEMBL、DDBJ和NCBI。通過搜索互聯網不難鑒定到其它數據庫。一般來說,本發明的蛋白質與已有的蛋白(如治療蛋白、診斷蛋白、工業用酶,或其片段等)至少有60%、70%、75%、80%、90%、95%、99%或更高的相同性,其中包含一個或多個非天然氨基酸。可被修飾使其包含一個或多個非天然氨基酸的治療蛋白、診斷蛋白以及其它蛋白可在下列文獻中找到,但是又不僅僅局限于這些文獻2004年4月16日提交的題為“真核遺傳密碼的擴展”的國際專利申請WO2004/094593;以及WO2002/085923,題為“非天然氨基酸的體內摻入”。可被修飾使其包含一個或多個非天然氨基酸的治療蛋白、診斷蛋白以及其它蛋白包括但不限于α-1抗胰蛋白酶、血管他丁、抗溶血因子、抗體(有關抗體的詳細描述見下文)、載脂蛋白、脫輔基蛋白、心房利鈉因子、心房利鈉多肽、心房肽、C-X-C趨化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降鈣素、CC趨化因子(如單核細胞趨化蛋白-1、單核細胞趨化蛋白-2、單核細胞趨化蛋白-3、單核細胞炎癥蛋白-1α、單核細胞炎癥蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配基、C-kit配基、膠原蛋白、集落刺激因子(CSF)、補體因子5a、補體抑制因子、補體受體1、細胞因子(如上皮細胞中性粒細胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)表皮生長因子(EGF)、紅細胞生成素(EPO)、剝脫毒素A和B、因子IX、因子VII、因子VIII、因子X、成纖維細胞生長因子(FGF)、纖維蛋白原、纖連蛋白、G-CSF、GM-CSF、葡萄糖腦苷脂酶、絨毛膜促性腺激素、生長因子、Hedgehog蛋白(如Sonic、Indian、Desert)、血紅素、肝細胞生長因子(HGF)、水蛭素、人血清白蛋白、胰島素、胰島素樣生長因子(IGF)、干擾素(如IFN-α、IFN-β、IFN-γ)、白細胞介素(如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角質化細胞生長因子(KGF)、乳鐵蛋白、白血病抑制因子、熒光素酶、Neurturin、中性粒細胞抑制因子(NIF)、抑瘤素M、骨生成蛋白、甲狀旁腺激素、PD-ECSF、PDGF、肽類激素(如人生長激素、Pleiotropin、蛋白A、蛋白G、熱原性外毒素A、B和C、松弛素、腎素、SCF、可溶性補體受體1、可溶性I-CAM1、可溶性白細胞介素受體(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受體、生長調節素、生長抑素、生長激素、鏈激酶、超抗原即葡萄球菌腸毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物歧化酶(SOD)、中毒性休克綜合征毒素TSST-1)、胸腺素α1、組織纖溶酶原激活因子、腫瘤壞死因子β(TNFβ)、腫瘤壞死因子受體(TNFR)、腫瘤壞死因子-α(TNFα)、血管內皮生長因子(VEGEF)、尿激酶等。可以利用本發明的組合物和方法在體內產生出的含本文所述的非天然氨基酸的一類蛋白質是轉錄調節因子或其片段。轉錄調節因子的例子包括能調節細胞生長、分化、調控等的基因和轉錄調節蛋白。轉錄調節因子存在于原核細胞、病毒和真核生物如真菌、植物、酵母、昆蟲和動物如哺乳動物,提供了一個大范圍的治療靶位。應當理解的是表達和轉錄活化因子調節轉錄的機制很多,如與受體結合、刺激信號轉導級聯、調節轉錄因子的表達、與啟動子和增強子結合、與啟動子和增強子結合的蛋白結合、解鏈DNA、剪接mRNA前體、多聚腺苷酸化RNA和降解RNA。本發明的一類蛋白質(如攜帶一個或多個非天然氨基酸)的蛋白質)包括生物活性蛋白質,如細胞因子、炎癥分子、生長因子及其受體、以及癌基因產物,如白細胞介素(如IL-1、IL-2、IL-8等)、干擾素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和hyalurin/CD44;信號轉導分子和相應的癌基因產物,如Mos、Ras、Raf和Met;以及轉錄活化因子和抑制因子,如p53、Tat、Fos、Myc、Jun、Myb、Rel,以及類固醇激素受體,如雌激素、孕酮、睪丸酮、醛固酮的受體、LDL受體的配基和皮質酮。本發明還提供至少含有一個非天然氨基酸的酶(如工業用酶)或其片段。酶的例子包括但不限于酰胺酶、氨基酸消旋酶、酰基轉移酶、脫鹵素酶、二氧合酶、二芳基丙烷過氧化物酶、表位酶、環氧化物水解酶、酯酶、異構酶、激酶、葡萄糖異構酶、糖苷酶、葡萄糖酰基轉移酶、鹵代過氧化物酶(haloperoxidase)、單加氧酶(如p450)、脂肪酶、木素過氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酯酶、枯草桿菌蛋白酶、轉氨酶和核酶。這些蛋白中有許多是可以從公司購買到的(見SigmaBioSciences的2002年產品目錄和價目表),其相應的蛋白序列和基因及其變體通常都是已知的(見Genbank)。它們都可以按照本發明的方法通過摻入一個或多個非天然氨基酸來加以修飾,例如改變蛋白質的一種或多種治療、診斷或酶催化特性。與治療相關的特性包括血清半衰期、保存半衰期、穩定性、免疫原性、治療活性、可檢測性(如在非天然氨基酸中摻入報告基團(如標記物或標記結合位點))、LD50或其它負效應的降低、通過胃腸道進入體內的能力(如口服利用度)等。診斷特性的例子包括保存半衰期、穩定性、診斷活性、可檢測性等。相關的酶催化特性的例子包括保存半衰期、穩定性、酶活性、產生能力等。其它各種蛋白也可用本發明的組合物和方法修飾而含有一個或多個非天然氨基酸。例如,本發明可包括在一種或多種疫苗蛋白質中用非天然氨基酸取代一個或多個天然氨基酸,所述蛋白來自于傳染性真菌,如曲霉屬、念珠菌屬真菌;細菌,特別是大腸桿菌,可以作為致病菌的模型,和醫學上重要的細菌如葡萄球菌屬(如金黃色葡萄糖球菌)或鏈球菌屬(如肺炎鏈球菌)的細菌;原蟲如孢子蟲(如剛地弓形蟲)、根足蟲(如阿米巴原蟲)和鞭毛蟲(錐蟲、利什曼原蟲、毛滴蟲、鞭毛蟲等);病毒如(+)RNA病毒(例子包括痘病毒如痘苗病毒;細小核糖核酸病毒如脊髓灰質炎病毒;披膜病毒如風疹病毒;黃病毒如HCV;以及冠狀病毒),(-)RNA病毒(如彈狀病毒如VSV;副黏病毒如RSV;正粘病毒如流感病毒;布尼亞病毒;以及沙粒病毒),dsDNA病毒(如呼腸孤病毒),RNA到DNA的病毒,即逆轉錄病毒如HIV和HTLV,以及某些DNA到RNA的病毒如乙肝病毒。與農業有關的蛋白質如昆蟲抗性蛋白(如Cry蛋白)、淀粉和脂質生成酶、植物和昆蟲毒素、毒素抗性蛋白、霉菌毒素脫毒蛋白、植物生長酶(如核酮糖1,5-二磷酸羧化酶/氧合酶,″RUBISCO″)、脂肪加氧酶(LOX)、以及磷酸烯醇丙酮酸(PEP)羧化酶也是非天然氨基酸修飾的適當靶標。在某些實施方案中,本發明的方法和/或組合物中感興趣蛋白或多肽(或其片段)是由核酸編碼的。一般來說,這種核酸至少含有1、2、3、4、5、6、7、8、9、10個或更多個選擇者密碼子。感興趣蛋白或多肽的編碼基因可用本領域技術人員熟知的方法以及本文“突變和其它分子生物學技術”部分描述的方法加以突變使其包含用于摻入非天然氨基酸的一個或多個選擇者密碼子。例如,突變感興趣蛋白的編碼核酸使其含有一個或多個選擇者密碼子,因而可插入一個或多個非天然氨基酸。本發明包括任何蛋白的這種突變,如至少含有一個非天然氨基酸。同樣,本發明還包括相應的核酸,即含有一個或多個編碼一個或多個非天然氨基酸的選擇者密碼子的任何核酸。為了使蛋白包含非天然氨基酸,需要使用適于通過正交tRNA/RS對在體內摻入非天然氨基酸的宿主細胞和生物。宿主細胞用一種或多種載體進行遺傳改造(如轉化、轉導或轉染),這些載體表達正交tRNA、正交tRNA合成酶和編碼衍生蛋白的載體。這些組分可以位于同一個載體上,或者位于不同的載體上,或者兩個組分位于一個載體上而第三個組分位于第二個載體上。載體可以是質粒、細菌、病毒、裸多核苷酸或偶聯多核苷酸形式。根據免疫活性定義多肽由于本發明的多肽提供了各種新的多肽序列(如在本文翻譯系統合成的蛋白中含有非天然氨基酸或者在新型合成酶、標準氨基酸的新型序列中含有非天然氨基酸),因此這些多肽也提供了能在免疫試驗中被識別的新型結構特征。產生能特異性結合本發明多肽的抗血清以及這些抗血清結合的多肽也是本發明的特征。本文所用的術語“抗體”包括但不限于免疫球蛋白基因或其片段編碼的多肽,這些多肽能特異性識別并結合分析物(抗原)。例子包括多克隆抗體、單克隆抗體、嵌合抗體和單鏈抗體等。免疫球蛋白的片段包括Fab片段和表達庫包括噬菌體展示庫產生的片段,也包括在本文所用的術語“抗體”之中。見Paul編的《基礎免疫學》(FuncamentalImmunology),第四版,1999,RavenPress,NewYork,的抗體結構和術語。為了產生用于免疫試驗的抗血清,可如本文所述產生和純化一種或多種免疫原性多肽。例如,可用重組細胞產生重組蛋白。純系小鼠(可用于此試驗中,因為這種小鼠遺傳上實際相同,得到的結果重復性更高)用含標準佐劑如福氏完全佐劑的免疫原性蛋白按照標準的小鼠免疫方法免疫(見Harlow和Lane(1988),《抗體-實驗室操作手冊》(Antibodies,ALaboratoryManual)(冷泉港出版社,紐約)關于抗體產生、用于測定特異性免疫反應的免疫試驗方法和條件的標準描述)。關于蛋白質、抗體、抗血清等的其它詳細描述見題為“真核遺傳密碼的擴展”的國際公開號WO2004/094593;題為“非天然氨基酸的體內摻入”的WO2002/085923;題為“糖蛋白的合成(GLYCOPROTEINSYNTHESIS)”的WO2004/035605;以及題為“蛋白質陣列(PROTEINARRAYS)”的WO2004/058946。O-TRNA和O-RS以及O-TRNA/O-RS對的應用本發明的組合物和用本發明方法制備的組合物任選存在于細胞內。因而本發明的O-tRNA/O-RS對或其各個組分可為宿主系統的翻譯機制所利用,結果導致將非天然氨基酸摻入蛋白質中。Schultz等人的國際公開專利“非天然氨基酸的體內摻入”(WO2002/085923)描述了這一過程,本文納入作為參考。例如,當將O-tRNA/O-RS對導入到宿主如大腸桿菌或酵母時,O-tRNA/O-RS對可響應選擇者密碼子如琥珀無義密碼子在體內將外源加入到培養基中的非天然氨基酸摻入到蛋白質如肌紅蛋白或治療蛋白中。本發明的組合物可任選用于體外翻譯系統中,或體內細胞系統中。含非天然氨基酸的蛋白質的應用范圍廣泛,例如非天然氨基酸摻入的蛋白質可作為廣泛修飾的靶標,如與其它蛋白質、與小分子如標記物或染料和/或生物分子偶聯。通過這些修飾,摻入非天然氨基酸可產生改進的治療蛋白,可用于改變或促進酶的催化功能。在其它方面,蛋白質中摻入非天然氨基酸和亞序列修飾有助于研究蛋白質的結構、與其它蛋白質的相互作用。光可調節(PHOTOREGULATION)和光囚禁光可調節的(Photoregulated)氨基酸(例如,光致變色的、光可剪切的(photocleavable)、光促異構的等)可用于在空間和時間上控制多種生物過程,例如,通過直接調節酶、受體、離子通道等的活性,或通過調節各種信號傳導分子的胞內濃度。參見,例如,Shigeri等,Pharmacol.Therapeut.,2001,9185;Curley等,Pharmacol.Therapeut.,1999,82347;Curley等,Curr.Op.Chem.Bio.,1999,384;“囚禁的化合物(CagedCompounds)”《酶學方法》(MethodsinEnzymology),Marriott,G.編,AcademicPress,NY,1998,V.291;Adams等,Annu.Rev.Physiol.,1993,55755+;和Bochet等,J.Chem.Soc.,Perkin1,2002,125。在本文各實施方案中,所述組合物和方法包含光調節的氨基酸。例如,本發明提供用于摻入光調節的非天然氨基酸o-硝基芐基-絲氨酸和O-(2-硝基芐基)-L-酪氨酸的正交翻譯系統(見圖1和實施例8和9)。“光可調節的氨基酸”通常是,例如,光敏氨基酸。光調節的氨基酸通常是那些可用光(例如,UV、IR等)以某些方式進行控制的氨基酸。因此,例如,如果光調節的氨基酸被摻入具有生物學活性的多肽,則通過光照可改變氨基酸,從而改變肽的生物學活性。一些光調節的氨基酸可包括“光囚禁的氨基酸”、“光敏氨基酸”、“光不穩定性氨基酸”、“光促異構的氨基酸”等。“囚禁的種類”,如囚禁的氨基酸或囚禁的肽,是那些陷入較大實體(如分子)并在特定光照下釋放的種類。參見,例如,Adams等,Annu.Rev.Physiol.,1993,55755-784。氨基酸的“囚禁”基團可能抑制或掩蔽(例如,通過打斷通常用來穩定與靶分子之間相互作用的鍵,通過改變特定側鏈的疏水性或離子特性,或通過空間位阻等)分子(如含有這種氨基酸的肽)的生物學活性。“光促異構的”氨基酸可由于光照而改變異構體的形式。摻入后,這種氨基酸的不同異構體可停止與蛋白質中其它側鏈的各種相互作用。光調節的氨基酸因此可控制含有它們的肽的生物學活性(通過激活、部分激活、滅活、部分滅活、修飾激活等)。參見上述Adams的論文以及該部分的其它參考資料以了解光調節的氨基酸和分子進一步的定義和例子。本領域已知許多光調節的氨基酸,且許多是可通過商業獲得的。將光調節部分附加和/或關聯到氨基酸的方法是已知的。這種光調節的氨基酸通常滿足這里的各實施方案。應該理解,雖然這里列出了許多可能的光調節部分,例如光囚禁基團等,以及許多光調節的氨基酸,當這種例舉不應視為限制。因此,本發明也適用于這里沒有特別提到的光調節部分和光調節的氨基酸。如上所述,許多方法都可用來產生光調節的氨基酸。因此,例如,光調節的氨基酸,例如,光囚禁的氨基酸可用諸如BOC(丁氧羰基)的化合物保護其α-氨基并用諸如叔丁酯的化合物保護α-羧基而產生。這種保護之后可使氨基酸側鏈與反應性形式如如2-硝基芐基氯甲酸酯、α-羧基2-硝基芐基溴化物甲酯或2-硝基芐基重氮乙烷中的光不穩定性囚禁基如2-硝基芐基反應。加入光不穩定性囚禁基之后,可通過標準方法除去保護基。參見,例如,USPN5,998,580。另一個例子中,賴氨酸殘基可用2-硝基芐基氯甲酸酯囚禁以衍生ε-賴氨酸氨基,從而除去正電荷。或者,就用α-羧基2-硝基芐氧基羰基囚禁基在肽(含有這種賴氨酸)中引入負電荷而囚禁賴氨酸。此外,可用1(2-硝基苯基)重氮乙烷處理磷酸氨基酸或磷酸肽而囚禁磷酸絲氨酸和磷酸蘇氨酸。參見,例如,Walker等,MethEnzymol.172288-301,1989。許多其它氨基酸也方便地適用于標準囚禁化學,例如絲氨酸、蘇氨酸、組氨酸、谷氨酰胺、天冬酰胺、天冬氨酸和谷氨酸。參見,例如,Wilcox等,J.Org.Chem.551585-1589,1990)。再者,應理解,例舉特定光調節的氨基酸和/或那些能夠轉變為光調節形式的氨基酸不應視為限制。也可用其它方式制備光調節的氨基酸殘基(例如,光敏或光不穩定)。例如,可制備某些氨基酸殘基,其中,光照將導致切斷含有特定氨基酸殘基的肽主鏈。例如,光不穩定性甘氨酸、2-硝基苯基甘氨酸可以這種方法發揮作用。參見,例如,Davis等,1973,J.Med.Chem.,161043-1045。照射含有2-硝基苯基甘氨酸的肽將切除2-硝基苯基甘氨酸的α碳和α氨基之間的肽主鏈。如果將2-硝基芐基插入α碳和α氨基之間,則這種切割策略通常適用于甘氨酸之外的氨基酸。本領域已知系多光調劑基團,如囚禁基,和許多用來共價連接這種基團與其它分子(如氨基酸)的反應性化合物。光調節(例如,光不穩定、光囚禁)基團的例子包括,但不限于o-硝基芐基-絲氨酸,O-(2-硝基芐基)-L-酪氨酸,硝基二氫吲哚;N-酰基-7-硝基二氫吲哚;苯酰基;羥基苯酰基;溴化7-羥基香豆素-4-基甲基(例如,Bhc);安息香酯;二甲氧基安息香;間-苯酚;2-硝基芐基;1-(4,5-二甲氧基-2-硝基苯基)乙基(DMNPE);4,5-二甲氧基-2-硝基芐基(DMNB);α-羧基-2-硝基芐基(CNB);1-(2-硝基苯基)乙基(NPE);5-羧基甲氧基-2-硝基芐基(CMNB);(5-羧基甲氧基-2-硝基芐基)氧)羰基;(4,5-二甲氧基-2-硝基芐基)氧)羰基;脫氧安息香基等。參見,例如,Haugland和Gee(1997-1-3)的題為“α-羧基囚禁的化合物”的USPN5,635,608;Neuro19,465(1997);JPhysiol508.3,801(1998);ProcNatlAcadSciUSA1988Sep,85(17)6571-5;JBiolChem1997Feb14,272(7)4172-8;Neuron20,619-624,1998;NatureGenetics,第28卷2001317-325;Nature,第392卷,1998936-941;Pan,P.和Bayley,H.“囚禁的半胱氨酸和硫代膦酰肽”FEBSLetters40581-85(1997);Pettit等(1997)“化學雙光子未囚禁描繪谷氨酸鹽受體的新方法(Chemicaltwo-photonuncaginganovelapproachtomappingglutamatereceptors)”Neuron19465-471;Furuta等(1999)“Brominated7-hydroxycoumarin-4-ylmethylsnovelphotolabileprotectinggroupswithbiologicallyusefulcross-sectionsfortwophotonphotolysis”Proc.Natl.Acad.Sci.96(4)1193-1200;Zou等“CatalyticsubunitofpeoteinkinaseAcagedattheactivatingphosphothreonine”J.Amer.Chem.Soc.(2002)1248220-8229;Zou等“CagedThiophosphotyrosinePeptides”Angew.Chem.Int.Ed.(2001)403049-3051;ConradII等“p-HydroxyphenacylPhototriggersThereactiveExcitedStateofPhosphatePhotorelease”J.Am.Chem.Soc.(2000)1229346-9347;ConradII等“NewPhototriggers10Extendingtheπ,π*AbsorptiontoReleasePeptidesinBiologicalMedia”Org.Lett.(2000)21545-1547;Givens等“ANewPhototriggers9p-HydroxyphenacylasaC-TerminusPhotoremovableProtectingGroupforOligopeptides”J.Am.Chem.Soc.(2000)1222687-2697;Bishop等“40-Aminomethyl-2,20-bipyridyl-4-carboxylicAcid(Abc)andRelatedDerivativesNovelBipyridineAminoAcidsfortheSolid-PhaseIncorporationofaMetalCoordinationSiteWithinaPeptideBackbone”Tetrahedron(2000)564629-4638;Ching等“PolymersAsSurface-BasedTetherswithPhotolytictriggersEnablingLaser-InducedRelease/DesorptionofCovalentlyBoundMolecules”BioconjugateChemistry(1996)7525-8;生物探針手冊(BioProbesHandbook),2002,MolecularProbes,Inc.;和熒光探針和研究產品手冊(HandbookofFluorescentProbesandResearchProducts),第9版或Web版,MolecularProbes,Inc,以及本文的參考文獻。可通過商業獲得許多用于囚禁各種分子的化合物、試劑盒等,例如,購自MolecularProbes,Inc。在以下文獻中能找到其它參考資料,例如,Merrifield,Science232341(1986),Corrie,J.E.T.和Trentham,D.R.(1993)摘自Morrison,H.編的《光化學開關的生物應用》(BiologicalApplicationsofPhotochemicalSwitches),JohnWileyandSons,Inc.NewYork,第243-305頁。合適光敏囚禁基的例子包括,但不限于,2-硝基芐基、安息香酯、N-酰基-7-硝基二氫吲哚(nitindoline)、間-苯酚和苯酰基。一些實施方案中,光調節(例如,囚禁)基團可任選含有可結合第二結合部分的第一結合部分。例如,市售的囚禁的亞磷酰胺[1-N-(4,4′-二甲氧基三苯甲基)-5-(6-生物素氨基己酰氨基甲基)-1-(2-硝基苯基)-乙基]-2-氰基乙基-(N,N-二異丙基)-亞磷酰胺(PCBiotinPhosphoramadite,獲自GlenResearchCorp.,www.glenres.com)包含光不穩定性基團和生物素(第一結合部分)。第二結合部分,例如,鏈霉抗生物素蛋白或抗生物素蛋白,因此可與囚禁基結合、提高其膨松度(bulkiness)及囚禁效率。在某些實施方案中,囚禁的組分包含兩個或多個囚禁基,它們分別含有第一結合部分和可同時結合兩個或多個第一結合部分的第二結合部分。例如,囚禁的組分可含有至少兩個生物素化的囚禁基;鏈霉抗生物素蛋白與多個囚禁的組分分子上多個生物素部分的結合將囚禁組分連接成巨大網絡。切除附加到組分生物素上的光不穩定性基團導致該網絡解散。形成囚禁的多肽(包括例如肽和蛋白質,如抗體或轉錄因子)的常規方法包括,例如,使多肽與囚禁化合物反應或在多肽合成過程中摻入囚禁的氨基酸。參見,例如,Fay等的(1999-12-7)題為“光敏囚禁的大分子”美國專利No.5,998,580;Kossel等(2001)PNAS9814702-14707;TrendsPlantSci(1999)4330-334;PNAS(1998)951568-1573;J.Am.Chem.Soc.(2002)1248220-8229;Pharmacology&Therapeutics(2001)9185-92;和Angew.Chem.Int.Ed.Engl.(2001)403049-3051。光不穩定性多肽結合(例如,用于連接蛋白質轉導結構域和傳感器等)可以例如包含光不穩定性氨基酸,如美國專利No.5,998,580中描述的那些。用光照射可例如釋放氨基酸的側鏈殘基,該殘基對于含有這種氨基酸的肽的活性是重要的。此外,一些實施方案中,未囚禁的氨基酸可切除含有這種氨基酸的肽的肽主鏈,因此例如可打開環肽而形成具有不同生物特性等的直線肽。可通過精通本領域的技術人員已知的任何標準方法破壞光調節的氨基酸上的光敏囚禁基從而激活囚禁的肽。例如,可將光敏氨基酸暴露于合適的常規光源如激光(例如,在UV范圍或紅外范圍發射)而進行去囚禁或激活。那些精通本領域的技術人員將了解并熟悉許多具有適當波長和能量的其它激光以及適用于光調節的氨基酸(如這里提到的那些)的合適的應用方法(例如,暴露時間等)。釋放光調節的囚禁的氨基酸能夠控制含有這種氨基酸的肽。這種控制可發生在空間上或時間上。例如,暴露于聚焦的激光可在一個位置去囚禁氨基酸,而不會去囚禁其它位置上的氨基酸。那些精通本領域的技術人員將了解許多可用來評價光調節的氨基酸活性的試驗,例如,本文實施例中描述的試驗。可在將含有光調節的氨基酸引入細胞或組織之前和之后以及釋放光調節的分子之后測試諸如細胞功能、組織功能等許多內容。這里所述的組合物和方法可用于許多方面。例如,由于可通過靶定位的光照射使光調節的氨基酸激活/失活/等,因此光調節的氨基酸(例如,在肽中的)可將治療化合物遞送到機體的不同部位。應該了解,本發明的方法、結構和組合物可用于摻入/利用光調節的天然氨基酸(例如,連接/結合含光調節部分的氨基酸)。可利用光致變色的和光可剪切的基團在空間和時間上調控各種生物過程,這可通過以下方式實現直接調節酶活性(參見,例如,Westmark等,J.Am.Chem.Soc.1993,1153416-19以及Hohsaka等,J.Am.Chem.Soc.1994,116413-4)、受體活性(參見,例如,Bartels等,Proc.Natl.Acad.Sci.USA,1971,681820-3;Lester等,Nature1977,266373-4Cruz等,J.Am.Chem.Soc.,2000,1228777-8;和Pollitt等,Angew.Chem.Int.Ed.Engl.,1998,372104-7)或離子通道活性(參見,例如,Lien等,J.Am.Chem.Soc.1996,11812222-3;Borisenko等,J.Am.Chem.Soc.2000,1226364-70;和Banghart等,Nat.Neurosci.2004,71381-6),或調節各種信號分子的胞內濃度(參見,例如,Adams等,Annu.Rev.Physiol.1993,55755-84)。通常,這要求用光反應性配體如偶氮苯或硝基芐基化學修飾蛋白質或小分子。在活生物中將光反應性氨基酸遺傳直接摻入蛋白質預定位點的能力將顯著擴大該技術的應用范圍。參見,例如,Wu等,J.Am.Chem.Soc.2004,12614306-7。試劑盒試劑盒也是本發明的特征。例如,本發明提供了用于在細胞內產生至少含一個非天然氨基酸的蛋白質的試劑盒,所述試劑盒包括一個盛有O-tRNA和/或O-tRNA編碼多核苷酸序列、和/或O-RS編碼多核苷酸序列、和/或O-RS的容器。在一個實施方案中,試劑盒還裝有諸如p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素丙氨酸、7-羥基-香豆素丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸;p-異丙基硫代羰基-L-苯丙氨酸;3-硝基-L-酪氨酸或p-硝基-L-苯丙氨酸的非天然氨基酸。在另一個實施方案中,試劑盒還裝有關于產生蛋白質的說明書。實施例下面所提供的實施例只是為了說明,并不意味著對本發明權利要求的限制。本領域的技術人員應該認識到,只要不偏離本發明權利要求的范圍,許多非關鍵的參數都可以改變。實施例1用于在大腸桿菌體內蛋白質中摻入3-硝基-L-酪氨酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將3-硝基-L-酪氨酸(見圖1)通過生物合成摻入蛋白質的組合物和方法。從甲烷球菌中分離得到的新型正交tRNA/合成酶對在大腸桿菌宿主細胞系統中具有功能。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA(SEQIDNO1)聯用。這些新的正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。所得到的正交tRNA合成酶能選擇性地用3-硝基-L-酪氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入3-硝基-L-酪氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。用已報道的方法分離得到新型合成酶,參見Alfonta等,JournaloftheAmericanChemicalSociety125(48)14662-14663(2003);以及國際專利公開號WO2005/038002,2005年4月28日公開。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫。野生型甲烷球菌酪氨酰tRNA合成酶分子的氨基酸序列和多聚核苷酸序列見表5,分別為SEQIDNOS3和4。根據嗜熱脂肪芽孢桿菌的同源酪氨酰tRNA合成酶晶體結構,誘變包含隨機預測活性位點上的殘基。誘變后,對突變庫內諸合成酶進行5輪正負篩選。選擇得到了7株能用3-硝基-L-酪氨酸加載O-tRNA的合成酶克隆,命名為克隆A到克隆G。對這些選出的合成酶克隆測序,確定其氨基酸序列如下表2克隆A、B、C、E和G都為相同的突變體序列。克隆D和F顯示具有不同的序列。這些突變體合成酶的氨基酸序列提供在表5中,為SEQIDNOS7-9。實施例2用于在大腸桿菌體內蛋白質中摻入p-硝基-L-苯丙氨酸(NO2-Phe)的正交翻譯組分本實施例描述了利用新型正交翻譯系統將p-硝基-L-苯丙氨酸(見圖1;也寫成NO2-Phe)位點特異性用遺傳工程程序性方法摻入到大腸桿菌蛋白質內。非天然氨基酸NO2-Phe曾被用作光親和標記探針來研究蛋白質-受體結構(Dong,Mol.Pharmacol.2005,69,1892),以及用作熒光淬滅劑來研究蛋白酶的活性(Wang,Biochem.Biophys.Res.Comm.1994,201835)和蛋白質結構(Sisido,J.Am.Chem.Soc.1998,1207520;2002,12414586)。已采用三堿基(Schultz,Science1989,244182)、四堿基(M.Sisido)和五堿基(M.Sisido,NucleicAcidsRes.2001,29,3646)密碼子通過體外生物合成方法將此種氨基酸位點特異性地摻入到蛋白質內。但是,這種方法所得到的蛋白量通常很低。另外,該方法因需要化學計量的酰化tRNA且不能再生氨酰tRNA而受到限制。考慮到這些局限性,我們開發了一種新型的體內正交翻譯系統,可將非天然氨基酸直接摻入到蛋白質內,見下文所述。為了在大腸桿菌內遺傳編碼NO2-Phe,須改變甲烷球菌正交酪氨酰tRNA合成酶(MjTyrRS)的特異性,以使該合成酶能夠特異性地用非天然氨基酸NO2-Phe加載突變體酪氨酸琥珀抑制型tRNA(mutRNACUATyr)。該突變體合成酶來源于對突變體MjTyrRS庫的篩選。根據能選擇性地用p-溴代苯丙氨酸加載mutRNACUATyr的突變體MjTyrRS的晶體結構分析選擇突變體庫中進行誘變的位置。在1mMNO2-Phe存在或不存在下,用mutRNACUATyr和突變體MjTyrRS庫進行幾輪正負篩選后,產生了一個在高濃度氯霉素(90μg/mL)下存活依賴于NO2-Phe存在的克隆。另外,該選出的克隆只在NO2-Phe與T7/GFPuv報告基因存在時才能觀察到綠色熒光,T7/GFPuv報告基因中的位點上含有琥珀選擇密碼子。此結果提示產生的該合成酶對NO2-Phe的特異性比對其它任何天然氨基酸更高。該克隆的測序結果表明在產生的此合成酶中存在下列突變Tyr32→LeuGlu107→SerAsp158→ProIle159→LeuHis160→AsnLeu162→Glu此克隆的核苷酸序列提供在表5中,為SEQIDNO11,其相應的氨基酸序列也提供在表5中,為SEQIDNO10。為了檢測產生的此合成酶(mutNO2-PheRS)和mutRNATyCUATyr能夠將NO2-Phe選擇性摻入到蛋白質內,將C末端含六個組氨酸尾的蛋白質Z區基因中允許的位點(Lys7)替換成琥珀終止密碼子。將用mutNO2-PheRS、mutRNACUATyr和Z區基因轉化的細胞在含1mMNO2-Phe的GMML基礎培養基中培養。用Ni2+親和柱純化突變蛋白質,然后用SDS-PAGE(見圖2)和MALDI-TOF(圖3)分析。MALDI-TOF分析觀察到的質量(m/e=7958)與摻入了NO2-Phe的Z區蛋白的預期質量(m/e=7958)相匹配。缺乏NO2-Phe(見圖1)時沒有觀察到Z區蛋白,表面非天然氨基酸的摻入保真度很高。下一步檢測利用摻入的NO2-Phe作為熒光淬滅劑的可行性。從已報道的NO2-Phe的熒光團對應分子,如酪氨酸、色氨酸、1-pyrenylalanine和-氨茴酰-l-α,-二氨基丙酸中,挑選色氨酸/NO2-Phe對摻入到模型GCN4亮氨酸拉鏈中,形成一個平行的螺旋卷曲同型二聚體。GCN4基因的DNA結合區(676-840bp)不編碼色氨酸,克隆酵母基因組中的該區將其插入到蛋白表達載體pET-26b中。然后用定點誘變在此蛋白特定位點上用色氨酸或NO2-Phe非天然氨基酸(由TAG選擇密碼子編碼)替換該位置的氨基酸。將GCN4表達載體以及含mutNO2-PheRS和mutRNACUATyr的質粒共同轉染到大腸桿菌BL21(DE3)細胞內,然后在含1mMNO2-Phe的GMML基礎培養基內培養。用Ni2+親和柱純化積聚的GCN4p1突變蛋白,然后用SDS-PAGE和MALDI-TOF分析來驗證。測定該純化的突變蛋白的穩態熒光光譜。圖4A顯示單用22Trp突變蛋白以及22Trp突變體和22NO2-Phe突變體混合物的熒光光譜,而圖4B顯示55Trp突變體以及55Trp和22NO2-Phe突變體混合物的熒光光譜。在22Trp/22NO2-Phe突變體對中觀察到明顯的熒光淬滅;另一方面,55Trp/22NO2-Phe突變體對沒有獲得明顯的熒光淬滅。此結果清楚地表明Trp/NO2-Phe對之間的熒光團/淬滅劑相互作用是間距依賴性的。因此,本系統很容易應用于蛋白折疊和蛋白-蛋白相互作用的研究以及蛋白-配基相互作用的研究。實施例3用于在大腸桿菌體內蛋白質中摻入氧化活性氨基酸3-氨基-L-酪氨酸(NO2-Phe)的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將3-氨基-L-酪氨酸(見圖1,也寫為NH2-YRS)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。這個非天然氨基酸的側鏈易被氧化成為相應的半醌或醌,因此可用于探測和操作蛋白質內的電子轉移過程。氧化產生的醌可通過hetero-Diels-Alder反應與丙烯酰胺有效偶聯。這后一特性提供了另外一種用途,即該非天然氨基酸可作為蛋白質化學修飾的一個手柄。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,可與上述甲烷球菌抑制型酪氨酰tRNACUA(SEQIDNO1)聯用。這個新的正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。該得到的正交tRNA合成酶能選擇性地用3-氨基-L-酪氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入3-氨基-L-酪氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TGA反應中運送非天然氨基酸。用已報告的方法分離得到該新型合成酶。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備甲烷球菌酪氨酰tRNA合成酶突變體庫。根據其它氨酰tRNA合成酶的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變庫內諸合成酶進行多輪正負篩選。選擇得到了一個能用3-氨基-L-酪氨酸加載O-tRNA的合成酶克隆。此選出的合成酶克隆的氨基酸序列見表5,為SEQIDNO12;其多聚核苷酸序列也見表5,為SEQIDNO13。實施例4用于在大腸桿菌體內蛋白質中摻入磷酸酰氨酸模擬氨基酸p-羧甲基-L-苯丙氨酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將p-羧甲基-L-苯丙氨酸(見圖1,也寫為pCMF)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。采用此非天然氨基酸側鏈作為酪氨酸磷酸化的穩定模擬物。酪氨酸磷酸化在調節許多細胞過程中的細胞信號轉導中發揮重要作用,如細胞生長、代謝調節、轉錄調節和增殖。酪氨酸磷酸化在體內是一種可逆的過程。內源性酪氨酸磷酸酶有使酪氨酸去磷酸化的趨向而干擾了對酪氨酸磷酸化效應的研究,因而會妨礙對這些研究的解釋。氨基酸p-羧甲基-L-苯丙氨酸是磷酸酪氨酸的模擬物,可透入細胞,因而不能作為酪氨酸磷酸酶的底物。當將此非天然氨基酸摻入蛋白質內時可用于產生組成性活化的蛋白質。此非天然氨基酸還可用于噬菌體展示,來選擇含p-羧甲基-L-苯丙氨酸的肽庫中蛋白質酪氨酸磷酸酶的抑制劑。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA(SEQIDNO1)聯用。這些新的正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。該得到的正交tRNA合成酶能選擇性地用p-羧甲基-L-苯丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入p-羧甲基-L-苯丙氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源的tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。搜索能用p-羧甲基-L-苯丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。選擇得到了5個能用p-羧甲基-L-苯丙氨酸加載O-tRNA的合成酶克隆。對這些合成酶克隆測序確定其氨基酸序列,如表5所示,為SEQIDNO14、16、18、20和22。這些相同O-RS克隆的核苷酸序列為SEQIDNO15、17、19、21和23。實施例5用于在大腸桿菌體內蛋白質中摻入疏水性非天然氨基酸聯苯基丙氨酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將聯苯基丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。非天然氨基酸聯苯基丙氨酸含有大的芳香族側鏈。疏水性相互作用是驅使蛋白質折疊和蛋白-蛋白相互作用的主要作用力之一(其它的主要作用力是靜電相互作用、氫鍵和范得華力)。疏水性相互作用參與多種生物學過程,如蛋白質跨細胞膜轉運、蛋白質凝集以及酶催化作用。聯苯基丙氨酸的疏水性比常見的20種氨基酸高。在蛋白質內摻入聯苯基丙氨酸是研究和修飾蛋白質的分子內和分子間疏水性相互作用的一種有用工具。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA聯用。這些新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。所得到的正交tRNA合成酶能選擇性地用聯苯基丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入聯苯基丙氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。搜索能用聯苯基丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。選擇得到了7個能用聯苯基丙氨酸加載O-tRNA的合成酶克隆。對這些合成酶克隆測序,如表5所示。這些O-RS克隆的氨基酸序列為SEQIDNO24、26、28、30、32、34和36。這些相同O-RS克隆的相應核苷酸序列為SEQIDNO25、27、29、31、33、35和37。實施例6用于在大腸桿菌體內蛋白質中摻入金屬鰲合非天然氨基酸聯吡啶基丙氨酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將聯吡啶基丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。非天然氨基酸聯吡啶基丙氨酸能鰲合金屬離子。此氨基酸側鏈的N,N-二齒鰲合基序對過渡態金屬離子如Cu2+、Fe2+、Ni2+、Zn2+和Ru2+等是很強的螯合劑。此金屬鰲合氨基酸可用于(1)將氧化還原活性的或親電子的金屬離子引入到蛋白質內,(2)形成發熒光的金屬離子復合物如Ru(bpy)3,或者(3)介導含聯吡啶基丙氨酸的蛋白質發生金屬離子依賴性的二聚化。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA聯用。這些新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。所得到的正交tRNA合成酶能選擇性地用聯吡啶基丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入聯吡啶基丙氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。搜索能用聯吡啶基丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。選擇得到了2個能用聯吡啶基丙氨酸加載O-tRNA的合成酶克隆。對這些合成酶克隆測序,如表5所示。這些O-RS克隆的氨基酸序列為SEQIDNO38和40。這些相同O-RS克隆的相應核苷酸序列為SEQIDNO39和41。實施例7用于在酵母宿主細胞體內蛋白質中摻入發熒光非天然氨基酸1,5-丹酰基丙氨酸的正交翻譯組分本實施例描述了利用酵母宿主細胞翻譯機制將1,5-丹酰基丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從大腸桿菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在酵母宿主細胞系統內具有功能。熒光因其靈敏度高和操作安全已成為生物技術中一種最重要的檢測信號。另外,某些技術如熒光共振能量轉移(FRET)或熒光偏振使實時分析生物分子的結合運動或構象變化成為可能。目前所用的研究體內蛋白質的熒光方法通常依賴于含大熒光蛋白質的融合構建體。另外,可用小的有機標記物來最大程度降低結構干擾,但其區域選擇性差,這些小有機標記物有細胞毒性,或者需要引入染料結合蛋白基序,而限于(引入)蛋白質的表面。相反,熒光氨基酸不需要含有細胞毒性基團,其導入僅造成蛋白質結構的微小改變,而能夠在體內蛋白質的任何位置上進行特異性標記。本發明提供了能將熒光氨基酸即1,5-丹酰基修飾的丙氨酸(見圖5A)摻入到酵母正在延伸的多肽鏈內的正交翻譯系統組分。此非天然氨基酸還可以通過其IUPAC術語2-氨基-3-(5-二甲氨基-萘-1-硫氨基)-丙酸來鑒定。丹酰發色團具有令人感興趣的光譜特性,包括最大激發波長和最大發射波長間隔極大(>200nm)以及發射光強度高度依賴于環境的極性。這使其很適合于研究當蛋白質局部環境的極性受到影響時蛋白質的構象變化或結合。非天然氨基酸的合成可通過兩步方法完成,包括用三乙胺的二氯甲烷溶液將N-Boc-氨基丙氨酸偶聯于丹酰氯,然后用TFA的二氯甲烷溶液進行酸性脫保護。采用以前報道的方法分離得到用于摻入1,5-丹酰基丙氨酸的新型合成酶,參見Wu等,JournaloftheAmericanChemicalSociety12614306-14307(2004);以及Deiters等的國際專利申請PCT/US2005/034002,申請日為2005年9月21日。從酵母宿主細胞系統內的隨機大腸桿菌亮氨酰tRNA合成酶庫中分離得到顯示有初步加載活性的大腸桿菌突變體亮氨酰-tRNA合成酶克隆(克隆B8)。見表5和SEQIDNOS42和43。大腸桿菌亮氨酰tRNA合成酶庫中的突變位點是M40、L41、Y499、Y527和H537。在整個庫所有克隆中發現的其它突變(庫構建過程導致的)是H67R、N196T、R262A和S497C。然而,通過對表達的33位含有允許的琥珀密碼子的模型蛋白質-人超氧化物岐化酶(hSOD-33TAG-His6)的MALDITOFMS分析判斷,B8突變大腸桿菌合成酶顯示對一種或多種天然氨基酸的背景活性與亮氨酸相似。對丹酰基丙氨酸-AMP酰胺的理論停靠研究以及嗜熱棲熱菌(T.th.)的同源亮氨酰tRNA合成酶的晶體結構研究提示形成了擴展的結合袋,該結合袋主要通過疏水性相互作用而不需要對naphtyl基序的π堆積參與來結合配基(見圖5B)。大腸桿菌亮氨酰tRNA合成酶具有校對活性,因為所選出的突變體已產生了對1,5-丹酰基丙氨酸的活化活性和加載活性,設計的策略是通過重塑編輯位點來靶向選擇性去除活化的或加載的天然氨基酸。認為如MALDITOFMS所提示,觀察到的背景活性是由于亮氨酸的摻入。T.th來源的同源亮氨酰tRNA合成酶的晶體結構和突變研究,提示簡單地空間阻斷非極性氨基酸靠近γ-甲基側鏈就可以阻止活化的或加載的亮氨酸結合于水解位點(Lincecum等,MolCell.,4951-963)。為了提高對亮氨酸的水解活性,大腸桿菌合成酶編輯區中的殘基T252和V338可通過Quikchange誘變替換成丙氨酸以擴展結合袋(見圖6A)。V338A合成酶(見表5,SEQIDNOS46和47)用模型蛋白人超氧化物岐化酶(hSOD)進行表達研究顯示沒有明顯差異,而T252A合成酶(見表5,SEQIDNOS44和45)卻顯示背景活性明顯降低(見圖6B)。此突變體的高度選擇性通過hSOD-33TAG-His6的MALDITOFMS得到進一步確證。因此,本發明提供了大腸桿菌亮氨酰tRNA合成酶來源的能夠利用酵母(如釀酒酵母)宿主細胞翻譯機制將1,5-丹酰基丙氨酸通過生物合成摻入到蛋白質內的新型突變體tRNA合成酶。實施例8用于在酵母宿主細胞體內蛋白質中摻入光囚禁的非天然氨基酸o-硝基芐基絲氨酸的正交翻譯組分本實施例描述了利用酵母宿主細胞翻譯機制將o-硝基芐基絲氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從大腸桿菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在酵母宿主細胞系統內具有功能。對活的生物特定基因功能的研究主要依賴于其失活和活化以及對其所產生效應的研究。經典的基因敲除研究目標是DNA水平基因,基因敲除可導致滅活產生的編碼蛋白質的所有突變體,卻不能實時研究所產生的效應。最近幾年,利用小的有機分子顯著提高了基因滅活的特異性。用這些工具,可靶向單個蛋白質變體(或該變體的單一區域),在加入該分子后可實時研究所產生的效應。將光囚禁的氨基酸引入到蛋白質內作為瞬時可活化敲除可進一步提高這種研究的精確度。用化學敲除策略,化合物向其靶蛋白擴散的時間是受速率限制的,因而只可能用于研究整個細胞。與此相反,特定氨基酸的光去囚禁可在較快的時間內完成,因此可利用脈沖和高聚焦激光來研究細胞內的特定區室。先前已從構建在酵母宿主細胞中的大腸桿菌亮氨酰tRNA合成酶突變體庫中產生了能特異性識別被囚禁的半胱氨酸衍生物o-硝基芐基半胱氨酸(也寫為o-NBC)的大腸桿菌突變亮氨酰tRNA合成酶(見Wu等,JournaloftheAmericanChemicalSociety12614306-14307(2004);以及國際專利申請No.PCT/US2005/034002,申請日為2005年9月21日,Deiters等)。為了擴展該方法的適應范圍,經考慮產生了能特異性摻入o-硝基芐基絲氨酸(oNBS)的氨酰tRNA合成酶。當將此光囚禁的非天然氨基酸通過遺傳方法摻入到蛋白質內時,該氨基酸可用于光調節絲氨酸殘基所參與的功能,例如但不限于激酶導致的絲氨酸磷酸化,代表了信號轉導通路中最重要的一個化學標記。可用NaH作為堿,然后在作為清除劑的三乙基甲硅烷存在下用TFA的二氯甲烷溶液進行酸性脫保護,使o-硝基芐基溴偶聯于DMF配制的Boc-N-Ser-O-tBu而合成oNBS氨基酸,總產率為52%。產生的用于摻入oNBC的大腸桿菌突變亮氨酰tRNA合成酶(克隆3H11見表5,SEQIDNOS48和49)已顯示出某些有限的oNBS摻入活性,但其效率比oNBC氨基酸低兩倍。為了產生更有效oNBS翻譯系統,利用易錯PCR和三種不同的誘變方法在每個基因中引入1、2或5個突變使所選出的克隆3H11合成酶多樣化,共得到1×107個不同的克隆。亮氨酰tRNA合成酶中隨機化目標的位置是M40、L41、Y499、Y527和H537。本文所用的方法是本領域所述的通用方法,如Wu等,JournaloftheAmericanChemicalSociety12614306-14307(2004);以及國際專利申請No.PCT/US2005/034002,申請日為2005年9月21日,Deiters等。通過篩選新的突變合成酶庫得到了oNBS摻入效率提高2倍的改進合成酶(克隆G2-6)。G2-6克隆經測序鑒定到該酶中與初始3H11原材料相比有5個額外突變(位置S31G,T247A,T248S,M617I和V673A)。全庫的所有克隆中還發現以下額外突變(構建文庫導致的)H67R、N196T、R262A和S497C。此合成酶分離物的完整氨基酸序列和核苷酸序列見表5,為SEQIDNOs50和51。圖7A用示意圖的形式描述了這個改良的突變合成酶,圖7B用試驗說明了G2-6合成酶突變體的oNBS摻入活性的提高。進一步通過MALDIMS用hSOD作為表達研究模型系統確證了oNBS的選擇性摻入。因此,本發明提供了大腸桿菌亮氨酰tRNA合成酶來源的能夠利用酵母(如釀酒酵母)宿主細胞翻譯機制通過生物合成將oNBS摻入到蛋白質內的新型突變tRNA合成酶。實施例9用于在大腸桿菌體內蛋白質中摻入光囚禁的非天然氨基酸O-(2-硝基芐基)-L-酪氨酸的正交翻譯組分本實施例描述了利用古細菌合成酶和大腸桿菌宿主細胞翻譯機制將O-(2-硝基芐基)-L-酪氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。“被囚禁的蛋白質”指其生物活性受光控制的修飾蛋白質,通常是經光解轉化從非活化形式轉變為活化形式。這特別有用,因為光照在時間、位置和幅度上易于控制,能夠對蛋白功能的細節進行研究(綜述見Shigeri等,Pharmacol.Therapeut.2001,9185;CurleyandLawrencePharmacol.Therapeut.1999,82347;CurleyandLawrence,Curr.Op.Chem.Bio.1999,384;“被囚禁的化合物”(″CagedCompounds″),《酶學方法》(MethodsinEnzymology);Marriott,G.編輯;AcademicPressNewYork,1998;V.291;以及AdamsandTsien,Annu.Rev.Physiol.1993,55755)。最常用的囚禁基團是2-硝基芐基(見Bochet,J.Chem.Soc.,Perkin12002,125;Givens等,MethodsinEnzynology1998,291,1;以及Pillai,Synthesis1980,1),用該基團代替多肽或蛋白質的羥基、羧基、巰基或氨基,用非光損傷的紫外線照射時易于切斷。以前通過化學修飾分離的蛋白質來制備囚禁蛋白,未對囚禁基團的位置進行控制,因此很可能摻入多個囚禁基團(如Self和Thompson,NatureMed.1996,2,817)。其它例子采用無義密碼子抑制技術在體外摻入囚禁的氨基酸(見Philipson等,Am.J.Physiol.Cell.Physiol.2001,281,C195;Pollitt和Schultz,Angew.Chem.Int.Ed.1998,37,2105;Cook等,Angew.Chem.Int.Ed.1995,34,1629)。由于氨酰化tRNA必須通過化學方法合成,因此只適用于少量蛋白質,體內研究受到限制。利用正交翻譯系統技術克服了這些技術的固有局限性。用細胞系統,通過在大腸桿菌翻譯機制中加入新的組分可將非天然氨基酸以高度翻譯保真度位點特異性地摻入到體內蛋白質(綜述參見,如Wang和Schultz,Angew.Chem.Int.Ed.2004,44,34;Cropp和Schultz,Trend.Gen.2004,20,625;以及Wang和Schultz,Chem.Commun.2002,1)。本實施例描述了在大腸桿菌遺傳密碼內加入光囚禁酪氨酸O-(2-硝基芐基)-L-酪氨酸(見圖1)的方法。酪氨酸是蛋白酪氨酸激酶和磷酸酶底物中的重要氨基酸,是幾個酶活性位點中的必需殘基,通常位于蛋白-蛋白界面上。用365nm光照射O-(2-硝基芐基)-L-酪氨酸(如Miller等,Neuron1998,20,619所述從L-酪氨酸合成)誘導芐基CO鍵斷裂,快速形成脫囚禁的氨基酸(t1/2=4min,見支持信息),如圖8的示意圖所述。試驗觀察了O-(2-硝基芐基)-L-酪氨酸的光照脫囚禁,圖9顯示了試驗結果。如此圖所示,利用手提式紫外燈(波長365nm,距離10mm)照射其0.2mM水溶液(六孔板上的一個孔)研究了O-(2-硝基芐基)-L-酪氨酸的光照脫囚禁。在特定時間點采集等份樣品,用LC/MS分析。O-(2-硝基芐基)-L-酪氨酸(方塊)和脫囚禁的O-(2-硝基芐基)-L-酪氨酸(圓圈)的濃度顯示在圖中。在大約4分鐘后獲得50%脫囚禁。用甲烷球菌酪氨酰tRNA合成酶(MjYRS)作為起點來制備能接受O-(2-硝基芐基)-L-酪氨酸,但不能以20種常見氨基酸中的任何一種作為底物的正交合成酶。MjYRS不能用酪氨酸氨酰化任何大腸桿菌內源性tRNA,但能氨酰化突變的酪氨酸琥珀抑制子(mutRNACUA)。為了改變MjYRS選擇性識別O-(2-硝基芐基)-L-酪氨酸的特異性,根據甲烷球菌YRS/tRNATyr-酪氨酸復合物的晶體結構,通過在酪氨酸結合袋內隨機安置6個殘基(Tyr32,Leu65,Phe108,Gln109,Asp158和Leu162)制備了約含109個YRS的突變體庫(Zhang等,Prot.Sci.2005,14,1340;Kobayashi等,Nat.Struct.Biol.2003,10,425)。這六個殘基的選擇是依據它們密切靠近酪氨酸苯環的對位,其中Tyr32和Asp158與酪氨酸的羥基形成氫鍵。這些殘基的突變預期能擴展該合成酶的底物結合袋而特異性識別O-(2-硝基芐基)-L-酪氨酸和其它非天然氨基酸。分別利用氯霉素乙酰轉移酶(CAT)和芽孢桿菌報告系統進行正負篩選突變體MjYRS庫中的活性合成酶變體。經過5輪的交替正負選擇后,在存在或不存在O-(2-硝基芐基)-L-酪氨酸的條件下篩選到96個表型不同的克隆。根據對CAT基因Asp112TAG密碼子的抑制作用通過體內試驗進一步鑒定了三個合成酶的特征。表達這三對MjYRS/mutRNACUA的大腸桿菌可在氯霉素存在下存活,在O-(2-硝基芐基)-L-酪氨酸存在或不存在時其IC50值分別為110mg/L或低于10mg/L。氯霉素耐藥性的巨大差異提示在對琥珀密碼子反應中選出的合成酶/tRNA對體內插入O-(2-硝基芐基)-L-酪氨酸的特異性明顯高于所有20種天然氨基酸。對編碼這三種O-(2-硝基芐基)-L-酪氨酸-tRNA合成酶的核酸測序,并推測其氨基酸序列。這三個ONBY合成酶克隆的完整氨基酸序列見表5,為SEQIDNOs52-54。測序結果見表3。表3可以想見,突變Tyr32→Gly32/Ala32和Asp158→Glu158、Ala158或Ser158可導致Tyr32、Asp158與天然底物酪氨酸之間的氫鍵丟失,因此不利于其結合。為了測定這三種ONB-MjYRS的保真度和效率,在對C末端含6個組氨酸標記的突變抹香鯨精子肌紅蛋白基因位置4的琥珀密碼子的反應中摻入了O-(2-硝基芐基)-L-酪氨酸。為了表達重組蛋白,在合成酶/mutRNACUA對和O-(2-硝基芐基)-L-酪氨酸(1mM)都存在的條件下,將質粒pBAD/JYAMB-4TAG(編碼含阿拉伯糖啟動子和rrnB終止子的突變抹香鯨精子肌紅蛋白基因;lpp啟動子和rrnC終止子上有酪氨酰tRNACUA;以及四環素抗性標記)和pBK載體(編碼突變的合成酶和卡那霉素抗性基因)共轉染到DH10B大腸桿菌內。在添加四環素925mg/mL)和卡那霉素(30mg/mL)的Luria-Bertani培養基(5mL)中擴增細胞,用磷酸鹽緩沖液洗滌,然后接種到含合適抗生素、光囚禁酪氨酸(1mM)和阿拉伯糖(0.002%)的500mL液體甘油基礎培養基(GMML;含0.3mM亮氨酸的甘油基礎培養基)中。使細胞生長到飽和離心收獲。用Ni-NTA親和層析獲得純化的突變肌紅蛋白,產量約為2-3mg/L,用SDS-PAGE和GelcodeBlue染色判斷其均一性>90%。此產量與用能抑制相同琥珀密碼子的野生型MjYRS/mutRNACUA對所得到的肌紅蛋白表達量相當。如果撤除非天然氨基酸或存在1mM的酪氨酸則檢測不到肌紅蛋白,說明所有三種合成酶對O-(2-硝基芐基)-L-酪氨酸都有很高的選擇性(見圖10)。為了進一步確認位點特異性光囚禁蛋白的身份,在pONB-MjYRS-1、tRNACUA和O-(2-硝基芐基)-L-酪氨酸存在下表達Gly74為琥珀密碼子(因其具有優良的質譜特性)的不同肌紅蛋白突變體。在與4TAG突變體相同的條件下,在存在O-(2-硝基芐基)-L-酪氨酸(1mM)時利用合成酶pONB-1表達了肌紅蛋白突變體74TAG,并用鎳親和柱純化。通過SDS-PAGE凝膠的GelcodeBlue染色觀察蛋白質條帶,然后從聚丙烯酰胺凝膠上切下。將凝膠塊剪成1.5mm方塊,然后基本按照以前所述的方法(Shevchenko等,Anal.Chem.1996,68,850-858)進行胰蛋白酶水解。在配備NanosprayHPLC(Agilent1100系列)的FinniganLCQDeca離子陷阱質譜儀(ThermoFinnigan)上通過液相色譜串聯質譜(LC-MS/MS)分析胰蛋白酶水解肽。與含非天然氨基酸(命名為J)的肽HGVTVLTALGJILK的單價和二價帶電離子相對應的離子前體用離子陷阱質譜分離和破碎。LC-MS/MS分析表明74位為酪氨酸(胰蛋白酶水解肽HGVTVLTALGYILK)。此碎片離子的質量得以認定,表明74位上位點特異性地摻入了酪氨酸(3)(見圖11A和11B)。檢測到Tyr74很可能是因為MS分析時O-(2-硝基芐基)-L-酪氨酸中不穩定的二甲苯醚發生斷裂。為了確定上述摻入的被囚禁的氨基酸O-(2-硝基芐基)-L-酪氨酸,合成了其含氘的衍生物用于在相同條件下表達相同的肌紅蛋白突變體。然后用胰蛋白酶水解該蛋白質,進行質譜分析。認定的碎片離子質量顯示在肌紅蛋白的74位為摻入的d2-酪氨酸,清楚地證明了非天然氨基酸2的摻入(見圖12A和12B)。LCMS/MS分析未顯示此位置有任何天然氨基酸摻入,進一步證明了所產生的合成酶的高保真度。另外,含有O-(2-硝基芐基)-L-酪氨酸摻入的蛋白質的體內光化學活化可利用lacZ作為報告基因來證明。大腸桿菌β-半乳糖苷酶在503位上有一個必須的酪氨酸(Juers等,Biochemistry2001,40,14781;Penner等,Biochem.CellBiol.1999,77,229)。將其相應的密碼子突變成琥珀終止密碼子TAG以便于被囚禁的O-(2-硝基芐基)-L-酪氨酸摻入。監測酪氨酸脫囚禁前后的β-半乳糖苷酶。在體內照射后該β-半乳糖苷酶的活性恢復。實施例10用于在大腸桿菌體內蛋白質中摻入非天然氨基酸p-氰基苯丙氨酸的正交翻譯組分本實施例描述了利用古細菌合成酶和大腸桿菌宿主細胞翻譯機制將p-氰基苯丙氨酸(見圖1,也寫作4-氰基苯丙氨酸)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。氰基是一種極佳的局部環境IR探針,因為在從疏水環境向親水環境移動過程中其CN伸展振動(v2)以10個波數的數量級頻繁轉換(Getahun等,“利用腈衍生氨基酸作為局部環境的紅外探針”(UsingNitrile-DerivatizedAminoAcidsasInfraredProbesofLocalEnvironment),JACS125,405-411)。因此,對位(4-位)和間位(3-位)氰基苯丙氨酸可用于研究蛋白特性的分類,包括蛋白與蛋白結合,蛋白質的構象以及疏水折攏。肽鏈中氰基苯丙氨酸的對位和間位形式可存在于極性和疏水環境中,它們對構象的影響可忽略不計。因此,兩者可能和其所取代的蛋白質或肽中的野生型殘基處于同一個環境中。另外,化合物的CN伸展振動(范圍)窄,不會與其它任何蛋白吸收相重疊,在很大程度上與蛋白的其它振動脫離,并且對溶劑的極性相當敏感。基于這些理由,二者都是研究肽構象的極好工具。芳香族腈可作為小肽局部環境的IR探針Getahun及其同事(Getahun等,“利用腈衍生氨基酸作為局部環境的紅外探針”,JACS125,405-411)已證明(見圖13)對位氰基苯丙氨酸的氰伸展振動在水中比在THF中高10個波數。當突變14位殘基為兩性的肥大細胞脫顆粒肽(MPx),將對-氰基苯丙氨酸插入到其脂質結合區時,如果MPx結合于POPC脂雙層上,那么氰伸展發生在2229.6cm-1。在水中,MPxPheCN突變的CN伸展振動發生在2235.7cm-1。總之,水合肽中的氰伸展與水中游離的對-氰基苯丙氨酸的氰伸展相似,而包埋肽中的PheCN氰伸展與THF中游離PheCN氰伸展類似(Tucker等,“一種測定膜結合肽的各側鏈局部環境和方向的新方法”(ANewMethodforDeterminingtheLocalEnvironmentandOrientationofIndividualSideChainsofMembrane-BindingPeptides),JACS1265078-5079)。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA聯用。此新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。所得到的正交tRNA合成酶能選擇性地用p-氰基苯丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入p-氰基苯丙氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。搜索能用p-氰基苯丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。選擇得到了1個能用p-氰基苯丙氨酸加載O-tRNA的合成酶克隆。對這個合成酶克隆測序,確定了其氨基酸序列,如表5所示,為SEQIDNOs55和56。與野生型的合成酶序列相比,這個合成酶突變體具有下列取代Tyr32Leu、Leu65Val、Phe108Trp、Gln109Met、Asp158Gly和Ile159Ala。實施例11用于在大腸桿菌體內蛋白質中摻入非天然氨基酸m-氰基苯丙氨酸的正交翻譯組分本實施例描述了利用古細菌合成酶和大腸桿菌宿主細胞翻譯機制將m-氰基苯丙氨酸(見圖1,也寫作3-氰基苯丙氨酸)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。氰基是一種極佳的局部環境IR探針,因為在從疏水環境向親水環境移動過程中其CN伸展振動(v2)以10個波數的數量級頻繁轉換(Getahun等,“利用腈衍生氨基酸作為局部環境的紅外探針”,JACS125,405-411)。因此,對位(4-位)和間位(3-位)氰基苯丙氨酸可用于研究蛋白特性的分類,包括蛋白與蛋白結合,蛋白質的構象以及疏水折攏。肽鏈中氰基苯丙氨酸的對位和間位形式可存在于極性和疏水環境中,它們對構象的影響可忽略不計。因此,兩者可能和其所取代的蛋白或肽內的野生型殘基處于同一個環境中。另外,化合物的CN伸展振動(范圍)窄,不會與其它任何蛋白吸收相重疊,在很大程度上與蛋白的其它振動脫離,并且對溶劑的極性相當敏感。基于這些理由,二者都是研究肽構象的極好工具。蛋白質中的芳香族腈建立了直接產生的方法后,產生了一種新的甲烷球菌tRNATyrCUA-酪氨酰-tRNA合成酶(TyrRS)對,在對琥珀TAG密碼子的反應中該正交對可高保真度特異性地摻入間-氰基苯丙氨酸。此新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。所得到的正交tRNA合成酶能選擇性地用m-氰基苯丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入m-氰基苯丙氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。利用以前所述的方法構建能夠用m-氰基苯丙氨酸特異性加載正交tRNA的正交合成酶。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。選擇得到了1個能用m-氰基苯丙氨酸加載O-tRNA的合成酶克隆。對這個合成酶克隆測序,確定了其氨基酸序列(見表5,SEQIDNOs57和58)。與野生型的合成酶序列相比,這個合成酶突變體具有下列取代Tyr32His、His70Ser、Asp158Ser、Ile159Ser和Leu162Pro。我們試圖在m-氰基苯丙氨酸和p-氰基苯丙氨酸都存在的條件下利用其各自的正交tRNA/合成酶對來抑制C末端為His6尾的Z區蛋白的Tyr7→TAG突變。在兩種情況下,如果存在非天然氨基酸可產生全長蛋白,而在缺乏各自非天然氨基酸時,SDS-PAGE凝膠考馬斯藍染色未檢測到任何產物。另外,我們獲得了在位置7上摻入有間位和對位氰基苯丙氨酸的蛋白質的IR光譜。扣除野生型Z區IR光譜背景后,我們所得到的光譜見圖14A和14B所示。圖14A顯示在圖13所示的兩端之間對-氰基苯丙氨酸有單一吸收峰,提示7位殘基位于該蛋白的表面,但不直接伸入溶液內。圖14B顯示間-氰基苯丙氨酸的光譜是兩個正態分布的和,峰值在2236和2228cm-1處。該曲線的R2值大于0.99,曲線擬合極佳,圖14B的數據提示m-氰基苯丙氨酸有兩種構象。如2228cm-1處的峰所示看,一種構象是氰基位于該蛋白的疏水區內。2236cm-1處的峰提示另一種構象氰基位于水合環境內。實施例12用于在大腸桿菌體內蛋白質中摻入非天然氨基酸p-(2-氨基-1-羥乙基)-L-苯丙氨酸的正交翻譯組分本實施例描述了利用古細菌合成酶和大腸桿菌宿主細胞翻譯機制將p-(2-氨基-1-羥乙基)-L-苯丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。采用生物物理探針、細胞毒制劑、交聯劑和其它試劑進行蛋白質的位點特異性修飾已廣泛用于分析蛋白質的結構和功能以及開發診斷、治療試劑和高通量篩選。選擇性修飾蛋白質的一種方法包括將N末端絲氨酸或蘇氨酸氧化成相應的醛,然后與肼、烷氧胺或酰肼衍生物偶聯。不幸的是,此方法有局限性,因為它只能用于修飾蛋白質的N末端位置。我們的方法是將2-氨基-1-羥乙基的關鍵性氨基醇功能基團置于靶蛋白的側鏈上,從而克服只對蛋白質N末端進行選擇性修飾的局限性,并且具有可控制蛋白質中氨基醇基團位置的優點。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA聯用。此新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。所得到的正交tRNA合成酶能選擇性地用p-(2-氨基-1-羥乙基)-L-苯丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入p-(2-氨基-1-羥乙基)-L-苯丙氨酸。這些tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG反應中運送非天然氨基酸。搜索能用p-(2-氨基-1-羥乙基)-L-苯丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。選擇得到了1個能用p-(2-氨基-1-羥乙基)-L-苯丙氨酸加載O-tRNA的合成酶克隆。對這個合成酶克隆測序,確定了其氨基酸序列(見表5,SEQIDNOs59)。與野生型甲烷球菌合成酶序列相比,這個合成酶突變體具有下列取代實施例13用于在大腸桿菌體內蛋白質中摻入非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸的正交翻譯組分本實施例描述了利用古細菌合成酶和大腸桿菌宿主細胞翻譯機制將p-乙基硫代羰基-L-苯丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。制備半合成蛋白質的一種有用方法是天然的化學連接,其中兩個完全未被保護的肽片段通過酰胺鍵在室溫和溫和的生理條件下連接在一起(Nilsson等,Annu.Rev.Biophys.Biomol.Struct.2005,34,91-118;Dawson等,Science1994,266,776-779)。該方法經改良后稱為表達蛋白連接,此發中通過重組方式制備一個或多個反應伙伴,用于合成含100個殘基以上的蛋白質(Muir,Annu.Rev.Biochem2003,72,249-289;David等,Eur.J.Biochem.2004,271,663-677)。實際上,這兩種方法都需要C末端為α-硫酯,限制了這些方法用于肽片段C末端的修飾。如果將活性硫酯基團放置在細菌表達的肽/蛋白質的任意殘基上,將顯著擴展這些方法的應用范圍,例如,可合成環狀或分支結構,或者用生物物理探針、聚乙二醇或各種標記特異性修飾側鏈。產生含硫酯側鏈的蛋白質的方法可用于含硫酯側鏈(蛋白質)所參加的后續體外及可能的體內化學連接反應(Camarero和Muir,J.Am.Chem.Soc.1999,121,5597-5598;Camarero等,BioorgMedChem.2001,9,2479-2484;Scott等,Proc.Natl.Acad.Sci.USA1999,96,13638-13643;Evans等,J.Biol.Chem.2000,275,9091-9094;Yeo等,Chem.Commun.2003,2870-2871)。P-乙基硫代羰基-L-苯丙氨酸的合成p-乙基硫代羰基-L-苯丙氨酸(結構1;也被稱為4-(乙基硫代羰基)-L-苯丙氨酸)以商品化的α-溴-p-甲基苯甲酸(1a)和N-(二苯甲烯基)甘氨酸叔丁酯(1c)為起始材料分四步合成。這些步驟概述如下4-(溴代甲基)苯并硫代S-乙酯(S-ethyl4-(bromomethyl)benzothioate)的合成(結構1b)在溶于THF(50ml)的1a溶液(2.15g,10.0mmol)中加入亞硫酰氯(2ml,28mmol),然后加入DMF(50μl),反應混合物在室溫下攪拌5小時。在減壓的情況下去除有機溶劑直到出現白色固體,再將其溶于THF(50ml)中,溶液冷卻到0℃。以30分鐘的時間滴加溶于THF(10ml)的乙硫醇(0.78ml,10.0mmol)和三乙胺(2ml,14mmol)溶液。反應混合物再攪拌4小時,去掉溶劑。加入水(100ml)和醚(200ml)。有機相用水(2×50mL)洗滌,用NaSO4干燥,在減壓的情況下去除。粗產物通過硅膠(溶于乙烷中的80%的乙酸乙酯)上的快速層析純化,得到1b(2.18g,78%),是一種無色油狀物。1HNMR(400MHz,CDCl3)δ7.94(d,J=8.0Hz,2H),7.46(d,J=8.0Hz,2H),4.50(s,2H),3.07(q,J=7.6,15.2Hz,2H),1.35(t,J=9.2Hz,3H)。計算C10H11BrOS258.0/260.0的準確質量m/z,結果為(LC/MS)259.1/260.1。2-(二苯基亞甲基氨基)-3-(4-乙基硫代羰基)苯基)丙酸叔丁酯(結構1d)的合成將1b(0.455g,1.76mmol)、1c(0.47g,1.60mmol)、18-冠-6(0.42g,1.59mmol)和無水K2CO3(0.344g,2.50mmol)溶于無水CH3CN(10ml)中,在室溫下攪拌24小時。在減壓的情況下去除有機溶劑。加入水(100ml)和CH2Cl2(200ml)。有機相用水(2×50mL)洗滌,用NaSO4干燥,在減壓的情況下去除。粗產物無需純化直接用于下一步。計算C29H31NO3S473.2的準確質量m/z,結果為(LC/MS)474.3。(4-(乙基硫代羰基))苯丙氨酸(1)的合成將上一步的1d(0.94g,2.0mmol)溶于三氟乙酸(8ml)和CH2Cl2(2ml)中,在室溫下攪拌1小時。在減壓的情況下完全去除有機溶劑以后,加入濃鹽酸溶液(0.8ml)和MeOH(10ml),所得溶液在室溫下攪拌1小時,然后去除所有溶劑,加入無水丙酮(10ml)。溶液過濾,回收的固體用無水MeOH(2ml)研磨成粉。過濾后,甲醇濾出液置于減壓環境中得到白色固體1(>0.55g,95%)。1HNMR(400MHz,DMSO-d6)δ7.85(d,J=8.0Hz,2H),7.44(d,J=8.0Hz,2H),4.21(t,J=6.4Hz,1H),3.06(q,J=14.8,17.2Hz,2H),3.00(s,2H),1.26(t,J=7.2Hz,3H)。計算C12H15NO3S253.1的準確質量m/z,結果為(LC/MS)(LC/MS)254.2。P-乙基硫代羰基-L-苯丙氨酸摻入的遺傳程序為了在大腸桿菌內遺傳編碼p-乙基硫代羰基-L-苯丙氨酸,必須制備此氨基酸的特異性正交氨酰tRNA合成酶/tRNA對。根據甲烷球菌TyrRS-tRNAL-酪氨酸復合物的晶體結構(Kobayashi等,Nat.Struct.Biol.2003,10,425-432),隨機突變了甲烷球菌TyrRS的酪氨酸結合位點中的六個殘基(Tyr32,Leu65,Phe108,Gln109,Asp158和Leu162)。分別在p-乙基硫代羰基-L-苯丙氨酸存在和不存在下對含109個TyrRS的突變體庫進行3輪正篩選(根據對氯霉素乙酰轉移酶中琥珀密碼子的抑制)間以2輪負篩選(根據對芽孢桿菌RNA酶中三個琥珀密碼子的抑制),得到了在氯霉素中存活依賴于p-乙基硫代羰基-L-苯丙氨酸的一些克隆。發現這些突變體中有一個在存在p-乙基硫代羰基-L-苯丙氨酸時能支持細胞在120μgmL-1氯霉素環境中生長,而在p-乙基硫代羰基-L-苯丙氨酸缺乏時只能支持細胞在10μgmL-1氯霉素環境中生長。此克隆測序結果表明存在以下突變Tyr32Ala、Leu65Phe、Phe108Trp、Gln109Ser、Asp158Ser和Leu162His(見表5,SEQIDNO60)。Tyr32突變為Ala32可能去除結合酪氨酸的酚酸羥基與Tyr32之間的氫鍵。為了確認所觀察到的表型是通過mutRNACUA-mutTyrRS對位點特異性地插入了p-乙基硫代羰基-L-苯丙氨酸所引起的,將融合有C末端His6尾的Z區蛋白編碼基因(Nilsson等,ProteinEng.1987,1,107-113)中第7位(Tyr)替換成琥珀密碼子。在1mMp-乙基硫代羰基-L-苯丙氨酸存在或不存在下表達該蛋白并用Ni-NTA層析純化。SDS-PAGE分析表明突變的Z區蛋白的表達完全依賴于p-乙基硫代羰基-L-苯丙氨酸的存在。該突變蛋白的表達量約為野生型Z區蛋白的10-30%(用含1%甘油、0.3mM亮氨酸、1mM的p-乙基硫代羰基-L-苯丙氨酸以及合適抗生素的基礎培養基培養約為8mg/L)。通過基質輔助的激光解吸/電離飛行時間質譜(MALDI-TOFMS)分析獲得了p-乙基硫代羰基-L-苯丙氨酸位點特異性摻入的其它證據。除了觀察到完整的Tyr→p-乙基硫代羰基-L-苯丙氨酸蛋白的實驗平均質量為8006Da((M理論=8002Da,見圖16)外,還檢測到在乙酰化中不含第一甲硫氨酸殘基的突變蛋白相對應的小峰(M實驗=7913Da對M理論=7913Da)以及不含第一甲硫氨酸殘基的突變蛋白相應的主要峰(M實驗=7871Da對M理論=7871Da)(圖16)。存在的另外一個主峰7828Da對應于7位為游離羧酸基團而不是硫酯基序的Z區蛋白,計算其質子化形式的質量為7827Da。推測含羧酸和含硫酯的突變蛋白在質量檢測條件下具有相同的離子化效率,它們相對應的質量峰面積的積分提示約有40%含硫酯的突變被水解。事實上,該突變合成酶在體內為水解形式不會摻入非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸,而p-乙基硫代羰基-L-苯丙氨酸在體內和體外看來都是穩定的,提示硫酯水解成酸發生在其被硫酯特異性突變合成酶摻入到Z區蛋白之后。為了確定gai突變蛋白的硫酯側鏈是否能被選擇性修飾,用20-60μg/ml含硫酯的粗提突變蛋白和10mM半胱氨酸乙酯進行了體外連接試驗,其中半胱氨酸乙酯溶于pH為8.0含100mM二硫蘇糖醇(DTT)和2M鹽酸胍的磷酸鹽緩沖液中。然后純化所得到的修飾蛋白質用MALDI-TOFMS分析。測得的實驗平均分子量分別為7956Da和7998Da,對應于用一個半胱氨酸分子修飾的含硫酯的蛋白質(M理論=7958Da對應于不含第一甲硫氨酸殘基的蛋白質,M理論=8000Da對應于含第一甲硫氨酸殘基的乙酰化形式的蛋白質)(圖17)。用它們的質量峰面積積分定量估計標記效率超過85%。如圖16所示,主要表達的Z區蛋白不含第一甲硫氨酸殘基。這種形式的未修飾含硫酯突變蛋白的分子量為7872,該分子量與乙酰化形式的含羧酸蛋白質的分子量重疊(M理論=7869Da)。因此,計算標記效率時,7867Da處的峰面積采用未修飾含硫酯蛋白的上限值,導致標記效率的估計值大于85%。7825Da和7867Da(M理論=7827Da和7869Da)二峰表明存在7位含羧酸基團的Z區蛋白,該蛋白不與半胱氨酸乙酯反應。如預計的那樣,野生型Z區蛋白未檢測到標記產物,說明標記反應只發生在半胱氨酸分子和硫酯基團之間,而不會與野生型蛋白中存在的功能基團反應。另一方面,未觀察到含硫酯突變蛋白中的硫酯基團和5個賴氨酸殘基的ε-氨基參與了分子內側鏈的環化或自身二聚化反應。因此這些數據證明硫酯手柄具有優良的選擇性和反應性,可用于可靠和選擇性地體外修飾蛋白質。半胱氨酸乙酯和含硫酯Z區蛋白質之間的化學連接37℃培養含有編碼突變tRNA合成酶質粒和編碼Z區蛋白基因(第7位為琥珀密碼子,羧基端含His-6尾)表達載體pLEIZ的大腸桿菌DH10B細胞(60ml),在OD600=0.5時加入1mM異丙基硫代半乳糖苷(IPTG)誘導4小時。在沉淀的細胞團內加入1ml緩沖液(6M鹽酸胍,100mM磷酸鈉,200mM氯化鈉,pH=8.0)。室溫振蕩該溶液1小時,超聲破碎3分鐘,離心去除所有細胞碎片。在澄清上清液中加入2ml磷酸鹽緩沖液(100mM磷酸鈉,200mM,氯化鈉,0.01M半胱氨酸乙酯,pH=8.0)、150μl二硫蘇糖醇溶液(2M)和60mg巰乙磺酸鈉(MESNA)。室溫振蕩溶液混合物12小時。更換含修飾蛋白的溶液,濃縮至500μl緩沖液(8M尿素,100mM磷酸鈉,10mM氨基丁三醇(Trizma),pH8.0)。按照廠家提供的方法(Qiagen,Chatsworth,CA)用Ni2+親和層析純化修飾的蛋白質,用蒸餾水透析進行MALDI-TOFMS分析。結論總之,我們提供了一種甲烷球菌酪氨酰tRNA合成酶來源的新型正交合成酶。當與甲烷球菌抑制型tRNACUA聯用時,這些試劑可在體內將非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸摻入到多肽鏈中。本研究闡明了一種利用細菌制備在確定位點上含有側鏈硫酯手柄的蛋白質的生物合成方法。該方法可將各種配基高度選擇性地有效地化學連接于與摻入到蛋白質中的p-乙基硫代羰基-L-苯丙氨酸殘基上的反應活性基團。實施例14用于在大腸桿菌體內蛋白質中摻入二酮基非天然氨基酸p-(3-氧丁酰基)-L-苯丙氨酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將二酮基非天然氨基酸p-(3-氧丁酰基)-L-苯丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。對單用單酮基或β-二酮基功能基團與氨基丁烷能否形成亞胺以及所形成的亞胺在不同pH的磷酸鹽緩沖液中是否穩定的比較研究證明,在pH6.5-10.5的范圍內,從β-二酮基更容易形成烯醇亞胺,其對pH3.9酸性水解超級穩定。與此相比,在相同條件下,pH上升到10.5時,單酮基基本保持游離形式,未檢測到亞胺形成。因此,合成了側鏈含β-二酮基的非天然氨基酸并鑒定到能摻入此非天然氨基酸的正交tRNA-合成酶對。本發明提供了成功產生在體內能以高翻譯效率和保真度將含有此二酮基的氨基酸特異性摻入到蛋白質內的突變合成酶。如下文所詳細描述的那樣,將生物素羥胺衍生物選擇性偶聯于此二酮基經遺傳方法編碼于Z區蛋白中,提示對正常生物化學來說反應性是正交的二酮基可作為高效化學手柄用于將各種外部特性帶入到靶蛋白中。以前曾證明,通過在大腸桿菌或酵母的翻譯機制中加入新的組分,可在體外或體內用正交翻譯組分將非標準氨基酸以高翻譯保真度和效率位點特異性地摻入到蛋白質內。此法已用于將含酮基的氨基酸通過遺傳方法摻入到蛋白質內,含酮基氨基酸可通過形成腙鍵和肟鍵偶聯于具有各種生物和/或物理特性的非肽類分子(如聚乙二醇、生物素、糖類似物等)。雖然這些腙鍵和肟鍵在生理條件下是穩定的,但其缺點是需要同時存在常見20種氨基酸所沒有的兩種功能基團。如果一種是例如能夠與賴氨酸的ε-氨基或α-氨基直接形成穩定的加合物的活性功能基團如硫酯或β-二酮基,那么就可以形成分子間或分子內蛋白交聯。為此目的,我們最近報道了含二酮基的氨基酸2在大腸桿菌內的遺傳編碼。見圖21。要考慮到芳香二酮基2與脂肪族胺的交聯產物可導致形成亞胺加合物3(圖21),后者可異構成由六個分子間氫鍵穩定的相應的烯胺。這可導致形成在生理pH下穩定的加合物。為了用實驗證實這一推理,我們開始測定一種簡單模型系統的相對反應性,該系統包含氨基丁烷與用pH范圍為6.5-10.5的100mM磷酸鹽緩沖液配的芳香基一元酮1a和芳香基二酮2之間形成的一系列亞胺。用液相色譜和質譜(LC/MS)分析了各種加合物(1b和3a-3d)。見表4。該表描述了氨基丁烷(10mM)與用不同pH的PBS緩沖液(100mMK(PO4)i,500mMNaCl)配的芳香基一元酮1(1mM)或2(1mM)之間形成的亞胺的結果,反應在室溫下進行一周。表4**室溫,反應時間為12小時該分析表明,在pH上升到10.5時,1a基本保持游離形式,未檢測劍1b的形成。相反,在pH為7.4時,50%的2已轉變為3,在pH10.5時,此百分率升高到令人驚嘆的75%。考慮到以前所觀察到的在水溶液中酮型2b和烯醇-亞胺型3b占優勢,超過其它相應的互變異構體(Iglesias,Curr.Org.Chem.2004,8,1-24;Patteux等,Org.Lett.2003,5,3061-3063;Aly,Tetrahedron2003,50,1739-1747;Lopez等,TetrahedronAsymmetry1998,9,3741-3744;Mazzone等,S.Eur.J.Med.Chem.1986,21,277-284;以及Kim和Ryu,Bull.Korean.Chem.Soc.1992,13,184-187),因而證實與1a相比,氫鍵導致穩定性缺失顯著地促進了3的產生(主要是3b)。為了進一步確證穩定的分子間氫鍵可賦予3對水解的穩定性高于單純的亞胺1b,還在pH1.9-9.4范圍內對1b和3進行了LC/MS分析。如圖1所示,3(假設是3b)在生理pH7.4或以上基本保持完整。在pH降到3.9時,室溫4天后,只有約40%的3轉變為2。用更酸性的條件處理3可導致氨基完全丟失(uninstallation)(圖18)。與此形成鮮明對比但如預料到的那樣,1b甚至在pH10.5下攪拌過夜也很容易被水解(數據未顯示)。非天然氨基酸的合成受這些發現的鼓舞,我們希望建立衍生側鏈含有β-二酮基的非天然氨基酸p-(3-氧丁酰基)-L-苯丙氨酸的化學方法。我們的合成策略(見圖19)從易于獲得的p-乙酰-(±)-L-苯丙氨酸開始,用Boc化學物和酯化分別保護骨架氨基和羧酸基團。在含有叔-丁氧鉀的混合溶劑(2∶3[v/v]醋酸甲酯∶THF)反應條件下進行第二個羰基的加入。用TFA去除Boc基團,然后堿水解,得到所需的p-(3-氧丁酰基)-L-苯丙氨酸,總產率為40%。正交翻譯組分的鑒定用已建立的方法構建新型正交氨酰-tRNA合成酶/tRNA對,用于在體內將p-(3-氧丁酰基)-L-苯丙氨酸摻入到蛋白質中。根據甲烷球菌TyrRS-tRNA(Tyr)L-酪氨酸復合物的晶體結構(Kobayashi等,Nat.Struct.Biol.2003,10,425-432),隨機突變甲烷球菌TyrRS酪氨酸結合位點周圍的六個殘基(Tyr32,Leu65,Phe108,Gln109,Asp158和Leu162)。按照我們已報道的方法,將產生的約含109個突變體的庫依次經過3輪正選擇和2輪負選擇,得到了在氯霉素中存活依賴于p-(3-氧丁酰基)-L-苯丙氨酸存在的許多克隆。根據對CAT基因中Asp112TAG密碼子的抑制,用體內試驗鑒定到兩個TyrRS突變體。這兩個突變體在p-(3-氧丁酰基)-L-苯丙氨酸存在時能支持細胞在120μgmL-1的氯霉素中生長,在沒有p-(3-氧丁酰基)-L-苯丙氨酸時能支持細胞在10μgmL-1的氯霉素中生長。此結果提示所產生的這兩個合成酶對p-(3-氧丁酰基)-L-苯丙氨酸的活性比對其它天然氨基酸更高。這些突變體的DNA測序結果表明他們具有相同的序列(見表5,SEQIDNO61)。將Tyr32和Asp158突變成Gly打斷了結合酪氨酸的酚羥基與Tyr32和Asp158之間的氫鍵。Leu65轉變成Val65可能能夠提供更大的空間來容納β-二酮基的延展骨架。因此,Phe108Thr和Leu162Ser突變以及保守的Gln109可能表明他們參與了β-二酮基中的羰基氧的氫鍵結合。這些合成酶克隆的序列總結如下。為了確認所觀察到的表型是由于mutRNACUATyr-mutTyrRS對位點特異性地插入了p-(3-氧丁酰基)-L-苯丙氨酸所致,在融合有C末端His6尾的Z區蛋白的編碼基因(Nilsson等,ProteinEng.1987,1,107-113)第7位導入琥珀密碼子以替換酪氨酸的密碼子。在1mMp-(3-氧丁酰基)-L-苯丙氨酸存在或不存在下表達蛋白用Ni-NTA層析純化。SDS-PAGE分析表明有非天然氨基酸依賴的蛋白質的表達(圖20)。加載到凝膠上的突變蛋白體積是野生型(WT)蛋白的三倍,其中野生型蛋白用酪氨酸殘基取代了含二酮基的非天然氨基酸,結果表明與酪氨酸相比,p-(3-氧丁酰基)-L-苯丙氨酸的摻入率約為30%。p-(3-氧丁酰基)-L-苯丙氨酸確實被摻入的更令人信服的證據獲自于基質輔助的激光解吸/電離飛行時間質譜(MALDI-TOFMS)。除了觀察到完整蛋白的實驗平均分子量為7991Da(M理論=7997Da)之外,還檢測到一個對應于不含第一甲硫氨酸殘基的蛋白主峰(M實驗=7867Da,M理論=7866Da)。信-噪比>400,提示要用所產生的mutRNACUATyr-mutTyrRS對摻入p-(3-氧丁酰基)-L-苯丙氨酸的保真度高于99%。用生物素羥胺衍生物(MW=331.39,購自MolecularProbes)體外標記表達的含二酮基蛋白質檢驗了能夠用二酮基作為化學手柄對蛋白質進行位點特異性修飾以添加外部特性。在25℃用溶于pH4.0磷酸鹽緩沖液的2mM生物素羥胺處理純化的突變Z區蛋白和野生型Z區蛋白12小時。用水透析去除剩余的生物素羥胺后用MALDI-TOFMS分析此二種蛋白。獲得的實驗平均分子量分別為8315Da(M理論=8310Da,生物素標記的完整突變蛋白),8182Da(M理論=8179Da,生物素標記的不含第一甲硫氨酸的突變蛋白)和8225Da(M理論=8221Da,生物素標記的不含第一甲硫氨酸的乙酰化形式的突變蛋白),證實生物素羥胺與突變Z區蛋白反應的摩爾比為1∶1。如預期的那樣,未檢測到野生型Z區蛋白的標記產物,說明標記反應只發生在羥胺與二酮基之間,羥胺不與野生型蛋白中的任何功能基團反應。考慮到在質譜中未觀察到含二酮基的未標記突變蛋白,這些數據證明了利用二酮基手柄體外選擇性修飾蛋白質有極佳的特異性和高反應活性。本實施例證明用產生的高特異性正交翻譯系統可在體內將β-二酮基手柄位點特異性地摻入到蛋白質內,其高保真度和效率與其天然系統相當。鑒于在較寬pH范圍內3高度穩定并且易于制備,那么很可能通過在β-二酮基與賴氨酸殘基的氨基之間形成希夫堿來改進蛋白-蛋白相互作用,尤其是當p-(3-氧丁酰基)-L-苯丙氨酸位于合適的疏水環境中時。實施例15用于在大腸桿菌體內蛋白質中摻入非天然氨基酸p-異丙基硫代羰基-L-苯丙氨酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將p-異丙基硫代羰基-L-苯丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。發現此非天然氨基酸在摻入到蛋白質內時可作為翻譯后修飾的靶標,此非天然氨基酸有更多的優點,因為該非天然氨基酸上的化學活性基因對細胞酶的水解活性具有抗性。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA聯用。此新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。該得到的正交tRNA合成酶能選擇性地用p-異丙基硫代羰基-L-苯丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入p-異丙基硫代羰基-L-苯丙氨酸。該tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對琥珀無義密碼子TAG的反應中摻入非天然氨基酸。搜索能用p-異丙基硫代羰基-L-苯丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。誘變后,對突變體合成酶庫進行多輪正負篩選。經選擇得到了1個能用p-異丙基硫代羰基-L-苯丙氨酸加載O-tRNA的合成酶克隆。對這個合成酶克隆測序,確定其氨基酸序列(見表5,SEQIDNO62)。此合成酶突變體相對于野生型甲烷球菌合成酶序列顯示有以下列取代實施例16用于在大腸桿菌體內蛋白質中摻入含香豆素的熒光非天然氨基酸的正交翻譯組分本實施例描述了利用大腸桿菌宿主細胞翻譯機制將7-氨基-香豆素丙氨酸和7-羥基-香豆素丙氨酸(見圖1)通過生物合成摻入到蛋白質內所用的組合物和方法。從甲烷球菌中分離得到新型正交合成酶/tRNA對,用于摻入此非天然氨基酸,該正交對在大腸桿菌宿主細胞系統內具有功能。熒光是分子生物學中最敏感、最有用的一種技術。綠色熒光蛋白(GFP)的發現導致了細胞生物學的顯著革新,使我們可直接觀察活細胞中蛋白質的表達、定位、動力學和相互作用(Lippincott-Schwartz等,Nat.Rev.Mol.CellBio.(2001)2444-456)。但是,由于GFP的大小使蛋白質相互作用和動力學不能精確到原子分辨水平。GFP還需要許多轉錄物來獲得合適的信號,其折疊和熒光團的成熟也需要滯后時間。與摻入完整熒光蛋白分子不同,摻入熒光氨基酸可以克服GFP熒光系統的某些局限性。位點特異性地摻入熒光氨基酸對宿主蛋白的干擾很小,因而可更精確地測定熒光共振能量轉移(FRET)(Truong和Ikura,Curr.Opin.Struct.Bio.2001,11573-578)。另外,采用熒光氨基酸可探測每個氨基酸所處的局部環境,通過改變熒光氨基酸在蛋白中的位置可以使我們精確地找到介導與其它細胞組分相互作用的殘基。這對于研究蛋白的體外折疊也很有用(Lakowicz,J.R.,《熒光光譜學原理》(PrinciplesofFluorescenceSpectroscopy),第2版;KluwerAcademic/PlenumPublishersNewYork,1999),特別是在單分子系統中(Lipman等,Science2003,3011233-1235),因為一個蛋白分子通常含有多個色氨酸殘基,用熒光探針特異性地化學標記蛋白質是十分困難的。已化學合成了圖1所示的香豆素丙氨酸。新型正交合成酶來源于甲烷球菌酪氨酰tRNA合成酶,與上述甲烷球菌抑制型酪氨酰tRNACUA聯用摻入這些香豆素氨基酸。此新型正交對對任何常見氨基酸(即天然氨基酸)無親和力或親和力極低。該得到的正交tRNA合成酶能選擇性地用7-氨基-香豆素丙氨酸和7-羥基-香豆素丙氨酸加載琥珀抑制型酪氨酰-tRNACUA。氨酰化的抑制型tRNA(即“負載的”tRNA)在轉錄時對TAG琥珀終止密碼子(一種選擇性密碼子)的反應中可作為大腸桿菌內源性翻譯裝置的底物摻入7-氨基-香豆素丙氨酸和7-羥基-香豆素丙氨酸。該tRNA/合成酶對的正交性能可確保tRNA和合成酶都不會與大腸桿菌內源性tRNA或合成酶發生交叉反應,而只在對TAG的反應中摻入該非天然氨基酸。搜索能用7-氨基-香豆素丙氨酸和7-羥基-香豆素丙氨酸特異性加載正交tRNA的正交合成酶。此搜索所用的方法上面已有描述。通過誘變野生型甲烷球菌酪氨酰tRNA合成酶制備了甲烷球菌酪氨酰tRNA合成酶突變體庫,根據其它氨酰tRNA合成酶分子的晶體結構誘變包含隨機預測活性位點上的殘基。該庫含有約109種多樣性。誘變后,對突變體合成酶庫進行多輪正負篩選。經選擇得到了1個能用7-氨基-香豆素丙氨酸或7-羥基-香豆素丙氨酸加載O-tRNA的合成酶克隆。對這個合成酶克隆測序,確定其氨基酸序列(見表5,SEQIDNO63)。此合成酶突變體相對于野生型甲烷球菌酪氨酰tRNA合成酶序列顯示有以下列取代Y32R、L65A、H70M、D158N和L162T。所獲得的其它數據證明在包含分離的合成酶的正交翻譯系統中香豆素丙氨酸氨基酸在對選擇密碼子的反應中已選擇性地摻入到蛋白質中。這些數據包括(a)表達研究顯示位置4為TAG選擇密碼子的肌紅蛋白基因只有在該非天然氨基酸存在時才表達;(b)通過SDS-PAGE凝膠分析發現只有在該非天然氨基酸存在時合成的突變肌紅蛋白才呈現熒光條帶;以及(c)已結晶了該分離的突變合成酶,結果發現在該非天然氨基酸存在時此突變合成酶的共晶體結構具有熒光。實施例17用于摻入非天然氨基酸的O-RS和O-tRNA種類各種O-tRNA都可用于本發明,本發明不限于使用任何特定的O-tRNA。例如,包含SEQIDNO1或SEQIDNO2核苷酸序列的O-tRNA都可用于本發明。如本文所述的,可構建其它種類的O-tRNA用于本發明。類似地,本發明還提供了摻入非天然氨基酸方法中所用的O-RS(見表5),如選自以下的非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧丁酰基)-L-苯丙氨酸、1,5-丹酰基-丙氨酸、7-氨基-香豆素丙氨酸、7-羥基-香豆素丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、p-氰-L-苯丙氨酸、m-氰-L-苯丙氨酸、、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸、p-異丙基硫代羰基-L-苯丙氨、3-硝基-L-酪氨酸和p-硝基-L-苯丙氨酸。本發明的O-RS多肽包括含有表5所列的氨基酸序列SEQIDNOS7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57以及59-63的那些多肽。本發明還提供編碼O-RS或其片段的多聚核苷酸的例子。例如,編碼本發明的O-RS分子的多聚核苷酸包括SEQIDNOS11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、57、51、56、58。但是,這并不意味著本發明的多聚核苷酸僅限于表5所提供的那些。事實上,能編碼本發明的O-RS氨基酸序列,如SEQIDNOS7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-55、57以及59-63的任何多聚核苷酸也是本發明的特征。應理解,本文所述的實施例和實施方式只是為了說明的目的,本領域技術人員可以根據本文的構思作出各種修改和改變,這些也包括在本申請的構思和范圍內以及附屬權利要求的范圍之內。雖然為了闡明和理解的目的已經詳細描述了本發明,但本領域的技術人員通過閱讀本說明書應當知道,在不脫離本發明的真實范圍下,可以在形式和細節上作出各種修改。例如,上面所述的所有技術和裝置都可以不同組合來使用。本申請書所引用的所有出版物、專利、專利申請和/或其它文獻都已完整納入本文作為參考,如同各個出版物、專利、專利申請和/或其它文獻各自明確獨立地納入本文作為參考。實施例18核苷酸和氨基酸序列本實施例分別提供了各種多聚核苷酸和多肽的核苷酸序列和氨基酸序列。下表5所提供的序列只是作為例子,并不意味著以任何方式將本發明限于表5所提供的序列。表5核苷酸和氨基酸序列權利要求1.一種翻譯系統,其包含(a)選自下組的第一非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素-丙氨酸、7-羥基-香豆素-丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸和p-異丙基硫代羰基-L-苯丙氨酸;(b)第一正交氨酰-tRNA合成酶(O-RS);和(c)第一正交tRNA(O-tRNA);其中,所述第一O-RS用所述第一非天然氨基酸優先氨酰化所述第一O-tRNA。2.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶。3.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。4.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS衍生自大腸桿菌氨酰-tRNA合成酶。5.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS衍生自野生型大腸桿菌亮氨酰-tRNA合成酶。6.如權利要求1所述的翻譯系統,其特征在于,所述第一O-RS包含選自以下的氨基酸序列SEQIDNO12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-54、57、59-63所示的氨基酸序列及其保守變體。7.如權利要求1所述的翻譯系統,其特征在于,所述第一O-tRNA是琥珀抑制基因tRNA。8.如權利要求1所述的翻譯系統,其特征在于,所述第一O-tRNA包含SEQIDNO1或2所示的多核苷酸序列或由其編碼。9.如權利要求1所述的翻譯系統,還包括編碼感興趣蛋白質的核酸,所述核酸含有至少一個選擇者密碼子,其中,所述選擇者密碼子被所述第一O-tRNA識別。10.如權利要求9所述的翻譯系統,還包括第二O-RS和第二O-tRNA,其中所述第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,而其中所述第二O-tRNA識別不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。11.如權利要求1所述的翻譯系統,其特征在于,所述系統包括含有所述第一非天然氨基酸、所述第一O-RS和所述第一O-tRNA的宿主細胞。12.如權利要求11所述的翻譯系統,其特征在于,所述宿主細胞選自真細菌細胞或酵母細胞。13.如權利要求11所述的翻譯系統,其特征在于,所述真細菌細胞是大腸桿菌細胞。14.如權利要求11所述的翻譯系統,其特征在于,所述宿主細胞含有編碼所述第一O-RS的多核苷酸。15.如權利要求14所述的翻譯系統,其特征在于,所述多核苷酸包含SEQIDNO13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51或58所示的核苷酸序列。16.如權利要求11所述的翻譯系統,其特征在于,所述宿主細胞包含編碼所述第一O-tRNA的多核苷酸。17.一種在翻譯系統內產生在所選位置上含有非天然氨基酸的蛋白質的方法,所述方法包括(a)提供一種翻譯系統,其包含(i)選自以下的第一非天然氨基酸p-乙基硫代羰基-L-苯丙氨酸、p-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆素-丙氨酸、7-羥基-香豆素-丙氨酸、o-硝基芐基-絲氨酸、O-(2-硝基芐基)-L-酪氨酸、p-羧甲基-L-苯丙氨酸、m-氰基-L-苯丙氨酸、聯苯基丙氨酸、3-氨基-L-酪氨酸、聯吡啶基丙氨酸、p-(2-氨基-1-羥乙基)-L-苯丙氨酸和p-異丙基硫代羰基-L-苯丙氨酸;(ii)第一正交氨酰-tRNA合成酶(O-RS);(iii)第一正交tRNA(O-tRNA),其中所述第一O-RS用所述非天然氨基酸優先氨酰化所述第一O-tRNA;和(iv)編碼所述蛋白質的核酸,其中,所述核酸包含至少一個被所述第一O-tRNA識別的選擇者密碼子;和(b)在所述蛋白質的翻譯過程中響應所述選擇者密碼子將所述非天然氨基酸摻入所述蛋白質的所述所選位置,從而產生在所選位置含有所述非天然氨基酸的所述蛋白質。18.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供編碼所述O-RS的多核苷酸。19.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供衍生自詹氏甲烷球菌氨酰-tRNA合成酶的O-RS。20.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的O-RS。21.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供衍生自大腸桿菌氨酰-tRNA合成酶的O-RS。22.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供衍生自野生型大腸桿菌亮氨酰-tRNA合成酶的O-RS。23.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供含有選自以下的氨基酸序列的O-RSSEQIDNO12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-54、57、59-63所示氨基酸序列及其保守變體。24.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含通過定點誘變突變野生型氨酰-tRNA合成酶的氨基酸結合口袋,并選擇用所述非天然氨基酸優先氨酰化所述O-tRNA的所得O-RS。25.如權利要求24所述的方法,其特征在于,所述選擇步驟包括在定點誘變之后從含有許多所得氨酰-tRNA合成酶分子的集合中對所述O-RS進行陽性選擇和陰性選擇。26.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供編碼所述O-tRNA的多核苷酸。27.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供O-tRNA,該O-tRNA是琥珀抑制基因tRNA。28.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供含有SEQIDNO1或2所示多核苷酸序列或由其編碼的O-tRNA。29.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供含有琥珀選擇者密碼子的核酸。30.如權利要求17所述的方法,其特征還在于,所述蛋白質含有不同于第一非天然氨基酸的第二非天然氨基酸,且其中提供的翻譯系統還包括第二O-RS和第二O-tRNA,其中的第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且其中的第二O-tRNA識別核酸中不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。31.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供宿主細胞,其中所述宿主細胞含有所述第一非天然氨基酸、所述第一O-RS、所述第一O-tRNA和所述核酸,且其中所述摻入步驟包括培養所述宿主細胞。32.如權利要求31所述的方法,其特征在于,所述提供宿主細胞包括提供真細菌宿主細胞或酵母宿主細胞。33.如權利要求32所述的方法,其特征在于,所述提供真細菌宿主細胞包括提供大腸桿菌宿主細胞。34.如權利要求31所述的方法,其特征在于,所述提供宿主細胞包括提供含有編碼所述O-RS的多核苷酸的宿主細胞。35.如權利要求34所述的方法,其特征在于,所述提供含有編碼所述O-RS的多核苷酸的宿主細胞的步驟包括提供含有選自SEQIDNO13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51或58所示多核苷酸序列的多核苷酸的宿主細胞。36.如權利要求17所述的方法,其特征在于,所述提供翻譯系統包含提供細胞提取物。37.一種翻譯系統,其包含(a)選自以下的第一非天然氨基酸3-硝基-L-酪氨酸和p-硝基-L-苯丙氨酸;(b)第一正交氨酰-tRNA合成酶(O-RS);和(c)第一正交tRNA(O-tRNA);其中,所述第一O-RS用所述第一非天然氨基酸氨酰化所述第一O-tRNA,其效率至少為含有所述第一非天然氨基酸、所述第一O-tRNA和含有選自SEQIDNO7-10的氨基酸序列的O-RS的翻譯系統效率的50%。38.如權利要求37所述的翻譯系統,其特征在于,所述第一O-RS衍生自詹氏甲烷球菌氨酰-tRNA合成酶。39.如權利要求37所述的翻譯系統,其特征在于,所述第一O-RS衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。40.如權利要求37所述的翻譯系統,其特征在于,所述第一O-RS包含選自SEQIDNO7-10所示氨基酸序列及其保守變體的氨基酸序列。41.如權利要求37所述的翻譯系統,其特征在于,所述第一O-tRNA是琥珀抑制基因tRNA。42.如權利要求37所述的翻譯系統,其特征在于,所述第一O-tRNA包含SEQIDNO1所示多核苷酸序列或由其編碼。43.如權利要求37所述的翻譯系統,還包括編碼感興趣蛋白質的核酸,所述核酸包含至少一種選擇者密碼子,其中所述選擇者密碼子被所述第一O-tRNA識別。44.如權利要求43所述的翻譯系統,還包括第二O-RS和第二O-tRNA,其中所述第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且其中所述第二O-tRNA識別不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。45.如權利要求37所述的翻譯系統,其特征在于,所述系統包含宿主細胞,其中所述宿主細胞包含所述第一非天然氨基酸、所述第一O-RS和所述第一O-tRNA。46.如權利要求45所述的翻譯系統,其特征在于,所述宿主細胞是真細菌細胞。47.如權利要求46所述的翻譯系統,其特征在于,所述真細菌細胞是大腸桿菌細胞。48.如權利要求45所述的翻譯系統,其特征在于,所述宿主細胞包含編碼所述第一O-RS的多核苷酸。49.如權利要求48所述的翻譯系統,其特征在于,所述多核苷酸包含SEQIDNO11所示核苷酸序列。50.如權利要求45所述的翻譯系統,其特征在于,所述宿主細胞包含編碼所述第一O-tRNA的多核苷酸。51.一種在宿主細胞中產生在特定位置含有非天然氨基酸的蛋白質的方法,所述方法包括(a)提供宿主細胞,其包含(i)選自以下的第一非天然氨基酸3-硝基-L-酪氨酸和p-硝基-L-苯丙氨酸;(ii)第一正交tRNA(O-tRNA);(iii)第一正交氨酰-tRNA合成酶(O-RS),其中所述第一O-RS用所述非天然氨基酸優先氨酰化所述第一O-tRNA,其效率至少為含有所述第一非天然氨基酸、所述第一O-tRNA和含有選自SEQIDNO7-10的氨基酸序列的O-RS的所述宿主細胞效率的50%;和(iv)編碼所述蛋白質的核酸,其中所述核酸含有至少一個被所述第一O-tRNA識別的選擇者密碼子;和(b)培養所述宿主細胞;和(c)在所述蛋白質的翻譯過程中將所述非天然氨基酸摻入所述蛋白質的所述所選位置,其中,所述蛋白質中的所述所選位置對應于所述核酸中所述選擇者密碼子的位置,從而產生在所選位置含有所述非天然氨基酸的所述蛋白質。52.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供編碼所述O-RS的多核苷酸。53.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供衍生自詹氏甲烷球菌氨酰-tRNA合成酶的O-RS。54.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的O-RS。55.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供含有選自SEQIDNO7-10所示氨基酸序列及其保守變體的氨基酸序列的O-RS。56.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含通過定點誘變突變野生型氨酰-tRNA合成酶的氨基酸結合口袋,并選擇用所述非天然氨基酸優先氨酰化所述O-tRNA的所得O-RS。57.如權利要求56所述的方法,其特征在于,所述選擇步驟包括在定點誘變之后從含有許多所得氨酰-tRNA合成酶分子的集合中對所述O-RS進行陽性選擇和陰性選擇。58.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供編碼所述O-tRNA的多核苷酸。59.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供O-tRNA,該O-tRNA是琥珀抑制基因tRNA。60.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供含有SEQIDNO1所示多核苷酸序列或由其編碼的O-tRNA。61.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供含有琥珀選擇者密碼子的核酸。62.如權利要求51所述的方法,其特征還在于,所述蛋白質包含不同于第一非天然氨基酸的第二非天然氨基酸,且其中所提供的翻譯系統還包括第二O-RS和第二O-tRNA,其中所述第二O-RS用不同于第一非天然氨基酸的第二非天然氨基酸優先氨酰化第二O-tRNA,且其中所述第二O-tRNA識別核酸中不同于被第一O-tRNA識別的選擇者密碼子的選擇者密碼子。63.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供宿主細胞,其中所述宿主細胞包含所述第一非天然氨基酸、所述第一O-RS、所述第一O-tRNA和所述核酸,且所述摻入步驟包括培養所述宿主細胞。64.如權利要求63所述的方法,其特征在于,所述提供宿主細胞包括提供真細菌宿主細胞或酵母宿主細胞。65.如權利要求64所述的方法,其特征在于,所述提供真細菌宿主細胞包括提供大腸桿菌宿主細胞。66.如權利要求63所述的方法,其特征在于,所述提供宿主細胞包括提供含有編碼所述O-RS的多核苷酸的宿主細胞。67.如權利要求66所述的方法,其特征在于,所述提供含有編碼所述O-RS的多核苷酸的宿主細胞的步驟包括提供含有SEQIDNO11所示核苷酸序列的多核苷酸的宿主細胞。68.如權利要求51所述的方法,其特征在于,所述提供翻譯系統包含提供細胞提取物。69.一種包含多肽的組合物,所述多肽含有選自以下的氨基酸序列SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-54、57、59-63或其保守變體,其中所述保守變體多肽用非天然氨基酸氨酰化同源正交tRNA(O-tRNA),其效率至少為含有所述O-tRNA、所述非天然氨基酸和含有選自SEQIDNO7-10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、50、52-54、57或59-63的氨基酸序列的氨酰-tRNA合成酶的翻譯系統效率的50%。70.一種編碼權利要求69所述多肽的多核苷酸。71.如權利要求70所述的多核苷酸,其特征在于,所述多核苷酸選自SEQIDNO11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51或58。72.如權利要求69所述的組合物,其特征在于,所述組合物是含有所述多肽的細胞。73.一種含有多核苷酸的組合物,所述多核苷酸包含SEQIDNO11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、51或58所示的核苷酸序列。74.一種含有權利要求73所述多核苷酸的載體。75.一種含有權利要求73所述多核苷酸的表達載體。76.一種包含載體的細胞,所述載體含有權利要求73所述的多核苷酸。全文摘要本發明涉及能將非天然氨基酸摻入真細菌宿主細胞如大腸桿菌或在真核宿主如酵母細胞中產生的蛋白質的正交tRNA和氨酰-tRNA合成酶對。本發明提供了,例如,但不限于,新的正交合成酶、鑒定和制造所述新合成酶的方法、產生含有非天然氨基酸的蛋白質的方法以及翻譯系統。文檔編號C12N15/00GK101048506SQ200580036982公開日2007年10月3日申請日期2005年10月27日優先權日2004年10月27日發明者P·舒爾茨,L·阿方達,J·R·齊圖魯如,A·戴特斯,D·格羅夫,D·薩默爾,曹蘿麟,王江云,武寧,謝建明,曾華強申請人:斯克利普斯研究院