Hiv－1亞型間(c/b’)基因組和其用途的制作方法

文檔序號：567375閱讀：848來(lai)源(yuan)：國(guo)知局

專利名稱：Hiv－1亞型間(c/b’)基因組和其用途的制作方法
發明說明本發明涉及一種多核苷酸，其包括在SEQ ID NO1，2或3中所示的核酸序列或其片段或衍生物，或與在SEQ ID NO1，2或3中所示的核酸序列雜交的多核苷酸。本發明更涉及由在SEQ ID NO1，2或3中所示的核酸序列或其片段或衍生物所編碼的多肽。該等多核苷酸和多肽可用為藥品，疫苗或診斷用物質，較佳者是用于HIV感染的治療，預防或診斷。
在考慮到至本世紀末全世界經估計有超過四千萬受感染的人且其中有超過90％是生活在發展中國家中的人類免疫缺陷性病毒(Human Immunodeficiency Virus)(HIV)的全球分布程度，HIV疫苗的開發據認為是現代工業化社會的重大挑戰之一。不過，到目前為止，成功的HIV疫苗的開發仍然受限于此種病毒的復雜生物學及其與宿主所具免疫系統的復雜相互作用。到目前為止已經在發展中國家中對臨床第三期用藥中試驗過的少數可選用疫苗主要是以第1型HIV之外部糖蛋白gp120或gp160為基礎。不過，這些研究的結果十分令人失望，該等疫苗不僅不能誘導出寬廣的交叉中和抗體與T細胞反應，而且甚至于不能防止已對某些接種疫苗的個體報導過的突破感染。這種結果的諸項原因之一確定是來自于所使用的衍生自經實驗室適應的病毒株的抗原與在試驗區例如泰國境內循環的遺傳分歧性病毒之間的廣泛序列變異。
對在全球流轉的HIV病毒株所進行的分類學分析，除了O組病毒以外，已鑒定出在包膜蛋白質中存在著高達24％序列變異的10種不同的序列亞型(A-J)組成的一主要組(M)(Kostrikis et al.，1995；Leitner and Albert，1995；Gaywee et al.，1996World HealthOrganisation Network for HIV lsolation and Characterization，1994)該O組病毒與M組病毒在某些讀框上有超過40％的差異(LoussertAjaka et al.，1995；Myers et al.，1996；Sharp et al.，1995；Shary etal.，1999)。HIV是經由突變與亞型間重組的快速累積而進行演化。在地理區群中共同循環的諸不同亞型代表進化枝間鑲嵌性病毒(interclade mosaic virus)的產生與分布的分子基礎。雖然已經利用血清學和異型雙螺旋體DNA分析對全球HIV-1變異體作過精深的研究，不過因為現有諸亞型和多種重組形式都缺乏經完整測序的基因組，所以大部份分類學研究都是以包膜序列為基礎。
非亞型B病毒會引起極多種全球性新的HIV-1感染。其中，進化枝CHIV-1病毒株在有關受感染人的總數以及新感染例特別是在南美和亞洲中的高發生率兩者扮有前導性角色。因此之故，進化枝C病毒的鑒定對于診斷、預防和治療目的而言都是頂級優先者之一。除了泰國之外，有關在整個亞洲流傳的HIV-1病毒株的分布與分子特性所能得到的資訊直到最近仍然有限。WHO估計南亞與東南亞具有最快速的HIV傳播速率且很快就會變成全世界最大的HIV流行區。中國具有與這些區域非常類似的社會和經濟狀況與直接的倫理和經濟關聯。自從1995年早期之后，在中國許多省中即可清楚地看到HIV感染的快速增加。與1985年到1994年所偵檢到的HIV和AIDS的累積1774病例相比，在1995年偵檢到1421例，而單在1997年就偵檢出超過4000病例。WHO估計到1997年底在中國境內會有超過400,000 HIV感染例，且單在1997年內，估計有6400個累積的AIDS死亡例和4000個死亡途中者。于最近的全國HIV分子流行病學調查中，可以發現在云南省所存在的亞型原型B與B’-亞型(Graf et al.，1998)已被毒品使用者，污染的血液和tat漿收集服務傳播到中國中部與東部。第二種流行病最可能是在1990年代早期由帶有亞型C病毒株的印度IDUs輸入到該等相同的地區(Luoet al.，1995；Shao et al.，1999)。在數年之內，亞型C病毒經由毒品運輸在中國南部、中部及甚至于西北部快速地傳播且在中國境內引起廣泛傳播的流行病。根據最近的全國HIV分子流行病學調查，幾乎所有感染亞型C的個體都是IDUs且占有中國HIV感染IDUs的約40％，可以推測出亞型C病毒為在中國境內IDUs中所遍布的諸主要HIV-1亞型中之一(Shao et al，1998；Shao et al.，1994)。
由此點可以推測出在中國境內IDUs之間的HIV流行病于短短數年之間就從單一主要亞型(B)擴展到至少兩種主要亞型，B-Thai和C，增加了亞型間重組的可能性。根據我們對于不同病毒株所具可變異性與抗原性的認知，應該對區域性病毒株調整診斷工具，治療藥劑與疫苗。不過，目前對于非-亞型B病毒所用的分子藥劑的種類數目仍然極為有限。目前，對于B或C以外的病毒只有少數非重組分子克隆(molecular clone)和一些鑲嵌性基因組(mosaicgenomes)可以取用。有關進化枝CHIV-1病毒，到目前為止只有公開出非一重組型代表物與4A/C重組體，彼等全部都是源自非洲、南美或印度(Lao et al.1995；Gao et al，1998Loke et al.1999)。再者，所有先前對于在中國境內的亞型C病毒的數據都局限在env基因的遺傳亞型定型(genetic subtyping)(Luo et al.1995；Yu etal.1997；Salminen et al.1995)。
到目前為止已有數個使用疫苗實施針對HIV感染的臨床實驗。在該等臨床實驗中所觀察到的令人失望的結果包括在接受疫苗的人中不斷地報導出有突破防線性的感染。這種結果經歸因于所施用的包膜蛋白質與感染性輸入病毒之間的重大序列變異，此點于事實上主要是來自于對于在獨特地理區域內流傳的病毒群所作的鑒定不足所致。此點導致對和在試驗場域中的病毒群不相關的病毒的病毒抗原產生體液免疫反應與(較少程度地)細胞介導的免疫反應。再者，已經報導的低親和結合性，包膜特異性抗體不僅缺乏中和能力，而且甚至于會助成通過補體-或Fc-受體的感染的增強。另外，所選用的抗原和輸送系統會轉變成為極端微弱的細胞介導的免疫反應的誘導劑。
基于對跨進化枝保護性免疫反應的正確知識的缺乏以及有關在已知有多重HIV-1亞型共同流傳的發展中國家境內的復雜情勢，疫苗制劑應該包括多種代表性抗原的混合物。因此，有需要分離與鑒定進化枝C病毒，特別是克隆其編碼區。
本發明的問題是由權利要求的主題內容予以解決。
本發明用附圖進一步闡明。

圖1顯示來自克隆97cn54的env C2V3編碼區與主要HIV-1(M組)亞型的代表的分類學關系的圖解說明。Cn-con-c代表在中國境內普遍流行的HIV-1亞型C病毒株的env共有序列(consensussequence)。分類學樹是使用鄰域連接法(neighbour joining method)構成的。在結點的值指的是朝右的簇集受到支持的相生百分比(percent bootstrap)。其中只顯示出70％和更高的相生率。右邊括號表HIV-1M組的主要亞型序列。
圖2顯示出97cn54完整gagpol編碼區的重組鑒定程序分析(theRecombinant Identification Program analysi)(RIP，versionl，1.3)的圖解說明(窗尺寸200，統計意義閾值90％，Gap處置STRIP)。gag和pol兩開放讀框的位置是在圖的頂端用箭號指示出。Rip分析是以使用從所選代表最相關性HIV-1亞型的病毒株導出的參比序列進行背景對比(background alignment)為基礎的。標準代表物是使用如所示的不同顏色予以標記出。X軸指示出沿著該對比的核苷酸位置。Y軸指示出97cn54與所列出的參比亞型的類似率。
圖3顯示出在97cn54衍生的gagpol讀框內的諸不同區相對于主要HIV-1(M組)亞型的標準代表物的分類關系的圖解說明。分類學樹是使用鄰域連接法以下列序列連續段(stretch)為基礎而構成者(A)核苷酸1-478，(B)479-620，(C)621-1290，(D)1291-1830，(E)1831-2220，(F)2221-2520和(G)2521-2971。所給位置指的是gag開放讀框的第一個核苷酸。灰色區突顯出用進化枝C-(A，C，E，G)或B-(B，D，F)衍生的參比株分析的序列的簇集。在結點的值指的是朝右的簇集受到支持的相生百分比。其中只顯示出70％和更高的相生率。
圖4顯示出97cn54所含諸不同區的重組鑒定程序分析(RIP，version 1.3)的圖解說明(窗尺寸200，統計意義閡值90％，Gap處置STRIP)。分析包括(A)-1500bp的序列連續段，從vif基因的起始密碼子到env基因的5’端，內含vif，vpr，tat和rev的第一個外顯子，vpu以及env基因的前面200bp與(B)從env的3’端有300bp重疊之一段約700bp的片段內含完整的nef基因與3’LTR的部份。vpr，tat，vpu，env，nef的起始密碼子以及3’-LTR的5’端等的位置是在圖的頂端分別以箭號指示出。Rip分析是以便用從所選代表最相關性HIV-1亞型的病毒株導出的參比序列進行背景對比(background alignment)為基礎的。所示標準代表物是使用不同顏色予以標記出。X軸指示比沿著該對比的核苷酸位置。Y軸指示出97cn54與所列出的參比亞型的類似率。(C)和(D)得自中國境內的兩種獨立進化枝C-分離物(xj24和xj158)的序列的Rip分析，其中vpr與vpu基因重疊包括tat的第一個外顯子。
圖5顯示出一分類學樹分析。分類學樹是使用鄰域連接法以下列序列連續段(stretch)為基礎而構成(A)-380bp片段將vpr基因的3’150bp到vpu讀框的末端重疊，(B)net編碼區的前面290bp與(C)nef基因的3’320bp。在結點的值指的是朝右的簇集受到支承的相生百分比。其中只顯示70％和更高的相生率。右邊括號表HIV-1M組的主要亞型序列。
圖6為97cn54的鑲嵌性基因組組織的示意圖。
圖7為在已知且經實驗證明過的原型B(HIV-1LAI)衍生CTL表位與在進化枝C病毒株97cn54的gag，pol和env多肽中的相應氨基酸序列之間的比較的圖解說明。顯示出下列功能結構區(functional domain)gag(p17基質，p24衣殼，p15核衣殼和連結蛋白質)，POL(PR蛋白酶，RT反轉錄酶，IN整合酶(integrase))和ENV(gp120外部糖蛋白，gp41透膜蛋白)。在開放讀框下方的數值分別指示出相對于多肽氨基端的氨基酸位置。已知HIV-1LAI衍生CTL表位的單倍型(haplotype)限制分別在左和右兩邊緣指示出。綠色條代表在已知的表位與對應的進化枝C序列之間的相同率，藍色條指示出2或更少的保守性錯配(conservative mismatch)。紅色條表相對于相應的LAI衍生表位具有超過2個保守性錯配或任何非保守性取代的進化枝C衍生序列連續段。
圖8顯示出進化枝CHIV-1 97cn54的完整長度密碼核苷酸序列(SEQ ID NO1)與相應的以一字母碼示出的氨基酸。所有三個讀框都在此給出。星號表終止密碼子。
圖9顯示出使用各DNA質粒進行肌肉內免疫之后細胞毒性T細胞在小鼠BALB/c脾細胞內的活性結果的圖解說明。將在初次免疫3星期之后從每組各5只的小鼠分別取得的淋巴細胞與裝載入具有氨基酸序列AMOMLKETI的gag多肽的同基因P815肥大細胞瘤細胞(用20,000rad照射過)共同培養。對照組包括從未免疫處理，用裝載肽的P815細胞刺激過的小鼠所取得的脾細胞。在體外培養5天之后收獲細胞毒性效應細胞群。在51C釋放標準檢定中針對用上面所提九肽裝載過的A20細胞或針對未裝載的A20細胞讀取細胞毒性反應。所顯示出的數據代表從分別實施三次該做法所得的平均值。所測定的標準偏差分別低于相對于該平均值的15％。
“表位”(epitope)或“抗原決定簇”(antigenic determinant)一詞如本文中所用者指的是可為一抗體所特異地辨識的抗原所含免疫學決定基。一表位包括至少3個，較佳者至少5個氨基酸的呈空間或不連續構象的氨基酸。一表位也可以包括一包括著一連續氨基酸序列的單一節段多肽鏈。
“多核苷酸”一詞如本文中所用者是指稱具有任何長度，可為核糖核苷酸或脫氧核糖核苷酸的核苷酸單位的單鏈或雙鏈異元聚合物。該術語也包括經修飾的核苷酸。
“衍生物”一詞如本文中所用者指的是一核酸，其亦編碼一或多種被另一核酸序列所編碼的多肽，雖則該核酸的核酸序列不同于該另一核酸序列。于此種意義中，“衍生物”一詞也指稱因為遺傳密碼簡并(degeneration)而存在的其他核酸序列的相等物(equivalent)。因此，“衍生物”一詞包括例如編碼相同多肽的核酸如根據SEQ IDNO1，2或3的核酸但具有另一核酸序列者。再者，該術語包括編碼相同多肽的核酸片段如具有根據SEQ ID NO1，2或3的核酸序列的核酸片段。
“多肽’一詞如本文中所用者是指稱具有至少兩個氨基酸殘基由肽鍵所連接成的鏈。所以，該術語包括任何氨基酸鏈，例如寡肽(oligopeptides)或蛋白質。該術語也指稱其中有一或更多個氨基酸是經修飾過，例如乙酰化、糖基化或磷酸化之氨基酸鏈。
“連續序列”或“片段”一詞如本文中所用者是指稱一衍生自一參比序列的線型核苷酸或氨基酸連續段，例如在序列表中所列的本發明各序列。
“選擇性雜交”或“可選擇性雜交”，一詞如本文中所用者是指稱在嚴格雜交條件(stringent hybridization condition)之下兩多核苷酸形成雙螺旋核苷酸分子的雜交條件。此等條件為現有技術所知悉者且見于例如，Sambrook et al.，Molecular Cloning，Cold SpringHarbour Laboratory(1989)，ISBN 0-87969-309-6之中。嚴格雜交條件的例子包括(1)在4×SSC內于65℃之下或(2)在50％甲酰胺于4×SSC中42℃之下，兩者都于其后接著進行在0.1×SSC內于65℃之下1小時的洗滌步驟。
“病毒載體”或“細菌載體”一詞如本文中所用者指的是經遺傳修飾的病毒或細菌，其可用來將SEQ ID NO1，2或3的DNA序列或其衍生物，片段，或其編碼表位或表位串的序列導到不同的細胞，較佳者抗原呈遞細胞，例如樹突狀細胞(dendritic cell)之內。此外，細菌載體可以適當地用來直接表達由SEQ ID NO1，2或3所編碼的多肽或由其衍生的表位或表位串。
本發明的一方面涉及在SEQ ID NO1，SEQ ID NO2或SEQ IDNO3中所示的核苷酸序列。為了收集所需的有關代表性和實質完全長度病毒基因組的資訊，首先對中國境內超過100個HIV-1亞型C血清陽性靜脈內毒品使用者(IDUs)進行分子流行病學研究，對于在病毒包膜糖蛋白基因內的固定區2和可變區3(C2V3)進行的基因定型(genotyping)揭露出在整個中國境內最普遍流傳的病毒株相對于印度來源的亞型C序列有最高的同源性(homology)。根據此等結果，從選出的經HIV感染IDU的周圍血液單核細胞(PBMCs)擴增與亞克隆實質完整長度代表在整個中國境內最普遍流傳的進化枝C病毒株的基因組。序列分析鑒定出一鑲嵌性構造，其可推斷出在該地理區域內普及性進化枝C與(B’)-亞型Thai病毒株的基因組之間有廣泛的亞型間重組事件。RIP(重組檢定程序)分析與分類學相生推斷總共有10個斷點(i)在gagpol編碼區內，(ii)在vpr內與在vpu基因的3’端以及(iii)在nef開放讀框之內。Thai(B)-序列因而包括(i)在gagpol編碼區內的數個插入(核苷酸478-620，1290-1830，2221-2520，各分別相對于在gag起始密碼子與gagpol讀框內的第一個核苷酸)，(ii)在3’-vpr，完整的vpu，tat和rev的第一個外顯子(從相對于Vpr讀框的起始密碼子的核苷酸138起算的約1000個核苷酸)以及(iii)nef基因的5’半部(核苷酸1-300)。在包括9078個核苷酸的序列(SEQ IDNO1，表3)之內的其余諸部份顯示出對已知亞型C分離物的最高同源性。位于97cn54中的vpr/vpu編碼區內以及在nef基因內的諸斷點經發現也出現于從往在中國境內不同地區的IDUs分離出的許多亞型C病毒株的類似位置上，由此可以推測C/B’重組株有一個共同的始祖。有超過50％在Gap和Pol內的明確亞型B-衍生CTL表位與10％在Env內的已知表位經發現可以與在此進化枝C/B’嵌合型參比株內的多個序列正確地匹配。這些結果可以經由對疫苗設計提供高度相關性模板(templates)與開發出為最恰當的免疫學/病毒學請出資料所用藥劑而實質地幫助在中國境內的疫苗相關性努力。
上文所說明的代表最普及的中國C型病毒株的本發明HIV-1序列作為基礎與來源的用途有利于預防性與治療性疫苗的開發。對于成功的HIV候選疫苗的開發所需的結果為(i)對于個別流行病學情勢的詳細知識與(ii)代表在一地理區域內或獨特的人群中最普及病毒株的克隆編碼序列的可取得性。此等序列代表著作為下列的基礎(i)在預防上與治療上可以應用的HIV候選疫苗的合理設計，(ii)特異性治療醫藥品的開發，例如治療有效的誘餌寡核苷酸和蛋白質，反義構建體(antisense constructs)，核糖體和反式顯性陰性效應突變體(transdominant negative effective mutants)，(iii)基因療法所用慢病毒載體之開發，與(iv)可以用來診斷或監測HIV感染及用于免疫學/病毒學監測疫苗處理過程的藥劑的制造。
此點對于以HIV包膜蛋白質為基礎的候選疫苗特別正確，該等HIV包膜蛋白質業經證實為在所有HIV蛋白質中最具可變異性者。除此之外，一種成功的疫苗必須誘發免疫系統的最可能兩種分支中和抗體，其理想上是針對包膜蛋白質中的構象表位，以及細胞介導的免疫反應(CD4陽性T-輔助細胞，CD8陽性細胞溶解性T-細胞，Th1型細胞因子，β-趨化因子(chemokines))，其是針對不同病毒蛋白質的表位而產生的。根據本發明的構象表位包括涉及抗體結合作用的至少3個氨基酸且可能為5或更多個氨基酸。構象表位也可以包括數個節段，其可能為單一蛋白質的節段或在低聚物復合物例如三聚物型糖蛋白包膜復合物的情況中為數個具有不同亞單位的節段。根據本發明一線型表位在長度上的變異通常為包括至少8個氨基酸到約15個氨基酸或更長者，較佳者包括9到11個氨基酸，特別是在MHC第I類限制CTL表位的情況中。
因此，本發明更有涉及SEQ ID NO1，2或3的核酸序列或其片段或衍生物所編碼的多肽。本發明更涉及SEQ ID NO1，2或3的核酸序列或其片段或衍生物所編碼的包括至少8個氨基酸的連續序列。較佳者本發明多肽包括一可自然地引起感染患者內免疫反應的抗原決定簇。更佳者為包括SEQ ID NO2或3的核酸序列或其片段或衍生物所編碼的氨基酸序列。最佳者為表位，其包括一相同于SEQ ID NO1所編碼的多肽與-HIV-1LAI參比分析物的具有9到11個氨基酸的連續區，或其為包括在該有9到11個氨基酸的序列內的2或更少個保守性氨基酸取代者。本發明多肽可以用為例如疫苗和治療性物質或診斷用物質。
本發明的另一方面涉及SEQ ID NO1，2或3的多核苷酸。本發明更涉及一種具有SEQ ID NO1，2或3的核苷酸序列的多核苷酸片段或涉及一種包括至少一個能夠選擇性地雜交到如SEQ IDNO1，2或3所示核苷酸序列的連續核苷酸序列。再者，本發明也涉及本發明多核苷酸的衍生物或多核苷酸片段。較佳者該多核苷酸或多核苷酸片段包括一有至少9個核苷酸，較佳者至少15個核苷酸，更佳者至少27個核苷酸或更長者的連續序列。該多核苷酸或多核苷酸片段也可以包括單一HIV基因的編碼區，例如gag，pol，env。其例子為在SEQ ID NO2和SEQ ID NO3中所列出者。本發明的另一方面涉及一種多核苷酸，其包括至少兩個本發明多核苷酸片段，其中該等多核苷酸片段可以重疊或可由一核苷酸序列間隔段所分隔。該等多核苷酸片段的序列可相同或相異。本發明多核苷酸或多核苷酸片段可以用為疫苗或治療性物質或診斷用物質。
克隆的SEQ ID NO1的進化枝C HIV-1 97cn54編碼序列和其衍生物可以用為下列應用的基礎供治療與預防目的所用的進化枝-C特異性HIV-1疫苗之開發。此等進化枝特異性疫苗可以在全世界所有地理區中使用，于該等區域中該進化枝C病毒株在HIV流行病中扮有主要角色，例如在拉丁美洲，非洲以及亞洲境內。更特定言之，要針對東南亞和中國進行試驗且開發出的HIV疫苗應該以上文所說明的97cn54編碼序列為基礎以期誘導出亞型特異性體液與細胞介導的免疫反應。再者，此等進化枝-C特異性HIV-1疫苗可以在考慮所有的或明確選定的全世界性相關HIV亞型之下用作混合疫苗的成分。
要輸送到免疫系統的抗原或編碼序列包括(i)從表3中所列出的諸開放讀框中之一者衍生的有至少3個到約5個氨基酸的連續段或更長的連續段，(ii)具有較佳者9到11個氨基酸的連續段，(iii)以分開的方式或以多肽串形式(表位串)輸送的此等連續段的組合，其中該表位串與彼等的氨基酸序列分別地可以重疊或可用氨基酸或其他間隔段予以分隔，且最佳者完整的蛋白質或對應的編碼序列或其變異體，彼等也可以包括延伸的刪除(deletion)以期在接受疫苗者體內誘導出恰當的體液與細胞介導的免疫反應。因此之故，本發明的另一個目的涉及SEQ ID NO1，SEQ ID NO2和SEQ ID NO3中所示核苷酸序列或其片段所編碼的多肽。較佳者，該多肽包括具有至少8個氨基酸，較佳者至少9到11氨基酸，更佳者至少15個氨基酸或更長序列的連續序列，或較佳者，包括單一多肽鏈的至少3個氨基酸的不連續表位或于低聚物蛋白質的情況中，包括具有不同多肽鏈的復合物。以91cn54編碼序列為基礎的疫苗構建體包括現有技術中已知的所有抗原形式且包括所有已知的輸送系統。
由SEQ ID NO1到3的核酸序列的片段所編碼且于每一情況中包括3到5個氨基酸，較佳者9到11或更多個氨基酸的短表位可以較佳地以合成方式制成。此等肽包括B細胞表位，第II類MHC限制輔助T細胞表位，第I類MHC限制細胞毒性T細胞表位，或所提變異體的組合。具體表位可以重疊或由一間隔段所分隔，其優先地包括甘氨酸及/或絲氨酸部份。分支型肽可以根據現有技術于合成中產生或在具體肽的合成與純化之后利用已知且為市面上可取得的同元或異元雙官能化學交聯劑予以產生。另外，可以將本身為小型的免疫原性肽經由交聯反應綴合到所選定的載體蛋白質例如卵白蛋白，經基因工程方式嵌入到載體蛋白質之內或分別融合到彼等的N端和C端。較佳者，此等載體蛋白質都能夠形成特別的構造，其中(i)于適當的細胞培養系統內進行表達的過程中(參看下文)或(ii)在經純化變性的蛋白質的適當回折之后，將B細胞表位較佳地安置在該特別載體的表面上。同時，有傾向于形成特別構造的多肽的許多例子是已知的，例如B型肝炎病毒(HBV)核心抗原(HBcAg)，HBV表面抗原(HBsAg)，HIV組特異性抗原，多瘤病毒VP1蛋白，乳頭狀瘤病毒L1蛋白，或酵母IA蛋白。由于大部份到目前為止所提及的粒子形成性蛋白質都是從不同病毒的衣殼或結構蛋白質衍生的，因此彼等也稱為似病毒粒子；可參看特別版的Vaccine.(1999)，Vol.18，Advances in，Proteln and Nuddc Acid VaccineStrategies.Edhed by Pof.P.T.P.Kauvama。
由SEQ ID NO1到3的核酸序列的片段所編碼且具有超過30，較佳者超過50個氨基酸的表位串和多肽，及具有形成粒狀結構(VLP)的傾向的多肽可以使用現有技術中已知的手段在原核生物體內制造與純化。該等質粒因而包括細菌復制源例如ColEl，通用的選擇標志例如對康那霉素(kanamycin)或氨芐青霉素(ampicillin)的抗性，組成型活性或可誘導性轉錄控制單元例如LacZ或Tac啟動子，以及轉譯起始和終止信號。對于經簡化的表達和親和性純化，可以視情況使用可分離的融合部份與純化工具例如谷胱甘肽-S-轉移酶或低聚組氨酸標簽(tag)。
(i)在真核生物細胞培養物例如酵母細胞、真菌、昆蟲細胞或哺乳動物細胞內制造該等表位串，完全蛋白質或似病毒粒子結構體，或(ii)為了免疫化目的直接輸送DNA，等所使用的DNA或RNA可以依賴病毒本身所利用的密碼子用法。另外，在技術上可行的任何情況中可以將該密碼子用法調整成適用于在個別制造系統內高度表達的基因內最常或次最常使用的密碼子。在為了保險措施經最佳化的多基因內使用的密碼子最佳化的例子包括Gag，Pol和Nef等基因以及包膜基因都列于SEQ ID NO2和3之中。該SEQ ID NO2和3在實施例15中有更特別的說明。
建立細胞系以在所提細胞培養系統內生產表位串，多肽或似病毒粒子結構體可以使用現有技術的載體(vector)為基礎。該等載體同樣地可以包括細菌復制源點，陽性或陰性選擇標志及主要的外來蛋白質的正常轉錄和轉譯所用的具體控制區。后面所說明的DNA疫苗構建體所含成分也代表出現在載體內用以在不同的哺乳動物細胞培養物內表達表位串，多肽或完全蛋白質的模組。
最簡單的免疫化形式為純DNA疫苗的直接應用。該疫苗基本上包括編碼區的5’，一轉錄控制區也稱為啟動子/增強子(promoter/enhancer)區，視情況后面接著功能插入序列以增強基因表達，(ii)一Kozak共有序列包括一轉譯起始密碼子以及一轉譯終止密碼子后面接著一在該外來基因3’端的聚腺苷酸化信號。較佳者，該啟動子/增強子區可以支持所欲基因產物的組成性表達且為衍生自巨細胞病毒立即早期基因(immediate early gene)(CMV-IE)或羅氏肉瘤病毒長末端重復體(RSV-LTV)。另外，可以使可誘導形式的轉錄控制區例如經由例如應用四環素或類似物來調節轉錄的Teton/Tet off啟動子。再者，有利者為使用細胞類型特異性調節轉錄控制區例如肌肉肌酸激酶基因(MCK基因；肌肉特異性表達)或CD4受體基因的上游區，或在第II類MHC基因(在抗原呈遞細胞中優先表達)配置的啟動子/增強子區。于某些情況中，也使用來自(i)細胞類型特異性啟動子與(ii)病毒增強子區的嵌合型組合間組織特異性表達與病毒增強子所具強轉錄活性等多項優點組合在一起。經由整合入通常配置在一開放讀框5’端的功能性插入序列所達到的基因表達的增強是因為從經剪接轉錄本的核所得相對于未經剪接者較增強的輸出速率且是經由嵌置在一經配置在β-球蛋白基因之內的插入序列而得到。
以SEQ ID NO1，2或3為基礎的交佳DNA疫苗也另外包括一源自α病毒類例如西門利克森林α病毒(SFV)或委內瑞拉腦炎病毒(VEE)的復制子(replicon)。此處，前面提及的核轉錄控制區與視情況考慮到的插入序列后面先接著該VEE或SFV非結構蛋白質(NS)的編碼區。只有其3’端才接著實際的外來基因，該外來基因的細胞質內轉錄是由NS敏感性啟動子所調節。相應地，產生一從核轉錄控制單元起始的跨過數個開放讀框的長轉錄本，其接著轉位到細胞質內。于此處合成的NS蛋白質隨即經由結合到相應的控制區而活化該等外來基因的細胞質內轉錄。此種擴增處理通常會導致豐富的RNA合成且因而導致該外來蛋白質的高合成速率。與放棄上述細胞質內RNA擴增的效應的傳統質粒直接相比，于至少可相比擬的免疫原性之下，后者通常可以促成要施用的質粒用量的明顯減少。
前述肽、蛋白質、似病毒粒子和DNA構建體可以經由肌肉內、皮下、皮內、靜脈內注射來施用，其中可以使用個別的先前技術來施用蛋白質抗原。對于DNA免疫，可以使用帶有注射針頭的傳統注射針筒，或者使用沒有注射針頭者而通常為利用空氣壓力將DNA直接導到合意的組織之內。此舉也特別包括利用噴霧工具將含有DNA的疫苗調配物經鼻內和經口施用者。另外，也可以將DNA拼合到固體支持物例如金珠粒上且通過空氣壓力施用到組織之內。
為了增強或調制免疫反應，可以將前述蛋白質抗原和DNA構建體與通常為免疫反應刺激劑的所謂佐劑組合施用或按順序施用。傳統佐劑例如氫氧化鋁或羥基磷酸鋁，可以導致體液免疫反應的刺激顯示出IgG1亞型的高抗體滴定度。更現代的佐劑例如CpG寡核苷酸(共有核心序列嘌呤-嘌呤-CpG-嘧啶-嘧啶)或其經化學修飾的衍生物(硫代磷酸寡核苷酸，具有肽主鏈的寡核苷酸)通常可增強細胞靶的免疫反應且主要支援Thl型的細胞介導的免疫性，其具有下列特征高IgG2a亞型的抗體滴度及誘導Thl細胞因子例如γ-IFN，IL-2和IL-12。
前述肽、蛋白質、似病毒粒子和DNA構建體的施用和攝取可以經由結合到較高分子結構物上或摻加到較高分子結構物之內而獲得特別地改良，該較高分子結構物的例子為生物可降解性粒子，多層狀物(multilamellar)，較佳者陽離子性微脂粒，免疫刺激性復合物(ISCOMS)，病毒脂蛋白體(virosomes)或在體外(invitro)組裝的病毒粒子。該等生物可降解性粒子有例如PLA-(L-乳酸)，PGA-(聚乙醇酸)或PLGA-[聚(D，L-乳交酯-共聚-乙交酯)]微球體或其衍生物，陽離子性微粒子或衍生自細菌多糖莢膜的載體物質。集合名詞ISCOMS是指稱從石鹼樹(Quillajia saponaria)的樹皮所得水溶性萃取物衍生出且經層析法醇化過的免疫刺激性復合物。有關各種佐劑與給藥手段的先前技術詳細摘要見于http//www.niaid.gov/aidsvaccine/pdf/compendium/pdf[Vogel，F.R.，Powell，M.F.andAlving，C.R.，A Compendium of Vaccine Adjuvants andExcipients(2ndEdition)]。
再者，也可以使用病毒載體或細菌載體來適當地呈遞表位串，多肽和似病毒粒子。
根據現有技術狀態，例如經遺傳修飾的沙門氏菌與李斯特氏菌(listeriae)，因為彼等所具有的天然細胞向性(cell tropism)可以將DNA疫苗構建體導到抗原呈遞細胞例如單核細胞，巨噬細胞和主要的樹突狀細胞之內而為可較佳地使用者。除了細胞類型特異性的效益之外，遺傳修飾可以達成下述事實，亦即DNA可以無損壞地進入抗原呈遞細胞的細胞質之內。于此種情況的中，DNA疫苗構建體可進入細胞核內而于該處讀框可通過真核生物型、較佳者病毒型或細胞型特異性啟動子使用細胞資源和蛋白質進行轉錄。在RNA輸送到細胞質之內后即轉譯出相應的基因產物，且根據個別狀況進行轉譯后的修飾并分配到相應的細胞區室之內。
也可以使用細菌載體(沙門氏菌、李斯特氏菌、耶爾森氏菌(yersiniae)等)來誘導出粘膜免疫性，較佳者是在口服之后。藉此經由細菌的轉錄和轉譯機制產生相應的抗原，因而不會發生通常存在于喃乳動物細胞內的轉譯后修飾(沒有相應的糖基化；沒有分泌途徑)。
此外，到目前為止已經有眾多經減毒的病毒載體，彼等可以成功地以高產率地幫助合意抗原的表達。此等病毒載體除了彼等所具有的唯一抗原產生能力之外，可以直接用于免疫化。該產生可先在體外(ex vivo)進行例如用于在給疫苗接受者服用之后將抗原呈遞細胞感染的情況，或者直接在體內(in vivo)使用重組病毒經由皮下、透皮、皮內、肌肉內或鼻內免疫化導致隨著個別免疫化成功的有益抗原呈現。如此，可以經由使用重組疫苗病毒例如經由通過雞細胞予以減毒的修飾安卡拉牛痘病毒(Modified VacciniaAncararirus)(MVA)，經遺傳減毒的紐約型牛痘(NYVAC)或鳥類地方性禽痘病毒類(禽痘病毒(Fowlpox)，金絲雀痘病毒(Canarypox))。另外，有數種其他病毒也經鑒定過例如重組α病毒類例如西門利克森林α病毒或委內瑞拉腦炎病毒，重組腺病毒類，重組單純庖疹病毒類，流感病毒類等。
最后，若根據先前技術經由克隆方法補充側接在密碼部份的調節性序列(LTR，長末端重復體)時，也可以根據SEQ ID NO1，2或3產生經減毒的HIV病毒且用于免疫目的。隨后也可以根據先前技術在例如nef基因中施以一或多個刪除而得到充分的減毒。在SEQ ID NO1和3中所顯示出的核酸序列以及從其所衍生的肽、蛋白質和似病毒粒子也可以用為基因轉移所用病毒載體所含的成分。
由GagPol基因(SEQ ID NO1，核甘酸177-4458；表3)所編碼的多肽可以對例如短病毒或反轉錄病毒提供例如包裝和受體功能。也可以產生病毒粒子，其可以往例如使用可同時支援GagPol和VSV-G(水庖性口炎病毒包膜蛋白)基因的表達且確保治療性轉殖基因(transgene)的包裝的適當質粒載體將哺乳動物細胞短暫轉染之后，用來轉導休眠期有絲分裂后的細胞或經最后分化的細胞。該用來產生專導勝任性病毒粒子所用的方法可以通過例如根據例如人類胚胎腎細胞(HEK293)建立可以組成，性地(constitutively)或在誘導性啟動子的控制下表達GagPol多蛋白的穩定細胞是獲得明顯地幫助且可有效率地成形。另外，可以產生重組型腺病毒，其包括包裝功，受體功能和轉殖基因功能或彼等的組合且因而可作為一工具用來進行反轉錄病毒載體或短病毒載體的活體外，原位(in situ)和活體內輸送。
由SEQ ID NO3所編碼的背末蛋白質或其衍生物可以經由摻加到脂質雙層而提供受體功能給短病毒載體，泡沫病毒(spumavirus)載體或反轉錄病毒載體或以包被病毒(coated virus)為基礎的其他載體。對于此種目的而言，可以產生例如包裝細胞系，其可以組成性地，或在誘導性，或取代地，可調節性啟動子的控制，表達來自反轉錄病毒，泡沫病毒和較佳者短病毒GagPol蛋白以及衍生處SEQID NO3的包膜蛋白質。另外，可以產生以C型或D型反轉錄病毒或其他膜被覆病毒例如流感病毒或庖疹病毒的基因組為基礎的嵌合型病毒，其在表面上載有針對天熱發生的包膜蛋白質，加添地或取而代之地，一衍生自SEQ ID NO1或3的包膜蛋白質。
針對SEQ ID NO1至3衍生的肽、蛋白質或似病毒粒子，可以產生(i)多株抗體血清，(ii)單株抗體(鼠類，人類，駱駝)，(iii)抗體行衍生物價例如單鏈抗體，人類化抗體，雙-特異性抗體，抗體噬菌體庫或(iv)其他高親和性結合性多肽例如hPSTI(人類胰分泌胰蛋白醣抑制劑)。該等藥劑可以用于治療目的例如治療HIV感染，或用于診斷目的例如用于檢驗套劑的制造。
類似地，SEQ ID NO1，2或3衍生的類似肽、蛋白質或核酸序列可以應用核酸雜交技術，采用核酸擴增系統或彼等的組合用于診斷目的例如用于血清診斷。較佳者，根據本發明，依照SEQ ID NO1核甘酸序列的多核苷酸片段可以用于聚合酶鏈型反應之中。特別較佳者為根據本發明，依照SEQ ID NO1核甘酸序列的多核苷酸片段經由利用DNA晶片技術作為診斷劑的用途。
本發明要用下列實施例予以示范說明但非予以限制。
實施例實施例1.血液樣品。本研究中所使用的所有血液樣品都是在1996-1997年期間于中國境內數個HIV流行地區進行全國分子流行病學調查中從HIV-1亞型C血清陽性的注射藥物使用者(IDUs)收集到者。以發克梯度(ficoll gradient)分離出周圍血液單核細胞(PBMC)。經由將得自血清陽性IDUs的PBMCs與經用植物血球凝集素(phytohemagglutinin)(PHA)刺激過的捐血者的PBMCs共同培養以分離出病毒。使用HIV-1 p24 Core Profile ELISA套劑(DuPontInc.，Boston，MA)從細胞上澄液偵檢出陽性病毒培養物。
實施例2.聚合醣鏈型反應和DNA定序。從超過100個來自中國西北省份預先選定的HIV-1陽性IDUs經有成果地感染過的PBMCs萃取出前病毒DNA(provirus DNA)(Qiagen Inc.，Valencia，CA)。使用套試PCR(nesied PCR)來擴增包膜C2V3編碼區。使用螢光染料—標記終止序列(terminators)(Applied Biosystems，373A-Fosier Ciiy，CA)按先前技術所述(Bai et al.1997；Yu et al.，1997)以Taq-循環定序法(Taq-cycle sequencing)將PCR產物直接定序。經由應用威斯康辛套裝軟體Genetics Computer Group加上Kimura的校正法(GCG，1997，第9版)進行多重序列排比。
實施例3.使用PHYLIP套裝軟體進行所有所得序列的分類學樹分析。以最大節省法(maximum parsimony method)計算進化距離并用累積水平分校長度予以指示出。按先前技術所述(Graf etal.1998)以相生重取樣方式(bootstrap resampling)試驗鄰域連接法的統計穩健性。
實施例4.從中國IDUs選擇出代表性C-進化枝HIV-1分離物。經計算出的在C2V3編碼區內的平均組內距離于DNA層次上低到2.26±1，43，顯示比在此地區內的流行病仍然非常的早期。在中國進化枝C序列與來自印度，非洲和南美洲來源的序列之間的組間差異分別為9.67±2.31(印度)，15.02±4.13非洲與8.78±3.41(南美)。此種結果證實在印度與中國進化枝C序列之間有密切的關系(Lole et al，1999)且對本身相當異源性的非洲進化枝CHIV-1病毒株有一實質的遺傳距離。
實施例5.最代表在整個中國境內流傳的遍性進化枝C病毒株的病毒分離物的檢定。從分析周的檢體看來，經稱為97cn54的代表性分離物經鑒定為相對于一經計算出之共有序列(cn-conV3)展現出最高同源性(99.6％)，此點是經由以經鑒定過的局部HIV序列為基礎而確定者(表1)。包括從不同流行病區選巴的原C-進化枝代表物V3-環圈序列以及其他進化枝(A-，O，CPZ)之共有序列等在內的多重氨基酸序列排比強調出帶有所選原分離物97cn54的亞型C特質的(表1)。與整個V3共有序列(共有)比較之下，97cn54以及cn-con-c顯示出在位置13(H→R)和19(A→T)處有氨基酸變更，兩者都是亞型分離物的特性(C共有)。
表1V3-環圈氨基酸序列排比位置位置 111 21 3138共有 CTRPNNNTRK SIHIGPGQAF YA---TGDII GDIRQAHCC_94IN11246 ---------- --r-----t- -- --e-v -n------C_93IN905---------- --r-----t- -- ----m --------C_93IN999-Vr------e --r-----t- -- --e-- --------C_consensus ---------- --r-----t- --...----- --------C_ind8 ---------- -tr-----t- --...----- --------97cn54-V3----g----- --r-----t- --...----- --------cn-con-V3----g----- --r-----t- --...----- --------C_bro025 ---------- --r------- --...--e-- --------C_ind1024---------- --r-----t- --...----- ----r-y-C_nof---------- r-rv----tv --...-na-- --------C_zam20 -a--g----- --r-----t- f-...--a-- --------C_sm145 ---ya----- -Vr-----t- -....-n--- --------A_consensus ---------- -Vr------- --...----- --------B_consensus ---------- -------r-- -t...--e-- --------D_consensus ----y----q rt-------l -....-tr-- --------E_consensus ----s----t --t-----v- -r...----- ----k-v-F_consensus ---------- ---l------ --...----- ----k---G_consensus ---------- --t------- --...----- --------H_consensus ---------- --s------- --...----- ----k-y-O_consensus -e--gidiqe .-r---.m-w -smglg-tng nss-a-y-表1得自不同HIV-1進化枝(A-O)之共有序列與所選來自不同國家的亞型C分離物的V3氨基酸排比。完整V3共有序列是經由將得自不同進化枝(A-O)之共有序列排比而構成者，Cn-con-V3代表在中國境內普及的HIV-1亞型C病毒株之共有序列。97cn54是經選擇為在中國境內流傳的最遍性進化枝CHIV-1病毒株的標準代表性分離物。“-”表相對于V3-共有序列沒有改變，小寫字母表氨基酸取代且“-”表間隙。多重排比所用的所有共有序列和分離物序列都得自Los Akamos數據庫。
實施例6.97cn54包膜蛋白編碼序列對于印度進化枝C病毒株有最密切的關聯。以包膜蛋白的C2V3序列為起始基礎的分類學樹分析揭露出97cn54以及中國進化枝C分離物兩者對群集到來自印度(ind8，d1024，c-95in025，c--93in999，c-93in11246)，非洲(c-eth2220，c-ug286a2)和南美(92br025，nof，cam20，和sm145)的亞型C病毒株。此結果可推測印度C-進化枝病毒株可能為在中國境內流行的HIV-1亞型C的來源(第1圖)。此種假說也與我們早期的流行病學參考文獻相符合，其中確定在云南省內的HIV-1亞型C感染個體與在邊界地區的印度珠責生意人共用針頭(Shao etal，1999)。
實施例7.幾乎完整長度HIV-1基因組的克隆。幾乎完整長度HIV-1基因組是按先前技術所述(Grafet al.1998；Salminen et al.，1995)經由使用the Expand Long Template PCR系統予以擴增(Boehringer-Mannheim，Mannheim，Germany)。引子(primers)是位于HIV-1長端重復體(LTR)內的保守區中TBS-A1(5’-ATC TCT AGC AGT GGC GGC GGA A)和NP-(5’-GCA CTCAAG GCA AGC TTT ATT G)。將經純化的PCR-片段鈍端連接到一經SrfI消化過的pCR-Script載體中(Stratagene，Heidelberg，Germany)并轉形到大腸桿菌(E.coli)菌株DH5α之內。經由限制片段長度多形性(RFLP)分析及將V3-環圈編碼序列定序分析而鑒定出數個含有幾乎完整長度HIV-1基因組的重組殖株。根據RFLP分析，于使用不同的限制核酸內切酶的組合，接著將V3-環圈編碼序列定序分析，得知有77％陽性完整長度構建體接近于相同。按照上述所述使用引子-走引法(primer-walking approach)對代表廣多種陽性殖株的前病毒構建體進行選擇與定序(引子是沿著兩股基因組上每約300bp而設計)。
實施例8.使用Lasergene Software(DNASTAR，Inc.，Madison，WI)在Macintosh電腦上匯編DNA序列。所有在此研究中使用的參比亞型序列都得自Los Akamos HIV數據庫。核苷酸序列類似率是經由Smiih和Waterman的局部同源性算法予以計算出。與可取得的其他亞型序列數據的多重序列排恍是使用威斯康辛套裝軟體GeneticsComputer Group(GCG，1997，第9版)進行。
實施例9.97cn54編碼序列的整體結構。衍生自分離物97cn54的9078bp基因組序列含有HIV-1基因組的所有已知的結構基因和調節基因。沒有發現有重大的刪除、嵌入或重排。經由將97cn54的所有編碼序列(CDS)與不同基因型之共有序列和所選亞型分離物(表刀相比較而探討出核苷酸序列類似率。gag、pol、env和vif請碼相對于對應的進化枝-C共有序列的簸高同源性都在93.93％-95.06％的范圍內。此種觀察結果顯著地擴展上述以C2V3為基礎的序列比較與分類學樹分析(參看表1和
圖1)且因而清楚地確定所選擇巴的病毒分離物對于先前公開的C-進化枝病毒株的歸屬。不過，由此類分析對對tat、vpu、vpr和nef等基因所測定出的同源性仍不足以促成此等讀框對于進化枝-B或C病毒株的清楚指定(表2)。對于vpu基因而言，相對于進化枝-B有最高同源性(94.24％)，比較之下對于進化枝-C共有序列只有78.23％。對于tat基因也得到類似的觀察結果，對B，-r142分離物有最高同源性(＞91％)，而對所選巴的元C-進化枝代表物為85.5％(C-eth2220)或對進化枝-C共有序列有89.01％。這些數據加上B、C和E基因型在整個云南省流行病地區內的巴現事實可以推測出所分析的病毒可能代表從B’/C進化枝間重組事件所得的鑲嵌型病毒株。
表2.97cn54衍生的編碼序列與參比病毒株的相應基因和進化枝特異性共有序列的比較對97cn54的相同百分率CDS gag pol vif vpr tat rev vpu env nefA 87.6891.80 86.8183.66 84.9083.97 79.82 85.75 84.19B 90.4391.93 88.0490.31 86.5682.08 94.24 84.52 88.13B-mn 89.3890.82 86.0189.31 87.4479.48 88.21 82.33 85.41B’-r142 91.5390.76 86.0188.97 91.163 80.23 96.74 82.70 85.99C 94.6594.29 95.0691.39 89.0191.99 78.23 93.93 88.82C-92.1992.91 88.5190.03 87.9189.70 76.13 88.51 86.2092br025C-91.4 92.06 87.1590.77 85.5788.08 80.09 87.15 87.08eth2220D 89.8091.08 87.7487.94 83.9384.39 87.30 85.26 86.88E/A 86.324 89.07 86.5983.39 81.4481.74 77.31 82.09 84.18F 88.0288.99 86.3686.25 80.6586.25 82.33 84.02 /G 88.08/ // // / 84.55 /H 87.6989.45 86.0185.22 // / 83.74 /O 73.4278.02 72.1276.604 72.3176.60 59.54 67.01 80.35CPZ 74.1478.80 93.7575.44 76.0075.44 64.41 72.42 /表2在97cn54與下列諸DNA序列之間的所有編碼序列(CDS)的核苷酸比較(1)諸獨特HIV-1進化枝之共有序列(得自LasAlamos HIV數聚庫)或(2)標準亞型C(92br025和eth2220)和B(mn和r142)分離物。該數據呈現出所給序列對97cn54的相同百分率。在諸共有序列內的不明確核苷酸位置經計為一匹配。其中將最高同源性以黑體突顯出。/，表示無法從LasA lamos HIV數聚庫取得共有序列。
實施例10.亞型間重組的測定。使用重組體鑒定程序(RIP，第3.1版；hiip//hiv-web.lanl.gov/tools)來鑒定在此殖株的至長度序列內所含的潛在鑲嵌型結構(窗尺寸200，統計意義閾值90％，Gap處置STRIP；Informative modeOFF)。導入間隙以造成對齊。于此分析中的背景亞型序列為u455(亞型A)，RL42(中國亞型B-Thai(B))，eth2220(亞型C)，z2d2(亞型D)，93th2(亞型A/E)。
實施例11.在97cn54的Gag-pol編碼區內的進化枝間重組。雖然在高度保守的gag和pol讀框內觀察到對C-進化枝病毒株的實質同質性，不過RIP分析鑒定出在gagpol內在gag起始密碼子上游約在位置478-620，1290-1830和2221-2520處有引固進化枝間重組區。這些分散開的連續段是位于顯示出對原型B有最高同賈率且特別是對源自云南省的亞型B(B’)分離物有最高同源性的gag和pol讀框之內(位顯示出數據)(圖2)。這種觀察結果清楚地強調RIP分析的重要性，是因為單純的以完全基因為基礎的同質性排比部能夠鑒定出這些不同亞型的小分散開的片段之故。為了肯定RIP分析所得數據，我們使用側接或跨展所提重組連續段的諸區造出數個分類學樹(圖3)。使用數種不同亞型的標準代表物與某些經選出的C-進化枝原分離物，可以經由97cn54與個別C-進化枝參比分離物(圖3A，3C，3E，3G)或B-進化枝參比分離物(圖3F，3D，3F)進行差式簇集(differential clustering)，可以確定出所有經提出的重組區。
實施例12.于97cn54的Env編碼區內的進化枝間重組。如從表2中所摘列出的是列排比所預期者，RIP分析清楚地確定出在亞型(B’)-Thai與亞型C之間有亞型間重組(圖4)。一段從vpr的3’150bp延伸經過tat和rev的第一個外顯子到vpu的約1000bp的片段顯示出與局部亞型(B’)代表物(r142)有最高同源性(圖4A)。再者，一段重疊在nef基因5’-半部的長約300bp的序列連續段顯示出對(B，)-Thai亞型有最高同源性而其余部份，包括延伸到3’-LTR之一300bp片段則與亞型C簇集(圖4B)。
將RIP分析予以擴大之下，分類學樹顯示出vpr/vpu和ne基因的5’-部份對進化枝-b分離物有最密切的關系(圖5A，圖5b)，而3’-nef片段則明確地與亞型C代表物簇集(圖5C)。進一部分析確定出在此鑲嵌段內的亞型B序列相對于非常最近時所述的分離自中國IDU的Thai-(B，)病毒株(r142)(Graf et al，1998)比相對于原型B分離物(mn和sf2)有更密切的關聯(表2)。
實施例13.97cn54的代表性特質。在vpr/vpu編碼區內以及在97cn54的nef基因內的斷點經發現出現于從生活在中國西北諸省境內的IDUs所分離出的所有亞型C病毒株上的幾乎相同位置上。對于8份獨立地從Xinjiang自治區境內的不同HIV-1感染個體所分離出且分析過的HIV-1病毒株所做的兩份RIP分析代表值經顯示于圖4C和D之中。有關97cn54(中國西南部)與xj24和xj25(中國西北地區))的來源，這些數據可以推測出對于流傳在整個中國境內的C/B’重組病毒株有一個共同的始祖。總而言之，我們的結果證實97cn54表一在中國西北省份境內的IDUs最為普及的具有10個進化枝間重阻斷點的C/(B’)進化枝間鑲嵌型病毒。圖6為分離物97cn54的(B’/C)擇嵌型基因組的示意性呈現。
實施例14.對HIV特異性細胞溶解性T細胞的跨—進化枝特異性表位的預測。基因組序列可提供機會來評估可能對HIV-1候選疫苗的效率有影響的以的CTL表位的保守性。對于CTL表位的大部份藥劑與數據都是導自進化枝B HIV-1 Lai序列。為了提出對于跨進化枝CTL-表位保守性的評估，將經預測過的97cn54蛋白質序列相對于已知且經制造過與圖的LAI特異性CTL表位進行比較。于194個報導過的HIV-1 CTL表位中75，55，40和24是分別位于Gagp(g17，p24，p15)，反轉錄酶(RT)，gp120和gp41之中，而在Gag和RT中有幾乎50％或更多的表位是完全相同者，而gp12.0和gp41HIV-1LAI衍生的CTL表位只的5％和17％與預測的97cn54氨基酸序列正確匹配。不過，在所給CTL表位中允許有多達2個保守性錯配之下，則會有增加的48％(p17)，33％(p24)，40％(RT)，57％(gp120)和33％(g41)部份之以之HIV-1 LAI CTL缺的決定部位與對應的97cn54衍生多肽中的序列相關聯。當然，后面所述的考慮必須加以某些地小心，因為會有甚至于非保守性改變可能廢止一抗原性肽的HLA-結合或T-細胞受體辨識之故。無論如何，總而言之，此等觀察結果清楚地預測出一顯著的跨—進化枝CTL反應性，尤其是有關功能上與免疫學上保守的HIV-1蛋白質。此外，這些數據可推測，有顯著部份的經合成且確立用來對進化枝B CTL表位進行與圖繪制與示性的藥劑(肽、疫苗病毒構建體)也可以用來以進化枝C HIV序列為基礎而測定CTL反應性。
表3.97cn54編碼序列的讀框(reading frame)
其編碼是參照SEQ ID NO1中所示DNA序列的5’端。
實施例15.(A)合成C54gp160編碼區C-gp160的描述。將C-gp120基因克隆到pCR-Sctipt cmp(+)克隆載體(Stratagene，GenbankAccessionU46017)的獨特KpnI/SacI限制部位內。經密碼子-最佳化以高表達哺乳動物基因的合成C54gp160編碼區是列于SEQ ID NO3之中者。合成信號序列包括一傳輸信號用以將所編碼的多肽輸入到內質網之內。
不同編碼區的位置為如下所列者
(B)合成C54gagpolnef序列C-gpnef的描述。將C-gpnef基因克隆到pCR-Scriptamp(+)克隆載體(Stratagene)的獨特KpnI/SacI限制部全內。經密碼子優化以高表達哺乳動物基因的合成C54nagpolnef序列是列SEQ ID NO2之中者。于本構建體之中，N端甘氨酸是經為丙氨酸(核苷酸序列GGC)以防止將多肽目標導引到細胞質膜及隨后的將經裝配好的似病毒粒子的通過出芽(budding)而分泌出。同時，將一(-1)移碼(frame shift)導到天然移碼序列之內以保證從Gag強制讀經核醣體進入Pol編閱架構之內，且因而保證GagPolNef多蛋白的合成。
不同編碼區的位置為如下所列者
實施例16.將SEQ ID NO1所編碼的GagPolNef多基因通過KpnI/XhoI部位嵌入到載體pcDNA3.1之中并轉形到大腸桿菌菌株XL1blue之內。GagPolNef表達載體誘導Gag特異性抗體反應的是在雌性BALB/c小鼠體內分析(圖9)。使兩組各5只的小鼠接受每免疫化處理各100微克DNA的肌肉內(i.m.)第一次免疫化接著在3和6星期之后追加兩次后續i.m.免疫化處理(第1組pcDNA-GagPolNef；第2組pcDNA)。對照組(第3組)只接受PBS免疫化處理。Gag特異性IgG的剖滴定度是以ELISA相對于經純化的Gag蛋白質而測定。使用pcDNA-GagPolNef的免疫化處理導致快速誘導出高滴定度的Gag特異性抗體(1∶4,000)，該抗體是由抗體亞型的典型Thl走勢(IgG2a＞＞IgG1)予以示性。第2和第3兩對照組都沒有產生Gag特異性抗體的跡象。在第一次追加免疫化處理的1星期之后抗體滴定度增加到幾乎百倍(1∶20,000)且在第次加強的1星期之后導致1∶80,000的Gag特異性終端滴定度。于該兩對照組中都沒有可證實出有明顯的Gag特異性抗體反應者。對照組中都沒有可證實出有明顯的Gag特異性抗體反應者。
實施例17.抗原特異性細胞介素分泌是用分別在第二次后續追加處理5解剖下脾細胞予以分析，其證據為T輔助細胞記憶反應的誘導。接受三次使用pcDNA-GagPolNef的肌肉內免疫化處理的彼等小鼠以明顯的γIFN分泌表現出對Gag特異性抗原刺激的反應(表3)。在從根據上述相同時間表用pcDNA-GagPolNef進行三次皮下(s.c.)或皮內(i.d.)免疫化處理后的小鼠解剖下來的脾細胞觀察到比較上有所減低的γIFN產生。于所有免疫化處理組中，從免疫化途徑沒有獨立地測定出從經活體外特異性刺激過的脾細胞發生的明顯IL4和IL5分泌。也沒有觀察到從未經刺激的脾細胞發生的細胞介素分泌。
根據此項結果，使用pcDNA-GagPolNef進行肌肉內疫化處理可誘導出強烈的Thl細胞因子走勢，而皮下施用則誘導出更微弱的Thl反應。
表4.在使用所提的DNA利用粒子槍進行免疫化處理(使用注射針注射)或皮內或皮下免疫處理之后來自經活體外刺激的小鼠脾細胞的細胞介素走勢。
每實驗從5只小鼠解剖下的脾細胞所得平均值±標準偏差實施例18.為了證實pcDNA-GagPolNef對于Gag對特異性CTLs的誘導能力，乃在第一次免疫化處理的3星期后用pcDNA-GagPolNEF(第一組)，pcDNA(第2組)和PBS(第3組)在混合淋巴細胞腫瘤細胞培養物中進行活體外劃地再刺激6天且于隨后探討彼等的細胞毒性活性。已知者，衍生自亞型B病毒(IIIB分離物)Gag蛋白質的毫微米AMQMLKETI肽(單字母代碼)為在BALB/c小鼠體內的Dd限制CTL表位。使用該肽于實驗中以再刺激活體外特異性細胞毒性活性以及測定該活性。在使用pcDNA-GagPolNef質粒單次肌肉內注之后可以測定出Gag特異性細胞毒性T細胞但在對照組2和3中則沒有測定到。使用該質粒處理脾細胞時不會導致Gag特異性細胞毒性T細胞的活體外引動(in vitro priming)。這些結果可確定(i)pcDNA-GagPolNef誘發特異性細胞毒性T細胞的能力，及(ii)該能力為跨亞型活性者(圖9)。
參考文獻Bai，X.，Su，L.，Zhang，Y，and et al(1997).Subtype and sequenceanalysis of the CZV3 region of gp 120 gene among HIV-1 strains inXinjiang.Chin.J Virology 13.
Carr，J.K.，Salminen，M.O.，Koch，C.，Gotte，D.，Artenstein，A.WHegerich，P.A.，St Louis，D.，Burke，D.S.，and McCutchan，F.E.(1996).Full-length sequence and mosaic stmcture of a human imnunodeficiencyVirus type I isolate from Thailand.J Virol.70，5935-5943.
Carr，J.K.，Salminen，M.O.，Albert，J.，Sanders Buell，E.，Gotte，D.，Birx，D.L.，and McCutchan，F.E.(1998).Full genome sequences ofhuman immunodeficiency Virus type I subtypes G and A/G intersubtyperecombinants.Virology 247，22-31.
Esparza，J.，Osmanov，S.，and Heyward，W L.(1995).HIVpreventive.Progress to date.Drugs 50，792-804.
Expert，group of joint United Nations programme on HIV/AIDS(1999).Implications of HIV variability for transmission scientific andpolicy issues.AIDS 11，UNAIDSI-UNAIDS 15.
Gao，F.，Robertson，D.L.，Morrison，S.G.，Hui，H.，Craig，S.，Decker，J.，Fultz，P N.，Girard，M.，Shaw，G.M.，Hahi]，B.H.，and Sharp，P M.(1996)，The heterosexual human immunodeficiency viru type 1 epidemic inThailand is caused by an intersubtype(A/E)recombinant of Africanorigin.J.VlrOI.70.7013-7029.
Gao，F.，Robertson，D.L.，Carruthers，C.D.，Morrison，S.G.，Jian，B.，Chen，Y，Barre Sinoussi，F.，Girard，M.，Srinivasan，A.，Abimiku，A.G.，Shaw，G.M.，Sharp，P M.，and Hahii，B.H.(1998).A comprehensivepanel of near-full-length clones and reference sequences for non-subtypeB isolates of human immunodeficiency virus type I.j Virol.72，5680-5698.
Gaywee，J.，ArtenStein，A.W，VanCott，T.C.，Trichavaroj，R.，Sukchamnong，A.，Amlee，P，de Souza，M.，McCutchan，F.E.，(Carr，J.K.，Markowitz，L.E.，Michael，R.，and Nittayaphan，S.(1996).Correlationof genetic and serologic approaches to HIV-1 subtyping in Thailand.JAcquir lmmune.
Graf，M.，Shao，Y，Zhao，Q.，Seidl，T.，Kostler，J.，Wolf，H.，andWagner，R.(1998).Cloning and characterization of a Virtually full-lengthHIV type 1 genome from a subtybe B′-Thai strain representing the mostprevalent B-clade isolate in China.AIDS Res.Hum.Retroviruses I4.285-288.
Graham，B.S.and Wright，P.F.(1995).Candidate AIDS vaccines.NEngl.J Med.333，1331-1339.
Kostrikis，L.G.，Bagdades，E.，Cao，Y，Zhang，L.，Dimitriou，D.，andHo，D.D.(1995).Genetic analysis of human immunodeficiency virustype 1 strains from patients in Cyprus；identification of a new subtypedesignated subtype i.J Virol.69，6122-6130.
Leitner，T.and Albert，J.(1995).Human Retroviruses and AIDS 199i..a compilation and analysis of nucleic acid and amino acid sequences.(Myers，G.，Korber，B.，Wain-Hobson，S.，Jeang，K.，Mellors J.，McCutchan，F.，Henderson，L.，and Paviakis，G.Eds.)Los AlamosNational Laboratory，Los Alamos.N.Mex.lll 147-lll 150.
Lloe，K.S.，Bollinger，R.C.，Paranjape，R.S.，Gadkari，D.，Kulkarni，S.S.，Novfor，N.G.，Ingersoll，R.，Sheppard，H.W，and Ray，S.(C.(1999).Full-length human immunodeficiency virus type I genomes from subtypeC-infected seroconverters in india，with evidence of intersubtyperecombination.J Firol.73-152-160.
Loussert Kjaka，I.，Chaix，M.L.，Korber，B.，Letoumeur，F.，Gomas，E.，Allen，E.，Ly，T-D.，Brun Vezinet，F.，Simon，F.，and Saragosti，S.(1995).Variability of human immunodeficiency virus type 1 group Ostrains isolated from Cameroonian patients living in France..J Virol.69.5640-5649.
Luo，C.C.，Tian，C.，Hu，D.J.，Kai，M.，DOndero，T.，and Zheng，X.(1995).HIV-1 subtype C in China[letter].Lancet 345，1051-1052.
Myers，G.，Korber，B.，Foley，B.，Jeang，K.T.，Mellors，J.W，andWain Hobson，S.(1996).Human retroviruses and AIDS a compilationand analysis ofnucleic acid and amino acid sequences.
(Anonymous Theoretical Biology and Biophysics Group，LosAlamos.N.Mex.
Salminen，M.O.，Koch，C.，Sanders Buell，E.，Ehrenberg，P K.，Michael，N.L.，Carr，J.K.，Burke，D.S.，and McCutchan，F.E.(1995).Recovery of Virtually full-length HIV-1 provirus of diverse subtypesfrom primary Virus cultures using the polymerase chain reaction.Virology 213.80-86.
Shao，Y，Zhao，Q.，Wang B.，and et al(1994).Sequence analysis ofHIV env gene among HIV infected IDUs in Yunnan epidemic area ofChina.Chin.J Virology 10，291-299.
Shao，Y，Su，L.，Sun，X.，and et al(1998).Molecular Epidemiologyof HIV infection in China.12thworld AIDS conference，Geneva 13132，(Abstract)Shao，Y，Guan，Y，Zhao，Q.，and et al(1999).Genetic variation andmolecular epidemiology of the Ruily HIV-1 strains of Yumian in 1995.Chin.J Virol.12，9.
Sharp，P.M.，Robertson，D.L.，and Hahn，B.H.(1995).Cross-species transmission and recombination of｀AIDS＇viruses.Philos.Trans.R.Soc.Lond B.Biol.Sci.349.41-47.
Sharp，P.M.，Bailes，E.，Robertson，D.L.，Gao，F.，and Hahn，B.H.(1999).Origins and evolution of AIDS viruses.Biol.Bull.196.338-342.
World Health Organisation Network for HIV Isolation andCharacterization(1994).HIV-1 variation in WHO-sponsored vaccine-evaluation sites genetic screening，sequence analysis and preliminarybiological characterization of selected viral strains.AIDS Res.Hum.Retroviruses 10，1327-1344.
Yu，H.，Su，L.，and Shao，Y(1997).Identification of the HIV-1subtypes by HMA and sequencing.Chin.J Epidemiol.18，201-204.
序列表序列表<110>Geneart GmbH<120>Dae Genom des HIV-1 Intersubtype (C/B＇) und seineAnwendungen<130>WAG-001 PCT<140>xx<141>2000-11-16<150>DE 199 55 089.1<151>1999-11-16<160>3<170>PatentIn Ver.2.1<210>1<211>9078<212>DNA<213>Human immunodeficiency virus<400>1aatctctagc agtggcgccc gaacagggac ttgaaagcga aagtaagacc agaggagatc 60tctcgac9ca ggactcggct tgctgaagtg cactcggcaa gaggcgagag cggcgactgg 120tga9tacgcc aattatattt gactagcgga ggctagaagg agagagatgg gtgcgagagc 180gtcaatatta agagggggaa aattagataa atgggaaaaa attaggttaa ggccaggggg 240aaagaaacac tatatgctaa aacacctagt atgggcaagc agggagctgg aaagattcgc 300acttaaccct ggccttttag agacatcaga aggctgtaaa caaataacga aacagctaca 360atcagctctt cagacaggaa cagaggaact tagatcatta ttcaacacag tagcaactcc 420ctattgtgta catacagaga tagatgtacg agacaccaga gaagccttag acaagataga 480ggaagaacaa aacaaaattc agcaaaaaac acagcaggca aaggaggctg acgggaaggt 540cagtcaaaat tatcctatag tacagaatct ccaagggcaa atggtacatc agcccatatc 600acctagaact ttaaatgcat gggtaaaagt ggtagaagag aaggctttta gcccagaagt 660aatacccatg ttttcagcgt tatcagaagg agccacccca caagatttaa acaccatgct 720aaacacagtg gggggacatc aagcagctat gcaaatatta aaagatacca tcaatgaaga 780ggctgcagaa tgggatagat tacatccagt aaatgcaggg cctattgcac caggccaaat 840gagagaacca aggggaagtg acatagcagg aactactagt aacctacagg aacaaatagc 900atggatgacg agtaacccac ctgttccagt aggagacatc tataaaagat ggataattct 960gggattaaat aaaatagtaa gaatgtatag ccctaccagc attctggaca taaaacaagg 1020gccgaaggaa ccctttagag actatgtaga ccggtttctt aaaactttaa gagcggaaca 1080agctacgcaa ggtgttaaaa attggatgac agacaccttg ttggtccaaa atgcgaaccc 1140agattgtaag accattttaa gagcattagg accaggggct tcaatagaag aaatgatgac 1200agcatgtcag ggagtgggag gacctagcca taaagcaaaa gtgttggccg aggcaatgag 1260ccaaacaaac agtgccatac tgatgcagag aagcaatttt aaaggctcta aaagaattgt 1320taaatgtttc aactgtggca aggaagggca catagccaga aattgcaggg cccctaggaa 1380aaagggctgt tggaaatgtg gaaaagaagg acaccaaatg aaagattgta ctgagagaca 1440ggccaatttt ttagggaaaa tctggccctc ccacaaggga gggccaggga attttcttca 1500gaacagacca gagccaacag ccccaccaga ggagagcttc aggtttgggg aagagacaac 1560aactccatct cagaagcagg agccaataga caaggaacta tatcctttaa cttccctcaa 1620atcactcttt ggcaacgacc cctcgtcaca ataaagatag gggggcaatt aaaggaagct 1680ctattagata caggagcagg tgatacagta ttagaagacc tgaatttgcc agggaaatgg 1740aaaccaaaaa tgataggggg aattggaggt tttatcaaag taagacagta tgaacagata 1800cccatagaaa tttgcggaca caaagctata ggtacagtat tagtaggacc tacacctgtc 1860aacacaattg gaagaaatct gttgactcag cttggttgca ctttaaattt tccaatcagt 1920cccattgaaa ctgtaccagt aaaattaaag ccaggaatgg atggcccaaa ggttaaacaa 1980tggccattga cagaagagaa aataaaagca ttaacagcaa tttgtgatga aatggagaaa 2040gaaggaaaaa ttacaaaaat tgggcctgaa aatccatata acactccaat atttgccata 2100aaaaagaagg acagtactaa gtggagaaag ttagtagatt tcagggaact caataaaaga 2160actcaagatt tttgggaagt tcaattagga ataccacacc cagcagggtt aaaaaagaaa 2220aaatcagtga cagtactgga tgtgggggat gcatattttt caattccttt atatgaagac 2280ttcaggaagt atactgcatt caccatacct agtagaaaca atgaaacacc agggattagg 2340tatcagtaca atgtacttcc acagggatgg aaaggatcac tagcaatatt ccaaagtagc 2400atgacaaaaa ccttagagcc ttttagaaaa caaaatccag gcatagttat ctatcaatac 2460atggatgatt tgtatgtagg atctgactta gagatagggc agcatagaac aaaaatagag 2520gaactgagac aacatttgtt gaggtgggga tttaccacac cagacaagaa acattagaaa 2580gaacctccat ttctttggat ggggtatgaa ctccatcctg acaaatggac agtacagcct 2640acacagctgc cagaaaaaga tagctggact gtcaatgata tacaaaagtt agtgggaaaa 2700ttaaactggg caagtcagat ttatcctgga attaaagtaa ggcaactttg taaactcctt 2760aggggggcca aagcactaac agacatagta ccactaactg aagaagcaga attagaattg 2820gcagaaaaca gggaaattct aaaagaacca gtacatggag tatactatga cccatcaaaa 2880gacttgatag ctgaaataca gaaacagggg caggaacaat ggacatatca aatttaccaa 2940gaaccattca aaaatctaaa aacagggaag tatgcaaaaa tgaggactgc ccacactaat 3000gatgtaaaac aattaacaga ggctgtgcag aaaatagcca tggaaggcat agtaatatgg 3060ggaaaaactc ctaaatttag attacccatc caaaaagaaa catgggagac atggtggaca 3120gactattggc aagccacctg gattcctgag tgggaatttg ttaatacccc tcccttagta 3180aaattatggt accagctgga aaaagatccc atagtaggag tagaaacttc ctatgtagat 3240ggagcagcta atagggagac taaaatagga aaagcagggt atgttactga cagaggaagg 3300aagaaaattg tttctctaac tgaaacaaca aatcagaaga ctgaattgca agcaatttgt 3360atagctttgc aagattcagg atcagaagta aacatagtaa cagattcaca gtatgcatta 3420gggatcattc aagcacaacc agataagagt gaatcagagt tagttaacca aataatagaa 3480caattaatga aaaaggaaag agtctacctg tcatgggtac cagcacataa aggaattgga 3540ggaaatgaac aagtagataa attagtaagt agtggaatca ggaaagtgct atttctagat 3600ggaatagata aagctcaaga agagcatgaa aagtatcaca gcaattggag agcaatggct 3660agtgacttta atctgccacc catagtagca aaagaaatag tggctagctg tgatcaatgt 3720cagctaaaag gagaagccat gcatggacaa gtagactgta gtccagggat atggcaatta 3780gattgtacac atttagaagg aaaaatcatc ctggtagcag tccatgtagc cagtggctac 3840atggaagcag aggttatccc agcagaaaca agacaagaga cagcatactt tatactaaaa 3900ttagcaggaa gatggccagt caaagtaata aatacagata atggtagtaa tttcaccagt 3960actgcagtta aggcagcctg ttggtgggca ggtatccaac aggaatttgg aattccctac 4020agtccccaaa gtcagggagt agtagaagcc atgaataaag aattaaagaa aattataggg 4080caggtaagag atcaagctga gcaccttaag acagcagtac taatggcagt attcattcac 4140aattttaaaa gaaaaggggg gattgggggg tacagtgcag gggaaagaat aatagatata 4200atagcaacag acatacaaac taaagaatta caaaaacaga ttacaaaaat tcaaaatttt 4260cgggtttatt acagagacag cagagacccc agttggaaag gaccagccaa actactctgg 4320aaaggtgaag gggcagtaat aatacaagat aatagtgaca taaaggtagt accaaggagg 4380aaagcaaaaa tcattaagga ctatggaaaa cagatggcag gtgctgattg tgtggcaggt 4440agacaggatg aagattagaa catggaatag tttagtaaaa caccatatgt atgtttcaag 4500gagagctaat ggatggtttt acagacatca ttatgacagc agacatccaa aagtaagttc 4560agaagtacac atcccattag gaaaggctaa attagtaata aaaacatatt gggggttgca 4620gacaggagaa agagatcggc atttgggtca tggagtctcc atagaatgga gattgagaag 4680atataccaca caaatagaac ctggcctggc agaccagcta attcatttgt attattttga 4740ttgttttgca gactctgata taaggaaagc catattagga cacatagtta ttcctaggtg 4800tgactatcaa gcaggacata ataataaggt aggatctcta caatacttgg cactgacagc 4860attgataaaa ccaaaaaaga taaagccacc tctgcctagt atcaagaaat tagtagagga 4920tagatggaac aatccccagg agatcagggg ccgcagaggg aaccacacaa tgaatggaca 4980ctagagcttc tagaggagct caagcaggaa gctgttagac actttcctag accatggctt 5040catagcttag gacaacatat ctatgaaaca tatggggata cttgggcagg agtggaagcc 5100ataataagaa ttctgcaaca actgctgttt attcatttca gaattgggtg tcagcatagc 5160agaataggca ttttgagaca gagaagaaca agaaatggag ccagtaaatc ataaaggaga 5220gccttgggag catccaggaa gtcagcctaa gactgcttgt aacagttgct attgtaaaaa 5280gtgctgcttt cattgccaag tttgtttcac gaaaaaaggc ttaggcatct tctatggcag 5340gaagaagcga agacagcgac gaagcgctca tcgaagcagt gaggatcatc aaaatcctat 5400atcaaagcag taagtagtaa atgtaatgca agctttaacc attttagcaa tagtagcctt 5460agtagtagca acaataatag caatagttgt gtggaccata gtattcatag aatataggaa 5520aatattaaga cagaaaaaaa tagacaggtt aattgataga ataagagaaa gagcagaaga 5580cagtggcaat gagggtgacg gggatcagga agaattatcg gcatttatgg agatggggca 5640ccatgctcct tgggatgttg atgatcagta gtgctgtagg aaacttgtgg gtcacagtct 5700attatggggt acctgtatgg aaaggggcaa ccaccacttt attttgtgca tcagatgcta 5760aagcatatga tacagaggta cataatgttt gggctacaca tgcctgtgta cccgcagacc 5820ccaacccaca agaaatggtt ttggaaaatg taacagaaaa ttttaacatg tggaaaaatg 5880aaatggtaaa tcagatgcag gaagatgtaa tcagtttttg ggatcaaagc ctaaaaccac 5940gtgtaaagtt gaccccactc tgtgccacct tagaatgtag aaatgttagc agtaatagta 6000atgataccta ccatgagacc taccatgaga gcatgaagga aatgaaaaat tgctctttca 6060atgcaaccac agtagtaaga gataggaagc agacagtgta tgcacttttt tatagacttg 6120atatagcacc acttactaag aagaactata gtgagaattc tagtgagtat tatagattaa 6180taaattgtaa tacctcagcc ataacacaag cctgtccaaa ggtcactttt gatccaattc 6240ctatacacta ttgcactcca gctggttatg caattctaaa gtgtaatgat aagatattca 6300atgggacagg accatgccat aatgttagca cagtacaatg tacacatggg attaagccag 6360tggtatcaac ccaactactg ttaaatggta gcctagcaga aggagaaata ataattagat 6420ctgaaaatct gacaaacaat gtcaaaacaa taatagtaca tcttaatcaa tctgtagaaa 6480ttgtatgtac aagacccggc aataatacaa gaaaaagtat aaggatagga ccaggacaaa 6540cattctatgc aacaggagac ataataggag acataagaca agcacactgt aacattagtg 6600aagataaatg gaatgaaact ctacaaaggg taagtaaaaa attagcagaa cacttccaga 6660ataaaacaat aaaatttgca tcatcctcag gaggggacct agaagttaca acacatagct 6720ttaattgtag aggagaattt ttctattgta atacatcagg cctgtttaat ggtgcataca 6780cgcctaatgg tacaaaaagt aattcaagct caatcatcac aatcccatgc agaataaagc 6840aaattataaa tatgtggcag gaggtaggac gagcaatgta tgcccctccc ataaaaggaa 6900acataacatg taaatcaaat atcacaggac tactattggt acgtgatgga ggaacagagc 6960caaacgatac agagacattc agacctggag gaggagatat gaggaacaat tggagaagtg 7020aattatataa atataaagtg gtagaaacta agccattggg agtagcaccc actacaacaa 7080aaaggagagt ggtggagaga gaaaaaagag cagtgggaat aggagctgtg ttccttgggt 7140tcttaggagt agcaggaagc actatgggcg cggcgtcaat aacgctgacg gtacaggcca 7200gacaattgct gtctggtata gtgcaacagc aaagcaattt gctgagggct atagaagcgc 7260aacagcatct gttgcaactc acggtctggg gcattaagca gctccagaca agagtcctgg 7320ctatagaaag atacctaaag gatcaacagc tcctagggat ttggggctgc tctggaaaac 7380tcatctgcac tactgctgta ccttggaact ccagttggag taacaaatct caaaaagaga 7440tttgggataa catgacctgg atgcaatggg ataaagaaat tagtaattac acaaacacag 7500tatacaggtt gcttgaagaa tcgcaaaacc agcaggaaag gaatgaaaaa gatctattag 7560cattggacag ttggaaaaat ctatggagtt ggtttgacat aacaaattgg ctgtggtata 7620taaaaatatt cataataata gtaggaggct tgataggttt aagaataatt tttgctgtgc 7680tctctatagt aaatagagtt aggcagggat actcaccttt gtcgtttcag acccttaccc 7740cgaacccagg gggacccgac aggctcggaa gaatcgaaga agaaggtgga aagcaagaca 7800gggacagatc cattcgatta gtgaacggat tcttagcgct tgcctgggac gacctgcgga 7860acctgtgcct cttcagctac caccgattga gggacttcac attagtggca gcgagggtgg 7920tggaacttct gggacgcaat agtctcaggg gactacagag agggtgggaa gcccttaaat 7980atctgggaag tcttgtgcag tactggggtc aggagctaaa aaagagtact attagtccgg 8040ttgataccat agcaatagca gtagctgaag gaacagatag gattatagaa ttagtacaag 8100gactttgtag agctatctac agcataccta gaagaataag acagggcttt gaagcagctt 8160tgcaataaaa tggggggcaa gtggtcgaaa agtagcatag ttggatggcc tgctataagg 8220gagagaatga gaagaactga gccagcagca gatggggtgg gagcagtatc tcgagacctg 8280gaaaaacatg gagcaatcac gagtagcaat acagcagcta ctaatgagga ttgtgcctgg 8340ctggaagcac aagaggaggg ggaggtgggt tttccagtca gacctcaggt acctttaaga 8400ccaatgactt acaagggagc tgtagatctt agcttctttt taaaagaaaa ggggggactg 8460gaagggttaa tttactctaa gaaaaggcta gagatccttg atttgtgggt ctatcacaca 8520caaggctact tccctgattg gcacaactac acaccaggac caggggtcag attcccactg 8580acttttgggt ggtgcttcaa gctagtacca gttgacccaa gggaagtaga agaggccaac 8640gagggagaag acaactgctt gctacaccct gtgtgccagc atggaatgga ggatgatcac 8700agagaagtat taaagtggaa gtttgacagt caactagcac acagacacag ggcccgcgaa 8760ctacatccgg agttttacaa agactgctga cacagaaggg actttccgcg gggactttcc 8820actggggcgt tctaggaggt gtggtctggc gggactggga gtggtcaacc ctcaaatgct 8880gcatataagc agctgctttt cgcctgtact gggtctctct agtcagacca gatctgagcc 8940tgggagctct ctggctaact agggaaccca ctgcttaagc ctcaataaag cctgccttga 9000ggggctagag cggccgccac cgcggtggag ctccagcttt tgttcccttt agtgag9gtt 9060aattgcgcgc tggcgatc9078<210>2<211>4288<212>DNA<213>Human immunodeficiency virus<400>2gctaggtacc taatgggcgc cagggccagc atcctgaggg gcggcaagct ggacaagtgg 60gagaagacca ggctgaggcc cggcggcaag aagcactaca tgctgaagca cctggtgtgg 120gccagcaggg agctggagag gttcgccctg aaccccggcc tgctggagac cagcgagggc 180tgcaagcaga tcatgaagca gctgcagagc gccctgcaga ccggcaccga ggagctgagg 240agcctgttca acaccgtggc caccccctac tgcgtgcaca ccgagatcga cgtgagggac 300accagggagg ccctggacaa gatcgaggag gagcagaaca agatccagca gaagacccag 360caggccaagg aggccgacgg caaggtgagc cagaactacc ccatcgtgca gaacctgcag 420ggccagatgg tgcaccagcc catcagcccc aggaccctga atgcatgggt gaaggtggtg 480gaggagaagg ccttcagccc cgaggtgatc cccatgttca gcgccctgag cgagggcgcc 540accccccagg acctgaacac catgctgaac accgtgggcg gccaccaggc cgccatgcag 600atcctgaagg acaccatcaa cgaggaggcc gccgagtggg acaggctgca ccccgtgcac 660gccggcccca tcgcccccgg ccagatgagg gagcccaggg gcagcgacat cgccggcacc 720accagcaacc tgcaggagca gatcgcctgg atgaccagca acccccccgt gcccgtgggc 780gacatctaca agaggtggat catcccgggt ttaaacaaga tcgtgaggat gcacagcccc 840accagcatcc tggacatcaa gcagggcccc aaggagccct tcagggacta cgtcgacagg 900ttcttcaaga ccctgagggc ggagcaggcc acccagggcg tgaagaactg gatgaccgac 960accctgctgg tgcagaacgc caaccccgac tgcaagacca tcctgagggc cctgggcccc 1020ggcgccagca tcgaggagat gatgaccgcc tgccagggcg tgggcggccc cagccacaag 1080gccaaggtgc tggccgaggc catgagccag accaacagcg ccatcctgat gcagaggagc 1140aacttcaagg gcagcaagag gatcgtgaag tgcttcaact gcggcaagga gggccacatc 1200gccaggaact gcagggcccc caggaagaag ggctgctgga agtgcggcaa ggagggccac 1260cagatgaagg accgcaccga gaggcaggcc aacttcctgg gcaagatctg gcccagccac 1320aagggcggcc ccggcaacct cctgcagaac aggcccgagc ccaccgcccc ccccgaggag 1380agcttcaggt tcgaggagga gaccaccacc cccagccaga agcaggagcc catcgacaag 1440gagctgtacc ccctgaccag cctgaagagc ctgttcggca acgaccccag cagccaggaa 1500ttcttcaggg agaacctggc cctgccccag ggcagggcca gggagttcag cagcgagcag 1560accagggcca acagccccac caggggcgag ctgcaggtgt ggggcaggga caacaacagc 1620atcagcgagg ccggcgccaa caggcagggc accaccagct tcaacttccc ccagatcacc 1680ctgtggcaga ggcccctggt gaccatcagg atcggcggcc agctgaagga ggccctgctg 1740aacaccggcg ccggcgacac cgtgctggag gacctgaacc tgcccggcaa gtggaagccc 1800aagatgatcg gcggcatcgg cggcttcatc aaggtgaggc agtacgagca gatccccatc 1860gagatctgcg gccacaaggc catcggcacc gcgctggtgg gccccacccc cgtgaacatc 1920atcggcagga acctgctgac ccagctgggc tgcaccctga actcccccat cagccccatc 1980gagaccgtgc ccgtgaagct gaagcccggc acggacggcc ccaaggtgaa gcagtggccc 2040ctgaccgagg agaagatcaa ggccctgacc gccatctgcg acgagatgga gaaggagggc 2100aagatcacca agatcggccc cgagaacccc tacaacaccc ccatcttcgc catcaagaag 2160aaggacagca ccaagtggag gaagctggtg gacttcaggg agctgaacaa gaggacccag 2220gacttctggg aggtgcagct gggcatcccc caccccgccg gcctgaagaa gaagaagagc 2280gtgaccgtgc tggacgtggg cgacgcctac ttcagcatcc ccctgtacga ggacttcagg 2340aagtacaccg ccttcaccat ccccagcagg aacaacgaga cccccggcat cagctaccag 2400tacaacgtgc tgccccaggg ctggaagggc agcctggcca tcttccagag cagcatgacc 2460atcgaggagc tgatctacag caagaagagg caggagatcc tggacctgtg ggtgtaccac 2520acccagggct acttccccga ctggcacaac tacacccccg gccccggcgt gaggttcccc 2580ctgaccttcg gctggtgctt caagctggtg cccgtggacc ccagggaggt ggaggaggcc 2640aacgagggcg aggacaactg cctgctgcac cccgtgtgcc agcacggcat ggaggacgac 2700cacagggagg tgctgaagtg gaagttcgac agccagctgg cccacaggca cagggccagg 2760gagctgcacc ccgagttcta caaggactgc atgggcggca agtggagcaa gagcagcatc 2820gtgggctggc ccgccatcag ggagaggatg aggaggaccg agcccgccgc cgacggcgtg 2880ggcgccgt9a gcagggacct ggagaagcac ggcgccatca ccagcagcaa caccgccgcc 2940accaacgagg actgcgcctg gctggaggcc caggaggagg gcgaggtggg cttccccgtg 3000aggccccagg tgcccctgag gcccatgacc tacaagggcg ccgtggacct gagcttcttc 3060ctgaaggaga agggcggcct ggagggcctg aggcagcacc tgctgaggtg gggcttcacc 3120acccccgaca agaagcacca gaaggagccc cccttcctgt ggatgggcta cgagctgcac 3180cccgacaagt ggaccgtgca gcccacccag ctgcccgaga aggacagctg gaccgtgaac 3240gacatccaga agctggtggg caagctgaac tgggccagcc agatctaccc cggcatcaag 3300gtgaggcagc tgtgcaagct gctgaggggc gccaaggccc tgaccgacat cgtgcccctg 3360accgaggagg ccgagctgga gctggccgag aacagggaga tcctgaagga gcccgtgcac 3420ggcgtgtact acgaccccag caaggacctg atcgccgaga tccagaagca gggccaggag 3480cagtggacct accagatcta ccaggagccc ttcaagaacc tgaagaccgg caagtacgcc 3540aagatgagga ccgcccacac caacgacgtg aagcagctga ccgaggccgt gcagaagatc 3600gccatggagg gcatcgtgat ctggggcaag acccccaagt tcaggctgcc catccagaag 3660gagacctggg agacctggcg gaccgactac tggcaggcca cctggatccc cgagtgggag 3720ttcgtgaaca cccctcccct ggtgaagctg tggtatcagc tggagaagga ccccatcgtg 3780ggcgtggaga ccttctacgt ggacggcgcc gccaacaggg agaccaagat cggcaaggcc 3840ggctacgtga ccgacagggg caggaagaag atcgtgagcc tgaccgagac caccaaccag 3900aagaccgagc tgcaggccat ctgcatcgcc ctgcaggaca gcggcagcga ggtgaacatc 3960gtgaccgaca gccagtacgc cctgggcatc atccaggccc agcccgacaa gagcgagagc 4020gagctggtga accagatcat cgagcagctg atgaagaagg agagggtgta cctgagctgg 4080gtgcccgccc acaagggcat cggcggcaac gagcaggtgg acaagctggt gagcagcggc 4140atcaggaagg tgctgaagac cctggagccc ttcaggaagc agaaccccgg catcgtgatc 4200taccagtaca tggacgacct gtacgtgggc agcgacctgg agatcggcca gcacaggacc 4260aagtaaagat ctctcgagga gctcaagc 4288<210>3<211>2605<212>DNA<213>Human immunodeficiency virus<400>3gcggcgggta ccgaactcgc cgccagcatg gacagggcca agctgctgct gctgctgctg 60ctgctgctgc tgccccaggc ccaggccgtg ggcaacctgt gggtgaccgt gtaccacggc 120gtgcccgtgt ggaagggcgc caccaccacc ctgttctgcg ccagcgacgc caaggcctac 180gacaccgagg tgcacaacgt gtgggccacc cacgcctgcg tgcccgccga ccccaacccc 240caggagatgg tgctggagaa cgtgaccgag aacttcaaca tgtggaagaa cgagatggtg 300aaccagatgc aggaggacgt catcagcctg tgggaccaga gcctgaagcc ctgcgtgaag 360ctgacccccc tgtgcgtgac cctggagtgc aggaacgtga gcagcaacag caacgacacc 420taccacgaga cctaccacga gagcatgaag gagatgaaga actgcagctt caacgccacc 480accgtggtga gggacaggaa gcagaccgtg tacgccctgt tctacaggct ggacatcgtg 540cccctgacca agaagaacta cagcgagaac agcagcgagt actacaggct gatcaactgc 600aacaccagcg ccatcaccca ggcctgcccc aaggtgacct tcgaccccat ccccatccac 660tactgcaccc ccgccggcta cgccatcctg aagtgcaacg acaagatctt caacggcacc 720ggcccctgcc acaacgtgag caccgtgcag tgcacccacg gcatcaagcc cgtggtgagc 780acccagctgc tgctgaacgg cagcctggcc gagggcgaga tcatcatcag gagcgagaac 840ctgaccaaca acgtgaaaac catcatcgtg cacctgaacc agagcgtgga gatcgtgtgc 900accaggcccg gcaacaacac caggaagagc atcaggatcg gccccggcca gaccttctac 960gccaccggcg acatcatcgg cgacatcagg caggcccact gcaacatcag cgaggacaag 1020tggaacgaga ccctgcagag ggtgagcaag aagcttgccg agcacttcca gaacaagacc 1080atcaagttcg ccagcagcag cggcggcgac ctggaggtga ccacccacag cttcaactgc 1140aggggcgagt tcttctactg caacaccagc ggcctgttca acggcgccta cacccccaac 1200ggcaccaaga gcaacagcag cagcatcatc accatcccct gcaggatcaa gcagatcatc 1260aacatgcggc aggaggtggg cagggccatg tacgcccctc ccatcaaggg caacatcacc 1320tgcaagagca acatcaccgg cctgctgatg gtgagggacg gcggcaccga gcccaacgac 1380accgagacct tcaggcccgg cggcggcgac atgaggaaca actggaggag cgagctgcac 1440aagtacaagg tggtggagat caagcccctg ggcgtggccc ccaccaccac caagaggagg 1500gtggtggaga gggagaagag ggccgtgggc atcggcgccg tgttcctggg cttcctgggc 1560gtggccggca gcaccatggg cgccgccagc atcaccctga ccgtgcaggc caggcagctg 1620ctgagcggca tcgtgcagca gcagagcaac ctgctgaggg ccatcgaggc ccagcagcac 1680ctgctgcagc tgaccgtgtg gggcatcaag cagctgcaga ccagggagct ggccatcgag 1740aggtacctga aggaccagca gctgctgggc atctggggct gcagcggcaa gctgatctgc 1800accaccgccg tgccctggaa cagcagctgg agcaacaaga gccagaagga gatctgggac 1860aacatgacct ggatgcagtg ggacaaggag atcagcaact acaccaacac cgtgtacagg 1920ctgctggagg agagccagaa ccagcaggag aggaacgaga aggacctgct ggccctggac 1980agctggaaga acctgtggag ctggttcgac atcaccaact ggctgtggta catcaagatc 2040ttcatcatca tcgtgggcgg cctgatcggc ctgaggatca tcttcgccgt gctgagcatc 2100gtgaacaggg tgaggcaggg ctacagcccc ctgagcttcc agaccctgac ccccaacccc 2160ggcggccccg acaggctggg caggatcgag gaggagggcg gcaagcagga cagggacagg 2220agcatcaggc tggtgaacgg cttcctggcc ctggcctggg acgacctgag gaacctgtgc 2280ctgttcagct accacaggct gagggacttc accctggtgg ccgccagggt ggtggagctg 2340ctgggcagga acagcctgag gggcctgcag aggggctggg aggccctgaa gtacctgggc 2400agcctggtgc agtactgggg ccaggagctg aagaagagca ccatcagcct ggtggacacc 2460atcgccatcg ccgtggccga gggcaccgac aggatcatcg agctggtgca gggcctgtgc 2520agggccatct acagcatccc caggaggatc aggcagggct tcgaggccgc cctgcagtga 2580taaagatctc tcgaggagct caagc260權利要求
1.一種多核苷酸，其包括如SEQ ID NO1，2或3中所示核酸序列，或其片段或衍生物，或一種可與如SEQ ID NO1，2或3中所示核酸序列雜交的多核苷酸。
2.如權利要求1的多核苷酸或其片段或衍生物，其中該雜交多核苷酸是在嚴格條件與如SEQ ID NO1，2或3中所示核酸序列雜交。
3.如權利要求1或2的多核苷酸或其片段或衍生物，其包括至少一個具有至少9個核苷酸，優選至少15個核苷酸，更優選至少27個核苷酸，或更長的連續序列。
4.如權利要求3的多核苷酸或其片段或衍生物，其具有一個以上的連續核苷酸序列，其中至少兩個連續序列是由一核苷酸序列間隔段所分隔。
5.如權利要求1到4項中任一項的多核苷酸或其片段或衍生物，其包括至少一個如SEQ ID NO1，2或3中所示核酸序列所編碼的多肽。
6.DNA構建體，其包括如權利要求1到5項中任一項的多核苷酸或其片段或衍生物。
7.細菌或病毒載體，其包括如權利要求1到5項中任一項的多核苷酸或其片段或衍生物。
8.如權利要求1到5項中任一項的多核苷酸或其片段或衍生物，用作藥物，疫苗或診斷物質。
9.如權利要求1到5項中任一項的多核苷酸或其片段或衍生物用于制造治療或預防HIV感染所用的藥物或疫苗的用途。
10.一種多肽，其是由如SEO ID NO1，2或3中所示核酸序列或其片段或衍生物所編碼。
11.如權利要求10的多肽，其包括一由如SEQ ID NO1，2或3中所示核酸序列或其片段或衍生物所編碼的含有至少8個氨基酸的連續序列。
12.如權利要求10或11的多肽，其中該氨基酸序列對應于HIV包膜蛋白質或其片段。
13.如權利要求10到12項中任一項的多肽，其還包括在一受感染對象體內天然地誘導免疫反應的抗原決定簇。
14.如權利要求13的多肽，其中該抗原決定簇為一種構象表位或線性表位。
15.如權利要求10到14項中任一項的多肽，用作藥物，疫苗或診斷物質。
16.如權利要求10到14項中任一項的多肽用于制造治療或預防HIV感染所用的藥物或疫苗的用途。
17.分離的多肽，其對如權利要求10到14項中任一項所述多肽具有特異性。
18.如權利要求17的分離的多肽，用作藥物或診斷物質。
19.如權利要求17的分離的多肽用于制造治療或預防HIV感染所用的藥物的用途。
20.如權利要求17到19項中任一項的分離的多肽，其中該分離的多肽為一種抗體。
全文摘要
本發明涉及一種多核苷酸,其包括在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物,或與在SEQ ID NO:1,2或3中所示的核酸序列雜交的多核苷酸。本發明更涉及由在SEQ ID NO:1,2或3中所示的核酸序列或其片段或衍生物所編碼的多肽。該等多核苷酸和多肽可用為藥品,疫苗或診斷用物質,較佳者是用于HIV感染的治療,預防或診斷。
文檔編號C12N15/00GK1423698SQ00818426
公開日2003年6月11日申請日期2000年11月16日優先權日1999年11月16日
發明者邵一鳴, 羅夫·偉格拿, 漢思·渥夫, 麻庫司·葛拉夫申請人:真那特應用生物科技有限公司, 邵一鳴

完整全部詳細(xi)技術資料下載