具体实施方式
除非下文中另外定义,否则本说明书中所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。本文所提及的全部出版物、专利申请、专利和其他参考文献通过引用的方式完整地并入。此外,本文中所述的材料、方法和例子仅是说明性的并且不意在是限制性的。本发明的其他特征、目的和优点将从本说明书及附图并且从后附的权利要求书中显而易见。
I.定义
在本文中,术语“约”在与数字数值联合使用时意为涵盖具有比指定数字数值小5%的下限和比指定数字数值大5%的上限的范围内的数字数值。该术语也旨在涵盖在指定数字±1%,±0.5%,或±0.1%范围内的数值。
在本文中,表述“和/或”用于表示所列相关项目中的任何一个、或所列相关项目中的多个的任何和所有可能的组合。
在本文中,术语“包含”或“包括”意指包括所述及的要素、整数或步骤、或要素组、整数组或步骤组,但是不排除任何其他的要素、整数或步骤、或其他要素组、整数组或步骤组。在本文中,当使用术语“包含”或“包括”时,除非另有指明,否则也涵盖由所述及的要素、整数或步骤组成的情形。例如,当提及“包含”某个具体序列的多肽/蛋白时,也旨在涵盖由该具体序列组成的多肽/蛋白。
在本文中,术语“AAV衣壳蛋白变体”、“AAV变体衣壳蛋白”和“AAV衣壳变体”是指,相对于亲本AAV衣壳蛋白,在氨基酸序列上具有至少一个修饰(包括,缺失、插入和/或替换)的AAV衣壳蛋白。变体AAV衣壳蛋白可以与亲本衣壳蛋白的氨基酸序列具有至少90%、至少95%、至少98%、至少99%的同一性。
在本文中,“亲本AAV衣壳蛋白”或“亲本衣壳蛋白”是指,作为引入根据本发明的568-589位的衣壳蛋白突变的模板的AAV衣壳蛋白。作为变体AAV衣壳蛋白的亲本可以是天然存在的或“野生型”的AAV衣壳蛋白;也可以不是野生型衣壳蛋白,例如,在天然AAV衣壳蛋白中引入一个或多个(例如不超过10个或5个、4个、3个、2个、1个)氨基酸修饰的衣壳蛋白;不同AAV血清型衣壳蛋白部分拼接而形成的嵌合衣壳蛋白,例如,AAV5/AAV9嵌合衣壳蛋白、AAV2/AAV9嵌合衣壳蛋白。应当理解,在亲本衣壳蛋白为非天然衣壳蛋白的情况下,所述亲本衣壳蛋白不包含根据本发明的586-589位的衣壳蛋白突变。在一些实施方案中,亲本衣壳蛋白是天然的AAV9血清型衣壳蛋白,例如,具有SEQ ID NO:6的氨基酸序列的VP1蛋白、或具有N端截短的相应VP2或VP3蛋白。
在本文中,当提及AAV衣壳蛋白或其区段中的氨基酸位置时,是指根据SEQ ID NO:6编号的氨基酸位置。可以通过将所述及的AAV衣壳蛋白与SEQ ID NO:6进行氨基酸序列比对,确定在该衣壳蛋白的序列中与SEQ ID NO:6的氨基酸位置对应的氨基酸位置。例如,当提及衣壳蛋白的586位时,是指SEQ ID NO:6的第586位氨基酸残基,或经比对出现在其他衣壳蛋白的对应位置上的氨基酸残基。应当理解,在本公开中,当AAV衣壳蛋白变体涉及在某些特定氨基酸位置区段上的氨基酸替代(例如,用不同残基数目的氨基酸序列替代原序列)时,可以目视检测所述AAV衣壳蛋白变体与SEQ ID NO:6在该区段的比对情况,并且如有必要,在两个所比对的序列之一个序列或两个序列中引入空位,以保证引入空位后所述AAV衣壳蛋白的该区段与SEQ ID NO:6的相应区段在比对中处于相应的位置区域,并具有相应的氨基酸残基编号。作为此类比对的一个例子,参见图7。为了确定氨基酸位置而实施的序列比对,可以使用从https://blast.ncbi.nlm.nih.gov/Blast.cgi可获得的Basic LocalAlignment Search Tool,采用默认参数进行。
在本文中,“AAV病毒粒子”和“AAV病毒颗粒”可互换使用,是指包含AAV衣壳和包装在所述衣壳中的AAV核酸基因组(包括野生型AAV基因组和重组AAV基因组)的完整病毒颗粒。就这一点而言,包装到任何一个AAV病毒粒子中的AAV核酸分子链可以是有义(例如“正义”)链或“反义”链,并且这两种链具有同等的感染性。
在本文中,术语“重组AAV载体”与“重组AAV病毒粒子”、“重组AAV病毒颗粒”可互换使用,是指能够作为目的核酸的运载工具的非野生型重组AAV病毒粒子。通常,所述病毒载体包含衣壳和包装在其中的病毒基因组,且优选地所述病毒基因组包含插入其中的待递送至靶细胞或组织的目的核酸。在本文中,“重组”可缩写为“r”,例如,重组AAV可用rAAV指代。因此,在本文中,术语“重组AAV病毒粒子”与“重组AAV载体”也可以与“rAAV病毒粒子”、“rAAV病毒颗粒”或“rAAV”或“rAAV载体”互换使用。典型地,重组AAV载体具有感染性、但为复制缺陷的。
在本文中,出于本公开的目的,rAAV衣壳可以来自或衍生自各种腺相关病毒血清型,包括但不限于AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12和AAV13。例如,所述rAAV可以具有由来自所述血清型的AAV衣壳蛋白、由至少两种所述血清型的AAV衣壳蛋白部分拼接形成的嵌合衣壳蛋白(例如,AAV5/AAV9嵌合衣壳蛋白、AAV2/AAV9嵌合衣壳蛋白)和/或其变体组成的病毒蛋白衣壳。
在本文中,出于本公开的目的,包装在rAAV载体中的病毒基因组是重组的,即,相对于野生型AAV基因组DNA具有遗传修饰的AAV基因组DNA。为了产生可以将目的核酸递送至组织或细胞的重组AAV病毒粒子,通常仅需要在基因组中保留反向末端重复(ITR)顺式元件,而病毒包装所需的其余序列可以反式提供。因此,典型地,rAAV可以具有全部或部分缺失的一个或多个AAV野生型基因,例如,具有全部或部分缺失的rep和/或cap基因,并由此是复制缺陷性的;但保留AAV病毒粒子的拯救、复制和包装所必需的功能性侧翼ITR序列。更典型地,包装在rAAV病毒粒子中的重组AAV病毒基因组可以仅保留功能性ITR序列,并优选地包含或由位于两个AAV ITR序列之间的一个或多个外源核苷酸序列组成。应当理解,就rAAV而言,功能性ITR序列可以是,但并不必须是,野生型核苷酸序列,其可以例如通过核苷酸的插入、缺失或替换而改变,只要其仍然提供拯救、复制和包装所需的功能即可。因此,在本文中,rAAV载体是至少包含顺式提供病毒的复制和包装所需的功能性ITR的病毒载体。而且应当理解,重组AAV病毒基因组可以包含两个或两个以上(例如三个)ITR序列,且这些ITR序列可以相同或不同。
在本文中,术语AAV“反向末端重复”(inverted terminal repeat)或“ITR”可互换使用,是指来自AAV病毒基因组的功能性反向末端重复顺式作用元件,且涵盖野生型ITR序列和变体ITR序列。
天然AAV病毒的野生型ITR在序列中包含Rep蛋白结合位点(Rep binding site,RBS)和末端解链位点trs(terminal resolution site),能够被Rep蛋白结合识别并在trs处产生切口,并可形成独特的“T”字母型二级结构,在AAV病毒的生活周期中发挥重要作用。最早分离到的AAV病毒,AAV2,具有位于基因组两端、长度145bp的呈回文-发卡结构的“反向末端重复序列”(ITR)。之后,在各种血清型的AAV病毒中发现不尽相同的ITR序列,但是都能形成发卡结构和存在Rep结合位点。基于这些野生型ITR序列的重组AAV病毒载体,一般为单链AAV载体(ssAAV)。
相对于野生型ITR序列,变体ITR可以是,例如包含一个或多个核苷酸的缺失、替代、和/或添加、和/或截短,但仍具有功能性,即,能够用于产生rAAV病毒载体,的非天然ITR序列。已经发现,与上述的ssAAV不同,通过改造ITR,删除AAV病毒的一侧ITR序列中的trs序列和任选地D序列,能够使包装得到的重组AAV病毒载体携带可自我互补的基因组DNA,由此产生称作scAAV(self-complementary AAV)的病毒。scAAV病毒载体的包装容量为ssAAV病毒载体包装容量的一半,约为2.2kb-2.5kb,但感染细胞后转导效率更高。参见例如,Self-complementary AAV Vectors;Advances and Applications,https://doi.org/10.1038/mt.2008.171。可用于产生scAAV病毒的此类变体ITR序列,在本文中,也称作ΔITR。本公开不仅考虑通过将两个野生型ITR组合而产生的ssAAV载体,也考虑通过将ΔITR序列与野生型ITR组合而产生的scAAV载体。
如本领域技术人员理解,重组腺相关病毒的病毒衣壳蛋白与病毒基因组ITR序列可以来自相同或不同的AAV病毒血清型。
在本文中,术语“宿主细胞”指已经向其中引入了外源多核苷酸的细胞,包括这类细胞的子代。宿主细胞的实例包括但不限于,微生物、酵母细胞、昆虫细胞和哺乳动物细胞。在一些实施方案中,宿主细胞是哺乳动物细胞。在一些实施方案中,所述宿主细胞是骨骼肌细胞。根据使用该术语的上下文,所述宿主细胞可以是体外、离体或体内细胞。在另一些实施方案中,宿主细胞是用于生产根据本发明的rAAV载体的生产细胞,例如,“HEK293细胞”或“293细胞”,或衍生自所述细胞的细胞系。
术语“转导效率”是指经至少一个AAV基因组转导的细胞的百分比。例如,如果将1×106个细胞暴露于AAV病毒,并且确定0.5×106个细胞含有至少一个拷贝的AAV基因组,则转导效率为50%。用于确定转导效率的方法是例如使用流式细胞术。例如,当AAV基因组包含编码绿色荧光蛋白(GFP)的多核苷酸时,GFP+细胞的百分比是转导效率的量度。
在本文中,在一些实施方案中,术语“生产细胞”或“生产细胞系”是指,能够在体外连续或长期生长和分裂的细胞群体。在本领域中已知,在这样的克隆细胞群体的储存或传代过程中,核型可以发生自发的或诱导的变化,并由此可能与祖先细胞或培养物不完全相同,但仍保持原始生产细胞的期望特性。这样的生产细胞或细胞系涵盖在本发明范围中。
在本文中,描述核酸或蛋白质时所用的术语“外源的”或“异源的”可互换使用,是指相对于包含所述核酸或蛋白质的病毒、宿主细胞或受试者或其他生物体,或相对于与之连接的侧翼核酸或多肽,所述核酸或蛋白质是外源或异源的,即,所述核酸或蛋白质以非天然状态存在于所述病毒、宿主细胞或受试者或生物体中,或与该侧翼核酸或多肽为非天然连接。例如,通过重组技术引入特定病毒基因组或宿主细胞或受试者中从而和非天然与之连接的序列连接或处于非天然的染色体或细胞位置或状态的核酸,相对于所述病毒基因组或宿主细胞或受试者,是异源的。因此,插入与其来源细胞相同的宿主细胞或插入与其来源生物体相同的生物体,但以非天然状态存在的核酸,例如,以不同的拷贝数存在或处于不同调控元件的控制下的核酸,是外源的或异源的。
在本文中,“分离的”核酸是指,人工合成的、或自包含其的天然环境的至少一些组分中分离出来的核酸分子。例如,分离的核酸可以是一个更大的核酸的一部分、或是载体或物质组合物的一部分,或者可以包含在细胞内,并且仍然是“分离的”,条件是该更大的核酸、载体、物质组合物或特定细胞不是所述核酸的天然环境。在一些实施方案中,“分离的”核酸相对于起始材料被富集了至少大约10倍、100倍、1000倍、10,000倍或更多。
在本文中,术语“功能性连接”也称作“有效连接”,意指指定的各组分处于一种允许它们以预期的方式起作用的关系中。举例而言,若启动子或增强子序列在合适的宿主细胞或其他表达系统中刺激或调节编码序列的转录,则该启动子或增强子序列有效连接到该编码序列。一般而言,有效连接到可转录序列的启动子,与该可转录序列是连续的,即它们是顺式作用(cis-acting)。然而,一些转录调控序列(如增强子)无须物理邻接于或紧密接近于其增强转录的编码序列。
在本文中,术语序列“同一性”用于描述两个氨基酸序列或多核苷酸序列之间的序列结构相似性。为确定两个氨基酸序列或两个核酸序列的同一性百分数,可以将所述序列出于最佳比较目的比对(例如,可以为了最佳比对而在第一和第二氨基酸序列或核酸序列之一或二者中引入空位或可以为比较目的而抛弃非同源序列)。在一个优选实施方案中,为比较目的,所比对的参考序列的长度是所述参考序列的长度的至少30%、优选地至少40%、更优选地至少50%、60%,和甚至更优选地至少70%、80%、90%、或100%。随后比较在对应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列中的位置由第二序列中对应位置处的相同氨基酸残基或核苷酸占据时,则所述分子在这个位置处是相同的。
可以利用数学算法实现两个序列间的序列比较和同一性百分数的计算。在一个优选实施方案中,使用已经集成至GCG软件包的GAP程序中的Needlema和Wunsch((1970)J.Mol.Biol.48:444-453)算法(在http://www.gcg.com可获得),使用Blossum 62矩阵或PAM250矩阵和空位权重16、14、12、10、8、6或4和长度权重1、2、3、4、5或6,确定两个氨基酸序列之间的同一性百分数。在又一个优选的实施方案中,使用GCG软件包中的GAP程序(在http://www.gcg.com可获得),使用NWSgapdna.CMP矩阵和空位权重40、50、60、70或80和长度权重1、2、3、4、5或6,确定两个核苷酸序列之间的同一性百分数。特别优选的参数集合(和除非另外说明否则应当使用的一个参数集合)是采用空位罚分12、空位延伸罚分4和移码空位罚分5的Blossum 62评分矩阵。
还可以使用PAM120加权余数表、空位长度罚分12,空位罚分4),利用已经并入ALIGN程序(2.0版)的E.Meyers和W.Miller算法,((1989)CABIOS,4:11-17)确定两个氨基酸序列或核苷酸序列之间的同一性百分数。
如本文中所用,术语“保守性”氨基酸或核苷酸改变是指,导致包含所述氨基酸或核苷酸改变的蛋白质或核酸分子实质性地保持原有功能的中性或近中性氨基酸或核苷酸改变。例如,保守性氨基酸置换是将氨基酸置换或替换成侧链具有相似生物化学性质(例如电荷、疏水性和大小)的不同氨基酸。这类保守性修饰的变体相对于多态性变体、物种间同源物和等位基因而言是附加的并且不排斥它们。以下8组含有互为保守替换的氨基酸:1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(参阅例如,Creighton,Proteins(1984))。本领域技术人员可以通过常规技术手段,例如功能性测定试验,容易地检测一个特定多肽序列或核苷酸序列中的氨基酸或核苷酸改变的保守性。
在本文中,“个体”或“受试者”是指哺乳动物。哺乳动物的实例包括,但不限于,人、非人灵长类动物(例如,食蟹猴、恒河猴)、啮齿类动物,以及其他哺乳动物,例如,牛、猪、马、狗。在本文中,哺乳动物包括处于所有发育期(包括胚胎和胎儿期)的个体。
骨骼肌疾病是机体骨骼肌在一定病因的损害性作用下,引起肌纤维破坏为主要病理生理过程的一组疾病,主要包括:炎性肌肉病、肌营养不良、先天性肌肉病、代谢性肌肉病、离子通道病,因其发病率低,都属于罕见病。骨骼肌疾病的主要临床症状有肌无力,包括近端对称性肢体无力和远端不对称肌无力;肌肉疼痛、痉挛与强直;肌肉肥大和萎缩。此外,骨骼肌疾病患者还常伴有其他系统损害,如脊柱侧弯、关节挛缩,心律失常,皮疹等皮肤改变,内分泌代谢异常等。
在本文中,术语“治疗”指意欲改变正在接受治疗的个体中疾病之天然过程的临床介入。想要的治疗效果包括但不限于防止疾病出现或复发、减轻症状、减小疾病的任何直接或间接病理学后果、防止转移、降低病情进展速率、改善或缓和疾病状态,以及缓解或改善预后。术语“治疗”也涵盖改良或改善至少一项身体参数,包括患者可能无法辨别的身体参数。
在本文中,术语“预防”是指预防或延缓疾病或病症的发作或发展或进程。在本文中,“预防”通常是指在疾病的至少一个症状发生前实施的医院干预。
以下对本发明的多个方面进行描述。
II.衣壳蛋白变体
腺相关病毒(AAV)是一种非致病性细小病毒,其由无包膜衣壳和其内的4.7kb单链DNA基因组构成。基因组包含三个开放阅读框(ORF),两侧是作为病毒复制和包装信号起源的反向末端重复序列(ITR)。rep ORF对四种非结构蛋白进行编码,这四种非结构蛋白在病毒复制、转录调节、位点特异性整合和病毒粒子组装中发挥作用。cap ORF对三种结构蛋白(VP1-3)进行编码,这三种结构蛋白组装形成病毒衣壳。
AAV病毒衣壳由来自三种VP衣壳蛋白的总共约60个VP单体组成,排列成二十面体结构,其中三个衣壳蛋白VP1:VP2:VP3的摩尔比“最优”值大约为1:1:10。三种衣壳蛋白VP1、VP2、VP3均由AAV的cap基因编码,并自相同的转录物产生,受p40启动子调节。三种VP蛋白具有共同的C-端序列,但不同的N端起始位点;通过可变剪接产生的VP2和VP3是VP1的两种截短形式。作为一个示例,下面显示了AAV9的衣壳蛋白序列,其中VP1特异性氨基酸序列以黑色并且粗体显示(VP1独特区)。VP1和VP2共有的氨基酸序列(“VP1/VP2共有区”)用下划线并且斜体表示;整个VP3包含在VP1和VP2中,是所有三种衣壳蛋白共有的氨基酸(“共有VP3区”),在下方以粗体并且斜体表示。
VP1和VP2主要定位于细胞核内,而单体的VP3在核内和细胞质内均有分布。装配完成的AAV衣壳外表面由VP3序列(包括VP3以及VP1和VP2的C末端)组成,VP1和VP2的N末端位于衣壳的内部。
VP存在九个称作可变区(VR)的突出环。VR因AAV血清型而异,并负责血清型特异性的受体结合差异。由于其暴露的位置及其在受体结合中的功能,形成突起环的VR是旨在进行衣壳修饰以重新定向或扩展AAV嗜性(即,细胞表面靶向型)的理想位置。
为了开发新的细胞/组织靶向性AAV衣壳蛋白变体,本发明人进行了AAV衣壳蛋白变体筛选。在相应于VR-VIII环顶部的氨基酸位置(586-588位置),将随机序列插入cap ORF中,并构建包含报告基因和该cap ORF的AAV转移质粒以将AAV衣壳变体的基因型和表型与报告基因表达偶联,生成了质粒文库。随后通过衣壳变体筛选以及动物体内组织分布检测,鉴定了在静脉内给药方式下能够更高效和/或更特异地转导骨骼肌细胞(例如,膈肌、间隔肌、肱二头肌细胞和股四头肌细胞)的AAV衣壳蛋白变体。由此,本发明人建立了本发明的新衣壳蛋白变体。
因此,在一个方面,本发明提供了AAV衣壳蛋白变体。在一个实施方案中,根据本发明的AAV衣壳蛋白变体衍生自亲本AAV衣壳蛋白,在亲本衣壳蛋白的氨基酸位置586和589之间插入SEQ ID NO:5的肽(QVL),以替换原始的587-588位残基(根据SEQ ID NO:6的AAV9VP1编号)。在下文中,为了方便,本发明的此类替代突变也称作“根据本发明的586-589位突变”。根据本发明的衣壳蛋白修饰不干扰衣壳组装和基因组包装,并允许rAAV获得修饰的骨骼肌细胞(例如,膈肌、间隔肌、肱二头肌细胞和股四头肌细胞)靶向性。
在一些实施方案中,所述亲本AAV衣壳蛋白为选自AAV1、AAV2、AAV3、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAV10、AAV11、AAV12和AAV13的AAV血清型的衣壳蛋白,例如,为AAV9血清型衣壳蛋白。在另一些实施方案中,所述亲本AAV衣壳蛋白可以为不同AAV血清型衣壳蛋白部分拼接而形成的嵌合衣壳蛋白,例如,为AAV5/AAV9嵌合衣壳蛋白、AAV2/AAV9嵌合衣壳蛋白。在一些实施方案中,所述亲本AAV衣壳蛋白为包含如下氨基酸序列的AAV9衣壳蛋白或是由如下氨基酸序列组成的AAV9衣壳蛋白:
(a)SEQ ID NO:6的氨基酸203至736的氨基酸序列;
(b)SEQ ID NO:6的氨基酸137至736的氨基酸序列;
(c)SEQ ID NO:6的氨基酸序列;
(d)与(a)-(c)任一项的氨基酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%同一性的氨基酸序列;或
(e)与(a)-(c)任一项的氨基酸序列相比,具有一个或多个(例如,1、2、3、4、5、7、8、9或10个)氨基酸残基替换、缺失和/或添加(优选保守氨基酸替换)。
在另一些实施方案中,根据本发明的AAV衣壳蛋白变体衍生自编码如下氨基酸序列的转录物,其中所述氨基酸序列为在氨基酸位置第586和589位之间具有SEQ ID NO:5所示的氨基酸序列的AAV9衣壳蛋白序列(例如,SEQ ID NO:4的序列)。在本文中,与衣壳蛋白变体相关的表述“衍生自”转录物是指,所述转录物在处于适宜其表达产生蛋白质的条件时,能够产生所述的衣壳蛋白变体,包括通过使用替代性翻译起始位点和/或可变剪接,自该转录物产生的不同形式的衣壳蛋白变体,如VP1、VP2或VP3衣壳蛋白变体。在一些实施方案中,因此,衍生自转录物的本发明AAV衣壳蛋白可以是选自VP1、VP2和VP3的衣壳蛋白变体。在一些优选的实施方案中,根据本发明的AAV衣壳蛋白变体衍生自编码SEQ ID NO:4中所示的氨基酸序列的转录物。在一些优选的实施方案中,根据本发明的AAV衣壳蛋白变体衍生自包含SEQ ID NO:3中所示的核苷酸序列的转录物。
在一些实施方案中,除了根据本发明的586-589位突变,根据本发明的衣壳蛋白变体可以包括或不包括在一个或多个其他氨基酸位置的氨基酸替换(优选地,保守替换),例如,2个到5个、5个到10个、或10个到15个氨基酸替换。
在一些实施方案中,可以进一步修饰根据本发明的AAV衣壳蛋白变体,以例如增强或扩展重组载体的递送。构建和筛选重组AAV衣壳蛋白文库的方法在本领域中是公知的。参见,例如,US2005/0053922和US2009/0202490,其公开内容全部通过引用结合于此。
在一些实施方案中,与使用包含相应亲代AAV衣壳蛋白或野生型AAV的rAAV病毒粒子转导肌肉细胞(例如,骨骼肌细胞)相比,本文公开的变体衣壳蛋白赋予包含其的rAAV病毒粒子增加的骨骼肌细胞(例如,膈肌、肋间肌、肱二头肌细胞和股四头肌细胞)转导。例如,相对于包含亲代AAV衣壳蛋白或野生型AAV的AAV病毒粒子,本发明变体衣壳蛋白导致骨骼肌细胞(例如,膈肌、肋间肌、肱二头肌细胞和股四头肌细胞)摄取更多的AAV病毒粒子。在一些实施实施方案中,包含本发明变体衣壳蛋白的AAV病毒粒子优先转导骨骼肌细胞(例如,膈肌、肋间肌、肱二头肌细胞和股四头肌细胞),例如与其他细胞相比,对所述骨骼肌细胞的转导效率提高1.0倍、1.5倍、2倍、2.5倍、3倍或更多倍。
可以使用本领域中用于测量基因表达的多种方法,在体外或体内评估待测AAV病毒粒子对骨骼肌细胞(例如,膈肌、肋间肌、肱二头肌细胞和股四头肌细胞)的转导效率,例如转导效率的增加、转导的细胞类型选择、转导的优先性,等。例如,可以使用AAV衣壳蛋白包装包含报告基因(例如在组成型启动子控制下的荧光蛋白)的rAAV基因组,并在基于体外细胞的测定(例如,转染目标细胞或一组目标细胞后)或在基于动物模型的测定中,通过检测报告基因的表达(例如荧光显微镜检测),来评估转导效率和/或转导的细胞类型选择性/优先性。
III.rAAV生产
在一些方面,本发明提供了编码本发明的AAV衣壳蛋白变体的核酸、包含其的载体和宿主细胞在制备rAAV载体中的用途。
rAAV生产的一般原理综述于例如Carter,1992,Current Opinions inBiotechnology,1533-539;和Muzyczka,1992,CUM Topics in Microbial.and Immunol.,158:97-129)。多种方法描述于以下文献中:WO 95/13365;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441;WO 97/08298;WO 97/21825;WO 97/06243;WO 99/11764;US 5,786,211;US 5,871,982;和US 6,258,595。这些文献,尤其是其中与rAAV产生有关的部分,通过引用以其整体并入本文作为参考。
已经证实,AAV基因组中两个末端倒转重复序列(ITR),是AAV整合、复制、拯救和包装所必须的顺式作用元件。野生型AAV基因组中位于ITR序列之间的两个开放阅读框,称为Rep和Cap,分别编码参与AAV复制和包装的4个Rep蛋白(Rep78、Rep68、Rep52和Rep40)和3个Cap蛋白(VP1、VP2和VP3)以及1个装配激活蛋白(AAP)。Rep78和Rep68的转录由p5启动子控制,Rep52和Rep40由p19启动子起始转录,p40启动子调节Cap蛋白VP1、VP2和VP3的转录。
通常,为产生rAAV病毒粒子,需要在rAAV基因组中保留顺式作用元件ITR,但复制和包装所需的REP和CAP蛋白可以反式提供。因此,典型地,可以采用携带缺失了全部或部分的rep和/或cap基因的rAAV基因组的载体(例如质粒),转染能够反式提供该缺失的AAV功能(例如,rep和/或cap蛋白)的合适宿主细胞(例如,适宜的包装细胞),来产生感染性rAAV病毒粒子。
在本文中,携带待转移到靶细胞中的rAAV基因组的核酸载体,也称作“AAV转移载体”,其可以是各种适宜基因转移的核酸载体形式,例如,质粒。在本文中,rAAV基因组中缺失的、需要反式提供以辅助rAAV基因组包装为生产性AAV病毒粒子的AAV功能,也称作“AAV辅助功能”,例如rAAV基因组缺失的rep和/或cap基因,或编码AAV rep和/或cap表达产物或其功能性变体的核酸。在一些实施方案中,AAV辅助功能可以通过编码所述辅助功能的载体来提供,例如,质粒、噬菌体、转座子、粘粒、病毒或病毒粒子的形式。典型地,这样的载体提供AAV rep和/或cap核酸的瞬时表达,但缺少AAV ITR,并因此既不能复制也不能包装自身。在另一些实施方案中,AAV辅助功能可以通过稳定表达所述辅助功能的细胞或细胞系来提供。
腺相关病毒(AAV)是细小病毒科的无包膜病毒,属于依赖型细小病毒属(dependoparvovirus),需要辅助病毒的存在才能进行复制和组装,产生感染性病毒粒子。允许AAV(例如野生型AAV)被哺乳动物细胞复制和包装的病毒,在本文中,也称作“AAV辅助病毒”。用于AAV的各种各样的辅助病毒是本领域已知的,包含腺病毒、疱疹病毒和痘病毒。在本文中,辅助病毒基因组编码的AAV复制和包装所需的功能,在本文中,也称作“辅助病毒功能”,例如,来自腺病毒的E1a和E1b辅助基因、以及E4、E2a和VA辅助基因。辅助病毒功能可以以质粒或其他载体形式提供、和/或以表达所述辅助基因的稳定细胞系的形式提供。此外,如本领域技术人员理解的,AAV辅助功能(rep/cap基因)和辅助病毒功能(例如E4、E2a和VA辅助基因)可以在单个或分开的载体上提供。在一些方面,辅助病毒功能也可以由野生型腺病毒提供。例如,可以用野生型腺病毒和AAV转移载体转导包含并稳定表达产生AAV Rep和Cap蛋白的细胞系,由此产生感染性rAAV病毒颗粒。
在一些方面,用于产生rAAV粒子的技术涉及,向细胞提供待包装的rAAV基因组、rep和cap基因以及辅助病毒功能。这样的技术在本领域是熟知的。例如,可以产生包含如下组分的rAAV生产细胞(或包装细胞):rAAV基因组、与rAAV基因组分开(即不在rAAV基因组中)的AAV rep和cap基因、以及辅助病毒功能。之后,可以应用该生产细胞来产生目的感染性rAAV粒子。
在一些方面,因此,本发明提供了一种可用于制备重组腺相关病毒(rAAV)载体的生产细胞(或包装细胞),其包含编码本发明衣壳蛋白变体的cap基因,以及任选地还包含编码AAV rep基因的核酸和/或编码辅助病毒功能的核酸。在一些实施方案中,所述生产细胞还包含rAAV基因组。在一些实施方案中,所述rAAV基因组包含所述cap基因或所述rep基因。在另一些实施方案中,所述rAAV基因组不包含所述cap基因和rep基因。
在另一些方面,本发明提供了用于制备重组腺相关病毒(rAAV)载体的方法。在一些实施方案中,所述方法包括:
(i)提供根据本发明的生产细胞;
(ii)在允许包装产生包含所述重组AAV基因组的rAAV病毒粒子的条件下培养所述细胞;和
(iii)收获培养的宿主细胞或培养基,以收集产生的重组AAV病毒载体。
在一些实施方案中,所述生产细胞包含编码根据本发明的AAV衣壳蛋白变体的根据本发明的核酸。在一些实施方案中,根据本发明的核酸包含:
(a)编码SEQ ID NO:4,或与之具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%同一性且在氨基酸位置586-589之间具有如SEQ ID NO:5所示氨基酸序列的多核苷酸;或
(b)SEQ ID NO:3的核苷酸序列,或与其具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%同一性且编码在氨基酸位置586-589之间具有如SEQID NO:5所示氨基酸序列的氨基酸序列的核苷酸序列。
在一些实施方案中,根据本发明的核酸能够转录并表达选自以下的至少一种或任意两种或全部三种AAV衣壳蛋白:VP1,VP2和VP3。
在一些实施方案中,根据本发明的核酸以核酸载体的形式被引入所述生产细胞。在一些实施方案中,所述核酸载体还包含编码AAV REP蛋白的核酸。在一些实施方案中,所述核酸载体是质粒。
在一些实施方案中,根据本发明的核酸稳定转染并整合在所述生产细胞的基因组中。
在另一些实施方案中,所述生产细胞还包含(例如稳定整合了)编码AAV REP蛋白(尤其是AAV9或AAV2的REP蛋白)的核酸。在另一些实施方案中,所述生产细胞还包含(例如稳定整合了或通过载体引入了)能够反式提供辅助病毒功能(例如,来自腺病毒的E1a和E1b辅助基因、和/或E4、E2a和VA辅助基因)的核酸。
在一些实施方案中,根据本发明方法的步骤(i)包括:向根据上述任一实施方案的生产细胞中引入包含异源核酸的重组AAV基因组。在一些实施方案中,待引入所述宿主细胞中的rAAV基因组缺少AAV rep和cap DNA。在一些实施方案中,待引入所述宿主细胞中的rAAV基因组包含编码本发明衣壳蛋白变体的cap DNA,但缺少AAV rep DNA。在一些实施方案中,所述rAAV基因组通过AAV转移载体引入所述宿主细胞。
在一些实施方案中,根据本发明的的rAAV生产方法还包括:生成生产细胞(或细胞系)的步骤。在一些实施方案中,所述生产细胞(或细胞系)表达rAAV基因组包装所必需的一种或多种如下组分:缺少AAV rep和cap基因的rAAV基因组、与rAAV基因组分开的AAV rep基因和编码根据本发明的衣壳蛋白变体的cap基因。之后,可以用辅助病毒(如腺病毒)感染所述生产细胞,以产生感染性rAAV病毒粒子。
在一些优选的实施方案中,根据本发明的rAAV生产方法包括:用三种质粒共转染来产生生产细胞(或细胞系),其中所述三种质粒为:提供包含异源核酸和侧翼ITR的rAAV基因组的质粒(转移质粒)、提供AAV辅助功能(cap和/或rep蛋白)的质粒、提供辅助病毒(如腺病毒或单纯疱疹病毒)功能的质粒。在另一些实施方案中,本发明也考虑采用腺病毒或杆状病毒替代上述的质粒,以引入AAV辅助功能和辅助病毒功能。
IV.rAAV载体
在一些方面,本发明提供了一种病毒载体,其为人造的重组病毒颗粒,其具有包装在由本发明的衣壳蛋白变体组成的病毒衣壳中的rAAV基因组。在一些实施方案中,根据本发明的rAAV基因组是ssAAV基因组或scAAV基因组。
在一些实施方案中,根据本发明的重组AAV载体在其基因组中包含:
a.AAV反向末端重复(ITR)序列,和
b.包含异源核酸的表达构建体,其中所述异源核酸编码目的基因产物,
优选地,其中所述表达构建体包含以转录方向彼此功能性连接的如下元件:
-启动子,
-编码目的基因产物的异源核酸,
-转录终止子。
在一些实施方案中,所述基因组缺乏AAV rep和cap DNA,即在基因组中不存在AAVrep和cap DNA。
在一些实施方案中,本文公开的rAAV基因组包含两个位于所述表达构建体侧翼的AAV ITR。在一些实施方案中,在rAAV基因组中位于所述表达构建体两侧的ITR序列是天然的、变异的或经修饰的AAV ITR序列。在一些实施方案中,至少一个ITR序列是天然的、变异的或经修饰的AAV ITR序列。在一些实施方案中,两个ITR序列都是天然的、变异的或经修饰的AAV ITR序列。在一些实施方案中,两个侧翼ITR之一是允许产生自互补基因组的经修饰的AAV ITR序列,而另一ITR是天然的AAV ITR序列。
在根据本发明的rAAV基因组中,AAV ITR可以来自或可衍生自任何AAV血清型,其包括但不限于AAV血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12和AAV-13。AAV各种血清型的基因组序列,以及天然反向末端重复序列(ITR)可以在文献或公共数据库诸如GenBank中找到。参见,例如,GenBank登录号NC_002077(AAV1)、AF063497(AAV1)、NC_001401(AAV2)、AF043303(AAV2)、NC_001729(AAV3)、NC_001829(AAV4)、U89790(AAV4)、NC_006152(AAV5)、AF513851(AAV7)、AF513852(AAV8)、NC_006261(AAV8)和AY530579(AAV9)。描述AAV的出版物包括Srivistava等人(1983)J.Virol.45:555;Chiorini等人(1998)J.Virol.71:6823;Chiorini等人(1999)J.Virol.73:1309;Bantel-Schaal等人(1999)J.Virol.73:939;Xiao等人(1999)J.Virol.73:3994;Muramatsu等人(1996)Virol.221:208;Shade等人(1986)J.Virol.58:921;Gao等人(2002)Proc.Nat.Acad.Sci.USA 99:11854;Moris等人(2004)Virology 33:375-383;国际专利公开号WO2018/222503A1、WO2012/145601A2、WO2000/028061A2、WO1999/61601A2和WO1998/11244A2;美国专利申请号15/782,980和15/433,322;和美国专利号10,036,016、9,790,472、9,737,618、9,434,928、9,233,131、8,906,675、7,790,449、7,906,111、7,718,424、7,259,151、7,198,951、7,105,345、6,962,815、6,984,517和6,156,303。
在一些实施方案中,包含在rAAV基因组中的异源核酸有效地连接到转录控制DNA,特别是在靶细胞中具有功能的启动子DNA、增强子DNA和聚腺苷酸化信号序列DNA上,以形成表达构建体。所述表达构建体还可包括内含子序列,以促进RNA转录物在哺乳动物细胞中表达时的加工。
包含在根据本发明的rAAV中的异源核酸并无特别限制。在一些实施方案中,所述异源核酸编码有待在靶组织/细胞(例如,一种或多种骨骼肌细胞(例如,膈肌、肋间肌、肱二头肌细胞和/或股四头肌细胞)中表达的基因产物。在一些实施方案中,所述基因产物在靶细胞/组织中的表达,将有益于与该组织的遗传性缺陷相关的疾病或病症(例如,骨骼肌疾病)的治疗或预防。在另一些实施方案中,所述异源核酸包含编码标记或报告蛋白的多核苷酸。
在一些实施方案中,所述异源核酸编码用于基因置换、基因阻抑或基因编辑的目的基因产物,优选地,所述目的基因产物为蛋白质或RNA。
基因置换(gene replacement)是一种最为“直接的基因治疗方式,其通常涉及将编码功能性蛋白质的核酸引入宿主细胞并使其在宿主细胞中表达,以弥补宿主细胞中由缺陷型基因造成的该功能性蛋白质缺失。如本领域技术人员理解,根据该功能性蛋白的大小和性质,可以通过将编码该蛋白质的一个核酸分子引入宿主细胞中、或通过将多个分别编码该蛋白质的一部分的核酸,引入同一宿主细胞中,来表达产生全长的功能性蛋白质。在一些实施方案中,根据本发明的rAAV包含表达构建体,其中所述表达构建体包含至少一个与启动子可操作连接的用于基因置换的异源核酸。在一些实施方案中,所述至少一个异源核酸编码治疗性蛋白质。
基因抑制可以通过诸如反义核酸、siRNA或microRNA等RNA干扰(RNAi)手段,抑制宿主细胞中缺陷基因的表达或翻译,从而治疗或预防由该缺陷基因导致的功能性障碍。在一些实施方案中,根据本发明的rAAV包含表达构建体,其中所述表达构建体包含至少一个与启动子可操作连接的用于基因抑制的异源核酸。在一些实施方案中,所述至少一个异源核酸在引入宿主细胞表达中后,将导致siRNA或microRNA产生,以抑制宿主细胞中缺陷型基因的表达或翻译。
基因编辑是另一种靶向修复基因缺陷的基因治疗手段,包括但不限于,ZFN、TALEN和CRISP/Cas编辑。在一些实施方案中,根据本发明的rAAV包含表达构建体,其中所述表达构建体包含至少一个与启动子可操作连接的用于基因编辑(尤其是CRISP/Cas9编辑)的异源核酸。在一些实施方案中,该异源核酸在目标细胞/组织中的表达将靶向修复所述细胞/组织中的基因缺陷。
不希望受任何理论约束,在根据本发明的rAAV中的异源核酸表达后可以治疗骨骼肌疾病。骨骼肌疾病的非限制性实例以及每种骨骼肌疾病可靶向的示例性蛋白或基因例举如下:
-杜氏肌营养不良症(Duchenne muscular dystrophy,DMD)和/或Becker-Kiener肌营养不良症,可靶向提供的示例性蛋白为抗肌萎缩蛋白,可靶向的示例性基因为致病性突变的抗肌萎缩蛋白基因;
-X连锁肌管性肌病(X-linked myotubular myopathy,XLMTM),可靶向提供的示例性蛋白为肌管蛋白,可靶向的示例性基因为致病性突变的肌管蛋白基因(MTM1)。
用于在表达构建体中与异源核酸连接的启动子并无特别限制。在本文公开的rAAV载体的一些实施方案中,编码基因产物的异源核酸与组成型启动子有效地连接。合适的组成型启动子包含例如巨细胞病毒(CMV)启动子,CMV早期增强子/鸡β-肌动蛋白(CBA)启动子/兔β-珠蛋白内含子(CAG)7,人类延伸因子1α启动子(EF1α),人类磷酸甘油酸激酶启动子(PGK),线粒体重链启动子,泛素启动子。在其它实施方案中,编码基因产物的异源核酸与诱导型启动子有效地连接。在一些情况下,编码基因产物的异源核酸与肌肉组织特异性或肌肉细胞类型特异性调节元件有效地连接。
除了启动子和所述异源核酸,表达构建体中还可以根据需要包含其他调控序列。术语“调控序列”和“表达控制序列”在本文中可以互换使用,是指这样的核酸序列,其诱导、抑制或以其它方式控制与之有效连接的编码核酸序列的蛋白质转录。调控序列可以是例如起始序列、增强子序列、内含子序列和转录终止子序列等。在一些实施方案中,所述表达构建体还包含位于异源核酸上游(即,5’)的Kozak序列。
V.药物组合物
在一方面,本发明提供了包含本发明的rAAV载体的药物组合物。根据本公开的rAAV病毒粒子在纯化后可以根据已知的方法配制以制备药学上有用的组合物。本公开的组合物可以使用本领域已知的技术配制用于施用给哺乳动物受试者,例如人。
当所述递送系统被配制成溶液或悬浮液时,所述递送系统处于可接受的载体中,例如水性载体。可以使用多种水性载体,例如,水、缓冲水、0.8%盐水、0.3%甘氨酸、透明质酸等。这些组合物可以通过常规的熟知灭菌技术灭菌,或者可以是无菌过滤的。所得水溶液可以被包装以按原样使用,或者被冻干,在给药前将该冻干制剂与无菌溶液组合。
根据本发明的药物组合物可以含有药学上可接受的辅助物质以接近生理条件,例如pH调节剂和缓冲剂、张力调节剂、湿润剂等,例如乙酸钠、乳酸钠、氯化钠、氯化钾、氯化钙、脱水山梨糖醇单月桂酸酯、油酸三乙醇胺等。根据本发明的药物组合物可以包含或不包含防腐剂。
病毒载体的基因组效价,例如本文公开的组合物和配制品中的病毒载体的基因组效价,可以用多种标准方法确定,包括例如,使用PCR确定病毒载体的基因组效价。使用qPRC和ddPCR确定病毒载体的基因组效价。
在一个优选的实施方案中,本发明的药物组合物为配制成静脉递送的药物制剂形式。
VI.病毒载体的用途
本发明的病毒载体作为一种基因药物,可以使用本领域技术人员已知的各种方法和递送系统中的任何一种将具有本发明衣壳蛋白变体的AAV病毒载体物理引入受试者,包括但不限于静脉内、肌内、皮下、腹膜内、脊髓或其他非肠胃外施用,例如通过注射或输注。
具有本发明衣壳蛋白变体的AAV病毒载体对多种骨骼肌细胞(例如,膈肌、肋间肌、肱二头肌和股四头肌,尤其是股四头肌)表现出提高的靶向和转导效率,因此提供了有效的基于基因递送以治疗骨骼肌疾病的手段。
在一些实施方案中,所述骨骼肌疾病是例如遗传性骨骼肌缺陷,例如,杜氏肌营养不良症和/或Becker-Kiener肌营养不良症;X连锁肌管性肌病。
实施例
下面参考本发明实施例,对本发明进行进一步描述和举例说明,显然,所描述的实施例仅仅是本发明的一部分实施方式,而不是全部的实施方式。基于本发明中的实施例,本领域普通技术人员在不偏离本发明精神情况下对本发明实施方案所作的修改或变化,都属于本发明保护的范围。如无特殊说明,实施例中涉及的各种反应试剂均可以通过商业渠道购买得到。
实施例1.构建用于AAV9衣壳蛋白变体库的骨架质粒
1、构建pRDAV-CMV-EGFP-Cap9骨架质粒(构建体1)
原始质粒pRDAV-CMV-EGFP(锦篮基因保存)在EGFP后包含EcoRI和MluI酶切位点。按如下所述,产生表达AAV9衣壳蛋白(Cap9)的构建体1(如图1示意性所示)。
Cap9完整ORF片段扩增
以AAV9完整基因组为模板,PCR扩增Cap9完整ORF片段并引入酶切位点,其中Cap9完整ORF片段指自P40启动子起,Cap9终止密码子TAA止,长度为2637bp的ORF片段,其中在P40端引入限制性内切酶MluI酶切位点,在Cap9终止密码子端引入限制性内切酶EcoRI酶切位点。
所述PCR扩增采用的引物序列如下所示:
上游引物(SEQ ID NO:7):ACGCGTacgtcaaaaagggtggagc
下游引物(SEQ ID NO:8):GAATTCttacagattacgagtcaggtatctg
PCR扩增采用的程序为:95℃预变性2min、95℃变性15s、56℃退火15s、72℃延伸30s、重复变性至延伸35个循环、72℃整理延伸2min、4℃终止。
产生构建体1
PCR产物经EcoRI和MluI酶切消化后,凝胶电泳回收,得到目的片段。使用EcoRI和MluI双酶切消化原始质粒pRDAV-CMV-EGFP,将得到的目的片段与消化的质粒骨架连接,由此获得质粒骨架pRDAV-CMV-EGFP-Cap9,即构建体1(图1所示),大小为10191bp,序列如SEQID NO.1所示。
2、构建pRDAV-CMV-EGFP-Cap9Δ-588骨架质粒(构建体2)
选取野生型Cap9基因上第881碱基位置(c.881)至第1985碱基位置(c.1985)的片段,将对应于氨基酸587位点的丙氨酸密码子突变为酪氨酸密码子(A587Y),同时用GGTAACCGTT AACTT序列(该序列包含BestEII和HpaI酶切位点)替换编码原来的588位点氨基酸残基的3个碱基,由此获得编码587位点突变且588位点缺失的Cap9Δ-588序列。在Cap9Δ-588序列c.881位置引入DraIII酶切位点位点,c.1985位置引入BamHI酶切位点,并委托擎科生物科技有限公司进行基因合成。合成产物通过酶切连接的方式构建入构建体1,以替代原始Cap9中位于DraIII和BamHI酶切位点之间的相应片段,获得构建体2,即,pRDAV-CMV-EGFP-Cap9Δ-588。构建体2的序列如SEQ ID NO.2所示。
实施例2构建AAV衣壳变体病毒文库
线性化骨架载体
以实施例1中构建体2为骨架载体,用BestEII和HpaI双酶切,以线性化该骨架载体。酶切体系为:构建体2(3μg)、CutSmart Buffer(5μL)、限制性内切酶BestEII(0.5μL)、限制性内切酶HpaI(0.5μL),补水至50μL,37℃孵育3~4小时。酶切后,通过切胶回收线性化载体。
合成Oligo文库
采用的Oligo序列如下:
Oligo-F:GTAACNNNNNNNNN
Oligo-R:NNNNNNNNN
Oligo经95度变性,室温缓慢退火,得到退火产物。
文库构建和筛选
Oligo退火产物与线性化骨架(构建体2)利用T4 DNA连接酶连接,得到重组质粒。连接体系为:退火产物(2μL)、线性化骨架载体(25ng)、T4 DNA连接酶(0.5μL)、连接缓冲液(5μL)、补水至10μL,16℃过夜,得到插入Oligo的重组质粒。
按如下所述,将重组质粒转化至大肠杆菌HB101感受态细胞。
1)分别将10μl重组质粒加入到装有100μl HB101感受态细胞的Ep管中,轻轻拍动管壁数次,充分混匀,冰浴30min;
2)将Ep管置于42℃水浴中90s;
3)向Ep管中缓慢加入LB培养基0.5mL,37℃,80rpm,振摇45min;
4)将菌液涂布在含氨苄青霉素(0.1g/L)的LB平板上,37℃,培养过夜。
随机挑取单菌落,接种于培养试管(含0.1g/L氨苄青霉素的LB培养基)中,37℃,200rpm振摇,培养过夜。
按如下所述,进行质粒提取。
1)将上述获得的菌液经过12000rpm离心1分钟,倒掉上清培养基;
2)加入250μL的buffer P1/RNaseA混合液,高速涡旋重悬细菌;
3)加入250μL的buffer P2,上下颠倒8-10次;
4)加入350μL的buffer P3,立即颠倒混匀8-10次让溶液彻底中和;
5)13000rpm离心10分钟,取上清过柱;
6)12000离心1分钟,倒掉废液,加入500μL的PW1,12000离心1分钟,倒掉废液;
7)加入600μL的PW2,12000离心1分钟,倒掉上清;
8)重复洗涤一次:重复步骤7;
9)12000rpm空转2分钟;
10)加入55℃预热洗脱液30-50μL,静置2分钟,12000rpm离心1分钟。
对经过浓度检测和酶切鉴定的阳性质粒进行编号并取10μL测序,阳性质粒保存在-20℃冰箱,获得AAV衣壳文库。
实施例3包装产生突变型AAV病毒和对照AAV病毒
参考文献(Xiao X,et al.Production of High-Titer Recombinant Adeno-Associated Virus Vectors in the Absence of Helper Adenovirus.J Virol.1998;72(3):2224-2232),应用三质粒包装系统包装和纯化重组AAV病毒。简言之,将表达AAV的Rep基因的包装质粒、提供AdV辅助功能的辅助质粒、和携带AAV的ITR以及表达变体CAP9和绿色荧光蛋白eGFP的转移质粒(插入CAP9变体的图2所示质粒)或表达野生型CAP9和绿色荧光蛋白eGFP的转移质粒(图1所示质粒),按照1:1:1的摩尔比混匀后,采用磷酸钙方法共转染HEK293细胞。转染72h后,收集细胞和培养上清液,采用PEG8000-NaCl&CH3Cl提取法纯化重组AAV病毒。用0.01%的Pluronic F68-PBS溶解AAV病毒产物,采用点杂交方法测定rAAV滴度。经初步实验,选择有效转导骨骼肌细胞的重组AAV病毒,获得编号为CapX-436的AAV衣壳变体病毒。
测序编号为CapX-436的重组AAV病毒中CAP9变体的编码序列,其对应的核苷酸序列如SEQ ID NO.3所示,对应的氨基酸序列如SEQ ID NO.4所示。将测序得到的序列信息与原始衣壳蛋白(CAP9)序列进行比对,所述变体在相应于原始序列(SEQ ID NO:6)的587和588位置具有突变。如图7所示,原始序列的587位和588位残基(AQ)在所述变体中被替代为如SEQ ID NO.5所示的氨基酸序列(QVL)。推测,最初突变文库构建引入587位的A587Y突变,在随后的文库筛选过程中发生了丢失的可能原因是,酶切位点粘性末端暴露后DNA存在不稳定性,激活DNA碱基修复机制,引入随机突变替补碱基,最终造成编码氨基酸的偏离。
实施例4AAV衣壳变体病毒在小鼠体内的生物分布规律
AAV病毒注射
选取6 -8周,18 -20g雄性SPF级C57小鼠,用编码荧光蛋白EFGP且具有野生型CAP9衣壳蛋白的rAAV9病毒作为对照,以实施例3获得的编号为CapX-436的AAV衣壳变体病毒作为实验组,每组至少3只小鼠。以2E13 gc/kg剂量,经尾静脉注射rAAV9病毒及衣壳变体病毒CapX-436。注射后,28天剖杀取材,制备各组织冰冻切片,观察EGFP荧光。
小鼠组织切片及免疫荧光对比
A.冰冻切片的制备
1)组织固定:新鲜组织固定液固定24h以上,将组织从固定液取出,用手术刀将目的部位组织修平整。
2)脱水:将修切好的组织放于15%的蔗糖溶液内,4℃冰箱脱水沉底后,转入30%的蔗糖溶液内4℃冰箱脱水沉底。
3)OCT包埋:将脱好水的组织取出,用滤纸将表面水稍吸干后,切面朝上放于包埋台上,组织周围滴上OCT包埋剂,将包埋台放在冰冻切片机的速冻台上速冻包埋,OCT变白变硬后即可进行切片。新鲜组织直接冰冻切片则不需要固定脱水,直接用手术刀将目的部位组织修平整后,OCT包埋剂包埋并切片。
4)切片:将包埋台固定于切片机上,先粗切将组织面修切平整后即可开始切片,切片厚度8-10μm,将干净的载玻片平放于切出的组织片上方即可将组织贴于载玻片上,写好标签。
B.观察荧光
将上述冷冻切片用防褪色的封片剂(ProLong,Thermo Fischer)保护,在荧光显微镜下用蓝色激发波段模块(488nm)观察EGFP蛋白并采集图像。使用ImageJ软件对图像进行统计分析。
结果
实验结果显示,与对照组相比,AAV衣壳变体CapX-436病毒经尾静脉注射后,小鼠骨骼肌细胞内荧光强度显著增强,膈肌、肋间肌、肱二头肌、股四头肌细胞的感染数量明显增多(图3和图4)。从ImageJ软件的荧光分析结果来看(图5),CapX-436病毒感染在膈肌和肋间肌中导致的平均荧光强度,均比AAV9病毒高出0.6倍。由图6可以看出,CapX-436病毒感染后的小鼠股四头肌细胞EGFP荧光强度比AAV9病毒感染后高出7倍,对骨骼肌的阳性转导效率比AAV9高出3倍。
综上结果表明,AAV衣壳蛋白变体CapX-436可显著的增强骨骼肌的转导效率,可作为AAV治疗骨骼肌疾病的更优选择。
序列表
SEQ ID NO:1:构建体1:
aaaaacctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttctagcttggccactccctctctgcgcgctcgctcgctcactgaggccggg
cgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctctc
gaggagcttgccattgcatacgttgtatccatatcataatatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgactagttattaatagtaatc
aattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtca
ataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc
caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcat
cgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttt
tggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcg
tttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccccggctagagcttcccgggggtac
ccgccaccatggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggc
gagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctac
ggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggg
cgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatc
ctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatc
gaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccg
ccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaaagtg
gccgcgactctaggaattctcgagaggatgcatcgatcagagtgtgttggtttttttctagagaattctacgtcaaaaagggtggagccaagaaaagacccgccccca
gtgacgcagatataagtgagcccaaacgggtgcgcgagtcagttgcgcagccatcgacgtcagacgcggaagcttcgatcaactacgcggacaggtaccaaaaca
aatgttctcgtcacgtgggcatgaatctgatgctgtttccctgcagacaatgcgagagactgaatcagaattcaaatatctgcttcactcacggtgtcaaagactgtttaga
gtgctttcccgtgtcagaatctcaacccgtttctgtcgtcaaaaaggcgtatcagaaactgtgctacattcatcacatcatgggaaaggtgccagacgcttgcactgcttg
cgacctggtcaatgtggacttggatgactgtgtttctgaacaataaatgacttaaaccaggtatggctgccgatggttatcttccagattggctcgaggacaaccttagtg
aaggaattcgcgagtggtgggctttgaaacctggagcccctcaacccaaggcaaatcaacaacatcaagacaacgctcgaggtcttgtgcttccgggttacaaatac
cttggacccggcaacggactcgacaagggggagccggtcaacgcagcagacgcggcggccctcgagcacgacaaggcctacgaccagcagctcaaggccgg
agacaacccgtacctcaagtacaaccacgccgacgccgagttccaggagcggctcaaagaagatacgtcttttgggggcaacctcgggcgagcagtcttccaggc
caaaaagaggcttcttgaacctcttggtctggttgaggaagcggctaagacggctcctggaaagaagaggcctgtagagcagtctcctcaggaaccggactcctccg
cgggtattggcaaatcgggtgcacagcccgctaaaaagagactcaatttcggtcagactggcgacacagagtcagtcccagaccctcaaccaatcggagaacctcc
cgcagccccctcaggtgtgggatctcttacaatggcttcaggtggtggcgcaccagtggcagacaataacgaaggtgccgatggagtgggtagttcctcgggaaatt
ggcattgcgattcccaatggctgggggacagagtcatcaccaccagcacccgaacctgggccctgcccacctacaacaatcacctctacaagcaaatctccaacag
cacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccctgggggtattttgacttcaacagattccactgccacttctcaccacgtgactggcagc
gactcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacattcaggtcaaagaggttacggacaacaatggagtcaagaccatcgcca
ataaccttaccagcacggtccaggtcttcacggactcagactatcagctcccgtacgtgctcgggtcggctcacgagggctgcctcccgccgttcccagcggacgttt
tcatgattcctcagtacgggtatctgacgcttaatgatggaagccaggccgtgggtcgttcgtccttttactgcctggaatatttcccgtcgcaaatgctaagaacgggta
acaacttccagttcagctacgagtttgagaacgtacctttccatagcagctacgctcacagccaaagcctggaccgactaatgaatccactcatcgaccaatacttgtac
tatctctcaaagactattaacggttctggacagaatcaacaaacgctaaaattcagtgtggccggacccagcaacatggctgtccagggaagaaactacatacctgga
cccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaatttgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgat
gaatcctggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtctggatctttaatttttggcaaacaaggaactggaagagacaacgtggatg
cggacaaagtcatgataaccaacgaagaagaaattaaaactactaacccggtagcaacggagtcctatggacaagtggccacaaaccaccagagtgcccaagcac
aggcgcagaccggctgggttcaaaaccaaggaatacttccgggtatggtttggcaggacagagatgtgtacctgcaaggacccatttgggccaaaattcctcacacg
gacggcaactttcacccttctccgctgatgggagggtttggaatgaagcacccgcctcctcagatcctcatcaaaaacacacctgtacctgcggatcctccaacggcct
tcaacaaggacaagctgaactctttcatcacccagtattctactggccaagtcagcgtggagatcgagtgggagctgcagaaggaaaacagcaagcgctggaaccc
ggagatccagtacacttccaactattacaagtctaataatgttgaatttgctgttaatactgaaggtgtatatagtgaaccccgccccattggcaccagatacctgactcgt
aatctgtaattgcttgttaatcaataaaccgtttaattcgtttcagttgaactttggtctctgcgACGCGTgatcccctaactacaaggaacccctagtgatggagttgg
ccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgc
agagagggacagatccccaggaagctcctctgtgtcctcataaaccctaacctcctctacttgagaggacattccaatcataggctgcccatccaccctctgtgtcctcc
tgttaattaggtcacttaacaaaaaggaaattgggtaggggtttttcacagaccgctttctaagggtaattttaaaatatctgggaagtcccttccactgctgtgttccagaa
gtgttggtaaacagcccacaaatgtcaacagcagaaacatacaagctgtcagctttgcacaagggcccaacaccctgctcatcaagaagcactgtggttgctgtgtta
gtaatgtgcaaaacaggaggcacattttccccacctgtgtaggttccaaaatatctagtgttttcatttttacttggatcaggaacccagcactccactggataagcattatc
cttatccaaaacagccttgtggtcagtgttcatctgctgactgtcaactgtagcattttttggggttacagtttgagcaggatatttggtcctgtagtttgctaacacaccctgc
agctccaaaggttccccaccaacagcaaaaaaatgaaaatttgacccttgaatgggttttccagcaccattttcatgagttttttgtgtccctgaatgcaagtttaacatagc
agttaccccaataacctcagttttaacagtaacagcttcccacatcaaaatatttccacaggttaagtcctcatttaaattaggcaaaggaattaattcttgaagacgaaag
ggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttcta
aatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattccctt
ttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaac
agcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtgttgacgccgggcaagag
caactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctg
ccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgcct
tgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaa
ctacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaa
tctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactat
ggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcattttta
atttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatctt
cttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggta
actggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaat
cctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggtt
cgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggac
aggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgac
ttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgtt
ctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcga
ggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaag
ccagtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgc
ttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagctgtggaatgtgtgtcagttagggtgtgg
aaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccccaggctccccagcaggcagaagtat
gcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactccgcccatcccgcccctaactccgcccagttccgcccattctccgccccatggctgacta
attttttttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggcctaggcttttgcaaaaagcttcacgctgccg
caagcactcagggcgcaagggctgctaaaggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccggatgaatgtcagctactgggctatct
ggacaagggaaaacgcaagcgcaaagagaaagcaggtagcttgcagtgggcttacatggcgatagctagactgggcggttttatggacagcaagcgaaccggaa
ttgccagctggggcgccctctggtaaggttgggaagccctgcaaagtaaactggatggctttcttgccgccaaggatctgatggcgcaggggatcaagatcgatctg
atcaagagacaggatgaggatcgtttcgcatgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggctattcggctatgactgggcacaa
cagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccggtgccctgaatgaactgcaggac
gaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaagggactggctgctattgggcgaagtg
ccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgcttgatccggctacctgcccattcg
accaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagcatcaggggctcgcgccagcc
gaactgttcgccaggctcaaggcgcgcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcatggtggaaaatggccgcttttct
ggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggcggcgaatgggctgaccgctt
cctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgagcgggactctggggttcgaaatgaccgaccaagc
gacgcccaacctgccatcacgagatttcgattccaccgccgccttctatgaaaggttgggcttcggaatcgttttccgggacgccggctggatgatcctccagcgcgg
ggatctcatgctggagttcttcgcccaccccgggctcgatcccctcgcgagttggttcagctgctgcctgaggctggacgacctcgcggagttctaccggcagtgcaa
atccgtcggcatccaggaaaccagcagcggctatccgcgcatccatgcccccgaactgcaggagtggggaggcacgatggccgctttggtccggatctttgtgaag
gaaccttacttctgtggtgtgacataattggacaaactacctacagagatttaaagctctaaggtaaatataaaatttttaagtgtataatgtgttaaactactgattctaattgt
ttgtgtattttagattccaacctatggaactgatgaatgggagcagtggtggaatgcctttaatgaggaaaacctgttttgctcagaagaaatgccatctagtgatgatgag
gctactgctgactctcaacattctactcctccaaaaaagaagagaaaggtagaagaccccaaggactttccttcagaattgctaagttttttgagtcatgctgtgtttagtaa
tagaactcttgcttgctttgctatttacaccacaaaggaaaaagctgcactgctatacaagaaaattatggaaaaatattctgtaacctttataagtaggcataacagttata
atcataacatactgttttttcttactccacacaggcatagagtgtctgctattaataactatgctcaaaaattgtgtacctttagctttttaatttgtaaaggggttaataaggaat
atttgatgtatagtgccttgactagagatcataatcagccataccacatttgtagaggttttacttgcttta
SEQ ID NO:2:构建体2
aaaaacctcccacacctccccctgaacctgaaacataaaatgaatgcaattgttgttgttctagcttggccactccctctctgcgcgctcgctcgctcactgaggccggg
cgaccaaaggtcgcccgacgcccgggctttgcccgggcggcctcagtgagcgagcgagcgcgcagagagggagtggccaactccatcactaggggttcctctc
gaggagcttgccattgcatacgttgtatccatatcataatatgtacatttatattggctcatgtccaacattaccgccatgttgacattgattattgactagttattaatagtaatc
aattacggggtcattagttcatagcccatatatggagttccgcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtca
ataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgc
caagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcat
cgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttt
tggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcg
tttagtgaaccgtcagatcgcctggagacgccatccacgctgttttgacctccatagaagacaccgggaccgatccagcctccccggctagagcttcccgggggtac
ccgccaccatggtgagcaagggcgaggagctgttcaccggggtggtgcccatcctggtcgagctggacggcgacgtaaacggccacaagttcagcgtgtccggc
gagggcgagggcgatgccacctacggcaagctgaccctgaagttcatctgcaccaccggcaagctgcccgtgccctggcccaccctcgtgaccaccctgacctac
ggcgtgcagtgcttcagccgctaccccgaccacatgaagcagcacgacttcttcaagtccgccatgcccgaaggctacgtccaggagcgcaccatcttcttcaaggg
cgacggcaactacaagacccgcgccgaggtgaagttcgagggcgacaccctggtgaaccgcatcgagctgaagggcatcgacttcaaggaggacggcaacatc
ctggggcacaagctggagtacaactacaacagccacaacgtctatatcatggccgacaagcagaagaacggcatcaaggtgaacttcaagatccgccacaacatc
gaggacggcagcgtgcagctcgccgaccactaccagcagaacacccccatcggcgacggccccgtgctgctgcccgacaaccactacctgagcacccagtccg
ccctgagcaaagaccccaacgagaagcgcgatcacatggtcctgctggagttcgtgaccgccgccgggatcactctcggcatggacgagctgtacaagtaaagtg
gccgcgactctaggaattctcgagaggatgcatcgatcagagtgtgttggtttttttctagagaattctacgtcaaaaagggtggagccaagaaaagacccgccccca
gtgacgcagatataagtgagcccaaacgggtgcgcgagtcagttgcgcagccatcgacgtcagacgcggaagcttcgatcaactacgcggacaggtaccaaaaca
aatgttctcgtcacgtgggcatgaatctgatgctgtttccctgcagacaatgcgagagactgaatcagaattcaaatatctgcttcactcacggtgtcaaagactgtttaga
gtgctttcccgtgtcagaatctcaacccgtttctgtcgtcaaaaaggcgtatcagaaactgtgctacattcatcacatcatgggaaaggtgccagacgcttgcactgcttg
cgacctggtcaatgtggacttggatgactgtgtttctgaacaataaatgacttaaaccaggtatggctgccgatggttatcttccagattggctcgaggacaaccttagtg
aaggaattcgcgagtggtgggctttgaaacctggagcccctcaacccaaggcaaatcaacaacatcaagacaacgctcgaggtcttgtgcttccgggttacaaatac
cttggacccggcaacggactcgacaagggggagccggtcaacgcagcagacgcggcggccctcgagcacgacaaggcctacgaccagcagctcaaggccgg
agacaacccgtacctcaagtacaaccacgccgacgccgagttccaggagcggctcaaagaagatacgtcttttgggggcaacctcgggcgagcagtcttccaggc
caaaaagaggcttcttgaacctcttggtctggttgaggaagcggctaagacggctcctggaaagaagaggcctgtagagcagtctcctcaggaaccggactcctccg
cgggtattggcaaatcgggtgcacagcccgctaaaaagagactcaatttcggtcagactggcgacacagagtcagtcccagaccctcaaccaatcggagaacctcc
cgcagccccctcaggtgtgggatctcttacaatggcttcaggtggtggcgcaccagtggcagacaataacgaaggtgccgatggagtgggtagttcctcgggaaatt
ggcattgcgattcccaatggctgggggacagagtcatcaccaccagcacccgaacctgggccctgcccacctacaacaatcacctctacaagcaaatctccaacag
cacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccctgggggtattttgacttcaacagattccactgccacttctcaccacgtgactggcagc
gactcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacattcaggtcaaagaggttacggacaacaatggagtcaagaccatcgcca
ataaccttaccagcacggtccaggtcttcacggactcagactatcagctcccgtacgtgctcgggtcggctcacgagggctgcctcccgccgttcccagcggacgttt
tcatgattcctcagtacgggtatctgacgcttaatgatggaagccaggccgtgggtcgttcgtccttttactgcctggaatatttcccgtcgcaaatgctaagaacgggta
acaacttccagttcagctacgagtttgagaacgtacctttccatagcagctacgctcacagccaaagcctggaccgactaatgaatccactcatcgaccaatacttgtac
tatctctcaaagactattaacggttctggacagaatcaacaaacgctaaaattcagtgtggccggacccagcaacatggctgtccagggaagaaactacatacctgga
cccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaatttgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgat
gaatcctggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtctggatctttaatttttggcaaacaaggaactggaagagacaacgtggatg
cggacaaagtcatgataaccaacgaagaagaaattaaaactactaacccggtagcaacggagtcctatggacaagtggccacaaaccaccagagtTACGGTA
ACCGTTAACTTgcacaggcgcagaccggctgggttcaaaaccaaggaatacttccgggtatggtttggcaggacagagatgtgtacctgcaaggacccat
ttgggccaaaattcctcacacggacggcaactttcacccttctccgctgatgggagggtttggaatgaagcacccgcctcctcagatcctcatcaaaaacacacctgta
cctgcggatcctccaacggccttcaacaaggacaagctgaactctttcatcacccagtattctactggccaagtcagcgtggagatcgagtgggagctgcagaagga
aaacagcaagcgctggaacccggagatccagtacacttccaactattacaagtctaataatgttgaatttgctgttaatactgaaggtgtatatagtgaaccccgccccat
tggcaccagatacctgactcgtaatctgtaattgcttgttaatcaataaaccgtttaattcgtttcagttgaactttggtctctgcgACGCGTgatcccctaactacaag
gaacccctagtgatggagttggccactccctctctgcgcgctcgctcgctcactgaggccgggcgaccaaaggtcgcccgacgcccgggctttgcccgggcggcc
tcagtgagcgagcgagcgcgcagagagggacagatccccaggaagctcctctgtgtcctcataaaccctaacctcctctacttgagaggacattccaatcataggct
gcccatccaccctctgtgtcctcctgttaattaggtcacttaacaaaaaggaaattgggtaggggtttttcacagaccgctttctaagggtaattttaaaatatctgggaagt
cccttccactgctgtgttccagaagtgttggtaaacagcccacaaatgtcaacagcagaaacatacaagctgtcagctttgcacaagggcccaacaccctgctcatcaa
gaagcactgtggttgctgtgttagtaatgtgcaaaacaggaggcacattttccccacctgtgtaggttccaaaatatctagtgttttcatttttacttggatcaggaacccag
cactccactggataagcattatccttatccaaaacagccttgtggtcagtgttcatctgctgactgtcaactgtagcattttttggggttacagtttgagcaggatatttggtc
ctgtagtttgctaacacaccctgcagctccaaaggttccccaccaacagcaaaaaaatgaaaatttgacccttgaatgggttttccagcaccattttcatgagttttttgtgt
ccctgaatgcaagtttaacatagcagttaccccaataacctcagttttaacagtaacagcttcccacatcaaaatatttccacaggttaagtcctcatttaaattaggcaaag
gaattaattcttgaagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgc
ggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaac
atttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgg
gttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatc
ccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgac
agtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaac
atgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgt
tgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttcc
ggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctaca
cgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactt
tagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccc
cgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaaga
gctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcacc
gcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcag
cggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgctt
cccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtc
ctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggc
cttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccg
agcgcagcgagtcagtgagcgaggaagcggaagagcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaat
ctgctctgatgccgcatagttaagccagtatacactccgctatcgctacgtgactgggtcatggctgcgccccgacacccgccaacacccgctgacgcgccctgacg
ggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgaggcagctgtg
gaatgtgtgtcagttagggtgtggaaagtccccaggctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccaggtgtggaaagtccccag
gctccccagcaggcagaagtatgcaaagcatgcatctcaattagtcagcaaccatagtcccgcccctaactccgcccatcccgcccctaactccgcccagttccgcc
cattctccgccccatggctgactaattttttttatttatgcagaggccgaggccgcctcggcctctgagctattccagaagtagtgaggaggcttttttggaggcctaggct
tttgcaaaaagcttcacgctgccgcaagcactcagggcgcaagggctgctaaaggaagcggaacacgtagaaagccagtccgcagaaacggtgctgaccccgga
tgaatgtcagctactgggctatctggacaagggaaaacgcaagcgcaaagagaaagcaggtagcttgcagtgggcttacatggcgatagctagactgggcggtttta
tggacagcaagcgaaccggaattgccagctggggcgccctctggtaaggttgggaagccctgcaaagtaaactggatggctttcttgccgccaaggatctgatggc
gcaggggatcaagatcgatctgatcaagagacaggatgaggatcgtttcgcatgattgaacaagatggattgcacgcaggttctccggccgcttgggtggagaggct
attcggctatgactgggcacaacagacaatcggctgctctgatgccgccgtgttccggctgtcagcgcaggggcgcccggttctttttgtcaagaccgacctgtccgg
tgccctgaatgaactgcaggacgaggcagcgcggctatcgtggctggccacgacgggcgttccttgcgcagctgtgctcgacgttgtcactgaagcgggaaggga
ctggctgctattgggcgaagtgccggggcaggatctcctgtcatctcaccttgctcctgccgagaaagtatccatcatggctgatgcaatgcggcggctgcatacgctt
gatccggctacctgcccattcgaccaccaagcgaaacatcgcatcgagcgagcacgtactcggatggaagccggtcttgtcgatcaggatgatctggacgaagagc
atcaggggctcgcgccagccgaactgttcgccaggctcaaggcgcgcatgcccgacggcgaggatctcgtcgtgacccatggcgatgcctgcttgccgaatatcat
ggtggaaaatggccgcttttctggattcatcgactgtggccggctgggtgtggcggaccgctatcaggacatagcgttggctacccgtgatattgctgaagagcttggc
ggcgaatgggctgaccgcttcctcgtgctttacggtatcgccgctcccgattcgcagcgcatcgccttctatcgccttcttgacgagttcttctgagcgggactctgggg
ttcgaaatgaccgaccaagcgacgcccaacctgccatcacgagatttcgattccaccgccgccttctatgaaaggttgggcttcggaatcgttttccgggacgccggc
tggatgatcctccagcgcggggatctcatgctggagttcttcgcccaccccgggctcgatcccctcgcgagttggttcagctgctgcctgaggctggacgacctcgcg
gagttctaccggcagtgcaaatccgtcggcatccaggaaaccagcagcggctatccgcgcatccatgcccccgaactgcaggagtggggaggcacgatggccgc
tttggtccggatctttgtgaaggaaccttacttctgtggtgtgacataattggacaaactacctacagagatttaaagctctaaggtaaatataaaatttttaagtgtataatgt
gttaaactactgattctaattgtttgtgtattttagattccaacctatggaactgatgaatgggagcagtggtggaatgcctttaatgaggaaaacctgttttgctcagaagaa
atgccatctagtgatgatgaggctactgctgactctcaacattctactcctccaaaaaagaagagaaaggtagaagaccccaaggactttccttcagaattgctaagtttt
ttgagtcatgctgtgtttagtaatagaactcttgcttgctttgctatttacaccacaaaggaaaaagctgcactgctatacaagaaaattatggaaaaatattctgtaaccttta
taagtaggcataacagttataatcataacatactgttttttcttactccacacaggcatagagtgtctgctattaataactatgctcaaaaattgtgtacctttagctttttaatttg
taaaggggttaataaggaatatttgatgtatagtgccttgactagagatcataatcagccataccacatttgtagaggttttacttgctttaSEQ ID No.3:CapX-436质粒中编码CAP9 VP1变体的DNA序列
atggctgccgatggttatcttccagattggctcgaggacaaccttagtgaaggaattcgcgagtggtgggctttgaaacctggagcccctcaacccaaggcaaatcaa
caacatcaagacaacgctcgaggtcttgtgcttccgggttacaaataccttggacccggcaacggactcgacaagggggagccggtcaacgcagcagacgcggc
ggccctcgagcacgacaaggcctacgaccagcagctcaaggccggagacaacccgtacctcaagtacaaccacgccgacgccgagttccaggagcggctcaaa
gaagatacgtcttttgggggcaacctcgggcgagcagtcttccaggccaaaaagaggcttcttgaacctcttggtctggttgaggaagcggctaagacggctcctgg
aaagaagaggcctgtagagcagtctcctcaggaaccggactcctccgcgggtattggcaaatcgggtgcacagcccgctaaaaagagactcaatttcggtcagact
ggcgacacagagtcagtcccagaccctcaaccaatcggagaacctcccgcagccccctcaggtgtgggatctcttacaatggcttcaggtggtggcgcaccagtgg
cagacaataacgaaggtgccgatggagtgggtagttcctcgggaaattggcattgcgattcccaatggctgggggacagagtcatcaccaccagcacccgaacctg
ggccctgcccacctacaacaatcacctctacaagcaaatctccaacagcacatctggaggatcttcaaatgacaacgcctacttcggctacagcaccccctgggggta
ttttgacttcaacagattccactgccacttctcaccacgtgactggcagcgactcatcaacaacaactggggattccggcctaagcgactcaacttcaagctcttcaacat
tcaggtcaaagaggttacggacaacaatggagtcaagaccatcgccaataaccttaccagcacggtccaggtcttcacggactcagactatcagctcccgtacgtgct
cgggtcggctcacgagggctgcctcccgccgttcccagcggacgttttcatgattcctcagtacgggtatctgacgcttaatgatggaagccaggccgtgggtcgttc
gtccttttactgcctggaatatttcccgtcgcaaatgctaagaacgggtaacaacttccagttcagctacgagtttgagaacgtacctttccatagcagctacgctcacag
ccaaagcctggaccgactaatgaatccactcatcgaccaatacttgtactatctctcaaagactattaacggttctggacagaatcaacaaacgctaaaattcagtgtgg
ccggacccagcaacatggctgtccagggaagaaactacatacctggacccagctaccgacaacaacgtgtctcaaccactgtgactcaaaacaacaacagcgaatt
tgcttggcctggagcttcttcttgggctctcaatggacgtaatagcttgatgaatcctggacctgctatggccagccacaaagaaggagaggaccgtttctttcctttgtct
ggatctttaatttttggcaaacaaggaactggaagagacaacgtggatgcggacaaagtcatgataaccaacgaagaagaaattaaaactactaacccggtagcaac
ggagtcctatggacaagtggccacaaaccaccagagtCAAGTCCTTgcacaggcgcagaccggctgggttcaaaaccaaggaatacttccgggtatggttt
ggcaggacagagatgtgtacctgcaaggacccatttgggccaaaattcctcacacggacggcaactttcacccttctccgctgatgggagggtttggaatgaagcac
ccgcctcctcagatcctcatcaaaaacacacctgtacctgcggatcctccaacggccttcaacaaggacaagctgaactctttcatcacccagtattctactggccaagt
cagcgtggagatcgagtgggagctgcagaaggaaaacagcaagcgctggaacccggagatccagtacacttccaactattacaagtctaataatgttgaatttgctgt
taatactgaaggtgtatatagtgaaccccgccccattggcaccagatacctgactcgtaatctgtaa
SEQ ID No.4:CapX-436质粒中CAP9 VP1变体的氨基酸序列
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNA
ADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEA
AKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASG
GGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYF
GYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQV
FTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFS
YEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYR
QQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVD
ADKVMITNEEEIKTTNPVATESYGQVATNHQSQVLAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAK
IPHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL*
SEQ ID No.5:CapX-436质粒中CAP9 VP1变体的第587和588位点的氨基酸序列
QVL
SEQ ID No.6:野生型CAP9 VP1的氨基酸序列
MAADGYLPDWLEDNLSEGIREWWALKPGAPQPKANQQHQDNARGLVLPGYKYLGPGNGLDKGEPVNA
ADAAALEHDKAYDQQLKAGDNPYLKYNHADAEFQERLKEDTSFGGNLGRAVFQAKKRLLEPLGLVEEA
AKTAPGKKRPVEQSPQEPDSSAGIGKSGAQPAKKRLNFGQTGDTESVPDPQPIGEPPAAPSGVGSLTMASG
GGAPVADNNEGADGVGSSSGNWHCDSQWLGDRVITTSTRTWALPTYNNHLYKQISNSTSGGSSNDNAYF
GYSTPWGYFDFNRFHCHFSPRDWQRLINNNWGFRPKRLNFKLFNIQVKEVTDNNGVKTIANNLTSTVQV
FTDSDYQLPYVLGSAHEGCLPPFPADVFMIPQYGYLTLNDGSQAVGRSSFYCLEYFPSQMLRTGNNFQFS
YEFENVPFHSSYAHSQSLDRLMNPLIDQYLYYLSKTINGSGQNQQTLKFSVAGPSNMAVQGRNYIPGPSYR
QQRVSTTVTQNNNSEFAWPGASSWALNGRNSLMNPGPAMASHKEGEDRFFPLSGSLIFGKQGTGRDNVD
ADKVMITNEEEIKTTNPVATESYGQVATNHQSAQAQAQTGWVQNQGILPGMVWQDRDVYLQGPIWAKI
PHTDGNFHPSPLMGGFGMKHPPPQILIKNTPVPADPPTAFNKDKLNSFITQYSTGQVSVEIEWELQKENSKRWNPEIQYTSNYYKSNNVEFAVNTEGVYSEPRPIGTRYLTRNL*
SEQ ID NO:7:ACGCGTacgtcaaaaagggtggagc
SEQ ID NO:8:GAATTCttacagattacgagtcaggtatctg