[go: up one dir, main page]

CN114703203A - 杆状病毒载体及其用途 - Google Patents

杆状病毒载体及其用途 Download PDF

Info

Publication number
CN114703203A
CN114703203A CN202210127524.1A CN202210127524A CN114703203A CN 114703203 A CN114703203 A CN 114703203A CN 202210127524 A CN202210127524 A CN 202210127524A CN 114703203 A CN114703203 A CN 114703203A
Authority
CN
China
Prior art keywords
promoter
nucleotide sequence
nucleic acid
protein
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210127524.1A
Other languages
English (en)
Other versions
CN114703203B (zh
Inventor
潘雨堃
王天天
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Boyin Biotechnology Co ltd
Original Assignee
Shanghai Boyin Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Boyin Biotechnology Co ltd filed Critical Shanghai Boyin Biotechnology Co ltd
Priority to CN202210127524.1A priority Critical patent/CN114703203B/zh
Publication of CN114703203A publication Critical patent/CN114703203A/zh
Application granted granted Critical
Publication of CN114703203B publication Critical patent/CN114703203B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/06Animal cells or tissues; Human cells or tissues
    • C12N5/0601Invertebrate cells or tissues, e.g. insect cells; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2510/00Genetically modified cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/14011Baculoviridae
    • C12N2710/14041Use of virus, viral particle or viral elements as a vector
    • C12N2710/14043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vectore
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14122New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/103Plasmid DNA for invertebrates
    • C12N2800/105Plasmid DNA for invertebrates for insects
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Virology (AREA)
  • Molecular Biology (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本申请涉及一种利用昆虫细胞‑‑杆状病毒体系制备一种线性双链无末端的DNA(neDNA)表达载体,所述neDNA载体含有AAV反向末端重复序列(ITRs)和一种基因表达盒。本申请的昆虫细胞‑‑杆状病毒体系制备neDNA的产量高,产率平均有2‑3倍提升。相比于其他Bac‑rep,经过3次连续杆状病毒传代后,Rep蛋白(Rep78)的表达稳定性更好。

Description

杆状病毒载体及其用途
技术领域
本申请涉及生物医药领域,具体的涉及一种杆状病毒载体及其用途。
背景技术
基因治疗是一种在核酸水平通过调控基因表达这一生物学过程达到治疗疾病目的的新型治疗方法。理想的基因治疗载体需具备递送效率高、安全性高、生产可放大、成本低这些特点。重组腺相关病毒(rAAV)载体具有高效和安全的特点,是目前用于遗传病基因治疗的主要基因递送载体。rAAV仍旧面临生产放大困难、生产成本高的问题。基于DNA治疗的非病毒载体基因治疗有望解决该问题。2013年,Robert Kotin等人利用昆虫细胞杆状病毒表达系统,制备得到一种线性双链无末端的DNA(no end DNA,neDNA),该线性DNA两端通过AAV基因组的反向末端重复序列(ITRs)闭合。Robert Kotin的制备方法由其实验室2002年开发的AAV杆状病毒生产体系直接转化而来,在产率方面没有针对neDNA进行优化;同时该制备方法在重组杆状病毒Bac-Rep表达Rep蛋白时,Rep78和Rep52之间会发生同源重组,体系不稳定。
因此仍然需要克服在昆虫细胞中大规模(商业化)生产neDNA的上述严重限制。因此提供在昆虫细胞中稳定和高产(大规模)地生产neDNA的手段和方法是本发明的一个目标。
发明内容
本申请目的在于设计一种高效的基于昆虫细胞杆状病毒表达系统及其用于制备neDNA的方法,优化了Rep蛋白表达载体,提升Rep蛋白表达的稳定性,从而制备提高了neDNA的产量和生产体系的稳定性。本发明的特征包括:1)使用强启动子(p10启动子),提高了Rep78表达量;2)优化了Rep52的序列密码子,避免Rep78和Rep52序列发生同源重组。本发明的效果:1)较Robert Kotin的制备方法提高产率2-3倍;2)Rep蛋白杆状病毒表达载体,传3代后依旧稳定。
一方面,本申请提供了一种分离的核酸分子,其包含SEQ ID NO:12所示的核苷酸序列。
在某些实施方式中,所述的分离的核酸分子编码腺相关病毒(AAV)Rep52蛋白。
另一方面,本申请提供了一种分离的核酸分子,其包含编码所述编码腺相关病毒(AAV)Rep78蛋白的核苷酸序列和编码Rep52蛋白的核苷酸序列,其中所述编码Rep52蛋白的核酸分子包含SEQ ID NO:12所示的核苷酸序列。
在某些实施方式中,其中所述编码Rep78蛋白的核苷酸序列为野生型。
在某些实施方式中,其中所述编码Rep78蛋白的核酸分子包含SEQ ID NO:11所示的核苷酸序列。
在某些实施方式中,其还包括启动所述编码AAV Rep78蛋白的核苷酸序列转录的第一启动子和启动所述编码AAV Rep52蛋白的核酸分子的第二启动子,所述第一启动子与第二启动子相同或不同。
在某些实施方式中,所述第一启动子和第二启动子包括昆虫细胞启动子。
在某些实施方式中,所述第一启动子包括强启动子。
在某些实施方式中,与所述第二启动子相比,所述第一启动子具有相同或更高的转录启动能力。
在某些实施方式中,其中所述第一启动子和第二启动子各自独立地选自:p10启动子、Polyhedrin(polh)启动子和IE1启动子。
在某些实施方式中,其中所述第一启动子和第二启动子的转录方向相同或相反。
在某些实施方式中,其中所述第一启动子与所述编码Rep78蛋白的核苷酸序列可操作地连接,第二启动子与所述编码Rep52蛋白的核苷酸序列可操作地连接。
在某些实施方式中,当第一启动子和第二启动子的转录方向相同时,其依次包含第一启动子、编码Rep78蛋白的核苷酸序列、第二启动子和编码Rep52蛋白的核苷酸序列。
在某些实施方式中,其中所述编码Rep78蛋白的核苷酸序列和编码Rep52蛋白的核苷酸序列下游还分别包含编码polyA的核苷酸序列(pA)。
在某些实施方式中,当第一启动子和第二启动子的转录方向相同时,其依次包含第一启动子、编码Rep78蛋白的核苷酸序列、第一pA、第二启动子、编码Rep52蛋白的核苷酸序列和第二pA。
在某些实施方式中,当第一启动子和第二启动子的转录方向相反时,其依次包含编码Rep78的核苷酸序列、第一启动子、第二启动子、编码Rep52的核苷酸序列,其中所述第一启动子启动所述编码Rep78蛋白的核苷酸序列的转录,所述第二启动子启动所述编码Rep52蛋白的核苷酸序列的转录。
在某些实施方式中,其中所述第一启动子的5’端与第二启动子的5’端直接或间接连接。
在某些实施方式中,其中所述第一启动子的3’端与所述编码Rep78的核苷酸序列的5’端直接或间接连接。
在某些实施方式中,其还包含第一pA,其中所述编码Rep78蛋白的核苷酸序列的3’端与所述编第一pA的5’端直接或间接连接。
在某些实施方式中,其中所述第二启动子的3’端与所述编码Rep52的核苷酸序列的5’端直接或间接连接。
在某些实施方式中,其还包含第二pA,其中所述编码Rep52蛋白的核苷酸序列的3’端与所述编第二pA的5’端直接或间接连接。
在某些实施方式中,其中所述pA选自:SV40 polyA和HSV TK polyA中的任意一种。
在某些实施方式中,所述的分离的核酸分子包含SEQ ID NO:8所示的核苷酸序列。
另一方面,本申请提供一种分离的核酸分子,其依次包含第一polyA(pA)、编码Rep78蛋白的核苷酸序列、第一启动子、第二启动子、编码Rep52的蛋白核苷酸序列和第二polyA(pA),其中所述第一启动子为编码Rep78蛋白的核苷酸序列和第一pA的转录启动子,所述第二启动子为编码Rep52蛋白的核苷酸序列和第二polyA的转录启动子,其中所述编码Rep52蛋白的核苷酸序列和/或所述编码Rep78蛋白的核苷酸序列的序列经过密码子优化以避免同源重组,所述第一启动子和第二启动子包括昆虫细胞启动子,所述第一启动子是强启动子。
在某些实施方式中,其中所述第一启动子包括p10启动子、polh启动子或IE1启动子。
在某些实施方式中,其中所述p10启动子包含SEQ ID NO:9所示的核苷酸序列。
在某些实施方式中,其中所述第二启动子包括第二启动子包括p10启动子、polh启动子或IE1启动子。
在某些实施方式中,其中所述polh启动子包含SEQ ID NO:10所示的核苷酸序列。
另一方面,本申请提供一种载体,其包含本申请所述的分离的核酸分子。
在某些实施方式中,所述载体包括病毒载体。
在某些实施方式中,所述载体包括杆状病毒载体。
在某些实施方式中,所述载体包括pFastBac载体。
在某些实施方式中,所述的载体包含SEQ ID NO:14所示的核苷酸序列。
另一方面,本申请提供一种细胞,其包含本申请所述的分离的核酸分子或本申请所述的载体。
在某些实施方式中,所述细胞包括昆虫细胞。
在某些实施方式中,所述细胞包括Spodoptera frugiperda(Sf9)细胞。
另一方面,本申请提供一种杆状病毒表达系统,其包含第一杆状病毒载体以及包含编码目的基因的核酸序列的第二杆状病毒载体,所述第一杆状病毒载体为本申请所述的杆状病毒载体。
在某些实施方式中,自5’端至3’端,所述编码目的基因的核酸序列其依次包含第一细小病毒的反向末端重复序列(ITR)、目的基因和第二ITR。
在某些实施方式中,其中所述第一ITR与目的基因之间还包含至少一个启动子。
在某些实施方式中,其中所述第一ITR与目的基因之间还包含至少一个真核启动子。
在某些实施方式中,其中所述第一ITR与目的基因之间还包含至少一个哺乳动物细胞启动子。
在某些实施方式中,其中所述第一ITR与目的基因之间还包含一个哺乳动物细胞启动子和一个昆虫细胞启动子。
在某些实施方式中,所述哺乳动物细胞启动子包括广泛性启动子和组织特异性启动子。
在某些实施方式中,所述广泛性启动子包括CMV、SV40、EF1a、CAG或UBC启动子。
在某些实施方式中,所述组织特异性启动子包括ALB、hAAT、TBG,TTR、GFAP、MHCK7或hSyn启动子。
在某些实施方式中,其中所述哺乳动物细胞启动子包括CMV启动子。
在某些实施方式中,其中所述昆虫细胞启动子包括p10启动子。
在某些实施方式中,所述启动子包括CMV和p10启动子。
另一方面,本申请提供一种含有编码第一氨基酸序列的第一核苷酸序列和编码第二氨基酸序列的第二核苷酸序列的昆虫细胞,其中所述第一核苷酸序列包含编码Rep78蛋白的核苷酸序列,所述第二核苷酸序列编码Rep52蛋白的核苷酸序列,其中所述第一核苷酸序列包含SEQ ID NO:11所示的核苷酸序列,第二核苷酸序列包含SEQ ID NO:12所示的核苷酸序列。
在某些实施方式中,其中所述第一和第二核苷酸序列是一个核酸构建体的一部分,其中所述第一和第二核苷酸序列每个都与用于昆虫细胞表达的表达控制序列可操作地连接。
在某些实施方式中,其中所述昆虫细胞还包含:一段含有至少一段细小病毒反向末端重复核苷酸序列(ITR)的第三核酸序列。
在某些实施方式中,其中所述第三核苷酸序列还含有至少一个编码目的基因的核苷酸序列。
在某些实施方式中,其中所述第三核苷酸序列含有两个细小病毒ITR核苷酸序列,且其中所述至少一个编码目的基因的核苷酸序列位于所述两个细小病毒ITR核苷酸序列之间。
在某些实施方式中,其中所述细小病毒包括腺相关病毒。
在某些实施方式中,其中所述第三核苷酸序列是另一个核酸构建体的一部分,其中所述每个编码目的基因的核苷酸序列都与用于哺乳动物表达的表达控制序列可操作地连接。
在某些实施方式中,所述核酸构建体为昆虫细胞相容的载体。
在某些实施方式中,所述核酸构建体为杆状病毒载体。
在某些实施方式中,其包含本申请所述的杆状病毒载体。
另一方面,本申请提供了本申请所述的杆状病毒表达系统或本申请所述的昆虫细胞在制备目的核酸分子中的应用。
在某些实施方式中,其中所述目的核酸分子为具有共价封闭末端的线性DNA分子(neDNA)。
另一方面,本申请提供了一种目的核酸分子的制备方法,包括培养本申请所述的昆虫细胞。
在某些实施方式中,所述的制备方法包括:
1)提供本申请所述的杆状病毒表达系统;
2)将目的基因序列插入所述第二杆状病毒载体;
3)将第一杆状病毒载体和第二杆状病毒载体共转染至昆虫细胞;
4)使所述昆虫细胞在允许包含目的基因的DNA复制和释放的条件下生长;
5)收集目的核酸分子。
在某些实施方式中,所述方法还保护分离所述目的核酸分子。
另一方面,本申请提供了一种试剂盒,其包含本申请所述的分离的核酸分子、本申请所述的杆状病毒表达系统和/或本申请所述的昆虫细胞。
本领域技术人员能够从下文的详细描述中容易地洞察到本申请的其它方面和优势。下文的详细描述中仅显示和描述了本申请的示例性实施方式。如本领域技术人员将认识到的,本申请的内容使得本领域技术人员能够对所公开的具体实施方式进行改动而不脱离本申请所涉及发明的精神和范围。相应地,本申请的附图和说明书中的描述仅仅是示例性的,而非为限制性的。
附图说明
本申请所涉及的发明的具体特征如所附权利要求书所显示。通过参考下文中详细描述的示例性实施方式和附图能够更好地理解本申请所涉及发明的特点和优势。对附图简要说明如下:
图1A显示的是本申请所述pFastBac-ITR-EGFP质粒图谱。
图1B显示的是本申请所述pFastBac-p10Rep质粒图谱。
图2显示的是本申请所述p10Rep、RepWT、inRep和CORep基因转录示意图。
图3显示的是Western Blotting分析Rep蛋白表达及稳定性结果;其中,Ctr:未感染Sf9细胞;1:BacV-RepWT感染的Sf9细胞;2:BacV-inRep感染的Sf9细胞;3:BacV-CORep感染的Sf9细胞;4:BacV-p10Rep感染的Sf9细胞。
图4显示的是本申请所述不同Rep蛋白驱动neDNA-ITR-EGFP基因表达载体鉴定结果;其中,M:DNA Marker;1-4:分别为RepWT,inRep,CORep和p10Rep驱动neDNA-ITR-EGFP基因表达载体的电泳图谱。
图5A-5B显示的是本申请所述neDNA-ITR-EGFP基因表达载体酶切鉴定结果。
图6显示的是本申请所述RepWT,inRep,CORep和p10Rep分别驱动neDNA-ITR-EGFP基因表达载体并转染HEK293细胞,在荧光显微镜下拍摄转染72h后的荧光表达图。
图7显示的是纳米脂质颗粒递送neDNA-ITR-FLuc在C57BL/6小鼠体内荧光素酶表达的结果。
图8显示的是本申请所述Rep52优化前后序列对比(Query:Rep52WT,Sbjct:Rep52-CO)。
具体实施方式
以下由特定的具体实施例说明本申请发明的实施方式,熟悉此技术的人士可由本说明书所公开的内容容易地了解本申请发明的其他优点及效果。
术语定义
细小病毒科的病毒是小DNA动物病毒。细小病毒科可分为两个亚科:感染脊椎动物的细小病毒亚科和感染昆虫的浓核病毒亚科。所述细小病毒亚科的成员在本文中称为细小病毒并包括依赖病毒属。如可从它们的属名推断的,所述依赖病毒的成员是独特的,因为它们通常需要与在细胞培养中产生感染的辅助病毒如腺病毒或疱疹病毒共感染。依赖病毒属包括AAV,其在人类和其他灵长类动物中非常普遍,并且已从各种组织样品中分离出几种血清型。在人类细胞中发现了血清型2、3、5和6,非人灵长类动物样品中的AAV血清型1、4和7-11。Kenneth I.Berns,"Parvoviridae:TheViruses and Their Replication,"Chapter69in Fields Virology(3dEd.1996)描述了有关细小病毒和细小病毒科的其他成员的其他信息。应理解,本发明不限于AAV,而是可同样地应用于其他细小病毒。
AAV的基因组是长度小于约5000核苷酸(nt)的线状单链DNA分子。反向末端重复序列(ITR)位于独特的编码非结构复制(rep)蛋白和结构蛋白(VP)的编码核苷酸序列的侧翼。所述VP蛋白(VP1、VP2和VP3)构成衣壳。末端的145nt是自身互补和有序的从而可形成一个能量上稳定的形成T形发夹的分子内双链。这些发夹结构的功能是病毒DNA复制的起点,用作细胞DNA聚合酶复合物的引物。在wtAAV感染哺乳动物细胞后,Rep基因(即Rep78和Rep52)分别从P5启动子和P19启动子表达,所表达的两种Rep蛋白都在该病毒基因组的复制中起作用。该Rep ORF中的剪接事件实际上导致四种Rep蛋白(即Rep78、Rep68、Rep52和Rep40)的表达。然而,编码Rep78和Rep52的未剪接的mRNA在哺乳动物细胞中足以产生AAV载体。在昆虫细胞中Rep78和Rep52蛋白也足以产生AAV载体。
在本申请中,术语"AAV载体"或"rAAV载体"通常是指包含一个或多个侧翼为细小病毒或AAV反转末端重复序列(ITR)的目的多核苷酸序列、目的基因或"转基因"的载体。
在本申请中,术语"可操作地连接"是指多核苷酸(或多肽)元件在一种功能关系上的连接。当一段核酸被置于与另一段核酸序列具有一种功能关系的位置时,它就是"可操作地连接"的。例如,如果一段转录调控序列影响一段编码序列的转录,则它就与所述编码序列可操作地连接。可操作地连接意味着,相连接的DNA序列通常是连续的,并在有必要将两段蛋白编码区域连接起来时,所述相连接的DNA序列是连续的且在阅读框中。
在本申请中,术语"表达控制序列"通常是指一段调控与之可操作地相连的一段核苷酸序列表达的核酸序列。当一段表达控制序列控制和调控一段核苷酸序列的转录和/或翻译时,所述表达控制序列就与所述核苷酸序列"可操作地连接"。因此,一段表达控制序列可包括启动子、增强子、内部核糖体进入位点(IRES)、转录终止子、蛋白编码基因前的起始密码子、内含子剪接信号和终止密码子。术语"表达控制序列"在最低限度上意图包括一段为了影响表达而存在的序列,也可包括其他有利组件。例如,前导序列和融合伙伴序列(fusion partner sequence)是表达控制序列。该术语还可包括将框内外不想要的可能的起始密码子从所述序列中除去的核酸序列设计。其还可包括将不想要的可能的剪接位点除去的核酸序列设计。其包括指导添加polyA尾的序列或多聚腺苷酸化序列(pA),所述polyA尾即位于mRNA的3'末端的一串腺嘌呤残基,该序列被称为polyA序列。其还可被设计成可增加mRNA的稳定性。已知昆虫细胞中存在影响转录和翻译稳定性的表达控制序列如启动子以及实现翻译的序列如Kozak序列。表达控制序列具有调节与之可操作地连接的核苷酸序列从而降低或提高表达水平的性质。
在本申请中,术语"启动子(promoter)"或"转录调控序列"通常是指这样一段核酸片段,所述核酸片段具有控制一种或多种编码序列的转录的作用,它位于所述编码序列的转录起始位点的转录方向上游,并且可通过存在的DNA依赖性RNA聚合酶结合位点、转录起始位点和任何其他DNA序列来进行结构性识别,所述其他DNA序列包括但不限于转录因子结合位点、抑制子和激活子蛋白结合位点和本领域技术人员已知的可直接或间接起到调控启动子转录量作用的任何其他核苷酸序列。"组成型"启动子是一种在大多数生理和发育条件下在大多数组织中具有活性的启动子。"可诱导"启动子为例如通过使用化学诱导物来进行生理或发育调控的启动子。"组织特异性"启动子仅在特定的组织或细胞类型中具有活性。
在本申请中,术语“强启动子(strong promoter)”通常指对RNA聚合酶有很高亲和力的启动子,它能指导合成大量的mRNA,即可以高效启动DNA转录的启动子。哺乳动物强启动子包括CMV启动子、CAG启动子、EF1a启动子、SV40启动子等。昆虫细胞强启动子包括p10启动子、polh启动子、IE1启动子等。以说明书中昆虫细胞--杆状病毒表达系统中p10启动子为例:p10启动子(p10 promoter),是来自于苜蓿银纹夜蛾核多角体病毒(AcMNPV)中晚期表达的p10启动子,是一段可以驱动目的基因在昆虫细胞中高表达的序列。
在本申请中,术语“线性双链无末端的DNA(no end DNA,neDNA)”通常指一种线性、双链、封闭末端DNA的载体,其两端通过AAV基因组的反向末端重复序列(ITRs)闭合。neDNA载体具有共价封闭的,因此对核酸外切酶(如核酸外切酶I或核酸外切酶III)具有抵抗力。neDNA可以具有多种构型,如:单体,二聚体,三聚体及多聚体等。
在本申请中,术语“载体”或“构建体”通常是用于将过客核酸序列(即DNA或RNA)转移至宿主细胞的核酸分子(一般是DNA或RNA)。三种常见类型的载体包括质粒、噬菌体和病毒。载体优选为病毒。同时含启动子和多核苷酸可以可操作地连接于其中的克隆位点的载体是本领域中公知的。这类载体能够在体外或体内转录RNA,可市购自诸如Stratagene(LaJolla,Calif.)和PromegaBiotech(Madison,ffis.)等供应商。为了优化表达和/或体外转录,需要去除、添加或改变所述克隆的5'和/或3'非翻译部分以除去额外的可能不合适的可变翻译起始密码子或可在转录或翻译水平干涉或减少表达的其他序列。
在本申请中,术语“病毒载体”通常是指包含下列中的一些或全部的载体编码基因产物的病毒基因、控制序列和病毒包装序列。
在本申请中,“细小病毒载体”可定义为包含将送递至宿主细胞(在体内(invivo)、离体(ex vivo)或在体外(in vitro))中的多核苷酸的重组产生的细小病毒或细小病毒颗粒。细小病毒载体的实例包括例如腺相关病毒载体。
在本申请中,术语“杆状病毒昆虫细胞表达系统”或“BEVS”(Baculovirusexpression vector system)通常是指一种表达外源蛋白的真核表达系统。当前应用最广的杆状病毒表达体系是Autographa california multiply enveloped nuclearpolyhedrosisvirus(AcMNPV)的裂解病毒,简称为杆状病毒(baculovirus)。这类载体的特点是:杆状病毒表达体系全部使用存在于高等真核细胞内的蛋白质修饰、加工和转运体系,属于真核表达体系;AcMNPV是非辅助病毒,不需任何辅助因素即可适宜悬浮生长的昆虫细胞内大量增殖,因此便于大量地表达重组蛋白质;该表达体系使表达产物呈溶解态;杆状病毒的基因很大(130kb),适合克隆大片段外源基因。杆状病毒不感染脊椎动物病毒启动子在哺乳动物细胞中无活性。
在本申请中,术语“Bacmid”或“杆粒”通常是指能在昆虫细胞和大肠杆菌之间穿梭的杆状病毒重组DNA,该名称取自Baculovirus和plasmid。
在本申请中,术语"基本上同一"、"基本同一"或"基本上相似"或"基本相似"通常是指,当两个肽序列或两个核苷酸序列在例如用缺省参数通过GAP或BESTFIT程序进行最佳比对时,它们至少共有某一百分比的序列同一性,所述序列同一性如说明书其他部分所定义。GAP采用Needleman和Wunsch全序列比对算法对两个全长序列进行比对,并使匹配数最大,使空位数最小。通常采用GAP缺省参数,其空位生成罚分=50(核苷酸)/8(蛋白质)以及空位延长罚分=3(核苷酸)/2(蛋白质)。针对核苷酸,采用的缺省计分矩阵为nwsgapdna,针对蛋白质采用的缺省计分矩阵为Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。当RNA序列被认为与DNA序列基本类似或具有一定程度的序列同一性时,可认为DNA序列中的胸腺嘧啶⑴相当于RNA序列中的尿嘧啶(U),这一点已经很清楚。可以利用计算机程序通过序列比对和计分来确定序列同一性百分比。或者,还可通过检索数据库例如FASTA、BLAST等来确定相似性或同一性百分比。
在本申请中,术语“包含(comprise)”及其变形如“包含(comprises)”和“包含(comprising)”通常是指包括所述整数或步骤或者整数或步骤的组,但不排除任意其它整数或步骤或者整数或步骤的组。本文所用术语“包含”又可用术语“含有”或“包括”替代,或本文所用术语有时可用术语“具有”替代。
必须注意的是,除非上下文另外清楚地指出,否则如本说明书和所附权利要求书中所使用,单数形式“一个/一种(a/an)”和“该”包括复数指示物。术语“一个/一种”以及术语“一个或多个/一种或多种”和“至少一个/至少一种”可以在此互换使用。
发明详述
分离的核酸分子
一方面,本申请提供了一种分离的核酸分子,其包含SEQ ID NO:12所示的核苷酸序列。
在某些实施方式中,所述的分离的核酸分子编码腺相关病毒(AAV)Rep52蛋白。
本申请的Rep52序列密码子是经优化的,优化后,避免了Rep78和Rep52发生同源重组。密码子优化可基于在密码子使用数据库(参见如http://www.kazusa.or.jp/codon/)中找到的草地贪夜蛾生物体的密码子使用进行,也可从从NCBI数据库中提取Sf9昆虫细胞转录组测序数据,手工完成提取密码子偏好性适应指数等参数。合适的用于密码子优化的计算机程序是本领域技术人员可获得的(参见如Anders Fuglsang,2003,ProteinExpression and Purification 31:247-249;Jayaraj et al.,2005,Nucl.Acids Res.33(9):3011-3016;Chin et al.,2014 Bioinformatics 30(15)2210-2212以及在互联网上)。或者,所述优化可使用相同的密码子使用数据库手工完成。为避免同源重组,选取连续碱基的核苷酸序列是相同数小于等于30,同源性小于等于85%的候选序列,进行后续实验验证,最终获得Rep52密码子优化序列。
Rep52-WT的核酸序列如SEQ ID NO:13所示,Rep52-CO的核酸序列如SEQ ID NO:12所示,Rep52-WT与Rep52-CO密码子优化前后对比如图8所示。
另一方面,本申请提供了一种分离的核酸分子,其包含编码所述编码腺相关病毒(AAV)Rep78蛋白的核苷酸序列和编码Rep52蛋白的核苷酸序列,其中所述编码Rep52蛋白的核酸分子包含SEQ ID NO:12所示的核苷酸序列。
在某些实施方式中,其中所述编码Rep78蛋白的核苷酸序列为野生型。
在某些实施方式中,其中所述编码Rep78蛋白的核酸分子包含SEQ ID NO:11所示的核苷酸序列。
在某些实施方式中,其还包括启动所述编码AAV Rep78蛋白的核苷酸序列转录的第一启动子和启动所述编码AAV Rep52蛋白的核酸分子的第二启动子,所述第一启动子与第二启动子相同或不同。
在某些实施方式中,与所述第二启动子相比,所述第一启动子具有相同或更高的转录启动能力。
在某些实施方式中,其中所述第一启动子包括p10启动子。
在某些实施方式中,其中所述第一启动子包括全长p10启动子。
在某些实施方式中,其中所述第一启动子包含SEQ ID NO:9所示的核苷酸序列。
在某些实施方式中,其中所述第二启动子包括Polyhedrin(polh)启动子。
在某些实施方式中,其中所述第二启动子包含SEQ ID NO:10所示的核苷酸序列。
在某些实施方式中,其中所述第一启动子和第二启动子的转录方向相同或相反。
在某些实施方式中,其中所述第一启动子与所述编码Rep78蛋白的核苷酸序列可操作地连接,第二启动子与所述编码Rep52蛋白的核苷酸序列可操作地连接。
在某些实施方式中,当第一启动子和第二启动子的转录方向相同时,其依次包含第一启动子、编码Rep78蛋白的核苷酸序列、第二启动子和编码Rep52蛋白的核苷酸序列。
在某些实施方式中,其中所述编码Rep78蛋白的核苷酸序列和编码Rep52蛋白的核苷酸序列下游还分别包含编码polyA的核苷酸序列(pA)。
在某些实施方式中,当第一启动子和第二启动子的转录方向相同时,其依次包含第一启动子、编码Rep78蛋白的核苷酸序列、第一pA、第二启动子、编码Rep52蛋白的核苷酸序列和第二pA。
在某些实施方式中,当第一启动子和第二启动子的转录方向相反时,其依次包含编码Rep78的核苷酸序列、第一启动子、第二启动子、编码Rep52的核苷酸序列,其中所述第一启动子启动所述编码Rep78蛋白的核苷酸序列的转录,所述第二启动子启动所述编码Rep52蛋白的核苷酸序列的转录。
在某些实施方式中,其中所述第一启动子的5’端与第二启动子的5’端直接或间接连接。
在某些实施方式中,其中所述第一启动子的3’端与所述编码Rep78的核苷酸序列的5’端直接或间接连接。
在某些实施方式中,其还包含第一pA,其中所述编码Rep78蛋白的核苷酸序列的3’端与所述编第一pA的5’端直接或间接连接。
在某些实施方式中,其中所述第二启动子的3’端与所述编码Rep52的核苷酸序列的5’端直接或间接连接。
在某些实施方式中,其还包含第二pA,其中所述编码Rep52蛋白的核苷酸序列的3’端与所述编第二pA的5’端直接或间接连接。
在某些实施方式中,其中所述pA选自:SV40 polyA和HSV TK polyA中的任意一种。
在某些实施方式中,所述的分离的核酸分子包含SEQ ID NO:8所示的核苷酸序列。
另一方面,本申请提供一种分离的核酸分子,其依次包含第一polyA(pA)、编码Rep78蛋白的核苷酸序列、第一启动子、第二启动子、编码Rep52的蛋白核苷酸序列和第二polyA(pA),其中所述第一启动子为编码Rep78蛋白的核苷酸序列和第一pA的转录启动子,所述第二启动子为编码Rep52蛋白的核苷酸序列和第二polyA的转录启动子,其中所述编码Rep52蛋白的核苷酸序列和/或所述编码Rep78蛋白的核苷酸序列的序列经过密码子优化以避免同源重组,所述第一启动子比第二启动子具有相同或更高的转录启动能力。
与所述第二启动子相比,具有相同或更高的转录启动能力的第一启动子可被定义如下。所述启动子的强度可通过在用于本申请方法的条件下获得的表达确定。
在某些实施方式中,所述第一启动子或第二启动子选自polh启动子、p10启动子、碱性蛋白启动子、一种诱导型启动子或IE1启动子,或任何其他晚期或极晚期杆状病毒基因启动子。
在一个实施方式中,第一启动子为p10启动子,第二启动子为polh启动子。在在另一个实施方案中,本发明核酸构建体中的第一启动子为polh启动子,第二启动子为IE1启动子。在另一个实施方案中,本发明核酸构建体中的第一启动子为pl0启动子,第二启动子为IE1启动子。在另一个实施方案中,本发明核酸构建体中的第一启动子为polh启动子,第二启动子为polh启动子。
在某些实施方式中,其中所述第一启动子包括p10启动子。
在某些实施方式中,其中所述第一启动子包含SEQ ID NO:9所示的核苷酸序列。
在某些实施方式中,其中所述第二启动子包括Polyhedrin启动子。
在某些实施方式中,其中所述第二启动子包含SEQ ID NO:10所示的核苷酸序列。
载体和表达系统
另一方面,本申请提供一种载体,其包含本申请所述的分离的核酸分子。
在某些实施方式中,所述载体适用于在昆虫细胞中表达和/或复制。
在某些实施方式中,所述载体包括病毒载体。
在某些实施方式中,所述载体包括杆状病毒载体,例如,所述载体可以是pFastBac载体
在某些实施方式中,所述的载体包含SEQ ID NO:14所示的核苷酸序列或与SEQ IDNO:14具有至少50%、60%、70%、80%、81%、82%、85%、90%、95%、97%、98%或99%的序列同一性的核苷酸序列。
另一方面,本申请提供一种细胞,其包含本申请所述的分离的核酸分子或本申请所述的载体。
在某些实施方式中,所述细胞包括昆虫细胞。例如,所述细胞可以是Sf9细胞。
另一方面,本申请提供一种杆状病毒表达系统,其包含第一杆状病毒载体以及包含编码目的基因的核酸序列的第二杆状病毒载体,所述第一杆状病毒载体为本申请所述的杆状病毒载体。
在某些实施方式中,自5’端至3’端,所述编码目的基因的核酸序列其依次包含第一细小病毒的反向末端重复序列(ITR)、目的基因和第二ITR。
在某些实施方式中,所述目的基因包含至少一个编码在哺乳动物细胞中表达的目的基因产物的核苷酸序列。
在某些实施方式中,其中所述第一ITR与目的基因之间包含至少一个启动子。
在某些实施方式中,其中所述第一ITR与目的基因之间包含至少一个真核启动子。
在某些实施方式中,其中所述第一ITR与目的基因之间包含至少一个哺乳动物细胞启动子。
在某些实施方式中,至少一个编码在哺乳动物细胞中表达的目的基因产物的核苷酸序列,与至少一个哺乳动物细胞相容的表达控制序列例如启动子可操作地连接。本领域已知许多这类启动子。可使用在许多种细胞中广泛表达的构成型启动子,例如CMV启动子。在另一些实施方式中,所述启动子是诱导型的、组织特异的、细胞种类特异的或细胞周期特异的。例如,对于肝脏特异性表达,启动子可选自a 1-抗胰蛋白酶启动子、甲状腺激素结合球蛋白启动子、白蛋白启动子、LPS(甲状腺素结合球蛋白)启动子、HCR-Ap0CII杂交启动子、HCR-hAAT杂交启动子和载脂蛋白E启动子。其他实例包括用于肿瘤选择性一特别是神经细胞肿瘤选择性一表达的E2F启动子(Parr et al.,1997,Nat.Med.3:1145-9)或用于在单核血细胞中使用的IL-2启动子(Hagenbaugh et al.,1997,J Exp Med;185:2101-10)。
在某些实施方式中,其中所述第一ITR与目的基因之间包含一个哺乳动物细胞启动子和一个昆虫细胞启动子。
在某些实施方式中,其中所述哺乳动物细胞启动子包括CMV启动子。
在某些实施方式中,其中所述昆虫细胞启动子包括p10启动子。
在某些实施方式中,所述启动子包括CMV和p10启动子。
昆虫细胞
另一方面,本申请提供一种含有编码第一氨基酸序列的第一核苷酸序列和编码第二氨基酸序列的第二核苷酸序列的昆虫细胞,其中所述第一核苷酸序列包含编码Rep78蛋白的核苷酸序列,所述第二核苷酸序列编码Rep52蛋白的核苷酸序列,其中所述第一核苷酸序列包含SEQ ID NO:11所示的核苷酸序列或与SEQ ID NO:11具有至少50%、60%、70%、80%、81%、82%、85%、90%、95%、97%、98%或99%的序列同一性的核苷酸序列,第二核苷酸序列包含SEQ ID NO:12所示的核苷酸序列或与SEQ ID NO:12具有至少50%、60%、70%、80%、81%、82%、85%、90%、95%、97%、98%或99%的序列同一性的核苷酸序列。
例如,所用细胞系可来自草地夜蛾(Spodopterafrugiperda)、果蝇细胞系,或蚊子细胞系,例如白纹伊蚊(Aedesalbopictu)衍生细胞系。优选的昆虫细胞或细胞系是来自易被杆状病毒感染的昆虫种类的细胞,包括例如Se301、SeIZD2109、SeUCRU Sf9,Sf900+、Sf21、BT1-TN-5Bl-4、MG-l、Tn368、HzAml、Ha2302、Hz2E5、High Five(Invitrogen,CA,USA)和(US 6,103,526;Protein Sciences Corp.,CT,USA)。
在某些实施方式中,其中所述第一和第二核苷酸序列是一个核酸构建体的一部分,其中所述第一和第二核苷酸序列每个都与用于昆虫细胞表达的表达控制序列可操作地连接。
在某些实施方式中,其中所述昆虫细胞还包含:一段含有至少一段细小病毒反向末端重复(ITR)核苷酸序列的第三核酸序列。
在本申请中,术语"细小病毒ITR"通常被理解意为一个回文序列,其含有大部分互补、对称排列的也称为和"C"区的序列。所述ITR的功能为复制起点——一个在复制中具有"顺式"作用的位点,即作为反式作用复制蛋白如Rep78(或Rep68)的识别位点,所述反式作用复制蛋白识别所述回文结构和所述回文结构内部的特异序列。所述ITR序列对称性的一个例外是所述ITR的"D"区。它是独特的(在一个ITR内无互补序列)。单链DNA的切开发生在A区和D区之间的结合处。它是新DNA合成起始的区域。D区通常位于所述回文结构的一侧并为核酸复制步骤提供方向性。在哺乳动物细胞中复制的细小病毒通常含有两个ITR序列。然而,可以设计一种ITR使结合位点在A区和D区的两条链上对称分布,所述回文结构的每侧各一个。因此在双链环形DNA模板(如质粒)上,Rep78或Rep68辅助的核酸复制在两个方向上进行,且单一ITR序列足以进行环形载体的细小病毒复制。因此,一个ITR核苷酸序列可用于本发明的上下文中。然而,优选地,使用两个或其他偶数个规则的ITR。最优选地,使用两个ITR序列。在一个实施方式中,所述细小病毒ITR是AAV ITR。
在某些实施方式中,其中所述第三核苷酸序列还含有至少一个编码目的基因的核苷酸序列。
在某些实施方式中,其中所述第三核苷酸序列含有两个细小病毒ITR核苷酸序列,且其中所述至少一个编码目的基因的核苷酸序列位于所述两个细小病毒ITR核苷酸序列之间。
在某些实施方式中,其中所述第三核苷酸序列是另一个核酸构建体的一部分,其中所述每个编码目的基因的核苷酸序列都与用于哺乳动物表达的表达控制序列可操作地连接。
在某些实施方式中,所述核酸构建体为昆虫细胞相容的载体。
在本申请中,术语"昆虫细胞相容载体"通常被理解为一种能够生产性转化或转染昆虫或昆虫细胞的核酸分子。生物载体的实例包括质粒、线性核酸分子和重组病毒。只要与昆虫细胞相容,任何载体都可被使用。所述载体可整合到所述昆虫细胞基因组中但所述载体也可为游离的。所述载体在所述昆虫细胞中并不需永久存在,也包括瞬时游离载体。可通过任何已知的方法例如通过所述细胞的化学处理、电穿孔或感染引入所述载体。在一些实施方案中,所述载体是一种杆状病毒、一种病毒载体或一种质粒。例如,所述载体可以是一种杆状病毒,即所述构建体是一种杆状病毒载体。
在某些实施方式中,所述核酸构建体为杆状病毒载体。
在某些实施方式中,所述昆虫细胞包含本申请所述的杆状病毒载体。
例如,所述昆虫细胞可以包含2种不同的杆状病毒,分别为∶①Bac-Rep∶含有rAAV的Rep52和Rep78,分别由多角体蛋白启动子(Polyhedrin promotor)和p10启动子调控;②Bac-Transgene∶含有由rAAV末端重复序列包裹的转基因,由哺乳动物巨细胞病毒(CMV)启动子调控。
又例如,所述昆虫细胞可以包含2种不同的杆状病毒,分别为∶①Bac-Rep∶含有rAAV的Rep52和Rep78,分别由多角体蛋白启动子(Polyhedrin promotor)和p10启动子调控;②Bac-Transgene∶含有由rAAV末端重复序列包裹的转基因,由昆虫p10和哺乳动物巨细胞病毒(CMV)启动子共同调控。
在某些实施方式中,所述编码目的基因的核苷酸序列,其位置使其可整合到在昆虫细胞中复制的neDNA中。任何核苷酸序列都可被整合,以随后在用根据本发明产生的neDNA转染的哺乳动物细胞中表达。可编码例如一个可表达出RNAi试剂的核苷酸序列,即能够进行RNA干扰的RNA分子,例如shRNA(短发夹RNA)或siRNA(短干扰RNA)。
在某些实施方式中,所述编码目的基因的核苷酸序列,可编码转座子系统的转座酶或缺陷转座子,转座子系统包括但不限于Sleeping Beauty转座子和piggyBac转座子。
在某些实施方式中,所述编码目的基因的核苷酸序列,可编码基因编辑器或用于基因编辑介导同源重组的DNA模版,基因编辑系统包括但不限于CRISPR、TALEN和各类单碱基基因编辑器。
在哺乳动物细胞中表达的目的产物可以是治疗用基因产物。治疗用基因产物可以是多肽或RNA分子(siRNA)或其他基因产物,所述其他基因产物在靶细胞中表达时可提供想要的治疗效果,例如消除不想要的活性,如除去感染的细胞或补足基因缺陷(如导致酶活缺失的缺陷)。治疗用多肽基因产物的实例包括CFTR、IX因子、VIII因子、PAH、脂蛋白脂肪酶(LPL,优选为LPLS447X;参见WO 01/00220)、载脂蛋白Al、尿苷二磷酸葡萄糖醛酸转移酶(UGT)、视网膜色素变性GTP酶调节因子相互作用蛋白(RP-GRIP)和细胞因子或白细胞介素例如IL-10。在某些实施方式中,所述治疗用基因产物的实例包括编码治疗用抗体的多肽基因治疗产物。在某些实施方式中,所述治疗用基因产物的实例包括编码可诱导激活体内体液免疫反应或细胞免疫反应用于治疗传染性疾病和肿瘤的抗原。
此外,所述的第三核苷酸序列还可含有编码用作标记蛋白的多肽的核苷酸序列,以测定细胞转化和表达。用于此目的的合适的标记蛋白为例如荧光蛋白GFP、荧光素酶(Luciferase)、选择性标记基因HSV胸苷激酶(用于HAT培养基上的选择)、细菌潮霉素B磷酸转移酶(用于对潮霉素B的选择)、Tn5氨基糖苷磷酸转移酶(用于对G418的选择)和二氢叶酸还原酶(DHFR)(用于对甲氨蝶呤的选择)、CD20(低亲和性神经生长因子基因)。获得这些标记基因的来源和其使用方法见Sambrook andRussel(2001)"Molecular Cloning:ALaboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,New York。
另外,本文上面定义的第三核苷酸序列可含有编码可用作故障保险机制的多肽的核苷酸序列,在认为必要时,所述多肽使得可以用由本发明的neDNA转导的细胞来治愈受试者。这种通常被称为自杀基因的核苷酸序列编码能够将前药转变为有毒物质的蛋白,所述有毒物质能够杀死所述蛋白在其中表达的转基因细胞。这种自杀基因的合适的实例包括例如大肠杆菌(E.coli)胞嘧啶脱氨酶基因或单纯疱疹病毒、巨细胞病毒和水痘带状疱疹病毒的胸苷激酶基因之一,在这些实例中,更昔洛韦可用作杀死受试者中转基因细胞的前药(参见例如Clair et al.1987,Antimicrob.Agents Chemother.31:844-849)。
在另一个实施方案中,一个目的基因产物可以是AAV蛋白。特别是Rep蛋白,如Rep78和/或Rep52,或其功能片段。Rep78和/或Rep52在ne DNA转导或感染的哺乳动物细胞中的表达,可通过允许经所述重组细小病毒(rAAV)载体引入细胞的其他目的基因产物长期或永久地表达,而有利于所述载体的某些应用。
用途
另一方面,本申请提供了本申请所述的杆状病毒表达系统或本申请所述的昆虫细胞在制备目的核酸分子中的应用。
在某些实施方式中,其中所述目的核酸分子为具有共价封闭末端的线性DNA分子(neDNA)。
另一方面,本申请提供了一种目的核酸分子的制备方法,包括培养本申请所述的昆虫细胞。
在某些实施方式中,所述的制备方法包括:
1)提供本申请所述的杆状病毒表达系统;
2)将目的基因序列插入所述第二杆状病毒载体;
3)将第一杆状病毒载体和第二杆状病毒载体共转染至昆虫细胞;
4)使所述昆虫细胞在允许包含目的基因的DNA复制和释放的条件下生长;
5)收集目的核酸分子。
在某些实施方式中,所述方法还保护分离所述目的核酸分子。
在具体的操作中,首先将2种杆状病毒分别感染草地贪夜蛾(Spodopterafrugiperda,Sf9)细胞分别进行扩增,将纯化后的2种杆状病毒共感染的昆虫生产细胞悬浮培养。在生产过程中定期检测被感染的细胞量、成活率和ne DNA产量等参数以优化生产工艺。在最佳时间段收获细胞并提取和提纯neDNA,之后检测neDNA的产量和质量。
另一方面,本申请提供了一种试剂盒,其包含本申请所述的分离的核酸分子、本申请所述的杆状病毒表达系统和/或本申请所述的昆虫细胞。
本申请还提供了以下具体实施方式:
1.分离的核酸分子,其包含SEQ ID NO:12所示的核苷酸序列。
2.根据实施方式1所述的分离的核酸分子,其编码腺相关病毒(AAV)Rep52蛋白。
3.分离的核酸分子,其包含编码所述编码腺相关病毒(AAV)Rep78蛋白的核苷酸序列和编码Rep52蛋白的核苷酸序列,其中所述编码Rep52蛋白的核酸分子包含SEQ ID NO:12所示的核苷酸序列。
4.根据实施方式3所述的分离的核酸分子,其中所述编码Rep78蛋白的核苷酸序列为野生型。
5.根据实施方式3所述的分离的核酸分子,其中所述编码Rep78蛋白的核酸分子包含SEQ ID NO:11所示的核苷酸序列。
6.根据实施方式3-5中任一项所述的分离的核酸分子,其还包括启动所述编码AAVRep78蛋白的核苷酸序列转录的第一启动子和启动所述编码AAV Rep52蛋白的核酸分子的第二启动子,所述第一启动子与第二启动子相同或不同。
7.根据实施方式6所述的分离的核酸分子,所述第一启动子和第二启动子包括昆虫细胞启动子。
8.根据实施方式6-7中任一项所述的分离的核酸分子,所述第一启动子包括强启动子。
9.根据实施方式6-8中任一项所述的分离的核酸分子,与所述第二启动子相比,所述第一启动子具有相同或更高的转录启动能力。
10.根据实施方式6-9中任一项所述的分离的核酸分子,其中所述第一启动子和第二启动子各自独立地选自:p10启动子、Polyhedrin(polh)启动子和IE1启动子。
11.根据实施方式6-10中任一项所述的分离的核酸分子,其中所述第一启动子和第二启动子的转录方向相同或相反。
12.根据实施方式6-11中任一项所述的分离的核酸分子,其中所述第一启动子与所述编码Rep78蛋白的核苷酸序列可操作地连接,第二启动子与所述编码Rep52蛋白的核苷酸序列可操作地连接。
13.根据实施方式11-12中任一项所述的分离的核酸分子,当第一启动子和第二启动子的转录方向相同时,其依次包含第一启动子、编码Rep78蛋白的核苷酸序列、第二启动子和编码Rep52蛋白的核苷酸序列。
14.根据实施方式13所述的分离的核酸分子,其中所述编码Rep78蛋白的核苷酸序列和所述编码Rep52蛋白的核苷酸序列下游还分别包含编码polyA的核苷酸序列(pA)。
15.根据实施方式14所述的分离的核酸分子,当第一启动子和第二启动子的转录方向相同时,其依次包含第一启动子、编码Rep78蛋白的核苷酸序列、第一pA、第二启动子、编码Rep52蛋白的核苷酸序列和第二pA。
16.根据实施方式11-12中任一项所述的分离的核酸分子,当第一启动子和第二启动子的转录方向相反时,其依次包含编码Rep78的核苷酸序列、第一启动子、第二启动子、编码Rep52的核苷酸序列,其中所述第一启动子启动所述编码Rep78蛋白的核苷酸序列的转录,所述第二启动子启动所述编码Rep52蛋白的核苷酸序列的转录。
17.根据实施方式16所述的分离的核酸分子,其中所述第一启动子的5’端与第二启动子的5’端直接或间接连接。
18.根据实施方式17所述的分离的核酸分子,其中所述第一启动子的3’端与所述编码Rep78的核苷酸序列的5’端直接或间接连接。
19.根据实施方式18所述的分离的核酸分子,其还包含第一pA,其中所述编码Rep78蛋白的核苷酸序列的3’端与所述编第一pA的5’端直接或间接连接。
20.根据实施方式16所述的分离的核酸分子,其中所述第二启动子的3’端与所述编码Rep52的核苷酸序列的5’端直接或间接连接。
21.根据实施方式20所述的分离的核酸分子,其还包含第二pA,其中所述编码Rep52蛋白的核苷酸序列的3’端与所述编第二pA的5’端直接或间接连接。
22.根据实施方式14-21中任一项所述的分离的核酸分子,其中所述pA选自:SV40polyA和HSV TK polyA中的任意一种。
23.根据实施方式3-22中任一项所述的分离的核酸分子,其包含SEQ ID NO:8所示的核苷酸序列。
24.分离的核酸分子,其依次包含第一polyA(pA)、编码Rep78蛋白的核苷酸序列、第一启动子、第二启动子、编码Rep52的蛋白核苷酸序列和第二polyA(pA),其中所述第一启动子为编码Rep78蛋白的核苷酸序列和第一pA的转录启动子,所述第二启动子为编码Rep52蛋白的核苷酸序列和第二polyA的转录启动子,其中所述编码Rep52蛋白的核苷酸序列和/或所述编码Rep78蛋白的核苷酸序列的序列经过密码子优化以避免同源重组,所述第一启动子和第二启动子包括昆虫细胞启动子,所述第一启动子是强启动子。
25.根据实施方式24所述的分离的核酸分子,其中所述第一启动子包括p10启动子、polh启动子或IE1启动子。
26.根据实施方式25所述的分离的核酸分子,其中所述p10启动子包含SEQ ID NO:9所示的核苷酸序列。
27.根据实施方式24所述的分离的核酸分子,其中所述第二启动子包括p10启动子、polh启动子或IE1启动子。
28.根据实施方式27所述的分离的核酸分子,其中所述polh启动子包含SEQ IDNO:10所示的核苷酸序列。
29.载体,其包含实施方式1-28中任一项所述的分离的核酸分子。
30.根据实施方式29所述的载体,所述载体包括病毒载体。
31.根据实施方式29所述的载体,所述载体包括杆状病毒载体。
32.根据实施方式29所述的载体,所述载体包括pFastBac载体。
33.根据实施方式29-32中任一项所述的载体,其包含SEQ ID NO:14所示的核苷酸序列。
34.细胞,其包含实施方式1-28中任一项所述的分离的核酸分子或实施方式29-33中任一项所述的载体。
35.根据实施方式34所述的细胞,所述细胞包括昆虫细胞。
36.根据实施方式35所述的细胞,所述细胞包括Spodoptera frugiperda(Sf9)细胞。
37.杆状病毒表达系统,其包含第一杆状病毒载体以及包含编码目的基因的核酸序列的第二杆状病毒载体,所述第一杆状病毒载体为实施方式31-33中任一项所述的杆状病毒载体。
38.根据权利要37所述的杆状病毒表达系统,自5’端至3’端,所述编码目的基因的核酸序列其依次包含第一细小病毒的反向末端重复序列(inverted terminal repeat,ITR)、目的基因和第二ITR。
39.根据实施方式38中任一项所述的杆状病毒表达系统,其中所述第一ITR与目的基因之间还包含至少一个启动子。
40.根据实施方式38-39中任一项所述的杆状病毒表达系统,其中所述第一ITR与目的基因之间还包含至少一个真核启动子。
41.根据实施方式38-40中任一项所述的杆状病毒表达系统,其中所述第一ITR与目的基因之间还包含至少一个哺乳动物细胞启动子。
42.根据实施方式38-41中任一项所述的杆状病毒表达系统,其中所述第一ITR与目的基因之间还包含一个哺乳动物细胞启动子和一个昆虫细胞启动子。
43.根据实施方式42中任一项所述的杆状病毒表达系统,其中所述哺乳动物细胞启动子包括广泛性启动子和组织特异性启动子。
44.根据实施方式43所述的杆状病毒表达系统,其中所述广泛性启动子包括CMV、SV40、EF1a、CAG或UBC启动子。
45.根据实施方式43所述的杆状病毒表达系统,其中所述组织特异性启动子包括ALB、hAAT、TBG,TTR、GFAP、MHCK7或hSyn启动子。
46.根据实施方式42-25中任一项所述的杆状病毒表达系统,其中所述昆虫细胞启动子包括p10启动子。
47.根据实施方式42-26中任一项所述的杆状病毒表达系统,所述启动子包括CMV和p10启动子。
48.含有编码第一氨基酸序列的第一核苷酸序列和编码第二氨基酸序列的第二核苷酸序列的昆虫细胞,其中所述第一核苷酸序列包含编码Rep78蛋白的核苷酸序列,所述第二核苷酸序列编码Rep52蛋白的核苷酸序列,其中所述第一核苷酸序列包含SEQ ID NO:11所示的核苷酸序列,第二核苷酸序列包含SEQ ID NO:12所示的核苷酸序列。
49.根据实施方式48所述的昆虫细胞,其中所述第一和第二核苷酸序列是一个核酸构建体的一部分,其中所述第一和第二核苷酸序列每个都与用于昆虫细胞表达的表达控制序列可操作地连接。
50.根据实施方式48-49中任一项所述的昆虫细胞,其中所述昆虫细胞还包含:一段含有至少一段细小病毒反向末端重复核苷酸序列(inverted terminal repeat,ITR)的第三核酸序列。
51.根据实施方式50所述的昆虫细胞,其中所述第三核苷酸序列还含有至少一个编码目的基因的核苷酸序列。
52.根据实施方式50-51中任一项所述的昆虫细胞,其中所述第三核苷酸序列含有两个细小病毒ITR核苷酸序列,且其中所述至少一个编码目的基因的核苷酸序列位于所述两个细小病毒ITR核苷酸序列之间。
53.根据实施方式52所述的昆虫细胞,其中所述细小病毒包括腺相关病毒。
54.根据实施方式51-53中任一项所述的昆虫细胞,其中所述第三核苷酸序列是另一个核酸构建体的一部分,其中所述每个编码目的基因的核苷酸序列都与用于哺乳动物表达的表达控制序列可操作地连接。
55.根据实施方式49-54中任一项所述的昆虫细胞,所述核酸构建体为昆虫细胞相容的载体。
56.根据实施方式55所述的昆虫细胞,所述核酸构建体为杆状病毒载体。
57.根据实施方式48-56任一项所述的昆虫细胞,其包含实施方式31-33任一项所述的杆状病毒载体或实施方式37-47任一项所述的杆状病毒表达系统。
58.实施方式37-47任一项所述的杆状病毒表达系统或实施方式48-57任一项所述的昆虫细胞在制备目的核酸分子中的应用。
59.根据实施方式58所述的应用,其中所述目的核酸分子为具有共价封闭末端的线性DNA分子(neDNA)。
60.一种目的核酸分子的制备方法,包括培养实施方式48-57任一项所述的昆虫细胞。
61.根据实施方式60所述的制备方法,包括:
1)提供实施方式37-47中任一项所述的杆状病毒表达系统;
2)将目的基因序列插入所述第二杆状病毒载体;
3)将第一杆状病毒载体和第二杆状病毒载体共转染至昆虫细胞;
4)使所述昆虫细胞在允许包含目的基因的DNA复制和释放的条件下生长;
5)收集目的核酸分子。
62.根据实施方式62所述的制备方法,还保护分离所述目的核酸分子。
63.一种试剂盒,其包含实施方式1-28任一项所述的分离的核酸分子、实施方式37-47任一项所述的杆状病毒表达系统和/或实施方式48-57任一项所述的昆虫细胞。
不欲被任何理论所限,下文中的实施例仅仅是为了阐释本申请的核酸分子、载体、表达系统、制备方法和用途等,而不用于限制本申请发明的范围。
实施例
实施例1
一、实验方法
本文所述的技术涉及利用昆虫细胞--杆状病毒体系制备一种线性双链无末端的DNA(neDNA)表达载体,所述neDNA载体含有AAV反向末端重复序列(ITRs)和一种基因表达盒(本文以EGFP表达框为例)。使用本文公开的neDNA载体示例性合成方法涉及以下几个主要步骤:
1、载体构建
1.1构建pFastBac-ITR-EGFP供体载体
以质粒pAAV-CMV-p10-EGFP为模板,通过PCR扩增CMV-p10-EGFP序列,上下游引物分别为P1和P2(见表1),通过酶切位点5’BamHI和3’SalI将基因克隆至载体pFastBac-AAV-MCS-PA,构建质粒pFastBac-ITR-EGFP。
其中,pAAV-CMV-p10-EGFP载体通过基因合成CMV-p10序列[SEQ ID No:1],并添加5’KpnI和3’NcoI酶切位点,酶切连接插入pAAV-EGFP载体[SEQ ID No:2]中获得;
pFastBac-AAV-MCS-PA载体通过基因合成ITR-MCS-PA-ITR序列[SEQ ID No:.3],并添加5’KpnI和3’HindIII酶切位点,酶切连接插入pFastBac dual载体[SEQ ID No:4]中获得。
1.2构建pFastBac-ITR-Fluc供体质粒
通过基因合成CpGfreeFluc序列[SEQ ID No:5],并添加5'SalI和3'PmlI酶切位点,酶切连接插入pFastBac-AAV-MCS-PA,构建pFastBac-CpGfreeFluc。
表1:引物序列
引物名称 序列(5’-3’) SEQ ID NO:
P1 GATCCGGTACCACGCGTCTAG 15
P2 CTCGACGTCGACTTTACTTGTACAGC 16
P3 GCGGGGTTTTACGAGATTGTG 17
P4 GGGGTGCCTGCTCAATCAGA 18
P5 GCAGCACACACTGACATCCA 19
P6 GATCACCGGCGCATCAGAATTG 20
P7 ACTTCAAGATCCGCCACAACAT 21
P8 TCTCGTTGGGGTCTTGCTCAG 22
M13F CCCAGTCACGACGTTGTAAAACG 23
M13R AGCGGATAACAATTTCACACAGG 24
1.3构建pFastBac-RepWT和pFastBac-inRep辅助载体
合成基因Rep52WT[SEQ ID No:13],通过5’XmaI和3’NheI将基因克隆至载体pFastBac-Rep,构建质粒pFastBac-RepWT。合成基因inRep[SEQ ID No:6],通过5’BstZ17I和3’SphI将基因克隆至载体pFastBac dual,构建质粒pFastBac-inRep。
1.4 Rep52密码子优化和构建pFastBac-CORep辅助载体
从NCBI数据库提取Sf9昆虫细胞转录组测序数据,抓取密码子偏好性适应指数和密码子背景参数。输入初始Rep52WT序列后,使用密码子优化算法随机产生子代序列,并循环迭代直至结果收敛,获得候选密码子优化基因序列。为避免同源重组,选取连续碱基的核苷酸序列是相同数小于等于30,同源性小于等于85%的候选序列,进行后续实验验证,最终获得Rep52密码子优化序列。
合成基因Rep52密码子优化序列Rep52-CO[SEQ ID No:12],通过5’XmaI和3’NheI将基因克隆至载体pFastBac-Rep,构建质粒pFastBac-CORep。
1.5构建pFastBac-p10Rep辅助载体
常规合成基因p10[SEQ ID No:9],添加5’BstZ17I和3’NotI,将基因通过5’BstZ17I和3’NotI克隆至载体pFastBac-CORep,构建质粒pFastBac-p10Rep。
2、质粒转化DH10 Bac
将供体质粒pFastBac-ITR-EGFP或pFastBac-ITR-Fluc与辅助质粒(pFastBac-RepWT、pFastBac-inRep、pFastBac-CORep或pFastBac-p10Rep质粒)分别转化至DH10 Bac大肠杆菌感受态细胞(索莱宝,货号:C1480)。诱导DH10 Bac细胞中的质粒与Bacmid杆状病毒穿梭质粒之间重组,生成重组Bacmid杆状质粒。DH10 Bac细胞中的Φ80dlacZΔM15基因的产物可以实现β-半乳糖苷酶的α-互补现象,用于在LB固体培养基(卡那霉素(50μg/ml)、四环素(10μg/ml)、庆大霉素(7μg/ml)、IPTG(40μg/ml)和X-gal(100μg/ml))上进行重组Bacmid的蓝白斑筛选;挑选出由破坏β-半乳糖苷酶指示基因的易位所造成的白色单菌落,在LB培养基(卡那霉素(50μg/ml)、四环素(10μg/ml)和庆大霉素(7μg/ml))中进行37℃过夜培养;使用PureLinkTM HiPure Plasimd DNA Miniprep Kit(赛默飞,货号:K2100-02)抽提大肠杆菌中重组Bacmid杆状质粒。
3、PCR鉴定重组Bacmid杆状质粒
使用Bacmid上的通用引物M13F/R(见表1),PCR鉴定重组的Bacmid杆状质粒。PCR扩增的条件为:98℃2min;98℃10s,60℃30s,72℃1min,35个循环;72℃5min。PCR结束后,进行琼脂糖凝胶电泳实验,确定目的条带的大小。
4、P0代重组杆状病毒的获取
将鉴定正确的重组杆状质粒Bacmid-ITR-EGFP、Bacmid-ITR-Fluc、Bacmid-RepWT、Bacmid-inRep、Bacmid-CORep以及Bacmid-p10Rep分别用ExpiFectamineTM SfTransfection转染试剂(赛默飞,货号:A38915)转染细胞6孔板中预铺板Sf9细胞(赛默飞,货号:11496-015,27℃无CO2恒温培养),每孔有3ml Sf900TMIII SFMTM培养基(赛默飞,货号:12658-019)含1*106Sf9细胞,继续培养72-96h,当细胞出现“空泡”状的结构并且趋向于裂解,离心收集细胞培养上清(500g,5min)并通过0.22μm的过滤器,即获得P0代杆状病毒,可4℃避光保存。
使用噬菌斑法测定重组杆状病毒滴度,依赖于病毒在感染细胞中的复制以及感染周边细胞形成局灶性病变。将Sf9细胞以1*106细胞量预铺板于细胞6孔板中,用Sf900TMIIISFMTM培养基以10倍比连续稀释P0代杆状病毒储存液,分别为10-1至10-8稀释度,每一稀释度的体积为5ml。将每份1ml的稀释液加入到上述细胞6孔板中,每个稀释度设置2个重复测定孔,在27℃孵育1h。准备10ml 4%琼脂溶液与30ml Sf-900培养基(1.3x)(赛默飞,货号:10967-032)充分混合,放置在40℃水浴中待用。完全吸除6孔板中的病毒稀释液,铺上2ml/孔的上述琼脂溶液,室温孵育1h,待琼脂完全凝固,将细胞培养板转移至27℃培养箱继续孵育。7-10天后,可肉眼看见小而白的斑点就是病毒空斑,也可以使用1mg/ml的中性红染料对6孔板中的琼脂进行染色,较为清楚的计数空斑个数。计数每一稀释度下单个可见的空斑数,使用以下公式计算病毒的滴度:
Figure BDA0003501101540000241
同时使用SYBR染料的方法进行实时定量PCR检测,检测重组杆状病毒外源基因拷贝数,来确定重组杆状病毒滴度。使用GeneJET Viral DNA and RNA Purification Kit(赛默飞,货号:K0821)提取P0代杆状病毒基因组DNA,用TE溶液溶解病毒DNA,-80℃存储备用。以EGFP、RepWT、inRep、CORep以及p10Rep序列分别设计qPCR引物,其中RepWT、CORep以及p10Rep序列共用引物P3和P4,inRep序列引物为P5和P6,EGFP序列引物为P7和P8(引物序列信息见表1)。实时定量PCR体系为:SYBR染料预混液25μl,上下游引物(10μm)各2μl,样品溶液5μl,蒸馏水16μl。PCR反应程序:预变性95℃60s,95℃15s,60℃15s,72℃45s,40个循环;溶解曲线分析。每个样品设置3个重复测定管。根据标准曲线的浓度和Ct值(阈值循环,cycle of threshold,Ct)对应的关系,可以确定各待测样品的初始浓度。
5、重组杆状病毒的扩增
通常P0代杆状病毒的体积小,滴度低,需要继续感染Sf9细胞以获得高滴度的杆状病毒。初始P0代杆状病毒的滴度在1*106至1*107pfu/ml(菌斑形成单位,plaque formingunits,pfu),扩增后P1代杆状病毒的滴度在1*107至1*108pfu/ml。用125ml细胞摇瓶含30mlSf9细胞(27℃,130rpm),细胞密度为2*106细胞/ml,取P0代杆状病毒按感染复数MOI=0.1感染细胞;继续培养72-96h,当死细胞数达到60--80%,离心收集细胞培养上清(500g,5min)并通过0.22μm的过滤器,即获得P1代杆状病毒。按照上述相同的步骤,获得高滴度的P2病毒。使用实时定量荧光PCR方法和噬菌斑法测定病毒滴度(同前)。
6、杆状病毒表达Bac-p10Rep蛋白的鉴定
使用蛋白印迹实验(Western Blotting,WB)检测Rep蛋白的表达情况。P2-P5代病毒按MOI=3分别感染Sf9细胞,离心收集细胞样品。使用1x SDS溶液裂解细胞,制备蛋白上样液。使用SDS-PAGE进行电泳,电泳结束后,将蛋白样品转于硝酸纤维素膜;用anti-AAVRep的小鼠单克隆抗体(ARP,货号:03-65171)检测Rep蛋白的表达,并且考察Rep蛋白表达的稳定性,即观察P2、P3、P4和P5代杆状病毒中Rep蛋白表达情况。
7、制备neDNA-ITR-EGFP和neDNA-ITR-Fluc表达载体
P2代两种重组杆状病毒BacV-ITR-EGFP或BacV-ITR-Fluc和BacV-Rep按MOI=1-5(选择合适的MOI参数),共感染2*106细胞/ml的Sf9昆虫细胞,继续培养72-96h,当细胞直径在18-20μm且细胞活率处于80%左右,收取细胞(500g,5min)。使用QIAGEN质粒抽提试剂盒(货号:12163)抽提Sf9细胞中小分子量的DNA。
8、neDNA在HEK293T细胞中的表达能力
将neDNA-ITR-EGFP用LipoFectamine 2000转染试剂(赛默飞,货号:11668-019)转染HEK293T细胞(使用含10%胎牛血清的高糖DMEM培养基(Gibco,货号:11965-092),37℃,5%CO2条件下培养),72h后使用荧光显微镜观察EGFP的表达情况。
9、纳米脂质颗粒(lipid nanoparticle)递送neDNA在C57BL/6小鼠体内的表达能力
将1mg neDNA-ITR-Fluc溶解于醋酸钠-醋酸缓冲液中,作为水相混合液;取可离子化阳离子脂质Dlin-MC3-DMA、二油酰基磷脂酰胆碱DOPC、胆固醇和PEG脂质以50:10:38:2比例溶解在乙醇中,作为脂相混合液;水相和脂相使用Precision Nanosystems Ignite微流控芯片混合,再用中性的磷酸盐缓冲液进行透析,获得中性缓冲液中的LNP-DNA复合物悬液。以2mg/kg的剂量尾静脉注射C57BL/6小鼠。观察neDNA-ITR-Fluc介导基因表达时,在小鼠体内腹腔注射150mg/kg的荧光素酶底物荧光素luciferin,并在Xenogen IVIS Spectrum小动物活体成像仪上观察荧光信号。
二、实验结果
1、供体质粒和杆状病毒的制备
在质粒pFastBac上插入两端包含ITR序列的EGFP基因表达框,得到重组质粒pFastBac-ITR-EGFP(如图1A)。
构建辅助质粒pFastBac-p10Rep(如图1B,SEQ ID NO:14),p10为Rep78-WT的启动子,polh为Rep52-CO的启动子。构建辅助质粒pFastBac-RepWT,其中ΔIE1为Rep78的启动子,polh为Rep52WT的启动子。构建辅助质粒pFastBac-inRep,在同一表达框中,其中p10为Rep78启动子,Rep78和Rep52之间有一个人工合成的内含子(Intron)序列(包含polh启动子),作为Rep52的启动子,该构建基于Haifeng Chen 2008年的工作。构建辅助质粒pFastBac-CORep,ΔIE1为Rep78的启动子,polh为Rep52-CO的启动子。图2为p10Rep基因、RepWT基因、inRep基因和CORep基因的转录示意图。
将上述供体质粒(pFastBac-ITR-EGFP)与不同的辅助质粒分别转化DH10 Bac大肠杆菌感受态细胞,蓝白斑筛选得到杆状质粒Bacmid-ITR-EGFP和Bacmid-Rep,并通过PCR进一步筛选序列正确的重组Bacmid杆状质粒。重组Bacmid分别转染Sf9细胞得到重组杆状病毒BacV-ITR-EGFP和BacV-Rep。
2、Rep蛋白在昆虫细胞Sf9中的表达
用anti-AAV Rep的小鼠单克隆抗体(ARP,货号:03-65171)检测BacV-p10Rep感染Sf9细胞表达的Rep蛋白,同时使用未感染Sf9细胞作为阴性对照。使用BacV-RepWT[1],BacV-inRep[2]和BacV-CORep(优化RepWT中Rep52序列)作为对照。P1代BacV-Rep杆状病毒按MOI=0.1连续感染Sf9细胞,分别获得P2、P3、P4和P5杆状病毒。用P2-P5代BacV-Rep按MOI=3分别感染Sf9细胞,收集细胞样品,用WB检测Rep蛋白的表达,并且考察不同代次杆状病毒中Rep蛋白表达的稳定性,如图3。
3、制备neDNA-ITR-EGFP基因表达载体
P2代两种重组杆状病毒BacV-ITR-EGFP和BacV-Rep按MOI=3,共感染Sf9昆虫细胞,培养72-96h,当细胞直径在18-20μm且细胞活率处于80%左右,收取细胞并抽提小分子量的neDNA-ITR-EGFP基因表达载体。用0.8%的琼脂糖凝胶进行电泳鉴定neDNA的条带大小,主要条带在2.7kb和5.4kb,分别对应neDNA-ITR-EGFP表达载体的单体和二聚体。二聚体上面的条带根据大小可以推算为三聚体和多聚体,如图4。
使用SalI单限制性内切酶对neDNA进行酶切,得到2kb,0.7kb条带,与预期单体酶切后片段大小相符,如图5A-B所示,5A.neDNA-EGFP单体片段长2.7kb,SalI限制性内切酶可将单体片段酶切为2kb和0.7kb大小的片段。5B.二聚体具有一种“头连头、尾连尾”的结构,可被酶切为2kb和1.4kb大小的片段或4kb和0.7kb大小的片段。深蓝色的长方形指示5’ITR序列,浅蓝色的长方形指示3’ITR序列。
不同Rep蛋白驱动neDNA-ITR-EGFP基因表达载体的表达产量是不同的,相比于RepWT,inRep和CORep驱动的neDNA-ITR-EGFP基因表达载体的表达产量,p10Rep驱动的neDNA-ITR-EGFP基因表达载体的表达产量约为:每6*107Sf9细胞中可表达近270μg的neDNA基因表达载体,是其他三组的2-3倍,详见表2。
表2:neDNA产量
Figure BDA0003501101540000271
4、neDNA-ITR-EGFP基因表达载体转染HEK293细胞
将neDNA-ITR-EGFP用LipoFectamine 2000转染试剂转染HEK293细胞,24h开始使用荧光显微镜观察EGFP的表达情况。转染后72h,neDNA-ITR-EGFP基因表达载体在HEK293细胞中的表达情况,如图6所示。
5、neDNA-ITR-Fluc基因表达载体在小鼠体内表达荧光素酶
使用供体质粒pFastBac-ITR-Fluc和辅助质粒pFastBac-p10Rep构建杆状质粒Bacmid-ITR-Fluc和Bacmid-p10Rep,获得重组杆状病毒BacV-ITR-Fluc和BacV-p10Rep,制备neDNA-ITR-Fluc基因表达载体。用纳米脂质颗粒(LNP)递送neDNA-ITR-Fluc尾静脉注射C57BL/6小鼠体内,24h开始可观察到荧光素酶在小鼠肝脏稳定表达,如图7所示。
综上,
本申请提供了涉及一种使用昆虫细胞--杆状病毒表达体系产生neDNA的方法,使用该方法产生的neDNA具有多种构型,如:单体,二聚体,三聚体及多聚体等。在小鼠实验中,相比于质粒DNA,neDNA可以介导目的基因表达框在体内(如:肝)的长效表达。
该方法优化了Rep蛋白表达载体,提升Rep蛋白表达的稳定性,从而制备提高了neDNA的产量和生产体系的稳定性,其中p10Rep是优化后的表达框,完整的p10启动子,提高了Rep78的表达量;Rep52序列密码子优化后,避免了Rep78和Rep52发生同源重组。
Bac-p10Rep相比于其他Bac-Rep和Bac-EFGP共感染Sf9细胞,neDNA的产量最高,产率平均有2-3倍提升。
Bac-p10Rep相比于其他Bac-Rep,经过3次连续杆状病毒传代后,Rep蛋白(Rep78)的表达稳定性更好。
参考文献:
[1]Masashi Urabe,Chuantian Ding,Robert M Kotin.Insect cells as afactory to produce adeno-associated virus type 2 vectors.Hum Gene Ther,2002,13(16):1935-43.
[2]Haifeng Chen.Intron splicing-mediated expression of AAV Rep andCap genes and production of AAV vectors in insect cells.Mol Ther,2008,16(5):924-30.
序列表
<110> 上海渤因生物科技有限公司
<120> 杆状病毒载体及其用途
<130> 0251-PA-002
<160> 24
<170> PatentIn version 3.5
<210> 1
<211> 1097
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CMV-p10
<400> 1
ggtaccacgc gtctagttat taatagtaat caattacggg gtcattagtt catagcccat 60
atatggagtt ccgcgttaca taacttacgg taaatggccc gcctggctga ccgcccaacg 120
acccccgccc attgacgtca ataatgacgt atgttcccat agtaacgcca atagggactt 180
tccattgacg tcaatgggtg gagtatttac ggtaaactgc ccacttggca gtacatcaag 240
tgtatcatat gccaagtccg ccccctattg acgtcaatga cggtaaatgg cccgcctggc 300
attatgccca gtacatgacc ttacgggact ttcctacttg gcagtacatc tacgtattag 360
tcatcgctat taccatgctg atgcggtttt ggcagtacac caatgggcgt ggatagcggt 420
ttgactcacg gggatttcca agtctccacc ccattgacgt caatgggagt ttgttttggc 480
accaaaatca acgggacttt ccaaaatgtc gtaataaccc cgccccgttg acgcaaatgg 540
gcggtaggcg tgtacggtgg gaggtctata taagcagacg tcgtttagtg aaccgtcaga 600
tcactagatg ctttattgcg gtagtttatc acagttaaat tgctaacgcc agtctcgaac 660
ttaacgtgca gaagttggtc gtgaggcact gggcaggtaa gtatcgggcc ctttgtgcgg 720
ggggagcggc tcggggctgt ccgcgggggg acggctgcct tcggggggga cggggcaggg 780
cggggttcgg cttctggcgt gtgaccggcg gctctagagc ctctgctaac catgttcatg 840
ccttcttctt tttcctacag ctcctgggca acgtgctggt tattgtgctg tctcatcatt 900
ttggcaaaga attggatcgg accgaaatta atacgactca ctatagggga attgtgagcg 960
gataacaatt ccccggagtt aatccgggac ctttaattca acccaacaca atatattata 1020
gttaaataag aattattatc aaatcatttg tatattaatt aaaatactat actgtaaatt 1080
acattttatt tacaatc 1097
<210> 2
<211> 5547
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pAAV-GFP
<400> 2
cagcagctgg cgtaatagcg aagaggcccg caccgatcgc ccttcccaac agttgcgcag 60
cctgaatggc gaatggaatt ccagacgatt gagcgtcaaa atgtaggtat ttccatgagc 120
gtttttcctg ttgcaatggc tggcggtaat attgttctgg atattaccag caaggccgat 180
agtttgagtt cttctactca ggcaagtgat gttattacta atcaaagaag tattgcgaca 240
acggttaatt tgcgtgatgg acagactctt ttactcggtg gcctcactga ttataaaaac 300
acttctcagg attctggcgt accgttcctg tctaaaatcc ctttaatcgg cctcctgttt 360
agctcccgct ctgattctaa cgaggaaagc acgttatacg tgctcgtcaa agcaaccata 420
gtacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc gcagcgtgac 480
cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt cctttctcgc 540
cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag ggttccgatt 600
tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt cacgtagtgg 660
gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt tctttaatag 720
tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt cttttgattt 780
ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt aacaaaaatt 840
taacgcgaat tttaacaaaa tattaacgtt tacaatttaa atatttgctt atacaatctt 900
cctgtttttg gggcttttct gattatcaac cggggtacat atgattgaca tgctagtttt 960
acgattaccg ttcatcgcct gcactgcgcg ctcgctcgct cactgaggcc gcccgggcaa 1020
agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag 1080
agggagtgga attcacgcgt ggtacgatct gaattcggta caattcacgc gtgggtacca 1140
cgcgtctagt tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga 1200
gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 1260
cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg 1320
acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca 1380
tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc 1440
ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc 1500
tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc ggtttgactc 1560
acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt ggcaccaaaa 1620
tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa tgggcggtag 1680
gcgtgtacgg tgggaggtct atataagcag agctcgttta gtgaaccgtc agatcgcctg 1740
gagacgccat ccacgctgtt ttgacctcca tagaagacac cgggaccgat ccagcctcca 1800
ccggttcgcc accatggtga gcaagggcga ggagctgttc accggggtgg tgcccatcct 1860
ggtcgagctg gacggcgacg taaacggcca caagttcagc gtgtccggcg agggcgaggg 1920
cgatgccacc tacggcaagc tgaccctgaa gttcatctgc accaccggca agctgcccgt 1980
gccctggccc accctcgtga ccaccctgac ctacggcgtg cagtgcttca gccgctaccc 2040
cgaccacatg aagcagcacg acttcttcaa gtccgccatg cccgaaggct acgtccagga 2100
gcgcaccatc ttcttcaagg acgacggcaa ctacaagacc cgcgccgagg tgaagttcga 2160
gggcgacacc ctggtgaacc gcatcgagct gaagggcatc gacttcaagg aggacggcaa 2220
catcctgggg cacaagctgg agtacaacta caacagccac aacgtctata tcatggccga 2280
caagcagaag aacggcatca aggtgaactt caagatccgc cacaacatcg aggacggcag 2340
cgtgcagctc gccgaccact accagcagaa cacccccatc ggcgacggcc ccgtgctgct 2400
gcccgacaac cactacctga gcacccagtc cgccctgagc aaagacccca acgagaagcg 2460
cgatcacatg gtcctgctgg agttcgtgac cgccgccggg atcactctcg gcatggacga 2520
gctgtacaag taaagcggcc atcaagctta tcgataccgt cgactagagc tcgctgatca 2580
gcctcgactg tgccttctag ttgccagcca tctgttgttt gcccctcccc cgtgccttcc 2640
ttgaccctgg aaggtgccac tcccactgtc ctttcctaat aaaatgagga aattgcatcg 2700
cattgtctga gtaggtgtca ttctattctg gggggtgggg tggggcagga cagcaagggg 2760
gaggattggg aagacaatag caggcatgct ggggagagat cgatctgagg aacccctagt 2820
gatggagttg gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa 2880
ggtcgcccga cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagaga 2940
gggagtggcc aacccccccc cccccccccc tgcatgcagg cgattctctt gtttgctcca 3000
gactctcagg caatgacctg atagcctttg tagagacctc tcaaaaatag ctaccctctc 3060
cggcatgaat ttatcagcta gaacggttga atatcatatt gatggtgatt tgactgtctc 3120
cggcctttct cacccgtttg aatctttacc tacacattac tcaggcattg catttaaaat 3180
atatgagggt tctaaaaatt tttatccttg cgttgaaata aaggcttctc ccgcaaaagt 3240
attacagggt cataatgttt ttggtacaac cgatttagct ttatgctctg aggctttatt 3300
gcttaatttt gctaattctt tgccttgcct gtatgattta ttggatgttg gaattcctga 3360
tgcggtattt tctccttacg catctgtgcg gtatttcaca ccgcatatgg tgcactctca 3420
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 3480
acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct 3540
ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg 3600
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagacgt 3660
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 3720
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 3780
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 3840
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 3900
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 3960
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 4020
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactgagtga 4080
taacactgcg gccaacttac ttctgacaac gatcggagga ccgaaggagc taaccgcttt 4140
tttgcacaac atgggggatc atgtaactcg ccttgatcgt tgggaaccgg agctgaatga 4200
agccatacca aacgacgagc gtgacaccac gatgcctgta gcaatggcaa caacgttgcg 4260
caaactatta actggcgaac tacttactct agcttcccgg caacaattaa tagactggat 4320
ggaggcggat aaagttgcag gaccacttct gcgctcggcc cttccggctg gctggtttat 4380
tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt atcattgcag cactggggcc 4440
agatggtaag ccctcccgta tcgtagttat ctacacgacg gggagtcagg caactatgga 4500
tgaacgaaat agacagatcg ctgagatagg tgcctcactg attaagcatt ggtaactgtc 4560
agaccaagtt tactcatata tactttagat tgatttaaaa cttcattttt aatttaaaag 4620
gatctaggtg aagatccttt ttgataatct catgaccaaa atcccttaac gtgagttttc 4680
gttccactga gcgtcagacc ccgtagaaaa gatcaaagga tcttcttgag atcctttttt 4740
tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg ctaccagcgg tggtttgttt 4800
gccggatcaa gagctaccaa ctctttttcc gaaggtaact ggcttcagca gagcgcagat 4860
accaaatact gtccttctag tgtagccgta gttaggccac cacttcaaga actctgtagc 4920
accgcctaca tacctcgctc tgctaatcct gttaccagtg gctgctgcca gtggcgataa 4980
gtcgtgtctt accgggttgg actcaagacg atagttaccg gataaggcgc agcggtcggg 5040
ctgaacgggg ggttcgtgca cacagcccag cttggagcga acgacctaca ccgaactgag 5100
atacctacag cgtgagctat gagaaagcgc cacgcttccc gaagggagaa aggcggacag 5160
gtatccggta agcggcaggg tcggaacagg agagcgcacg agggagcttc cagggggaaa 5220
cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc tgacttgagc gtcgattttt 5280
gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc agcaacgcgg cctttttacg 5340
gttcctggcc ttttgctggc cttttgctca catgttcttt cctgcgttat cccctgattc 5400
tgtggataac cgtattaccg cctttgagtg agctgatacc gctcgccgca gccgaacgac 5460
cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc ccaatacgca aaccgcctct 5520
ccccgcgcgt tggccgattc attaatg 5547
<210> 3
<211> 925
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> ITR-MCS-PA-ITR
<400> 3
ggtaccacat gtcctgcagg cagctgcgcg ctcgctcgct cactgaggcc gcccgggcaa 60
agcccgggcg tcgggcgacc tttggtcgcc cggcctcagt gagcgagcga gcgcgcagag 120
agggagtggc caactccatc actaggggtt cctgcggccg cagatctacc ggtggcgcgc 180
cggatccgaa ttctctagag tcgacgtcga gctagcatcg atgtttaaac gagctcacta 240
gtctcgagac gcgtacgggt ggcatccctg tgacccctcc ccagtgcctc tcctggccct 300
ggaagttgcc actccagtgc ccaccagcct tgtcctaata aaattaagtt gcatcatttt 360
gtctgactag gtgtccttct ataatattat ggggtggagg ggggtggtat ggagcaaggg 420
gcaagttggg aagacaacct gtagggcctg cggggtctat tgggaaccaa gctggagtgc 480
agtggcacaa tcttggctca ctgcaatctc cgcctcctgg gttcaagcga ttctcctgcc 540
tcagcctccc gagttgttgg gattccaggc atgcatgacc aggctcagct aatttttgtt 600
tttttggtag agacggggtt tcaccatatt ggccaggctg gtctccaact cctaatctca 660
ggtgatctac ccaccttggc ctcccaaatt gctgggatta caggcgtgaa ccactgctcc 720
cttccctgtc cttctgattt tgtaggtaac cacgtgcgga ccgagcggcc gcaggaaccc 780
ctagtgatgg agttggccac tccctctctg cgcgctcgct cgctcactga ggccgggcga 840
ccaaaggtcg cccgacgccc gggctttgcc cgggcggcct cagtgagcga gcgagcgcgc 900
agctgcctgc aggggcgcca agctt 925
<210> 4
<211> 5238
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pFastBac dual
<400> 4
ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt ttgtaattga 60
ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc 120
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 180
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 240
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 300
ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt 360
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 420
aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc 480
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 540
attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 600
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 660
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 720
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 780
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 840
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 900
agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 960
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 1020
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 1080
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 1140
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 1200
accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 1260
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 1320
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 1380
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 1440
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 1500
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 1560
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 1620
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 1680
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 1740
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 1800
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 1860
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 1920
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 1980
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 2040
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 2100
acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 2160
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 2220
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 2280
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 2340
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 2400
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 2460
cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca 2520
tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg gttacggttg 2580
agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc ttaaactgaa 2640
caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt tgtaaactga 2700
aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct aaagcaaact 2760
cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc caagggcatg 2820
gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg ccgggaagcc 2880
gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa agtgcatcac 2940
ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac cgtaatctgc 3000
ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga gattgatgag 3060
cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat agatatagat 3120
ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc caacaaccgc 3180
ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt tcccgaggta 3240
atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac gaccgaaaag 3300
atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg tgcgaatgat 3360
gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg taacatcgtt 3420
gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg gcgtaacgcg 3480
cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa caagccatga 3540
aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac cagttgcgtg 3600
agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc aactgggttc 3660
gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc agcgaagtcg 3720
aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg catcgtcagg 3780
cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg ccctggcttc 3840
aggagatcgg tagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc ccggatgaag 3900
tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag gactctagct 3960
atagttctag tggttggcct acgtacccgt agtggctatg gcagggcttg ccgccccgac 4020
gttggctgcg agccctgggc cttcacccga acttgggggt tggggtgggg aaaaggaaga 4080
aacgcgggcg tattggtccc aatggggtct cggtggggta tcgacagagt gccagccctg 4140
ggaccgaacc ccgcgtttat gaacaaacga cccaacaccc gtgcgtttta ttctgtcttt 4200
ttattgccgt catagcgcgg gttccttccg gtattgtctc cttccgtgtt tcagttagcc 4260
tcccccatct cccggtaccg catgctatgc atcagctgct agcaccatgg ctcgagatcc 4320
cgggtgatca agtcttcgtc gagtgattgt aaataaaatg taatttacag tatagtattt 4380
taattaatat acaaatgatt tgataataat tcttatttaa ctataatata ttgtgttggg 4440
ttgaattaaa ggtccgtata ctccggaata ttaatagatc atggagataa ttaaaatgat 4500
aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt aataaaaaaa 4560
cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc ccggtccgaa 4620
gcgcgcggaa ttcaaaggcc tacgtcgacg agctcactag tcgcggccgc tttcgaatct 4680
agagcctgca gtctcgacaa gcttgtcgag aagtactaga ggatcataat cagccatacc 4740
acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct gaacctgaaa 4800
cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa 4860
taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 4920
ggtttgtcca aactcatcaa tgtatcttat catgtctgga tctgatcact gcttgagcct 4980
aggagatccg aaccagataa gtgaaatcta gttccaaact attttgtcat ttttaatttt 5040
cgtattagct tacgacgcta cacccagttc ccatctattt tgtcactctt ccctaaataa 5100
tccttaaaaa ctccatttcc acccctccca gttcccaact attttgtccg cccacagcgg 5160
ggcatttttc ttcctgttat gtttttaatc aaacatcctg ccaactccat gtgacaaacc 5220
gtcatcttcg gctacttt 5238
<210> 5
<211> 3129
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CpGfreeFluc
<400> 5
tttagggtta gggttagggt tagggaaaaa tttagggtta gggttagggt tagggaaaaa 60
tttagggtta gggttagggt tagggaaaaa aagcttgagt caatgggaaa aacccattgg 120
agccaagtac actgactcaa tagggacttt ccattgggtt ttgcccagta cataaggtca 180
atagggggtg agtcaacagg aaagtcccat tggagccaag tacattgagt caatagggac 240
tttccaatgg gttttgccca gtacataagg tcaatgggag gtaagccaat gggtttttcc 300
cattactgac atgtatactg agtcattagg gactttccaa tgggttttgc ccagtacata 360
aggtcaatag gggtgaatca acaggaaagt cccattggag ccaagtacac tgagtcaata 420
gggactttcc attgggtttt gcccagtaca aaaggtcaat agggggtgag tcaatgggtt 480
tttcccatta ttggcacata cataaggtca ataggggtga ctagtggaga agagcatgct 540
tgagggctga gtgcccctca gtgggcagag agcacatggc ccacagtccc tgagaagttg 600
gggggagggg tgggcaattg aactggtgcc tagagaaggt ggggcttggg taaactggga 660
aagtgatgtg gtgtactggc tccacctttt tccccagggt gggggagaac catatataag 720
tgcagtagtc tctgtgaaca ttcaagcttc tgccttctcc ctcctgtgag tttggtaagt 780
cactgactgt ctatgcctgg gaaagggtgg gcaggaggtg gggcagtgca ggaaaagtgg 840
cactgtgaac cctgcagccc tagacaattg tactaacctt cttctctttc ctctcctgac 900
aggttggtgt acagtagctt ccaccatgga ggatgccaag aatattaaga aaggccctgc 960
cccattctac cctctggaag atggcactgc tggtgagcaa ctgcacaagg ccatgaagag 1020
gtatgccctg gtccctggca ccattgcctt cactgatgct cacattgagg tggacatcac 1080
ctatgctgaa tactttgaga tgtctgtgag gctggcagaa gccatgaaaa gatatggact 1140
gaacaccaac cacaggattg tggtgtgctc tgagaactct ctccagttct tcatgcctgt 1200
gttaggagcc ctgttcattg gagtggctgt ggcccctgcc aatgacatct acaatgagag 1260
agagctcctg aacagcatgg gcatcagcca gccaactgtg gtctttgtga gcaagaaggg 1320
cctgcaaaag atcctgaatg tgcagaagaa gctgcccatc atccagaaga tcatcatcat 1380
ggacagcaag actgactacc agggcttcca gagcatgtat acctttgtga ccagccactt 1440
accccctggc ttcaatgagt atgactttgt gcctgagagc tttgacaggg acaagaccat 1500
tgctctgatt atgaacagct ctggctccac tggactgccc aaaggtgtgg ctctgcccca 1560
cagaactgct tgtgtgagat tcagccatgc cagagacccc atctttggca accagatcat 1620
ccctgacact gccatcctgt ctgtggttcc attccatcat ggctttggca tgttcacaac 1680
actggggtac ctgatctgtg gcttcagagt ggtgctgatg tataggtttg aggaggagct 1740
gtttctgagg agcctacaag actacaagat ccagtctgcc ctgctggtgc ccactctgtt 1800
cagcttcttt gccaagagca ccctcattga caagtatgac ctgagcaacc tgcatgagat 1860
tgcctctgga ggagcacccc tgagcaagga ggtgggtgag gctgtggcaa agaggttcca 1920
tctcccagga atcagacagg gctatggcct gactgagacc acctctgcca tcctcatcac 1980
ccctgaagga gatgacaagc ctggtgctgt gggcaaggtg gttccctttt ttgaggccaa 2040
ggtggtggac ctggacactg gcaagaccct gggagtgaac cagaggggtg agctgtgtgt 2100
gaggggtccc atgatcatgt ctggctatgt gaacaaccct gaggccacca atgccctgat 2160
tgacaaggat ggctggctgc actctggtga cattgcctac tgggatgagg atgagcactt 2220
tttcattgtg gacaggctga agagcctcat caagtacaaa ggctaccaag tggcacctgc 2280
tgagctagag agcatcctgc tccagcaccc caacatcttt gatgctggtg tggctggcct 2340
gcctgatgat gatgctggag agctgcctgc tgctgttgtg gttctggagc atggaaagac 2400
catgactgag aaggagattg tggactatgt ggccagtcag gtgaccactg ccaagaagct 2460
gaggggaggt gtggtgtttg tggatgaggt gccaaagggt ctgactggca agctggatgc 2520
cagaaagatc agagagatcc tgatcaaggc caagaagggt ggcaaacaat tgatctctgg 2580
agccaatgga gtctagctag ctggccagac atgataagat acattgatga gtttggacaa 2640
accacaacta gaatgcagtg aaaaaaatgc tttatttgtg aaatttgtga tgctattgct 2700
ttatttgtaa ccattataag ctgcaataaa caagttaaca acaacaattg cattcatttt 2760
atgtttcagg ttcaggggga ggtgtgggag gttttttaaa gcaagtaaaa cctctacaaa 2820
tgtggtatgg aattcggatc cggtgtggaa agtccccagg ctccccagca ggcagaagta 2880
tgcaaagcat gcatctcaat tagtcagcaa ccaggtgtgg aaagtcccca ggctccccag 2940
caggcagaag tatgcaaagc atgcatctca attagtcagc aaccagagct ctggggactt 3000
tccgctgggg actttccgct ggggactttc cgctggggac tttccgctgg ggactttccg 3060
catttaaatg gtacattttg ttctagaaca aaatgtaccg gtacattttg ttctggtaca 3120
ttttgttct 3129
<210> 6
<211> 2305
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> inRep
<400> 6
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc actcgacgaa 120
gacttgatca ccctacccgc catgccgggg ttttacgaga ttgtgattaa ggtccccagc 180
gaccttgacg agcatctgcc cggcatttct gacagctttg tgaactgggt ggccgagaag 240
gaatgggagt tgccgccaga ttctgacatg gatctgaatc tgattgagca ggcacccctg 300
accgtggccg agaagctgca gcgcgacttt ctgacggaat ggcgccgtgt gagtaaggcc 360
ccggaggccc ttttctttgt gcaatttgag aagggagaga gctacttcca catgcacgtg 420
ctcgtggaaa ccaccggggt gaaatccatg gttttgggac gtttcctgag tcagattcgc 480
gaaaaactga ttcagagaat ttaccgcggg atcgagccga ctttgccaaa ctggttcgcg 540
gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc 600
cccaattact tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa 660
cagtatttaa ggtaagtact ccctatcagt gatagagatc tatcatggag ataattaaaa 720
tgataaccat ctcgcaaata aataagtatt ttactgtttt cgtaacagtt ttgtaataaa 780
aaaacctata aatattccgg attattcata ccgtcccacc atcgggcgcg aagggggaga 840
cctgtagtca gagcccccgg gcagcacaca ctgacatcca ctcccttcct attgtttcag 900
cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 960
gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 1020
atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 1080
ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 1140
caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 1200
taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 1260
gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 1320
gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1380
taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1440
aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1500
ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1560
caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1620
cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1680
ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1740
ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1800
ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1860
cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1920
gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1980
cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 2040
aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 2100
tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 2160
gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 2220
catctttgaa caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt 2280
ggctcgagga cactctctct gaagg 2305
<210> 7
<211> 3884
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> CORep
<400> 7
gaacaaacga cccaacaccc gtgcgtttta ttctgtcttt ttattgccgt catagcgcgg 60
gttccttccg gtattgtctc cttccgtgtt tcagttagcc tcccccatct cccggtaccg 120
catgctatgc atcagctgct agcttactgc tcgaagatgc agtcgtccag atccacgttc 180
acgagatcgc aagcagtgca agcgtcgggc accttgccca tgatgtggtg gatgtagcac 240
agcttctggt aggccttctt gacgacggac acgggttggg actcggagac ggggaagcat 300
tccagacagt ctttctggcc gtgggtgaag cagatgttgg agttctggtt catgcgctcg 360
cactggcggc aagggaacag catcagattc atgcccacgt ggcggctgca cttattctgg 420
tagcggtcgg cgtagttgat ggaggcttca gcatcggagg tggaaggctg agcgacggac 480
tcacgcacgc gcttaggctc gctgatatca gcgtcgctgg gagcggggcg cttcttagca 540
ccgcccttct tcacgtagaa ctcgtgctcc acctccacga cgtgatcctt ggcccaacgg 600
aagaagtcct tcacctcttg cttggtgact ttgccgaagt cgtggtccag acggcgggtg 660
agctcgaatt tgaacatgcg gtcttgcaga ggttgctgat gttcgaaggt agtggagttg 720
ccgtcgatga cagcgcacat gttggtgttg gaagtcacga tgacgggggt ggggtcgatc 780
tgagcggagg acttgcactt ctggtcgaca cgcaccttgc taccacccag aatggccttg 840
gcggattcga ccaccttggc agtcatcttg ccctcttccc accagatgac catcttgtcg 900
acgcagtcgt tgaaggggaa gttctcgttg gtccagttga cgcagccgta aaagggcacg 960
gtatgggcga tggcttcggc gatgttggtc ttaccagtgg tagcgggacc gaagagccag 1020
atagtgttgc gcttgccgaa cttcttggta gcccaaccga ggaagacgga ggcggcatac 1080
tgggggtcgt agccgttgag ctccagaatc ttgtagatgc ggttggagga gatgtcctcc 1140
acgggctgtt gaccgaccag ataatcggga gcggtcttgg tgaggctcat gatcttacca 1200
gcgttgtcga gggcagcctt gatctgggaa cgggagttgc tggcagcatt gaagctgatg 1260
tagctggctt ggtcctcttg gatccactgc ttctcgctag tgatgccctt gtcgaccagc 1320
caaccgacca gttccatggt ggcccgggtt tcggaccgag atccgcgccc gatggtggga 1380
cggtatgaat aatccggaat atttataggt ttttttatta caaaactgtt acgaaaacag 1440
taaaatactt atttatttgc gagatggtta tcattttaat tatctccatg atctattaat 1500
attccggagt atacaataaa cgataacgcc gttggtggcg tgaggcatgt aaaaggttac 1560
atcattatct tgttcgccat ccggttggta taaatagacg ttcatgttgg tttttgtttc 1620
agttgcaagt tggctgcggc gcgcgcagca cctttgcggc cgccaccatg gcggggtttt 1680
acgagattgt gattaaggtc cccagcgacc ttgacgagca tctgcccggc atttctgaca 1740
gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc gccagattct gacatggatc 1800
tgaatctgat tgagcaggca cccctgaccg tggccgagaa gctgcagcgc gactttctga 1860
cggaatggcg ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa tttgagaagg 1920
gagagagcta cttccacatg cacgtgctcg tggaaaccac cggggtgaaa tccatggttt 1980
tgggacgttt cctgagtcag attcgcgaaa aactgattca gagaatttac cgcgggatcg 2040
agccgacttt gccaaactgg ttcgcggtca caaagaccag aaatggcgcc ggaggcggga 2100
acaaggtggt ggatgagtgc tacatcccca attacttgct ccccaaaacc cagcctgagc 2160
tccagtgggc gtggactaat atggaacagt atttaagcgc ctgtttgaat ctcacggagc 2220
gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca gacgcaggag cagaacaaag 2280
agaatcagaa tcccaattct gatgcgccgg tgatcagatc aaaaacttca gccaggtaca 2340
tggagctggt cgggtggctc gtggacaagg ggattacctc ggagaagcag tggatccagg 2400
aggaccaggc ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc caaatcaagg 2460
ctgccttgga caatgcggga aagattatga gcctgactaa aaccgccccc gactacctgg 2520
tgggccagca gcccgtggag gacatttcca gcaatcggat ttataaaatt ttggaactaa 2580
acgggtacga tccccaatat gcggcttccg tctttctggg atgggccacg aaaaagttcg 2640
gcaagaggaa caccatctgg ctgtttgggc ctgcaactac cgggaagacc aacatcgcgg 2700
aggccatagc ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat gagaactttc 2760
ccttcaacga ctgtgtcgac aagatggtga tctggtggga ggaggggaag atgaccgcca 2820
aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg gaccagaaat 2880
gcaagtcctc ggcccagata gacccgactc ccgtgatcgt cacctccaac accaacatgt 2940
gcgccgtgat tgacgggaac tcaacgacct tcgaacacca gcagccgttg caagaccgga 3000
tgttcaaatt tgaactcacc cgccgtctgg atcatgactt tgggaaggtc accaagcagg 3060
aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt tgaggtggag catgaattct 3120
acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag tgacgcagat ataagtgagc 3180
ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa gcttcgatca 3240
actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat ctgatgctgt 3300
ttccctgcag acaatgcgag agaatgaatc agaattcaaa tatctgcttc actcacggac 3360
agaaagactg tttagagtgc tttcccgtgt cagaatctca acccgtttct gtcgtcaaaa 3420
aggcgtatca gaaactgtgc tacattcatc atatcatggg aaaggtgcca gacgcttgca 3480
ctgcctgcga tctggtcaat gtggatttgg atgactgcat ctttgaacaa taaatgattt 3540
aaatcaggta tggctgccga tggttatctt ccagattggc tcgaggacac tctctctgat 3600
ctagagcctg cagtctcgac aagcttgtcg agaagtacta gaggatcata atcagccata 3660
ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 3720
aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 3780
aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 3840
gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatc 3884
<210> 8
<211> 3874
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> p10Rep
<400> 8
gaacaaacga cccaacaccc gtgcgtttta ttctgtcttt ttattgccgt catagcgcgg 60
gttccttccg gtattgtctc cttccgtgtt tcagttagcc tcccccatct cccggtaccg 120
catgctatgc atcagctgct agcttactgc tcgaagatgc agtcgtccag atccacgttc 180
acgagatcgc aagcagtgca agcgtcgggc accttgccca tgatgtggtg gatgtagcac 240
agcttctggt aggccttctt gacgacggac acgggttggg actcggagac ggggaagcat 300
tccagacagt ctttctggcc gtgggtgaag cagatgttgg agttctggtt catgcgctcg 360
cactggcggc aagggaacag catcagattc atgcccacgt ggcggctgca cttattctgg 420
tagcggtcgg cgtagttgat ggaggcttca gcatcggagg tggaaggctg agcgacggac 480
tcacgcacgc gcttaggctc gctgatatca gcgtcgctgg gagcggggcg cttcttagca 540
ccgcccttct tcacgtagaa ctcgtgctcc acctccacga cgtgatcctt ggcccaacgg 600
aagaagtcct tcacctcttg cttggtgact ttgccgaagt cgtggtccag acggcgggtg 660
agctcgaatt tgaacatgcg gtcttgcaga ggttgctgat gttcgaaggt agtggagttg 720
ccgtcgatga cagcgcacat gttggtgttg gaagtcacga tgacgggggt ggggtcgatc 780
tgagcggagg acttgcactt ctggtcgaca cgcaccttgc taccacccag aatggccttg 840
gcggattcga ccaccttggc agtcatcttg ccctcttccc accagatgac catcttgtcg 900
acgcagtcgt tgaaggggaa gttctcgttg gtccagttga cgcagccgta aaagggcacg 960
gtatgggcga tggcttcggc gatgttggtc ttaccagtgg tagcgggacc gaagagccag 1020
atagtgttgc gcttgccgaa cttcttggta gcccaaccga ggaagacgga ggcggcatac 1080
tgggggtcgt agccgttgag ctccagaatc ttgtagatgc ggttggagga gatgtcctcc 1140
acgggctgtt gaccgaccag ataatcggga gcggtcttgg tgaggctcat gatcttacca 1200
gcgttgtcga gggcagcctt gatctgggaa cgggagttgc tggcagcatt gaagctgatg 1260
tagctggctt ggtcctcttg gatccactgc ttctcgctag tgatgccctt gtcgaccagc 1320
caaccgacca gttccatggt ggcccgggtt tcggaccgag atccgcgccc gatggtggga 1380
cggtatgaat aatccggaat atttataggt ttttttatta caaaactgtt acgaaaacag 1440
taaaatactt atttatttgc gagatggtta tcattttaat tatctccatg atctattaat 1500
attccggagt atacggacct ttaattcaac ccaacacaat atattatagt taaataagaa 1560
ttattatcaa atcatttgta tattaattaa aatactatac tgtaaattac attttattta 1620
caatcactcg acgaagactt gatcagcggc cgccaccatg gcggggtttt acgagattgt 1680
gattaaggtc cccagcgacc ttgacgagca tctgcccggc atttctgaca gctttgtgaa 1740
ctgggtggcc gagaaggaat gggagttgcc gccagattct gacatggatc tgaatctgat 1800
tgagcaggca cccctgaccg tggccgagaa gctgcagcgc gactttctga cggaatggcg 1860
ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa tttgagaagg gagagagcta 1920
cttccacatg cacgtgctcg tggaaaccac cggggtgaaa tccatggttt tgggacgttt 1980
cctgagtcag attcgcgaaa aactgattca gagaatttac cgcgggatcg agccgacttt 2040
gccaaactgg ttcgcggtca caaagaccag aaatggcgcc ggaggcggga acaaggtggt 2100
ggatgagtgc tacatcccca attacttgct ccccaaaacc cagcctgagc tccagtgggc 2160
gtggactaat atggaacagt atttaagcgc ctgtttgaat ctcacggagc gtaaacggtt 2220
ggtggcgcag catctgacgc acgtgtcgca gacgcaggag cagaacaaag agaatcagaa 2280
tcccaattct gatgcgccgg tgatcagatc aaaaacttca gccaggtaca tggagctggt 2340
cgggtggctc gtggacaagg ggattacctc ggagaagcag tggatccagg aggaccaggc 2400
ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc caaatcaagg ctgccttgga 2460
caatgcggga aagattatga gcctgactaa aaccgccccc gactacctgg tgggccagca 2520
gcccgtggag gacatttcca gcaatcggat ttataaaatt ttggaactaa acgggtacga 2580
tccccaatat gcggcttccg tctttctggg atgggccacg aaaaagttcg gcaagaggaa 2640
caccatctgg ctgtttgggc ctgcaactac cgggaagacc aacatcgcgg aggccatagc 2700
ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat gagaactttc ccttcaacga 2760
ctgtgtcgac aagatggtga tctggtggga ggaggggaag atgaccgcca aggtcgtgga 2820
gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg gaccagaaat gcaagtcctc 2880
ggcccagata gacccgactc ccgtgatcgt cacctccaac accaacatgt gcgccgtgat 2940
tgacgggaac tcaacgacct tcgaacacca gcagccgttg caagaccgga tgttcaaatt 3000
tgaactcacc cgccgtctgg atcatgactt tgggaaggtc accaagcagg aagtcaaaga 3060
ctttttccgg tgggcaaagg atcacgtggt tgaggtggag catgaattct acgtcaaaaa 3120
gggtggagcc aagaaaagac ccgcccccag tgacgcagat ataagtgagc ccaaacgggt 3180
gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa gcttcgatca actacgcaga 3240
caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat ctgatgctgt ttccctgcag 3300
acaatgcgag agaatgaatc agaattcaaa tatctgcttc actcacggac agaaagactg 3360
tttagagtgc tttcccgtgt cagaatctca acccgtttct gtcgtcaaaa aggcgtatca 3420
gaaactgtgc tacattcatc atatcatggg aaaggtgcca gacgcttgca ctgcctgcga 3480
tctggtcaat gtggatttgg atgactgcat ctttgaacaa taaatgattt aaatcaggta 3540
tggctgccga tggttatctt ccagattggc tcgaggacac tctctctgat ctagagcctg 3600
cagtctcgac aagcttgtcg agaagtacta gaggatcata atcagccata ccacatttgt 3660
agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga aacataaaat 3720
gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca aataaagcaa 3780
tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt gtggtttgtc 3840
caaactcatc aatgtatctt atcatgtctg gatc 3874
<210> 9
<211> 110
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> p10
<400> 9
gacctttaat tcaacccaac acaatatatt atagttaaat aagaattatt atcaaatcat 60
ttgtatatta attaaaatac tatactgtaa attacatttt atttacaatc 110
<210> 10
<211> 92
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> polh
<400> 10
atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60
gtaacagttt tgtaataaaa aaacctataa at 92
<210> 11
<211> 1866
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep78-WT
<400> 11
atggcggggt tttacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60
ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120
tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180
cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240
caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300
aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360
taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420
gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480
acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540
aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600
gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660
tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720
cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780
tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840
cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900
attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960
acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020
accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080
aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140
aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200
gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260
aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320
ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380
gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440
gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500
gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560
gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620
aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680
ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740
tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800
ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860
caataa 1866
<210> 12
<211> 1194
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep52-CO
<400> 12
atggaactgg tcggttggct ggtcgacaag ggcatcacta gcgagaagca gtggatccaa 60
gaggaccaag ccagctacat cagcttcaat gctgccagca actcccgttc ccagatcaag 120
gctgccctcg acaacgctgg taagatcatg agcctcacca agaccgctcc cgattatctg 180
gtcggtcaac agcccgtgga ggacatctcc tccaaccgca tctacaagat tctggagctc 240
aacggctacg acccccagta tgccgcctcc gtcttcctcg gttgggctac caagaagttc 300
ggcaagcgca acactatctg gctcttcggt cccgctacca ctggtaagac caacatcgcc 360
gaagccatcg cccataccgt gcccttttac ggctgcgtca actggaccaa cgagaacttc 420
cccttcaacg actgcgtcga caagatggtc atctggtggg aagagggcaa gatgactgcc 480
aaggtggtcg aatccgccaa ggccattctg ggtggtagca aggtgcgtgt cgaccagaag 540
tgcaagtcct ccgctcagat cgaccccacc cccgtcatcg tgacttccaa caccaacatg 600
tgcgctgtca tcgacggcaa ctccactacc ttcgaacatc agcaacctct gcaagaccgc 660
atgttcaaat tcgagctcac ccgccgtctg gaccacgact tcggcaaagt caccaagcaa 720
gaggtgaagg acttcttccg ttgggccaag gatcacgtcg tggaggtgga gcacgagttc 780
tacgtgaaga agggcggtgc taagaagcgc cccgctccca gcgacgctga tatcagcgag 840
cctaagcgcg tgcgtgagtc cgtcgctcag ccttccacct ccgatgctga agcctccatc 900
aactacgccg accgctacca gaataagtgc agccgccacg tgggcatgaa tctgatgctg 960
ttcccttgcc gccagtgcga gcgcatgaac cagaactcca acatctgctt cacccacggc 1020
cagaaagact gtctggaatg cttccccgtc tccgagtccc aacccgtgtc cgtcgtcaag 1080
aaggcctacc agaagctgtg ctacatccac cacatcatgg gcaaggtgcc cgacgcttgc 1140
actgcttgcg atctcgtgaa cgtggatctg gacgactgca tcttcgagca gtaa 1194
<210> 13
<211> 1194
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> Rep52WT
<400> 13
atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60
gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120
gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180
gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240
aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300
ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360
gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420
cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480
aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540
tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600
tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660
atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720
gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780
tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840
cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900
aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960
tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020
cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080
aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140
actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194
<210> 14
<211> 8310
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pFastBac-p10Rep
<400> 14
ttctctgtca cagaatgaaa atttttctgt catctcttcg ttattaatgt ttgtaattga 60
ctgaatatca acgcttattt gcagcctgaa tggcgaatgg gacgcgccct gtagcggcgc 120
attaagcgcg gcgggtgtgg tggttacgcg cagcgtgacc gctacacttg ccagcgccct 180
agcgcccgct cctttcgctt tcttcccttc ctttctcgcc acgttcgccg gctttccccg 240
tcaagctcta aatcgggggc tccctttagg gttccgattt agtgctttac ggcacctcga 300
ccccaaaaaa cttgattagg gtgatggttc acgtagtggg ccatcgccct gatagacggt 360
ttttcgccct ttgacgttgg agtccacgtt ctttaatagt ggactcttgt tccaaactgg 420
aacaacactc aaccctatct cggtctattc ttttgattta taagggattt tgccgatttc 480
ggcctattgg ttaaaaaatg agctgattta acaaaaattt aacgcgaatt ttaacaaaat 540
attaacgttt acaatttcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 600
tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 660
gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 720
tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 780
aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 840
cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 900
agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 960
ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 1020
tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 1080
tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 1140
caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 1200
accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 1260
attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 1320
ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 1380
taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 1440
taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 1500
aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 1560
agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 1620
ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 1680
ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 1740
cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 1800
tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 1860
tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 1920
tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 1980
tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 2040
ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 2100
acagcgtgag cattgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 2160
ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 2220
gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 2280
ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 2340
ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 2400
taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 2460
cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc tccttacgca 2520
tctgtgcggt atttcacacc gcagaccagc cgcgtaacct ggcaaaatcg gttacggttg 2580
agtaataaat ggatgccctg cgtaagcggg tgtgggcgga caataaagtc ttaaactgaa 2640
caaaatagat ctaaactatg acaataaagt cttaaactag acagaatagt tgtaaactga 2700
aatcagtcca gttatgctgt gaaaaagcat actggacttt tgttatggct aaagcaaact 2760
cttcattttc tgaagtgcaa attgcccgtc gtattaaaga ggggcgtggc caagggcatg 2820
gtaaagacta tattcgcggc gttgtgacaa tttaccgaac aactccgcgg ccgggaagcc 2880
gatctcggct tgaacgaatt gttaggtggc ggtacttggg tcgatatcaa agtgcatcac 2940
ttcttcccgt atgcccaact ttgtatagag agccactgcg ggatcgtcac cgtaatctgc 3000
ttgcacgtag atcacataag caccaagcgc gttggcctca tgcttgagga gattgatgag 3060
cgcggtggca atgccctgcc tccggtgctc gccggagact gcgagatcat agatatagat 3120
ctcactacgc ggctgctcaa acctgggcag aacgtaagcc gcgagagcgc caacaaccgc 3180
ttcttggtcg aaggcagcaa gcgcgatgaa tgtcttacta cggagcaagt tcccgaggta 3240
atcggagtcc ggctgatgtt gggagtaggt ggctacgtct ccgaactcac gaccgaaaag 3300
atcaagagca gcccgcatgg atttgacttg gtcagggccg agcctacatg tgcgaatgat 3360
gcccatactt gagccaccta actttgtttt agggcgactg ccctgctgcg taacatcgtt 3420
gctgctgcgt aacatcgttg ctgctccata acatcaaaca tcgacccacg gcgtaacgcg 3480
cttgctgctt ggatgcccga ggcatagact gtacaaaaaa acagtcataa caagccatga 3540
aaaccgccac tgcgccgtta ccaccgctgc gttcggtcaa ggttctggac cagttgcgtg 3600
agcgcatacg ctacttgcat tacagtttac gaaccgaaca ggcttatgtc aactgggttc 3660
gtgccttcat ccgtttccac ggtgtgcgtc acccggcaac cttgggcagc agcgaagtcg 3720
aggcatttct gtcctggctg gcgaacgagc gcaaggtttc ggtctccacg catcgtcagg 3780
cattggcggc cttgctgttc ttctacggca aggtgctgtg cacggatctg ccctggcttc 3840
aggagatcgg tagacctcgg ccgtcgcggc gcttgccggt ggtgctgacc ccggatgaag 3900
tggttcgcat cctcggtttt ctggaaggcg agcatcgttt gttcgcccag gactctagct 3960
atagttctag tggttggcct acgtacccgt agtggctatg gcagggcttg ccgccccgac 4020
gttggctgcg agccctgggc cttcacccga acttgggggt tggggtgggg aaaaggaaga 4080
aacgcgggcg tattggtccc aatggggtct cggtggggta tcgacagagt gccagccctg 4140
ggaccgaacc ccgcgtttat gaacaaacga cccaacaccc gtgcgtttta ttctgtcttt 4200
ttattgccgt catagcgcgg gttccttccg gtattgtctc cttccgtgtt tcagttagcc 4260
tcccccatct cccggtaccg catgctatgc atcagctgct agcttactgc tcgaagatgc 4320
agtcgtccag atccacgttc acgagatcgc aagcagtgca agcgtcgggc accttgccca 4380
tgatgtggtg gatgtagcac agcttctggt aggccttctt gacgacggac acgggttggg 4440
actcggagac ggggaagcat tccagacagt ctttctggcc gtgggtgaag cagatgttgg 4500
agttctggtt catgcgctcg cactggcggc aagggaacag catcagattc atgcccacgt 4560
ggcggctgca cttattctgg tagcggtcgg cgtagttgat ggaggcttca gcatcggagg 4620
tggaaggctg agcgacggac tcacgcacgc gcttaggctc gctgatatca gcgtcgctgg 4680
gagcggggcg cttcttagca ccgcccttct tcacgtagaa ctcgtgctcc acctccacga 4740
cgtgatcctt ggcccaacgg aagaagtcct tcacctcttg cttggtgact ttgccgaagt 4800
cgtggtccag acggcgggtg agctcgaatt tgaacatgcg gtcttgcaga ggttgctgat 4860
gttcgaaggt agtggagttg ccgtcgatga cagcgcacat gttggtgttg gaagtcacga 4920
tgacgggggt ggggtcgatc tgagcggagg acttgcactt ctggtcgaca cgcaccttgc 4980
taccacccag aatggccttg gcggattcga ccaccttggc agtcatcttg ccctcttccc 5040
accagatgac catcttgtcg acgcagtcgt tgaaggggaa gttctcgttg gtccagttga 5100
cgcagccgta aaagggcacg gtatgggcga tggcttcggc gatgttggtc ttaccagtgg 5160
tagcgggacc gaagagccag atagtgttgc gcttgccgaa cttcttggta gcccaaccga 5220
ggaagacgga ggcggcatac tgggggtcgt agccgttgag ctccagaatc ttgtagatgc 5280
ggttggagga gatgtcctcc acgggctgtt gaccgaccag ataatcggga gcggtcttgg 5340
tgaggctcat gatcttacca gcgttgtcga gggcagcctt gatctgggaa cgggagttgc 5400
tggcagcatt gaagctgatg tagctggctt ggtcctcttg gatccactgc ttctcgctag 5460
tgatgccctt gtcgaccagc caaccgacca gttccatggt ggcccgggtt tcggaccgag 5520
atccgcgccc gatggtggga cggtatgaat aatccggaat atttataggt ttttttatta 5580
caaaactgtt acgaaaacag taaaatactt atttatttgc gagatggtta tcattttaat 5640
tatctccatg atctattaat attccggagt atacggacct ttaattcaac ccaacacaat 5700
atattatagt taaataagaa ttattatcaa atcatttgta tattaattaa aatactatac 5760
tgtaaattac attttattta caatcactcg acgaagactt gatcagcggc cgccaccatg 5820
gcggggtttt acgagattgt gattaaggtc cccagcgacc ttgacgagca tctgcccggc 5880
atttctgaca gctttgtgaa ctgggtggcc gagaaggaat gggagttgcc gccagattct 5940
gacatggatc tgaatctgat tgagcaggca cccctgaccg tggccgagaa gctgcagcgc 6000
gactttctga cggaatggcg ccgtgtgagt aaggccccgg aggccctttt ctttgtgcaa 6060
tttgagaagg gagagagcta cttccacatg cacgtgctcg tggaaaccac cggggtgaaa 6120
tccatggttt tgggacgttt cctgagtcag attcgcgaaa aactgattca gagaatttac 6180
cgcgggatcg agccgacttt gccaaactgg ttcgcggtca caaagaccag aaatggcgcc 6240
ggaggcggga acaaggtggt ggatgagtgc tacatcccca attacttgct ccccaaaacc 6300
cagcctgagc tccagtgggc gtggactaat atggaacagt atttaagcgc ctgtttgaat 6360
ctcacggagc gtaaacggtt ggtggcgcag catctgacgc acgtgtcgca gacgcaggag 6420
cagaacaaag agaatcagaa tcccaattct gatgcgccgg tgatcagatc aaaaacttca 6480
gccaggtaca tggagctggt cgggtggctc gtggacaagg ggattacctc ggagaagcag 6540
tggatccagg aggaccaggc ctcatacatc tccttcaatg cggcctccaa ctcgcggtcc 6600
caaatcaagg ctgccttgga caatgcggga aagattatga gcctgactaa aaccgccccc 6660
gactacctgg tgggccagca gcccgtggag gacatttcca gcaatcggat ttataaaatt 6720
ttggaactaa acgggtacga tccccaatat gcggcttccg tctttctggg atgggccacg 6780
aaaaagttcg gcaagaggaa caccatctgg ctgtttgggc ctgcaactac cgggaagacc 6840
aacatcgcgg aggccatagc ccacactgtg cccttctacg ggtgcgtaaa ctggaccaat 6900
gagaactttc ccttcaacga ctgtgtcgac aagatggtga tctggtggga ggaggggaag 6960
atgaccgcca aggtcgtgga gtcggccaaa gccattctcg gaggaagcaa ggtgcgcgtg 7020
gaccagaaat gcaagtcctc ggcccagata gacccgactc ccgtgatcgt cacctccaac 7080
accaacatgt gcgccgtgat tgacgggaac tcaacgacct tcgaacacca gcagccgttg 7140
caagaccgga tgttcaaatt tgaactcacc cgccgtctgg atcatgactt tgggaaggtc 7200
accaagcagg aagtcaaaga ctttttccgg tgggcaaagg atcacgtggt tgaggtggag 7260
catgaattct acgtcaaaaa gggtggagcc aagaaaagac ccgcccccag tgacgcagat 7320
ataagtgagc ccaaacgggt gcgcgagtca gttgcgcagc catcgacgtc agacgcggaa 7380
gcttcgatca actacgcaga caggtaccaa aacaaatgtt ctcgtcacgt gggcatgaat 7440
ctgatgctgt ttccctgcag acaatgcgag agaatgaatc agaattcaaa tatctgcttc 7500
actcacggac agaaagactg tttagagtgc tttcccgtgt cagaatctca acccgtttct 7560
gtcgtcaaaa aggcgtatca gaaactgtgc tacattcatc atatcatggg aaaggtgcca 7620
gacgcttgca ctgcctgcga tctggtcaat gtggatttgg atgactgcat ctttgaacaa 7680
taaatgattt aaatcaggta tggctgccga tggttatctt ccagattggc tcgaggacac 7740
tctctctgat ctagagcctg cagtctcgac aagcttgtcg agaagtacta gaggatcata 7800
atcagccata ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc 7860
ctgaacctga aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat 7920
aatggttaca aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg 7980
cattctagtt gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatctgatca 8040
ctgcttgagc ctaggagatc cgaaccagat aagtgaaatc tagttccaaa ctattttgtc 8100
atttttaatt ttcgtattag cttacgacgc tacacccagt tcccatctat tttgtcactc 8160
ttccctaaat aatccttaaa aactccattt ccacccctcc cagttcccaa ctattttgtc 8220
cgcccacagc ggggcatttt tcttcctgtt atgtttttaa tcaaacatcc tgccaactcc 8280
atgtgacaaa ccgtcatctt cggctacttt 8310
<210> 15
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P1
<400> 15
gatccggtac cacgcgtcta g 21
<210> 16
<211> 26
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P2
<400> 16
ctcgacgtcg actttacttg tacagc 26
<210> 17
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P3
<400> 17
gcggggtttt acgagattgt g 21
<210> 18
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P4
<400> 18
ggggtgcctg ctcaatcaga 20
<210> 19
<211> 20
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P5
<400> 19
gcagcacaca ctgacatcca 20
<210> 20
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P6
<400> 20
gatcaccggc gcatcagaat tg 22
<210> 21
<211> 22
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P7
<400> 21
acttcaagat ccgccacaac at 22
<210> 22
<211> 21
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> P8
<400> 22
tctcgttggg gtcttgctca g 21
<210> 23
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> M13 F
<400> 23
cccagtcacg acgttgtaaa acg 23
<210> 24
<211> 23
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> M13 R
<400> 24
agcggataac aatttcacac agg 23

Claims (10)

1.分离的核酸分子,其包含编码所述编码腺相关病毒(AAV)Rep78蛋白的核苷酸序列和编码Rep52蛋白的核苷酸序列,其中所述编码Rep52蛋白的核酸分子包含SEQ ID NO:12所示的核苷酸序列。
2.根据权利要求1所述的分离的核酸分子,其还包括启动所述编码AAV Rep78蛋白的核苷酸序列转录的第一启动子和启动所述编码AAV Rep52蛋白的核酸分子的第二启动子,所述第一启动子与第二启动子相同或不同。
3.根据权利要求2所述的分离的核酸分子,其中所述第一启动子和第二启动子各自独立地选自:p10启动子、Polyhedrin(polh)启动子和IE1启动子。
4.根据权利要求2-3中任一项所述的分离的核酸分子,其中所述第一启动子和第二启动子的转录方向相同或相反。
5.根据权利要求4所述的分离的核酸分子,当第一启动子和第二启动子的转录方向相反时,其依次包含编码Rep78的核苷酸序列、第一启动子、第二启动子、编码Rep52的核苷酸序列,其中所述第一启动子启动所述编码Rep78蛋白的核苷酸序列的转录,所述第二启动子启动所述编码Rep52蛋白的核苷酸序列的转录。
6.根据权利要求1-5中任一项所述的分离的核酸分子,其包含SEQ ID NO:8所示的核苷酸序列。
7.载体,其包含权利要求1-6中任一项所述的分离的核酸分子。
8.细胞,其包含权利要求1-6中任一项所述的分离的核酸分子或权利要求7所述的载体。
9.杆状病毒表达系统,其包含第一杆状病毒载体以及包含编码目的基因的核酸序列的第二杆状病毒载体,所述第一杆状病毒载体为权利要求7所述的载体。
10.含有编码第一氨基酸序列的第一核苷酸序列和编码第二氨基酸序列的第二核苷酸序列的昆虫细胞,其中所述第一核苷酸序列包含编码Rep78蛋白的核苷酸序列,所述第二核苷酸序列编码Rep52蛋白的核苷酸序列,其中所述第一核苷酸序列包含SEQ ID NO:11所示的核苷酸序列,第二核苷酸序列包含SEQ ID NO:12所示的核苷酸序列。
CN202210127524.1A 2022-02-11 2022-02-11 杆状病毒载体及其用途 Active CN114703203B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210127524.1A CN114703203B (zh) 2022-02-11 2022-02-11 杆状病毒载体及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210127524.1A CN114703203B (zh) 2022-02-11 2022-02-11 杆状病毒载体及其用途

Publications (2)

Publication Number Publication Date
CN114703203A true CN114703203A (zh) 2022-07-05
CN114703203B CN114703203B (zh) 2024-08-06

Family

ID=82166547

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210127524.1A Active CN114703203B (zh) 2022-02-11 2022-02-11 杆状病毒载体及其用途

Country Status (1)

Country Link
CN (1) CN114703203B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040197895A1 (en) * 2001-11-09 2004-10-07 Kotin Robert M. Packaging lines for generation of high titers or recombinant aav vectors
CN101868547A (zh) * 2007-07-26 2010-10-20 阿姆斯特丹分子治疗股份有限公司 包含具有差别密码子偏性的重复编码序列的杆状病毒载体
CN106459984A (zh) * 2014-03-10 2017-02-22 优尼科Ip有限公司 昆虫细胞中产生的进一步改善的aav载体
CN106916793A (zh) * 2015-12-24 2017-07-04 中国科学院武汉物理与数学研究所 一种重组腺相关病毒的制备方法及重组杆状病毒
CN113454232A (zh) * 2019-02-15 2021-09-28 世代生物公司 封闭端dna(cedna)产生中对rep蛋白活性的调节

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040197895A1 (en) * 2001-11-09 2004-10-07 Kotin Robert M. Packaging lines for generation of high titers or recombinant aav vectors
CN101868547A (zh) * 2007-07-26 2010-10-20 阿姆斯特丹分子治疗股份有限公司 包含具有差别密码子偏性的重复编码序列的杆状病毒载体
CN106459984A (zh) * 2014-03-10 2017-02-22 优尼科Ip有限公司 昆虫细胞中产生的进一步改善的aav载体
US20170356008A1 (en) * 2014-03-10 2017-12-14 Uniqure Ip B.V. Further Improved AAV Vectors Produced in Insect Cells
CN106916793A (zh) * 2015-12-24 2017-07-04 中国科学院武汉物理与数学研究所 一种重组腺相关病毒的制备方法及重组杆状病毒
CN113454232A (zh) * 2019-02-15 2021-09-28 世代生物公司 封闭端dna(cedna)产生中对rep蛋白活性的调节

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HAIFENG CHEN: "Intron splicing-mediated expression of AAV Rep and Cap genes and production of AAV vectors in insect cells", MOLECULAR THERAPY, vol. 16, no. 5, pages 1 *

Also Published As

Publication number Publication date
CN114703203B (zh) 2024-08-06

Similar Documents

Publication Publication Date Title
CA2558313C (en) New expression tools for multiprotein applications
US6723551B2 (en) Production of adeno-associated virus in insect cells
CA2467959C (en) Production of adeno-associated virus in insect cells
KR102708770B1 (ko) 트리코플루시아 니 번데기에서의 재조합 단백질의 발현
KR101307880B1 (ko) 폴리진을 사용한 멀티단백질 복합체의 재조합 발현
AU2018338188B2 (en) SOD1 dual expression vectors and uses thereof
CN109451729B (zh) 工程化病毒载体减少了炎症和免疫反应的诱导
JP7725514B2 (ja) 結節性硬化症の遺伝子治療
AU2025283486A1 (en) Gene therapy for the treatment of galactosemia
CN114008209A (zh) Aav介导的枫糖尿症(msud)基因疗法
KR20190118163A (ko) 가족성 고콜레스테롤혈증을 치료하기 위한 유전자 요법
CN114846141B (zh) 一种分离的核酸分子及其应用
CN114703203B (zh) 杆状病毒载体及其用途
CN117795086A (zh) 用于枫糖尿症(msud)中bcaa调节的基因疗法
AU2025201572A1 (en) Nucleic acid construct for increasing adeno-associated virus yield, and construction method therefor
CN114231564B (zh) 一种rAAV载体核心质粒及其应用
CN115298307A (zh) 核酸调节元件的新组合及其方法和用途
KR102208879B1 (ko) 핵산 구조 및 이의 용도
CN113667017A (zh) 一种可提高CRISPR/Cas9系统同源重组效率的方法和应用
CN115704023A (zh) 靶向USH2A基因pre-mRNA的gRNA、递送系统和CRISPR-Cas系统
KR20210106489A (ko) 가족성 고콜레스테롤혈증을 치료하기 위한 유전자 요법
KR102175930B1 (ko) Cux2 유전자의 인핸서 인자 및 이의 용도
CN105925610B (zh) 昆虫杆状病毒表达载体、构建方法及其应用
HK40075438B (zh) 一种分离的核酸分子及其应用
CN116768983A (zh) 一种用于慢性乙型肝炎预防和/或治疗的蛋白、编码基因、重组腺相关病毒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant