[go: up one dir, main page]

CN119563026A - 新型冠状病毒S蛋白的mRNA及其应用 - Google Patents

新型冠状病毒S蛋白的mRNA及其应用 Download PDF

Info

Publication number
CN119563026A
CN119563026A CN202380054184.7A CN202380054184A CN119563026A CN 119563026 A CN119563026 A CN 119563026A CN 202380054184 A CN202380054184 A CN 202380054184A CN 119563026 A CN119563026 A CN 119563026A
Authority
CN
China
Prior art keywords
seq
rna
polynucleotide
sequence
utr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202380054184.7A
Other languages
English (en)
Inventor
黄慧
庞司林
李林鲜
李永兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Xinxin Biotechnology Co ltd
Original Assignee
Shenzhen Xinxin Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Xinxin Biotechnology Co ltd filed Critical Shenzhen Xinxin Biotechnology Co ltd
Publication of CN119563026A publication Critical patent/CN119563026A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • A61K39/215Coronaviridae, e.g. avian infectious bronchitis virus
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K39/12Viral antigens
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/165Coronaviridae, e.g. avian infectious bronchitis virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • A61K2039/575Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2 humoral response
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/317Chemical structure of the backbone with an inverted bond, e.g. a cap structure
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/33Chemical structure of the base
    • C12N2310/334Modified C
    • C12N2310/33415-Methylcytosine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20022New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/20011Coronaviridae
    • C12N2770/20034Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Virology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Communicable Diseases (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Oncology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Epidemiology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Mycology (AREA)
  • Pulmonology (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

提供了一种编码新型冠状病毒S蛋白的RNA、包含该RNA的疫苗及其应用。还提供了一种通用型多核苷酸分子,其包含5′‑UTR和/或3′‑UTR,以及编码感兴趣的蛋白和/或多肽的核酸序列,并且任选包含polyA。

Description

新型冠状病毒S蛋白的mRNA及其应用 技术领域
本发明属于生物制药领域。具体而言,本发明涉及编码新型冠状病毒S蛋白的RNA、包含所述RNA的疫苗及其应用。本发明还涉及一种用于制备新型mRNA疫苗的通用型多核苷酸分子,其包含5’-UTR和编码感兴趣的多肽的核酸序列,并且任选包含3’-UTR和/或polyA。
背景技术
新型冠状病毒(SARS-COV-2)能够引起严重的传染性疾病,具有传染性高等特点,国际病毒分类学委员会(ICTV)将此病毒命名为SARS冠状病毒2型(severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)。目前已有部分针对该病毒的灭活疫苗、减活疫苗以及重组蛋白亚单位疫苗等,取得一部分效果。但是SARS-COV-2一直在不断突变进化,衍生出许多新型的感染力和致病力更强的毒株,这些新的突变病毒对原有的疫苗产生的抗体产生免疫逃避。因此,研发有效的可以预防突变型的COVID-19疫苗仍是控制疫情或彻底清除疫情的最佳手段和迫切需求。
SARS-COV-2属于冠状病毒科,冠状病毒颗粒呈球形或椭圆形,病毒有包膜(envelope),包膜上存在棘突(spike),内部基因组为单股正链RNA(+ssRNA),病毒整个病毒颗粒在电镜下像皇冠或日冕状。病毒基因组根据其作用可以分为两大类:主要负责编码与病毒复制和转录相关的酶等非结构蛋白的开放阅读框(Open reading frame,ORF)ORF1a和ORF1b,以及编码结构蛋白的基因序列,如编码刺突蛋白(Spike protein,S)、包膜蛋白(Envelope membrane protein,E)、膜蛋白(Membrane protein,M)和核衣壳蛋白(Nucleocapsid protein,N)等主要结构蛋白。其中S蛋白可以识别并结合宿主细胞表面受体血管紧张素转化酶2(angiotensin converting enzyme 2,ACE2),介导病毒和宿主细胞膜融合。S蛋白也是诱导宿主产生体液和细胞免疫反应,尤其是体液免疫反应的主要抗原。因此S蛋白适合成为开发针对新冠疫苗的靶标。
mRNA(messenger RNA)是一种单链的RNA分子。它以细胞核中的基因组DNA序列为模板制造然后输出到细胞质中,并在核糖体中翻译产生特定的蛋白从而发挥生物学效应。成熟的mRNA主要含有以下几个结构:5’-帽子结构、5’-UTR、编码区、3’-UTR和polyA尾。其中5’-帽子结构对于核糖体的识别和保护mRNA分子免受RNase的影响至关重要。非翻译区5’-UTR和3’-UTR控制着mRNA分子的稳定性和翻译效率,3’-UTR甚至决定了mRNA的细胞质定位。编码区主要由密码子组成,由核糖体编码并翻译成蛋白质。起始密码子一般为AUG,终止密码子真核细胞中一般为UGA。polyA尾是一段长的腺嘌呤核苷酸序列,polyA尾促进细胞核的输出和翻译并且保护mRNA免于降解。
与重组蛋白亚单位疫苗、灭活疫苗或者DNA疫苗相比,mRNA疫苗具有几个明显的优势。首先,由于mRNA不会感染机体也不会整合基因组DNA,因此大大提高了安全性。其次,使用修饰碱基可以降低mRNA分子的固有免疫原性并减少其被机体降解,进一步提高mRNA疫苗的安全性和mRNA的稳定性。另外,体外mRNA合成的产率很高,因此mRNA疫苗具有高效、可快速开发以及低成本制造和便于安全管理的潜力。对于控制新型爆发的病毒而言,人们可以更快速的开发和大规模生产针对新病毒的mRNA疫苗,因此相对于传统疫苗产品,mRNA疫苗研发极具潜力。
SARS-COV-2从产生到现在,突变进化出许多不同的变异株,包括Alpha(如B.1.1.7变体及其后代谱系)、Beta(如B.1.351变体及其后代谱系)、Gamma(如P.1变体及其后代谱系)、Delta(如B.1.617.2及AY谱系)以及Omicron等,随着Delta和Omicron等突变谱系在全球的广泛传播和流行,使现有疫苗的中和抗体的效率显著降低,导致目前已有疫苗诱导的保护作用减弱,传播能力和疾病严重程度增加,已经成为全球关注的变体(variant of concern,VOC)。因此,快速研发出新型的针对新型冠状病毒变异株的mRNA疫苗极具挑战和重大的意义。
mRNA的非翻译区(untranslated region,UTR)控制基因的翻译、降解和定位,包括茎环结构、上游起始密码子、上游开放阅读框、内部核糖体进入位点和各种与RNA结合蛋白结合的顺式作用元件。
UTR在基因表达的转录后调节中起着至关重要的作用,包括调节mRNA出核转运和翻译效率、亚细胞定位和稳定性。UTR也可能发挥其他作用,例如在编码硒蛋白的mRNA的UGA密码子处特异性 掺入修饰的氨基酸硒半胱氨酸,该过程由3’-UTR中的保守茎环结构介导。
本领域技术人员知晓,mRNA分子的翻译效率直接影响mRNA药物(特别是mRNA疫苗)的给药剂量和给药间隔,最终影响mRNA药物的生物利用度并决定mRNA药物的临床应用价值。虽然已经有用于增加mRNA分子翻译效率和稳定性的技术方案,例如通过添加非翻译区(UTR)来提高mRNA分子的翻译效率,但在提高mRNA分子翻译效率方面,仍然存在进一步改进的需求。
因此,需要鉴定或设计可以实现更高的mRNA翻译效率和/或稳定性的UTR。
发明内容
本申请发明人预料不到地发现,通过对新型冠状病毒突变位点进行分析,设计了一种新的新型冠状病毒S蛋白的RNA编码序列并由此制备新型mRNA疫苗。所述mRNA疫苗对不同毒株,包括新型冠状病毒野生型SARS-COV-2、Delta和Omicron变异株具有交叉保护反应,并对Delta和Omicron变异株具有良好的免疫作用,且可以更快速的开发和大规模生产。
本申请发明人还出乎意料地构建了一种用于制备新型mRNA疫苗的通用型多核苷酸分子,其包含5’-UTR和编码感兴趣的蛋白和/或多肽的核酸序列,并且任选包含3’-UTR和/或polyA。这些创新性设计提高了mRNA表达蛋白的水平。所述多核苷酸分子不仅可以用于制备对新型冠状病毒野生型SARS-COV-2、Delta和Omicron变异株具有良好免疫作用的mRNA疫苗,还可以用于转染细胞或者细菌以生产相应的抗体或者抗原蛋白,因而是一个通用性的核心元件组合。
另外,本申请发明人鉴定出多种可提高mRNA分子翻译效率和/或稳定性的5’-UTR和/或3’-UTR、以及含有所述UTR的RNA(例如mRNA),上述UTR属于通用性的核心元件,赋予含有所述UTR的RNA(例如mRNA)增强的翻译效率,显著提升目标基因的表达和/或mRNA稳定性,在RNA药物产业化中具有广泛的应用价值。
附图说明
图1A为质粒H构建流程图;
图1B为工程质粒构建流程图;
图2为荧光素酶-pcDNA3的质粒图谱;
图3为本发明中质粒B的质粒图谱;
图4为本发明中质粒C的质粒图谱;
图5为本发明中质粒D的质粒图谱;
图6为本发明中质粒F的质粒谱图;
图7为本发明中质粒G的质粒谱图;
图8为本发明中质粒H的质粒谱图;
图9为本发明中工程质粒的谱图;
图10A为质粒H构建改造示意图;
图10B为工程质粒构建改造示意图;
图11为不同的5’-UTR mRNA注射小鼠,体内肝脏活体成像结果;
图12为不同的5’-UTR mRNA注射小鼠,体内肝脏活体成像平均光子数汇总结果;
图13为固定5’-UTR,不同的3’-UTR组合生产的小鼠体内肝脏活体成像结果;
图14为固定5’-UTR,不同的3’-UTR组合生产的小鼠体内肝脏活体成像平均光子数汇总结果;
图15为筛选polyA小鼠体内肝脏活体成像结果;
图16为筛选polyA小鼠体内肝脏活体成像平均光子数汇总结果;
图17为工程质粒转染细胞表达抗原蛋白的western blot结果;
图18为工程质粒和新型冠状病毒mRNA转染细胞表达抗原蛋白的FACS流式结果;
图19为新型冠状病毒mRNA转染细胞表达水平ELISA结果;
图20为新型冠状病毒mRNA疫苗制剂免疫小鼠,小鼠血清特异性针对Delta变异株S蛋白的IgG抗体测试结果;
图21为新型冠状病毒mRNA体内免疫实验,针对SARS-COV-2假病毒中和测试结果;
图22为新型冠状病毒mRNA体内免疫实验,针对Delta假病毒中和测试结果;
图23为新型冠状病毒mRNA疫苗体内免疫小鼠后诱导的针对Omicron变异株S蛋白的IgG抗体测试结果;
图24为新型冠状病毒mRNA疫苗体内免疫小鼠后诱导的针对Omicron(BA.2)假病毒的中和抗体测试结果;
图25为新型冠状病毒mRNA疫苗体内免疫小鼠后的脾脏淋巴细胞Elispot(IFN-γ)测试结果;
图26包含单独的3UTR-NO3,3UTR-NO30,3UTR-NO50的mRNA的体内肝脏活体成像结果;
图27包含单独的3UTR-NO3,3UTR-NO30,3UTR-NO50的mRNA体内肝脏活体成像平均光子数汇总结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
定义
本文引用的所有专利、专利申请、科学出版物、制造商的说明书和指南等,无论上文或下文,均整体援引加入本文。本文中的任何内容均不应理解为承认本公开无权先于这样的公开。
除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白和核酸化学、分子生物学、细胞和组织培养、微生物学相关术语均为相应领域内广泛使用的术语(参见,例如,Molecular Cloning:A Laboratory Manual,2nd Edition,J.Sambrook et al.eds.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor 1989)。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。
如本文所用,表述“包括”、“包含”、“含有”和“具有”是开放式的,表示包括所列举的元素、步骤或组分但不排除其他未列举的元素、步骤或组分。表述“由……组成”不包括未指定的任何元素、步骤或组分。表述“基本上由……组成”是指范围限于指定的元素、步骤或组分,加上不显著影响要求保护的主题的基本和新颖性质的任选存在的元素、步骤或组分。应当理解,表述“基本上由……组成”和“由……组成”涵盖在表述“包含”的含义之内。
如本文所用,除非上下文另外指明,否则在描述本发明的上下文中(特别是在权利要求的上下文中)使用的单数形式表述的“一”和“一个/种”和“所述”以及类似的引用应被解释为涵盖单数和复数两者。术语“一个或多个”或者“至少一个”涵盖1、2、3、4、5、6、7、8、9个或更多个。术语“至少一种”涵盖1、2、3、4、5、6、7、8、9种或更多种。术语“至少两个”涵盖2、3、4、5、6、7、8、9个或更多个。术语“至少两种”涵盖2、3、4、5、6、7、8、9种或更多种。
本文中所述的数值范围应理解为涵盖其中包含的任何和所有子范围。例如,范围“1至10”应理解为不仅包括明确记载的1和10的值,而且还包括1至10范围内的任何单个值(例如2、3、4、5、6、7、8和9)和子范围(例如1至2、1.5至2.5、1至3、1.5至3.5、2.5至4、3至4.5等等)。该原则亦适用于仅用一个数值作为最小值或最大值的范围。
除非另有说明,否则本文描述的所有方法均可以以任何合适的顺序进行。
如本文所用,术语“野生型”表示该序列是天然存在的并且未经人为修饰的,包括天然存在的突变体。术语“片段”或“核酸的片段”涉及核酸的一部分。例如在5’和/或3’端缩短的核酸。核酸的片段包含来自所述核酸的至少50%、60%、70%或80%。在一些实施方案中,核酸的片段包含来自所述核酸的至少70%或80%。优选至少90%、95%、96%、97%、98%或99%的核苷酸残基。通常可以是核酸的全长的较短部分。
关于核酸中的术语“变体”是指核酸变体,该核酸变体的至少一个核苷酸与参考核酸(或称“母本”)不同。与参考核酸相比,变体核酸包括单个或多个核苷酸缺失、添加、突变和/或插入,其中:缺失包括从 参考核酸移除一个或更多个核苷酸;添加包括将一个或更多个核苷酸(例如1、2、3、5、10、20、30、50个或更多个核苷酸)与参考核酸的5’和/或3’端融合;突变可以包括但不限于替换(例如至少一个核苷酸被移除并且在其位置插入另一个核苷酸(例如颠换和转换));插入包括添加至少一个核苷酸。在一些实施方案中,核酸变体为5’-UTR的变体、3’-UTR的变体或ployA的变体。在一些实施方案中,核酸变体中所引入的突变能够使核酸变体避免被核酸酶识别而被酶切、避免与microRNA结合以及避免产生发卡结构或G-四链体(G-quadruplex)等复杂二级结构。例如,核酸变体为源自HDGFL1基因(GenBank登录号为NM_138574.4)的3’-UTR的变体,该变体在HDGFL1基因的3’-UTR的基础上将其中的两个“C”突变为两个“A”,以避免被核酸酶识别而被酶切。
本文使用的术语“核酸变体”包括天然存在的变体和工程化变体。因此,本文所定义的“核酸变体”可从参考核酸衍生、分离、相关、基于或同源于参考核酸序列。“核酸变体”可选具有与相应天然存在的(野生型)核酸或其同系物、片段或衍生物的至少5%、10%、20%、30%、40%、50%、60%、70%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些实施方案中,至少70%、至少80%、至少85%、至少90%、至少95%或至少97%的序列同一性。可以理解的是,对于核酸分子,术语“变体”包括简并性核酸序列,其中根据本发明的简并性核酸序列是由于遗传密码的简并性而在密码子序列中与参考核酸不同的核酸。
如本文所用,关于术语“%相同性”或“%同一性”是指在待比较的序列之间的最佳比对中相同的核苷酸或氨基酸的百分比,两个序列之间的差异可以分布在待比较序列的局部区域(区段)或整个长度上。通常在对区段或“比较窗口”最佳比对之后,确定两个序列之间的相同性。最佳比对可以手动进行或者借助于本领域已知算法。本领域已知算法包括但不限于Smith and Waterman,1981,Ads App.Math.2,482和Neddleman and Wunsch,1970,J.Mol.Biol.48,443描述的局部同源性算法,Pearson and Lipman,1988,Proc.Natl Acad.Sci.USA 88,2444描述的相似性搜索方法,或使用计算机程序,例如Wisconsin Genetics Software Package,Genetics Computer Group,575Science Drive,Madison,Wis.中的GAP、BESTFIT、FASTA、BLAST P、BLAST N和TFASTA进行。例如,可以利用美国国家生物技术信息中心(NCBI)网站公共可用的BLASTN或BLASTP算法确定两个序列的百分比相同性。
“%相同性”或“%同一性”可以通过如下获得:通过确定待比较的序列对应的相同位置的数目,用这个数目除以比较的位置数目(例如,参考序列中的位置数目),并将这个结果乘以100,获得%相同性。在一些实施方案中,至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%或约100%的区域给出相同性程度。在一些实施方案中,对参考序列的整个长度给出相同性程度。可以用本领域已知的工具进行确定序列相同性的比对,优选利用最佳序列比对,例如,利用Align,利用标准设置,优选EMBOSS::needle、Matrix:Blosum62、Gap Open 10.0、Gap Extend 0.5。
在一些实施方案中,特定核酸的片段或变体或者与特定核酸具有特定同一性程度的核酸具有所述特定核酸的至少一种功能特性,并且优选地与所述特定核酸是功能上等同的,例如展现出与特定核酸的特性相同或相似的特性的核酸。
在本文中,“核苷酸”包括脱氧核糖核苷酸、核糖核苷酸、脱氧核糖核苷酸衍生物、及核糖核苷酸衍生物。如本文所用,“核糖核苷酸”是核糖核酸(RNA)的构成物质,由一分子碱基、一分子五碳糖和一分子磷酸组成,其是指在β-D-呋喃核糖(β-D-ribofuranosyl)基团的2’位置具有羟基的核苷酸而“脱氧核糖核苷酸”是脱氧核糖核酸(DNA)的构成物质,也是由一分子碱基、一分子五碳糖和一分子磷酸构成,其是指在β-D-呋喃核糖(β-D-ribofuranosyl)基团的2’位置的羟基被氢取代的核苷酸,是染色体的主要化学成分。
“核苷酸”通常由代表其中碱基的单字母来指代:“A”或“A核苷酸”指含有腺嘌呤的腺嘌呤脱氧核糖核苷酸或腺嘌呤核糖核苷酸,“C”或“C核苷酸”指含有胞嘧啶的胞嘧啶脱氧核糖核苷酸或胞嘧啶核糖核苷酸,“G”或“G核苷酸”指含有鸟嘌呤的鸟嘌呤脱氧核糖核苷酸或鸟嘌呤核糖核苷酸,“U”或“U核苷酸”指含有尿嘧啶的尿嘧啶核糖核苷酸,“T”或“T核苷酸”指含有胸腺嘧啶的胸腺嘧啶脱氧核糖核苷酸。
如本文所用,术语“核酸”是通常地指包含脱氧核糖核苷酸的聚合物(脱氧核糖核酸,简称DNA)或 核糖核苷酸的聚合物(核糖核酸,简称RNA)或其组合的任何化合物。另外,本文中的核酸还包括核酸的衍生物。术语“核酸的衍生物”包括对核酸在核苷酸的碱基上、糖上或磷酸上的化学衍生化,以及含有非天然核苷酸和核苷酸类似物的核酸。此外,在本文中,核酸可以是单链或双链的线性或共价闭合环状分子的形式。
“多核苷酸序列”、“核酸序列”和“核苷酸序列”可以互换使用,用来表示多核苷酸中核苷酸的排序。本领域人员应当理解,DNA编码链(有义链)与其编码的RNA可以看作具有相同的核苷酸序列,DNA编码链序列中的脱氧胸苷酸对应其编码的RNA序列中的尿苷酸。DNA编码的RNA是指与该DNA对应的RNA,即该DNA中的T全部替换为U后的多核苷酸,例如序列SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA是指序列SEQ ID NO:47~67中至少一个所示的多核苷酸(DNA)对应的RNA,即序列SEQ ID NO:47~67中至少一个所示的多核苷酸中的T全部替换为U后的多核苷酸。DNA序列相对应的RNA序列是指该DNA序列中的T全部替换为U后的核酸序列,例如SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列是指SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列中的T全部替换为U后的核酸序列。
多核苷酸可以包含一个区段或多个区段(核酸片段)(例如1、2、3、4、5、6、7、8个区段)。例如,多核苷酸可以包含编码感兴趣多肽(例如本文所述多肽和多肽抗原)的区段。在特定实施方案中,多核苷酸可以包含编码感兴趣多肽的区段以及调控区段(包括但不限于用于转录调控和翻译调控的区段)。在一实施方案中,调控区段包含以下的一个或多个起调控作用的元件所对应的多核苷酸:启动子、5’非翻译区(5’-UTR)、3’非翻译区(3’-UTR)和poly(A)尾。
术语“启动子”是指位于基因的编码区5’端上游的多核苷酸,它含有RNA聚合酶特异性结合和转录起始所需的保守序列,能活化RNA聚合酶,使RNA聚合酶与模板DNA能准确的结合并具有转录起始的特异性。启动子可以源自包括病毒、细菌、真菌、植物、昆虫和动物。启动子的代表性实例包括噬菌体T7启动子、噬菌体T3启动子、SP6启动子、lac操纵子-启动子、tac启动子、SV40晚期启动子、SV40早期启动子、RSV-LTR启动子、CMV IE启动子、SV40早期启动子或SV 40晚期启动子和CMV IE启动子。
如本文所用,术语“5’非翻译区”或“5’-UTR”可以是mRNA中位于编码序列上游,且不被翻译为蛋白质的RNA序列。基因中的5’-UTR通常从转录起始位点开始,且在编码序列的翻译起始密码子上游的核苷酸结束。5’-UTR可以包含控制基因表达的元件,如核糖体结合位点、5’-末端寡嘧啶束和翻译起始信号如Kozak序列。mRNA可以通过添加5’帽进行转录后修饰。因此,成熟mRNA中的5’-UTR也可以指5’帽和起始密码子之间的RNA序列。
如本文所用,术语“3’非翻译区”或“3’-UTR”可以是mRNA中位于编码序列下游,且不被翻译为蛋白质的RNA序列。mRNA中的3’-UTR位于编码序列的终止密码子和poly(A)序列之间,例如从终止密码子下游的核苷酸开始到poly(A)序列上游的核苷酸结束。
如本文所用,“源自基因A的5’或3’-UTR”是指来自基因A的mRNA的5’或3’-UTR。源自基因A的5’或3’-UTR可以是基因A的mRNA的全部5’或3’-UTR,也可以是基因A的mRNA的部分5’或3’-UTR,基因A的mRNA的部分5’或3’-UTR包括将基因A的mRNA的5’-UTR的多个片段拼接而成的部分5’-UTR或将基因A的mRNA的3’-UTR的多个片段拼接而成的部分3’-UTR。
如本文所用,术语“聚腺苷酸”、“polyA”、“poly(A)序列”和“poly(A)尾”可互换使用,天然存在的poly(A)序列通常由腺嘌呤核糖核苷酸组成。根据本发明,术语“经修饰的poly(A)序列”是指包含除腺嘌呤核糖核苷酸之外的核苷酸或核苷酸区段的poly(A)序列。poly(A)序列通常位于mRNA的3’端,例如3’-UTR的3’端(下游)。
如本文所用,术语“5’-帽子结构”:5’-帽子结构通常位于成熟mRNA的5’末端。在一些实施方案中,5’-帽子结构通过5’-5’-三磷酸酯键与mRNA的5’-末端连接。5’-帽子结构通常是由修饰的(例如甲基化的)核糖核苷酸(尤其是由鸟嘌呤核苷酸衍生物)形成。例如m7GpppN(帽0或称“cap0”,是hnRNA的5′磷酸基团在鸟苷酸转移酶的作用下与m7GTP的5′-磷酸基团作用形成5′,5′-磷酸二酯键而形成的帽结构),其中N是携带5’-帽子结构的核酸的末端5′核苷酸。在一些实施例中,5’-帽子结构包括但不限于帽0、帽1(在帽0的基础上对hnRNA第一个核苷酸糖基2′-OH进一步发生甲基化而形成的帽结构,或称 “cap1”)、帽2(在帽1的基础上对hnRNA第二位核苷酸糖基2′-OH进一步甲基化而形成的帽结构,或称“cap2”)、帽4、帽0类似物、帽1类似物、帽2类似物或帽4类似物。
如本文所用,术语“表达”包括核苷酸序列的转录和/或翻译。因此,表达可以涉及转录物和/或多肽的产生。术语“转录”涉及将DNA序列中的遗传密码转录为RNA(转录物)的过程。术语“体外转录”指在不含细胞的系统中(例如在适当的细胞提取物中)体外合成RNA,特别是mRNA(参见,例如Pardi N.,Muramatsu H.,Weissman D.,KarikóK.(2013).In:Rabinovich P.(eds)Synthetic Messenger RNA and Cell Metabolism Modulation.Methods in Molecular Biology(Methods and Protocols),vol 969.Humana Press,Totowa,NJ.)。可以用于产生转录物的载体又称为“转录载体”,其中包含转录所需的调控序列。术语“转录”涵盖“体外转录”。
如本文所用,术语“多肽”指包含通过肽键共价连接的两个以上氨基酸的聚合物。“蛋白”可以包含一条或多条多肽,其中多肽之间通过共价或非共价方式相互作用。
如本文所用,术语“宿主细胞”指用于接受、保持、复制、表达多核苷酸或载体的细胞。术语“宿主细胞”包含原核细胞(例如大肠杆菌)或真核细胞(例如酵母细胞和昆虫细胞)。例如来自人、小鼠、仓鼠、猪、山羊、灵长类的细胞。细胞可以来源于多种组织类型,并且包含初级细胞和细胞系。一些具体实例包括角质形成细胞、外周血白细胞、骨髓干细胞和胚胎干细胞。在另一些实施方案中,宿主细胞是抗原呈递细胞,特别地树突细胞、单核细胞或巨噬细胞。核酸可以以单拷贝或以数个拷贝存在于宿主细胞中。在一些实施方案中,宿主细胞可以是在其中表达本发明的多肽的细胞。
在本文中,术语“重组”或“重组的”意指“通过基因工程产生的”。在一些实施方案中,在本发明的上下文中,“重组物质”例如重组RNA分子是非天然存在的。本文所用的术语“天然出现的”或“天然存在的”是指物质可见于自然界中的事实。例如,存在于生物体(包括病毒)中和可从自然界来源中分离的并且未在实验中人工有意修饰的肽或核酸是天然存在的。
在本发明的上下文中,术语“质粒”通常是指环状DNA分子,但是该术语还可以涵盖线性化DNA分子。具体地,术语“质粒”还涵盖通过例如用限制酶消化环状质粒,从而使该环状质粒分子转变成线性分子而使该环状质粒线性化所得到的分子。质粒可以复制,即在细胞中独立于作为染色体DNA存储的遗传信息扩增,并且可以用于克隆,即用于在细菌细胞中扩增遗传信息。在一些实施方案中,所述DNA质粒是中拷贝或高拷贝质粒。在一些实施方案中,所述DNA质粒是高拷贝质粒。此类高拷贝质粒的实例包括,例如,pUC和pTZ质粒或包含支持质粒高拷贝的复制起点的任意其它质粒(例如pMB1、pCoIE1)。
如本文所用,术语“疫苗”典型地被理解为提供至少一种抗原或具有抗原功能的预防性或治疗性材料,可以刺激身体的适应性免疫系统提供适应性免疫应答。
如本文所用,术语“抗原”通常指可被免疫系统识别的物质,优选由适应性免疫系统识别,并且能够触发抗原特异性免疫应答(例如形成抗体和/或抗原特异性T细胞)。通常,抗原可以是或可以包含可由MHC呈递给T细胞的肽或蛋白质。在本公开的意义上,抗原可以是所提供的核酸(例如本文的RNA、RNA分子、DNA)的翻译产物。此外,从包含至少一个表位或抗原(例如肿瘤抗原、病毒抗原、细菌抗原、原生动物抗原)的肽或蛋白衍生的肽或蛋白质的片段、变体和衍生物可理解为抗原。
术语“治疗”等在本文中用于通常意指获得期望的药理学和/或生理学效果。因此,本发明的治疗可以涉及某种疾病的状态的治疗,但是也可以涉及就完全或部分预防疾病或其症状而言的预防性治疗。在一些实施方案中,术语“治疗”应理解为在部分或完全治愈疾病和/或归因于该疾病的不利作用和/或症状方面是治疗性的。治疗也可以是预防性(prophylactic)或预防性(preventive)治疗,即为预防疾病而采取的措施,例如为了预防感染和/或疾病的发作。
如本文所用,术语“受试者”和“患者”可以互换使用。在某些实施方案中,受试者是哺乳动物,例如人、非人灵长类动物(例如猿猴、黑猩猩、猴子和红毛猩猩)、家养动物(包括狗和猫以及家畜(例如马、牛、猪、绵羊和山羊))或者其他哺乳动物。其他哺乳动物包括但不限于小鼠、大鼠、天竺鼠、兔子、仓鼠等。在特定的实施方案中,受试者是人。在一个实施方案中,受试者是患有传染病或赘生性疾病的哺乳动物(例如人)。在另一个实施方案中,所述受试者是处于发生传染病或赘生性疾病风险的哺乳动物(例如人)。
如本文所用,术语“施用”是指通过任何有效途径向受试者提供或给予药剂。示例性的施用途径包括但不限于下述的一种或多种:注射(例如皮下、肌内、皮内、腹膜内、鞘内、脑室内、或静脉内)、口服、胆管腔内、舌下、直肠、透皮、鼻内、阴道和吸入。当用于治疗疾病、病症、病状或其症状时,通常在疾病、病症、病状或其症状发作后进行物质的施用。当用于预防疾病、病症、病状或症状时,通常在疾病、病症、病状或症状发作之前进行物质的施用。
本文中,将描述本发明的一些要素。这些要素和具体实施方案一起列出,然而应理解,其可以以任何方式和任意数量组合以产生另外的实施方案。不同描述的实例和优选实施方案不应解释为将本发明仅限于明确描述的实施方案。该说明书应理解为支持并包括将明确描述的实施方案与任意数量的所公开和/或优选要素组合的实施方案。此外,除非上下文另外指出,否则本发明中所有描述要素的任意排列和组合应视为被本发明的说明书公开。例如,在一个实施方案中,RNA分子的5’-UTR包括序列如SEQ ID NO:9所示的多核苷酸,并且在另一个实施方案中,RNA分子的3’-UTR包括序列如SEQ ID NO:10所示的多核苷酸,则以下方案也是本发明请求保护一个实施方案:RNA分子的5’-UTR包括序列如SEQ ID NO:9所示的多核苷酸,该RNA分子的3’-UTR包括序列如SEQ ID NO:10所示的多核苷酸。
在第一方面,本发明涉及一种编码新型冠状病毒S蛋白的RNA、包含所述RNA的疫苗及其应用。
在一些实施方案中,本发明提供了一种RNA,其编码新型冠状病毒S蛋白,所述S蛋白包含SEQ ID NO:13所示的氨基酸序列。在一些实施方案中,所述S蛋白的氨基酸序列如SEQ ID NO:13所示;在一些实施方案中,所述RNA为mRNA。
在一些实施方案中,本发明提供了一种RNA,其编码新型冠状病毒S蛋白,所述S蛋白包含与SEQ ID NO:13所示的氨基酸序列具有至少95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%或99.9%的相同性。
在一些实施方案中,所述RNA包含SEQ ID NO:14所示的核酸序列。在一些实施方案中,所述RNA的核酸序列如SEQ ID NO:14所示。
在一些实施方案中,所述RNA中的部分或全部胞嘧啶和/或尿嘧啶进行了可提高所述RNA在生物体内稳定性的化学改性。
在一些实施方案中,所述化学改性包括以下:
所述RNA中的一个或多个尿嘧啶核苷,例如1、2、3、4、5、6、7、8、9、10个尿嘧啶核苷或者至少50%、至少60%、至少70%、至少80%、至少90%或100%的尿嘧啶核苷被至少一种选自以下的核苷替换:假尿苷、N1-甲基假尿苷、N1-乙基假尿苷、2-硫尿苷、4′-硫尿苷、5-甲基胞嘧啶、5-甲基尿苷、2-硫基-1-甲基-1-去氮杂-假尿苷、2-硫基T-甲基-假尿苷、2-硫基-5-氮杂-尿苷、2-硫基-二氢假尿苷、2-硫基-二氢尿苷、2-硫基-假尿苷、4-甲氧基-2-硫基-假尿苷、4-甲氧基-假尿苷、4-硫基-1-甲基-假尿苷、4-硫基-假尿苷、5-氮杂-尿苷、二氢假尿苷或5-甲氧基尿苷和2′-O-甲基尿苷。在一个可选地具体示例中,选自以下核苷替换:假尿苷、N1-甲基假尿苷或N1-乙基假尿苷;和/或
所述RNA中的一个或多个胞嘧啶核苷,例如1、2、3、4、5、6、7、8、9、10个胞嘧啶核苷或者至少50%、至少60%、至少70%、至少80%、至少90%或100%的胞嘧啶核苷被5-甲基胞嘧啶核苷替换。
在一些实施方案中,所述RNA中的全部或部分尿嘧啶核苷被假尿苷。在一些实施方案中,所述RNA中的全部或部分尿嘧啶核苷被N1-甲基假尿苷替换。在一些实施方案中,所述SEQ ID NO:14所示的核酸序列中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换。
在一些实施方案中,所述SEQ ID NO:14所示的核酸序列中的全部尿嘧啶核苷被N1-甲基假尿苷替换。
在一些实施方案中,所述RNA还包含5’-帽结构、5’-UTR、3’-UTR和polyA中的至少一种。
在一些实施方案中,所述5’-帽结构选自m7GpppG、m27,3′-OGpppG、m7Gppp(5′)N1和m7Gppp(m2′-O)N1中的至少一种,优选m7Gppp(5′)N1或m7Gppp(m2′-O)N1,其中“m7G”代表7-甲基鸟苷帽核苷,“ppp”代表帽核苷的5′碳和初级RNA转录物的第一个核苷酸之间的三磷酸酯键,N1是最5′的核苷酸,“G”代表鸟嘌呤核苷,“7”代表在鸟嘌呤的7-位上的甲基,“m2′-O”代表核苷酸2′-O位上的甲基;
和/或所述5’-UTR选自下述(1)-(5):
(1)包含SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列的5’-UTR、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42相对应的RNA序列所示5’-UTR相同或更优的提高翻译效率的功能;在一些实施方案中,所述同源物的核酸序列与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
(2)由SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列组成的5’-UTR;
(3)由SEQ ID NO:9所示核酸序列相对应的RNA序列组成的5’-UTR;
(4)上述(1)-(3)中2个或2个以上相同5’-UTR经串联获得的5’-UTR;或
(5)上述(1)-(3)中2个或2个以上不同5’-UTR经串联获得的5’-UTR;
和/或,所述3’-UTR选自下述(1)-(5):
(1)包含SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列的3’-UTR、其同源物、片段或变体;所述同源物、片段或变体具有与SEQ ID NO:47-67或10相对应的RNA序列所示3’-UTR相同或更优的提高翻译效率和/或稳定性的功能;在一些实施方案中,所述同源物的核酸序列与SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
(2)由SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列组成的3’-UTR;
(3)由SEQ ID NO:10所示核酸序列相对应的RNA序列组成的3’-UTR;
(4)上述(1)-(3)中2个或2个以上相同3’-UTR经串联获得的3’-UTR;或
(5)上述(1)-(3)中2个或2个以上不同3’-UTR经串联获得的3’-UTR;
和/或所述polyA为截断式polyA,即在多个连续的核苷酸A后加一段10bp的非A的接头序列再加多个连续的核苷酸A;在一些实施方案中,polyA为30个连续核苷酸A后加一段10bp的非A的接头序列再加70个连续的核苷酸A;
在一些实施方案中,所述polyA选自下述(1)-(3)中的一种:
(1)包含SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列的polyA、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:68-70、72、75或11相对应的RNA序列所示polyA相同或更优的提高翻译效率和/或稳定性的功能;在一些实施方案中,所述同源物包含与SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同源性的核酸序列;
(2)由SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列组成的polyA;
(3)由SEQ ID NO:11所示核酸序列相对应的RNA序列组成的polyA。
在一些实施方案中,所述RNA包含SEQ ID NO:15所示的核酸序列。在一些实施方案中,其核酸序列如SEQ ID NO:15所示。SEQ ID NO:15序列本身已包含帽子结构:cap G1G2=m7G+-5′-ppp-5′-Gm2′-3′-p-[m7=7-CH3;m2′=2′-O-CH3;-ppp-=-PO2H-O-PO2H-O-PO2H)-;-p-=-PO2H-]。需要注意的是,根据核苷酸或氨基酸序列表WIPO标准ST.26,序列表中RNA序列(例如SEQ ID NO:14、SEQ ID NO:15)中的t(胸腺嘧啶)实际上是u(尿嘧啶)。
在其中所述RNA包含SEQ ID NO:15所示的核酸序列的实施方案中,所述RNA中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换;在一些实施方案中,所述SEQ ID NO:15所示的核酸序列中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换;在一些实施方案中,所述SEQ ID NO:15所示的核酸序列中的全部尿嘧啶核苷被N1-甲基假尿苷替换。
在一些实施方案中,本发明提供了一种蛋白质,其由前述任一种的RNA表达;在一些实施方案中,所述蛋白质包含如SEQ ID NO:13所示的氨基酸序列,在一些实施方案中,其氨基酸序列如SEQ ID NO:13所示。
在一些实施方案中,本发明提供了编码上述任一实施方案的RNA的DNA;在一些实施方案中,所述DNA包含SEQ ID NO:12所示的核酸序列;在一些实施方案中,所述DNA包含SEQ ID NO:8所示的核酸序列。
在一些实施方案中,本发明提供了一种载体,其包含上述任一实施方案的DNA。
在一些实施方案中,本发明提供了一种宿主细胞,其包含上述任一实施方案的载体。
在一些实施方案中,本发明提供了一种脂质纳米颗粒,其包含上述任一实施方案的RNA。
在一些实施方案中,所述脂质纳米颗粒还含有可离子化阳离子脂质、辅助脂质、结构脂质和PEG-脂质中的一种或多种。
在一些实施方案中,所述可离子化阳离子脂质选自Dlin-MC3-DMA、Dlin-KC2-DMA、DODMA、c12-200或DlinDMA中的一种或多种;和/或所述辅助脂质选自DSPC,DOPE,DOPC或DOPS中的一种或多种;和/或所述结构脂质选自胆固醇、胆固醇酯、固醇类激素、固醇类维生素和胆汁酸中的至少一种;和/或所述PEG-脂质选自PEG-DMG或PEG-DSPE,优选为PEG-DMG。PEG-DMG是1,2-二肉豆蔻酸甘油酯的聚乙二醇(PEG)衍生物。在一些实施方案中,PEG的平均分子量约为2000道尔顿~5000道尔顿。在一个可选地具体示例中,PEG的平均分子量约为2000或5000道尔顿。
在一些实施方案中,本发明提供了一种药物组合物,其包含所述RNA、所述蛋白质、所述DNA、所述载体、所述宿主细胞或所述脂质纳米颗粒,以及药学上可接受的载体和/或赋形剂。
在一些实施方案中,本发明提供了所述RNA、所述蛋白质、所述DNA、所述载体、所述宿主细胞或所述脂质纳米颗粒在制备用于预防新型冠状病毒感染的疫苗中的用途。在一些实施方案中,所述新型冠状病毒包括Alpha(如B.1.1.7变体及其后代谱系)、Beta(如B.1.351变体及其后代谱系)、Gamma(如P.1变体及其后代谱系)、Delta(如B.1.617.2及AY谱系)以及Omicron等。
在一些实施方案中,本发明提供了用于在施用对象中控制、预防或治疗由新型冠状病毒引起的感染性疾病的方法,其包括向施用对象施用治疗有效量的所述RNA、所述蛋白质、所述DNA、所述载体、所述宿主细胞、所述脂质纳米颗粒或所述药物组合物。
在一些实施方案中,所述施用对象是人类或非人类哺乳动物。在一些实施方案中,所述施用对象是成人、老人、儿童或幼儿。在一些实施方案中,所述施用对象处于新型冠状病毒感染的风险中或对其有易感性。在一些实施方案中,施用对象已经被诊断新型冠状病毒感染阳性或是无症状的。
在第二方面,本发明还涉及一种可以用于制备新型RNA疫苗(例如mRNA疫苗)的通用型多核苷酸分子,其包含5’-UTR和/或3’-UTR。
在一些实施方案中,本发明提供了一种人工RNA分子,其包含5’-UTR和编码感兴趣的多肽和/或蛋白的核酸序列,所述5’-UTR选自下述(1)-(5):
(1)包含SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列的5’-UTR、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42相对应的RNA序列所示5’-UTR相同或更优的提高翻译效率的功能;在一些实施方案中,所述同源物的核酸序列与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
(2)由SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列组成的5’-UTR;
(3)由SEQ ID NO:9所示核酸序列相对应的RNA序列组成的5’-UTR;
(4)上述(1)-(3)中2个或2个以上相同5’-UTR经串联获得的5’-UTR;或
(5)上述(1)-(3)中2个或2个以上不同5’-UTR经串联获得的5’-UTR。
在本文中,“A、其同源物、片段或变体”是指A、A的同源物、A的片段或A的变体,例如“包含SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列的5’-UTR、其同源物、片段或变体”是指包含SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列的5’-UTR、该5’-UTR的同源物、该5’-UTR的片段或该5’-UTR的变 体。
在一些实施方案中,所述RNA分子进一步包含3’-UTR以及polyA。
在一些实施方案中,所述3’-UTR选自下述(1)-(5):
(1)包含SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列的3’-UTR、其同源物、片段或变体;所述同源物、片段或变体具有与SEQ ID NO:47-67或10相对应的RNA序列所示3’-UTR相同或更优的提高翻译效率和/或稳定性的功能;在一些实施方案中,所述同源物的核酸序列与SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
(2)由SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列组成的3’-UTR;
(3)由SEQ ID NO:10所示核酸序列相对应的RNA序列组成的3’-UTR;
(4)上述(1)-(3)中2个或2个以上相同3’-UTR经串联获得的3’-UTR;或
(5)上述(1)-(3)中2个或2个以上不同3’-UTR经串联获得的3’-UTR。
在一些实施方案中,所述polyA为截断式polyA,即在多个连续的核苷酸A后加一段10bp的非A的接头序列再加多个连续的核苷酸A;在一些实施方案中,polyA为30个连续核苷酸A后加一段10bp的非A的接头序列再加70个连续的核苷酸A。
在一些实施方案中,所述polyA选自下述(1)-(3):
(1)包含SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列的polyA、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:68-70、72、75或11相对应的RNA序列所示polyA相同或更优的提高翻译效率和/或稳定性的功能;在一些实施方案中,所述同源物包含与SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同源性的核酸序列;
(2)由SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列组成的polyA;或
(3)由SEQ ID NO:11所示核酸序列相对应的RNA序列组成的polyA。
在一些实施方案中,本发明还提供了另一种RNA分子,其包含:
(1)编码感兴趣的多肽和/或蛋白的第一核苷酸序列;和
(2)含有3’-非翻译区(3’-UTR)的第二核苷酸序列;
所述3’-UTR包含以下多核苷酸中的至少一种:
(a):源自基因APOA1、UL122、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146和GHRL中的至少一个基因的3’-UTR;在一些实施方案中,源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146和GHRL中的至少一个基因的3’-UTR;
(b):(a)中所述3’-UTR的片段;
(c):(a)中所述3’-UTR的变体;及
(d):(b)中所述片段的变体;
所述第一核苷酸序列和所述第二核苷酸序列不天然出现于同一RNA分子。
在一些实施方案中,所述基因是真核生物的基因。在一些实施方案中,所述基因为动物的基因。在一些实施方案中,所述基因为脊索动物的基因,例如人或小鼠的基因。
在一些实施方案中,所述基因是人基因。
在一些实施方案中,APOA1基因的GenBank登录号(accession number)为NM_000039.3;UL122基因的Gene ID为3077563(对应于GenBank登录号为NC_006273.2的170689..174090),COP1基因的GenBank登录号为AY885669;MYSM1基因的GenBank登录号为NM_001085487.3;ASAH2B基因的GenBank登录号为NM_001079516.4;NDUFAF2基因的GenBank登录号为NG_008978.1;APOD基因的GenBank登录号为NM_001647;HBB基因的GenBank登录号为MK476504.1;TF基因的GenBank登录号为NM_001063.4;TMSB4X基因的GenBank登录号为BC001631.1;CPAMD8基因的GenBank登录号 为NM_015692.5;VIM基因的GenBank登录号为NM_003380.5;HDGFL1基因的GenBank登录号为NM_138574.4;TTR基因的GenBank登录号为NM_000371;SRM基因的GenBank登录号为NM_003132.3;HBA1基因的GenBank登录号为NM_000558.5;PRPF8基因的GenBank登录号为NM_006445.4;LMBRD1基因的GenBank登录号为NM_001367272.1;IFNA1基因的GenBank登录号为NM_024013.3;CCDC146基因的GenBank登录号为NM_020879.3;GHRL基因的GenBank登录号为NM_001134941.3;GH1基因的GenBank登录号为NM_000515.5。
在一些实施方案中,所述第二核苷酸序列包含以下多核苷酸中的至少一种:
(e):源自基因COP1和HDGFL1中的至少一个基因的3’-UTR;
(f):(e)中所述3’-UTR的片段;
(g):(e)中所述3’-UTR的变体;及
(h):(f)中所述片段的变体。
在一些实施方案中,所述第二核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段、变体、或片段的变体与序列如SEQ ID NO:47~67之一所示的多核苷酸编码的RNA相比具有至少1、2、3、4、5、6、7、8、9、10或更多个核苷酸的插入、添加、删除或取代。
需要说明的是,在本文中“A的片段、变体或片段的变体”是A的片段、A的变体或A的片段的变体的简称。例如“序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段、变体、或片段的变体”是指序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的变体、或序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段的变体。在一些实施方案中,A的片段、A的变体、A的片段的变体与A具有相同或更优的性能,例如提高核酸(例如mRNA)的翻译效率和/或稳定性。
在一些实施方案中,所述第二核苷酸序列包含:(a)中所述基因中的至少两个基因的3’-UTR、(a)中所述基因中的至少两个基因的3’-UTR的片段、(a)中所述基因中的至少两个基因的3’-UTR的变体和(a)中所述基因中的至少两个基因的3’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个基因为两个基因、三个基因、四个基因、五个基因、六个基因、七个基因、八个基因、九个基因或十个基因。
在一些实施方案中,所述第二核苷酸序列包含:至少两个拷贝的(a)中的3’-UTR、至少两个拷贝的(a)中的3’-UTR的片段、至少两个拷贝的(a)中的3’-UTR的变体和至少两个拷贝的(a)中的3’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个拷贝为两个拷贝、三个拷贝、四个拷贝、五个拷贝、六个拷贝、七个拷贝、八个拷贝、九个拷贝或十个拷贝。
在一些实施方案中,所述RNA分子进一步还包含启动子、5’-帽子结构、5’-UTR和polyA中的至少一种。
在一些实施方案中,所述RNA分子进一步还包含5’-帽子结构、5’-UTR和polyA中的至少一种。
在一些实施方案中,所述5’-帽子结构包括m7GpppG、m27,3′-OGpppG、m7Gppp(5′)N1和m7Gppp(m2′-O)N1中的至少一种。
在一些实施方案中,所述5’-UTR包含i)~iv)中的一种:
i)源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、 FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR、其片段、变体和片段的变体中的至少一种;
ii)下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体。
iii)至少两个拷贝的i)或ii)中的其中一种多核苷酸。
iv)至少两种i)中的多核苷酸。
在一些实施方案中,5’-UTR的来源基因的物种或具体GenBank登录号可以参考如下文第三核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,i)中的5’-UTR包含或为下述中的一种或多种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,ii)中的序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;在一些实施方案中,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸。
在一些实施方案中,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸。
在一些实施方案中,所述polyA为截断式polyA;在一些实施方案中,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A。在一些实施方案中,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A。
在一些实施方案中,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种。在一些实施方案中,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA。在一些实施方案中,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
在一些实施方案中,所述3’-UTR源自COP1基因的3’-UTR、其片段、变体和片段的变体中的一种或多种,所述5’-UTR包含下述多核苷酸中的一种或多种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、其片段、变体和片段的变体。在一个可选地具体示例中,所述3’-UTR为序列如SEQ ID NO:49所示的多核苷酸编码的RNA、其片段、变体或片段的变体中的一种或多种。需要说明的是,本文中“A、片段、变体和片段的变体”是指A、A的片段、A的变体和A的片段的变体。例如“序列如SEQ ID NO: 9所示的多核苷酸编码的RNA、其片段、变体和片段的变体”是指序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述3’-UTR源自HDGFL1基因的3’-UTR、其片段、变体和片段的变体中的一种或多种,所述5’-UTR包含下述多核苷酸中的一种或多种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、其片段、变体和片段的变体。在一个可选地具体示例中,所述3’-UTR为序列如SEQ ID NO:59所示的多核苷酸编码的RNA、其片段、变体或片段的变体中的一种或多种。
在一些实施方案中,序列如SEQ ID NO:9、49或59所示的多核苷酸编码的RNA的片段、变体和片段的变体,与序列如SEQ ID NO:9、49或59所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,本发明还提供了另一种RNA分子,其包含:
(1)编码感兴趣的多肽和/或蛋白的第一核苷酸序列;和
(2)含有5’-非翻译区(5’-UTR)的第三核苷酸序列;
所述5’-UTR包含以下多核苷酸中的至少一种:
(a):源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR;
(b):(a)中所述5’-UTR的片段;
(c):(a)中所述5’-UTR的变体;及
(d):(b)中所述片段的变体;
所述第一核苷酸序列和所述第三核苷酸序列不天然出现于同一RNA分子。
在一些实施方案中,所述基因是真核生物的基因。在一些实施方案中,所述基因为动物的基因。在一些实施方案中,所述基因为脊索动物的基因,例如人或小鼠的基因。在一些实施方案中,所述基因是人基因。
在一些实施方案中,APOA1基因的GenBank登录号为NM_000039.3;CARD16基因的GenBank登录号为NM_052889.4;ALB基因的GenBank登录号为AH002596.2;APOC1基因的GenBank登录号为NM_001645.5;EEF1A1基因的GenBank登录号为NM_001402.6;RBP4基因的GenBank登录号为BC020633.1;GHRL基因的GenBank登录号为NM_016362.5;MPND基因的GenBank登录号为NM_032868;ASAH2B基因的GenBank登录号为NM_001079516.4;FBX016基因的GenBank登录号为NM_172366.4;FBH1基因的GenBank登录号为NG_047206.1;SRM基因的GenBank登录号为M64231.1;NAAA基因的GenBank登录号为NM_001363719.2;ACTB基因的GenBank登录号为NM_001101.5;MKNK2基因的GenBank登录号为NM_017572.4;ORM1基因的GenBank登录号为NG_012108.1;GADPH基因的GenBank登录号为NG_007073;NDUFAF2基因的GenBank登录号为NG_008978.1;FGFR2基因的GenBank登录号为NM_000141.5;MYCBPAP基因的GenBank登录号为AK303041.1;CHMP2A基因的GenBank登录号为NM_198426.3;TSG101基因的GenBank登录号为NM_006292.4;PRPF8基因的GenBank登录号为NM_006445;NFKB2基因的GenBank登录号为NM_001322935;NAE1基因的GenBank登录号为NM_001018159;HDGFL1基因的GenBank登录号为HM005397;GSDMD基因的GenBank登录号为BC008904.2;FBXW12基因的GenBank登录号为NM_207102.2;FBXW10基因的GenBank登录号为XM_054314720.1;FBXL8基因的GenBank登录号为NM_018378;ATG4D基因的GenBank登录号为NM_032885.6。
在一些实施方案中,所述第三核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、变体、或片段的变体与序列如SEQ ID NO:16~46之一所示的多核苷酸编码的RNA相比具有至少1、2、3、4、5、6、7、8、9、10或更多个核苷酸的插入、添加、删除或取代。
在一些实施方案中,所述第三核苷酸序列包含:(a)中所述基因中的至少两个基因的5’-UTR、(a)中所述基因中的至少两个基因的5’-UTR的片段、(a)中所述基因中的至少两个基因的5’-UTR的变体和(a)中所述基因中的至少两个基因的5’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个基因为两个基因、三个基因、四个基因、五个基因、六个基因、七个基因、八个基因、九个基因或十个基因。
在一些实施方案中,所述第三核苷酸序列包含:至少两个拷贝的(a)中的5’-UTR、至少两个拷贝的(a)中的5’-UTR的片段、至少两个拷贝的(a)中的5’-UTR的变体和至少两个拷贝的(a)中的5’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个拷贝为两个拷贝、三个拷贝、四个拷贝、五个拷贝、六个拷贝、七个拷贝、八个拷贝、九个拷贝或十个拷贝。
在一些实施方案中,所述RNA分子进一步还包含启动子、5’-帽子结构、3’-UTR和polyA中的至少一种。
在一些实施方案中,所述RNA分子进一步还包含5’-帽子结构、3’-UTR和polyA中的至少一种。
在一些实施方案中,所述5’-帽子结构包括m7GpppG、m2 7,3′-OGpppG、m7Gppp(5′)N1和m7Gppp(m2′-O)N1中的至少一种;
在一些实施方案中,所述3’-UTR包含i)~iii)中的一种:
i):源自基因APOA1、UL122、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;或者源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;
ii)至少两个拷贝的i)中的其中一种多核苷酸。
iii)至少两种i)中的多核苷酸。
在一些实施方案中,3’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第二核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,i)中的3’-UTR包含或为下述中的一种或多种:序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体;
在一些实施方案中,所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67和10中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;在一些实施方案中,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;
在一些实施方案中,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸。
在一些实施方案中,所述polyA为截断式polyA;在一些实施方案中,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;在一些实施方案中,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A。
在一些实施方案中,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;在一些实施方案中,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;在一些实施方案中,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
在一些实施方案中,本发明还提供了另一种RNA分子,其包含:
(1)编码感兴趣的多肽和/或蛋白的第一核苷酸序列;和
(2)5’-非翻译区(5’-UTR);其中所述5’-UTR包含下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体;
在一些实施方案中,序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、变体、或片段的变体与序列如SEQ ID NO:9所示的多核苷酸编码的RNA相比具有至少1、2、3、4、5、6、7、8、9、10或更多个核苷酸的插入、添加、删除或取代。
在一些实施方案中,所述RNA分子进一步还包含启动子、5’-帽子结构、3’-UTR和polyA中的至少一种。
在一些实施方案中,所述RNA分子进一步还包含5’-帽子结构、3’-UTR和polyA中的至少一种。
在一些实施方案中,所述5’-帽子结构包括m7GpppG、m2 7,3′-OGpppG、m7Gppp(5′)N1和m7Gppp(m2′-O)N1中的至少一种;
在一些实施方案中,所述3’-UTR包含i)~iii)中的一种:
i):源自基因APOA1、UL122、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;或者源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种。
ii)至少两个拷贝的i)中的其中一种多核苷酸。
iii)至少两种i)中的多核苷酸。
在一些实施方案中,3’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第二核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,i)中的3’-UTR包含或为下述中的一种或多种:序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编 码的RNA的片段、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67和10中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;在一些实施方案中,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;
在一些实施方案中,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸。
在一些实施方案中,所述polyA为截断式polyA;在一些实施方案中,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;在一些实施方案中,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A。
在一些实施方案中,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;在一些实施方案中,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;在一些实施方案中,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
在一些实施方案中,上述任一实施方案的RNA分子为重组RNA分子或人工RNA分子。
在一些实施方案中,上述任一实施方案的所述RNA分子中的全部或部分尿嘧啶被选自以下核苷构成的组中的至少一种核苷替换:假尿苷、N1-甲基假尿苷、N1-乙基假尿苷、2-硫尿苷、4′-硫尿苷、5-甲基胞嘧啶、5-甲基尿苷、2-硫基-1-甲基-1-去氮杂-假尿苷、2-硫基T-甲基-假尿苷、2-硫基-5-氮杂-尿苷、2-硫基-二氢假尿苷、2-硫基-二氢尿苷、2-硫基-假尿苷、4-甲氧基-2-硫基-假尿苷、4-甲氧基-假尿苷、4-硫基-1-甲基-假尿苷、4-硫基-假尿苷、5-氮杂-尿苷、二氢假尿苷或5-甲氧基尿苷和2′-O-甲基尿苷;在一些实施方案中,所述RNA分子中全部或部分的尿嘧啶核苷被假尿苷、N1-甲基假尿苷或N1-乙基假尿苷替换。
在一些实施方案中,所述RNA分子中的一个或多个胞嘧啶核苷(例如1、2、3、4、5、6、7、8、9、或10个胞嘧啶核苷)或者至少50%、至少60%、至少70%、至少80%、至少90%或100%的胞嘧啶核苷被5-甲基胞嘧啶核苷替换。
在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子包含一个或多个修饰的核苷酸。在一些实施方案中,修饰的核苷酸具有碱基修饰和/或糖修饰。例如,修饰的核苷酸具有碱基修饰。
在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子包含一个或多个修饰的核苷。
在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子包含修饰的尿苷、修饰的胞苷、修饰的腺苷和修饰的鸟苷中的至少一种。
在一些实施方案中,所述修饰的核苷是修饰的尿苷。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子中0.1%~100%的尿苷被修饰。在一些实施方案中,80%~100%的尿苷被修饰。在一些实施方案中,100%的尿苷被修饰。示例性的 修饰的尿苷包括但不限于下述的一种或多种:假尿苷(ψ)、N1-甲基假尿苷、吡啶-4-酮核糖核苷、5-氮杂-尿苷、6-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代-尿苷(s2U)、4-硫代-尿苷(s4U)、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基-尿苷(ho5U)、5-氨基烯丙基-尿苷、5-卤代-尿苷(例如,5-碘-尿苷或5-溴-尿苷)、3-甲基-尿苷(m3U)、5-甲氧基-尿苷(mo5U)、尿苷-5-氧基乙酸(cmo5U)、尿苷-5-氧基乙酸甲酯(memo5U)、5-羧基甲基-尿苷(cm5U)、1-羧基甲基-假尿苷、5-羧基羟基甲基-尿苷(chm5U)、5-羧基羟基甲基-尿苷甲酯(mchm5U)、5-甲氧基羰基甲基-尿苷(mcm5U)、5-甲氧基羰基甲基-2-硫代-尿苷(mcm5s2U)、5-氨基甲基-2-硫代-尿苷(nm5s2U)、5-甲基氨基甲基-尿苷(mnm5U)、5-甲基氨基甲基-2-硫代-尿苷(mnm5s2U)、5-甲基氨基甲基-2-硒代-尿苷(mnm5se2U)、5-氨基甲酰基甲基-尿苷(ncm5U)、5-羧基甲基氨基甲基-尿苷(cmnm5U)、5-羧基甲基氨基甲基-2-硫代-尿苷(cmnm5s2U)、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷(5-taurinomethyl-uridine)(τm5U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷(τm5s2U)、1-牛磺酸甲基-4-硫代-假尿苷、5-甲基-尿苷(m5U,即具有核碱基脱氧胸腺嘧啶)、1-甲基-假尿苷(m1ψ)、5-甲基-2-硫代-尿苷(m5s2U)、1-甲基-4-硫代-假尿苷(m1s4ψ)、4-硫代-1-甲基-假尿苷、3-甲基-假尿苷(m3ψ)、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮-假尿苷、2-硫代-1-甲基-1-脱氮-假尿苷、二氢尿苷(D)、二氢假尿苷、5,6-二氢尿苷、5-甲基-二氢尿苷(m5D)、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧基丙基)尿苷(acp3U)、1-甲基-3-(3-氨基-3-羧基丙基)假尿苷(acp3ψ)、5-(异戊烯基氨基甲基)尿苷(inm5U)、5-(异戊烯基氨基甲基)-2-硫代-尿苷(inm5s2U)、α-硫代-尿苷、2′-O-甲基-尿苷(Um)、5,2′-O-二甲基-尿苷(m5Um)、2′-O-甲基-假尿苷(ψm)、2-硫代-2′-O-甲基-尿苷(s2Um)、5-甲氧基羰基甲基-2′-O-甲基-尿苷(mcm5Um)、5-氨基甲酰基甲基-2′-O-甲基-尿苷(ncm5Um)、5-羧基甲基氨基甲基-2′-O-甲基-尿苷(cmnm5Um)、3,2′-O-二甲基-尿苷(m3Um)、和5-(异戊烯基氨基甲基)-2′-O-甲基-尿苷(inm5Um)、1-硫代-尿苷、脱氧胸苷、2′-F-阿糖-尿苷(2′-F-ara-uridine)、2′-F-尿苷、2′-OH-阿糖-尿苷、5-(2-甲氧甲酰基乙烯基)尿苷(5-(2-carbomethoxyvinyl)uridine)和5-[3-(1-E-丙烯基氨基)尿苷。
在一些实施方案中,所述修饰的核苷是修饰的胞苷。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子中0.1%~100%的胞苷被修饰。在一些实施方案中,80%~100%的胞苷被修饰。在一些实施方案中,100%的胞苷被修饰。示例性的修饰的胞苷包括但不限于下述的一种或多种:5-氮杂-胞苷、6-氮杂-胞苷、假异胞苷(pseudoisocytidine)、3-甲基-胞苷(m3C)、N4-乙酰基-胞苷(ac4C)、5-甲酰基-胞苷(f5C)、N4-甲基-胞苷(m4C)、5-甲基-胞苷(m5C)、5-卤代-胞苷(例如5-碘-胞苷)、5-羟甲基-胞苷(hm5C)、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷(s2C)、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮-假异胞苷、1-甲基-1-脱氮-假异胞苷、泽布拉林(zebularine)、5-氮杂-泽布拉林、5-甲基-泽布拉林、5-氮杂-2-硫代-泽布拉林、2-硫代-泽布拉林、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、赖西丁(lysidine)(k2C)、α-硫代-胞苷、2′-O-甲基-胞苷(Cm)、5,2′-O-二甲基-胞苷(m5Cm)、N4-乙酰基-2′-O-甲基-胞苷(ac4Cm)、N4,2′-O-二甲基-胞苷(m4Cm)、5-甲酰基-2′-O-甲基-胞苷(f5Cm)、N4,N4,2′-O-三甲基-胞苷(m42Cm)、1-硫代-胞苷、2′-F-阿糖-胞苷、2′-F-胞苷和2′-OH-阿糖-胞苷。
在一些实施方案中,所述修饰的核苷是修饰的腺苷。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子中0.1%~100%的腺苷被修饰。在一些实施方案中,80%~100%的腺苷被修饰。在一些实施方案中,100%的腺苷被修饰。示例性的修饰的腺苷包括但不限于下述的一种或多种:2-氨基-嘌呤、2,6-二氨基嘌呤、2-氨基-6-卤代-嘌呤(例如,2-氨基-6-氯-嘌呤)、6-卤代-嘌呤(例如,6-氯-嘌呤)、2-氨基-6-甲基-嘌呤、8-叠氮基-腺苷、7-脱氮-腺嘌呤、7-脱氮-8-氮杂-腺嘌呤、7-脱氮-2-氨基-嘌呤、7-脱氮-8-氮杂-2-氨基-嘌呤、7-脱氮-2,6-二氨基嘌呤、7-脱氮-8-氮杂-2,6-二氨基嘌呤、1-甲基-腺苷(m1A)、2-甲基-腺嘌呤(m2A)、N6-甲基-腺苷(m6A)、2-甲硫基-N6-甲基-腺苷(ms2m6A)、N6-异戊烯基-腺苷(i6A)、2-甲硫基-N6-异戊烯基-腺苷(ms2i6A)、N6-(顺式-羟基异戊烯基)腺苷(io6A)、2-甲硫基-N6-(顺式-羟基异戊烯基)腺苷(ms2io6A)、N6-甘氨酰基氨基甲酰基-腺苷(g6A)、N6-苏氨酰基氨基甲酰基-腺苷(t6A)、N6-甲基-N6-苏氨酰基氨基甲酰基-腺苷(m6t6A)、2-甲硫基- N6-苏氨酰基氨基甲酰基-腺苷(ms2g6A)、N6,N6-二甲基-腺苷(m62A)、N6-羟基正缬氨酰基氨基甲酰基-腺苷(hn6A)、2-甲硫基-N6-羟基正缬氨酰基氨基甲酰基-腺苷(ms2hn6A)、N6-乙酰基-腺苷(ac6A)、7-甲基-腺嘌呤、2-甲硫基-腺嘌呤、2-甲氧基-腺嘌呤、α-硫代-腺苷、2′-O-甲基-腺苷(Am)、N6,2′-O-二甲基-腺苷(m6Am)、N6,N6,2′-O-三甲基-腺苷(m62Am)、1,2′-O-二甲基-腺苷(m1Am)、2′-O-核糖基腺苷(磷酸酯)(Ar(p))、2-氨基-N6-甲基-嘌呤、1-硫代-腺苷、8-叠氮基-腺苷、2′-F-阿糖-腺苷、2′-F-腺苷、2′-OH-阿糖-腺苷和N6-(19-氨基-五氧杂十九烷基)-腺苷。
在一些实施方案中,所述修饰的核苷是修饰的鸟苷。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子中0.1%~100%的鸟苷被修饰。在一些实施方案中,80%~100%的鸟苷被修饰。在一些实施方案中,100%的鸟苷被修饰。示例性的修饰的鸟苷包括但不限于下述的一种或多种:肌苷(I)、1-甲基-肌苷(m1I)、丫苷(wyosine)(imG)、甲基丫苷(mimG)、4-脱甲基-丫苷(imG-14)、异丫苷(imG2)、怀丁苷(yW)、过氧怀丁苷(o2yW)、羟基怀丁苷(OHyW)、修饰不完全的(undermodified)羟基怀丁苷(OHyW*)、7-脱氮-鸟苷、辫苷(queuosine)(Q)、环氧辫苷(oQ)、半乳糖基-辫苷(galQ)、甘露糖基-辫苷(manQ)、7-氰基-7-脱氮-鸟苷(preQ0)、7-氨基甲基-7-脱氮-鸟苷(preQ1)、古嘌苷(G+)、7-脱氮-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮-鸟苷、6-硫代-7-脱氮-8-氮杂-鸟苷、7-甲基-鸟苷(m7G)、6-硫代-7-甲基-鸟苷、7-甲基-肌苷、6-甲氧基-鸟苷、1-甲基-鸟苷(m1G)、N2-甲基-鸟苷(m2G)、N2,N2-二甲基-鸟苷(m22G)、N2,7-二甲基-鸟苷(m2,7G)、N2,N2,7-二甲基-鸟苷(m2,2,7G)、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲基-6-硫代-鸟苷、N2-甲基-6-硫代-鸟苷、N2,N2-二甲基-6-硫代-鸟苷、α-硫代-鸟苷、2′-O-甲基-鸟苷(Gm)、N2-甲基-2′-O-甲基-鸟苷(m2Gm)、N2,N2-二甲基-2′-O-甲基-鸟苷(m22Gm)、1-甲基-2′-O-甲基-鸟苷(m1Gm)、N2,7-二甲基-2′-O-甲基-鸟苷(M2,7Gm)、2′-O-甲基-肌苷(Im)、1,2′-O-二甲基-肌苷(m1Im)、2′-O-核糖基鸟苷(磷酸酯)(Gr(p))、1-硫代-鸟苷、O6-甲基-鸟苷、2′-F-阿糖-鸟苷和2′-F-鸟苷。
在一些实施方案中,修饰的核苷酸包含含有同位素的核苷酸。
在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子包含含有氢的同位素的核苷酸。氢的同位素不限于氘、氚。另外,在一些实施方案中,所述RNA还包含或是含有除氢外的其他元素的同位素的核苷酸,其中,其他元素包括但不限于碳、氧、氮和磷。
在一些实施方案中,上述任一实施方案的编码感兴趣的多肽的核苷酸序列或上述任一实施方案的所述第一核苷酸序列编码至少一种感兴趣的多肽。例如一种、两种、三种、四种、五种、六种、七种、八种、九种或十种感兴趣的多肽。在一些实施方案中,上述任一实施方案的编码感兴趣的多肽的核苷酸序列或上述任一实施方案的所述第一核苷酸序列编码至少一种感兴趣的蛋白。例如一种、两种、三种、四种、五种、六种、七种、八种、九种或十种感兴趣的蛋白。在一些实施方案中,上述任一实施方案的编码感兴趣的多肽和蛋白的核苷酸序列或上述任一实施方案的所述第一核苷酸序列编码至少一种感兴趣的多肽和至少一种感兴趣的蛋白。例如一种、两种、三种、四种、五种、六种、七种、八种、九种或十种感兴趣的多肽和一种、两种、三种、四种、五种、六种、七种、八种、九种或十种感兴趣的蛋白。
在一些实施方案中,感兴趣的蛋白为新型冠状病毒的S蛋白。在一些实施方案中,新型冠状病毒的S蛋白的氨基酸序列如上文所述。在一些实施方案中,编码新型冠状病毒的S蛋白的RNA的序列如上文所述。可以理解的是感兴趣的蛋白不限于新型冠状病毒的S蛋白,还可以其他蛋白。
在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子不超过50000nt。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子不超过40000nt、30000nt、20000nt、10000nt、9000nt、8000nt或6000nt。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子为500nt~50000nt。在一些实施方案中,上述任一实施方案的RNA、上述任一实施方案的RNA分子或上述任一实施方案的人工RNA分子为1000nt~40000nt、1000nt~30000nt、1500nt~10000nt或1500nt~8000nt。
在一些实施方案中,本发明还提供了一种编码上述任一实施方案的RNA的DNA、编码上述任一实 施方案的人工RNA分子的DNA或编码上述任一实施方案的RNA分子的DNA。
在一些实施方案中,上述任一实施方案的DNA不超过50000bp。在一些实施方案中,上述任一实施方案的DNA不超过40000bp、30000bp、20000bp、10000bp、9000bp、8000bp或6000bp。在一些实施方案中,上述任一实施方案的DNA为500bp~50000bp。在一些实施方案中,上述任一实施方案的DNA为1000bp~40000bp、1000bp~30000bp、1500bp~10000bp或1500bp~8000bp。
在一些实施方案中,本发明还提供了一种载体,所述载体包含上述任一实施方案的DNA。
在一些实施方案中,本发明还提供了另一种载体,其包含编码3’-UTR的第四核苷酸序列,所述第四核苷酸序列包含以下多核苷酸中的至少一种:
(a):编码源自基因APOA1、UL122、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146和GHRL中的至少一个基因的3’-UTR的多核苷酸;在一些实施方案中,编码源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146和GHRL中的至少一个基因的3’-UTR的多核苷酸;
(b):编码(a)中所述3’-UTR的片段的多核苷酸;
(c):编码(a)中所述3’-UTR的变体的多核苷酸;及
(d):编码(b)中所述片段的变体的多核苷酸。在一些实施方案中,所述基因是人基因。
在一些实施方案中,所述载体不包含编码目的蛋白和/或多肽的多核苷酸。
在一些实施方案中,所述第四核苷酸序列包含以下多核苷酸中的至少一种:
(e):编码源自基因COP1和HDGFL1中的至少一个基因的3’-UTR的多核苷酸;
(f):编码(e)中所述3’-UTR的片段的多核苷酸;
(g):编码(e)中所述3’-UTR的变体的多核苷酸;及
(h):编码(f)中所述片段的变体的多核苷酸。
在一些实施方案中,3’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第二核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,所述第四核苷酸序列包含下述(1)~(3)中的多核苷酸中的至少一种:
(1)序列如SEQ ID NO:47~67中至少一个所示的多核苷酸、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的变体和序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段的变体中的至少一种。
(2)编码(a)中所述基因中的至少两个基因的3’-UTR的多核苷酸、编码(a)中所述基因中的至少两个基因的3’-UTR的片段的多核苷酸、编码(a)中所述基因中的至少两个基因的3’-UTR的变体的多核苷酸和编码(a)中所述基因中的至少两个基因的3’-UTR的片段的变体的多核苷酸中的至少一种。在一些实施方案中,所述至少两个基因为两个基因、三个基因、四个基因、五个基因、六个基因、七个基因、八个基因、九个基因或十个基因。
(3)至少两个拷贝的(a)中的3’-UTR、至少两个拷贝的(a)中的3’-UTR的片段、至少两个拷贝的(a)中的3’-UTR的变体和至少两个拷贝的(a)中的3’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个拷贝为两个拷贝、三个拷贝、四个拷贝、五个拷贝、六个拷贝、七个拷贝、八个拷贝、九个拷贝或十个拷贝。
在一些实施方案中,所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的变体、所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段和所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段的变体,与所述序列如SEQ ID NO:47~67中的至少一个所示的多核苷酸具有至少70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段、变体、或片段的变体与序列如SEQ ID NO:47~67之一所示的多核苷酸相比具有至少1、2、3、4、5、6、7、8、9、10或更多个核苷酸的插入、添加、删除或取代。
在一些实施方案中,所述载体进一步还包含启动子、编码5’-UTR的多核苷酸和编码polyA的多核苷酸中的至少一种。
在一些实施方案中,所述5’-UTR包含i)~iv)中的一种:
i)源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR、其片段、变体和片段的变体中的至少一种。
ii)下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体。
iii)至少两个拷贝的i)或ii)中的其中一种多核苷酸。
iv)至少两种i)中的多核苷酸。
在一些实施方案中,5’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第三核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,i)中的5’-UTR包含或为下述中的一种或多种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸编码的RNA具有至少70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,ii)中的序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;在一些实施方案中,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸。
在一些实施方案中,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸。
在一些实施方案中,所述polyA为截断式polyA;在一些实施方案中,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A。在一些实施方案中,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A。
在一些实施方案中,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;在一些实施方案中,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述polyAy为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA。在一些实施方案中,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
在一些实施方案中,本发明还提供了另一种载体,其包含编码5’-UTR的第五核苷酸序列,所述第五 核苷酸序列包含以下多核苷酸中的至少一种:
(a):编码源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR的多核苷酸;
(b):编码(a)中所述5’-UTR的片段的多核苷酸;
(c):编码(a)中所述5’-UTR的变体的多核苷酸;及
(d):编码(b)中所述片段的变体的多核苷酸。
在一些实施方案中,5’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第三核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,所述载体不包含编码目的蛋白和/或多肽的多核苷酸。
在一些实施方案中,所述第五核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段的变体。
在一些实施方案中,序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的变体、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段的变体,与序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。在一些实施方案中,所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段、变体、或片段的变体与序列如SEQ ID NO:16~46之一所示的多核苷酸相比具有至少1、2、3、4、5、6、7、8、9、10或更多个核苷酸的插入、添加、删除或取代。
在一些实施方案中,所述第五核苷酸序列包含:(a)中所述基因中的至少两个基因的5’-UTR、(a)中所述基因中的至少两个基因的5’-UTR的片段、(a)中所述基因中的至少两个基因的5’-UTR的变体和(a)中所述基因中的至少两个基因的5’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个基因为两个基因、三个基因、四个基因、五个基因、六个基因、七个基因、八个基因、九个基因或十个基因。
在一些实施方案中,所述第五核苷酸序列包含:至少两个拷贝的(a)中的5’-UTR、至少两个拷贝的(a)中的5’-UTR的片段、至少两个拷贝的(a)中的5’-UTR的变体和至少两个拷贝的(a)中的5’-UTR的片段的变体中的至少一种。在一些实施方案中,所述至少两个拷贝为两个拷贝、三个拷贝、四个拷贝、五个拷贝、六个拷贝、七个拷贝、八个拷贝、九个拷贝或十个拷贝。
在一些实施方案中,所述载体进一步还包含启动子、编码3’-UTR的多核苷酸和编码polyA的多核苷酸中的至少一种。
在一些实施方案中,所述3’-UTR包含i)~iii)中的一种:
i):源自基因APOA1、UL122、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;或者源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种。
ii)至少两个拷贝的i)中的其中一种多核苷酸。
iii)至少两种i)中的多核苷酸。
在一些实施方案中,3’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第二核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,i)中的3’-UTR包含或为下述的一种或多种:序列如SEQ ID NO:47~67和10中 至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67和10中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;在一些实施方案中,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸。
在一些实施方案中,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸。
在一些实施方案中,所述polyA为截断式polyA;在一些实施方案中,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;在一些实施方案中,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A。
在一些实施方案中,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;在一些实施方案中,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;在一些实施方案中,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
在一些实施方案中,本发明还提供了另一种载体,所述载体包含编码5’-UTR的多核苷酸序列;其中所述编码5’-UTR的多核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸、序列如SEQ ID NO:9所示的多核苷酸的片段、序列如SEQ ID NO:9所示的多核苷酸的变体和序列如SEQ ID NO:9所示的多核苷酸的片段的变体;
在一些实施方案中,序列如SEQ ID NO:9所示的多核苷酸的变体、序列如SEQ ID NO:9所示的多核苷酸的片段和序列如SEQ ID NO:9所示的多核苷酸的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。在一些实施方案中,所述序列如SEQ ID NO:9所示的多核苷酸的片段、变体、或片段的变体与序列如SEQ ID NO:9所示的多核苷酸相比具有至少1、2、3、4、5、6、7、8、9、10或更多个核苷酸的插入、添加、删除或取代。
在一些实施方案中,所述载体进一步还包含启动子、编码3’-UTR的多核苷酸和编码polyA的多核苷酸中的至少一种。
在一些实施方案中,所述3’-UTR包含i)~iii)中的一种:
i):源自基因APOA1、UL122、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;或者源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种。
ii)至少两个拷贝的i)中的其中一种多核苷酸。
iii)至少两种i)中的多核苷酸。
在一些实施方案中,3’-UTR的来源基因的物种或具体GenBank登录号可以参考如上文第二核苷酸序列处的相关描述,此处不再赘述。
在一些实施方案中,i)中的3’-UTR包含或为下述的一种或多种:序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体。
在一些实施方案中,所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67和10中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;在一些实施方案中,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸。
在一些实施方案中,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸。
在一些实施方案中,所述polyA为截断式polyA;在一些实施方案中,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;在一些实施方案中,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A。
在一些实施方案中,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;在一些实施方案中,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
在一些实施方案中,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;在一些实施方案中,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
在上述任一实施方案中,所述感兴趣的多肽或蛋白是指具有治疗或预防效果的治疗上或药学上有活性的多肽或蛋白质,其在细胞中或细胞附近的功能是需要的或有益的,例如,这样的蛋白质,其缺乏或其缺陷形式导致疾病发生,提供这样的蛋白质则可以调节或预防疾病,或者这样的蛋白质,其在细胞中或其附近对身体是有利的。所述多肽或蛋白质可以包含完整的蛋白质或其功能变体。
在上述任一实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列或第一核苷酸序列所表达的肽和/或蛋白包含或为下述中的一种或多种:(a)抗原;(b)治疗性蛋白或多肽、其片段、片段或变体;及(c)其他多肽或蛋白。
在一些实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列所表达的肽和/或蛋白包含或为抗原。
在一些实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列所表达的抗原源自下述的一种或多种:(1)致病性抗原、其片段、变体或片段的变体,(2)肿瘤抗原、其片段、变体或片段的变体,(3)过敏性抗原、其片段、变体或片段的变体(4)自身免疫性自体抗原、其片段、变体或片段的变体。
在一些实施方案中,病性抗原源自致病性生物体,其能够引起受试者(例如哺乳动物受试者,进一步例如人类)的免疫应答。在一些实施方案中,致病性生物体包括或为下述中的一种或多种:细菌、病毒、真菌、和原生动物(例如单细胞生物、多细胞生物)。
在一些实施方案中,致病性抗原包含或为表面抗原、其片段、变体或片段的变体,例如位于病毒、细菌或原生动物表面的蛋白、其片段(例如表面抗原的外部部分)、变体或片段的变体。
在一些实施方案中,致病性抗原包含或是源自与传染病相关的病原体的多肽或蛋白。
在一些实施方案中,致病性抗原选自但不限于WO2018/078053A1第21至35页中记载的源自病原体的抗原、WO2019/077001A1第57页第3段-第63页第2段记载的源自病原体的抗原、WO2013/120628A1第32页第26行至第34页第27行中记载的源自病原体的抗原、以及WO2013/120628A1中第34页第29行至第59页第5行所记载的抗原所构成的组。
在一些实施方案中,致病性抗原的病原体选自但不限于下述中的一种或多种:疥螨、巴倍虫、利什曼原虫、颚口线虫、巴西钩口线虫、十二指肠钩口线虫、粪类圆线虫、毛首鞭形线虫、犬弓首线虫、猫弓首线虫、弓形虫、布氏锥虫、克鲁兹锥虫、马来丝虫、旋盘尾丝虫、班氏丝虫、绦虫、猪带绦虫、棘球绦虫、人蛔虫、脆弱双核阿米巴、福氏耐格里阿米巴原虫(Naegleria fowleri)、美洲钩虫、并殖吸虫(例如卫氏并殖吸虫)、华支睾吸虫、疟原虫(例如恶性疟原虫、间日疟原虫、三日疟原虫或卵形疟原虫)、耶氏肺孢子虫、横川后殖吸虫、旋毛虫、阴道毛滴虫、肠贾第虫、血吸虫、白地霉、人酵母菌、汉赛巴尔通体、韦尼克黑酵母(Hortaea Wernicke)、曲霉、马拉色菌、霍乱弧菌、鲍曼不动杆菌、巴西副球孢子菌、淋病奈瑟菌、脑膜炎奈瑟菌、巴氏杆菌、星状诺卡氏菌、诺卡氏菌、申克孢子丝菌、葡萄球菌、无乳链球菌、肺炎链球菌、化脓性链球菌、毛癣菌、小肠结肠炎耶尔森菌、鼠疫耶尔森菌、假结核耶尔森菌、解脲脲原体、、沙门氏菌、图拉氏弗朗西斯菌、梭杆菌、麻风分枝杆菌、弥漫型麻风分枝杆菌、结核分枝杆菌、溃疡分枝杆菌、志贺氏菌、、溶血隐秘杆菌、炭疽杆菌、蜡样芽胞杆菌、荚膜组织胞浆菌、皮炎芽生菌、百日咳博德特氏菌、包柔氏螺旋体菌、包柔体、布鲁氏菌、伯克霍尔德菌(例如洋葱伯克霍尔德菌、鼻疽伯克霍尔德菌、类鼻疽伯克霍尔德菌)、弯曲菌、念珠菌(例如白念珠菌)、肺炎嗜衣原菌、白喉棒状杆菌、伯氏考克斯氏体、梭菌(例如肉毒梭菌、艰难梭菌、产气荚膜梭菌、产气荚膜梭菌)、破伤风梭菌、球孢菌、恰菲埃里希氏体、埃翁氏埃里希氏体(Ehrlichia ewingii)、埃里希氏体、肠外致病性大肠杆菌、金氏菌、肉芽肿克雷伯菌、无形体(例如嗜吞噬细胞无形体)、钩端螺旋体属、博氏疏螺旋体、梅毒螺旋体、立克次氏体(例如普氏立克次氏体、立氏立克次氏体、伤寒立克次氏体)、鹦鹉热嗜衣原体、沙眼衣原体、库鲁病朊病毒、拉沙病毒(LASV)、嗜肺军团菌、单核细胞增生李斯特菌、肠球菌、表面癣菌、大肠杆菌O157:H7和O104:H4、肝片吸虫和巨大片吸虫、肠道病毒(例如柯萨奇A病毒、肠道病毒71(EV71))、FFI朊病毒、CJD朊病毒、爱泼斯坦-巴尔病毒(EBV)、猫免疫缺陷病毒(FIV)、黄病毒、GSS朊病毒、瓜那利托病毒、杜克雷嗜血杆菌、流感嗜血杆菌、幽门螺杆菌、布尼亚病毒科、杯状病毒科、星状病毒科、冠状病毒、刚果出血热病毒、新生隐球菌、隐孢子虫属、巨细胞病毒(CMV)、BK病毒、登革热病毒、埃博拉病毒(EBOV)、单纯疱疹病毒(HSV)、人类免疫缺陷病毒(HIV)、人乳头瘤病毒(HPV)、流感病毒、狂犬病病毒、诺如病毒、尼帕病毒、亨利帕病毒(亨克莱病毒-尼帕病毒)、甲型肝炎病毒、乙型肝炎病毒(HBV)、丙型肝炎病毒(HCV)、丁型肝炎病毒、戊型肝炎病毒、、人博卡病毒(HBoV)、人类偏肺病毒(hMPV)、人类副流感病毒(HPIV)、日本脑炎病毒、JC病毒、鸠宁(Junin)病毒、黄热病病毒、MERS冠状病毒、淋巴细胞性脉络丛脑膜炎病毒(LCMV)、马丘波病毒、马尔堡病毒、麻疹病毒、人传染性软疣病毒(MCV)、腮腺炎病毒、细小病毒B19、肺炎支原体正粘病毒、脊髓灰质炎病毒、鼻病毒、裂谷热病毒、轮状病毒、风疹病毒、萨比亚病毒、SARS冠状病毒(例如SARS-CoV-2)、nCoV-2019冠状病毒、辛诺柏病毒、汉坦病毒、痘苗病毒、呼吸道合胞病毒(RSV)、蜱传脑炎病毒(TBEV)、水痘带状疱疹病毒(VZV)、委内瑞拉马脑炎病毒、西尼罗河病毒、西部马脑炎病毒、和寨卡病毒。
在一些实施方案中,致病性抗原包括或为下述的一种或多种:
(1)SARS冠状病毒2(SARS-CoV-2)、nCoV-2019冠状病毒或SARS冠状病毒(SARS-CoV))的下述蛋白中的一种或多种:棘突蛋白(S)、包膜蛋白(E)、膜蛋白(M)或核衣壳蛋白(N);(2)MERS冠状病毒的下述蛋白中的一种或多种棘突蛋白(S)、棘突S1片段(S1)、包膜蛋白(E)、膜蛋白(M)或核衣壳蛋白(N);(3)人乳头瘤病毒(例如HPV16)的下述蛋白中的一种或多种:复制蛋白E1、调节蛋白E2、蛋白E3、蛋白E4、蛋白E5、蛋白E6、蛋白E7、蛋白E8、主要衣壳蛋白L1和次要衣壳蛋白L2;(4)人副流感病毒(HPIV/PIV)(例如hPIV-1、hPIV-2、hPIV-3或hPIV-4血清型)的下述蛋白中的一种或多种:融合蛋白(F)、血凝素神经氨酸酶、糖蛋白(G)、基质蛋白(M)、磷蛋白(P)、核衣壳蛋白、融合糖蛋白F0、 F1或F2、重组PIV3/PIV1融合糖蛋白、C蛋白、D蛋白、病毒复制酶(L)和非结构V蛋白;(5)人类偏肺病毒(hMPV)的下述蛋白中的一种或多种:融合(F)糖蛋白、糖蛋白(G)、磷蛋白(P)、和核衣壳蛋白;(6)流感病毒的下述蛋白中的一种或多种:血凝素(HA)、神经氨酸酶(NA)、核蛋白(NP)、M1蛋白、M2蛋白、NS1蛋白、NS2蛋白(NEP蛋白:核输出蛋白)、PA蛋白、PB1蛋白(聚合酶碱性1蛋白)、PB1-F2蛋白和PB2蛋白;(7)狂犬病病毒的下述蛋白中的一种或多种:核蛋白(N)、大结构蛋白(L)、磷蛋白(P)、基质蛋白(M)和糖蛋白(G);(8)人类免疫缺陷病毒的下述蛋白中的一种或多种:HIV p24抗原、HIV包膜蛋白(Gp120、Gp41、Gp160)、多蛋白GAG、负因子蛋白Nef、转录反式激活剂Tat和Brec1;(9)沙眼衣原体的下述蛋白中的一种或多种:主要外膜蛋白MOMP、可能的外膜蛋白PMPC、外膜复合蛋白B OmcB、热休克蛋白Hsp60HSP10、蛋白IncA、III型分泌系统蛋白、核糖核苷酸还原酶小链蛋白NrdB、质粒蛋白Pgp3、衣原体外蛋白N CopN、抗原CT521、抗原CT425、抗原CT043、抗原TC0052、抗原TC0189、抗原TC0582、抗原TC0660、抗原TC0726、抗原TC0816、抗原TC0828;(10)巨细胞病毒(CMV/HCMV)的下述蛋白中的一种或多种:pp65抗原、膜蛋白pp15、衣壳近端皮层(tegument)蛋白pp150、蛋白M45、DNA聚合酶UL54、螺旋酶UL105、糖蛋白gM、糖蛋白gN、糖蛋白H、糖蛋白B gB、蛋白UL83、蛋白UL94、蛋白UL99、HCMV糖蛋白(选自gH-gL、gB、gO、gN和gM)、HCMV蛋白(选自UL83、UL123、UL128、UL130和UL131A)、表皮蛋白pp150(pp150)、皮层蛋白pp65/下基质磷蛋白(pp65)、包膜糖蛋白M(UL100)、调节蛋白IE1(UL123)、包膜蛋白(UL128)、包膜糖蛋白(130)、包膜蛋白(UL131A)、包膜糖蛋白B(UL55)、结构糖蛋白N gpUL73(UL73)、结构糖蛋白O gpUL74(UL74);(11)登革热病毒的下述蛋白中的一种或多种:衣壳蛋白C、膜前蛋白prM、膜蛋白M、包膜蛋白E(结构域I、结构域II、结构域II)、蛋白NS1、蛋白NS2A、蛋白NS2B、蛋白NS3、蛋白NS4A、蛋白2K、蛋白NS4B、蛋白NS5;(12)EBOV病毒的下述蛋白中的一种或多种:EBOV糖蛋白(GP)、表面EBOV GP、野生型EBOV pro GP、成熟EBOV GP、分泌型野生型EBOV pro GP、分泌型成熟EBOV GP、EBOV核蛋白(NP)、RNA聚合酶L和EBOV基质蛋白(选自VP35、VP40、VP24和VP30);(13)乙型肝炎病毒(HBV)的下述蛋白中的一种或多种:乙型肝炎表面抗原HBsAg、乙型肝炎核心抗原HbcAg、聚合酶、蛋白Hbx、前S2中表面蛋白、表面蛋白L、大S蛋白、病毒蛋白VP1、病毒蛋白VP2、病毒蛋白VP3、和病毒蛋白VP4;(14)呼吸道合胞病毒(RSV)的下述蛋白中的一种或多种:融合蛋白F、F蛋白、核蛋白N、基质蛋白M、基质蛋白M2-1、基质蛋白M2-2、磷蛋白P、小疏水蛋白SH、主要表面糖蛋白G、聚合酶L、非结构蛋白1NS1、非结构蛋白2NS2、RSV附着蛋白(G)(糖蛋白G)、融合(F)糖蛋白(糖蛋白F)、核蛋白(N)、磷蛋白(P)、大聚合酶蛋白(L)、基质蛋白(M,M2)、小疏水蛋白(SH)、非结构蛋白1(NS1)、非结构蛋白2(NS2)、膜结合RSV F蛋白、膜结合DS Cavl(稳定的融合前RSV F蛋白);(15)结核分枝杆菌的下述蛋白中的一种或多种:分泌抗原SssA(葡萄球菌属,葡萄球菌食物中毒);分泌抗原SssA(葡萄球菌属,如金黄色葡萄球菌、葡萄球菌感染);分子伴侣DnaK、细胞表面脂蛋白Mpt83、脂蛋白P23、磷酸转运系统渗透蛋白pstA、14kDa抗原、纤维连接蛋白结合蛋白C FbpC1、丙氨酸脱氢酶TB43、谷氨酰胺合成酶1、ESX-1蛋白、蛋白CFP10,TB10.4蛋白质、蛋白MPT83、蛋白MTB12、蛋白MTB8、Rpf样蛋白质、蛋白MTB32、蛋白MTB39、晶体蛋白、热休克蛋白HSP65、和蛋白PST-S;(16)黄热病病毒的下述蛋白中的一种或多种:基因组多蛋白、蛋白E、蛋白M、衣壳蛋白C、蛋白酶NS3、蛋白NS1、蛋白NS2A、蛋白AS2B、蛋白NS4A、蛋白NS4B、蛋白NS5;(17)环孢子蛋白;和(18)寨卡病毒的下述蛋白中的一种或多种:寨卡病毒衣壳蛋白(c)、寨卡病毒膜前蛋白(prM)、寨卡病毒pr蛋白(pr)、寨卡病毒膜蛋白(M)、寨卡病毒包膜蛋白(E)、寨卡病毒非结构蛋白、寨卡病毒prME抗原、寨卡病毒衣壳蛋白、膜前/膜蛋白、ZIKV包膜蛋白、ZIKV非结构蛋白1、ZIKV非结构蛋白2A、ZIKV非结构蛋白2B、ZIKV非结构蛋白3、ZIKV非结构蛋白4A、ZIKV非结构蛋白4B、ZIKV非结构蛋白5、和寨卡病毒包膜蛋白(e)。
在一些实施方案中,肿瘤抗原选自但不限于由WO2018/078053A1第47-51页中记载的肿瘤抗原所组成的组。
在一些实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列所表达的抗原包含或为过敏性抗原和自身免疫性自体抗原。在一些实施方案中,过敏性抗原和自身免疫性自体抗原源自或选自但不限于 WO2018/078053A1第59至73页记载的抗原组。
在一些实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列所表达的抗原列于WO2018/078053A1第48至51页。
在一些实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列所表达的多肽和/或蛋白包含或为治疗性蛋白或多肽。
在一些实施方案中,治疗性蛋白或多肽包括或为下述的一种或多种:
(1)用于治疗代谢、内分泌或氨基酸紊乱的酶替代疗法或用于替代缺失、缺陷或突变蛋白质的治疗性蛋白或多肽;(2)用于治疗血液疾病、循环系统疾病、呼吸系统疾病、传染病或免疫缺陷的治疗性蛋白或多肽;(3)用于治疗癌症或肿瘤疾病的治疗性蛋白或多肽;(4)用于激素替代治疗的治疗性蛋白或多肽;(5)用于将体细胞重新编程为多能干细胞或全能干细胞的治疗性蛋白或多肽;(6)用作佐剂或免疫刺激的治疗性蛋白或多肽;(7)作为治疗性抗体的治疗性蛋白或多肽;(8)作为基因编辑剂的治疗性蛋白或多肽;(9)用于治疗或预防选自由肝纤维化、肝硬化和肝癌组成的组的肝病的治疗性蛋白或多肽;和(10)用于治疗或预防罕见病的治疗性蛋白或多肽。
在一些实施方案中,用于治疗代谢、内分泌或氨基酸紊乱的酶替代疗法或用于替代缺失、缺失或突变蛋白质的治疗性蛋白或多肽,包括或为下述的一种或多种:酸性鞘磷脂酶、脂肪酸、无糖苷酶β、白葡萄糖苷酶、α-半乳糖苷酶A、α-葡萄糖苷酶、α-L-艾杜糖苷酸酶、α-N-乙酰氨基葡萄糖苷酶、双调蛋白、血管生成素(Ang1、Ang2、Ang3、Ang4、ANGPTL2、ANGPTL3、ANGPTL4、ANGPTL5、ANGPTL6、ANGPTL7)、ATP酶、Cu(2+)-转运β多肽(ATP7B)、精氨琥珀酸合成酶(ASS1)、β细胞素、β-葡萄糖醛酸酶、骨形态发生蛋白BMP(BMP1、BMP2、BMP3、BMP4、BMP5、BMP6、BMP7、BMP8a、BMP8b、BMP10、BMP15)、CLN6蛋白、表皮生长因子(EGF)、表观蛋白、表观调节素、成纤维细胞生长因子(FGF、FGF-1、FGF-2、FGF-3、FGF-4、FGF-5、FGF-6、FGF-7、FGF-8、FGF-9、FGF-10、FGF-11、FGF-12、FGF-13、FGF-14、FGF-16、FGF-17、FGF-17、FGF-18、FGF-19、FGF-20、FGF-21、FGF-22、FGF-23)、延胡索酰乙酰乙酸水解酶(FAH)、加硫酯酶、生长激素释放肽、葡萄糖脑苷酶、GM-CSF、肝素结合EGF样生长因子(HB-EGF)、肝细胞生长因子HGF、肝细胞生成素、人白蛋白、白蛋白丢失增加、艾度硫酸酯酶(艾度糖-2-硫酸酯酶)、整联蛋白αVβ3、αVβ5和α5β1、Iuduronate硫酸酯酶、拉罗尼酶、N-乙酰半乳糖胺-4-硫酸酯酶(rhASB;加硫酶、芳香基硫酸酯酶A(ARSA)、芳香基硫酸酯酶B(ARSB))、N-乙酰氨基葡萄糖-6-硫酸酯酶、神经生长因子(NGF,脑源性神经营养因子(BDNF)、神经营养素-3(NT-3)和神经营养素4/5(NT-4/5)、神经调节蛋白(NRG1、NRG2、NRG3、NRG4)、神经纤毛蛋白(NRP-1、NRP-2)、肥胖抑制素、苯丙氨酸羟化酶(PAH),苯丙氨酸氨解水解酶(PAL)、血小板源生长因子(PDGF(PDFF-A、PDGF-B、PDGF-C、PDGF-D))、TGFβ受体(内皮素、TGFβ1受体、TGFβ2受体、TGFβ3受体)、血小板生成素(THPO)(巨核细胞生长和发育因子(MGDF))、转化生长因子(TGF(TGF-a、TGF-β(TGFβ1、TGFβ2和TGFβ3)))、VEGF(VEGF-A、VEGF-B、VEGF-C、VEGF-D、VEGF-E、VEGF-F和PIGF)、奈西立肽、胰蛋白酶、促肾上腺皮质激素(ACTH)、心钠肽(ANP)、胆囊收缩素、胃泌素、瘦素、催产素、生长抑素、加压素(抗利尿激素)、降钙素、艾塞那肽、生长激素(GH)、生长激素、胰岛素、胰岛素样生长因子IIGF-1、美卡西芬酯、IGF-1类似物、培维索孟、普兰林肽、特立帕肽(人甲状旁腺激素残基1-34)、贝卡普勒明、Dibotermin-α(骨形态生成蛋白2)、醋酸组氨瑞林(促性腺激素释放激素;GnRH)、奥曲肽、肝细胞核因子4α(HNF4A)、CCAAT/增强子结合蛋白α(CEBPA)、成纤维细胞生长因子21(FGF21)、细胞外基质蛋白酶或人胶原酶MMP1、肝细胞生长因子(HGF)、TNF相关凋亡诱导配体(TRAIL)、阿片生长因子受体样1(OGFRL1)、梭菌II型胶原酶、松弛素1(RLN1)、松弛素2(RLN2)、松弛素3(RLN3)和帕利夫明(角质形成细胞生长因子;KGF)。
在一些实施方案中,用于治疗代谢或内分泌疾病的治疗蛋白或多肽选自WO2017/191274表A(结合表C)中记载的蛋白或多肽。
在一些实施方案中,用于治疗血液疾病、循环系统疾病、呼吸系统疾病、癌症或肿瘤疾病、传染病或免疫缺陷的治疗性蛋白或多肽,包括或为下述的一种或多种:阿替普酶(组织纤溶酶原激活剂;tPA)、阿尼普酶、抗凝血酶III(AT-III)、比伐卢定、达贝泊汀-α、Drotrecogin-α(活化蛋白C)、促红细胞生成素、 阿法依泊汀-α、红细胞生成素、erthropoyetin、因子IX、因子VIIa、因子VIII、重组水蛭素、蛋白C浓缩物、瑞替普酶(tPA的缺失突变蛋白)、链激酶、替奈普酶、尿激酶、血管增生抑制素、抗-CD22免疫毒素、地尼白介素、免疫花青、MPS(锌指蛋白)、阿柏西普、内皮他丁、胶原酶、人脱氧核糖核酸酶I、脱氧核糖核酸酶、透明质酸酶、木瓜蛋白酶、L-天冬酰胺酶、Peg-天冬酰胺酶、拉布立酶、人绒毛膜促性腺激素(HCG)、人卵泡刺激素(FSH)、促黄体素-α、催乳素、α-1-蛋白酶抑制因子、乳糖酶、胰酶(脂肪酶、淀粉酶、蛋白酶)、腺苷脱氨酶(牛培格脱氨酶,PEG-ADA)、阿贝西普、阿法赛特、阿那白滞素、依那西普、白细胞介素-1(IL-1受体拮抗剂)、阿那白滞素、胸腺九肽、TNF-α拮抗剂、恩夫韦地和胸腺肽α1。
在一些实施方案中,用于治疗癌症或肿瘤疾病的治疗性蛋白或多肽,包括或为下述的一种或多种:细胞因子、趋化因子、自杀基因产物、免疫原性蛋白或肽、凋亡诱导剂、血管生成抑制剂、热休克蛋白、肿瘤抗原、β-连环蛋白抑制剂、STING通路激活剂、检查点调节剂、天然免疫激活剂、抗体、显性负性受体和诱饵受体、髓源性抑制细胞(MDSCs)抑制剂、IDO途径抑制剂和结合凋亡抑制剂的蛋白质或肽;
在一些实施方案中,用于激素替代治疗的治疗性蛋白或多肽中的激素包括下述的一种或多种:雌激素、孕酮、黄体酮以及睾酮。
在一些实施方案中,用于将体细胞重编程为多能或全能干细胞的治疗性蛋白质,包括下述的一种或多种:Oct-3/4、Sox基因家族(例如Sox1、Sox2、Sox3和Sox15)、Klf家族(例如Klf1、Klf2、Klf4和Klf5)、Myc家族(例如c-Myc、L-Myc和N-Myc)、Nanog和LIN28。
在一些实施方案中,用作佐剂或免疫刺激蛋白的治疗性蛋白或多肽包括或为下述的一种或多种:人辅助蛋白(human adjuvant proteins),特别是模式识别受体TLR1、TLR2、TLR3、TLR4、TLR5、TLR6、TLR7、TLR8、TLR9、TLR10、TLR11;NOD1、NOD2、NOD3、NOD4、NOD5、NALP1、NALP2、NALP3、NALP4、NALP5、NALP6、NALP6、NALP7、NALP7、NALP8、NALP9、NALP10、NALP11、NALP12、NALP13、NALP14J IPAF、NAIP、CIITA、RIG-I、MDA5和LGP2、TLR信号的信号转导子(包括衔接蛋白(例如Trif和Cardif)、小GTPases信号的成分(例如RhoA、Ras、Rac1、Cdc42、Rab等)、PIP信号的成分(例如PI3K、Src激酶等)、MyD88依赖信号的成分(例如MyD88、IRAK1、IRAK2、IRAK4、TIRAP、TRAF6等)、MyD88独立信号的成分(例如TICAM1、TICAM2、TRAF6、TBK1、IRF3、TAK1、IRAK1等)等;活化的激酶(例如Akt、MEKK1、MKK1、MKK3、MKK4、MKK6、MKK7、ERK1、ERK2、GSK3、PKC激酶、PKD激酶、GSK3激酶、JNK、p38MAPK、TAK1、IKK、TAK1等);活化的转录因子(例如NF-kB、c-Fos、c-Jun、c-Myc、CREB、AP-1、Elk-1、ATF2、IRF-3、IRF-7、热休克蛋白(例如HSP10、HSP60、HSP65、HSP70、HSP75和HSP90)、gp96、纤维蛋白原、纤维连接蛋白的III型重复额外结构域等);补体系统的成分(例如C1q、MBL、C1r、C1s、C2b、Bb、D、MASP-1、MASP-2、C4b、C3b、C5a、C3a、C4a、C5b、C6、C7、C8、C9、CR1、CR2、CR3、CR4、C1qR、C1INH、C4bp、MCP、DAF、H、I、P、CD59等);诱导靶基因的细胞表面蛋白(例如β-防御素)。在一些实施方案中,人辅助蛋白包括下述的一种或多种:trif、flt-3配体、Gp96或纤维连接蛋白、诱导或增强先天免疫应答的细胞因子(例如IL-1α、IL-1R1、IL1β、IL-2、IL-6、IL-7、IL-8、IL-9、IL-12、IL-13、IL-15、IL-16、IL-17、IL-18、IL-21、IL-23、TNFα、IFNα、IFNβ、IFNγ、GM-CSF、G-CSF、M-CSF),趋化因子(例如IL-8、IP-10、MCP-1、MIP-1α、RANTES、Eotaxin、CCL21),巨噬细胞释放的细胞因子(例如IL-1、IL-6、IL-8、IL-12、TNF-α等)。
在一些实施方案中,用作佐剂或免疫刺激的治疗性蛋白或多肽包括下述的一种或多种:细菌(佐剂)蛋白、原生动物(佐剂)蛋白、病毒(佐剂)蛋白、真菌(佐剂)蛋白、和动物源性蛋白。
在一些实施方案中,细菌(佐剂)蛋白包括下述中的一种或多种:细菌热休克蛋白或伴侣(包括Hsp60、Hsp70、Hsp90、Hsp100);革兰氏阴性菌OmpA(外膜蛋白);OspA;细菌孔蛋白(例如OmpF);细菌毒素(例如百日咳杆菌的百日咳毒素(PT)、百日咳杆菌的百日咳腺苷酸环化酶毒素CyaA和CyaC、百日咳毒素PT-9K/129G突变体、百日咳杆菌腺苷酸环化酶毒素CyaA和CyaC、破伤风毒素、霍乱毒素(CT)、霍乱毒素B亚单位、霍乱毒素CTK63突变体、CT的CTE112K突变体、大肠杆菌不耐热肠毒素(LT)、毒性降低的不耐热肠毒素(LTB)大肠杆菌不耐热肠毒素突变体的B亚单位(例如LTK63、LTR72));酚溶性 调节蛋白;幽门螺杆菌中性粒细胞激活蛋白(HP-NAP);表面活性蛋白D;伯氏疏螺旋体外表面蛋白A脂蛋白、结核分枝杆菌的Ag38(38kDa抗原);细菌菌毛蛋白(例如革兰氏阴性菌菌毛的菌毛蛋白)和表面活性蛋白A以及细菌鞭毛蛋白。
在一些实施方案中,原生动物(佐剂)蛋白包括下述的一种或多种:克氏锥虫的Tc52、刚地锥虫的PFTG、原生动物热休克蛋白、利什曼原虫的LeIF、和刚地弓形虫的类谱蛋白。
在一些实施方案中,病毒(佐剂)蛋白包括下述的一种或多种:呼吸道合胞病毒融合糖蛋白(F蛋白)、MMT病毒包膜蛋白、小鼠白血病病毒蛋白和野生型麻疹病毒血凝素蛋白。
在一些实施方案中,真菌(佐剂)蛋白包括真菌免疫调节蛋白(FIP,例如LZ-8)。
在一些实施方案中,动物源性蛋白包括钥孔血蓝蛋白(KLH)。
在一些实施方案中,编码感兴趣的多肽和/或蛋白的核苷酸序列所表达的多肽和/或蛋白包含或为作为治疗性抗体的治疗性蛋白或多肽。例如WO2016/170176A1的表1、表2、表3、表4、表5、表6、表7、表8、表9、表10、表11和表12中记载的细胞因子、趋化因子、自杀酶和基因产物、凋亡诱导剂、内源性血管生成抑制剂、热休克蛋白、肿瘤抗原、天然免疫激活剂、针对与肿瘤或癌症发展相关的蛋白的抗体中的一种或多种。
在一些实施方案中,本发明提供了一种宿主细胞,其包含上述任一实施方案的载体、上述任一实施方案的RNA、上述任一实施方案的人工RNA分子、或上述任一实施方案的RNA分子。
在一些实施方案中,本发明还提供了一种脂质纳米颗粒,其包含上述任一实施方案的RNA、上述任一实施方案的人工RNA分子、上述任一实施方案的RNA分子、上述任一实施方案的蛋白质、上述任一实施方案的DNA、或上述任一实施方案的载体。
在一些实施方案中,所述脂质纳米颗粒还含有可离子化阳离子脂质、辅助脂质、结构脂质和PEG-脂质中的一种或多种。
在一些实施方案中,脂质纳米颗粒含可离子化阳离子脂质。
在一些实施方案中,所述脂质纳米颗粒还含有辅助脂质、结构脂质和PEG-脂质(聚乙二醇-脂质)中的一种或多种。在一个可选地具体示例中,所述脂质纳米颗粒含有可离子化阳离子脂质、辅助脂质、结构脂质和PEG-脂质。
在一些实施方案中,所述可离子化阳离子脂质选自Dlin-MC3-DMA、Dlin-KC2-DMA、DODMA、c12-200和DlinDMA中的一种或多种。
在一些实施方案中,所述辅助脂质为磷脂类物质。所述磷脂类物质通常是半合成的,也可以是天然来源的或被化学修饰的。所述磷脂类物质包括但不限于DSPC(二硬脂酰磷脂酰胆碱)、DOPE(二油酰磷脂酰乙醇胺)、DOPC(二油酰基卵磷脂)、DOPS(二油酰磷脂酰丝氨酸)、DSPG(1,2-二十八烷酰基-sn-甘油-3-磷酸-(1’-rac-甘油))、DPPG(二棕榈酰磷脂酰甘油)、DPPC(二棕榈酰磷脂酰胆碱)、DGTS(1,2-二棕榈酰-sn-甘油-3-O-4′-(N,N,N-三甲基)高丝氨酸)、溶血磷脂等。在一些实施方案中,所述辅助脂质是选自DSPC、DOPE、DOPC和DOPS中的一种或多种。在一些实施方案中,所述辅助脂质是DSPC和/或DOPE。
在一些实施方案中,所述结构脂质为甾醇类物质,包括但不限于胆固醇、胆固醇酯、固醇类激素、固醇类维生素、胆汁酸、胆甾醇、麦角甾醇、β-谷甾醇和氧化胆固醇衍生物等。在一些实施方案中,所述结构脂质是选自胆固醇、胆固醇酯、固醇类激素、固醇类维生素和胆汁酸中的至少一种。在一些实施方案中,所述结构脂质是胆固醇,优选高纯度胆固醇,特别是注射级高纯度胆固醇。例如CHO-HP(由AVT生产)。
如本文所用的,术语PEG-脂质(聚乙二醇-脂质)为聚乙二醇和脂类结构的缀合物。在一些实施方案中,所述PEG-脂质选自PEG-DMG和PEG-二硬脂酰磷脂酰乙醇胺(PEG-DSPE)。所述PEG-DMG是1,2-二肉豆蔻酸甘油酯的聚乙二醇(PEG)衍生物。
在一些实施方案中,所述PEG-脂质选自PEG-DMG或PEG-DSPE。
在一些实施方案中,所述PEG的平均分子量为约2000道尔顿至5000道尔顿。进一步优选,PEG的平均分子量约为2000道尔顿或5000道尔顿。
在一些实施方案中,PEG-脂质为PEG2000-DMG。
在一些实施方案中,本发明还提供了一种药物组合物,其包含上述任一实施方案的人工RNA分子、上述任一实施方案的RNA分子、上述任一实施方案的DNA、上述任一实施方案的载体、上述任一实施方案的宿主细胞或上述任一实施方案的脂质纳米颗粒,以及药学上可接受的载体。
在一些实施方案中,本发明还提供了一种上述任一实施方案的人工RNA分子、上述任一实施方案的RNA分子、上述任一实施方案的DNA、上述任一实施方案的载体、上述任一实施方案的宿主细胞或上述任一实施方案的脂质纳米颗粒或上述任一实施方案的药物组合物在制备药物中的用途。
在一些实施方案中,所述药物用于基因治疗、基因疫苗接种、蛋白替代疗法、反义治疗或通过干扰RNA进行的治疗。
基因疫苗是用于基因疫苗接种的疫苗,通常被理解为“第三代”疫苗。它们通常由基因工程核酸分子组成,允许在体内表达病原体或肿瘤抗原特有的肽或蛋白质(抗原)片段。基因疫苗在给患者施用被靶细胞摄取后表达,所施用的核酸的表达导致编码蛋白质的产生。当患者的免疫系统识别出这些蛋白质为异物时,触发免疫应答。
在一些实施方案中,本发明还提供了一种上述任一实施方案的人工RNA分子、上述任一实施方案的RNA分子、上述任一实施方案的DNA、上述任一实施方案的载体、上述任一实施方案的宿主细胞或上述任一实施方案的脂质纳米颗粒或上述任一实施方案的药物组合物在制备用于核酸转移的药物中的用途。
在一些实施方案中,所述核酸为RNA、信使RNA(mRNA)、反义寡核苷酸、DNA、质粒、核糖体RNA(rRNA)、微RNA(miRNA)、转移RNA(tRNA)、小的抑制RNA(siRNA)和小的核RNA(snRNA)。
在一些实施方案中,所述药物用于基因治疗、基因疫苗接种或蛋白质替代疗法。
在一些实施方案中,所述药物用于疾病的治疗和/或预防。在一些实施方案中,所述药物是疫苗;在一些实施方案中,所述药物是用于预防新型冠状病毒感染的疫苗。
在一些实施方案中,所述疾病选自由以下组成的组:罕见病、感染性疾病、癌症、遗传性疾病、自体免疫性疾病、糖尿病、神经退化性疾病、心血管疾病、肾血管疾病,以及代谢性疾病。
在一些实施方案中,所述癌症包括肺癌、胃癌、肝癌、食管癌、结肠癌、胰腺癌、脑癌、淋巴癌、血癌或前列腺癌中的一种或多种。所述遗传疾病包括血友病,地中海贫血、高雪氏病中的一种或多种。所述罕见病包括下述的一种或多种:成骨不全症、威尔森氏症、脊髓性肌萎缩、亨廷顿氏病、瑞特综合征、肌肉萎缩性侧索硬化、杜氏型肌肉营养不良、弗雷德里希共济失调、甲基丙二酸血症、囊性纤维化、糖原贮积病1a、糖原贮积病III、Crigler-Najjar综合症、鸟氨酸氨甲酰转移酶缺乏症、丙酸血症、苯丙酮尿症、血友病A、血友病B、β-地中海贫血病、拉福拉病、Dravet综合征、亚历山大症、莱伯先天性黑内障、骨髓异常增生综合征和CBS缺陷型高胱氨酸尿症。
在一些实施方案中,所述药物为核酸药物,其中所述核酸包括下述的至少一种:RNA、信使RNA(mRNA)、DNA、质粒、核糖体RNA(rRNA)、单链向导RNA(sgRNA)和cas9mRNA。
如本文所使用,术语“转移”指将核酸例如治疗剂和/或预防剂递送至目标。例如,将治疗剂和/或预防剂递送至受试者,可涉及将包括该治疗剂和/或预防剂的脂质纳米颗粒施用给该受试者(例如通过静脉内、肌肉内、皮内或皮下途径等)。
在一个实施方案中,所述感兴趣的多肽是指具有治疗或预防效果的治疗上或药学上有活性的多肽或蛋白质,其在细胞中或细胞附近的功能是需要的或有益的,例如,这样的蛋白质,其缺乏或其缺陷形式导致疾病发生,提供这样的蛋白质则可以调节或预防疾病,或者这样的蛋白质,其在细胞中或其附近对身体是有利的。所述多肽或蛋白质可以包含完整的蛋白质或其功能变体。在一些实施方案中,感兴趣的多肽或蛋白参见上文描述。
在一些实施方案中,本发明还提供了一种疾病的治疗和/或预防方法,该方法包括给有需要的对象施用上述任一实施方案的人工RNA分子、上述任一实施方案的RNA分子、上述任一实施方案的DNA、上述任一实施方案的载体、上述任一实施方案的宿主细胞或上述任一实施方案的脂质纳米颗粒或上述任一实施方案的药物组合物。
在一些实施方案中,所述疾病或病症参见本发明上文的人工RNA分子、RNA分子、DNA、载体、 宿主细胞或脂质纳米颗粒或药物组合物在制备用于核酸转移的药物中的用途处的描述。
在一些实施方案中,人工RNA分子、RNA分子、DNA、载体、宿主细胞或脂质纳米颗粒或药物组合物用作预防疾病的疫苗。在一些实施方案中,人工RNA分子、RNA分子、DNA、载体、宿主细胞或脂质纳米颗粒或药物组合物用于产生病原体的抗原或其部分。
在一些实施方案中,人工RNA分子、RNA分子、DNA、载体、宿主细胞或脂质纳米颗粒或药物组合物用于产生所述遗传疾病相关的蛋白质。
在一些实施方案中,人工RNA分子、RNA分子、DNA、载体、宿主细胞或脂质纳米颗粒或药物组合物用于产生抗体,例如scFV或纳米抗体。
在第三方面,本发明提供上述RNA的制备方法,所述方法包括以下步骤:
(1)提取工程质粒,保证质粒超螺旋率达90%以上;
(2)质粒线性化和纯化;
(3)体外转录和纯化;和
(4)加帽和纯化。
在第四方面,本发明提供质粒H的制备方法,所述方法包括:
(1)质粒D的构建:以荧光素酶-pcDNA3质粒为骨架,在Kozack序列前面加入新的酶切位点HindIII和BamHI,并且在荧光素酶的终止密码子后面添加新的酶切位点KpnI和ApaI,得到质粒B;在质粒B的HindIII和BamHI酶切位点之间插入5’-UTR,得到质粒C;在质粒C的KpnI和ApaI酶切位点之间插入3’-UTR得到质粒D;
(2)质粒G的构建:以B质粒为骨架,更换氨苄抗性基因序列为硫酸卡那霉素抗性基因序列,并且去除从核苷酸位置3746开始到4540间(对应于质粒B的位置编号)的neo/KanR序列,得到质粒F;质粒F插入polyA序列,得到质粒G;
(3)质粒载体H的构建:质粒G和质粒D分别用HindIII和ApaI进行双酶切,质粒G双酶切的产物取分子量大的片段,质粒D双酶切的产物取分子量小的片段,两个片段进行T4酶连,获得质粒H。在质粒H的制备过程中使用的如SEQ ID NO:2(质粒B)、SEQ ID NO:3(质粒C)、SEQ ID NO:4(质粒D)、SEQ ID NO:5(质粒F)和SEQ ID NO:6(质粒G)的核苷酸序列所示的质粒也是本发明的一部分。
质粒H以BamHI和KpnI进行双酶切取分子量大的片段,与本发明的新型冠状病毒的S蛋白编码序列进行同源重组获得mRNA疫苗工程质粒。因此,本发明还提供了用于制备mRNA疫苗的工程质粒,其包含可转录mRNA的核苷酸序列,具体地包含本发明的mRNA疫苗的模板核苷酸序列。模板核苷酸序列是指工程质粒中的DNA序列,其作为体外合成mRNA的模板,来指导mRNA分子的合成;更具体地,本发明的mRNA疫苗的模板核苷酸序列为本发明的新型冠状病毒的S蛋白编码序列。在一个实施方案中,所述工程质粒如SEQ ID NO:8所示。
基于上述,本发明设计了一种新型冠状病毒的S蛋白、编码DNA和对应的mRNA,用该mRNA制备的疫苗免疫小鼠得到的血清可以同时中和SARS-COV-2假病毒、Delta假病毒和Omicron假病毒,说明该mRNA制备的mRNA疫苗可取得对不同毒株的交叉保护反应。对序列进行表达应用,制备新型的针对新型冠状病毒Delta和Omicron变异株的mRNA疫苗,对新型冠状病毒Delta和Omicron变异株具有良好的免疫作用,且可以更快速的开发和大规模生产。
同时,本发明还构建了一种用于制备新型mRNA疫苗的多核苷酸分子,通过对5’-UTR、3’-UTR和polyA各个区域的科学设计,其提高了mRNA表达蛋白的水平。该多核苷酸分子不仅可以用于制备保护野生型SARS-COV-2、Delta和Omicron变异株的mRNA疫苗,还可以用于转染细胞或者细菌生产相应的抗体或者抗原蛋白,是一个通用性的核心元件组合,对推进生物医药行业的发展,具有重要意义。
实施例
实施例1新型冠状病毒S蛋白编码序列的构建及制备
对新型冠状病毒突变位点进行分析并设计了如SEQ ID NO:12所示的新型冠状病毒S蛋白的编码核酸序列,其编码的氨基酸序列如SEQ ID NO:13所示,其mRNA序列如SEQ ID NO:14所示,其中全部尿嘧啶核苷被N1-甲基假尿苷替换。提供该核酸序列(SEQ ID NO:12)委托南京金斯瑞生物科技有限公司合 成,金斯瑞QC放行。
表征数据是:金斯瑞QC放行结果显示序列正确。
实施例2质粒H的构建
质粒H构建流程图如图1A所示,构建改造示意图如图10A所示。
具体构建方法包括:
质粒B的构建:
以荧光素酶-pcDNA3质粒(购自Addgene,其质粒编号#18964)为骨架,在Kozack序列前面加入新的酶切位点HindIII和BamHI,并且在荧光素酶的终止密码子后面添加新的酶切位点KpnI和ApaI,得到质粒B。荧光素酶-pcDNA3质粒的核苷酸序列如SEQ ID NO:1所示。荧光素酶-pcDNA3的质粒图谱如图2所示。质粒B的质粒图谱如图3所示。质粒B的核苷酸序列如SEQ ID NO:2所示。
质粒C的构建:
在质粒B的HindIII和BamHI酶切位点之间插入如SEQ ID NO:9所示的5’-UTR序列,得到质粒C。
具体地,质粒B以HindIII和BamHI进行双酶切,切胶回收纯化获取分子量约为7kb的片段为载体片段,将如SEQ ID NO:9所示的5’-UTR序列以PCR的方式引入同源臂序列为插入片段。载体片段和插入片段以同源重组的方式生成质粒C,质粒C的质粒图谱如图4所示。质粒C的核苷酸序列如SEQ ID NO:3所示。
质粒D的构建:
在质粒C的KpnI和ApaI酶切位点之间插入如SEQ ID NO:10所示的3’-UTR序列,得到质粒D。质粒D的质粒图谱如图5所示。质粒D的核苷酸序列如SEQ ID NO:4所示。
质粒F的构建:
将质粒B中的Amp(氨苄青霉素)抗性基因更换为kana(卡那霉素)抗性基因,并且去除从3746开始到4540间的neo/KanR序列得到质粒F。质粒F的质粒谱图如图6所示。质粒F的核苷酸序列如SEQ ID NO:5所示。
质粒G的构建:
质粒F插入如SEQ ID NO:11所示的polyA序列,质粒F以ApaI进行单酶切,产物进行纯化,纯化后的单酶切产物和如SEQ ID NO:11所示的polyA序列以同源重组的方式进行构建。产物转化DH5α,克隆筛选挑取测序正确的质粒。质粒G的质粒谱图如图7所示。质粒G的核苷酸序列如SEQ ID NO:6所示。
质粒H的构建:
质粒D以HindIII和ApaI双酶切,切胶回收(axygen)取分子量约1.6kb左右的片段为片段A;质粒G以HindIII和ApaI双酶切,切胶回收(axygen)分子量约4.5kb左右的片段为片段B;将片段A和片段B用quick ligase T4(NEB)连接酶在25℃,反应5分钟;上述反应体系转化DH5α(takara)感受态细胞,涂板(带有50μg/mL卡那霉素),培养16小时后,挑取3~4个单克隆,在含有50μg/mL卡那霉素培养基中培养8小时,小提质粒送交上海生工测序。质粒H的质粒谱图如图8所示。质粒H的核苷酸序列如SEQ ID NO:7所示。
实施例35’-UTR的合成
设计以下5’-UTR序列。
表1:5’-UTR序列表
以上5’-UTR序列委托生工生物工程(上海)股份有限公司合成获得。根据该公司的质量分析报告,5’-UTR序列和理论设计序列一致。
实施例43’-UTR的合成
设计以下3’-UTR序列。
表2:3’-UTR序列表
以上3’-UTR序列委托生工生物工程(上海)股份有限公司合成获得。根据该公司的质量分析报告,3’-UTR序列和理论设计序列一致。
实施例5polyA的合成
设计以下polyA序列。
表3:polyA序列表
以上polyA序列相关委托IDT(intergrated DNA technologies)有限公司合成获得,根据该公司的质量分析报告,序列和理论设计序列一致。
实施例6工程质粒的构建
通过PCR的方式在序列如SEQ ID NO:12所示的新型冠状病毒S蛋白编码序列两端引入同源臂序列,然后将此PCR产物与质粒H进行BamHI和KpnI双酶切跑胶回收的大分子片段进行同源重组,进行感受态细胞DH5α转化,挑选单克隆,测序验证,最终获得正确的工程质粒。该工程质粒使用的5’-UTR是如SEQ ID NO:9所示的5UTR-NO54,3’-UTR是如SEQ ID NO:10所示的3UTR-NO50,使用的polyA的序列如SEQ ID NO:11所示。
数据表征:从质粒H开始,进行测序验证确认。结果显示核苷酸序列完全插入正确位置,且与理论 序列完全一致。工程质粒的质粒谱图如图9所示,构建流程图如图1B所示,构建改造示意图如图10B所示。
实施例7新型冠状病毒疫苗mRNA的制备
1.提取实施例6制备的工程质粒模板,保证质粒超螺旋率达90%以上。
2.质粒线性化
(1)酶切线性化:取20μg工程质粒使用相应酶酶切进行质粒线性化处理。
备注:根据实际情况调整反应体系,受纯化试剂盒柱子影响,每个反应体系质粒不超过20μg。
(2)将体系配制到0.2mL管中,混匀后放至37℃培养箱过夜或2h酶切反应。
(3)取1μL酶切后产物与原质粒同时跑电泳,看是否酶切完全。
3.线性化质粒纯化:使用Takara回收试剂盒回收
(1)向PCR反应液(或其它酶促反应液)中加入3倍量的Buffer DC(如果需加入的Buffer DC量不足100μL时应加入100μL),然后均匀混合。
(2)将试剂盒中的Spin Column安置于Collection Tube上。
(3)将上述操作(1)的溶液转移至Spin Column中,室温12000rpm离心1分钟,弃滤液。
(4)将700μL的Buffer WB加入Spin Column中,室温12000rpm离心30秒,弃滤液。
4.酚氯仿抽提(去RNA酶、蛋白类等)
(1)将待抽提质粒稀释至300μL或500μL,加入等体积的酚氯仿(注意分层,不要吸取到上层液体),12000rpm离心10min。
(2)离心后尽可能的吸取上层液体,再加入等体积的酚氯仿,12000rpm离心10min。
(3)离心后再次尽可能的吸取上层液体(注意这次不要吸到下层液体),加入0.1×5M的NaCl,0.7×异丙醇后冰浴15min后,12000rpm离心10min,弃上清。
(4)用70%的乙醇(提前冰浴)200μL洗涤一次,12000rpm离心1min,弃上清,再12000rpm离心1min,用小枪头彻底吸取干净。
(5)室温晾干后加适量的UItraPure DNase/RNase-Free-Distilled Water混匀。
(6)使用OneDrop测定纯化样品浓度。
鉴定:取100ng纯化后的质粒与原质粒一起电泳,确认质粒线性化完全且无杂带后可用于mRNA合成。
5.mRNA的体外转录(参考诺唯赞IVT反应试剂盒)
(1)实验区域清理:首先用紫外对生物安全柜进行灭菌0.5h,之后用酒精棉球将安全柜擦干净,喷上RNase抑制剂。待5min之后,用酒精棉球将抑制剂擦干净,开始RNA实验。
(2)体系的配置:配制体系前,将各组分试剂取出,在振荡器上涡旋混匀,离心,放置到冰盒中备用。
注:配置体系的过程中,全程在冰上操作,将质粒模板与IVT体系分来配制。
(3)IVT体系配制:将除了质粒模板的各个组分加入到体系液面以下,最后加T7RNA聚合酶,涡旋混匀,其中尿嘧啶(U)用N1-甲基假尿苷替代。
(4)取出需要质粒的量到新的PCR管中,和IVT体系一起孵育5min,最后将两者的体系混合到一起,涡旋震荡混匀,离心之后37℃孵育2h。
(5)将体系配制到0.2mL平盖薄壁管中,混匀后置于PCR仪中进行反应,反应条件为37℃2h。备注:反应体系也可根据所需要的生产量进行同步放大生产。
(6)使用DNase去除线性化质粒模板,加入1μL(20μL体系)或5μL(100μL体系)DNase于反应体系中,37℃孵育15min。
6.纯化方式:(参考Thermo MEGAclear Kit试剂盒)
柱纯化
(1)将每个反应样转移至1.5mL EP管(若体系不足100μL,用Elution Solution补足至100μL),轻柔混匀;
(2)加入350μL Binding Solution Concentrate,用移液器轻柔的混匀;
(3)加入250μL无水乙醇,用移液器轻柔的混匀;
(4)将试剂盒自带滤芯插入收集管中,将混合液700μL加入至滤芯中,室温结合10min,12000g离心1min,倒掉滤液,将收集管重复利用,之后进行RNA的洗涤;
(5)加入500μL Wash Solution,通过滤芯进行过滤(12000g离心1min);
(6)重复步骤5;
(7)去除Wash Solution,继续离心,最高转速离心1min,去除残留的Wash Solution;
(8)加入适量(80-100μL)事先预热的RNase-Free Distilled Water入滤芯,盖上盖子,70℃静置10min,12000g离心1min,可根据需要增加洗脱次数;
(9)浓度测定,用onedrop或Qubit测定浓度(稀释10倍后测定)。
7.鉴定:取5μL稀释的纯化样品与NorthernMax Formaldehyde Load Dye混合75℃孵育10min,然后置于冰上保存。然后使用1%琼脂糖凝胶进行凝胶电泳,确定mRNA大小正确,条带无弥散,可进行下一步加帽反应。
8.加帽反应
mRNACap1型加帽反应:
Cap1型帽子结构和反应原理如下:
pppN1(p)Nx-OH(3′)→ppN1(pN)x-OH(3′)+Pi
ppN1(pN)x-OH(3′)+GTP→G(5′)ppp(5′)N1(pN)x-OH(3′)+PPi
G(5′)ppp(5′)N1(pN)x-OH(3′)+AdoMet→m7G(5′)ppp(5′)N1(pN)x-OH(3′)+AdoHyc
m7GpppN1(pN)x-OH(3′)+AdoMet→m7Gppp[m2’-O]N1(pN)x-OH(3′)+AdoHyc
5‘-Cap1型帽子结构:
cap G1G2=m7G+-5′-ppp-5′-Gm2′-3′-p-[m7=7-CH3;m2′=2′-O-CH3;-ppp-=-PO2H-O-PO2H-O-PO2H)-;-p-=-PO2H-],37℃5min或者65℃5min(CELL SCRIPT,反应体系如下表4所示)。
表4:Cap1型加帽反应体系
备注:受体系影响,单次加帽mRNA量(100μL体系)不超过60μg。
加帽(100μL体系)(参考CELL SCRIPT加帽反应试剂盒)如下表5所示。
表5:100μL加帽体系
将预先加热的mRNA与上述体系混合一起,37℃,1h。
9.纯化方式:同体外转录后产物纯化方式一致
表征数据:用onedrop或Qubit测定浓度。
实验结果:编码新型冠状病毒S蛋白的mRNA终产物的序列为将SEQ ID NO:15中的全部尿嘧啶(U)核苷用N1-甲基假尿苷替代后所获得的序列。实验证实获得了该mRNA终产物。
实施例8 5’-UTR的筛选试验
5’-UTR对荧光素酶表达水平的影响用体内活体成像(IVIS,in vivo imaging)数据来进行比较。
mRNA合成流程如下:
将实施例3中不同的5’-UTR插入到质粒G的HindIII和BamHI之间,得到一系列其它部分的序列相同,而5’-UTR序列不同的质粒;将这些质粒替换工程质粒,按照实施例7所述方法制备得到一系列其它 序列相同,而5’-UTR序列不同的mRNA。
小鼠体内成像实验(IVIS)具体如下:
将含有不同的5’-UTR的mRNA产物进行制剂包封具体流程如下:
配液批量为1.5mL,mRNA∶:脂质的质量比为1∶10,HAc-NaOAc缓冲液(0.2M,pH5.0)在最终水相的浓度为0.025M。采用微流控设备(MPE-L2)及芯片(SN.000035),以水相:醇相=9mL/min:3mL/min进行各处方样品的制备,将两相按接口要求注入微流控芯片进行混合,实验设计信息详细如下表6所示。
表6:实验设计
表7:水相醇相处方表
其中,脂质SM-102化学结构如下所示:
SM-102
包封后的制剂样品进行透析换液操作,具体如下:
透析液配制:
1×PBS+8%蔗糖溶液:取2包1×PBS粉针至烧杯中,用2L DEPC水溶解混匀,继续加入160g蔗糖,混匀即得1×PBS+8%蔗糖溶液。
将各组药液分别装至100kD透析袋,浸入装有1L透析溶液的烧杯中,用铝箔纸将烧杯包裹并以100rpm转速室温透析1h后,更换透析液继续透析1个小时。
所获得含有不同的5’-UTR的mRNA制剂成品,委托南京云桥璞瑞生物科技有限公司进行动物成像实验,具体流程如下:
雄性BALB/C小鼠,5~7周龄,在SPF条件实验室环境下饲养和实验。包封后的mRNA制剂产品采用尾静脉注射的方式,每一种5’-UTR检测小鼠为3只,每只小鼠尾静脉注射20μg的mRNA制剂成品。16h-18h后,采用异氟烷吸入麻醉的方式麻醉小鼠,并注射D-Luciferin荧光素酶显影底物(150mg/kg)。将动物仰卧位放置,在IVIS活体成像系统下观察活体动物体内荧光素的信号分布及表达强度。
相关指标的观察:
(1)IVIS观察的图片,包括原始图片以及将光子数bar值统一后的结果对比图;
(2)荧光素荧光信号分布及表达强度分析数据。
试验结果如图11、12显示:5UTR-NO1、5UTR-NO3、5UTR-NO21、5UTR-NO24、5UTR-NO31、5UTR-NO32、5UTR-NO36、5UTR-NO43、5UTR-NO45、5UTR-NO48所示的5’-UTR效果较好,而5UTR-NO54所示的5’-UTR效果最佳。
实施例93’-UTR的筛选试验
筛选3’-UTR对荧光素酶表达水平影响,用体内活体成像(IVIS,in vivo imaging)数据来进行比较。
1、不含有5’-UTR
参照实施例7制备不含有5’-UTR且含有3UTR-NO3、3UTR-NO30或3UTR-NO50所示3’-UTR的mRNA,然后将这些mRNA参照实施例8分别制备mRNA制剂成品,委托南京云桥璞瑞生物科技有限公司进行动物成像实验,具体流程如下:
雄性BALB/C小鼠,5-7周龄,在SPF条件实验室环境下饲养和实验。包封后的mRNA制剂产品采用尾静脉注射的方式,每一种mRNA制剂产品使用3只小鼠进行检测,每只小鼠尾静脉注射20μg的mRNA制剂成品。16-18h后,采用异氟烷吸入麻醉的方式麻醉小鼠,并注射D-Luciferin荧光素酶显影底物(150mg/kg)。将动物仰卧位放置,在IVIS活体成像系统下观察活体动物体内荧光素的信号分布及表达强度。
相关指标的观察:
(1)IVIS观察的图片,包括原始图片以及将光子数bar值统一后的结果对比图;
(2)荧光素荧光信号分布及表达强度分析数据。
试验结果如图26和27所示,不含有5’-UTR但含有单独的3UTR-NO3、3UTR-NO30或3UTR-NO50所示3’-UTR的mRNA可以提高蛋白的表达水平,其中,含有单独的3UTR-NO3或3UTR-NO30所示3’-UTR的mRNA较含有单独的3UTR-NO50所示3’-UTR的mRNA的效果更好。
2、含有5’-UTR
mRNA合成流程如下:
将5UTR-NO54插入到空白质粒G的HindIII和BamHI之间,固定5’-UTR序列以后,再将实施例4 中不同的3’-UTR插入到该质粒的ApaI和KpnI之间,得到一系列含有5UTR-NO54序列,其它部分序列相同,而3’-UTR不同的质粒。将这些质粒替换工程质粒,按照实施例7所述方法制备得到一系列含有5UTR-NO54序列,其它部分序列相同,而3’-UTR不同的mRNA。
小鼠体内成像实验(IVIS)具体如下:
含有不同的3’-UTR的mRNA产物进行制剂包封具体流程与实施例8中的将含有不同的5’-UTR的mRNA产物进行制剂包封,具体流程类似,只是用含有不同的3’-UTR的mRNA产物替换了含有不同的5’-UTR的mRNA产物。
所获得的含有不同的3’-UTR的mRNA制剂成品,委托南京云桥璞瑞生物科技有限公司进行动物成像实验,具体流程如下:
雄性BALB/C小鼠,5-7周龄,在SPF条件实验室环境下饲养和实验。包封后的mRNA制剂产品采用尾静脉注射的方式,每一种3’-UTR检测小鼠为3只,每只小鼠尾静脉注射20μg的mRNA制剂成品。16-18h后,采用异氟烷吸入麻醉的方式麻醉小鼠,并注射D-Luciferin荧光素酶显影底物(150mg/kg)。将动物仰卧位放置,在IVIS活体成像系统下观察活体动物体内荧光素的信号分布及表达强度。
相关指标的观察:
(1)IVIS观察的图片,包括原始图片以及将光子数bar值统一后的结果对比图;
(2)荧光素荧光信号分布及表达强度分析数据。
试验结果如图13、14所示,固定5’-UTR为5UTR-NO54后,更换不同的3’-UTR,发现3UTR-NO2、3UTR-NO3、3UTR-NO9、3UTR-NO21、3UTR-NO27、3UTR-NO28、3UTR-NO30、3UTR-NO35、3UTR-NO50效果较好。
实施例10polyA的筛选试验
mRNA的制备:将实施例5中不同的polyA序列,插入到质粒F的ApaI位点后,制备得到一系列其它序列相同,而polyA序列不同的质粒,再将这些质粒替换工程质粒,按照实施例7所述方法制备得到一系列其它序列相同,而polyA序列不同的mRNA。
PolyA对mRNA的影响,用活体成像IVIS数据来进行比较。
小鼠体内成像实验(IVIS)具体如下:
含有不同的PolyA的mRNA产物进行制剂包封具体流程与实施例8中的将含有不同的5’-UTR的mRNA产物进行制剂包封具体流程类似,只是用含有不同的PolyA的mRNA产物替换了含有不同的5’-UTR的mRNA产物。
所获得的最终不同的PolyA的mRNA制剂成品,委托南京云桥璞瑞生物科技有限公司进行动物成像实验,具体流程如下:
雄性BALB/C小鼠,5-7周龄,在SPF条件实验室环境下饲养和实验。包封后的mRNA制剂产品采用尾静脉注射的方式,每一种5UTR检测小鼠为3只,每只小鼠注射尾静脉12μg的mRNA制剂成品。16-18h后,采用异氟烷吸入麻醉的方式麻醉小鼠,并注射D-Luciferin荧光素酶显影底物(150mg/kg)。将动物仰卧位放置,在IVIS活体成像系统下观察活体动物体内荧光素的信号分布及表达强度。
相关指标的观察:
(1)IVIS观察的图片,包括原始图片以及将光子数bar值统一后的结果对比图;
(2)荧光素荧光信号分布及表达强度分析数据。
结果显示:如图15和图16所示,polyAV1、polyAV2、polyAV3、polyAV4、polyAV6、polyAV9相比其他polyA序列,可以提高体内蛋白水平的表达,其中以polyAV1的体内蛋白表达水平最高。
实施例11新型冠状病毒疫苗mRNA疫苗和小鼠体内免疫血清的制备
本实施例使用的mRNA按照实施例7所述方法制备获得,其序列为将SEQ ID NO:15中的全部尿嘧啶(U)核苷用N1-甲基假尿苷替代后所获得的序列。
体内免疫实验中的新型冠状病毒疫苗mRNA进行包封的制剂体系如下表8和表9所示。
表8:包封制剂体系
表9:水相醇相处方表
M-DMG2000即为PEG2000-DMG
透析液配制:
1×PBS+8%蔗糖溶液:取2包1×PBS粉针至烧杯中,用2L DEPC水溶解混匀,继续加入160g蔗糖,混匀即得1×PBS+8%蔗糖溶液。
将各组药液分别装至100KD透析袋,浸入装有1L透析溶液的烧杯中,用铝箔纸将烧杯包裹并以100rpm转速室温透析1h后,更换透析液继续透析1个小时。
透析后的制剂样品进行除菌过滤,具体如下:0.22μm的一次性过滤膜进行除菌过滤;最终获得的制剂成品,测试包封率。
新型冠状病毒疫苗mRNA疫苗的体内免疫实验分组,雌性小鼠,16g~18g,SPF环境适应性饲养。分成三组实验,分别为:生理盐水组(空白对照,6只),mRNA疫苗-5μg测试组(6只),mRNA疫苗-10μg测试组(6只)。受试样品进行肌肉注射,注射第一针疫苗的时间记为第1天;在第26天,进行第二次免疫(和第一次免疫剂量方式一致)。在疫苗免疫后的第7天、第14天、第33天、第44天眼眶采血以测试针对delta特异性的IgG抗体(供实施例12测试)。在第14天、第37天、第44天小鼠眼眶采血,进行野生型SARS-COV-2和突变型delta假病毒中和实验(供实施例13测试)。
血清获取步骤:采用非抗凝管收集所取的血液,冰上放置30分钟后,离心机4℃,3500rpm离心10分钟,分层后,用移液器小心吸取上层的淡黄色液体。
实施例12新型冠状病毒mRNA疫苗的小鼠免疫血清针对S蛋白的IgG抗体滴定实验
特异性S蛋白的IgG抗体滴定试验所需的免疫血清由实施例11实验提供。
耗材和试剂:SARS-CoV-2 Spike Trimer(T19R,G142D,EF156-157del,R158G,L452R,T478K,D614G,P681R,D950N,购买自acrobiosystems,货号为SPN-C52He)、Goat anti-Mouse IgG(H+L)HRP Conjugated、Ms mAb to SARS spike glycoprotein[IA9]、96孔酶标板、PBS、牛血清白蛋白、单组分TMB显色液、终止液。
首先是抗原包被:用1×PBS稀释抗原SARS-CoV-2Spike Trimer为1μg/mL,每孔抗原加入100μL,用封板膜封板,置37℃,4h,或4℃,16h弃去孔中液体,洗液洗三遍。
第二封闭:用封闭液(3%的BSA,PBST配置)以230μL/孔加入酶标板,用封板膜封板,37℃静置孵育40-60min,孵育结束后,洗三遍。
样品制备:待检测的小鼠免疫血清样品(实施例11提供)稀释到合适的浓度梯度(1∶10~1∶31250,起始稀释度为1∶10,5倍倍比稀释)。采用较大稀释体积进行,一般保证样品吸取量>20μL。阳性对照Ms mAb to SARS spike glycoprotein[IA9]进行1∶50000稀释。100μL/孔,37℃孵育60min,孵育结束后,洗三遍。
加入酶标二抗Goat anti-Mouse IgG(H+L)HRP Conjugated:酶标二抗进行1∶10000稀释。37℃,孵育40min,孵育结束后,洗三遍。
底物显色(TMB显色底物):每孔100μL,室温避光放置5min。
终止反应:每孔加入终止液50μL终止反应,于20min内测定实验结果。
检测指标:ELISA结果以在波长nm的OD(450nm-630nm)表示
试验结果如图20所示:新型冠状病毒mRNA疫苗产生较高的针对Delta S蛋白的IgG抗体(10μgmRNA疫苗在第44天产生平均1.3+e6的IgG抗体滴度)。
实施例13新型冠状病毒mRNA疫苗的小鼠免疫血清假病毒中和实验
假病毒中和试验所需的免疫血清由实施例11实验提供。
试剂耗材:假病毒SARS-CoV-2Delta株-Fluc:1~2×104TCID50/mL
灭活小鼠血清:56℃,30min、Vero细胞、DMEM、FBS、荧光素酶报告基因检测试剂。
血清样本的起始稀释度(用无血清的DMEM稀释):1∶20(血清样本需要提前灭活处理,56℃30min)。
在96孔白板B2~G2加入100μL含10%FBS的DMEM培养基作为细胞对照(CC),在B3~G3加入100μL含10%FBS的DMEM培养基作为病毒对照(VC)。
在96孔白板B4~B12加入150μL稀释后的血清样本(实施例11提供),作为样本的初始稀释液,C4~G12加入100μL DMEM无血清培养基。
从B4~B12取50μL体积到下一行混合均匀后进行3倍梯度稀释,共7个梯度,将最后一行多余的50μL液体弃去;
除B2~G2,每孔加入50μL稀释后的病毒,病毒滴度稀释到13000TCID50/mL 37℃孵育1h;每孔加入100μL密度为0.5×106细胞/孔的Vero细胞;培养24h后,取出96孔白板,平衡至室温,从孔板中吸出100μL培养基,加入100μL室温平衡后的Bio-Lite报告基因检测试剂,震板2min,室温静置5min后用酶标仪检测化学发光值(RLU)。
假病毒中和测试实验委托南京诺唯赞生物科技有限公司进行,具体实验步骤如上述的具体步骤开展。
结果如图21和22显示:新型冠状病毒mRNA疫苗可对野生型SARS-COV-2(10μg mRNA疫苗在第44天的中和抗体IC50为7952)和Delta(10μg mRNA疫苗在第44天的中和抗体IC50为3966)假病毒产生较好的免疫保护效应。
实施例14工程质粒的细胞western blot活性实验
试剂耗材:HEK293T、DMEM basic(1×)、Opti-MEMTMI减血清培养基、2000 Reagent、6孔板、sample buffer&leammli 2×concentrate、8%SDS-PAGE Color Preparation Kit、Ms mAb to SARS spike glycoprotein[IA9]、Goat anti-Mouse IgG(H+L)HRP Conjugated、PageRuler prestained Protein Ladder、牛血清白蛋白、超灵敏ECL发光试剂、甲醇。
提前一天按照2×106/孔,将293T细胞铺于60mm培养皿,待第二天细胞融合度达到70%~90%时进行细胞转染。
按试验需要的转染比例配好转染试剂,每孔细胞转染5μg工程质粒,37℃CO2培养箱孵育24h后进行western blot实验。
细胞裂解,95-100℃10min加热充分变性,恢复室温后上样跑胶,结束后转膜半小时,5%脱脂奶粉室温封闭1h。1%BSA稀释一抗(Ms mAb to SARS spike glycoprotein[IA9]1∶2000),室温孵育1h后,TBST洗三次。1%BSA稀释二抗(Goat anti-Mouse IgG(H+L)HRP Conjugated,1∶5000),室温摇床,1h,TBST洗三次。ECL显色上机检测化学发光。
结果如图17所示:工程质粒载体可在细胞内以高水平成功表达相应的抗原蛋白。
实施例15工程质粒和对应mRNA的细胞FACS活性实验
mRNA制备:新型冠状病毒mRNA制备流程详见实施例7。
试剂耗材:HEK293T、2000 Reagent、DMEM basic(1×)、24孔板、TrypLE Express、流式细胞管(BD)、流式一抗ACE2-Fc(acrobiosystems),流式二抗PE anti-human IgG Fc Recombinant Antibody(Biolegend)。
工程质粒或者对应mRNA转染HEK293T,提前一天按照1×105/孔,将HEK293T细胞铺于24孔板,待第二天细胞融合度达到70%~90%时进行细胞转染。
按试验需要的转染比例配好转染试剂,将转染复合物100μL/孔,每孔转3μg DNA或者3μg mRNA,37℃CO2培养箱孵育24h后进行FACS。
FACS检测:将细胞上清去除,每孔加入100μL/孔细胞消化液,室温消化1min,加入1mL 1×PBS重悬,2000rpm,离心2min去上清。空白组为不转染组(有同型对照抗体的加一组同型对照)。
一抗孵育:用1×PBS稀释一抗ACE2-Fc(acrobiosystems)1μg/mL,每个样品加入100μL,4℃孵育30min,2000rpm,离心2min去上清,加入1mL 1×PBS洗涤3次。
二抗孵育:用1×PBS稀释二抗PE anti-human IgG Fc Recombinant Antibody(Biolegend)。
1μg/mL,每个样品加入100μL,4℃孵育30min,2000rpm,离心2min去上清,加入1mL 1×PBS洗涤3次,然后加入100μL 1×PBS重悬,上机检测。
试验结果如图18所示:工程质粒和mRNA产物均可以在转染细胞上高表达正确的S蛋白。
实施例16新型冠状病毒mRNA的ELISA活性实验
mRNA制备:mRNA制备流程详见实施例7。
试剂耗材:DMEM basic(1×)、胎牛血清FBS、LipofectamineTMMessengerMAXTM、Opti-MEMTMI减血清培养基、0.25%Trypsin-EDTA(1×)、裂解液、Cocktail、Anti-nCoV-RBD Neutralizing Antibody、HRP conjugated Anti-nCoV-RBD-1Neutralizing antibody、PBS缓冲液、ELISA显色液、终止液、96孔酶标板。
按6×105个/mL的密度铺96孔板,细胞数为6×104个。每个样品设置三个复孔。铺板24h后转染mRNA,配制转染复合物,根据mRNA转染梯度(μg/孔)进行转染,设置三个复孔,转染梯度为0.05μg、0.015μg、0.03μg、0.06μg、0.18μg、0.54μg、1.62μg、4.86μg。转染24h后弃去培养基,PBS清洗一次,用120μLNP40裂解液(加100×cocktail)冰上解10min,4000rpm离心10min,后吸取100μL做后续ELISA实验。用包被液(PBS缓冲液)稀释Anti-nCoV-RBD Neutralizing Antibody为1μg/mL,100μL/孔,4度静置过夜。洗板后,用封闭液(3%W/V的BSA/PBS缓冲液)以240μL/孔加入酶标板,用封板膜封板,37℃静置孵育1h。洗板后,吸取收获的细胞上清液100μL至96孔板中,室温静置孵育2.5h。洗板后,用样品稀释液(0.5%W/V的BSA/洗液(洗液为PBS缓冲液加0.05%Tween20))对HRP conjugated Anti-nCoV-RBD-1Neutralizing antibody抗体进行8000倍稀释,100μL/孔,室温静置孵育1h。洗板后,加入ELISA显色液显色,100μL/孔,室温静置孵育10min,加终止液终止反应,酶标仪读数。
结果如图19所示:新型冠状病毒mRNA产物可在细胞上剂量依赖性表达S蛋白。
实施例17化合物(I)的合成
步骤1):8-((3-羟基环己基)氨基)辛酸壬酯的合成
在100mL的反应瓶中依次加入8-溴辛酸1-辛基壬酯(3.50g,10mmol),3-氨基环己醇(11.5g,100mmol),乙醇30mL,搅拌溶解后,再加入N,N-二异丙基乙胺(2.58g,20mmol),室温下反应24h,加入二氯甲烷100mL,水洗3次后,使用无水硫酸钠干燥,浓缩后,使用快速柱层析系统纯化(二氯甲烷甲醇=20∶1至5∶1)得到8-((3-羟基环己基)氨基)辛酸壬酯(2.34g,61%)。
1H NMR(600MHz,CDCl3)δ4.20-4.13(m,0.5H),4.05(t,2H),3.83(m,0.5H),3.09(m,0.5H),2.87(m,0.5H),2.76-2.59(m,2H),2.29(t,2H),2.00(m,0.5H),1.93-1.78(m,1.5H),1.78-1.65(m,2H),1.65-1.46(m,8H),1.40-1.18(m,20H),0.88(t,3H).
LCMS:384.3[M+H]+
步骤2):化合物(I)的合成
在100mL的反应瓶中依次加入8-((3-羟基环己基)氨基)辛酸壬酯(383mg,1mmol),8-溴辛酸1-辛基壬酯(554mg,1.2mmol),乙腈20mL,搅拌溶解后,再加入碳酸钾(276mg,2mmol),碘化钾(166mg,1mmol),室温下反应24h,加入二氯甲烷100mL,水洗3次后,使用无水硫酸钠干燥,浓缩后,使用快速柱层析系统纯化(二氯甲烷∶甲醇=20∶1至5∶1)得到化合物(I)(596mg,78%)。
1H NMR(600MHz,CDCl3)δ4.95-4.81(m,1H),4.30-4.12(m,0.5H),4.07(t,2H),3.72-3.61(m,0.5H),2.97(m,0.5H),2.64-2.52(m,0.5H),2.48-2.37(m,4H),2.30(q,4H),1.93-1.81(m,2H),1.72-1.57(m,8H),1.51(t,4H),1.43-1.18(m,56H),0.89(m,9H).
LCMS:765.3[M+H]+
实施例18新型冠状病毒mRNA疫苗对Omicron变异株的保护活性实验
新型冠状病毒mRNA疫苗的体内免疫实验分组,雌性小鼠,16g~18g,SPF环境适应性饲养。分成三组实验,分别为:生理盐水组(空白对照,5只),mRNA疫苗-5μg测试组(5只),mRNA疫苗-10μg测试组(5只)。受试样品进行肌肉注射,注射第一针疫苗的时间记为第1天;在第21天,进行第二次免疫(和第一次免疫剂量方式一致)。在疫苗免疫后的第7天、第14天、第28天、第35天眼眶采血测试针对Omicron特异性的IgG抗体。在第35天小鼠采血,进行Omicron(BA.2)假病毒中和实验,同时取脾脏淋巴细胞进行IFNγ-Elispot测定来测试疫苗的细胞免疫反应。
血清获取步骤:采用非抗凝管收集所取的血液,冰上放置30分钟后,离心机4℃,3500rpm,离心10分钟,分层后,用移液器小心吸取上层的淡黄色液体。
1、新型冠状病毒mRNA疫苗免疫小鼠后的特异性结合Omicron S蛋白的IgG抗体滴度检测
耗材和试剂:Omicron Spike Trimer(购买自acrobiosystems,货号为SPN-C52Hz)、Goat anti-Mouse IgG(H+L)HRP Conjugated、Ms mAb to SARS spike glycoprotein[IA9]、96孔酶标板、PBS、牛血清白蛋白、单组分TMB显色液、终止液。
实验步骤参考实施例12。
结果如图23显示:新型冠状病毒mRNA疫苗产生较高的针对Omicron S蛋白的IgG抗体(5μg mRNA疫苗在第35天产生平均2.67+e5的IgG抗体滴度)。
2、新型冠状病毒mRNA疫苗免疫小鼠后的针对Omicron假病毒的中和抗体滴度检测
试剂耗材:假病毒SARS-CoV-2Omicron(BA.2)株-Fluc:1~2×104TCID50/mL
灭活小鼠血清:56℃,30min、Vero细胞、DMEM、FBS、荧光素酶报告基因检测试剂。
实验步骤参考实施例13。
结果如图24显示:新型冠状病毒mRNA疫苗可对Omicron(10μg mRNA疫苗在第35天的中和抗体IC50为7952)假病毒产生较好的免疫保护效应。
3、脾脏淋巴细胞的IFN-γElispot检测
试剂和耗材:新冠SARS-CoV-2 Spike S1 Peptide Pool(PP003-A),SARS-CoV-2 Spike S2 Peptide Pool(PP003-B),小鼠淋巴细胞分离液(达科为,7211011),Mouse IFN-γELISPOT kit(达科为, CT317-PR2)
(1)淋巴细胞分离:在60mm培养皿中放入5mL恢复室温的小鼠淋巴细胞分离液,研磨脾脏。把悬有脾脏细胞的分离液立即转移到15mL离心管中,覆1mL的RPMI 1640培养基(保持液面分界明显)。室温,水平转子800g离心30min,注意设置较慢的加速度和减速度。离心结束后细胞分层,吸出淋巴细胞层,再加入10mL RPMI 1640培养基,颠倒洗涤。室温,250g离心10min收集细胞。倾倒上清液,用培养液重悬细胞,计数。
(2)肽库刺激Elispot实验:
正对照孔:加入阳性刺激剂工作液(用无血清培养基或者RPMI 1640将PMA原液进行10倍稀释,浓度即为10μg/mL,然后10μL/well加入每孔)。
负对照孔:加入重悬细胞所用的培养基;
实验孔:加入实验者自己的刺激物(用无血清培养基或者RPMI 1640将S1+S2肽库进行稀释。工作液的终浓度为1μg/mL)。
具体过程按照试剂盒的操作说明进行实验。
结果如图25显示:新型冠状病毒mRNA疫苗免疫小鼠后可以激活淋巴细胞产生较强的细胞免疫反应。
以上实施例表明,本申请发明人成功设计了一种新的新型冠状病毒S蛋白的RNA编码序列以及由此得到的新型mRNA疫苗。所述mRNA疫苗对不同毒株,包括新型冠状病毒野生型SARS-COV-2、Delta和Omicron变异株具有交叉保护反应,并对Delta和Omicron变异株具有良好的免疫作用,且可以更快速的开发和大规模生产。
以上实施例还表明,本申请发明人还成功构建了一种用于制备新型RNA疫苗(例如mRNA疫苗)的通用型多核苷酸分子(例如3’-UTR、5’-UTR、载体等),其提高了mRNA表达蛋白的水平。所述多核苷酸分子不仅可以用于制备对新型冠状病毒野生型SARS-COV-2、Delta和Omicron变异株具有良好免疫作用的mRNA疫苗,还可以用于转染细胞或者细菌以生产相应的抗体或者抗原蛋白,因而是一个通用性的核心元件组合。
以上实施例还表明,本申请发明人还成功构建了一种用于通用型多核苷酸分子(例如3’-UTR、5’-UTR、载体等),其提高了mRNA表达蛋白的水平。所述多核苷酸分子不仅可以用于体外制备蛋白和/或多肽,还可以用于在体内产生相应的蛋白和/或多肽,是一个通用性的核心元件。

Claims (52)

  1. 一种RNA,其编码新型冠状病毒S蛋白,所述S蛋白包含SEQ ID NO:13所示的氨基酸序列;优选地,所述RNA包含SEQ ID NO:14所示的核酸序列,更优选地,所述RNA的核酸序列如SEQ ID NO:14所示。
  2. 根据权利要求1所述的RNA,其中所述RNA中的一个或多个尿嘧啶核苷,例如1、2、3、4、5、6、7、8、9、10个尿嘧啶核苷或者至少50%、至少60%、至少70%、至少80%、至少90%或100%的尿嘧啶核苷被至少一种选自以下的核苷替换:假尿苷、N1-甲基假尿苷、N1-乙基假尿苷、2-硫尿苷、4′-硫尿苷、5-甲基胞嘧啶、5-甲基尿苷、2-硫基-1-甲基-1-去氮杂-假尿苷、2-硫基T-甲基-假尿苷、2-硫基-5-氮杂-尿苷、2-硫基-二氢假尿苷、2-硫基-二氢尿苷、2-硫基-假尿苷、4-甲氧基-2-硫基-假尿苷、4-甲氧基-假尿苷、4-硫基-1-甲基-假尿苷、4-硫基-假尿苷、5-氮杂-尿苷、二氢假尿苷或5-甲氧基尿苷和2′-O-甲基尿苷,优选假尿苷或N1-甲基假尿苷或N1-乙基假尿苷,更优选N1-甲基假尿苷;和/或
    所述RNA中的一个或多个胞嘧啶核苷,例如1、2、3、4、5、6、7、8、9、10个胞嘧啶核苷或者至少50%、至少60%、至少70%、至少80%、至少90%或100%的胞嘧啶核苷被5-甲基胞嘧啶核苷替换。
  3. 根据权利要求1或2所述的RNA,其中所述RNA中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换;优选地,所述SEQ ID NO:14所示的核酸序列中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换;更优选地,所述SEQ ID NO:14所示的核酸序列中的全部尿嘧啶核苷被N1-甲基假尿苷替换。
  4. 根据权利要求1-3中任一项所述的RNA,其还包含5’-帽结构、5’-UTR、3’-UTR和polyA中的至少一种。
  5. 根据权利要求4所述的RNA,其中所述5’-帽结构选自m7GpppG、m2 7,3′-OGpppG、m7Gppp(5′)N1或m7Gppp(m2′-O)N1中的至少一种,优选m7Gppp(5′)N1或m7Gppp(m2′-O)N1,其中“m7G”代表7-甲基鸟苷帽核苷,“ppp”代表帽核苷的5′碳和初级RNA转录物的第一个核苷酸之间的三磷酸酯键,N1是最5′的核苷酸,“G”代表鸟嘌呤核苷,“7”代表在鸟嘌呤的7-位上的甲基,“m2′-O”代表核苷酸2′-O位上的甲基;
    和/或所述5’-UTR选自下述(1)-(5):
    (1)包含SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列的5’-UTR、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42相对应的RNA序列所示5’-UTR相同或更优的提高翻译效率的功能;优选地,所述同源物的核酸序列与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
    (2)由SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列组成的5’-UTR;
    (3)由SEQ ID NO:9所示核酸序列相对应的RNA序列组成的5’-UTR;
    (4)上述(1)-(3)中2个或2个以上相同5’-UTR经串联获得的5’-UTR;或
    (5)上述(1)-(3)中2个或2个以上不同5’-UTR经串联获得的5’-UTR;
    和/或所述3’-UTR选自下述(1)-(5):
    (1)包含SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列的3’UTR、其同源物、片段或变体;所述同源物、片段或变体具有与SEQ ID NO:47-67或10相对应的RNA序列所示3’-UTR相同或更优的提高翻译效率和/或稳定性的功能;优选地,所述同源物的核酸序列与SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
    (2)由SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列组成的3’-UTR;
    (3)由SEQ ID NO:10所示核酸序列相对应的RNA序列组成的3’-UTR;
    (4)上述(1)-(3)中2个或2个以上相同3’-UTR经串联获得的3’-UTR;或
    (5)上述(1)-(3)中2个或2个以上不同3’-UTR经串联获得的3’-UTR;
    和/或所述polyA为截断式polyA,即在多个连续的核苷酸A后加一段10bp的非A的接头序列再加多个连续的核苷酸A;优选地,polyA为30个连续核苷酸A后加一段10bp的非A的接头序列再加70个连续的核苷酸A;
    优选地,所述polyA选自下述(1)-(3):
    (1)包含SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列的polyA、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:68-70、72、75或11相对应的RNA序列所示polyA相同或更优的提高翻译效率和/或稳定性的功能;优选地,所述同源物包含与SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同源性的核酸序列;
    (2)由SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列组成的polyA;或
    (3)由SEQ ID NO:11所示核酸序列相对应的RNA序列组成的polyA。
  6. 根据权利要求1-5中任一项所述的RNA,其包含SEQ ID NO:15所示的核酸序列,更优选地,其核酸序列如SEQ ID NO:15所示。
  7. 根据权利要求6所述的RNA,其中所述RNA中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换;优选地,所述SEQ ID NO:15所示的核酸序列中的全部或部分尿嘧啶核苷被假尿苷,优选N1-甲基假尿苷替换;更优选地,所述SEQ ID NO:15所示的核酸序列中的全部尿嘧啶核苷被N1-甲基假尿苷替换。
  8. 一种蛋白质,其由权利要求1-7中任一项所述的RNA表达,优选地,所述蛋白质包含如SEQ ID NO:13所示的氨基酸序列,更优选地,其氨基酸序列如SEQ ID NO:13所示。
  9. 编码权利要求1-7中任一项所述RNA的DNA;优选地,所述DNA包含SEQ ID NO:12所示的核酸序列;优选地,所述DNA包含SEQ ID NO:8所示的核酸序列。
  10. 一种载体,其包含权利要求9所述的DNA。
  11. 一种宿主细胞,其包含权利要求10所述的载体。
  12. 一种脂质纳米颗粒,其包含权利要求1-7中任一项所述的RNA。
  13. 根据权利要求12所述的脂质纳米颗粒,其还含有可离子化阳离子脂质、辅助脂质、结构脂质和PEG-脂质中的一种或多种。
  14. 根据权利要求13所述的脂质纳米颗粒,所述可离子化阳离子脂质选自Dlin-MC3-DMA、Dlin-KC2-DMA、DODMA、c12-200或DlinDMA中的一种或多种;和/或所述辅助脂质选自DSPC,DOPE,DOPC或DOPS中的一种或多种;和/或所述结构脂质选自胆固醇、胆固醇酯、固醇类激素、固醇类维生素和胆汁酸中的至少一种;和/或所述PEG-脂质选自PEG-DMG或PEG-DSPE,优选为PEG-DMG,更优选地,PEG-DMG是1,2-二肉豆蔻酸甘油酯的聚乙二醇(PEG)衍生物,进一步优选,PEG的平均分子量约为2000或5000道尔顿,优选2000道尔顿。
  15. 一种药物组合物,其包含权利要求1-7中任一项所述的RNA、权利要求8所述的蛋白质、权利要求9所述的DNA、权利要求10所述的载体、权利要求11所述的宿主细胞或权利要求12-14中任一项所述的脂质纳米颗粒,以及药学上可接受的载体和/或赋形剂。
  16. 权利要求1-7中任一项所述的RNA、权利要求8所述的蛋白质、权利要求9所述的DNA、权利要求10所述的载体、权利要求11所述的宿主细胞或权利要求12-14中任一项所述的脂质纳米颗粒或权利要求15所述的药物组合物在制备用于预防新型冠状病毒感染的疫苗中的用途。
  17. 一种人工RNA分子,其包含5’-UTR和编码感兴趣的蛋白和/或多肽的核酸序列,所述5’-UTR选自下述(1)-(5):
    (1)包含SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列的5’-UTR、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42相对应的RNA序列所示5’-UTR相同或更优的提高翻译效率的功能;优选地,所述同源物的核酸序列与SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%的同源性;
    (2)由SEQ ID NO:9、16、17、23、24、28、29、32、37、39或42所示核酸序列相对应的RNA序列组成的5’-UTR;
    (3)由SEQ ID NO:9所示核酸序列相对应的RNA序列组成的5’-UTR;
    (4)上述(1)-(3)中2个或2个以上相同5’-UTR经串联获得的5’-UTR;或
    (5)上述(1)-(3)中2个或2个以上不同5’-UTR经串联获得的5’-UTR。
  18. 根据权利要求17所述的人工RNA分子,其进一步包含3’-UTR以及polyA;
    优选地,所述3’-UTR选自下述(1)-(5):
    (1)包含SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列的3’UTR、其同源物、片段或变体;所述同源物、片段或变体具有与SEQ ID NO:47-67或10相对应的RNA序列所示3’-UTR相同或更优的提高翻译效率和/或稳定性的功能;优选地,所述同源物的核酸序列与SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同源性;
    (2)由SEQ ID NO:47-67或10所示核酸序列相对应的RNA序列组成的3’-UTR;
    (3)由SEQ ID NO:10所示核酸序列相对应的RNA序列组成的3’-UTR;
    (4)上述(1)-(3)中2个或2个以上相同3’-UTR经串联获得的3’-UTR;或
    (5)上述(1)-(3)中2个或2个以上不同3’-UTR经串联获得的3’-UTR;
    和/或所述polyA为截断式polyA,即在多个连续的核苷酸A后加一段10bp的非A的接头序列再加多个连续的核苷酸A;优选地,polyA为30个连续核苷酸A后加一段10bp的非A的接头序列再加70个连续的核苷酸A;
    优选地,所述polyA选自下述(1)-(3):
    (1)包含SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列的polyA、其同源物、片段或变体,所述同源物、片段或变体具有与SEQ ID NO:68-70、72、75或11相对应的RNA序列所示polyA相同或更优的提高翻译效率和/或稳定性的功能;优选地,所述同源物包含与SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同源性的核酸序列;
    (2)由SEQ ID NO:68-70、72、75或11所示核酸序列相对应的RNA序列组成的polyA;或
    (3)由SEQ ID NO:11所示核酸序列相对应的RNA序列组成的polyA。
  19. 一种RNA分子,其包含:
    (1)编码感兴趣的多肽和/或蛋白的第一核苷酸序列;和
    (2)含有3’-非翻译区(3’-UTR)的第二核苷酸序列;
    所述3’-UTR包含以下多核苷酸中的至少一种:
    (a):源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146和GHRL中的至少一个基因的3’-UTR;
    (b):(a)中所述3’-UTR的片段;
    (c):(a)中所述3’-UTR的变体;及
    (d):(b)中所述片段的变体;
    所述第一核苷酸序列和所述第二核苷酸序列不天然出现于同一RNA分子。
  20. 根据权利要求19所述的RNA分子,其中所述基因是人基因。
  21. 根据权利要求19或20所述的RNA分子,其中所述第二核苷酸序列包含以下多核苷酸中的至少一种:
    (e):源自基因COP1和HDGFL1中的至少一个基因的3’-UTR;
    (f):(e)中所述3’-UTR的片段;
    (g):(e)中所述3’-UTR的变体;及
    (h):(f)中所述片段的变体。
  22. 根据权利要求19~21任一项所述的RNA分子,其中所述第二核苷酸序列包含下述多核苷酸中的至少一种:
    序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段的变体;
    优选地,所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
  23. 根据权利要求19~22任一项所述的RNA分子,其中所述第二核苷酸序列包含:(a)中所述基因中的至少两个基因的3’-UTR、(a)中所述基因中的至少两个基因的3’-UTR的片段、(a)中所述基因中的至少两个基因的3’-UTR的变体和(a)中所述基因中的至少两个基因的3’-UTR的片段的变体中的至少一种。
  24. 根据权利要求19~23任一项所述的RNA分子,其中所述第二核苷酸序列包含:至少两个拷贝的
    (a)中的3’-UTR、至少两个拷贝的(a)中的3’-UTR的片段、至少两个拷贝的(a)中的3’-UTR的变体和至少两个拷贝的(a)中的3’-UTR的片段的变体中的至少一种。
  25. 根据权利要求19~24任一项所述的RNA分子,其进一步还包含启动子、5’-帽子结构、5’-UTR和polyA中的至少一种。
  26. 根据权利要求25所述的RNA分子,
    (1)所述5’-帽子结构包括m7GpppG、m2 7,3′-OGpppG、m7Gppp(5′)N1和m7Gppp(m2′-O)N1中的至少一种;
    (2)所述5’-UTR包含:
    i)源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR、其片段、变体和片段的变体中的至少一种;优选地,序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体;
    优选地,所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    ii)下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体;
    优选地,序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    iii)至少两个拷贝的i)或ii)中的其中一种多核苷酸;或
    iv)至少两种i)中的多核苷酸;
    (3)构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;优选地,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;
    优选地,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸;优选地,所述polyA为截断式polyA;优选地,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;优选地,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A;
    优选地,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;优选地,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    更优选地,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;优选地,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
  27. 一种RNA分子,其包含:
    (1)编码感兴趣的多肽和/或蛋白的第一核苷酸序列;和
    (2)含有5’-非翻译区(5’-UTR)的第三核苷酸序列;
    所述5’-UTR包含以下多核苷酸中的至少一种:
    (a):源自基因APOA1、CARD16、ALB、APOC1、EEFIA1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR;
    (b):(a)中所述5’-UTR的片段;
    (c):(a)中所述5’-UTR的变体;及
    (d):(b)中所述片段的变体;
    所述第一核苷酸序列和所述第三核苷酸序列不天然出现于同一RNA分子。
  28. 根据权利要求27所述的RNA分子,其中所述基因是人基因。
  29. 根据权利要求27或28所述的RNA分子,其中所述第三核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体;
    优选地,序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
  30. 根据权利要求27~29任一项所述的RNA分子,其中所述第三核苷酸序列包含:(a)中所述基因中的至少两个基因的5’-UTR、(a)中所述基因中的至少两个基因的5’-UTR的片段、(a)中所述基因中的至少两个基因的5’-UTR的变体和(a)中所述基因中的至少两个基因的5’-UTR的片段的变体中的至少一种;
    和/或,所述第三核苷酸序列包含:至少两个拷贝的(a)中的5’-UTR、至少两个拷贝的(a)中的5’-UTR的片段、至少两个拷贝的(a)中的5’-UTR的变体和至少两个拷贝的(a)中的5’-UTR的片段的变体中的至少一种。
  31. 一种RNA分子,其包含:
    (1)编码感兴趣的多肽和/或蛋白的第一核苷酸序列;和
    (2)5’-非翻译区(5’-UTR);其中所述5’-UTR包含下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体;
    优选地,序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
  32. 根据权利要求27~31任一项所述的RNA分子,其进一步还包含启动子、5’-帽子结构、3’-UTR和polyA中的至少一种;
    优选地,(1)所述5’-帽子结构包括m7GpppG、m2 7,3′-OGpppG、m7Gppp(5′)N1和m7Gppp(m2′-O)N1中的至少一种;
    (2)所述3’-UTR包含:
    i):源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;
    优选地,序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体;
    优选地,所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67和10中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    ii)至少两个拷贝的i)中的其中一种多核苷酸;或
    iii)至少两种i)中的多核苷酸;
    (3)构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;优选地,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;
    优选地,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸;优选地,所述polyA为截断式polyA;优选地,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;优选地,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A;
    优选地,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;优选地,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    更优选地,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;优选地,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
  33. 根据权利要求19~32任一项所述的RNA分子,所述RNA分子中的全部或部分尿嘧啶被选自以下核苷构成的组中的至少一种核苷替换:假尿苷、N1-甲基假尿苷、N1-乙基假尿苷、2-硫尿苷、4′-硫尿苷、5-甲基胞嘧啶、5-甲基尿苷、2-硫基-1-甲基-1-去氮杂-假尿苷、2-硫基T-甲基-假尿苷、2-硫基-5-氮杂-尿苷、2-硫基-二氢假尿苷、2-硫基-二氢尿苷、2-硫基-假尿苷、4-甲氧基-2-硫基-假尿苷、4-甲氧基-假尿苷、4-硫基-1-甲基-假尿苷、4-硫基-假尿苷、5-氮杂-尿苷、二氢假尿苷或5-甲氧基尿苷和2′-0-甲基尿苷;优选地,所述RNA分子中全部或部分的尿嘧啶核苷被假尿苷、N1-甲基假尿苷或N1-乙基假尿苷替换;
    优选地,所述RNA分子中的一个或多个胞嘧啶核苷或者至少50%、至少60%、至少70%、至少80%、至少90%或100%的胞嘧啶核苷被5-甲基胞嘧啶核苷替换。
  34. 编码权利要求17~18任一项所述人工RNA分子的DNA或编码权利要求19~33任一项所述的RNA分子的DNA。
  35. 一种载体,所述载体包含权利要求34所述的DNA。
  36. 一种载体,其包含编码3’-UTR的第四核苷酸序列,所述第四核苷酸序列包含以下多核苷酸中的至少一种:
    (a):编码源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146和GHRL中的至少一个基因的3’-UTR的多核苷酸;
    (b):编码(a)中所述3’-UTR的片段的多核苷酸;
    (c):编码(a)中所述3’-UTR的变体的多核苷酸;及
    (d):编码(b)中所述片段的变体的多核苷酸。
  37. 根据权利要求36所述的载体,其中所述基因是人基因;和/或,所述载体不包含编码目的蛋白和/或多肽的多核苷酸。
  38. 根据权利要求36或37所述的载体,其中所述第四核苷酸序列包含以下多核苷酸中的至少一种:
    (e):编码源自基因COP1和HDGFL1中的至少一个基因的3’-UTR的多核苷酸;
    (f):编码(e)中所述3’-UTR的片段的多核苷酸;
    (g):编码(e)中所述3’-UTR的变体的多核苷酸;及
    (h):编码(f)中所述片段的变体的多核苷酸。
  39. 根据权利要求33~38任一项所述的载体,其中所述第四核苷酸序列包含下述多核苷酸中的至少一种:
    (1)序列如SEQ ID NO:47~67中至少一个所示的多核苷酸、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段、序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的变体和序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段的变体中的至少一种;
    优选地,所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的变体、所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段和所述序列如SEQ ID NO:47~67中至少一个所示的多核苷酸的片段的变体,与所述序列如SEQ ID NO:47~67中的至少一个所示的多核苷酸编码的RNA具有至少70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    (2)编码(a)中所述基因中的至少两个基因的3’-UTR的多核苷酸、编码(a)中所述基因中的至少两个基因的3’-UTR的片段的多核苷酸、编码(a)中所述基因中的至少两个基因的3’-UTR的变体的多核苷酸和编码(a)中所述基因中的至少两个基因的3’-UTR的片段的变体的多核苷酸中的至少一种;及
    (3)至少两个拷贝的(a)中的3’UTR、至少两个拷贝的(a)中的3’-UTR的片段、至少两个拷贝的(a)中的3’-UTR的变体和至少两个拷贝的(a)中的3’-UTR的片段的变体中的至少一种。
  40. 根据权利要求36~39任一项所述的载体,其进一步还包含启动子、编码5’-UTR的多核苷酸和编码polyA的多核苷酸中的至少一种。
  41. 根据权利要求40所述的载体,所述载体满足下述(1)~(2)中的至少一种:
    (1)所述5’-UTR包含:
    i)源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR、其片段、变体和片段的变体中的至少一种;优选地,序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体;
    优选地,所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:16~46中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸编码的RNA具有至少70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    ii)下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸编码的RNA、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体;
    优选地,序列如SEQ ID NO:9所示的多核苷酸编码的RNA的变体、序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段和序列如SEQ ID NO:9所示的多核苷酸编码的RNA的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    iii)至少两个拷贝的i)或ii)中的其中一种多核苷酸;或
    iv)至少两种i)中的多核苷酸;
    (2)构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;优选地,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;
    优选地,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸;优选地,所述polyA为截断式polyA;优选地,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;优选地,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A;
    优选地,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;优选地,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;更优选地,所述polyAy为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;优选地,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
  42. 一种载体,其包含编码5’-UTR的第五核苷酸序列,所述第五核苷酸序列包含以下多核苷酸中的至少一种:
    (a):编码源自基因APOA1、CARD16、ALB、APOC1、EEF1A1、RBP4、GHRL、MPND、ASAH2B、FBX016、FBH1、SRM、NAAA、ACTB、MKNK2、ORM1、GADPH、NDUFAF2、FGFR2、MYCBPAP、CHMP2A、TSG101、PRPF8、NFKB2、NAE1、HDGFL1、GSDMD、FBXW12、FBXW10、FBXL8和ATG4D中至少一个基因的5’-UTR的多核苷酸;
    (b):编码(a)中所述5’-UTR的片段的多核苷酸;
    (c):编码(a)中所述5’-UTR的变体的多核苷酸;及
    (d):编码(b)中所述片段的变体的多核苷酸。
  43. 根据权利要求42所述的载体,其中所述基因是人基因;和/或,所述载体不包含编码目的蛋白或多肽的多核苷酸。
  44. 根据权利要求42或43所述的载体,其中所述第五核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的变体和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段的变体;
    优选地,所述第五核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的变体、序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段和序列如SEQ ID NO:16~46中至少一个所示的多核苷酸的片段的变体,与序列如SEQ ID NO:16~46中的至少一个所示的多核苷酸具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
  45. 根据权利要求42~44任一项所述的载体,其中所述第五核苷酸序列包含:(a)中所述基因中的至少两个基因的5’-UTR、(a)中所述基因中的至少两个基因的5’-UTR的片段、(a)中所述基因中的至少两个基因的5’-UTR的变体和(a)中所述基因中的至少两个基因的5’-UTR的片段的变体中的至少一种;
    和/或,所述第五核苷酸序列包含:至少两个拷贝的(a)中的5’-UTR、至少两个拷贝的(a)中的5’-UTR的片段、至少两个拷贝的(a)中的5’-UTR的变体和至少两个拷贝的(a)中的5’-UTR的片段的变体中的至少一种。
  46. 一种载体,包含编码5’-UTR的多核苷酸序列;其中所述编码5’-UTR的多核苷酸序列包含下述多核苷酸中的至少一种:序列如SEQ ID NO:9所示的多核苷酸、序列如SEQ ID NO:9所示的多核苷酸的片段、序列如SEQ ID NO:9所示的多核苷酸的变体和序列如SEQ ID NO:9所示的多核苷酸的片段的变体;
    优选地,序列如SEQ ID NO:9所示的多核苷酸的变体、序列如SEQ ID NO:9所示的多核苷酸的片段和序列如SEQ ID NO:9所示的多核苷酸的片段的变体,与序列如SEQ ID NO:9所示的多核苷酸具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性。
  47. 根据权利要求42~46任一项所述的载体,其进一步还包含启动子、编码3’-UTR的多核苷酸和编码polyA的多核苷酸中的至少一种;
    优选地,(1)所述3’-UTR包含:
    i):源自基因APOA1、IE1、COP1、MYSM1、ASAH2B、NDUFAF2、APOD、HBB、TF、TMSB4X、CPAMD8、VIM、HDGFL1、TTR、SRM、HBA1、PRPF8、LMBRD1、IFNA1、CCDC146、GHRL和GH1中的至少一个基因的3’-UTR、其片段、变体和片段的变体中的至少一种;
    优选地,序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体和序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体;
    优选地,所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的变体、所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段和所述序列如SEQ ID NO:47~67和10中至少一个所示的多核苷酸编码的RNA的片段的变体,与所述序列如SEQ ID NO:47~67和10中的至少一个所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    ii)至少两个拷贝的i)中的其中一种多核苷酸;或
    iii)至少两种i)中的多核苷酸;
    (2)构成所述polyA的核苷酸包含至少20个、至少40个、至少80个、至少100个或至少120个A核苷酸;优选地,构成所述polyA的核苷酸包含连续地至少20个、至少40个、至少80个、至少100 个或至少120个A核苷酸;
    优选地,构成所述polyA的核苷酸包含一个或多个除A核苷酸之外的其他核苷酸;优选地,所述polyA为截断式polyA;优选地,在多个连续的A核苷酸后有一段10bp的非A的接头序列后再有多个连续的核苷酸A;优选地,polyA为30个连续核苷酸A后有一段10bp的非A的接头序列再有70个连续的核苷酸A;
    优选地,所述polyA包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的变体、和包含序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段的变体中的至少一种;优选地,序列如SEQ ID NO:68~76和11中至少一个所示的多核苷酸编码的RNA的片段、变体和片段的变体与序列如SEQ ID NO:68~76和11中的一种所示的多核苷酸编码的RNA具有至少40%、50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的相同性;
    更优选地,所述polyA为由序列如SEQ ID NO:68~70、72、75和11中的一种所示多核苷酸编码的RNA;优选地,所述polyA为由序列如SEQ ID NO:11所示的多核苷酸编码的RNA。
  48. 一种宿主细胞,其包含权利要求35~47任一项所述的载体。
  49. 一种脂质纳米颗粒,其包含权利要求17或18所述的人工RNA分子、或权利要求19~33任一项所述的RNA分子;
    优选地,所述脂质纳米颗粒还含有可离子化阳离子脂质、辅助脂质、结构脂质和PEG-脂质中的一种或多种;
    所述可离子化阳离子脂质选自Dlin-MC3-DMA、Dlin-KC2-DMA、DODMA、c12-200和DlinDMA中的一种或多种;和/或所述辅助脂质选自DSPC、DOPE、DOPC和DOPS中的一种或多种;和/或所述结构脂质选自胆固醇、胆固醇酯、固醇类激素、固醇类维生素和胆汁酸中的至少一种;和/或所述PEG-脂质选自PEG-DMG或PEG-DSPE;优选地,PEG的平均分子量为约2000道尔顿~5000道尔顿;进一步优选,PEG的平均分子量约为2000道尔顿或5000道尔顿。
  50. 一种药物组合物,其包含权利要求17或18所述的人工RNA分子、权利要求19~33任一项所述的RNA分子、权利要求34所述的DNA、权利要求35~47所述的载体、权利要求48所述的宿主细胞或权利要求49所述的脂质纳米颗粒,以及药学上可接受的载体。
  51. 权利要求17或18所述的人工RNA分子、权利要求19~33任一项所述的RNA分子、权利要求34所述的DNA、权利要求35~47所述的载体、权利要求48所述的宿主细胞或权利要求49所述的脂质纳米颗粒或权利要求50所述的药物组合物在制备药物中的用途;
    优选地,所述药物用于基因治疗、基因疫苗接种、蛋白替代疗法、反义治疗或通过干扰RNA进行的治疗。
  52. 权利要求17或18所述的人工RNA分子、权利要求19~33任一项所述的RNA分子、权利要求34所述的DNA、权利要求35~47所述的载体、权利要求48的宿主细胞或权利要求49所述的脂质纳米颗粒或权利要求50所述的药物组合物在制备用于核酸转移的药物中的用途;
    优选地,所述核酸为RNA、信使RNA(mRNA)、反义寡核苷酸、DNA、质粒、核糖体RNA(rRNA)、微RNA(miRNA)、转移RNA(tRNA)、小的抑制RNA(siRNA)和小的核RNA(snRNA)。
    优选地,所述药物用于基因治疗、基因疫苗接种或蛋白质替代疗法;
    优选地,所述药物用于疾病的治疗和/或预防;优选地,所述药物是疫苗;更优选地,所述药物是用于预防新型冠状病毒感染的疫苗;
    优选地,所述疾病选自由以下组成的组:罕见病、感染性疾病、癌症、遗传性疾病、自体免疫性疾病、糖尿病、神经退化性疾病、心血管疾病、肾血管疾病,以及代谢性疾病;
    优选地,所述癌症包括肺癌、胃癌、肝癌、食管癌、结肠癌、胰腺癌、脑癌、淋巴癌、血癌或前列腺癌中的一种或多种;所述遗传疾病包括血友病,地中海贫血、高雪氏病中的一种或多种;
    所述药物为核酸药物,其中所述核酸包括下述的至少一种:RNA、信使RNA(mRNA)、DNA、质 粒、核糖体RNA(rRNA)、单链向导RNA(sgRNA)和cas9 mRNA。
CN202380054184.7A 2022-07-19 2023-07-18 新型冠状病毒S蛋白的mRNA及其应用 Pending CN119563026A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
CN2022108456905 2022-07-19
CN202210845690 2022-07-19
CNPCT/CN2023/098013 2023-06-02
CN2023098013 2023-06-02
CN2023100319 2023-06-15
CNPCT/CN2023/100319 2023-06-15
PCT/CN2023/107936 WO2024017253A1 (zh) 2022-07-19 2023-07-18 新型冠状病毒S蛋白的mRNA及其应用

Publications (1)

Publication Number Publication Date
CN119563026A true CN119563026A (zh) 2025-03-04

Family

ID=89617143

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202380054184.7A Pending CN119563026A (zh) 2022-07-19 2023-07-18 新型冠状病毒S蛋白的mRNA及其应用

Country Status (7)

Country Link
US (1) US20260014248A1 (zh)
EP (1) EP4560021A1 (zh)
JP (1) JP2025525578A (zh)
KR (1) KR20250048616A (zh)
CN (1) CN119563026A (zh)
AU (1) AU2023310896A1 (zh)
WO (1) WO2024017253A1 (zh)

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112013031553A2 (pt) * 2011-06-08 2020-11-10 Shire Human Genetic Therapies, Inc. composições, mrna que codifica para uma hgla e seu uso, uso de pelo menos uma molécula de mrna e um veículo de transferência e uso de um mrna que codifica para proteína exógena
WO2013120499A1 (en) 2012-02-15 2013-08-22 Curevac Gmbh Nucleic acid comprising or coding for a histone stem-loop and a poly (a) sequence or a polyadenylation signal for increasing the expression of an encoded pathogenic antigen
EA201690403A1 (ru) * 2013-08-16 2016-07-29 Рана Терапьютикс, Инк. Композиции и способы для модулирования рнк
CA2966092A1 (en) * 2014-12-30 2016-07-07 Curevac Ag Artificial nucleic acid molecules
US10293058B2 (en) 2015-04-22 2019-05-21 Curevac Ag RNA containing composition for treatment of tumor diseases
AU2016316439B2 (en) * 2015-08-28 2022-02-24 CureVac SE Artificial nucleic acid molecules
EP3452101A2 (en) 2016-05-04 2019-03-13 CureVac AG Rna encoding a therapeutic protein
KR20190093816A (ko) 2016-10-26 2019-08-26 큐어백 아게 지질 나노입자 mRNA 백신
EP3585162B1 (en) * 2017-09-29 2023-08-30 Regeneron Pharmaceuticals, Inc. Rodents comprising a humanized ttr locus and methods of use
MX2020003995A (es) 2017-10-19 2020-07-22 Curevac Ag Nuevas moleculas de acido nucleico artificiales.
CN113186203B (zh) * 2020-02-13 2022-12-30 斯微(上海)生物科技股份有限公司 治疗或者预防冠状病毒病的疫苗试剂
IL297419B2 (en) * 2020-04-22 2025-02-01 BioNTech SE Coronavirus vaccine
WO2022137133A1 (en) * 2020-12-22 2022-06-30 Curevac Ag Rna vaccine against sars-cov-2 variants

Also Published As

Publication number Publication date
JP2025525578A (ja) 2025-08-05
US20260014248A1 (en) 2026-01-15
AU2023310896A1 (en) 2025-01-30
KR20250048616A (ko) 2025-04-09
EP4560021A1 (en) 2025-05-28
WO2024017253A1 (zh) 2024-01-25

Similar Documents

Publication Publication Date Title
US20240382581A1 (en) Pan-human coronavirus vaccines
US20240358819A1 (en) Pan-human coronavirus domain vaccines
CA3169664A1 (en) Respiratory virus immunizing compositions
TW202305140A (zh) 多價rna組合物中rna種類之鑑定及比率測定方法
CA3216490A1 (en) Epstein-barr virus mrna vaccines
WO2022221336A1 (en) Respiratory syncytial virus mrna vaccines
WO2023283642A2 (en) Pan-human coronavirus concatemeric vaccines
WO2023092069A1 (en) Sars-cov-2 mrna domain vaccines and methods of use
CA3223855A1 (en) Non-natural 5?-untranslated region and 3?-untranslated region and use thereof
CN119866376A (zh) 编码流感病毒抗原的自扩增rna
WO2023227124A1 (zh) 一种构建mRNA体外转录模板的骨架
US20260014248A1 (en) Mrna for sars-cov-2 s protein and use thereof
CA3262348A1 (en) Mrna for sars-cov-2 s protein and use thereof
CN120435560A (zh) 提高rna分子翻译效率和/或稳定性的utr及其应用
WO2025228326A1 (zh) 重组rna分子及其应用
CN119570817B (zh) 多抗原猴痘rna疫苗及其制备方法
CN117051019B (zh) 新型冠状病毒疫苗及其制备方法和应用
US20240277835A1 (en) Vaccine
WO2024199441A1 (zh) 一种包含poly(A)的多核苷酸分子及其用途
AU2024209872A1 (en) Nucleic acid molecules
CN119752950A (zh) 一种狂犬病mRNA疫苗及其应用
CN120554476A (zh) 一种粒细胞巨噬细胞集落刺激因子rna疫苗及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40117411

Country of ref document: HK