CN118813654A - Rna指导的核酸酶及其活性片段及变体以及使用方法 - Google Patents
Rna指导的核酸酶及其活性片段及变体以及使用方法 Download PDFInfo
- Publication number
- CN118813654A CN118813654A CN202411155276.7A CN202411155276A CN118813654A CN 118813654 A CN118813654 A CN 118813654A CN 202411155276 A CN202411155276 A CN 202411155276A CN 118813654 A CN118813654 A CN 118813654A
- Authority
- CN
- China
- Prior art keywords
- sequence
- rgn
- rna
- polypeptide
- target dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6816—Hybridisation assays characterised by the detection means
- C12Q1/6818—Hybridisation assays characterised by the detection means involving interaction of two or more labels, e.g. resonant energy transfer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
本发明提供了一种用于结合至所关注的靶序列的组合物及方法。该组合物可用于切割或修饰所关注的靶序列、所关注的靶序列的可视化、以及修饰所关注的序列的表达。组合物包括RNA指导的核酸酶多肽、CRISPR RNA、反式活化的CRISPR RNA、指导RNA以及编码其的核酸分子。还提供了包括该核酸分子的载体和宿主细胞。进一步提供了用于结合所关注的靶序列的CRISPR系统,其中CRISPR系统包括RNA指导的核酸酶多肽以及一个或多个指导RNA。还提供了用于检测靶DNA序列的方法和试剂盒。
Description
本申请是申请日为2020年8月11日、申请号为202080068763.3、发明名称为“RNA指导的核酸酶及其活性片段及变体以及使用方法”的发明专利申请的分案申请。
发明领域
本发明涉及分子生物学及基因编辑领域。
对通过EFS-WEB作为文本文件提交的序列表的引用
本申请包含序列表,该序列表已通过EFS-Web以ASCII格式提交,并在此通过引用整体并入。所述ASCII拷贝创建于2020年8月11日,文件名为L103438_1170WO_0049_2_Seq_List.txt,大小为489,326字节。
发明背景
靶向基因组编辑或修饰正迅速成为基础及应用研究的重要工具。最初的方法涉及诸如大范围核酸酶(meganuclease)、锌指融合蛋白或TALEN之类的工程核酸酶,需要生成具有特定于每一种具体靶序列的工程化、可程序化、序列特定的DNA结合域的嵌合核酸酶。RNA指导的核酸酶(诸如成簇规律间隔的短回文重复(Clustered Regularly InterspacedShort Palindromic Repeats)(CRISPR)相关联(Cas)细菌系统的CRISPR-Cas蛋白)通过将核酸酶与指导RNA(指导RNA与具体靶序列特定地杂交)复合而允许特定序列的靶向。相较于为每个靶序列生成嵌合核酸酶,制造靶特定的指导RNA的成本更低且更有效。这种RNA指导的核酸酶可用于任选通过序列特定的、双链断裂(其经由易错的非同源末端连接(NHEJ)被修复)的引入来编辑基因组,以在特定的基因组位置引入突变。替换地,可以经由同源定向修复(homology-directed repair)将异源DNA引入基因组位点。
发明概述
提供了用于结合所关注的靶序列的组合物及方法。该组合物可用于切割或修饰所关注的靶序列、检测所关注的靶序列、以及修饰所关注的序列的表达。组合物包括RNA指导的核酸酶(RGN)多肽、CRISPR RNA(crRNA)、反式活化的CRISPR RNA(tracrRNA)、指导RNA(gRNA)、编码其的核酸分子、以及包括核酸分子的载体及宿主细胞。还提供了用于结合所关注的靶序列的CRISPR系统,其中CRISPR系统包括RNA指导的核酸酶多肽以及一个或多个指导RNA。因此,本文公开的方法用于结合所关注的靶序列,并且在一些实施方案中,用于切割或修饰所关注的靶序列。所关注的靶序列可举例而言由于与引入的供体序列的非同源末端连接或同源定向修复而被修饰。进一步提供了使用检测器单链DNA用于检测DNA分子的靶DNA序列的方法和试剂盒。
详述
受益于前述描述及相关附图中呈现的教导,本发明所属领域中技术人员将想到本文中阐述的本发明的许多修改及其他实施方案。因此,应该明白,本发明不限于所公开的特定实施方案,且修改以及其他实施方案旨在包含于所附实施方案的范围内。尽管本文采用了特定的术语,但这些术语仅以一般性及描述性意义使用,而非出于限制性目的。
I.概述
RNA指导的核酸酶(RGN)允许在基因组内的单一位点的靶向的操纵,并且在基因靶向的背景下用于治疗及研究应用为有用的。在各种生物体(包含哺乳动物)中,举例而言,通过刺激非同源末端连接和同源重组,RNA指导的核酸酶已被使用于基因组工程。本文所述的组合物及方法有用于在多核苷酸中造成单链或双链的断裂、修饰多核苷酸、检测多核苷酸内的具体位点、或修饰具体基因的表达。
本文公开的RNA指导的核酸酶可通过修饰靶序列来改变基因表达。在特定实施方案中,RNA指导的核酸酶是通过指导RNA(gRNA)作为成簇规律间隔的短回文重复(CRISPR)RNA指导的核酸酶系统的部分而被定向至靶序列。RGN被理解为“RNA指导”是因为指导RNA与RNA指导的核酸酶形成复合物,以将RNA指导的核酸酶导向与靶序列结合,并且在一些实施方案中,在靶序列处引入单链或双链的断裂。在靶序列被切割后,断裂可以被修复,使得靶序列的DNA序列在修复过程期间被修饰。因此,本文提供了用于使用RNA指导的核酸酶来修饰宿主细胞的DNA中的靶序列的方法。举例而言,RNA指导的核酸酶可被使用于修饰真核细胞或原核细胞的基因组的基因座的靶序列。
II.RNA指导的核酸酶
本文提供了RNA指导的核酸酶。术语“RNA指导的核酸酶(RGN)”是指以序列特定方式结合至具体靶核苷酸序列,并且通过与多肽复合并与靶序列杂交的指导RNA分子而被导向该靶核苷酸序列的多肽。尽管RNA指导的核酸酶能够在结合时切割靶序列,但术语“RNA指导的核酸酶”还涵盖能够结合至靶序列但不切割靶序列的失效核酸酶的RNA指导的核酸酶。通过RNA指导的核酸酶切割靶序列可导致单链或双链断裂。仅能切割双链核酸分子的单链的RNA指导的核酸酶在本文中称为切口酶。
本文公开的RNA指导的核酸酶包含APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748以及APG07433.1 RNA指导的核酸酶(这些核酸酶的氨基酸序列分别如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所示)、以及保持了以RNA指导的序列特定的方式结合至靶核苷酸序列的能力的活性片段或其变体。在这些实施方案中的一些实施方案中,APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748、或APG07433.1 RGN的活性片段或变体能够切割单链或双链靶序列。在一些实施方案中,APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748、或APG07433.1 RGN的活性变体包括具有与如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所示的氨基酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列。在某些实施方案中,APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG05712.1、APG01658.1、APG06498.1、APG09106.1、APG09882.1、APG02675.1、APG01405.1、APG06250.1、APG06877.1、APG09053.1、APG04293.1、APG01308.1、APG06646.1、APG09748或APG07433.1RGN的活性片段包括如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所示的氨基酸序列的至少50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个邻接的氨基酸残基。本文提供的RNA指导的核酸酶可以包括至少一个核酸酶域(例如,脱氧核糖核酸酶(DNase)域、核糖核酸酶(RNase)域)以及至少一个RNA识别域和/或RNA结合域,以与指导RNA相互作用。可在本文提供的RNA指导的核酸酶中发现的另外域包含但不限于:DNA结合域、解旋酶域、蛋白质-蛋白质相互作用域以及二聚化域。在特定实施方案中,本文提供的RNA指导的核酸酶可包括对于DNA结合域、解旋酶域、蛋白质-蛋白质相互作用域以及二聚化域中的一个或多个至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%。
靶核苷酸序列由本文提供的RNA指导的核酸酶结合,并与关联于RNA指导的核酸酶的指导RNA杂交。如果多肽拥有核酸酶活性,则可以由RNA指导的核酸酶随后切割靶序列。术语“切割(cleave)”或“切割(cleavage)”是指靶核苷酸序列的主链内的至少一个磷酸二酯键的水解,其可导致靶序列内的单链或双链断裂。本发明公开的RGN可以切割在多核苷酸内的核苷酸、起核酸内切酶的作用;或者可以是核酸外切酶、从多核苷酸端(5'和/或3'端)移除连续的核苷酸。在其他实施方案中,所公开的RGN可在多核苷酸的任何位置内切割靶序列的核苷酸、且因此起核酸内切酶和核酸外切酶两者的作用。通过本发明公开的RGN切割靶多核苷酸可导致交错的断裂或平端。
本发明公开的RNA指导的核酸酶可以是从细菌物种或古生菌物种衍生的野生型序列。作为另一种选择,RNA指导的核酸酶可以是野生型多肽的变体或片段。举例而言,可以修饰野生型RGN以改变核酸酶活性或改变PAM特异性。在一些实施方案中,RNA指导的核酸酶不是天然存在的。
在某些实施方案中,RNA指导的核酸酶起切口酶的作用,仅切割靶核苷酸序列的单链。这种RNA指导的核酸酶具有单一作用的核酸酶域。在这些实施方案的一些实施方案中,额外的核酸酶域已经突变,使得核酸酶活性降低或消除。
在其他实施方案中,RNA指导的核酸酶完全缺少核酸酶活性或表现降低的核酸酶活性、并且在本文中被称为无核酸酶反应或无核酸酶活性。本领域中用于将突变引入氨基酸序列的任何已知方法(诸如PCR介导的诱变以及定点诱变)可用于产生无切口酶或无核酸酶反应的RGN。例如参见第2014/0068797号美国公开以及第9,790,490号美国专利;这些美国公开和美国专利中的每一篇的全部内容通过引用而被并入本文。
缺少核酸酶活性的RNA指导的核酸酶可用于将融合的多肽、多核苷酸或小分子有效负载递送至具体基因组部位。在这些实施方案的一些实施方案中,RGN多肽或指导RNA可与可检测标记融合,以允许具体序列的检测。作为非限制性实例,无核酸酶反应的RGN可与可检测标记(例如,荧光蛋白)融合并且靶向与疾病关联的具体序列,以允许疾病关联序列的检测。
作为另一种选择,无核酸酶反应的RGN可以靶向具体的基因组位置,以改变期望序列的表达。在一些实施方案中,无核酸酶反应的RNA指导的核酸酶与靶序列的结合通过干扰所靶向的基因组区域内的转录因子或RNA聚合酶的结合而导致靶序列的表达的抑制或受靶序列的转录控制下的基因的表达的抑制。在其他实施方案中,RGN(例如,无核酸酶反应的RGN)或其复合的指导RNA进一步包括表达调节子,其在与靶序列结合时充当抑制或活化靶序列的表达或受靶序列的转录控制下的基因的表达。在这些实施方案的一些中,表达调节子通过表观遗传机制调节靶序列或被调节基因的表达。
在其他实施方案中,无核酸酶反应的RGN或仅具有切口酶活性的RGN可以靶向具体基因组部位,以通过与碱基编辑多肽(举例而言,脱氨酶多肽)或其活性变体或片段的融合(这使核苷酸碱基脱去氨基)来修饰靶多核苷酸的序列,导致从一种核苷酸碱基转变为另一种核苷酸碱基。碱基编辑多肽可在其N末端或C末端与RGN融合。另外,碱基编辑多肽可以经由肽接头而与RGN融合。有用于此类组合物以及方法的脱氨酶多肽的非限制性实例包含胞苷脱氨酶或腺苷脱氨酶(诸如,Gaudlli等人(2017)Nature 551:464-471、第2017/0121693号和第2018/0073012号美国专利公开、以及第WO/2018/027078号国际专利公开中描述的腺苷脱氨酶碱基编辑器,或者第PCT/US2019/068079号国际专利申请中公开的脱氨酶中的任一者,这些专利的每一篇的全部内容通过引用而被并入本文)。此外,本领域中已知在RGN与碱基编辑酶之间的某些融合蛋白也可包括至少一个尿嘧啶稳定多肽,其通过脱氨酶提高胞苷、脱氧胞苷或胞嘧啶对于核酸分子中的胸苷、脱氧胸苷或胸腺嘧啶的突变率。尿嘧啶稳定多肽的非限制性实例包含在2020年7月15日提交申请的第63/052,175号美国临时专利申请中公开的尿嘧啶稳定多肽和尿嘧啶糖基化酶抑制剂(UGI)域(SEQ ID NO:261),尿嘧啶糖基化酶抑制剂(UGI)域可提高碱基编辑效率(第10,167,547号美国专利,其通过引用并入本文)。因此,融合蛋白可包括本文描述的RGN或其变体、脱氨酶以及任选的至少一个尿嘧啶稳定多肽,诸如,UGI。
与多肽或域融合的RNA指导的核酸酶可通过接头而被分开或连接。如本文所使用的,术语“接头”是指连接两个分子或部分(例如核酸酶的结合域和切割域)的化学基团或分子。在一些实施方案中,接头连接RNA指导的核酸酶的gRNA结合域与诸如脱氨酶的碱基编辑多肽。在一些实施方案中,接头连接无核酸酶反应的RGN与脱氨酶。通常情况下,接头位于两个基团、分子或其他部分之间或两边,并经由共价键而被连接到每一个,因此连接两者。在一些实施方案中,接头是一个氨基酸或多个氨基酸(例如肽或蛋白质)。在一些实施方案中,接头是有机分子、基团、聚合物或化学部分。在一些实施方案中,接头的长度是5-100个氨基酸,举例而言,长度是5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、30-35、35-40、40-45、45-50、50-60、60-70、70-80、80-90、90-100、100-150、或150-200个氨基酸。更长或更短的接头也被设想。
本发明公开的RNA指导的核酸酶可包括至少一个核定位信号(NLS),以增强RGN向细胞核的运输。核定位信号是本领域中已知的且一般而言包括一段碱性氨基酸(参见,例如,Lange等人,J.Biol.Chem.(2007)282:5101-5105)。在具体实施方案中,RGN包括2、3、4、5、6个或更多核定位信号。(数个)核定位信号可以是异源NLS。有用于本发明公开的RGN的核定位信号的非限制性实例是SV40大T抗原、核质蛋白以及c-Myc的核定位信号(参见,例如,Ray等人(2015)Bioconjug Chem 26(6):1004-7)。在具体实施方案中,RGN包括如SEQ IDNO:125或127所列的NLS序列。RGN可在其N端、C端、或N端及C端两者处都包括一个或多个NLS序列。举例而言,RGN可在N端区域包括两个NLS序列,而在C端区域包括四个NLS序列。
本领域中已知的将多肽定位于具体亚细胞位置的其他定位信号序列也可用于靶向RGN,包含但不限于质体定位序列、线粒体定位序列、以及既靶向质体又靶向线粒体的双靶向信号序列(参见,例如,Nassoury和Morse(2005)Biochim Biophys Acta 1743:5-19;Kunze和Berger(2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann和Neupert(2003)IUBMB Life 55:219-225;Soll(2002)Curr Opin Plant Biol 5:529-535;Carrie和Small(2013)Biochim Biophys Acta 1833:253-259;Carrie等人(2009)FEBSJ 276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol 6:589-595;Peeters和Small(2001)Biochim Biophys Acta 1541:54-63;Murcha等人(2014)J Exp Bot 65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glase等人(1998)Plant Mol Biol38:311-338)。
在某些实施方案中,本发明公开的RNA指导的核酸酶包括促进RGN的细胞摄取的至少一个细胞穿透域。细胞穿透域是本领域中已知的并且一般包括数段带正电荷的氨基酸残基(即,聚阳离子细胞穿透域)、交替极性的氨基酸残基以及非极性氨基酸残基(即,两亲性细胞穿透域)、或疏水性氨基酸残基(即,疏水性细胞穿透域)(参见,例如,Milletti F.(2012)Drug Discov Today 17:850-860)。细胞穿透域的非限制性实例是来自人免疫缺陷病毒1的反式活化转录活化子(TAT)。
核定位信号、质体定位信号、线粒体定位信号、双靶向定位信号和/或细胞穿透域可位于氨基端(N端)、羧基端(C端)、或在RNA指导的核酸酶的内部位置处。
本发明公开的RGN可经由接头肽而直接或间接地与诸如切割域、脱氨酶域或表达调节域的效应子域(effector domain)融合。这种域可位于RNA指导的核酸酶的N端、C端或内部位置处。在这些实施方案中的一些中,融合蛋白的RGN成分是无核酸酶反应的RGN。
在一些实施方案中,RGN融合蛋白包括切割域,切割域是能够切割多核苷酸(即,RNA、DNA或RNA/DNA杂交体)的任何域,并且包含但不限于限制性核酸内切酶和归巢核酸内切酶(homing endonuclease),诸如IIS型核酸内切酶(例如,FokI)(参见,例如,Belfort等人(1997)Nucleic Acids Res.25:3379-3388;Linn等人(eds.)Nucleases,Cold SpringHarbor Laboratory Press,1993)。
在其他实施方案中,RGN融合蛋白包括脱氨酶域,脱氨酶域将核苷酸碱基脱去氨基,导致从一种核苷酸碱基转化为另一种,并且包含但不限于胞苷脱氨酶或腺苷脱氨酶碱基编辑器(参见,例如,Gaudelli等人(2017)Nature 551:464-471、第2017/0121693号和第2018/0073012号美国专利公开、第9,840,699号美国专利以及第WO/2018/027078号国际公开)。
在一些实施方案中,RGN融合蛋白的效应子域可以是表达调节域,表达调节域是用来协助上调或下调转录的域。表达调节域可以是表观遗传修饰域、转录阻遏物域或转录活化域。
在这些实施方案的一些中,RGN融合蛋白的表达调节子包括表观遗传修饰域,表观遗传修饰域共价修饰DNA或组蛋白(histone protein)以改变组蛋白(histone)结构和/或染色体结构,而不改变DNA序列,导致基因表达中的变化(即,上调或下调)。表观遗传修饰的非限制性实例包含赖氨酸残基的乙酰化或甲基化、精氨酸甲基化、丝氨酸及苏氨酸磷酸化、以及组蛋白的赖氨酸泛素化(ubiquitination)及小泛素化(sumoylation)、和DNA中胞嘧啶残基的甲基化和羟甲基化。表观遗传修饰域的非限制性实例包含组蛋白乙酰基转移酶域、组蛋白去乙酰基酶域、组蛋白甲基转移酶域、组蛋白去甲基酶域、DNA甲基转移酶域以及DNA去甲基酶域。
在其他实施方案中,融合蛋白的表达调节子包括转录阻遏物域,其与诸如RNA聚合酶和转录因子的转录控制元件和/或转录调节蛋白相互作用,以减少或终止至少一个基因的转录。转录阻遏物域是本领域中已知的且包含但不限于类Sp1阻遏物、IκB以及Krüppel关联盒(KRAB)域。
在再一其他实施方案中,融合蛋白的表达调节子包括转录活化域,转录活化域与诸如RNA聚合酶和转录因子的转录控制元件和/或转录调节蛋白相互作用,以增加或活化至少一个基因的转录。转录活化域是本领域中已知的且包含但不限于单纯疱疹病毒VP16活化域和NFAT活化域。
本发明公开的RGN多肽可包括可检测标记或纯化标签。可检测标记或纯化标签可直接地或间接地经由接头肽位于RNA指导的核酸酶的N端、C端或内部位置处。在这些实施方案的一些中,融合蛋白的RGN成分是无核酸酶反应的RGN。在其他实施方案中,融合蛋白的RGN成分是具有切口酶活性的RGN。
可检测标记是可目视的或可以其他方式观察的分子。可检测标记可作为融合蛋白(例如,荧光蛋白)而与RGN融合、也可以是缀合至RGN多肽的、可目视或通过其他手段检测的小分子。可作为融合蛋白与本发明公开的RGN融合的可检测标记包含任何可检测蛋白域,其包含但不限于可用特定抗体检测的荧光蛋白或蛋白域。荧光蛋白的非限制性实例包含绿色荧光蛋白(例如,GFP、EGFP、ZsGreen1)和黄色荧光蛋白(例如,YFP、EYFP、ZsYellow1)。小分子可检测标记的非限制性实例包含放射性标记,例如3H以及35S。
RGN多肽还可包括纯化标签,纯化标签是可用于从混合物(例如,生物样本、培养基)中分离蛋白质或融合蛋白的任何分子。纯化标签的非限制性实例包含生物素、myc、麦芽糖结合蛋白(MBP)以及谷胱甘肽-S-转移酶(GST)。
II.指导RNA
本公开内容提供指导RNA和编码该指导RNA的多核苷酸。术语“指导RNA”是指与靶核苷酸序列具有与靶序列杂交的足够互补性、并将关联RNA指导的核酸酶导向至与靶核苷酸序列的直接序列特定的结合的核苷酸序列。因此,RGN的分别的指导RNA是可与RGN结合并指导RGN来与具体靶核苷酸序列结合的一个或多个RNA分子(一般为,一个或两个),并且在其中RGN具有切口酶或核酸酶活性的那些例子中,还切割靶核苷酸序列。一般来说,指导RNA包括CRISPR RNA(crRNA)且在一些实施方案中还包括反式活化CRISPR RNA(tracrRNA)。包括crRNA与tracrRNA两者的原生指导RNA一般包括两个分开的RNA分子,这两个分开的RNA分子通过crRNA的重复序列和tracrRNA的抗重复序列彼此杂交。
CRISPR阵列内的原生直接重复序列的长度一般在28至37个碱基对的范围内,而长度可在约23bp至约55bp之间变化。CRISPR阵列内的间隔序列的长度一般在约32至约38bp的范围内,而长度可以在约21bp至约72bp之间。每一个CRISPR阵列一般包括少于50个单位的CRISPR重复间隔序列。CRISPR被转录为称为初级CRISPR转录物的长转录物的部分,其包含许多CRISPR阵列。初级CRISPR转录物被Cas蛋白切割,以生成crRNA,或者在一些情况下,以生成前体crRNA(pre-crRNA),前体crRNA被额外的Cas蛋白进一步处理为成熟的crRNA。成熟的crRNA包括间隔序列和CRISPR重复序列。在将前体crRNA处理为成熟(或经处理)的crRNA的其中一些实施方案中,成熟涉及移除约1至约6个或更多个5'、3'或5'及3'核苷酸。出于基因组编辑或靶向所关注的具体靶核苷酸序列的目的,在前体crRNA分子成熟期间移除的这些核苷酸对于生成或设计指导RNA不是必需的。
CRISPR RNA(crRNA)包括间隔序列和CRISPR重复序列。“间隔序列”是与所关注的靶核苷酸序列直接杂交的核苷酸序列。间隔序列被工程化为与所关注的靶序列完全或部分互补。在各种实施方案中,间隔序列可包括从约8个核苷酸至约30个核苷酸或更多个核苷酸。举例而言,间隔序列的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30或更多个核苷酸。在一些实施方案中,间隔序列的长度为约10至约26个核苷酸,或长度为约12至约30个核苷酸。在特定实施方案中,间隔序列的长度是约30个核苷酸。在一些实施方案中,当使用适合的比对算法进行最佳对齐时,间隔序列与其对应的靶序列之间的互补性程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大。在特定实施方案中,间隔序列不含使用本领域中已知的任何适合的多核苷酸折叠算法可预测的次级结构,多核苷酸折叠算法包含但不限于mFold(参见,例如,Zuker和Stiegler(1981)Nucleic Acids Res.9:133-148)和RNAfold(参见,例如,Gruber等人(2008)Cell 106(1):23-24)。
CRISPR RNA重复序列包括核苷酸序列,该核苷酸序列包括具有与tracrRNA杂交的足够互补性的区域。在各种实施方案中,CRISPR RNA重复序列可包括从约8个核苷酸至约30个核苷酸或更多核苷酸。举例而言,CRISPR重复序列的长度可以为约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30或更多个核苷酸。在一些实施方案中,CRISPR重复序列的长度为约21个核苷酸。在一些实施方案中,当使用适合的对齐算法进行最佳对齐时,CRISPR重复序列与其对应的tracrRNA序列之间的互补性程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更多。在特定实施方案中,CRISPR重复序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性变体或片段,当该核苷酸序列或其活性变体或片段被包括在指导RNA内时,该核苷酸序列或其活性变体或片段能够导向本文提供的关联的RNA指导的核酸酶至所关注的靶序列的序列特定结合。在某些实施方案中,野生型序列的活性CRISPR重复序列变体包括具有与如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所列的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性CRISPR重复序列片段包括如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所列的核苷酸序列的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸。
在某些实施方案中,crRNA不是天然存在的。在这些实施方案的一些中,特定CRISPR重复序列不天然地与工程化间隔序列连接,并且CRISPR重复序列被认为与间隔序列是异源的。在某些实施方案中,间隔序列是非天然存在的工程化序列。
反式活化的CRISPR RNA或tracrRNA分子包括核苷酸序列,该核苷酸序列包括具有与crRNA的CRISPR重复序列杂交的足够互补性的区域,其在本文中称为抗重复区域。在一些实施方案中,tracrRNA分子还包括具有次级结构(例如,茎-环)的区域、或在与其对应的crRNA杂交时形成次级结构。在具体实施方案中,完全或部分互补于CRISPR重复序列的tracrRNA的区域是在分子的5'端,并且tracrRNA的3'端包括次级结构。该次级结构的区域一般包括与抗重复序列相邻、包含融合膜(nexus)发夹的几个发夹结构。融合膜发夹常常在发夹茎的基部具有保守的核苷酸序列,在tracrRNA中的很多融合膜发夹中发现了模体UNANNA、CNANNG、CNANNU,UNANNG、UNANNC、或CNANNU(分别为SEQ ID NO:8、37、45、53、68以及102)。在tracrRNA的3'端处常常存在末端发夹,其结构和数量可变,但常常包括富含GC的Rho非依赖性转录终止子发夹,其后在3'端具有一串U'。参见,举例而言,Briner等人(2014)Molecular Cell56:333-339、Briner和Barrangou(2016)Cold Spring Harb Protoc;doi:10.1101/pdb.top090902以及第2017/0275648号美国专利公开,每一篇的全部内容通过引用并入本文。
在各种实施方案中,与CRISPR重复序列完全或部分互补的tracrRNA的抗重复区域包括约8个核苷酸至约30个核苷酸或更多个。举例而言,tracrRNA抗重复序列与CRISPR重复序列之间的碱基配对区域的长度可以是约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25、约26、约27、约28、约29、约30或更多个核苷酸。在特定实施方案中,与CRISPR重复序列完全或部分互补的tracrRNA的抗重复区域的长度为约20个核苷酸。在一些实施方案中,当使用适合的对齐算法进行最佳对齐时,CRISPR重复序列与其对应的tracrRNA抗重复序列之间的互补性程度为约或大于约50%、约60%、约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大。
在各种实施方案中,整个tracrRNA可包括约60个核苷酸至多于约140个核苷酸。举例而言,tracrRNA的长度可以是约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140或更多个核苷酸。在特定实施方案中,tracrRNA的长度为约80至约90个核苷酸,长度为包含约80、约81、约82、约83、约84、约85、约86、约87、约88、约89以及约90个核苷酸。在某些实施方案中,tracrRNA的长度为约85个核苷酸。
在具体实施方案中,tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119的核苷酸序列或其活性变体或片段,该核苷酸序列或其活性变体或片段当被包括在指导RNA内时能够将本文提供的关联RNA指导的核酸酶导向至与所关注的靶序列序列特定结合。在某些实施方案中,野生型序列的活性tracrRNA序列变体包括具有与如SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所列的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性的核苷酸序列。在某些实施方案中,野生型序列的活性tracrRNA序列片段包括如SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所列的核苷酸序列的至少5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80或更多个连续核苷酸。
当两个多核苷酸序列在严格条件下彼此杂交时,可以认为该两个多核苷酸序列基本上互补。同样地,如果与RGN结合的指导RNA在严格条件下与靶序列结合,则认为该RGN以序列特定方式结合至具体靶序列。“严格条件”或“严格杂交条件”旨在指两个多核苷酸序列彼此杂交至可检测程度高于其他序列(例如,至少比背景高2倍)的条件。严格条件是序列相依的,并且在不同环境下将会不同。通常情况下,严格条件将是这样的条件,其中:在pH 7.0至8.3下,盐类浓度小于约1.5M Na离子,通常情况下约0.01至1.0M Na离子浓度(或其它盐类),并且针对短序列(例如,10至50个核苷酸),温度为至少约30℃,而针对长序列(例如,大于50个核苷酸),温度为至少约60℃。通过添加诸如甲酰胺的去稳定剂也可以达到严格条件。示例性的低严格条件包含在37℃下与30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液中杂交和在50至55℃下以1X至2X SSC洗涤(20X SSC=3.0M NaCl/0.3M柠檬酸三钠)。示例性的中等严格条件包含在37℃下于40至45%甲酰胺、1.0M NaCl、1%SDS中杂交和在55至60℃下以0.5X至1X SSC洗涤。示例性的高严格条件包含在37℃下于50%甲酰胺、1M NaCl、1%SDS中杂交和在60至65℃下以0.1X SSC洗涤。任选地,洗涤缓冲液可包括约0.1%至约1%的SDS。杂交持续时间一般小于约24小时,通常约4至约12小时。洗涤时间的持续时间至少是足以达到平衡的时间长度。
Tm是50%的互补靶序列与完全匹配的序列杂交的温度(在规定的离子强度和pH下)。对于DNA-DNA杂交体,Tm可以由Meinkoth和Wahl(1984)Anal.Biochem.138:267-284中的等式:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L大致估计;其中M是单价阳离子的体积莫耳浓度,%GC是鸟苷和胞嘧啶核苷酸在DNA中的百分比,%form是杂交溶液中甲酰胺的百分比,以及L是碱基对中的杂交体的长度。一般而言,严格条件被选择为比在规定的离子强度和pH下的特定序列及其补体的热熔点(Tm)低约5℃。然而,极度严格条件可利用在比热熔点(Tm)低1、2、3或4℃下的杂交和/或洗涤;中等严格条件可利用在比热熔点(Tm)低6、7、8、9或10℃的温度下的杂交和/或洗涤;低严格条件可利用在比热熔点(Tm)低11、12、13、14、15或20℃的温度下的杂交和/或洗涤。本领域技术人员将明白,使用该等式、杂交及洗涤组合物以及要求的Tm本身描述了杂交和/或洗涤溶液的严格性的变化。核酸杂交的广泛指南可在Tijssen(1993)Laboratory Techniques in Biochemistry andMolecular Biology—Hybridization with Nucleic Acid Probes,Part I,Chapter 2(Elsevier,New York);以及Ausubel等人编辑的(1995)Current Protocols in MolecularBiology,Chapter 2(Greene Publishing and Wiley-Interscience,New York)中得到。参见Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(2d ed.,Cold SpringHarbor Laboratory Press,Plainview,New York)。
指导RNA可以是单指导RNA或双指导RNA系统。单指导RNA包括单一RNA分子上的crRNA和tracrRNA,而双指导RNA系统包括存在于两个不同RNA分子上的crRNA和tracrRNA,crRNA和tracrRNA通过crRNA的CRISPR重复序列的至少一部分和tracrRNA的可与crRNA的CRISPR重复序列完全或部分互补的至少一部分而彼此杂交。在其中指导RNA是单指导RNA的那些实施方案的一些实施方案中,crRNA和tracrRNA被接头核苷酸序列分开。一般来说,接头核苷酸序列是不包含互补碱基的核苷酸序列,以避免在该接头核苷酸序列的核苷酸内形成次级结构或包括该接头核苷酸序列的核苷酸。在一些实施方案中,crRNA与tracrRNA之间的接头核苷酸序列的长度是至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12个或更多个核苷酸。在特定实施方案中,单指导RNA的接头核苷酸序列的长度是至少4个核苷酸。在某些实施方案中,接头核苷酸序列是如SEQ ID NO:123所列的核苷酸序列。
单指导RNA或双指导RNA可被化学合成或经由体外转录合成。用于确定RGN与指导RNA之间的序列特定结合的测定法是本领域中已知的、并且包含但不限于所表达的RGN与指导RNA之间的体外结合测定法,其可以用可检测标记(例如,生物素)来示迹并被用于下拉检测测定法中,在下拉检测测定法中指导RNA:RGN复合物是经由该可检测标记(例如,利用链霉亲和素珠)捕获的。具有与指导RNA无关的序列或结构的对照物指导RNA可用作RGN与RNA的非特定结合的阴性对照物。在某些实施方案中,指导RNA是SEQ ID NO:4、12、19、26、33、41、49、57、64、72、78、85、92、98、106、113或120,其中间隔序列可以是任何序列并且被表示为多N序列。
在某些实施方案中,指导RNA可作为RNA分子而被引入靶细胞、细胞器或胚胎中。该指导RNA可以体外被转录或被化学合成。在其他实施方案中,将编码该指导RNA的核苷酸序列引入细胞、细胞器或胚胎中。在这些实施方案的一些实施方案中,编码该指导RNA的核苷酸序列可操作地被连接至启动子(例如,RNA聚合酶III启动子)。启动子可以是原生启动子或与指导RNA编码的核苷酸序列异源。
在各种实施方案中,如本文所述,指导RNA可作为核糖核蛋白复合物而被引入靶细胞、细胞器或胚胎中,其中指导RNA与RNA指导的核酸酶多肽结合。
指导RNA通过该指导RNA与靶核苷酸序列的杂交将关联RNA指导的核酸酶导向至所关注的具体靶核苷酸序列。靶核苷酸序列可包括DNA、RNA或两者的组合,并且可以是单链或双链的。靶核苷酸序列可以是基因组DNA(即,染色体DNA)、质体DNA或RNA分子(例如,信使RNA、核糖体RNA、转移RNA、微RNA、小干扰RNA)。靶核苷酸序列可体外或在细胞中被RNA指导的核酸酶结合(而在一些实施方案中,被切割)。RGN所靶向的染色体序列可以是核、质体或线粒体染色体序列。在一些实施方案中,靶核苷酸序列在靶基因组中是独特的。
靶核苷酸序列与原间隔序列相邻模体(protospacer adjacent motif,PAM)相邻。原间隔序列相邻模体一般在距靶核苷酸序列约1至约10个核苷酸内,包含距靶核苷酸序列约1、约2、约3、约4、约5、约6、约7、约8、约9、或约10个核苷酸。PAM可以是靶序列的5'或3'。在一些实施方案中,PAM是本发明公开的RGN的靶序列的3'。一般而言,PAM是约3-4个核苷酸的共有序列,但在特定实施方案中,PAM的长度可以是2、3、4、5、6、7、8、9或更多个核苷酸。在各种实施方案中,由本发明公开的RGN识别的PAM序列包括如SEQ ID NO:7、15、22、29、36、44、52、60、67、81、88、101、109或116所列的共有序列。
在具体实施方案中,具有SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117的RNA指导的核酸酶或其活性变体或片段分别结合与如SEQ ID NO:7、15、22、29、36、44、52、60、67、81、88、101、109或116所列的PAM序列相邻的靶核苷酸序列。在一些实施方案中,具有SEQ ID NO:54或137的RNA指导的核酸酶或其活性变体或片段结合与如SEQ ID NO:147所列的PAM序列相邻的靶核苷酸序列。在这些实施方案的一些实施方案中,RGN结合至包括:分别在SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118中所列的CRISPR重复序列或其活性变体或片段;和分别在SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119中所列的tracrRNA序列或其活性变体或片段的指导序列。在本说明书的实施例1和表1及2中进一步描述RGN系统。
本领域中众所周知,PAM序列对给定核酸酶的特异性受酶浓度的影响(参见,例如,Karvelis等人(2015)Genome Biol 16:253),其可以通过改变用于表达该RGN的启动子或被递送至细胞、细胞器或胚胎的核糖核蛋白复合物的量来修饰。
在识别其对应的PAM序列时,RGN可在特定切割位点切割靶核苷酸序列。如本文所使用的,切割位点是由靶核苷酸序列内的两个特定核苷酸组成,该两个特定核苷酸之间的核苷酸序列被RGN切割。切割位点可以包括在5'或3'方向上离开PAM的第1和第2、第2和第3、第3和第4、第4和第5、第5和第6、第7和第8、或第8和第9个核苷酸。在一些实施方案中,切割位点可以在5'或3'方向上离开PAM 10、11、12、13、14、15、16、17、18、19或20个以上的核苷酸。在一些实施方案中,切割位点距离PAM 4个核苷酸。在其他实施方案中,切割位点距离PAM至少15个核苷酸。因RGN可切割导致交错的末端的靶核苷酸序列,在一些实施方案中,基于多核苷酸的正(+)链上的两个核苷酸离开PAM的距离和多核苷酸的负(-)的链上的两个核苷酸离开PAM的距离来定义切割位点。
PAM被看作II型CRISPR系统的RNA指导核酸酶的标记(Szczelkun等人,PNAS,111:9798-9803,2014;Sternberg等人,Nature507:62-67,2014)。令人关注的是,虽然APG06646.1和APG04293.1起RNA指导的核酸酶的作用并且拥有与II型CRISPR CAS9核酸酶很多相同的域,但是它们每一个都缺少典型的PAM相互作用域(PID;Interpro:IPR032237;Pfam:PF16595)。于是,APG06646.1和APG04293.1没有典型PAM的要求,如上所述,典型PAM是2-5个核苷酸的模体。相反,这些蛋白在其C端(APG06646.1的残基821-1092(全长序列是SEQID NO:117);APG04293.1的残基1064-1401(全长序列是SEQ ID NO:103))处具有独特的DNA识别域。这些独特的DNA识别域使得该核酸酶能够基于基因组靶序列(SEQ ID NO:109;参见表2)附近的单核苷酸模体而在基因组靶位点切割。
APG04293.1还具有靠近其N端的133个氨基酸残基(残基144-276)的独特签名域。此域的功能在II型CRISPR Cas9核酸酶中或本领域中一般而言不为所知。
III.编码RNA指导的核酸酶、CRISPR RNA和/或tracrRNA的核苷酸
本公开内容提供了包括本发明公开的CRISPR RNA、tracrRNA和/或sgRNA的多核苷酸和包括编码本发明公开的RNA指导的核酸酶、CRISPR RNA、tracrRNA和/或sgRNA的核苷酸序列的多核苷酸。本发明公开的多核苷酸包含包括或编码CRISPR重复序列的那些多核苷酸,该CRISPR重复序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性变体或片段,该核苷酸序列或其活性变体或片段当被包括在指导RNA内时能够将关联RNA指导的核酸酶导向至与所关注的靶序列序列特定结合。还公开了包括或编码tracrRNA的多核苷酸,该tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性变体或片段,该核苷酸序列或其活性变体或片段当被包括在指导RNA内时能够将关联RNA指导的核酸酶导向至与所关注的靶序列序列特定结合。还提供了编码RNA指导的核酸酶的多核苷酸,该RNA指导的核酸酶包括如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所列的氨基酸序列及其活性片段或变体,该氨基酸序列及其活性片段或变体保持了以RNA指导的序列特定方式结合至靶核苷酸序列的能力。
术语“多核苷酸”的使用不旨在将本公开内容局限于包括DNA的多核苷酸。本领域技术人员将认可多核苷酸可包括核糖核苷酸(RNA)以及核糖核苷酸与脱氧核糖核苷酸的组合。这种脱氧核糖核苷酸和核糖核苷酸既包含天然存在的分子又包含合成类似物。这些包含肽核酸(PNA)、PNA-DNA嵌合体、锁核酸(LNA)以及硫代磷酸酯连接序列。本文公开的多核苷酸还涵盖所有形式的序列,包含但不限于单链形式、双链形式、DNA-RNA杂交体、三重结构(triplex structure)、茎环结构等。
编码RGN的核酸分子可以针对所关注的生物体中的表达而被密码子优化。“密码子优化的”编码序列是使其密码子使用频率设计成模拟优选密码子使用频率或特定宿主细胞的转录条件的多核苷酸编码序列。由于核酸水平上的一个或多个密码子的改变使得翻译的氨基酸序列未改变,所以特定宿主细胞或生物体中的表达被增强。核酸分子可以全部或部分地被密码子优化。密码子表和提供大范围生物体的偏好信息的其他参考文献在本领域中是可得的(参见,例如,Campbell和Gowri(1990)Plant Physiol.92:1-11,有关植物优选密码子使用的讨论)。本领域中用于合成植物优选基因的方法是可得的。参见,例如,第5,380,831号和第5,436,391号美国专利以及Murray等人(1989)Nucleic Acids Res.17:477-498,它们通过引用并入本文。
编码本文中提供的RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可在表达盒中提供,以用于体外表达或在所关注的细胞、细胞器、胚胎或生物体中表达。该盒包含5'和3'调节序列,该5'和3'调节序列可操作地连接至编码本文中提供的允许多核苷酸表达的RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸。该盒可额外含有将被转化至生物体中的至少一种额外基因或基因元件。如果包含额外基因或元件,则成分被可操作地连接。术语“可操作地连接”旨在表达两个或更多个元件之间的功能性连接。举例而言,启动子与所关注的编码区域(例如,编码RGN、crRNA、tracrRNA和/或sgRNA的区域)之间的可操作地连接是允许所关注的编码区域表达的功能性连接。可操作地连接的元件可以是连续的,也可以是非连续的。当用于指两个蛋白质编码区域的连接时,通过可操作地连接意指编码区域在相同的阅读框中。作为另一种选择,可在多个表达盒上提供(数个)额外基因或元件。举例而言,编码本发明公开的RGN的核苷酸序列可存在于一个表达盒上,而编码crRNA、tracrRNA或完整指导RNA的核苷酸序列可在单独表达盒上。这种表达盒被提供有多个限制性位点和/或重组位点,以使多核苷酸的插入受调节区域的转录调节。该表达盒可额外含有选择性标记基因。
表达盒在5'-3'转录方向将包含转录(以及在一些实施方案中,翻译)启动区域(即,启动子)、本发明的RGN-、crRNA-、tracrRNA-和/或sgRNA-编码多核苷酸、以及在所关注的生物体中起作用的转录(以及在一些实施方案中,翻译)终止区域(即,终止区域)。本发明的启动子能够在宿主细胞中导向或驱动编码序列的表达。调节区域(例如,启动子、转录调节区域以及翻译终止区域)对宿主细胞或彼此可以是内源的或异源的。如本文所使用的关于序列的“异源”是源自外来物种的序列,或者,如果来自相同物种,则是通过蓄意的人为干预从其在组合物和/或基因组基因座中的天然形式基本上被修饰的序列。如本文中所使用的嵌合基因包括与转录起始区域可操作地连接的编码序列,该转录起始区与编码序列是异源的。
合宜的终止区域可从根癌农杆菌(A.tumefaciens)的Ti质粒获得,诸如,章鱼碱合成酶和胭脂碱合成酶终止区域。还参见Guerineau等人(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev.5:141-149;Mogen等人(1990)Plant Cell 2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)Nucleic Acids Res.17:7891-7903;以及Joshi等人(1987)Nucleic AcidsRes.15:9627-9639。
额外调节信号包含但不限于转录起始初始位点、操纵基因、活化子、增强子、其他调节元件、核糖体结合位点、起始密码子、终止信号等。参见,举例而言,第5,039,523号和第4,853,331号美国专利;EPO 0480762A2;Sambrook等人(1992),Molecular Cloning:ALaboratory Manual,Maniatis等人编辑(Cold Spring Harbor Laboratory Press,ColdSpring Harbor,N.Y.),后称“Sambrook 11”;Davis等人编辑(1980)Advanced BacterialGenetics(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)以及其中引用的参考文献。
在制备表达盒时,可以操纵各种DNA片段,以便在适宜的方向上和恰当的情况下于适宜阅读框中提供DNA序列。为此,可以使用衔接子或接头来连接DNA片段,或者可涉及其他操纵来提供合宜的限制位点、除去多余的DNA、除去限制位点等。为此目的,可涉及体外诱变、引物修复、限制、退火、重新置换,例如转换和颠换。
许多启动子可用于本发明的实施。可基于期望结果来选择启动子。核酸可以与组成型、诱导型、生长阶段特定、细胞类型特定、组织优选、组织特定的启动子或其他启动子结合,用于所关注的生物体中的表达。参见,举例而言,WO 99/43838中和第8,575,425号;第7,790,846号;第8,147,856号;第8,586832号;第7,772,369号;第7,534,939号;第6,072,050号;第5,659,026号;第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号;以及第6,177,611号美国专利中所列的启动子;它们通过引用并入本文。
对于在植物中的表达,组成型启动子还包含CaMV 35S启动子(Odell等人(1985)Nature 313:810-812);水稻肌动蛋白(McElroy等人(1990)Plant Cell 2:163-171);泛素(Christensen等人(1989)Plant Mol.Biol.12:619-632以及Christensen等人(1992)PlantMol.Biol.18:675-689);pEMU(Last等人(1991)Theor.Appl.Genet.81:581-588);以及MAS(Velten等人(1984)EMBO J.3:2723-2730)。
诱导型启动子的实例是可通过缺氧或冷应激诱导的Adh1启动子、可通过热应激诱导的Hsp70启动子、可由光诱导的PPDK启动子和磷酸烯醇丙酮酸羧化酶(pepcarboxylase)启动子。同样有用的是化学诱导的启动子,诸如,安全剂诱导的In2-2启动子(第5,364,780号美国专利)、生长素诱导的且是绒毡层特定的但在愈合组织中还有活性的Axig1启动子(PCT US01/22169)、类固醇反应性启动子(参见,举例而言,Schena等人(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425和McNellis等人(1998)Plant J.14(2):247-257中的雌激素诱导的ERE启动子和糖皮质激素诱导型启动子)、以及四环素诱导型和四环素抑制型启动子(参见,举例而言,Gatz等人(1991)Mol.Gen.Genet.227:229-237以及第5,814,618号和第5,789,156号美国专利),它们通过引用并入本文。
组织特定或组织优选的启动子可用于靶向具体组织内的表达构建体的表达。在某些实施方案中,组织特定或组织优选的启动子在植物组织中是有活性的。在植物中受发育控制的启动子的实例包含在诸如叶、根、果实、种子或花的某些组织中优选地起始转录的启动子。“组织特定的”启动子是仅在某些组织中起始转录的启动子。与基因的组成型表达不同,组织特定表达是几种水平的基因调节相互作用的结果。就其本身而言,来自同源或密切相关的植物物种的启动子可优选地用于在特定组织中实现转基因的有效且可靠的表达。在一些实施方案中,表达包括组织优选的启动子。“组织优选的”启动子是优选地在,但不一定完全在或仅在某些组织中起始转录的启动子。
在一些实施方案中,编码RGN、crRNA和/或tracrRNA的核酸分子包括细胞类型特定启动子。“细胞类型特定”启动子是主要在一个或多个器官的某些细胞类型中驱动表达的启动子。举例而言,其中在植物中起作用的细胞类型特定启动子可主要是活性的植物细胞的一些实例包含BETL细胞、根、叶中的维管细胞、柄细胞以及茎细胞(stemcell)。核酸分子还可包含细胞类型优选的启动子。“细胞类型优选的”启动子是主要驱动大部分在,但不一定完全在或仅在一个或多个器官中的某些细胞类型中的表达的启动子。举例而言,其中在植物中起作用的细胞类型优选的启动子可具优选活性的植物细胞的一些实例包含BETL细胞、根、叶中的维管细胞、柄细胞以及茎细胞。
编码RGN、crRNA、tracrRNA和/或sgRNA的核酸序列可与举例而言用于体外mRNA合成的噬菌体RNA聚合酶识别的启动子序列可操作地连接。在此类实施方案中,可纯化体外转录的RNA,以用于本文所述的方法。举例而言,启动子序列可以是T7、T3或SP6启动子序列,或T7、T3或SP6启动子序列的变体。在此类实施方案中,可纯化表达蛋白和/或RNA,以用于本文所述的基因组修饰方法。
在某些实施方案中,编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸还可与多腺苷酸化信号(例如,SV40多A信号及植物中起作用的其他信号)和/或至少一个转录终止序列连接。另外,编码RGN的序列还可与编码至少一个核定位信号、至少一个细胞穿透域和/或能够将蛋白质运输到具体亚细胞位置的至少一个信号肽的序列连接,如本文中别处所述。
编码RGN、crRNA、tracrRNA和/或sgRNA的多核苷酸可存在于一个载体或多个载体中。“载体”是指用于将核酸转移、递送或引入宿主细胞内的多核苷酸组合物。适合的载体包含质粒载体、噬菌粒、黏粒、人工/微型染色体、转座子以及病毒载体(例如,慢病毒载体、腺相关病毒载体、杆状病毒载体)。载体可包括额外的表达控制序列(例如,增强子序列、Kozak序列、多腺苷酸化序列、转录终止序列)、选择性标记序列(例如,抗生素抗性基因)、复制起点等。额外信息可在“Current Protocols in Molecular Biology”Ausubel等人、JohnWiley&Sons,纽约,2003;或“Molecular Cloning:A Laboratory Manual”Sambrook&Russell,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.,3rd edition,2001中找到。
载体还可包括用于选择转化细胞的选择性标记基因。选择性标记基因用于转化的细胞或组织的选择。标记基因包含:编码抗生素抗性的基因,诸如,编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因;以及对诸如草铵膦、溴苯腈、咪唑啉酮以及2,4-二氯苯氧乙酸酯(2,4-D)的除草性化合物赋予抗性的基因。
在一些实施方案中,包括编码RGN多肽的序列的表达盒或载体可进一步包括编码crRNA和/或tracrRNA或者被组合以形成指导RNA的crRNA和tracrRNA的序列。编码crRNA和/或tracrRNA的(数个)序列可与至少一个转录控制序列可操作地连接,用于所关注的生物体或宿主细胞中的crRNA和/或tracrRNA的表达。举例而言,编码crRNA和/或tracrRNA的多核苷酸可与由RNA聚合酶III(Pol III)识别的启动子序列可操作地连接。适合的Pol III启动子的实例包含但不限于哺乳动物U6、U3、H1及7SL RNA启动子以及水稻U6及U3启动子。
如所指示的,包括编码RGN、crRNA、tracrRNA和/或sgRNA的核苷酸序列的表达构建体可用于转化所关注的生物体。用于转化的方法涉及将核苷酸构建体引入所关注的生物体内。“引入”旨在以使得该构建体获得进入宿主细胞内部的这样方式将核苷酸构建体引入宿主细胞。本发明的方法不需要用于将核苷酸构建体引入宿主生物体的特定方法,仅需要该核苷酸构建体获得进入宿主生物体的至少一个细胞的内部。宿主细胞可以是真核细胞或原核细胞。在特定实施方案中,真核宿主细胞是植物细胞、哺乳动物细胞或昆虫细胞。用于将核苷酸构建体引入植物以及其他宿主细胞内的方法是本领域中已知的,其包含但不限于稳定转化方法、瞬时转化方法以及病毒介导方法。
这些方法导致转化的生物体(诸如植物),其包含:整株植物和植物器官(例如,叶、茎、根等)、种子、植物细胞、繁殖体、胚胎及其后代。植物细胞可被分化,也可不被分化(例如,愈合组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。
“转基因生物体”或“转化生物体”或“稳定转化的”生物体或细胞或组织是指已并入或整合了编码本发明的RGN、crRNA和/或tracrRNA的多核苷酸的生物体。已经认识到其他外源或内源核酸序列或DNA片段也可被并入宿主细胞内。农杆菌介导和基因枪介导的转化仍然是用于植物细胞转化的两种盛行采用的方法。然而,宿主细胞的转化可通过感染、转染、显微注射、电穿孔、显微投影(microprojection)、基因枪或粒子轰击、电穿孔、二氧化硅/碳纤维、超声波介导的、PEG介导的、磷酸钙共沉淀、聚阳离子DMSO技术、DEAE葡聚糖程序、以及病毒介导的、脂质体介导的等进行。编码RGN、crRNA和/或tracrRNA的多核苷酸的病毒介导的引入包含反转录病毒、慢病毒、腺病毒以及腺相关病毒介导的引入和表达,以及花椰菜花叶病毒、双生病毒(Geminivirus)以及RNA植物病毒的使用。
转化方案和用于将多肽或多核苷酸序列引入植物内的方案可随针对转化所靶向的宿主细胞的类型(例如,单子叶植物或双子叶植物细胞)而不同。用于转化的方法是本领域中已知的,且包含第8,575,425号、第7,692,068号、第8,802,934号、第7,541,517号美国专利中阐述的那些方法,这些专利中的每一篇都通过引用并入本文。还参见Rakoczy-Trojanowska,M.(2002)Cell Mol Biol Lett.7:849-858;Jones等人(2005)Plant Methods1:5;Rivera等人(2012)Physics of Life Reviews 9:308-345;Bartlett等人(2008)PlantMethods 4:1-12;Bates,G.W.(1999)Methods in Molecular Biology 111:359-366;Binns和Thomashow(1988),Microbiology 42:575-606中的Annual Reviews;Christou,P.(1992)The Plant Journal 2:275-281;Christou,P.(1995)Euphytica 85:13-27;Tzfira等人(2004)TRENDS in Genetics 20:375-383;Yao等人(2006)Journal of ExperimentalBotany 57:3737-3746;Zupan和Zambryski(1995)Plant Physiology 107:1041-1047;Jones等人(2005)Plant Methods 1:5。
转化可导致核酸稳定或瞬时并入细胞内。“稳定转化”旨在指引入宿主细胞内的核苷酸构建体整合到宿主细胞的基因组内,且能够被其后代遗传。“瞬时转化”旨在指多核苷酸被引入宿主细胞内且不整合到宿主细胞的基因组内。
用于叶绿体转化的方法是本领域中已知的。参见,举例而言,Svab等人(1990)Proc.Nail.Acad.Sci.USA 87:8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA90:913-917;Svab和Maliga(1993)EMBO J.12:601-606。该方法依赖于含有选择性标记的DNA的粒子枪递送和通过同源重组将该DNA靶向质体基因组。另外,质体转化可通过核编码的和质体导向的RNA聚合酶的组织优选的表达来反式活化(transactivation)沉默的质体携带的转基因来实现。McBride等人(1994)在Proc.Natl.Acad.Sci.USA 91:7301-7305已报导了这种系统。
已经被转化的细胞可以按照传统方法生长成转基因生物体,诸如植物。参见,例如McCormick等人(1986)Plant Cell Reports 5:81-84。然后,可以使这些植物生长,并用相同转化品系或不同品系授粉,并且鉴别出具有期望表型特征的组成型表达的所得杂交体。可生长两代或更多代,以确保稳定维持并遗传期望表型特征的表达,然后,收获种子以确保已经实现期望表型特征的表达。以此方式,本发明提供具有稳定地并入其基因组内的本发明的核苷酸构建体(举例而言,本发明的表达盒)的转化种子(也称为“转基因种子”)。
作为另一种选择,可以将已经被转化的细胞引入生物体内。这些细胞可以源自该生物体,其中细胞以离体(ex vivo)方法被转化。
本文提供的序列可用于转化任何植物物种,包含但不限于:单子叶植物和双子叶植物。所关注的植物的实例包含但不限于:玉蜀黍(玉米)、高粱、小麦、向日葵、西红柿、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦及油菜、芸苔属物种、苜蓿、黑麦、小米、红花、花生、甘薯、木薯、咖啡、椰子、菠萝、柑橘树、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、木瓜、腰果、澳洲胡桃、杏仁、燕麦、蔬菜、观赏植物以及针叶树。
蔬菜包含但不限于西红柿、莴苣、绿豆、利马豆、豌豆、以及诸如黄瓜(cucumber)、哈密瓜以及香瓜的黄瓜(Curcumins)属的成员。观赏植物包含但不限于杜鹃花、绣球花、芙蓉、玫瑰、郁金香、水仙、矮牵牛、康乃馨、猩猩木以及菊花。优选地,本发明的植物是农作物(举例而言、玉米、高粱、小麦、向日葵、西红柿、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等)。
如本文所使用的,术语“植物”包含植物细胞、植物原生质体、可以从其再生植物的植物细胞组织培养物、植物愈伤组织、植物块、以及在植物或植物的诸如胚胎、花粉、胚珠、种子、叶子、花、枝、果实、仁、穗、玉米穗轴、壳、茎、根、根尖、花药等的部分中是完整的植物细胞。谷物意指出于种植或繁殖物种之外的目的而由商业种植者生产的成熟种子。再生植物的后代、变体以及突变体也包含在本发明的范围内,前提条件是这些部分包括引入的多核苷酸。还提供了保持了本文中公开的序列的经加工的植物产品或副产物,举例而言,包含豆粕。
编码RGN、crRNA和/或tracrRNA的多核苷酸也可用于转化任何原核物种,包含但不限于古生菌和细菌(例如,芽孢杆菌属(Bacillussp.)、克雷伯氏菌属(Klebsiella sp.)、链霉菌属(Streptomyces sp.)、根瘤菌属(Rhizobium sp.)、埃希氏菌属(Escherichia sp.)、假单胞菌属(Pseudomonas sp.)、沙门氏菌属(Salmonella sp.)、志贺氏杆菌属(Shigellasp.)、弧菌属(Vibrio sp.)、耶尔森菌属(Yersinia sp.)、支原体菌属(Mycoplasma sp.)、农杆菌属(Agrobacterium)、乳酸乳杆菌属(Lactobacillus sp.)。
编码RGN、crRNA和/或tracrRNA的多核苷酸可用于转化任何真核物种,包含但不限于动物(例如,哺乳动物、昆虫、鱼类、鸟类以及爬行动物)、真菌、变形虫、藻类以及酵母。
传统的基于病毒和非病毒的基因转移方法可用于将核酸引入哺乳动物细胞或靶组织中。这些方法可用于将编码CRISPR系统成分的核酸提供给培养中的细胞、或宿主生物体中的细胞。非病毒载体递送系统包含DNA质粒、RNA(例如,本文描述的载体的转录物)、裸核酸以及与诸如脂质体的递送载剂复合的核酸。病毒载体递送系统包含DNA和RNA病毒,其在递送至细胞后具有附加型或整合的基因组。有关基因治疗程序的综述,参见Anderson,Science 256:808-813(1992);Nabel&Feigner,TIBTECH 11:211-217(1993);Mitani&Caskey,TIBTECH 11:162-166(1993);Dillon,TIBTECH 11:167-175(1993);Miller,Nature357:455-460(1992);Van Brunt,Biotechnology 6(10):1149-1154(1988);Vigne,Restorative Neurology and Neuroscience 8:35-36(1995);Kremer&Perricaudet,British Medical Bulletin 51(1):31-44(1995);Haddada等人,于Current Topics inMicrobiology and Immunology,Doerfler和Bohm(eds)(1995);以及Yu等人,Gene Therapy1:13-26(1994)。
核酸的非病毒递送方法包含脂质体转染、核转染、显微注射、基因枪、病毒微体、脂质体、免疫脂质体、聚阳离子或脂质:核酸缀合物、裸DNA、人工病毒粒子以及DNA的药剂增强摄取。例如第5,049,386号、第4,946,787号以及第4,897,355号美国专利中描述了脂质体转染,并且脂质体转染试剂是市售的(例如,TransfectamTM和LipofectinTM)。适合用于多核苷酸的有效受体识别脂质体转染的阳离子和中性脂质包含Feigner的WO 91/17424;WO 91/16024中的那些阳离子和中性脂质。递送可以是至细胞(例如,体外或离体施用)或靶组织(例如,体内施用)。包含靶向的脂质体诸如免疫脂质复合物的脂质:核酸复合物的制备是本领域技术人员众所周知的(参见,例如Crystal,Science270:404-410(1995);Blaese等人,Cancer Gene Ther.2:291-297(1995);Behr等人,Bioconjugate Chem.5:382-389(1994);Remy等人,Bioconjugate Chem.5:647-654(1994);Gao等人,Gene Therapy2:710-722(1995);Ahmad等人,Cancer Res.52:4817-4820(1992);第4,186,183号、第4,217,344号、第4,235,871号、第4,261,975号、第4,485,054号、第4,501,728号、第4,774,085号、第4,837,028号以及第4,946,787号美国专利)。
用于核酸的递送的基于RNA或DNA病毒的系统的使用利用了高度进化的过程,以用于将病毒靶向体内的特定细胞并将病毒载荷运输至细胞核。病毒载体可以直接施用于患者(体内),或者该病毒载体可以用于体外处理细胞,并且可任选地将修饰后的细胞施用于患者(离体)。传统的基于病毒的系统可包含用于基因转移的反转录病毒、慢病毒、腺病毒、腺相关以及单纯疱疹病毒载体。使用反转录病毒、慢病毒以及腺相关病毒基因转移方法,在宿主基因组中的整合是可能的,常常导致插入的转基因的长期表达。另外,在很多不同细胞类型和靶组织中已经观察到高转导功效。
反转录病毒的向性可通过并入外来包膜蛋白而被改变,从而扩展靶细胞的潜在靶群。慢病毒载体是能够转导或感染非分裂细胞并且通常情况下生成高病毒效价的反转录病毒载体。因此,反转录病毒基因转移系统的选择将取决于靶组织。反转录病毒载体由顺式作用长末端重复构成,具有达到6-10kb外源序列的包装能力。最小顺式作用LTR足够用于载体的复制和包装,然后,将其用于将治疗基因整合到靶细胞中,以提供永久转基因表达。广泛使用的反转录病毒载体包含基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猿猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)及其组合的载体。(参见,例如,Buchscher等人,J.Viral.66:2731-2739(1992);Johann等人,J.Viral.66:1635-1640(1992);Sommnerfelt等人,Viral.176:58-59(1990);Wilson等人,J.Viral.63:2374-2378(1989);Miller等人,1.Viral.65:2220-2224(1991);PCT/US94/05700)。
在瞬时表达优选的应用中,可以使用基于腺病毒的系统。基于腺病毒的载体在许多细胞类型中为能够非常高的转导效率,并且不需要细胞分裂。使用这样的载体,已经获得了高效价和表达水平。此载体可在相对简单的系统中大量生产。腺相关病毒(“AAV”)载体也可例如在核酸和肽的体外生成中用于转导具有靶核酸的细胞,并且用于体内和体外基因治疗程序(参见,例如,West等人,Virology 160:38-47(1987);第4,797,368号美国专利;WO93/24641;Katin,Human Gene Therapy 5:793-801(1994);Muzyczka,1.Clin.Invest.94:1351(1994))。重组AAV载体的构建描述于许多出版物中,包含第5,173,414号美国专利;Tratschin等人,Mol.Cell.Biol.5:3251-3260(1985);Tratschin等人,Mol.Cell.Biol.4:2072-2081(1984);Hermonat&Muzyczka,PNAS 81:6466-6470(1984);以及Samulski等人,1.Viral.63:03822-3828(1989)。包装细胞通常情况下用于形成能够感染宿主细胞的病毒颗粒。这种细胞包含包装腺病毒的293细胞和包装反转录病毒的ψJ2细胞或PA317细胞。
用于基因治疗的病毒载体通常通过生成将核酸载体包装于病毒颗粒内的细胞系而被产生。载体通常情况下含有用于包装且随后整合至宿主内所需的最小病毒序列,其他病毒序列由用于要表达的(数个)多核苷酸的表达盒置换。遗失的病毒功能通常情况下由包装细胞系反式提供。举例而言,基因治疗中使用的AAV载体通常情况下仅具有来自用于包装及整合至宿主基因组内所需的AAV基因组的ITR序列。病毒DNA被包装在细胞系中,该细胞系含有编码其他AAV基因的辅助质粒,即,rep和cap,但缺少ITR序列。
也可以用腺病毒作为辅助者来感染细胞系。辅助病毒促进AAV载体的复制和来自辅助质粒的AAV基因的表达。因缺少ITR序列,未以显著量包装辅助质粒。腺病毒的污染可通过例如对腺病毒比AAV更敏感的热处理来降低。将核酸递送至细胞的额外方法是本领域技术人员已知的。举例而言,参见US20030087817,其通过引用并入本文。
在一些实施方案中,用本文描述的一个或多个载体瞬时或非瞬时转染宿主细胞。在一些实施方案中,细胞在其天然存在于个体中时被转染。在一些实施方案中,被转染的细胞取自个体。在一些实施方案中,细胞衍生自取自个体的细胞,诸如细胞系。用于组织培养的多种细胞系是本领域中已知的。细胞系的实例包含但不限于C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLaS3、Huhl、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panel、PC-3、TFl、CTLL-2、CIR、Rat6、CVI、RPTE、AlO、T24、182、A375、ARH-77、Calul、SW480、SW620、SKOV3、SK-UT、CaCo2、P388Dl、SEM-K2、WEHI-231、HB56、TIB55、lurkat、145.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4.COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎纤维母细胞、3T3 Swiss、3T3-Ll、132-d5人胎儿纤维母细胞;10.1小鼠纤维母细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-I细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10Tl/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-Kl、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L235010、CORL23/R23、COS-7、COV-434、CML Tl、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepalclc7、HL-60、HMEC、HT-29、lurkat、lY细胞、K562细胞、Ku812、KCL22、KGl、KYOl、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-l0A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCKII、MDCKII、MOR/0.2R、MONO-MAC 6、MTD-lA、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-lA/PNT2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THPl细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR、及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(参见,例如American Type CultureCollection(ATCC)(Manassas,Va.))。
在一些实施方案中,用本文描述的一个或多个载体转染的细胞被用于建立包括一个或多个载体衍生序列的新细胞系。在一些实施方案中,用如本文描述的CRISPR系统的成分瞬时转染(诸如通过一个或多个载体的瞬时转染,或用RNA转染)并通过CRISPR复合物的活性修饰后细胞用于建立包括含有修饰但缺少任何其他外源序列的细胞的新细胞系。在一些实施方案中,用本文描述的一个或多个载体瞬时或非瞬时转染的细胞或从此类细胞衍生的细胞系用于评估一个或多个测试化合物。
在一些实施方案中,本文描述的一个或多个载体用于生成非人的转基因动物或转基因植物。在一些实施方案中,转基因动物是哺乳动物,诸如,小鼠、大鼠或兔子。
IV.多肽及多核苷酸的变体和片段
本公开内容提供了:天然存在的(即,野生型)RNA指导的核酸酶的活性变体和片段,该活性变体和片段的氨基酸序列如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235所示;以及天然存在的CRISPR重复的活性变体和片段,诸如,如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所示序列;和天然存在的tracrRNA的活性变体和片段,诸如,如SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所示序列);及编码这些活性变体和片段的多核苷酸。
虽然与所关注的多核苷酸或多肽相较下可以改变变体或片段的活性,但变体和片段应保持所关注的多核苷酸或多肽的功能性。举例而言,当与所关注的多核苷酸或多肽相较时,变体或片段可具有增加的活性、降低的活性、不同的活性谱或任何其他活性改变。
诸如本文公开的天然存在的RGN多肽的片段和变体将保持序列特定的RNA指导的DNA结合活性。在特定实施方案中,诸如本文公开的天然存在的RGN多肽的片段和变体将保持核酸酶活性(单链或双链)。
当指导RNA(包括tracrRNA)的部分以序列特定方式结合至RNA指导的核酸酶(与指导RNA复合的)并且将RNA指导的核酸酶(与指导RNA复合的)指导至靶核苷酸序列时,诸如本文公开的天然存在的CRISPR重复的片段和变体将保持该能力。
当指导RNA(包括CRISPR RNA)的部分以序列特定方式将RNA指导的核酸酶(与指导RNA复合的)指导至靶核苷酸序列时,诸如本文公开的天然存在的tracrRNA的片段和变体将保持该能力。
术语“片段”是指本发明的多核苷酸或多肽序列的一部分。“片段”或“生物活性部分”包含多核苷酸,该多核苷酸包括足够数量的连续核苷酸,以保持生物活性(即,当被包括在指导RNA内时,以序列特定方式与RGN结合并将RGN导向至靶核苷酸序列)。“片段”或“生物活性部分”包含多肽,该多肽包括足够数量的连续氨基酸残基,以保持生物活性(即,当与指导RNA复合时,以序列特定方式与靶核苷酸序列结合)。RGN蛋白的片段包含由于使用替代的下游初始位点而比全长序列短的那些。RGN蛋白的生物活性部分可以是包括举例而言SEQID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的10、25、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个连续氨基酸残基的多肽。这些生物活性部分可通过重组技术而被制备并且针对序列特定的RNA指导的DNA结合活性而被评价。CRISPR重复序列的生物活性片段可包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的至少8个连续氨基酸。CRISPR重复序列的生物活性部分可以是包括举例而言SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸的多核苷酸。tracrRNA的生物活性部分可以是包括举例而言SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、55、60、65、70、75、80个或更多个连续核苷酸的多核苷酸。
一般来说,“变体”旨在表达基本上相似的序列。对于多核苷酸,变体包括在天然多核苷酸内的一个或多个内位点处的一个或多个核苷酸的缺失和/或添加和/或天然多核苷酸中一个或多个位点处的一个或多个核苷酸的置换。如本文所使用的,“原生”或“野生型”多核苷酸或多肽分别包括天然存在的核苷酸序列或氨基酸序列。对于多核苷酸,保守变体包含因为基因密码的退化性而编码所关注基因的原生氨基酸序列的那些序列。与举例而言利用下面阐述的聚合酶链式反应(PCR)和杂交技术一样,可使用众所周知的分子生物学技术鉴定诸如这些等位基因变体的天然存在的等位基因变体。变体多核苷酸还包含合成衍生的多核苷酸,诸如通过使用定点诱变产生的但其仍然编码所关注的多肽或多核苷酸的多核苷酸。一般而言,如通过本文他处描述的序列对齐程序及参数所确定的,本文公开的特定多核苷酸的变体具有与该特定多核苷酸至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
本文公开的特定多核苷酸的变体(即,参考多核苷酸)也可以通过比较由变体多核苷酸所编码的多肽与该参考多核苷酸所编码的多肽之间的序列同一性百分比来评价。可使用本文别处描述的序列对齐程序和参数来计算任何两个多肽之间的序列同一性百分比。当通过比较本文公开的任何给定的多核苷酸与它们编码的两个多肽共有的序列同一性百分比来评价给定的多核苷酸对时,这两个经编码的多肽之间的序列同一性百分比为至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。
在特定实施方案中,本发明公开的多核苷酸编码RNA指导的核酸酶多肽,该RNA指导的核酸酶多肽包括的氨基酸序列具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的氨基酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性。
本发明的RGN多肽的生物活性变体可以相差少至约1-15个氨基酸残基、少至约1-10个(诸如,约6-10个)、少至5个、少至4个、少至3个、少至2个、或少至1个氨基酸残基。在特定实施方案中,多肽可包括N端或C端截短,该截短可包括从该多肽的N端或C端缺失至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050个或更多个氨基酸。
在某些实施方案中,本发明公开的多核苷酸包括或编码CRISPR重复,该CRISPR重复包括具有与如SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287所示的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核苷酸序列。
本发明公开的多核苷酸可包括或编码tracrRNA,该tracrRNA包括具有与如SEQ IDNO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286所示的核苷酸序列至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核苷酸序列。
本发明的CRISPR重复或tracrRNA的生物活性变体可以相差少至约1-15个核苷酸、少至约1-10个核苷酸(诸如,约6-10个)、少至5个核苷酸、少至4个核苷酸、少至3个核苷酸、少至2个核苷酸、或少至1个核苷酸。在特定实施方案中,多核苷酸可包括5'或3'截短,该5'或3'截短可包括从该多核苷酸的5'或3'末端缺失至少10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个核苷酸或更多个核苷酸。
已经认识到的是,可对本文提供的RGN多肽、CRISPR重复以及tracrRNA进行修饰,从而建立变体蛋白质和多核苷酸。人为设计的变化可通过位点导向的诱变技术的应用来引入。作为另一种选择,在结构上和/或功能上与本文公开的序列有关的原生的、尚不知晓的或尚未鉴别的多核苷酸和/或多肽也可被认为落入本发明范围内的。可以在不改变RGN蛋白功能的非保守区域中进行保守式氨基酸置换。作为另一种选择,可以进行改进RGN活性的修饰。
变体多核苷酸和蛋白质还涵盖从诸如DNA混编的诱变和引起重组程序衍生的序列和蛋白质。利用这种程序,操纵本文公开的一个或多个不同的RGN蛋白质(例如,SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235),以建立具有期望特性的新RGN蛋白质。以这种方式,重组多核苷酸文库是从包括序列区域的有关序列多核苷酸群产生的,该序列区域具有基本的序列同一性并且可以体外或体内同源重组。举例而言,使用这种方法,编码所关注域的序列模体可在本文提供的RGN序列与其他已知的RGN基因之间混编,以获得为了具有改善的关注性质(诸如在酶的情况下增加的Km)而编码的蛋白质的新基因。这种DNA混编的策略在本领域中是已知的。举例而言,参见Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri等人(1997)Nature Biotech.15:436-438;Moore等人(1997)J.Mol.Biol.272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509;Crameri等人(1998)Nature391:288-291;以及第5,605,793号和第5,837,458号美国专利。“混编的”核酸是通过混编程序(诸如本文阐述的任何混编程序)生成的核酸。混编的核酸是通过举例而言以人工方式和任选的递归方式(实际或虚拟地)重组两种或更多种核酸(或字符串)生成的。一般而言,在混编过程中使用一个或多个筛选步骤来识别所关注的核酸;此筛选步骤可在任何重组步骤之前或之后进行。在一些(但不是全部)混编实施方案中,期望在选择之前进行多轮重组,以增加要筛选的库的多样性。重组和选择的整个过程可任选递归地重复。取决于上下文,混编可以指重组和选择的整个过程,或者,作为另一种选择,可仅指整个过程的重组部分。
如前后文在两个多核苷酸或多肽序列的背景中所使用的“序列同一性”或“同一性”涉及当在指定的比较窗上对齐最大对应性时为相同的两个序列中的残基。当使用与蛋白质有关的序列同一性百分比时,识别出不相同的残基位置,其常常通过保守氨基酸置换而不同,在保守氨基酸置换中氨基酸残基被置换成具有类似化学性质(例如,电荷或疏水性)的其他氨基酸残基,且因此不改变分子的功能性质。当序列在保守置换中不同时,可以上调序列同一性百分比,以修正置换的保守性质。通过这种保守置换而不同的序列被称为具有“序列相似性”或“相似性”。用于进行这种调节的手段是本领域技术人员众所周知的。通常情况下,这涉及将保守置换作为部分错配而非完全错配进行评分,从而增加序列同一性百分比。由此,举例而言,当对相同氨基酸给予1分,而对非保守置换给予零分时,对保守置换给予零与1之间的得分。计算保守置换的得分,例如,如在程序PC/GENE(Intelligenetics,Mountain View,California)中所实施的。
如本文所使用的,“序列同一性的百分比”是指通过在比较窗上比较两个最佳对齐序列所确定的值,其中多核苷酸序列在比较窗中的部分可包括相较于用于该两个序列的最佳对齐的参考序列(不包括添加或缺失)的添加或缺失(即,缺口)。通过确定在两个序列中出现相同的核酸碱基或氨基酸残基的位置的数目来求得匹配位置的数目;将匹配位置的数目除以比较窗中的位置总数;并将该结果乘以100,求得序列同一性百分比,来计算该百分比。
除非另外说明,否则本文提供的序列同一性/相似性值是指使用GAP版本10采用以下参数获得的值:核苷酸序列的%同一性和%相似性使用GAP权重50和长度权重3,以及nwsgapdna.cmp评分矩阵;氨基酸序列的%同一性和%相似性使用GAP权重8和长度权重2,以及BLOSUM62评分矩阵;或其任何等同程序。“等同程序”是指对于所考虑的任何两个序列,当与GAP版本10产生的对应对齐相比较时,产生具有相同的核苷酸或氨基酸残基匹配及相同的序列同一性百分比的对齐的任何序列比较程序。
当为了进行相似性评分而使用限定的氨基酸置换矩阵(例如,BLOSUM62)、缺口存在罚分以及缺口延伸罚分对齐两个序列,以达到该对序列可能的最高分数时,该两个序列被“最佳对齐”。氨基酸置换矩阵及其在定量该两个序列之间的相似性中的用途在本领域中是已知的,并且被描述于例如Dayhoff等人“A model of evolutionary change inproteins(蛋白质中的进化改变模型)”;“Atlas of Protein Sequence and Structure(蛋白质序列及结构的图谱)”,Vol.5,Suppl.3(M.O.Dayhoff编辑),pp.345-352;Natl.Biomed.Res.Found.,Washington,D.C.;以及Henikoff等人(1992)Proc.Natl.Acad.Sci.USA 89:10915-10919。BLOSUM62矩阵常常用作序列对齐操作流程中的默认评分置换矩阵。缺口存在罚分是针对单一氨基酸缺口在其中一个对齐序列中的引入而施加的,而缺口延伸罚分是针对被插入已经打开的缺口内的每一个额外空的氨基酸位置而施加的。对齐是由在对齐开始和结束处的每一个序列的氨基酸位置限定,并且可任选通过一个缺口或多个缺口在一个或两个序列中的插入来限定,以便达到最高可能分数。尽管可以手动完成最佳对齐和评分,但是该过程可以通过计算机实施的对齐算法(例如Altschul等人(1997)Nucleic Acids Res.25:3389-3402中描述的gapped BLAST 2.0)的使用而被促进,并且在National Center for Biotechnology Information网站(www.ncbi.nlm.nih.gov)向大众开放。可以使用例如可通过www.ncbi.nlm.nih.gov获得的和Altschul等人在(1997)Nucleic Acids Res.25:3389-3402中描述的PSI-BLAST来准备包含多重对齐的最佳对齐。
关于与参考序列最佳对齐的氨基酸序列,氨基酸残基“对应于”参考序列中在该对齐中与该残基成对的位置。“位置”由数字标示,该数字基于其相对于N端的位置依序识别该参考序列中的每一个氨基酸。归因于在确定最佳对齐时必须考虑的缺失、插入、截短、融合等,所以,一般来说,通过简单地从N端计数所确定的测试序列中的氨基酸残基数目不一定与其在该参考序列中的对应位置的数目相同。举例而言,在对齐的测试序列中存在缺失的情况中,将不存在与缺失位点处的参考序列中的位置对应的氨基酸。当在对齐的参考序列中存在插入时,该插入将不对应于该参考序列中的任何氨基酸位置。在截短或融合的情况中,参考序列或对齐序列中可存在不对应于相应序列中的任何氨基酸的氨基酸链段(stretch)。
V.抗体
还涵盖针对本发明的RGN多肽的抗体或包括该RGN多肽的核糖核蛋白的抗体,该RGN多肽或核糖核蛋白包含具有如SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117所列的氨基酸序列或其活性变体或片段的那些RGN多肽或核糖核蛋白。生成抗体的方法是在本领域中众所周知的(参见,举例而言,Harlow和Lane(1988)Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold SpringHarbor,N.Y.;以及第4,196,265号美国专利)。这些抗体可用于试剂盒中,用于RGN多肽或核糖核蛋白的检测和分离。由此,本公开内容提供了包括特定结合至本文描述的多肽或核糖核蛋白的抗体的试剂盒,该多肽或核糖核蛋白包含举例而言具有SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117的序列的多肽。
VI.用于结合所关注的靶序列的系统和核糖核蛋白复合物及其制造方法
本公开内容提供了一种用于结合所关注的靶序列的系统,其中该系统包括至少一种指导RNA或编码其的核苷酸序列以及至少一种RNA指导的核酸酶或编码其的核苷酸序列。指导RNA与所关注的靶序列杂交,并且还与RGN多肽形成复合物,从而将该RGN多肽导向至与该靶序列结合。在这些实施方案的一些实施方案中,RGN包括SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包括CRISPR重复序列,该CRISPR重复序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包括tracrRNA,该tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性变体或片段。该系统的指导RNA可以是单指导RNA或双指导RNA。在特定实施方案中,该系统包括与指导RNA异源的RNA指导的核酸酶,其中RGN与指导RNA在本质上不是天然复合的。
本文提供的用于结合所关注的靶序列的系统可以是核糖核蛋白复合物,其是与至少一种蛋白质结合的RNA的至少一个分子。本文提供的核糖核蛋白复合物包括作为RNA成分的至少一种指导RNA和作为蛋白质成分的RNA指导的核酸酶。此种核糖核蛋白复合物可从天然表达RGN多肽的细胞或生物体中纯化,并且已经被工程化,以表达对所关注的靶序列特定的具体指导RNA。作为另一种选择,该核糖核蛋白复合物可从已经用编码RGN多肽和指导RNA的多核苷酸转化且在允许RGN多肽和指导RNA表达的条件下培养的细胞或生物体中纯化。由此,提供了用于制造RGN多肽或RGN核糖核蛋白复合物的方法。此种方法包括在表达了RGN多肽(而在一些实施方案中,表达了指导RNA)的条件下,培养包括编码RGN多肽的核苷酸序列的细胞,而在一些实施方案中,培养包括编码指导RNA的核苷酸序列的细胞。然后,可从所培养的细胞的裂解物中纯化RGN多肽或RGN核糖核蛋白。
用于从生物样本的裂解物中纯化RGN多肽或RGN核糖核蛋白复合物的方法是本领域中已知的(例如,尺寸排阻层析法和/或亲和层析法、2D-PAGE、HPLC、反相层析法、免疫沉淀法)。在特定方法中,RGN多肽是重组生成的并且包括纯化标签以帮助其纯化,其包括但不限于:谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白、硫氧还蛋白(TRX)、聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、10xHis、生物素羧基载体蛋白(BCCP)以及钙调蛋白。一般而言,使用固定金属亲和层析法纯化加标签的RGN多肽或RGN核糖核蛋白复合物。应当理解,可单独地或组合地使用本领域中已知的其他类似方法,包含其他形式的层析法或举例而言免疫沉淀法。
“分离的”或“纯化的”多肽或其生物活性部分基本上或实质上不含在其天然存在的环境中发现的、正常情况下与该多肽相伴或相互作用的成分。因此,分离的或纯化的多肽当通过重组技术被生成时基本上不含其他细胞物质或培养基,或当被化学合成时基本上不含化学前体物或其他化学物质。基本上不含细胞物质的蛋白质包含具有少于约30%、20%、10%、5%或1%(以干重计)的污染蛋白质的蛋白质制剂。当重组生成本发明的蛋白质或其生物活性部分时,最佳培养基代表少于约30%、20%、10%、5%或1%(以干重计)的化学前体物或所关注的非蛋白质化学物质。
本文提供的用于结合和/或切割所关注的靶序列的具体方法涉及使用体外组装的RGN核糖核蛋白复合物。RGN核糖核蛋白复合物的体外组装可以使用本领域中已知的、在允许RGN多肽与指导RNA结合的条件下使RGN多肽与指导RNA接触的任何方法进行。如本文中使用的,“接触(contact)”、“接触(contacting)”、“接触(contacted)”是指在适合进行期望反应的条件下将期望反应的成分放在一起。RGN多肽可从生物样本、细胞裂解物或培养基中纯化,经由体外翻译生成,或被化学合成。指导RNA可从生物样本、细胞裂解物或培养基中纯化,体外被翻译,或被化学合成。可使RGN多肽和指导RNA在溶液(例如,缓冲盐水溶液)中产生接触以允许RGN核糖核蛋白复合物的体外组装。
VII.结合、切割或修饰靶序列的方法
本公开内容提供用于结合、切割和/或修饰所关注的靶核苷酸序列的方法。这些方法包含向该靶序列或包括该靶序列的细胞、细胞器或胚胎递送包括至少一种指导RNA或编码其的多核苷酸以及至少一种RGN多肽或编码其的多核苷酸的系统。在这些实施方案的一些实施方案中,RGN包括SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包括CRISPR重复序列,该CRISPR重复序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包括tracrRNA,该tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性变体或片段。该系统的指导RNA可以是单指导RNA或双指导RNA。该系统的RGN可以是无核酸酶反应的RGN,其具有切口酶活性,也可以是融合多肽。在一些实施方案中,融合多肽包括碱基编辑多肽,举例而言,胞苷脱氨酶或腺苷脱氨酶。在其他实施方案中,RGN融合蛋白包括逆转录酶。在其他实施方案中,RGN融合蛋白包括多肽,该多肽募集功能性核酸修复复合物的成员,诸如,核苷酸切除修复(NER)或转录偶联-核苷酸切除修复(TC-NER)路径的成员(Wei等人,2015,PNAS USA112(27):E3495-504;Troelstra等人,1992,Cell 71:939-953;Marnef等人,2017,J MolBiol 429(9):1277-1288),如2020年1月27日提交申请的第62/966,203号美国临时专利申请中所描述的,该美国临时专利申请的全部内容通过引用并入本文。在一些实施方案中,RGN融合蛋白包括CSB(van den Boom等人,2004,J Cell Biol 166(1):27-36;van Gool等人,1997,EMBO J 16(19):5955-65;SEQ ID NO:268列出其实例),CSB是TC-NER(核苷酸切除修复)路径的成员并且在其他成员的募集中起作用。在另外实施方案中,RGNABP融合蛋白包括CSB的活性域,诸如,包括SEQ ID NO:268的氨基酸残基356-394的CSB的酸性域(Teng等人,2018,Nat Commun 9(1):4115)。
在具体实施方案中,RGN和/或指导RNA对于RGN和/或指导RNA(或编码RGN及指导RNA中的至少其中之一的(数个)多核苷酸)被引入到的细胞、细胞器或胚胎是异源的。
在其中该方法包括递送编码指导RNA和/或RGN多肽的多核苷酸的那些实施方案中,细胞或胚胎然后可在指导RNA和/或RGN多肽被表达的条件下培养。在各种实施方案中,该方法包括使靶序列与RGN核糖核蛋白复合物接触。RGN核糖核蛋白复合物可包括无核酸酶反应或具有切口酶活性的RGN。在一些实施方案中,核糖核蛋白复合物的RGN是包括碱基编辑多肽的融合多肽。在某些实施方案中,该方法包括将RGN核糖核蛋白复合物引入包括靶序列的细胞、细胞器或胚胎内。RGN核糖核蛋白复合物可以是从生物样本中已被纯化、重组生成并随后纯化、或如本文所描述的体外组装的复合物。在其中与靶序列或细胞器或胚胎接触的RGN核糖核蛋白复合物已经体外被组装的那些实施方案中,该方法可进一步包括该复合物在与靶序列、细胞、细胞器或胚胎接触之前的体外组装。
可使用本领域中已知的、包含但不限于电穿孔的任何方法将纯化的或体外组装的RGN核糖核蛋白复合物引入细胞、细胞器或胚胎内。作为另一种选择,可使用本领域中已知的任何方法(例如,电穿孔)将编码或包括指导RNA的RGN多肽和/或多核苷酸引入细胞、细胞器或胚胎内。
在递送至靶序列或包括该靶序列的细胞、细胞器或胚胎,或与靶序列或包括该靶序列的细胞、细胞器或胚胎接触时,指导RNA以序列特定方式将该RGN导向至与靶序列结合。在其中RGN具有核酸酶活性的那些实施方案中,RGN多肽在结合后切割所关注的靶序列。靶序列随后可经由诸如非同源末端连接或用所提供的供体多核苷酸的同源定向修复的内源修复机制而被修饰。
测量RGN多肽与靶序列的结合的方法是本领域中已知的,且包含:染色质免疫沉淀测定法、凝胶迁移率变动测定法、DNA下拉测定法、报道子测定法(reporter assay)、微孔板捕获及检测测定法。同样地,测量靶序列的切割或修饰的方法是本领域中已知的,并且包含体外或体内切割测定法,其中在为了促进降解产物的检测而将适当标记(例如,放射性同位素、荧光物质)附着至靶序列的情况下或在未为了促进降解产物的检测而将适当标记(例如,放射性同位素、荧光物质)附着至靶序列的情况下,使用PCR、测序或凝胶电泳来确认切割。作为另一种选择,可使用切口触发的指数扩增反应(nicking triggered exponentialamplification reaction)(NTEXPAR)测定法(参见,例如,Zhang等人(2016)Chem.Sci.7:4951-4957)。可以使用Surveyor测定法评价体内切割(Guschin等人(2010)Methods MolBiol649:247-256)。
在一些实施方案中,该方法涉及与一个以上的指导RNA复合的单一类型的RGN的使用。该一个以上的指导RNA可靶向单一基因的不同区域,也可靶向多个基因。
在其中未提供供体多核苷酸的那些实施方案中,由RGN多肽引入的双链断裂可通过非同源末端连接(NHEJ)修复过程修复。由于NHEJ的易错性质,双链断裂的修复可导致对靶序列的修饰。如本文所使用的,关于核酸分子的“修饰”是指核酸分子的核苷酸序列的变化,其可以是一个或多个核苷酸的缺失、插入或置换或它们的组合。靶序列的修饰可导致改变的蛋白质产物的表达或编码序列的失活。
在其中存在供体多核苷酸的那些实施方案中,供体多核苷酸中的供体序列可在引入的双链断裂的修复过程期间被整合至靶核苷酸序列内或与靶核苷酸序列交换,导致外源供体序列的引入。因此,供体多核苷酸包括期望被引入所关注的靶序列内的供体序列。在一些实施方案中,供体序列改变原始靶核苷酸序列,使得新整合的供体序列将不被RGN识别和切割。供体序列的整合可通过在供体多核苷酸内包含与靶核苷酸序列侧翼的序列具有基本序列同一性的侧翼序列来增强,以允许同源导向的修复过程。在其中RGN多肽引入双链交错断裂的那些实施方案中,供体多核苷酸可包括侧翼为相容突出部的供体序列,以允许在双链断裂的修复期间通过非同源修复过程将供体序列直接连接(ligation)至包括突出部的经切割的靶核苷酸序列。
在其中该方法涉及使用为切口酶(即,仅能够切割双链多核苷酸的单链)的RGN的那些实施方案中,该方法可包括引入靶向相同的或重叠的靶序列并切割多核苷酸的不同链的两个RGN切口酶。举例而言,可以将仅切割双链多核苷酸的正(+)链的RGN切口酶与仅切割双链多核苷酸的负(-)链的第二RGN切口酶一起引入。
在各种实施方案中,提供了用于结合靶核苷酸序列并检测靶序列的方法,其中该方法包括将至少一种指导RNA或编码其的多核苷酸和至少一种RGN多肽或编码其的多核苷酸引入细胞、细胞器或胚胎中,表达该指导RNA和/或RGN多肽(如果编码序列被引入),其中RGN多肽是无核酸酶反应的RGN并且还包括可检测标记,并且该方法还包括检测该可检测标记。该可检测标记可以与RGN融合为融合蛋白(例如,荧光蛋白),也可以是与RGN多肽缀合或被引入RGN多肽内、可通过视觉或通过其他方式检测的小分子。
本文还提供了用于在靶序列的调节下调节所关注的靶序列或基因的表达的方法。该方法包括至少一种指导RNA或编码其的多核苷酸和至少一种RGN多肽或编码其的多核苷酸引入细胞、细胞器或胚胎内,表达该指导RNA和/或RGN多肽(如果编码序列被引入),其中该RGN多肽是无核酸酶反应的RGN。在这些实施方案的一些实施方案中,该无核酸酶反应的RGN是包括如本文所描述的表达调节域(即,表观遗传修饰域、转录活化域、或转录阻遏物域)的融合蛋白。
本公开内容还提供了用于结合和/或修饰所关注的靶核苷酸序列的方法。该方法包含递送系统至该靶序列或包括该靶序列的细胞、细胞器或胚胎,该系统包括至少一种指导RNA或编码其的多核苷酸以及至少一种融合多肽或编码该融合多肽的多核苷酸,该至少一种融合多肽包括本发明的RGN和碱基编辑多肽(举例而言,胞苷脱氨酶或腺苷脱氨酶)。
本领域技术人员将理解,本发明公开的任一方法可用于靶向单一靶序列或多个靶序列。由此,方法包括使用单一RGN多肽与多个不同的指导RNA组合,其可靶向单一基因和/或多个基因内的多个不同序列。本文还涵盖其中将多个不同的指导RNA与多个不同的RGN多肽组合引入的方法。这些指导RNA和指导RNA/RGN多肽系统可靶向单一基因和/或多个基因内的多个不同序列。
在一个方面中,本发明提供了含有上述方法和组合物中公开的任何一个或多个元件的试剂盒。在一些实施方案中,该试剂盒包括载体系统和使用该试剂盒的说明。在一些实施方案中,载体系统包括(a)第一调节元件,该第一调节元件与编码crRNA序列的DNA和用于在指导序列的上游插入经编码的crRNA序列的一个或多个插入位点可操作地连接,其中当表达时,该指导序列在真核细胞中将CRISPR复合物导向与靶序列序列特定结合,其中该CRISPR复合物包括与指导RNA多核苷酸复合的CRISPR酶;和/或(b)第二调节元件,该第二调节元件与酶编码序列可操作地连接,该酶编码序列编码包括核定位序列的该CRISPR酶。元件可以单独或组合地被提供,并且可以被提供在诸如小瓶、瓶子或管子的任何适合的容器中。
在一些实施方案中,试剂盒包含一种或多种语言的说明。在一些实施方案中,试剂盒包括一种或多种试剂,其在利用本文描述的一个或多个元件的过程中使用。试剂可以被提供在任何适合的容器中。举例而言,试剂盒可提供一个或多个反应或储存缓冲液。试剂可以是以可用于特定测定的形式、或者以在使用前需要添加一个或多个其他成分的形式(例如,以浓缩物或冷冻干燥形式)被提供。缓冲液可以是任何缓冲液,包含但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及它们的组合。在一些实施方案中,缓冲液是碱性的。在一些实施方案中,缓冲液具有约7至约10的pH。
在一些实施方案中,试剂盒包括与用于插入载体的指导序列对应的一个或多个寡核苷酸,以便可操作地连接该指导序列与调节元件。在一些实施方案中,试剂盒包含同源重组模板多核苷酸。在一个方面中,本发明提供了用于使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有种类繁多的功用,包含在多种细胞类型中修饰(例如,缺失、插入、易位、灭活、活化、碱基编辑)靶多核苷酸。就其本身而言,本发明的CRISPR复合物在例如基因治疗、药物筛选、疾病诊断以及预后中具有广泛的应用。示例性的CRISPR复合物包括与指导序列复合的CRISPR酶,该指导序列与靶多核苷酸内的靶序列杂交。
VIII.靶多核苷酸
在一个方面中,本发明提供了修饰真核细胞中的靶多核苷酸的方法,其可以是在体内、离体或体外。在一些实施方案中,该方法包括:从人或非人动物或植物(包含微藻类)取样细胞或细胞群;以及修饰该细胞或这些细胞。培养可以在任何阶段离体发生。甚至可以将该细胞或这些细胞重新引入该非人动物或植物(包含微藻类)中。
使用自然变异性,植物育种者将关于诸如产量、质量、均匀性、耐性以及抗害虫性的期望质量的大多数有用基因组合起来。这些期望质量还包含生长、日长度偏好、温度要求、花卉或繁殖发育的起始日期、脂肪酸含量、抗虫性、抗病性、线虫抗性、真菌抗性、除草剂抗性、对各种环境因素(包含干旱、热、湿、冷、风以及包含高盐度的不利土壤条件)的耐受性。这些有用基因的来源包含天然或外来品种、原种(heirloom variety)、野生植物近源种以及例如以诱变剂处理植物材料的诱导突变。使用本发明,向植物育种者提供诱导突变的新工具。据此,本领域技术人员可以为有用基因来源分析基因组,并且在具有期望特征或性状的品种中采用本发明以诱导有用基因的增加,同时比先前的诱变剂更精确,并且因此加速并改善植物育种计划。
RGN系统的靶多核苷酸可以是对真核细胞是内源或外源的任何多核苷酸。举例而言,靶多核苷酸可以是驻留于真核细胞的细胞核中的多核苷酸。靶多核苷酸可以是编码基因产物(例如,蛋白质)的序列或非编码序列(例如,调节多核苷酸或垃圾DNA)。不希望受理论约束,相信靶序列应与PAM(原间隔序列相邻模体)相关联;亦即,CRISPR复合物识别的短序列。PAM的精确序列和长度要求随所使用的CRISPR酶而不同,但PAM通常情况下是与原间隔序列(即,靶序列)相邻的2-5个碱基对序列。
CRISPR复合物的靶多核苷酸可包含若干疾病关联基因和多核苷酸以及信号传导生化途径关联基因和多核苷酸。靶多核苷酸的实例包含与信号传导生化途径关联的序列,例如,信号传导生化途径关联基因或多核苷酸。靶多核苷酸的实例包含疾病关联基因或多核苷酸。“疾病关联”基因或多核苷酸是指:与非疾病控制的组织或细胞相较下,在从感染疾病的组织获得的细胞中以异常水平或以异常形式产出转录或翻译产物的任何基因或多核苷酸。其可以是一种变得异常高水平表达的基因;其可以是变得异常低水平表达的基因,其中改变的表达与疾病的发生和/或进展相关。疾病关联基因还指具有(数个)突变或基因变异的基因,该突变或遗传变异是疾病病因的直接原因或与是疾病病因的基因(例如,因果突变)连锁不平衡。转录或翻译产物可以是已知的或未知的,并且还可以处于正常或异常水平。疾病关联基因和多核苷酸的实例可从在万维网上找到的约翰·霍普金斯大学(麻省巴尔的摩)(Johns Hopkins University(Baltimore,Md.))的麦库席克–内森斯遗传医学研究所(McKusick-Nathans Institute of Genetic Medicine)和美国国家医学图书馆(麻省贝西达)(National Library of Medicine(Bethesda,Md.))的国家生物技术信息中心(National Center for Biotechnology Information)找到。
尽管CRISPR系统在对于其相对容易靶向所关注的基因组序列方面特别有用,但仍然存在RGN可以做什么来解决因果突变的问题。一种方法是在RGN(优选是RGN的无活性或切口酶变体)与碱基编辑酶或碱基编辑酶(诸如,胞苷脱氨酶或腺苷脱氨酶基编辑器)的活性域之间生成融合蛋白(第9,840,699号美国专利,该美国专利通过引用并入本文)。在一些实施方案中,这些方法包括使DNA分子与:(a)包括本发明的RGN和诸如脱氨酶的碱基编辑多肽的融合蛋白;及(b)将(a)的融合蛋白靶向DNA链的靶核苷酸序列的gRNA接触;其中该DNA分子与融合蛋白及gRNA以有效量并且在适于核苷酸碱基的脱氨基化的条件下接触。在一些实施方案中,靶DNA序列包括与疾病或病症关联的序列,并且其中核苷酸碱基的脱氨基化得到与疾病或病症无关的序列。在一些实施方案中,靶DNA序列驻留于农作物的等位基因中,其中所关注的性状的特定等位基因导致具有较低农艺价值的植物。核苷酸碱基的脱氨基化导致改善了性状并增加了植物的农艺价值的等位基因。
在一些实施方案中,DNA序列包括与疾病或病症关联的T→C或A→G点突变,并且其中突变体C或G碱基的脱氨基化导致与疾病或病症不关联的序列。在一些实施方案中,脱氨基化修正与疾病或病症关联的序列中的点突变。
在一些实施方案中,与疾病或病症关联的序列编码了蛋白质,并且其中脱氨基化将终止密码子引入与疾病或病症关联的序列中,导致编码蛋白质的截短。在一些实施方案中,该接触在易患有、患有或诊断患有该疾病或病症的受治疗者体内进行。在一些实施方案中,该疾病或病症是与基因组中的点突变或单碱基突变关联的疾病。在一些实施方案中,该疾病是基因疾病、癌症、代谢疾病或溶酶体贮积病。
使用碱基编辑修饰因果突变
可以使用依赖于本发明的RGN-碱基编辑器融合蛋白的方法修正的基因遗传性疾病的实例是赫尔勒综合征。赫尔勒综合征也称为MPS-1,是α-L-艾杜糖醛酸酶(IDUA)缺乏而导致在分子水平上由溶酶体中硫酸乙酰肝素和硫酸皮肤素的累积表征的溶酶体贮积病的结果。此疾病一般而言是由编码α-L-艾杜糖醛酸酶的IDUA基因突变引起的遗传性基因病症。常见的IDUA突变是W402X和Q70X,两者都是无义突变,导致翻译过早终止。通过精确的基因组编辑(PGE)方法很好地解决了这种突变,因为单核苷酸的回复突变(举例而言,通过碱基编辑方法)将恢复野生型编码序列并导致由基因座内源调节机制控制的蛋白质表达。另外,因为已知杂合子是无症状的,所以靶向这些突变中的一个突变的PGE疗法对于大部分患有此疾病的患者是有用的,因只有突变的等位基因中的一个需被修正(Bunge等人(1994)Hum.Mol.Genet.3(6):861-866,通过引用并入本文)。
目前对赫尔勒综合征的治疗包含酶替代疗法以及骨髓移植(Vellodi等人(1997)Arch.Dis.Child.76(2):92-99;Peters等人(1998)Blood 91(7):2601-2608,通过引用并入本文)。尽管酶替代疗法对赫尔勒综合征患者的生存和生活质量具有显著影响,但这种方法需要昂贵且耗时的每周灌注。额外方法包含在表达载体上递送IDUA基因或将该基因插入高度表达的基因座内,诸如,血清白蛋白基因座内(第9,956,247号美国专利,通过引用并入本文)。然而,这些方法不能将原始IDUA基因座恢复到正确的编码序列。基因组编辑策略具有许多优点,最显著的是基因表达的调节将受健康个体中存在的天然机制的控制。另外,使用碱基编辑不一定引起双链DNA断裂,这可能通过破坏肿瘤抑制机制来导致大规模染色体重排、细胞死亡或致癌性。一般策略的目标可以是使用本发明的RGN碱基编辑器融合蛋白来靶向并修正人基因组中的某些引起疾病的突变。应理解,也可以进行类似方法来靶向通过碱基编辑可修正的疾病。还还应理解,也可以使用本发明的RGN来部署用于靶向其他物种(特别是一般家庭宠物或家畜)中引起疾病的突变的类似方法。常见家庭宠物和家畜包含狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、以及包含鲑鱼的鱼和虾。
通过靶向缺失修饰因果突变
本发明的RGN在因果突变更复杂的人医疗方法中也有用。举例而言,诸如弗里德赖希氏共济失调和亨廷顿氏舞蹈症的一些疾病是基因特定区域处的三个核苷酸模体的重复显著增加的结果,这会影响表达蛋白起作用或被表达的能力。弗里德赖希氏共济失调(FRDA)是一种导致脊髓神经组织进行性退化的常染色体隐性疾病。线粒体中共济(frataxin,FXN)蛋白质的降低水平导致细胞水平的氧化损伤和铁缺乏。降低的FXN表达与体细胞和种系FXN基因的内含子1内的GAA三联体扩增有关。在FRDA患者中,GAA重复往往由超过70个,有时甚至超过1000个(最常见的是600-900个)三联体组成,而未受影响的个体具有约40个或更少的重复(Pandolfo等人(2012)Handbook of Clinical Neurology 103:275-294;Campuzano等人(1996)Science271:1423-1427;Pandolfo(2002)Adv.Exp.Med.Biol.516:99-118;全部通过引用并入本文)。
引起弗里德赖希氏共济失调(FRDA)的三核苷酸重复序列的扩增发生在FXN基因内的限定的基因座中,所限定的基因座被称为FRDA不稳定区域。RNA指导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定区域。此方法需要1)RGN和指导RNA序列,该RGN和指导RNA序列可以被程序化,以靶向人基因组中的等位基因;以及2)RGN和指导序列的递送方法。特别是当除了功能性表达盒所需的其他基因元件之外,还要考虑到SpCas9基因和指导RNA的长度时,用于基因组编辑的许多核酸酶(诸如,来自化脓性葡萄球菌(S.pyogenes)(SpyCas9)的常用Cas9核酸酶)太大而无法包装到腺相关病毒(AAV)载体中。这使得使用SpCas9的方法更加困难。
本发明的某些RNA指导核酸酶非常适合与指导RNA一起被包装到AAV载体内。包装两个指导RNA可能需要第二个载体,但这种方法与诸如SpCas9的较大核酸酶所需要的相较仍然是有利的,这可能需要在两个载体之间分裂蛋白质序列。本发明涵盖使用本发明的RGN的策略,其中移除了基因组不稳定区域。这种策略适用于具有类似基因基础的其他疾病和病症,诸如亨廷顿氏舞蹈症。使用本发明的RGN的类似策略还可适用于具有农艺或经济重要性的非人动物(包含:狗、猫、马、猪、牛、羊、鸡、驴、蛇、雪貂、以及包含鲑鱼的鱼和虾)中的类似疾病和病症。
通过靶向诱变修饰因果突变
本发明的RGN也可以引入可以得到有益结果的破坏性突变。编码血红蛋白(特别是β球蛋白链(HBB基因))的基因中的基因缺陷可能是许多称为血红蛋白病变的疾病(包含镰状细胞贫血症和地中海贫血症)的原因。
在成年人中,血红蛋白是包括两个α样球蛋白链和两个β样球蛋白链以及4个血红素(heme)基团的异四聚体。在成人中,α2β2四聚体被称为血红蛋白A(HbA)或成人血红蛋白。通常情况下,α和β球蛋白链以约1:1的比例合成,并且此比例就血红蛋白和红血球(RBC)稳定而言似乎是关键的。在发育中的胎儿中,生成了不同形式的血红蛋白(胎儿血红蛋白(HbF)),其对氧的结合亲和力高于血红蛋白A,使得氧可经由母亲的血流递送到婴儿的系统。胎儿血红蛋白也含有两个α球蛋白链,但是代替成人β-球蛋白链,其具有两个胎儿γ-球蛋白链(即,胎儿血红蛋白是α2γ2)。从γ-球蛋白的生成转换到β-球蛋白的生成的调节相当复杂,且主要涉及γ球蛋白转录的下调和β球蛋白转录的同时上调。在妊娠约30周时,胎儿中γ球蛋白的合成开始下降,而β球蛋白的生成增加。到大约10个月龄时,新生儿的血红蛋白几乎都是α2β2,但是一些HbF持续到成年期(约为总血红蛋白的1-3%)。在大多数具有血红蛋白病变的患者中,编码γ球蛋白的基因仍然存在,但因如上所述在靠近分娩时发生正常的基因抑制,表达相对较低。
镰状细胞疾病是由β球蛋白基因(HBB)中的V6E突变(DNA水平的GAG至GTG)引起的,其中所得的血红蛋白被称为“血红蛋白S”或“HbS”。在低氧条件下,HbS分子聚集并形成纤维状沉淀物。这些聚集物使得红血球异常或“镰状化”,导致细胞的灵活性丧失。镰状化红血球不再能够挤入微血管床,并且可能导致镰状细胞患者的血管阻塞性危症。除此之外,镰状化红血球比正常红血球更脆弱,并倾向于溶血,最终导致患者贫血。
镰状细胞患者的治疗和管理是终生的课题,涉及抗生素治疗、疼痛管理以及急性发作期间的输血。一种方法是使用羟基脲,其部分地通过增加γ球蛋白的生成来发挥其效用。然而,长期羟基脲疗法的长期副作用仍然是未知的,并且治疗给予了不想要的副作用并且可能在患者之间具有不同的疗效。尽管镰状细胞治疗的疗效有所提高,但患者的预期寿命仍然只在40至60岁(50’s)的中到后期,并且关联的疾病发病率对患者的生活质量具有深远的影响。
地中海贫血症(α地中海贫血症和β地中海贫血症)也是与血红蛋白有关的疾病,并且通常情况下涉及减少的球蛋白链表达。这可以通过基因调节区域的突变或从导致表达降低或降低水平的球蛋白编码序列中的或功能性球蛋白中的突变发生。地中海贫血症的治疗通常涉及输血和铁螯合疗法。如果适当的供体可被鉴别,则骨髓移植也用于治疗有严重地中海贫血症的人,但这种做法可能具有重大风险。
已经提出用于治疗SCD和β地中海贫血症的一种方法是增加γ球蛋白的表达,使得HbF在功能上取代异常的成人血红蛋白。如上所提及,用羟基脲治疗SCD患者由于其对增加γ球蛋白表达上的影响而被认为是部分成功的(DeSimone(1982)Proc Nat'l Acad SciUSA 79(14):4428-31;Ley等人(1982)N.Engl.J.Medicine,307:1469-1475;Ley等人(1983)Blood 62:370-380;Constantoulakis等人(1988)Blood72(6):1961-1967,均通过引用并入本文)。增加HbF的表达涉及鉴定其产物在γ球蛋白表达的调节中起功用的基因。一种这样的基因是BCL11A。BCL11A编码在成体红血球前体细胞中表达的锌指蛋白,并且其表达的下调导致γ球蛋白表达增加(Sankaran等人(2008)Science 322:1839,通过引用并入本文)。已经提出使用靶向BCL11A基因的抑制性RNA(例如,第2011/0182867号美国专利公开,通过引用并入本文),但是此技术具有几个潜在的缺点,包含可能无法实现完全敲减,这种RNA的递送可能是有问题的,并且RNA必须连续存在且终生需要多次治疗。
本发明的RGN可用于靶向BCL11A增强子区域,以破坏BCL11A的表达,从而增加γ球蛋白表达。这种靶向破坏可通过非同源末端连接(NHEJ)来实现,因此本发明的RGN靶向BCL11A增强子区域内的特定序列,造成双链断裂,并且细胞的机制修复该断裂,通常情况下同时引入有害突变。类似于针对其他疾病靶所描述的,本发明的RGN因其相对小的尺寸使得能够将RGN及其指导RNA的表达盒包装至用于体内递送的单一AAV载体中从而具有优于其他已知RGN的优点。使用本发明的RGN的类似策略也可适用于人和具有农艺或经济重要性的非人动物中的类似疾病和病症。
IX.包括多核苷酸基因修饰后细胞
本文提供了包括已经使用通过如本文所描述的RGN、crRNA和/或tracrRNA介导的过程修饰的所关注的靶序列的细胞和生物体。在这些实施方案的一些实施方案中,RGN包括SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117、137或235的氨基酸序列或其活性变体或片段。在各种实施方案中,指导RNA包括CRISPR重复序列,该CRISPR重复序列包括SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118、240、273或287的核苷酸序列或其活性变体或片段。在特定实施方案中,指导RNA包括tracrRNA,tracrRNA包括SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119、241、274或286的核苷酸序列或其活性变体或片段。系统的指导RNA可以是单指导RNA或双指导RNA。
修饰后细胞可以是真核细胞(例如,哺乳动物、植物、昆虫细胞)或原核细胞。还提供了包括至少一种核苷酸序列的细胞器和胚胎,该核苷酸序列已经通过利用如本文所描述的RGN、crRNA和/或tracrRNA的过程进行了修饰。基因修饰后细胞、生物体、细胞器以及胚胎对于经修饰后核苷酸序列可以是杂合的或纯合的。
细胞、生物体、细胞器或胚胎的染色体修饰可导致改变的表达(上调或下调)、失活、或改变的蛋白质产物或整合的序列的表达。在其中染色体修饰导致基因失活或非功能性蛋白质产物表达的那些情形中,基因修饰后细胞、生物体、细胞器或胚胎被称为“敲除”。敲除表型可以是缺失突变(即,至少一个核苷酸的缺失)、插入突变(即,至少一个核苷酸的插入)或无义突变(即,至少一个核苷酸的置换,使得终止密码子被引入)的结果。
作为另一种选择,细胞、生物体、细胞器或胚胎的染色体修饰可生成“敲入”,“敲入”由编码蛋白质的核苷酸序列的染色体整合导致。在这些实施方案的一些实施方案中,编码序列被整合到染色体内,从而使得编码野生型蛋白质的染色体序列被失活,但表达出外源引入的蛋白质。
在其他实施方案中,染色体修饰导致变体蛋白质产物的生成。表达的变体蛋白质产物可具有至少一个氨基酸置换和/或至少一个氨基酸的添加或缺失。当与野生型蛋白质相较时,由改变的染色体序列编码的变体蛋白质产物可呈现出修饰后的特征或活性,包含但不限于改变的酶活性或底物特定性。
在又一些其他实施方案中,染色体修饰可导致改变的蛋白质表达模式。作为非限制性实例,控制蛋白质产物表达的调节区域中的染色体改变可导致蛋白质产物或改变的组织或时间表达模式的过表达或下调。
X.用于检测靶DNA或单链DNA的试剂盒和方法
一些RGN(例如,如SEQ ID NO:54和137所示的APG09106.1和APG09748)一旦通过靶DNA的缺失而被活化则可混杂地切割非靶向的单链DNA(ssDNA)。由此,本文提供了用于在样本中检测靶DNA(双链或单链)的组合物和方法。在一些实施方案中,期望靶可作为RNA(诸如,举例而言诸如冠状病毒的RNA病毒的基因组或基因组的部分)存在。在一些实施方案中,冠状病毒可以是SARS类冠状病毒。在进一步的实施方案中,冠状病毒可以是SARS-CoV-2、SARS-CoV或诸如bat-SL-CoVZC45(登录号:MG772933)的蝙蝠SARS类冠状病毒。在靶作为RNA存在的实施方案中,靶可被反转录为可通过RGN有效靶向的DNA分子。反转录后面可以是诸如本领域中已知的涉及热循环的RT-PCR方法的扩增反应步骤,后面也可以是诸如RT-AMP(反转录环介导等温扩增反应)的等温方法(Notomi等人Nucleic Acids Res 28:E63,(2000))。
这些组合物和方法涉及不与指导RNA杂交且是非靶ssDNA的检测器ssDNA的使用。在一些实施方案中,检测器ssDNA包括可检测标记,该可检测标记在切割检测器ssDNA后提供可检测信号。非限制性实例是包括荧光团/猝灭剂对的检测器ssDNA,其中荧光团当检测器ssDNA是完整的(即,未被切割)时因其信号通过紧密相邻的猝灭剂的存在被抑制而不发荧光。检测器ssDNA的切割导致猝灭剂的移除,且然后荧光标记可被检测到。荧光标记或荧光染料的非限制性实例包含Cy5、荧光素(例如,FAM、6FAM、5(6)FAM、FITC)、Cy3、Alexa染料以及得克萨斯红。猝灭剂的非限制性实例包含IowaIowaQx1猝灭剂、ATT0猝灭剂以及QSY染料。在一些实施方案中,检测器ssDNA包括第二猝灭剂,诸如,比如ZENTM、TAOTM以及黑洞猝灭剂(Black Hole)的内部猝灭剂,其可降低背景而增加信号检测。
在其他实施方案中,检测器ssDNA包括可检测标记,该可检测标记在切割检测器ssDNA之前提供可检测信号,而ssDNA的切割抑制或防止该信号的检测。这种情况的非限制性实例是包括荧光共振能量转移(FRET)对的检测器ssDNA。FRET是能量从第一(供体)荧光团的激发态到紧密相邻的第二(受体)荧光团发生的无辐射转移。供体荧光团的发射光谱与受体荧光团的激发光谱重叠。由此,当检测器ssDNA是完整的(即,未被切割)时,受体荧光团将发荧光,而当检测器ssDNA被切割时,因为供体荧光团和受体荧光团不再彼此紧密相邻,所以受体荧光团不再发荧光。FRET供体荧光团和受体荧光团在本领域中是已知的,且包含但不限于青色荧光蛋白(CFP)/绿色荧光蛋白(GFP)、Cy3/Cy5以及GFP/黄色荧光蛋白(YFP)。
在一些实施方案中,检测器ssDNA具有的长度为约2个核苷酸至约30个核苷酸,包含但不限于:约2、约3、约4、约5、约6、约7、约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约21、约22、约23、约24、约25个核苷酸、约26个核苷酸、约27个核苷酸、约28个核苷酸、约29个核苷酸以及约30个核苷酸。
检测DNA分子的靶DNA的方法包括使样本与RGN、能够与RGN和DNA分子中的靶DNA序列杂交的指导RNA以及不与指导RNA杂交的检测器单链DNA(ssDNA)接触,然后,测量由RGN切割ssDNA的生成的可检测信号,从而检测DNA分子的靶DNA序列。在一些实施方案中,在RGN和指导RNA的接触之前或接触的同时,该方法可包括样本中的核酸分子的扩增反应步骤。在这些实施方案的一些实施方案中,可使指导RNA将与其杂交的特定序列扩增反应,以增加检测方法的灵敏度。
其中使用包括检测器ssDNA这些组合物和方法可检测靶DNA的样本包含了包括或相信包括核酸的任何样本(例如,DNA或RNA分子)。样本可从包含纯化核酸的合成组合或诸如呼吸拭子(例如,鼻咽拭子)提取物、细胞裂解物、患者样本、细胞、组织、唾液、血液、血清、血浆、尿液、抽吸物、活检样本、脑脊液或生物体(例如,细菌、病毒)的生物样本的任何来源衍生。
使样本与RGN、指导RNA和检测器ssDNA接触可包含体外、离体或体内接触。在一些实施方案中,检测器ssDNA和/或RGN和/或指导RNA被固定于(举例而言)横向流动装置上,其中样本接触固定检测器ssDNA和/或RGN和/或指导RNA。在一些实施方案中,针对检测器ssDNA上的抗原部分的抗体以从完整检测器ssDNA分化经切割的检测器ssDNA的方式被固定于(举例而言)横向流动装置上。
在一些实施方案中,该方法还可包括决定样本中存在的靶DNA的量。可将测试样本中的可检测信号的测量值与参考测量值(例如,参考样本的或其包括已知量的靶DNA的系列参考样本的测量值)进行比较。
组合物和方法的应用的非限制性实例包含单核苷酸多态性(SNP)检测、癌症筛查、细菌感染的检测、抗生素抗性的检测以及病毒感染的检测。
使用本领域已知的任何适合方法可测量通过RGN切割ssDNA生成的可检测信号,该方法包含但不限于测量荧光信号、凝胶上条带的视觉分析、比色变化以及存在或不存在电信号。
本发明提供了用于检测样本中的DNA分子的靶DNA的试剂盒,其中该试剂盒包括:RGN多肽、能够与RGN和DNA分子中的靶DNA序列杂交的指导RNA以及不与指导RNA杂交的检测器ssDNA。
本发明还提供了通过接触核酸群切割单链DNA的方法,其中该群包括DNA分子的靶DNA序列和多个非靶ssDNA,该非靶ssDNA具有RGN和能够与该RGN和靶DNA序列杂交的指导RNA。
冠词“a”和“an”在本文中用于指该冠词的一个或一个以上(即,至少一个)的语法对象。举例来说,“一个多肽”是指一个或多个多肽。
本说明书中提及的所有出版物和专利申请表示本公开内容所属领域中技术人员的水平。所有出版物和专利申请通过引用并入本文,如同每个单独的出版物或专利申请被特定且单独地表示以通过引用而被并入。
尽管为了清楚理解的目的已经由说明和实例某种程度上详细描述了前述发明,但显然可以在所附实施方案的范围内进行某些改变和修改。
非限制性实施方案包括:
1.一种核酸分子,包括编码RNA指导的核酸酶(RGN)多肽的多核苷酸,其中该多核苷酸包括编码RGN多肽的核苷酸序列,该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列;
其中,当与能够与靶DNA序列杂交的指导RNA(gRNA)结合时,该RGN多肽能够以RNA指导的序列特定方式结合DNA分子的该靶DNA序列,以及
其中编码RGN多肽的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
2.如实施方案1的核酸分子,其中该RGN多肽在结合时能够切割该靶DNA序列。
3.如实施方案2的核酸分子,其中该RGN多肽能够产生双链断裂。
4.如实施方案2的核酸分子,其中该RGN多肽能够产生单链断裂。
5.如实施方案2的核酸分子,其中该RGN多肽是无核酸酶活性的。
6.如实施方案1-5中任一实施方案的核酸分子,其中该RGN多肽与碱基编辑多肽可操作地融合。
7.如实施方案6的核酸分子,其中该碱基编辑多肽是脱氨酶。
8.如实施方案7的核酸分子,其中该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
9.如实施方案1-8中任一实施方案的核酸分子,其中该RGN多肽包括一个或多个核定位信号。
10.如实施方案1-9中任一实施方案的核酸分子,其中该RGN多肽被密码子优化以用于在真核细胞中的表达。
11.如实施方案1-10中任一实施方案的核酸分子,其中该靶DNA序列位于与原间隔序列相邻模体(PAM)相邻的位置。
12.一种包括实施方案1-11中任一实施方案的核酸分子的载体。
13.如实施方案12的载体,还包括编码能够与该靶DNA序列杂交的该gRNA的至少一个核苷酸序列。
14.如实施方案13的载体,其中该指导RNA包括CRISPR RNA,该CRISPR RNA包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的CRISPR重复序列。
15.如实施方案13或14的载体,其中该gRNA包括tracrRNA。
16.如实施方案15的载体,其中该tracrRNA具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列同一性。
17.如实施方案15或16的载体,其中该gRNA是单指导RNA。
18.如实施方案15或16的载体,其中该gRNA是双指导RNA。
19.一种细胞,包括实施方案1-11中任一实施方案的该核酸分子或实施方案12-18中任一实施方案的该载体。
20.一种用于制造RGN多肽的方法,该方法包括在其中该RGN多肽被表达的条件下培养实施方案18的该细胞。
21.一种用于制造RGN多肽的方法,该方法包括将异源核酸分子引入细胞内,该异源核酸分子包括编码RNA指导的核酸酶(RGN)多肽的核苷酸序列,该RGN多肽包括具有与SEQID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列;
其中,当与能够与靶DNA序列杂交的指导RNA(gRNA)结合时,该RGN多肽能够以RNA指导的序列特定方式结合DNA分子的该靶DNA序列,
并且在其中该RGN多肽被表达的条件下,培养该细胞。
22.如实施方案20或21的方法,还包括纯化该RGN多肽。
23.如实施方案20或21的方法,其中该细胞进一步表达一个或多个指导RNA,该一个或多个指导RNA结合至该RGN多肽,以形成RGN核糖核蛋白复合物。
24.如实施方案23的方法,还包括纯化该RGN核糖核蛋白复合物。
25.一种包括编码CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中该crRNA包括间隔序列和CRISPR重复序列,其中该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列;
其中,指导RNA包括:
a)该crRNA;以及任选地
b)能够与该crRNA的该CRISPR重复序列杂交的反式活化的CRISPR RNA(tracrRNA);
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA能够通过该crRNA的间隔序列以序列特定方式与DNA分子的靶DNA序列杂交,并且
其中编码crRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
26.一种包括实施方案25的核酸分子的载体。
27.如实施方案26的载体,其中该载体还包括编码该tracrRNA的多核苷酸。
28.如实施方案27的载体,其中该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列同一性的核苷酸序列。
29.如实施方案27或28的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与相同启动子可操作地连接,并且被编码为单指导RNA。
30.如实施方案27或28的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与分开的启动子可操作地连接。
31.如实施方案26-30中任一实施方案的载体,其中该载体还包括编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列。
32.一种包括编码反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该tracrRNA;以及
b)包括间隔序列和CRISPR重复序列的crRNA,其中该tracrRNA能够与该crRNA的该CRISPR重复序列杂交;
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA能够通过该crRNA的间隔序列以序列特定方式与DNA分子的靶DNA序列杂交;并且
其中编码tracrRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
33.一种包括实施方案32的核酸分子的载体。
34.如实施方案33的载体,其中该载体还包括编码该crRNA的多核苷酸。
35.如实施方案34的载体,其中该crRNA的CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列。
36.如实施方案34或35的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与相同启动子可操作地连接,并被编码为单指导RNA。
37.如实施方案34或35的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与分开的启动子可操作地连接。
38.如实施方案33-37中任一实施方案的载体,其中该载体还包括编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列。
39.一种用于结合DNA分子的靶DNA序列的系统,该系统包括:
a)能够与该靶DNA序列杂交的一个或多个指导RNA或包括编码该该一个或多个指导RNA(gRNA)的核苷酸序列的一个或多个多核苷酸;以及
b)RNA指导的核酸酶(RGN)多肽或包括编码该RGN多肽的核苷酸序列的多核苷酸,该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列;
其中编码该一个或多个指导RNA及编码该RGN多肽的该核苷酸序列中的每一个可操作地连接至与该核苷酸序列异源的启动子;以及
其中该一个或多个指导RNA能够与该RGN多肽形成复合物,从而将该RGN多肽导向至与该DNA分子的该靶DNA序列结合。
40.如实施方案39的系统,其中该gRNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列。
41.如实施方案39或40的系统,其中该gRNA包括tracrRNA。
42.如实施方案41的系统,其中该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列同一性的核苷酸序列。
43.如实施方案41或42的系统,其中该gRNA是单指导RNA(sgRNA)。
44.如实施方案41或42的系统,其中该gRNA是双指导RNA。
45.如实施方案39-44中任一实施方案的系统,其中该靶DNA序列位于与原间隔序列相邻模体(PAM)相邻的位置。
46.如实施方案39-45中任一实施方案的系统,其中该靶DNA序列是在细胞内。
47.如实施方案46的系统,其中该细胞是真核细胞。
48.如实施方案47的系统,其中该真核细胞是植物细胞。
49.如实施方案47的系统,其中该真核细胞是哺乳动物细胞。
50.如实施方案47的系统,其中该真核细胞是昆虫细胞。
51.如实施方案46的系统,其中该细胞是原核细胞。
52.如实施方案39-51中任一实施方案所述的系统,其中,当被转录时,该一个或多个指导RNA能够与该靶DNA序列杂交,并且该指导RNA能够与该RGN多肽形成复合物,从而导向该靶DNA序列的切割。
53.如实施方案52的系统,其中该RGN多肽能够产生双链断裂。
54.如实施方案52的系统,其中该RGN多肽能够产生单链断裂。
55.如实施方案52的系统,其中该RGN多肽是无核酸酶活性的。
56.如实施方案39-55中任一实施方案的系统,其中该RGN多肽可操作地连接至碱基编辑多肽。
57.如实施方案56的系统,其中该碱基编辑多肽是脱氨酶。
58.如实施方案57的系统,其中该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
59.如实施方案39-58中任一实施方案的系统,其中该RGN多肽包括一个或多个核定位信号。
60.如实施方案39-59中任一实施方案的系统,其中该RGN多肽被密码子优化以用于在真核细胞中的表达。
61.如实施方案39-60中任一实施方案的系统,其中包括编码该一个或多个指导RNA的核苷酸序列的多核苷酸和包括编码RGN多肽的该核苷酸序列的多核苷酸位于一个载体上。
62.如实施方案39-61中任一实施方案的系统,其中该系统还包括一个或多个供体多核苷酸或编码该一个或多个供体多核苷酸的一个或多个核苷酸序列。
63.一种用于结合DNA分子的靶DNA序列的方法,包括将如实施方案39-62中任一实施方案的系统递送至该靶DNA序列或包括该靶DNA序列的细胞。
64.如实施方案63的方法,其中该RGN多肽或该指导RNA还包括可检测标记,从而允许该靶DNA序列的检测。
65.如实施方案63的方法,其中该指导RNA或该RGN多肽还包括表达调节子,从而调节该靶DNA序列的表达或在该靶DNA序列的转录控制下的基因的表达。
66.一种用于切割或修饰DNA分子的靶DNA序列的方法,包括将如实施方案39-62中任一实施方案的系统递送至该靶DNA序列或包括该DNA分子的细胞,并且发生该靶DNA序列的切割或修饰。
67.如实施方案66的方法,其中该修饰后靶DNA序列包括异源DNA插入该靶DNA序列内。
68.如实施方案66的方法,其中该修饰后靶DNA序列包括从该靶DNA序列缺失至少一个核苷酸。
69.如实施方案66的方法,其中该修饰后靶DNA序列包括该靶DNA序列中至少一个核苷酸的突变。
70.一种用于结合DNA分子的靶DNA序列的方法,该方法包括:
a)在适于形成RGN核糖核苷酸复合物的条件下,通过组合下列,以体外组装该RNA指导的核酸酶(RGN)核糖核苷酸复合物:
i)能够与该靶DNA序列杂交的一个或多个指导RNA;以及
ii)RGN多肽,包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列;以及
b)使该靶DNA序列或包括该靶DNA序列的细胞与该体外组装的RGN核糖核苷酸复合物接触;
其中该一个或多个指导RNA与该靶DNA序列杂交,从而将该RGN多肽导向至与该靶DNA序列结合。
71.如实施方案70的方法,其中该RGN多肽或该指导RNA还包括可检测标记,从而允许该靶DNA序列的检测。
72.如实施方案70的方法,其中该指导RNA或该RGN多肽还包括表达调节子,从而允许该靶DNA序列的表达的调节。
73.一种用于切割和/或修饰DNA分子的靶DNA序列的方法,包括使该DNA分子与下列接触:
a)RNA指导的核酸酶(RGN)多肽,其中该RGN包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸;以及
b)能够将(a)的RGN靶向该靶DNA序列的一个或多个指导RNA;
其中该一个或多个指导RNA与该靶DNA序列杂交,从而将该RGN多肽导向至与该靶DNA序列结合,并且发生该靶DNA序列的切割和/或修饰。
74.如实施方案73的方法,其中由该RGN多肽进行的切割产生了双链断裂。
75.如实施方案73的方法,其中由该RGN多肽进行的切割产生了单链断裂。
76.如实施方案73的方法,其中该RGN多肽是无核酸酶活性的。
77.如实施方案73-76中任一实施方案的方法,其中该RGN多肽可操作地连接至碱基编辑多肽。
78.如实施方案77的方法,其中该碱基编辑多肽包括脱氨酶。
79.如实施方案78的方法,其中该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
80.如实施方案73-79中任一实施方案的方法,其中该修饰后靶DNA序列包括异源DNA插入该靶DNA序列内。
81.如实施方案73-79中任一实施方案的方法,其中该修饰后靶DNA序列包括从该靶DNA序列中缺失至少一个核苷酸。
82.如实施方案73-79中任一实施方案的方法,其中该修饰后靶DNA序列包括该靶DNA序列中至少一个核苷酸的突变。
83.如实施方案70-82中任一实施方案的方法,其中该gRNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列。
84.如实施方案70-83中任一实施方案的方法,其中该gRNA包括tracrRNA。
85.如实施方案84的方法,其中该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列同一性的核苷酸序列。
86.如实施方案84或85的方法,其中该gRNA是单指导RNA(sgRNA)。
87.如实施方案84或85的方法,其中该gRNA是双指导RNA。
88.如实施方案63-87中任一实施方案的方法,其中该靶DNA序列位于与原间隔序列相邻模体(PAM)相邻的位置。
89.如实施方案63-88中任一实施方案的方法,其中该靶DNA序列是在细胞内。
90.如实施方案89的方法,其中该细胞是真核细胞。
91.如实施方案90的方法,其中该真核细胞是植物细胞。
92.如实施方案90的方法,其中该真核细胞是哺乳动物细胞。
93.如实施方案90的方法,其中该真核细胞是昆虫细胞。
94.如实施方案89的方法,其中该细胞是原核细胞。
95.如实施方案89-94中任一实施方案的方法,还包括在其中该RGN多肽被表达且切割该靶DNA序列以生成包括修饰后DNA序列的DNA分子的条件下培养该细胞;以及选择包括该修饰后靶DNA序列的细胞。
96.一种细胞,包括如实施方案95的方法的修饰后靶DNA序列。
97.如实施方案96的细胞,其中该细胞是真核细胞。
98.如实施方案97的方法,其中该真核细胞是植物细胞。
99.一种植物,包括如实施方案98的细胞。
100.一种种子,包括实施方案98的细胞。
101.如实施方案97的细胞,其中该真核细胞是哺乳动物细胞。
102.如实施方案98的细胞,其中该真核细胞是昆虫细胞。
103.如实施方案96的细胞,其中该细胞是原核细胞。
104.一种利用针对基因遗传性疾病的因果突变的修正来生成基因修饰细胞的方法,该方法包括将下列引入该细胞内:
a)RNA指导的核酸酶(RGN)多肽或编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列,其中编码该RGN多肽的该多核苷酸与启动子可操作地连接,使得该RGN多肽能够在该细胞中表达;以及
b)指导RNA(gRNA)或编码该gRNA的多核苷酸,其中该gRNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列,其中编码该gRNA的该多核苷酸与启动子可操作地连接,使得该gRNA能够在该细胞中表达,
从而该RGN和gRNA靶向该因果突变的该基因组位置并修饰该基因组序列以除去该因果突变。
105.如实施方案104的方法,其中该RGN与碱基编辑多肽可操作地连接。
106.如实施方案105的方法,其中该碱基编辑多肽是脱氨酶。
107.如实施方案106的方法,其中该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
108.如实施方案104-107中任一实施方案的方法,其中该细胞是动物细胞。
109.如实施方案104-107中任一实施方案的方法,其中该细胞是哺乳动物细胞。
110.如实施方案108的方法,其中该细胞是从狗、猫、小鼠、大鼠、兔、马、牛、猪或人取得的。
111.如实施方案108的方法,其中该基因遗传性疾病是单核苷酸多态性引起的。
112.如实施方案111的方法,其中该基因遗传性疾病是赫尔勒综合征。
113.如实施方案112的方法,其中该gRNA还包括靶向靠近该因果单核苷酸多态性的区域的间隔序列。
114.一种利用针对引起疾病的不稳定基因组区域中的缺失来生成基因修饰细胞的方法,该方法包括将下列引入该细胞内:
a)RNA指导的核酸酶(RGN)多肽或编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列,其中编码该RGN多肽的该多核苷酸与启动子可操作地连接,使得该RGN多肽能够在该细胞中表达;以及
b)指导RNA(gRNA)或编码该gRNA的多核苷酸,其中该gRNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列,其中编码该gRNA的该多核苷酸与启动子可操作地连接,使得该gRNA能够在该细胞中表达,并且进一步地其中该gRNA包括靶向该不稳定基因组区域的5'侧翼的间隔序列;以及
c)第二指导RNA(gRNA)或编码该gRNA的多核苷酸,其中该gRNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列,其中编码该gRNA的该多核苷酸与启动子可操作地连接,使得该第二gRNA能够在该细胞中表达,并且进一步地其中该第二gRNA包括靶向该不稳定基因组区域的3'侧翼的间隔序列;
从而该RGN和该两个gRNA靶向该不稳定基因组区域,并且该不稳定基因组区域的至少一部分被除去。
115.如实施方案114的方法,其中该细胞是动物细胞。
116.如实施方案114的方法,其中该细胞是哺乳动物细胞。
117.如实施方案115的方法,其中该细胞是从狗、猫、小鼠、大鼠、兔、马、牛、猪或人取得的。
118.如实施方案115的方法,其中该基因遗传性疾病是弗里德赖希氏共济失调或亨汀顿氏舞蹈症。
119.如实施方案118的方法,其中该第一gRNA还包括靶向该不稳定基因组区域内的或靠近该不稳定基因组区域的区域的间隔序列。
120.如实施方案118的方法,其中该第二gRNA还包括靶向该不稳定基因组区域内的或靠近该不稳定基因组区域的区域的间隔序列。
121.一种用于生成具有降低的BCL11A mRNA和蛋白质表达的基因修饰后哺乳动物造血祖细胞的方法,该方法包括将下列引入分离的人造血先驱细胞内:
a)RNA指导的核酸酶(RGN)多肽或编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列,其中编码该RGN多肽的该多核苷酸与启动子可操作地连接,使得该RGN多肽能够在该细胞中表达;以及
b)指导RNA(gRNA)或编码该gRNA的多核苷酸,其中该gRNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ IDNO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111或118至少95%序列同一性的核苷酸序列,其中编码该gRNA的该多核苷酸与启动子可操作地连接,使得该gRNA能够在该细胞中表达,
从而该RGN和该gRNA在细胞中表达并在BCL11A增强子区域处切割,导致该人造血先驱细胞的基因修饰并降低BCL11A的mRNA和/或蛋白质表达。
122.如实施方案121的方法,其中该gRNA还包括靶向位于该BCL11A增强子区域内的或靠近该BCL11A增强子区域的区域的间隔序列。
123.如实施方案104-122中任一实施方案的方法,其中该指导RNA包括tracrRNA,该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112或119至少95%序列同一性的核苷酸序列。
124.一种用于结合DNA分子的靶DNA序列的系统,该系统包括:
a)能够与该靶DNA序列杂交的一个或多个指导RNA,或包括编码该一个或多个指导RNA(gRNA)的一个或多个核苷酸序列的一个或多个多核苷酸;以及
b)RNA指导的核酸酶(RGN)多肽,包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117至少95%序列同一性的氨基酸序列;
其中该一个或多个指导RNA能够与该靶DNA序列杂交,并且
其中该一个或多个指导RNA与该RGN多肽形成复合物,从而将该RGN多肽导向至与该DNA分子的该靶DNA序列结合。
125.如实施方案124的系统,其中该RGN多肽是无核酸酶活性的或能够作为切口酶。
126.如实施方案124或125的系统,其中该RGN多肽与碱基编辑多肽可操作地融合。
127.如实施方案126的系统,其中该碱基编辑多肽是脱氨酶。
128.如实施方案127的系统,其中该脱氨酶是胞苷脱氨酶或腺苷脱氨酶。
129.一种用于检测样本中的DNA分子的靶DNA序列的方法,该方法包括:
a)使该样本与下列接触:
i)RNA指导的核酸酶(RGN)多肽,包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117或137至少95%序列同一性的氨基酸序列,其中当与能够与该靶DNA序列杂交的指导RNA结合时,该RGN多肽以RNA指导的序列特定方式结合DNA分子的该靶DNA序列;
ii)该指导RNA;以及
iii)不与该指导RNA杂交的检测器单链DNA(ssDNA);以及
b)测量通过该RGN切割该检测器ssDNA生成的可检测信号,从而检测该靶DNA序列。
130.如实施方案129的方法,其中该样本包括来自细胞裂解物的DNA分子。
131.如实施方案129的方法,其中该样本包括细胞。
132.如实施方案131的方法,其中该细胞是真核细胞。
133.如实施方案129的方法,其中包括该靶DNA的DNA分子通过存在于包括RNA的样本中的RNA模板分子的反转录生成。
134.如实施方案133的方法,其中该RNA模板分子是RNA病毒。
135.如实施方案134的方法,其中该RNA病毒是冠状病毒。
136.如实施方案135的方法,其中该冠状病毒是蝙蝠SARS类冠状病毒、SARS-CoV或SARS-CoV-2。
137.如实施方案133-136中任一实施方案的方法,其中包括RNA的该样本是从包括细胞的样本取得的。
138.如实施方案129-137中任一实施方案的方法,其中该检测器ssDNA包括荧光团/猝灭剂对。
139.如实施方案129-137中任一实施方案的方法,其中该检测器ssDNA包括荧光共振能量转移(FRET)对。
140.如实施方案129-139中任一实施方案的方法,其中该指导RNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118或273至少95%序列同一性的核苷酸序列。
141.如实施方案129-140中任一实施方案的方法,其中该指导RNA包括tracrRNA。
142.如实施方案141的方法,其中该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119或274至少95%序列同一性的核苷酸序列。
143.如实施方案141或142的方法,其中该指导RNA是单指导RNA。
144.如实施方案141或142的方法,其中该指导RNA是双指导RNA。
145.如实施方案129-144中任一实施方案的方法,其中该方法还包括在步骤a)的接触之前或同时使样本中的核酸扩增反应。
146.如实施方案145的方法,其中该扩增反应是通过RNA分子的反转录生成的DNA分子的扩增反应。
147.一种用于检测样本中的DNA分子的靶DNA序列的试剂盒,该试剂盒包括:
a)RNA指导的核酸酶(RGN)多肽,包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117或137至少95%序列同一性的氨基酸序列,其中当与能够与该靶DNA序列杂交的指导RNA结合时,该RGN多肽能够以RNA指导的序列特定方式结合DNA分子的该靶DNA序列;
b)该指导RNA;以及
c)不与指导RNA杂交的检测器单链DNA(ssDNA)。
148.如实施方案147的试剂盒,其中该检测ssDNA包括荧光团/猝灭剂对。
149.如实施方案147的试剂盒,其中该检测ssDNA包括荧光共振能量转移(FRET)对。
150.如实施方案147-149中任一实施方案的试剂盒,其中该指导RNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118或273至少95%序列同一性的核苷酸序列。
151.如实施方案147-150中任一实施方案的试剂盒,其中该指导RNA包括tracrRNA。
152.如实施方案151的试剂盒,其中该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119或274至少95%序列同一性的核苷酸序列。
153.如实施方案151或152的试剂盒,其中该指导RNA是单指导RNA。
154.如实施方案151或152的试剂盒,其中该指导RNA是双指导RNA。
155.一种切割单链DNA的方法,该方法包括使核酸群与下列接触,其中该群包括DNA分子和多个非靶ssDNA,该DNA分子包括靶DNA序列:
a)RNA指导的核酸酶(RGN)多肽,包括具有与SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110、117或137至少95%序列同一性的氨基酸序列,其中当与能够与该靶DNA序列杂交的指导RNA结合时,该RGN多肽能够以RNA指导的序列特定方式结合该靶DNA序列;以及
b)该指导RNA;
其中该RGN多肽切割该多个非靶ssDNA。
156.如实施方案155的方法,其中该核酸群在细胞裂解物内。
157.如实施方案155或156的方法,其中该指导RNA包括CRISPR重复序列,该CRISPR重复序列包括具有与SEQ ID NO:2、10、17、24、31、39、47、55、62、70、76、83、90、96、104、111、118或273至少95%序列同一性的核苷酸序列。
158.如实施方案155-157中任一实施方案的方法,其中该指导RNA包括tracrRNA。
159.如实施方案158的方法,其中该tracrRNA包括具有与SEQ ID NO:3、11、18、25、32、40、48、56、63、71、77、84、91、97、105、112、119或274至少95%序列同一性的核苷酸序列。
160.如实施方案158或159的方法,其中该指导RNA是单指导RNA。
161.如实施方案158或159的方法,其中该指导RNA是双指导RNA。
162.一种包括编码CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中该crRNA包括间隔序列和CRISPR重复序列,其中该CRISPR重复序列包括具有与SEQ ID NO:240至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该crRNA;以及任选地
b)能够与该crRNA的该CRISPR重复序列杂交的反式活化的CRISPR RNA(tracrRNA);
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA能够通过该crRNA的间隔序列以序列特定方式与DNA分子的靶DNA序列杂交,并且
其中编码crRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
163.一种包括实施方案162的核酸分子的载体。
164.如实施方案163的载体,其中该载体还包括编码该tracrRNA的多核苷酸。
165.如实施方案164的载体,其中该tracrRNA包括具有与SEQ ID NO:241至少95%序列同一性的核苷酸序列。
166.如实施方案164或165的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与相同启动子可操作地连接,并且被编码为单指导RNA。
167.如实施方案164或165的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与分开的启动子可操作地连接。
168.如实施方案163-167中任一实施方案的载体,其中该载体还包括编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:235至少95%序列同一性的氨基酸序列。
169.一种包括编码反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,该tracrRNA包括具有与SEQ ID NO:241至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该tracrRNA;以及
b)包括间隔序列和CRISPR重复序列的crRNA,其中该tracrRNA能够与该crRNA的该CRISPR重复序列杂交;
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA能够通过该crRNA的间隔序列以序列特定方式与DNA分子的靶DNA序列杂交;并且
其中编码tracrRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
170.一种包括实施方案169的核酸分子的载体。
171.如实施方案170的载体,其中该载体还包括编码该crRNA的多核苷酸。
172.如实施方案171的载体,其中该crRNA的CRISPR重复序列包括具有与SEQ IDNO:240至少95%序列同一性的核苷酸序列。
173.如实施方案171或172的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与相同启动子可操作地连接,并被编码为单指导RNA。
174.如实施方案171或172的载体,其中编码该crRNA的该多核苷酸和编码该tracrRNA的该多核苷酸与分开的启动子可操作地连接。
175.如实施方案170-174中任一实施方案的载体,其中该载体还包括编码该RGN多肽的多核苷酸,其中该RGN多肽包括具有与SEQ ID NO:235至少95%序列同一性的氨基酸序列。
提供以下实施例是为了说明而不是为了限制。
实施例
实施例1.RNA指导的核酸酶的鉴别
鉴别了十七种不同CRISPR关联的RNA指导的核酸酶(RGN)并描述于下表1中。表1提供了每一个RGN的名称、其氨基酸序列、其衍生自的来源、以及经处理的crRNA及tracrRNA序列(参见实施例2的鉴别方法)。表1进一步提供了通用的单指导RNA(sgRNA)序列,其中多N表示确定sgRNA的核酸靶序列的间隔序列的位置。RGN系统APG05733.1、APG06207.1、APG01647.1、APG08032.1、APG02675.1、APG01405.1、APG06250.1、APG04293.1以及APG01308.1)在UNANNA的tracrRNA的发夹茎的基部具有保守序列(SEQ ID NO:8)。对于APG05712.1,相同位置的序列是CNANNG(SEQ ID NO:37)。对于APG01658.1,相同位置的序列是CNANNU(SEQ ID NO:45)。对于RGN系统APG06498.1和APG06877.1,在tracrRNA的发夹茎的基部的保守序列为UNANNG(SEQ ID NO:53)。对于APG09882.1和APG06646.1,相同位置的序列是UNANNC(SEQ ID NO:68)。对于APG09053.1,相同位置的序列是CNANNU(SEQ ID NO:102)。
表1:SEQ ID和CRISPR关联系统的概述
实施例2:指导RNA鉴别和sgRNA构建体
使天然表达了研究中的RNA指导的核酸酶系统的细菌培养物生长至对数中期(OD600为~0.600)、制成颗粒并快速冷冻。使用mirVANA miRNA分离试剂盒(LifeTechnologies,Carlsbad,CA)从颗粒中分离RNA,并使用NEBNext Small RNA Library Prep试剂盒(NEB,Beverly,MA)从分离的RNA制备测序文库。将文库制备物(library prep)在6%聚丙烯酰胺凝胶上分级分离,以捕获小于200nt的RNA物质,从而分别检测crRNA和tracrRNA。深度测序(75bp双端(paired-end))由服务提供商(MoGene,St.Louis,MO)在NextSeq 500(高输出试剂盒)上进行。使用Cutadapt对读数进行质量修整,并使用Bowtie2将读数映射到参考基因组。用python编写定制RNAseq管线来检测crRNA和tracrRNA转录物。通过天然重复间隔序列阵列的序列覆盖来确定经处理的crRNA边界。使用许可的BLASTn参数鉴别tracrRNA的抗重复部分。通过鉴别含有抗重复的转录物,RNA测序深度确认经处理的tracrRNA的边界。使用NUPACK(RNA折叠软件)进行二次结构预测来进行RNA的手动处理(curation)。sgRNA盒是通过DNA合成而被制备的,并且一般而言被如下设计(5'->3'):20-30bp间隔序列,在其3’末端可操作地连接至crRNA的经处理的重复部分,可操作地连接至4bp非互补接头(AAAG;SEQ ID NO:123),在其3’末端可操作地连接至经处理的tracrRNA。也可以使用其他4bp非互补接头。
对于体外测定,通过用GeneArtTM Precision gRNA合成试剂盒(ThermoFisher)体外转录sgRNA盒来合成sgRNA。每一个RGN多肽的经处理的crRNA和tracrRNA序列被鉴别并被列于表1中。参见下文针对PAM文库1和2构建的sgRNA。
实施例3:每一个RGN的PAM需要的确定
使用基本上改写自Kleinstiver等人(2015)Nature 523:481-485和Zetsche等人(2015)Cell 163:759-771的PAM消耗测定法确定每一个RGN的PAM需要。简言之,在pUC18主链(ampR)中产生两个质粒文库(L1和L2),每个质粒文库含有侧翼为8个随机核苷酸(即,PAM区域)的不同的30bp原间隔序列(靶)序列。每一个RGN的文库1和文库2的靶序列和侧翼PAM区域列于表2中。
将文库分别电穿孔到带有pRSF-1b表达载体的大肠杆菌BL21(DE3)细胞内,该载体含有本发明的RGN(针对大肠杆菌而被密码子优化)以及含有与L1或L2中的原间隔序列对应的间隔序列的同源(cognate)sgRNA。在转化反应中使用足够的文库质粒以获得>106CFU。pRSF-1b主链中的RGN和sgRNA两者都在T7启动子的控制下。使转化反应恢复1小时,此后,将其稀释到含有羧苄西林和卡那霉素的LB培养基内并过夜生长。第二天,将混合物稀释到自诱导的Overnight ExpressTM Instant TB培养基(Millipore Sigma)内以允许RGN和sgRNA的表达,并额外生长4小时或20小时,此后,将细胞离心(spun down)并以Mini-prep试剂盒(Qiagen,Germantown,MD)分离质粒DNA。在适当的sgRNA存在下,含有可被RGN识别的PAM的质粒将被切割,导致从群中除去它们。含有不可被RGN识别、或被转化至不含适当sgRNA的细菌内的PAM的质粒将存活并复制。未切割的质粒的PAM和原间隔序列区域被PCR扩增并按照公开的操作流程(16s-宏基因组(metagenomic)文库制备物指南15044223B,Illumina,SanDiego,CA)被制备以用于测序。由服务提供商(MoGene,St.Louis,MO)在MiSeq(Illumina)上进行深度测序(75bp单端读数)。通常情况下,每扩增子获得1-4M读数。PAM区域被取出、计数并被归一化为每一个样本的总读数。当与对照物相较时(即,当文库被转化到含有RGN但缺少适合的sgRNA的大肠杆菌内时),导致质粒切割的PAM被鉴别为代表性不足。为了代表新型RGN的PAM需要,用-log以2为底的转化将所考虑的区域中所有序列的消耗率(样本中的频率/对照物中的频率)转换为富集值。足够的PAM被定义为富集值>2.3(对应于消耗率<~0.2)的那些PAM。收集两个文库中高于此临界值的PAM并将其用于生成网站徽标(weblogo),举例而言可以使用称为“weblogo”的因特网上的基于网站的服务生成网站徽标。当顶部富集的PAM中存在一致模式时,PAM序列被识别并且被报告。表2中提供了每一个RGN的共有PAM(具有富集因子(EF)>2.3)。表2中还示出了PAM方向。如此申请的别处所指出的,APG06646.1和APG04293.1核酸酶不拥有PAM相互作用域。表2中的结果显示它们不拥有典型PAM需要,典型PAM需要为2-5个核苷酸。APG06646.1和APG04293.1被显示具有用于切割的单核苷酸需要。
表2:PAM或PAM类的确定
实施例4:工程化指导RNA以增加核酸酶活性
4.1RGN APG09748和APG09106.1
对于RGN APG09748(如SEQ ID NO:137所示的,并且APG09748crRNA重复序列、tracrRNA序列以及通用sgRNA分别如SEQ ID NO:273、274以及275所示,所有序列都描述于第PCT/US2019/068079号国际专利申请中,该国际专利申请通过引用整体并入本文)和APG09106.1,它们具有非常高的序列同一性,且具有相同的PAM,使用RNA折叠预测来确定指导RNA中可为优化核酸酶活性而改变的区域。通过缩短重复:抗重复区域、添加G-C碱基对以及移除G-U摆动对,增加重复:抗重复区域中的crRNA:tracrRNA碱基配对的稳定性。体外切割测定法中,使用RGN APG09748测试“优化的”指导变体并将其与野生型gRNA相比较。
为生成用于RNP形成的RGN,含有与C端His6(SEQ ID NO:276)或His10(SEQ ID NO:277)标记融合的RGN的表达质粒被构建并转化到大肠杆菌的BL21(DE3)菌株中。使用补加了50μg/mL卡那霉素的魔培养基(Magic Media)(赛默飞世尔(Thermo Fisher))进行表达。裂解以及澄清后,通过固定金属亲和层析法纯化蛋白质,并且使用Qubit蛋白定量试剂盒(赛默飞世尔)或使用所计算的消光系数通过UV-vis将蛋白质定量。
通过将~2:1的比例的经纯化的RGN与sgRNA于室温下温育20分钟制备核糖核蛋白(RNP)。对于体外切割反应,将RNP与质粒或含有侧翼为优选的PAM序列的靶向原间隔序列的线性dsDNA于室温下温育>30分钟。测试TRAC基因座内的两个靶核酸序列(TRAC11(SEQ IDNO:278)和TRAC14(SEQ ID NO:279))。在具有正确靶核酸序列的情况下(举例而言,gRNA具有TRAC11间隔序列,且测定的靶为TRAC11),在没有正确靶核酸序列的情况下(举例而言,gRNA具有TRAC11间隔序列,而测定的靶为TRAC14),测定gRNA在两种情况下是否有靶向活性。通过琼脂糖凝胶电泳评估通过质粒切割确定的活性。结果显示于表3中。如SEQ ID NO:280-283列出指导变体,并且对该指导变体提供间隔序列。这些指导序列使用非互补核苷酸接头AAAA(SEQ ID NO:284)。具有增加的重复:抗重复结合的优化的gRNA(SEQ ID NO:285;多N表示间隔序列的位置)具有优化的tracrRNA(SEQ ID NO:286)和优化的crRNA(SEQ IDNO:287)成分。优化的指导变体能够切割之前使用野生型指导RNA没有检测到切割的两个基因座。通过重复:抗重复区域中的杂交的优化,对于TRAC基因座中的多个靶,APG09748的体外切割从0%的切割增加到100%的切割。
表3:具有工程化指导变体的APG09748的编辑效率
设计并测定额外优化gRNA变体。此外,还测试不同长度的间隔序列,以确定间隔序列多长将如何影响切割效率。在此测定法中,间隔序列外的sgRNA被称为“主链”。在表4中,这些被标示为“WT”(SEQ ID NO:288,野生型序列)、和三个优化的sgRNA:V1(SEQ ID NO:289)、V2(SEQ ID NO:290)以及V3(SEQ ID NO:291)。所有这些序列都具有表示间隔序列的位置的多N。通过体外转录(IVT),指导被表达为sgRNA。相较于野生型sgRNA主链,V1具有87.8%的同一性,V2具有92.4%的同一性,并且V3具有85.5%的同一性。还生成并测试代表双指导RNA但在其他方面与上述野生型的和优化的sgRNA类似的合成tracrRNA:crRNA双链体(“合成物”)。
关于此组测定,使用RGN APG09106.1;在其他方面,用于体外切割反应的方法与上面描述的类似。靶向的核酸序列是靶1(SEQ ID NO:292)和靶2(SEQ ID NO:293)。结果示于表4中。
表4:具有工程化指导变体的APG09106.1的编辑效率
4.2RGN APG07433.1
使用RNA折叠预测来确定APG07433.1的指导RNA中可以为优化核酸酶活性并缩短指导RNA从而包装于病毒载体内而被改变的区域(如SEQ ID NO:235所示的并且在第2019/0367949号美国专利申请公布和第WO 2019/236566号国际专利申请公布所描述的,每一篇专利申请公布通过引用整体并入本文)。鉴别出两个区域作为进行改变的潜在位置:crRNA和tracrRNA区域之间的重复:抗重复配对和tracrRNA中的末端发夹。重复:抗重复区域的长度被截短至7个(APG07433.1-7bp,SEQ ID NO:238和239)、13个(APG07433.1-13bp,SEQ IDNO:250和251)、以及15个碱基对(APG07433.1-15bp,SEQ ID NO:242和243)。另外,测试在相较于野生型指导引入较小RNA凸起物的情况下改变重复:抗重复区域的序列并将该配对的长度减小至11个碱基对(APG07433.1-11bp-syn,SEQ ID NO:240和241)的第四变体。还对tracrRNA中的末端发夹进行截短,包含使天然序列的长度减小至40个(APG07433.1-40ntTHP,SEQ ID NO:254和255)和42个(APG07433.1-42ntTHP,SEQ ID NO:244和245)核苷酸。亦将改变的茎-环设计成将这些缩短至35个(APG07433.1-35ntTHP-syn,SEQ ID NO:248和249)和39个(APG07433.1-39ntTHP-syn,SEQ ID NO:246和247)核苷酸。一个指导使13碱基对的缩短重复:抗重复区域与42核苷酸的缩短末端发夹组合(APG07433.1-13bp42ntTH,SEQ ID NO:252和253)。还测试了间隔序列长度对切割的影响。还测试了野生型指导RNA主链上的25个(APG07433.1-天然[25],SEQ ID NO:236和237;间隔序列如SEQ ID NO:271所示)和18个(APG07433.1-天然[18],SEQ ID NO:256和257;间隔序列如SEQ ID NO:272所示)核苷酸的间隔序列长度。
通过在退火缓冲液(Synthego)中制备含有20μM的crRNA和10μM的tracrRNA的溶液,然后,将其加热至78℃10分钟,且然后在37℃30分钟,通过使crRNA和tracrRNA退火来制备下面的双指导RNA。通过在磷酸缓冲盐水溶液中与0.5μM的纯化APG07433.1蛋白和1μM的双指导RNA温育20分钟,形成RNP。此实验中使用的指导RNA显示于表5中。
表5:双指导RNA
这些RNP与使用FAM和Cy3标记的引物扩增生成的含有适当靶序列(SEQ ID NO:260)的PCR产物一起温育,以促进切割产物的准确且灵敏定量。在1X Cutsmart缓冲液(NewEngland Biolabs)中,反应物含有如上生成的250nM的RNP,和150nM的FAM和Cy3标记的PCR产物。使该反应在37℃进行15分钟,并且通过将RNase A添加至0.1mg/mL且将EDTA添加至45mM,该反应被终止。猝灭反应物(quenched reaction)在50℃加热30分钟并在95℃加热5分钟。然后,在5%的TBE凝胶上使用非变性丙烯酰胺凝胶电泳分析该样本。在ChemiDoc MP成像器上对这些成像。两种染料中的每一种可用于定量,且每一个样本都是一式两份进行。此实验的结果显示于表6中。
表6:切割结果
此分析表明天然主链优于大多数经缩短的变体及含有经缩短的靶序列的变体(APG07433.1-天然[18],SEQ ID NO:256和257)。经缩短的主链序列中具有最高切割水平的主链序列是被命名为APG07433.1-11bp-syn的序列,其包括25nt的靶序列(间隔序列;SEQID NO:271)、crRNA的SEQ ID NO:240以及SEQ ID NO:241作为tracrRNA。此指导变体包含改变的重复:抗重复茎环及茎中的工程化凸起物。
实施例5:哺乳动物细胞中的基因编辑活性的证明
生成RGN表达盒并将其引入用于哺乳动物表达的载体中。RGN APG09748、APG09106.1、APG05712.1、APG01658.1、APG05733.1、APG06498.1、APG06646.1、APG09882.1、APG01405.1以及APG01308.1的每一个针对哺乳动物表达被密码子优化(分别为SEQ ID NO:304、305以及411-418),并且表达蛋白在N端可操作地融合至SV40核定位序列(NLS;SEQ IDNO 125)和3xFLAG标签(SEQ ID NO:126),而在C端可操作地融合至核质蛋白NLS序列(SEQID NO:127)。NLS序列的两个拷贝被使用,被串联地可操作地融合。每一个表达盒都在巨细胞病毒(CMV)启动子(SEQ ID NO:306)的控制下。本领域中已知CMV转录增强子(SEQ ID NO:307)也可被包括在包括CMV启动子的构建体中。编码单一gRNA的指导RNA表达构建体的每一个都在人RNA聚合酶III U6启动子(SEQ ID NO:308)的控制下被生成并被引入表达载体内。指导已选基因的靶向区域,包含RelA、AurkB、GAPDH、LINC01509、HBB、CFTR、HPRT1、TRA、EMX1和VEGFA,如表7所示。关于RNA指导核酸酶APG09106.1,特定残基突变,以增加蛋白质的核酸酶活性,特定地说,APG09106的T849残基突变至精氨酸(SEQ ID NO:309)。此点突变增加哺乳动物细胞的编辑率。
将上面描述的构建体引入哺乳动物细胞内。转染前一天,将1x105个HEK293T细胞(Sigma)铺板于Dulbecco的改良Eagle培养基(DMEM)加10%(vol/vol)胎牛血清(Gibco)和1%青霉素-链霉素(Gibco)的24孔培养皿中。第二天,当细胞达到50-60%汇合时,按照制造商的说明,使用每孔1.5μL的Lipofectamine 3000(Thermo Scientific)共转染500ng的RGN表达质粒加500ng的单一gRNA表达质粒。生长48小时后,根据制造商的说明,使用基因组DNA分离试剂盒(Machery-Nagel)来收获总基因组DNA。
然后,分析总基因组DNA,以确定所靶向的基因中的编辑率。生成寡核苷酸,以用于PCR扩增和随后对扩增的基因组靶位点(SEQ ID NO:310和311)的分析。在包含0.5μM的每一种引物的20μL反应物中使用10μL的2X Master Mix Phusion High-Fidelity DNA聚合酶(Thermo Scientific)进行所有PCR反应。首先,使用PCR#1引物(SEQ ID NO:310及311),使用以下程序:98℃,1分钟;[98℃,10秒;62℃,15秒;72℃,5分钟]的30个循环;72℃,5分钟;12℃,永远,来扩增涵盖每一个靶基因的大基因组区域。
然后,使用对每一个指导特定的引物(PCR#2引物;SEQ ID NO:365-370),使用以下程序:98℃,1分钟;[98℃,10秒;67℃,15秒;72℃,30秒]的35个循环;72℃,5分钟;12℃,永远,来进一步扩增1微升的此PCR反应物。PCR#2的引物包含用于Illumina测序的NexteraRead 1和Read 2转座酶衔接子突出部序列。
在第二次PCR扩增后,根据制造商的说明,使用PCR净化(cleanup)试剂盒(Zymo)洗涤DNA,并在水中洗脱。将200-500ng纯化的PCR#2产物在20μL反应物中与2μL的10X NEB缓冲液2和水组合,并使用程序:95℃,5分钟;95-85℃,以2℃/秒的速率冷却;85-25℃,以0.1℃/秒的速率冷却;12℃,永远,进行退火,以形成异源双链DNA。退火后,取出5μL的DNA作为无酶对照物,并且加入1μL的T7核酸内切酶I(NEB),并使反应物在37℃下温育1小时。温育后,加入5x FlashGel上样染料(Lonza),并使用凝胶电泳,通过2.2%琼脂糖FlashGel(Lonza)分析5μL的每一个反应物和对照物。在凝胶可视化之后,使用以下等式来确定非同源末端连接(NHEJ)的百分比:%NHEJ事件=100x[1-(1-所切割的部分)(1/2)],其中(所切割的部分)被定义为:(消化产物的密度)/(消化产物+未消化的亲本条带的密度)。
对于一些样本,使用分析哺乳动物细胞中表达后的结果。在基因组DNA提取之前,转染后将细胞在37℃下温育72小时。按照制造商的操作流程,使用QuickExtract DNA提取溶液(Epicentre)来提取基因组DNA。RGN靶位点侧翼的基因组区域被PCR扩增,并按照制造商的操作流程,使用QiaQuick Spin Column(Qiagen)来纯化产物。总计200-500ng的纯化PCR产物与1μl的10×Taq DNA聚合酶PCR缓冲液(Enzymatics)和超纯水混合至10μl的最终体积,并进行重退火过程,使得能够形成异源双链:95℃10分钟;95℃至85℃,以-2℃/s线性降温,85℃至25℃,以-0.25℃/s线性降温,以及25℃保持1分钟。
重退火后,按照制造商建议的操作流程,用核酸酶和增强子S(Integrated DNA Technologies)处理产物,并在4-20%的Novex TBE聚丙烯酰胺凝胶(Life Technologies)上分析产物。用SYBR Gold DNA染色剂(Life Technologies)对凝胶染色10分钟,并用Gel Doc凝胶成像系统(Bio-rad)对凝胶成像。定量是基于相对条带强度。插入缺失百分比由公式100×(1-(1-(b+c)/(a+b+c))1/2)确定,其中a是未消化的PCR产物的累积强度(integrated intensity),b和c是每一个切割产物的累积强度。
另外,按照Illumina 16S宏基因组测序文库操作流程,来自含有Illumina突出部序列的PCR#2的产物进行文库制备。通过服务提供商(MOGene)在Illumina Mi-Seq平台上进行深度测序。通常情况下,每扩增子产生200,000个250bp的双端读数(2x 100,000个读数)。使用CRISPResso(Pinello等人,2016,Nature Biotech 34:695-697)分析读数,以计算编辑率。手动处理输出对齐,以确认插入和缺失位点并鉴别重组位点处的微同源位点。每一个样本中的总编辑率以及缺失率和插入率显示于表7中。所有实验均在人细胞中进行。“靶”是基因靶内所靶向的序列。对于每一个靶序列,依据所使用的RGN,指导RNA包括互补RNA间隔序列和适当sgRNA。通过指导RNA进行的实验的所选细节(breakdown)显示于表8.1和8.2中。
表7:基因靶的总编辑率
各自指导的特定插入和缺失显示于表8.1和8.2中。在这些表中,靶序列由粗体大写字母标识。8mer PAM区域加双下划线,主要识别的核苷酸以粗体显示。插入由小写字母标识。缺失用虚线(---)指示。插入缺失位置是从靶序列的PAM近端边缘计算的,边缘是位置0。如果位置在边缘的靶侧,则该位置为正(+);如果位置在边缘的PAM侧,则该位置为负(-)。
表8.1:使用RGN APG09106.1对指导831的特定插入和缺失
表8.2:使用APG09106.1 T849R对指导831的特定插入和缺失
实施例6:植物细胞中的基因编辑活性的证明
使用改编自Li等人2013(Nat.Biotech.31:688-691)的操作流程,在植物细胞中证明本发明的RGN的RNA指导的核酸酶活性。简而言之,可操作地连接至用于对N端SV40核定位信号编码的核酸序列的本发明的RGN的植物密码子优化形式(SEQ ID NO:1、9、16、23、30、38、46、54、61、69、75、82、89、95、103、110或117)被克隆于瞬时转化载体中的强组成型35S启动子的后面。靶向适当PAM序列侧翼的植物PDS基因中的一个或多个位点的sgRNA被克隆于第二瞬时表达载体中的植物U6启动子的后面。使用PEG介导的转化将表达载体引入本氏烟草(Nicotiana benthamiana)叶肉原生质体内。将转化的原生质体在黑暗中温育达36小时。使用DNeasy Plant Mini Kit(Qiagen)从原生质体中分离基因组DNA。RGN靶位点侧翼的基因组区域被PCR扩增,并按照制造商的操作流程,使用QiaQuick Spin Column(Qiagen)纯化产物。使总共200-500ng的纯化PCR产物与1μl的10×Taq DNA聚合酶PCR缓冲液(Enzymatics)及超纯水混合至10μl的最终体积,并进行重退火过程,使得能够形成异源双链:95℃,10分钟;95℃至85℃,以-2℃/s线性降温,85℃至25℃,以-0.25℃/s线性降温,以及25℃保持1分钟。
重退火后,按照制造商建议的操作流程,利用SURVEYOR核酸酶和SURVEYOR增强子S(Integrated DNA Technologies)处理产物,并在4-20%的Novex TBE聚丙烯酰胺凝胶(Life Technologies)上进行分析。用SYBR Gold DNA染色剂(Life Technologies)对凝胶染色10分钟,并用Gel Doc凝胶成像系统(Bio-rad)对凝胶成像。定量基于相对条带强度。插入缺失百分比通过公式100×(1-(1-(b+c)/(a+b+c))1/2)确定,其中a是未消化的PCR产物的累积强度,而b和c是每一个切割产物的累积强度。
实施例7:疾病靶的鉴别
从通过万维网在NCBI ClinVar网站找到的NCBI ClinVar数据库获得临床变体的数据库。从此清单鉴别出致病性单核苷酸多态性(SNP)。使用基因组基因座信息,鉴别出在与每一个SNP重叠并围绕每一个SNP的区域中的CRISPR靶。表9.1中列出了为靶向因果突变(“Casl Mut.”)可结合包括APG09748或APG09106.1的RGN系统使用碱基编辑修正的SNP的选择。表9.2中列出了为靶向因果突变(“Casl Mut.”)可结合包括APG06646.1或APG01658.1的RGN系统使用碱基编辑修正的SNP的选择。在表9.1和9.2中,仅列出了每一种疾病的一个别名。“RS#”对应于在NCBI网站上通过SNP数据库的RS登录号。染色体登录号提供通过NCBI网站发现的登录参考信息。表9.1和9.2还提供了适合于针对每一种疾病的RGN系统APG09748或APG09106.1(表9.1中)或APG06646.1或APG01658.1(表9.2中)的基因组靶序列信息。靶序列信息还提供原型间隔序列,用于对本发明的对应RGN生成必要sgRNA。
表9.1:APG09748和APG09106.1的疾病靶
实施例8:靶向造成弗里德赖希氏共济失调的突变
引起弗里德赖希氏共济失调(FRDA)的三核苷酸重复序列的扩增(expansion)发生在FXN基因内、被称为FRDA不稳定区域的限定遗传基因基因座中。RNA指导的核酸酶(RGN)可用于切除FRDA患者细胞中的不稳定区域。此方法需要1)RGN和指导RNA序列,其可被程序化,以靶向人基因组中的等位基因;和2)RGN和指导序列的递送方法。特别是当除了功能性表达盒所需的其他基因元件外还要考虑到SpCas9基因和指导RNA的长度时,用于基因组编辑的诸如来自化脓性葡萄球菌(SpCas9)的常用Cas9核酸酶的许多核酸酶太大而无法包装于腺相关病毒(AAV)载体内。这使得不太可能存在使用SpCas9的可行方法。
本发明的诸如APG09748、APG09106.1和APG06646.1的紧凑(compact)RNA指导的核酸酶唯一很好地适合于FRDA不稳定区域的切除。每一个RGN都具有在FRDA不稳定区域附近的PAM需要。另外,这些RGN中的每一个都可与指导RNA一起包装于AAV载体内。包装两个指导RNA可能需要第二个载体,但这种方法与诸如SpCas9的较大核酸酶所需要的相比较仍有优势,较大核酸酶可能需要在两个载体之间分裂蛋白质序列。
表10显示了适合将APG09748、APG09106.1或APG06646.1靶向FRDA不稳定区域的5'和3'侧翼的基因组靶序列的位置以及基因组靶的sgRNA的序列。一旦到达基因座,RGN将切除FA不稳定区域。可使用基因座的Illumina测序来验证区域的切除。
表10:RGN系统的基因组靶序列
实施例9:靶向造成镰状细胞疾病的突变
靶向BCL11A增强子区域内的序列(SEQ ID NO:220)可提供增加胎儿血红蛋白(HbF)以治愈或减轻镰状细胞疾病的症状的机制。举例而言,基因组广泛关联研究已经鉴别出BCL11A处的一组基因变异与增加的HbF水平相关联。这些变异是在BCL11A的作用为阶段特定、谱系限制的增强子区域的非编码区中发现的SNP的集合。进一步的调研揭示在类红血球细胞中对于BCL11A表达需要这种BCL11A增强子(Bauer等人(2013)Science 343:253-257,通过引用并入本文)。在BCL11A基因的内含子2内发现了增强子区域,并且鉴别出内含子2中DNAseI过敏性的三个区(常常表示与调节潜力关联的染色质状态)。根据与BCL11A的转录初始位点的距离(以千碱基为单位),将这三个区鉴别为“+62”、“+58”以及“+55”。这些增强子区域的长度大约为350(+55);550(+58);以及350(+62)个核苷酸(Bauer等人,2013)。
实施例9.1:鉴别优选的RGN系统
这里描述了使用RGN系统对β-血红蛋白病变的有潜力的治疗,该RGN系统破坏BCL11A与其在HBB基因座内的结合位点的结合,HBB基因座是负责在成人血红蛋白中制造β-球蛋白的基因。此方法使用在哺乳动物细胞中更有效的NHEJ。除此之外,此方法使用可以被包装于单一AAV载体内以用于体内递送的足够小尺寸的核酸酶。
人的BCL11A增强子区域中的GATA1增强子模体(SEQ ID NO:220)是在HbF在成人红血球中同时重新表达的情况下,使用RNA指导的核酸酶(RGN)来降低BCL11A表达从而进行破坏的理想靶(Wu等人(2019)Nat Med 387:2554)。与APG09748或APG09106.1相容的几个PAM序列显而易见处于围绕此GATA1位点的基因座处。这些核酸酶具有5'-DTTN-3'(SEQ ID NO:60)的PAM序列,并且尺寸紧凑,可能使它们与单一AAV或腺病毒载体中的适合指导RNA一起递送。除了其尺寸之外,APG06646.1还具有最小的PAM需要(SEQ ID NO:109),这使得其非常适合用于此方法。这种递送方法相对于其他方法具有多种优势,诸如,获得造血干细胞以及完善建立的安全性分布和制造技术。
来自化脓性葡萄球菌(SpyCas9)的常用Cas9核酸酶需要5'-NGG-3'的PAM序列(SEQID NO:101),其中几个存在于GATA1模体附近。然而,SpyCas9的大小妨碍了包装于单一AAV或腺病毒载体内,且因此放弃了上面提及的此方法的优点。尽管可以采用双递送策略,但这样会增加明显的制造复杂性和成本。另外,双病毒载体递送明显降低了基因修正的效率,因为给定细胞中的成功编辑需要用这两个载体来感染。
生成了编码人的密码子优化的APG09748(SEQ ID NO:409)、APG09106.1(SEQ IDNO:410)或APG06646.1(SEQ ID NO:415)的表达盒,类似于在实施例5中描述的那些。还生成了表达针对RGN APG09748、APG09106.1或APG06646.1的指导RNA的表达盒。这些指导RNA包括:1)原型间隔序列,其与BCL11A增强子基因座(靶序列)内的非编码或编码DNA链互补;以及2)指导RNA与RGN关联所需的RNA序列。因为每一个RGN靶向的几个有潜力的PAM序列围绕BCL11A GATA1增强子模体,所以生成了几种有潜力的指导RNA构建体,以确定生成稳健切割和NHEJ介导的BCL11AGATA1增强子序列破坏的最佳原型间隔序列。使用表11中提供的sgRNA评价表11中的靶基因组序列。
表11:使用APG06646.1的BCL11A GATA1增强子基因座的靶序列
为了评价APG09748、APG09106.1或APG06646.1产生破坏BCL11A增强子区域的插入缺失的效率,使用人细胞系,诸如,人胚肾细胞(HEK细胞)。有RGN表达盒的DNA载体被生成(如实施例5中所述)。还生成包括表达盒的分开的载体,该表达盒包括表11的指导RNA序列的编码序列。如在实施例5中所描述的,这种表达盒可还包括人RNA聚合酶III U6启动子(SEQ ID NO:308)。作为另一种选择,可以使用包括RGN和指导RNA两者的表达盒的单一载体。使用标准技术,诸如,实施例5中所描述的那些技术,将载体引入HEK细胞中,并将细胞培养1-3天。在此培养期后,分离基因组DNA,并通过使用T7核酸内切酶I消化和/或直接DNA测序来确定插入缺失频率,如在实施例5中所描述的。
用含有Illumina Nextera XT突出部序列的引物,通过PCR来扩增涵盖靶BCL11A区域的DNA的区域。使用T7核酸内切酶I消化检查这些PCR扩增子的NHEJ形成,或者按照Illumina 16S宏基因组测序文库的操作流程或类似的下一代测序(NGS)文库制备,这些PCR扩增子进行文库制备。在深度测序后,通过CRISPResso分析产生的读数,以计算编辑率。手动处理输出对齐,以确认插入和缺失位点。此分析鉴别出优选RGN和对应的优选指导RNA(sgRNA)。该分析可得出的结果是APG09748、APG09106.1或APG06646.1是同样优选的,或者一个RGN是最优选的。另外,该分析可确定存在一个以上的优选指导RNA,或者表17中的所有靶基因组序列是同样优选的。
实施例9.2:胎儿血红蛋白表达的测定
在此实施例中,测定破坏BCL11A增强子区域的APG09748、APG09106.1或APG06646.1所产生插入或缺失的胎儿血红蛋白的表达。使用健康人供体CD34+造血干细胞(HSC)。培养这些HSC,并使用与实施例5中所描述的方法类似的方法,引入包括表达盒的载体,该表达盒包括优选RGN和优选sgRNA的编码区域。作为另一种选择,可使用电穿孔。在电穿孔后,使用已建立的操作流程将这些细胞体外分化为红血球(举例而言,Giarratana等人(2004)Nat Biotechnology23:69-74,通过引用并入本文)。然后,使用蛋白质印迹,用抗人HbF抗体来测量HbF的表达,或经由高效液相层析法(HPLC)定量HbF的表达。当与仅用RGN电穿孔但没有指导的HSC相比较时,预期BCL11A增强子基因座的成功破坏将引起HbF生成的增加。
实施例9.3:减少的镰状化细胞形成的测定
在此实施例中,测定破坏BCL11A增强子区域的APG09748、APG09106.1或APG06646.1的所产生插入或缺失的减少的镰状化细胞形成。使用来自患有镰状细胞病的患者的供体CD34+造血干细胞(HSC)。培养这些HSC,并使用与在实施例5中所描述的方法类似的方法引入包括表达盒的(数个)载体,该表达盒包括优选RGN的和优选sgRNA的编码区域。作为另一种选择,可使用电穿孔。在电穿孔后,使用已建立的操作流程(Giarratana等人(2004)Nat Biotechnology23:69-74)将这些细胞体外分化成红血球。然后,使用蛋白质印迹,用抗人HbF抗体来测量HbF的表达,或经由高效液相层析法(HPLC)定量HbF的表达。当与仅用RGN电穿孔但没有指导的HSC相比较时,预期BCL11A增强子基因座的成功破坏将引起HbF生成的增加。
通过加入焦亚硫酸盐,在这些分化的红血球中诱导镰状细胞形成。使用显微镜对镰状与正常红血球的数量计数。预期镰状细胞在用APG09748、APG09106.1或APG06646.1加sgRNA处理的细胞中的数量少于在未处理的细胞中的或单独用RGN处理的细胞中的数量。
实施例9.4:鼠模型中的疾病治疗验证
为了评价使用APG09748、APG09106.1或APG06646.1破坏BCL11A基因座的效力,使用适合的镰状细胞贫血症的人源化小鼠模型。将编码优选RGN和优选sgRNA的表达盒包装于AAV载体或腺病毒载体内。具体而言,腺病毒Ad5/35型在靶向HSC方面是有效的。选用含有带有镰状细胞等位基因的人源化HBB基因座的适合的小鼠模型,诸如,B6;FVB-Tg(LCR-HBA2、LCR-HBB*E26K)53Hhb/J或B6.Cg-Hbatm1Paz Hbbtm1Tow Tg(HBA-HBBs)41Paz/HhbJ。单独用粒细胞集落刺激因子或与普乐沙福结合处理这些小鼠,以将HSC移入循环。然后,静脉内注射携带RGN和指导质粒的AAV或腺病毒,并使小鼠恢复一周。体外镰状化测定(sicklingassay)中使用焦亚硫酸盐测试从这些小鼠获得的血液,并且纵向追踪小鼠,以监测死亡率和造血功能。当与用缺少两种表达盒的病毒或用仅携带RGN表达盒的病毒处理的小鼠相比较时,预期用携带RGN和指导RNA的AAV或腺病毒的治疗将降低镰状化、死亡率并且改善造血功能。
实施例10:哺乳动物细胞中的碱基编辑活性
如下构建生成胞苷脱氨酶RGN融合蛋白的表达盒。RGN的编码序列(本文描述的APG06646.1及第2019/0367949号美国专利申请公开和第WO 2019/236566号国际专利申请公开描述的APG08290.1,这两个专利申请公开通过引用整体并入本文)针对哺乳动物表达而被密码子优化且被突变,以起切口酶的作用(分别为SEQ ID NO:128和262)。此编码序列被引入生成融合蛋白的表达盒,该融合蛋白在其N末端侧处包括NLS(SEQ ID NO:125),在其C末端侧处可操作地连接至3xFLAG标签(SEQ ID NO:126),在其C末端侧处可操作地连接至胞苷脱氨酶(SEQ ID NO:129-132;它们全部公开于第PCT/US2019/068079号国际专利申请中,该国际专利申请通过引用整体并入本文),在其C末端侧上可操作地连接至氨基酸接头(SEQ ID NO:133),在其C末端侧上可操作地连接至RGN切口酶,在其C末端侧处可操作地连接至第二NLS(SEQ ID NO:127)。这些表达盒的每一个都被引入能够在哺乳动物细胞中驱动融合蛋白的表达的pTwist CMV载体(Twist Bioscience)内。还生成在哺乳动物细胞中在人U6启动子的控制下表达指导RNA的分开的载体。这些指导RNA(nAPG06646.1的SEQ ID NO:134-136和nAPG08290.1的SEQ ID NO:263-265)能够将脱氨酶nRGN融合蛋白或RGN本身指导至靶向的基因组序列,以分别进行碱基编辑或基因编辑。
在24孔板中,使用Lipofectamine 2000试剂(Life Technologies),将500ng的胞苷脱氨酶表达质粒或标准RGN表达质粒和500ng的指导RNA表达质粒共转染为75-90%汇合的HEK293FT细胞。然后,使细胞在37℃下温育72小时。然后,按照制造商的说明,使用NucleoSpin 96Tissue(Macherey-Nagel)提取基因组DNA。将指导RNA靶位点侧翼的基因组区域进行PCR扩增,并按照制造商的操作流程,使用ZR-96DNA Clean和Concentrator(ZymoResearch)来纯化产物。然后,输送经纯化的PCR产物,以对Illumina MiSeq(2x250)进行下一代测序。分析结果是否有插入缺失形成或特定胞嘧啶突变。
下面的表12显示每一个构建体和指导组合物的胞苷碱基编辑和插入缺失形成。有趣的是,当将RGN APG06646.1的活性与使用相同指导RNA的胞苷脱氨酶nAPG06646.1的活性相比较时,观察到胞苷碱基编辑比基因编辑高出达20x。这些结果证明在具体靶位点具有低核酸酶活性的RGN在此位点仍可作为有效碱基编辑器。再者,由于碱基编辑应用中的插入缺失形成常常是不想要的结局,所以位点处具有低核酸酶活性的RGN对于碱基编辑应用是优选的。
表12:RGN和胞苷脱氨酶nRGN的胞苷碱基编辑和基因编辑
实施例11:反式ssDNA切割
11.1确定反式DNA切割的测定条件
在Cutsmart缓冲液(New England Biolabs B7204S)中,将经纯化的APG09748(如SEQ ID NO:137所示和第PCT/US2019/068079号国际专利申请所描述的,该国际专利申请通过引用并入本文)与单一指导RNA(sgRNA)以50nM的核酸酶和100nM的sgRNA或者200nM的核酸酶和400nM的sgRNA的最终浓度温育10分钟。将这些RNP溶液添加至在1.5X Cutsmart缓冲液(New England Biolabs B7204S)中ssDNA(靶或错配阴性对照物ssDNA)的最终浓度为10nM而报道子探针的最终浓度为250nM的溶液。报道子探针(TB0125和TB0089,由SEQ IDNO:138和139分别列出)在5’末端含有荧光染料(56-FAM用于TB0125而Cy5用于TB0089),在3’末端含有猝灭剂(3IABkFQ用于TB0125而3IAbRQSp用于TB0089),并且任选地含有内部猝灭剂(内部猝灭剂ZEN仅存在于TB0125上)。报道子探针的切割导致荧光染料去猝灭,并且由此导致荧光信号增大。为监测荧光强度,在酶标仪(CLARIOstar Plus)中在30℃下在Corning的小体积384孔微孔板中温育10μl的每一个反应物。
为对此测定确定适合的参数,探测许多条件。为确定是否有猝灭的探针设计或荧光团特性的效果,在每一个反应物中包含两个这种报道子而作为混合物。在任何给定的反应物中,它们处于彼此相同的浓度。在所有情况中,对照物或靶ssDNA的浓度(LE201或LE205,分别如SEQ ID NO:140和141所示)为10nM。RNP名称示意了如下面的表13所表示的核酸酶和靶。
表13.核糖核蛋白复合物
| RNP名称 | 核酸酶 | sgRNA | 预期靶 |
| APG09748.1 | APG09748 | 27sg.1(SEQ ID NO:144) | LE201(SEQ ID NO:140) |
| APG09748.2 | APG09748 | 27sg.2(SEQ ID NO:145) | LE205(SEQ ID NO:141) |
结果示于下面的表14中。
表14.反式DNA切割测定的结果
由此实验得出的结论是相较于25nM浓度的RNP,100nM浓度的RNP一般而言导致较高的报道子探针切割率。一般来说,最多到250至500nM的报道子浓度,报道子寡核苷酸浓度越高,则报道子切割率越高,几乎没有从报道子浓度的进一步升高观察到什么益处。显然,对于TB0089报道子(在Cy5通道中检测的),尤其是在报道子浓度高于250nM时,存在干扰靶分化的实质较高水平的背景活性。因此,得出结论,报道子浓度高于250nM没有什么益处。两个探针似乎更适合观察RNP的靶识别。
11.2APG09748反式DNA切割以及纯化对非特定活性的影响
经纯化的APG09748与单一指导RNA(sgRNA)在37℃下在1XCutsmart缓冲液(NewEngland Biolabs B7204S)中以200nM核酸酶和400nM的sgRNA的最终浓度温育10分钟。然后,将这些RNP溶液添加至在1.5X Cutsmart缓冲液(New England Biolabs B7204S)中ssDNA(靶或错配阴性对照物ssDNA)的最终浓度为10nM而报道子探针(TP0003)的最终浓度为250nM的溶液。报道子探针在5’末端含有荧光染料,而在3’末端含有猝灭剂。报道子探针的切割导致荧光染料去猝灭,并且由此导致荧光信号增大。为监测荧光强度,在酶标仪(CLARIOstar Plus)中在37℃下在Corning的小体积384孔微孔板中温育10μl的每一个反应物。
相对于阴性对照物,与靶序列的温育导致随时间变化的荧光强度实质增强。切割率被总结为荧光随时间变化的线性部分的斜率,如表15所显示。
表15.反式DNA切割的测定结果
| ssDNA底物序列 | 斜率(RFU/分钟) |
| 错配(LE111;SEQ ID NO:142) | 549 |
| 匹配(LE113;SEQ ID NO:143) | 7724 |
这些数据显示通过使用切割的报道子探针可清楚地检测的RNP的从阴性对照物分化的靶序列。
11.3使用平行质粒DNA文库的PAM确定
使用NEBuilder HiFi DNA Assembly Master Mix(New England Biolabs),来使含有其前面是5nt简并PAM序列(NNNNN)的靶序列的寡核苷酸(分别如SEQ ID NO:266和267所示的LE00680和LE00688)退火并将其克隆于双消化pUC19质粒内。由此反应物的转化得到的每一个菌落与克隆质粒DNA序列对应,使得来自由单一菌落衍生的培养物的质粒DNA的制备物是从原始文库取样的独特质粒制备物。质粒制备物由96个菌落的取样获得。这些制备物分别进行Sanger测序,以验证它们的PAM序列。
经纯化的APG09748与sgRNA(27sg.2)在1X Cutsmart缓冲液(New EnglandBiolabs B7204S)中以200nM的核酸酶和400nM的sgRNA的最终浓度在室温下温育20分钟。
将这些RNP溶液以100nM的最终浓度添加至在1.5X Cutsmart缓冲液(New EnglandBiolabs B7204S)中质粒DNA靶的最终浓度为8.3nM而TB0125和TB0089报道子(分别如SEQID NO:138和139所示的)的最终浓度分别为250nM和50nM的溶液。为监测荧光强度,在酶标仪(CLARIOstar Plus)中在37℃下在Corning的小体积384孔微孔板中温育10μl的每一个反应物。
少数样本中的质粒浓度低于浓度归一化的靶,或者溶液的体积不足以将预期靶量递送至反应孔。没有把这些样本从分析中排除,且由此,通过复制品之间的不一致性,预期这些样本是错误的原因。把使用在通过Sanger测序评价后被确定在靶序列中具有交互污染(PAM区域中显而易见的多个痕量)或改变的质粒的样本从分析中排除,且下面未显示它们的结果。分析结果通过FAM通道中的斜率以降序显示于下面的表16中。
表16.PAM序列
具有最高斜率的序列看起来符合通过前面在第PCT/US2019/068079号国际专利申请(通过引用并入本文)中描述的质粒消耗测定法确定的预测PAM(如SEQ ID NO:60所列的DTTN)。具体而言,我们看到“T”处于该位置靶的两个核苷酸5’的强烈偏好。令人惊奇的是,在此测定中观察到的大多数活性PAM位点(ATATG,SEQ ID NO:147)不与DTTN(SEQ ID NO:60)的共有序列完全匹配,这暗示在此识别位点中有某个水平的灵活性。
11.4存在PCR扩展DNA情况下的反式ssDNA切割活性
使用适当引物,由基因组DNA(分别如SEQ ID NO:225和226所示的TRAC和VEGF扩增子)产生PCR扩增靶。通过具有序列LE573和LE578(分别如SEQ ID NO:228和229所示的)的引物,VEGF靶(如SEQ ID NO:227所示的)是从HEK293T细胞基因组DNA被PCR扩增。TRAC靶(如SEQ ID NO:230所示的)是通过LE257和LE258(分别如SEQ ID NO:231和232所示的)PCR扩增的。
RNP是通过温育在1X NEBuffer 2(New England Biolabs)中分别为0.5μM以及1μM的本文描述的APG09106.1核酸酶和sgRNA形成的,且在室温下温育20分钟。
表17.核糖核蛋白复合物
在1.5X NEBuffer 2中与具有5’TEX615标记和3'Iowa Black FQ猝灭剂以及100nM的各自PCR产物的1.5μM ssDNA的寡核苷酸报道子进行切割反应。报道子探针的切割导致荧光染料去猝灭,且由此导致荧光信号升高。为监测荧光强度,在酶标仪(CLARIOstar Plus)中在37℃下在Corning的小体积384孔微孔板中温育10μl的每一个反应物。动力学分析结果显示于表18中。
表18.反式DNA切割测定结果
| RNP | 靶浓度(nM) | 靶 | 斜率(RFU/分钟) |
| 28.836 | 30 | TRAC扩增子 | 1204 |
| 28.838 | 30 | TRAC扩增子 | 8436 |
| 28.838 | 30 | VEGF扩增子 | 766 |
| 28.836 | 30 | VEGF扩增子 | 3484 |
这些结果表明在存在来自各种来源的PCR扩增DNA的情况下反式ssDNA切割活性的特定活化。活性取决于PCR扩增底物的浓度。
11.5使用ssDNA切割作为诊断
因在存在靶DNA序列的情况下这些核酸酶产生光学可检测信号的能力,它们有希望在诊断装置内实现检测基因疾病或诸如细菌、病毒或真菌的传染性疾病的药剂的功用。
诊断程序可包含对待测试的样本中的核酸的分离或扩增。在不对核酸进行任何分离或扩增的情况下,使用某些样本亦可以是适合的,因它们可以相当高的量存在于样本中,在没有扩增(诸如PCR)或在没有干扰检测或信号生成的物料的情况下,足以被检测。
然后,如其他实施例中所描述而形成的RNP和报道子(诸如,前面的实施例中使用的荧光团或猝灭剂修饰的ssDNA寡核苷酸,或当被切割时生成可见的或以其他方式容易检测的信号的某个其他种类的ssDNA底物)一起被暴露于样本(或前面的段落中描述的经处理的样本)中。如果使用荧光团-猝灭剂缀合的DNA寡核苷酸(与前面描述的实施例中相同),则使用在前面的实施例中描述的荧光计可检测那些。为简化检测,可进行终点测定,代替前面描述的动力学测定,意味着该测定可相对于阳性和阴性对照物进行固定时间,且在此经过时间结束时读出。
这些试剂亦可被整合于横向流动装置内,这样允许利用非常小的仪器对引起给定疾病的药剂或特定核酸序列(诸如,个体中的患病等位基因)进行检测。在此测定中,ssDNA报道子会与多个适合抗体或亲和试剂捕获的诸如荧光素、生物素和/或地高辛的分子缀合。
Claims (34)
1.一种核酸分子,包括编码RNA指导的核酸酶(RGN)多肽的多核苷酸,其中该多核苷酸包括编码RGN多肽的核苷酸序列,该RGN多肽选自由下列组成的群组中:
a)包括具有与SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列同一性的氨基酸序列的RGN多肽;以及
b)包括如SEQ ID NO:54所示的氨基酸序列的RGN多肽;
其中,当与能够与靶DNA序列杂交的指导RNA(gRNA)结合时,该RGN多肽能够以RNA指导的序列特定方式结合DNA分子的该靶DNA序列,并且
其中编码RGN多肽的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
2.如权利要求1所述的核酸分子,其中该RGN多肽是无核酸酶活性的或是能够起切口酶的作用。
3.如权利要求1或2所述的核酸分子,其中该RGN多肽可操作地与碱基编辑的多肽融合。
4.一种包括如权利要求1至3中任一项所述的核酸分子的载体。
5.如权利要求4所述的载体,还包括编码能够与该靶DNA序列杂交的该gRNA的至少一个核苷酸序列,且其中该指导RNA包括CRISPR RNA,该CRISPR RNA包括具有与SEQ ID NO:118、31、76、2、10、17、24、39、47、55、62、70、83、90、96、104或111至少95%序列同一性的CRISPR重复序列。
6.如权利要求5所述的载体,其中该gRNA包括tracrRNA,该tracrRNA具有与SEQ ID NO:119、32、77、3、11、18、25、40、48、56、63、71、84、91、97、105或112至少95%序列同一性。
7.一种包括如权利要求1至3中任一项所述核酸分子、或如权利要求4至6中任一项所述载体的细胞。
8.一种核酸分子,包括编码CRISPR RNA(crRNA)的多核苷酸,其中该crRNA包括间隔序列和CRISPR重复序列,其中该CRISPR重复序列包括具有与SEQ ID NO:118、31、76、2、10、17、24、39、47、55、62、70、83、90、96、104或111至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该crRNA;以及任选地,
b)能够与该crRNA的该CRISPR重复序列杂交的反式活化的CRISPR RNA(tracrRNA);
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA通过该crRNA的该间隔序列以序列特定方式能够与DNA分子的靶DNA序列杂交,以及
其中编码crRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
9.一种包括如权利要求8所述的核酸分子的载体。
10.如权利要求9所述的载体,其中该载体还包括编码该tracrRNA的多核苷酸,并且其中该tracrRNA包括具有与SEQ ID NO:119、32、77、3、11、18、25、40、48、56、63、71、84、91、97、105或112至少95%序列同一性的核苷酸序列。
11.一种包括编码反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,该反式活化的tracrRNA包括具有与SEQ ID NO:119、32、77、3、11、18、25、40、48、56、63、71、84、91、97、105或112至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该tracrRNA;以及
b)包括间隔序列和CRISPR重复序列的crRNA,其中该tracrRNA能够与该crRNA的该CRISPR重复序列杂交;
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA通过该crRNA的该间隔序列以序列特定方式能够与DNA分子的靶DNA序列杂交,以及
其中编码tracrRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
12.一种包括如权利要求11所述的核酸分子的载体。
13.如权利要求9所述的载体,其中该载体还包括编码该crRNA的多核苷酸,并且其中该crRNA的该CRISPR重复序列包括具有与SEQ ID NO:118、31、76、2、10、17、24、39、47、55、62、70、83、90、96、104或111至少95%序列同一性的核苷酸序列。
14.一种用于结合DNA分子的靶DNA序列的系统,该系统包括:
a)能够与该靶DNA序列杂交的一个或多个指导RNA或包括编码该一个或多个指导RNA(gRNA)的核苷酸序列的一个或多个多核苷酸;以及
b)RNA指导的核酸酶(RGN)多肽,该RGN多肽包括选自由下列组成的群组中的氨基酸序列:
i)具有与SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列同一性的氨基酸序列;
ii)如SEQ ID NO:54所示的氨基酸序列;
或包括编码该RGN多肽的核苷酸序列的多核苷酸,
其中编码该一个或多个指导RNA及编码该RGN多肽的该核苷酸序列的每一个可操作地连接至与该核苷酸序列异源的启动子;以及
其中该一个或多个指导RNA能够与该RGN多肽形成复合物,从而将该RGN多肽导向至与该DNA分子的该靶DNA序列结合。
15.如权利要求14所述的系统,其中该靶DNA序列是在细胞内。
16.如权利要求14或权利要求15所述的系统,其中该RGN多肽是无核酸酶活性的或是能够起切口酶的作用,以及其中该RGN多肽可操作地连接至碱基编辑多肽。
17.如权利要求14或15所述的系统,其中该系统还包括一个或多个供体多核苷酸或编码该一个或多个供体多核苷酸的一个或多个核苷酸序列。
18.一种用于结合DNA分子的靶DNA序列的方法,该方法包括将如权利要求14至17中任一项所述的系统递送至该靶DNA序列或包括该靶DNA序列的细胞。
19.一种用于切割或修饰DNA分子的靶DNA序列的方法,该方法包括将如权利要求14至17中任一项所述的系统递送至该靶DNA序列或包括该DNA分子的细胞,以及发生该靶DNA序列的切割或修饰。
20.一种用于结合DNA分子的靶DNA序列的方法,该方法包括:
a)在适合形成RNA指导的核酸酶(RGN)核糖核苷酸复合物的条件下,通过组合:
i)能够与该靶DNA序列杂交的一个或多个指导RNA;以及
ii)RGN多肽,其包括选自由下列组成的群组中的氨基酸序列:
A)具有与SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列同一性的氨基酸序列;
B)如SEQ ID NO:54所示的氨基酸序列,
体外组装该RGN核糖核苷酸复合物;以及
b)使该靶DNA序列或包括该靶DNA序列的细胞与该体外组装的RGN核糖核苷酸复合物接触;
其中该一个或多个指导RNA与该靶DNA序列杂交,从而将该RGN多肽导向至与该靶DNA序列结合。
21.一种用于切割和/或修饰DNA分子的靶DNA序列的方法,该方法包括使该DNA分子与下列接触:
a)RNA指导的核酸酶(RGN)多肽,其中该RGN包括选自由下列组成的群组中的氨基酸序列:
i)具有与SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列同一性的氨基酸序列;
ii)如SEQ ID NO:54所示的氨基酸序列;
b)能够将(a)的该RGN靶向该靶DNA序列的一个或多个指导RNA;
其中该一个或多个指导RNA与该靶DNA序列杂交,从而将该RGN多肽导向至与该靶DNA序列结合,并且发生该靶DNA序列的切割和/或修饰。
22.如权利要求21所述的方法,其中该修饰后靶DNA序列包括该靶DNA序列中的至少一个核苷酸的缺失或突变。
23.如权利要求21或22所述的方法,其中该RGN多肽是无核酸酶活性的或起切口酶的作用,以及其中该RGN多肽可操作地连接至碱基编辑多肽。
24.如权利要求21所述的方法,其中该修饰后靶DNA序列包括异源DNA插入该靶DNA序列内。
25.如权利要求21至24中任一项所述的方法,其中该靶DNA序列是在细胞内。
26.如权利要求25所述的方法,还包括在其中该RGN多肽被表达且切割该靶DNA序列以生成包括修饰后DNA序列的DNA分子的条件下培养该细胞;以及选择包括该修饰后靶DNA序列的细胞。
27.一种包括如权利要求26所述方法的修饰后靶DNA序列的细胞。
28.一种用于结合DNA分子的靶DNA序列的系统,该系统包括:
a)能够与该靶DNA序列杂交的一个或多个指导RNA,或包括编码该一个或多个指导RNA(gRNA)的一个或多个核苷酸序列的一个或多个多核苷酸;以及
b)RNA指导的核酸酶(RGN)多肽,其包括选自由下列组成的群组中的氨基酸序列:
i)具有与SEQ ID NO:117、30、75、1、9、16、23、38、46、61、69、82、89、95、103或110至少95%序列同一性的氨基酸序列;
ii)如SEQ ID NO:54所示的氨基酸序列;
其中该一个或多个指导RNA能够与该靶DNA序列杂交,以及
其中该一个或多个指导RNA能够与该RGN多肽形成复合物,从而将该RGN多肽导向至与该DNA分子的该靶DNA序列结合。
29.一种用于检测样本中的DNA分子的靶DNA序列的方法,该方法包括:
a)使该样本接触:
i)RNA指导的核酸酶(RGN)多肽,其包括具有与SEQ ID NO:54或137至少95%序列同一性的氨基酸序列,其中当与能够与该靶DNA序列杂交的指导RNA结合时,该RGN多肽能够以RNA指导的序列特定方式结合DNA分子的该靶DNA序列;
ii)该指导RNA;以及
iii)不与该指导RNA杂交的检测器单链DNA(ssDNA);以及
b)测量通过该RGN切割该检测器ssDNA所生成的可检测信号,从而检测该靶DNA。
30.一种用于检测样本中的DNA分子的靶DNA序列的试剂盒,该试剂盒包括:
a)RNA指导的核酸酶(RGN)多肽,其包括具有与SEQ ID NO:54或137至少95%序列同一性的氨基酸序列,其中当与能够与该靶DNA序列杂交的指导RNA结合时,该RGN多肽能够以RNA指导的序列特定方式结合DNA分子的该靶DNA序列;
b)该指导RNA;以及
c)不与该指导RNA杂交的检测器单链DNA(ssDNA)。
31.如权利要求29所述的方法或如权利要求30所述的试剂盒,其中该检测器ssDNA包括荧光团/猝灭剂对或荧光共振能量转移(FRET)对。
32.一种切割单链DNA的方法,该方法包括使一群的核酸接触以下a)和b),其中该群包括DNA分子和多个非靶ssDNA,该DNA分子包括靶DNA序列:
a)RNA指导的核酸酶(RGN)多肽,其包括具有与SEQ ID NO:54或137至少95%序列同一性的氨基酸序列,其中当与能够与该靶DNA序列杂交的指导RNA结合时,该RGN多肽能够以RNA指导的序列特定方式结合该靶DNA序列;以及
b)该指导RNA,
其中该RGN多肽切割该多个中的非靶ssDNA。
33.一种包括编码CRISPR RNA(crRNA)的多核苷酸的核酸分子,其中该crRNA包括间隔序列和CRISPR重复序列,其中该CRISPR重复序列包括具有与SEQ ID NO:240至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该crRNA;以及任选地
b)能够与该crRNA的该CRISPR重复序列杂交的反式活化的CRISPR RNA(tracrRNA);
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA能够通过该crRNA的该间隔序列以序列特定方式与DNA分子的靶DNA序列杂交,以及
其中编码crRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
34.一种包括编码反式活化的CRISPR RNA(tracrRNA)的多核苷酸的核酸分子,该tracrRNA包括具有与SEQ ID NO:241至少95%序列同一性的核苷酸序列;
其中指导RNA包括:
a)该tracrRNA;以及
b)包括间隔序列和CRISPR重复序列的crRNA,其中该tracrRNA能够与该crRNA的该CRISPR重复序列杂交;
当该指导RNA与RNA指导的核酸酶(RGN)多肽结合时,该指导RNA能够通过该crRNA的该间隔序列以序列特定方式与DNA分子的靶DNA序列杂交;以及
其中编码tracrRNA的该多核苷酸可操作地连接至与该多核苷酸异源的启动子。
Applications Claiming Priority (8)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962885483P | 2019-08-12 | 2019-08-12 | |
| US62/885,483 | 2019-08-12 | ||
| US201962901875P | 2019-09-18 | 2019-09-18 | |
| US62/901,875 | 2019-09-18 | ||
| US202063030088P | 2020-05-26 | 2020-05-26 | |
| US63/030,088 | 2020-05-26 | ||
| PCT/US2020/045759 WO2021030344A1 (en) | 2019-08-12 | 2020-08-11 | Rna-guided nucleases and active fragments and variants thereof and methods of use |
| CN202080068763.3A CN114641568B (zh) | 2019-08-12 | 2020-08-11 | Rna指导的核酸酶及其活性片段及变体以及使用方法 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080068763.3A Division CN114641568B (zh) | 2019-08-12 | 2020-08-11 | Rna指导的核酸酶及其活性片段及变体以及使用方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN118813654A true CN118813654A (zh) | 2024-10-22 |
Family
ID=72243198
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080068763.3A Active CN114641568B (zh) | 2019-08-12 | 2020-08-11 | Rna指导的核酸酶及其活性片段及变体以及使用方法 |
| CN202411155276.7A Pending CN118813654A (zh) | 2019-08-12 | 2020-08-11 | Rna指导的核酸酶及其活性片段及变体以及使用方法 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202080068763.3A Active CN114641568B (zh) | 2019-08-12 | 2020-08-11 | Rna指导的核酸酶及其活性片段及变体以及使用方法 |
Country Status (12)
| Country | Link |
|---|---|
| US (1) | US20220364074A1 (zh) |
| EP (1) | EP4013864A1 (zh) |
| JP (2) | JP7640527B2 (zh) |
| KR (1) | KR20220062289A (zh) |
| CN (2) | CN114641568B (zh) |
| AU (1) | AU2020329912A1 (zh) |
| BR (1) | BR112022002695A2 (zh) |
| CA (1) | CA3147783A1 (zh) |
| IL (1) | IL290562A (zh) |
| MX (1) | MX2022001849A (zh) |
| TW (1) | TW202120688A (zh) |
| WO (1) | WO2021030344A1 (zh) |
Families Citing this family (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9340799B2 (en) | 2013-09-06 | 2016-05-17 | President And Fellows Of Harvard College | MRNA-sensing switchable gRNAs |
| EP3204496A1 (en) | 2014-10-10 | 2017-08-16 | Editas Medicine, Inc. | Compositions and methods for promoting homology directed repair |
| US12157760B2 (en) | 2018-05-23 | 2024-12-03 | The Broad Institute, Inc. | Base editors and uses thereof |
| US12522807B2 (en) | 2018-07-09 | 2026-01-13 | The Broad Institute, Inc. | RNA programmable epigenetic RNA modifiers and uses thereof |
| WO2020092453A1 (en) | 2018-10-29 | 2020-05-07 | The Broad Institute, Inc. | Nucleobase editors comprising geocas9 and uses thereof |
| BR112021012665A2 (pt) * | 2018-12-27 | 2021-11-03 | Lifeedit Therapeutics Inc | Polipeptídeos úteis para edição de genes e métodos de uso |
| US12351837B2 (en) | 2019-01-23 | 2025-07-08 | The Broad Institute, Inc. | Supernegatively charged proteins and uses thereof |
| CN114127285B (zh) | 2019-03-19 | 2024-09-10 | 布罗德研究所股份有限公司 | 编辑核苷酸序列的方法和组合物 |
| EP3956349A1 (en) | 2019-04-17 | 2022-02-23 | The Broad Institute, Inc. | Adenine base editors with reduced off-target effects |
| US12435330B2 (en) | 2019-10-10 | 2025-10-07 | The Broad Institute, Inc. | Methods and compositions for prime editing RNA |
| TW202208626A (zh) * | 2020-04-24 | 2022-03-01 | 美商生命編輯公司 | Rna引導核酸酶及其活性片段與變體,以及使用方法 |
| DE112021002672T5 (de) | 2020-05-08 | 2023-04-13 | President And Fellows Of Harvard College | Vefahren und zusammensetzungen zum gleichzeitigen editieren beider stränge einer doppelsträngigen nukleotid-zielsequenz |
| EP4176047A1 (en) | 2020-07-01 | 2023-05-10 | Elevatebio Technologies, Inc | Compositions and methods for cellular reprogramming using circular rna |
| EP4182454A1 (en) | 2020-07-15 | 2023-05-24 | Lifeedit Therapeutics, Inc. | Uracil stabilizing proteins and active fragments and variants thereof and methods of use |
| AU2021339805A1 (en) | 2020-09-11 | 2023-05-25 | Life Edit Therapeutics, Inc. | Dna modifying enzymes and active fragments and variants thereof and methods of use |
| WO2022204093A1 (en) | 2021-03-22 | 2022-09-29 | LifeEDIT Therapeutics, Inc. | Dna modifyng enzymes and active fragments and variants thereof and methods of use |
| JP2024516161A (ja) * | 2021-04-22 | 2024-04-12 | エメンドバイオ・インコーポレイテッド | 新規なomni-117、140、150~158、160~165、167~177、180~188、191~198、200、201、203、205~209、211~217、219、220、222、223、226、227、229、231~236、238~245、247、250、254、256、257、260及び262 crisprヌクレアーゼ |
| WO2024077267A1 (en) * | 2022-10-07 | 2024-04-11 | The Broad Institute, Inc. | Prime editing methods and compositions for treating triplet repeat disorders |
| KR20250126155A (ko) | 2022-11-04 | 2025-08-22 | 라이프 에디트 테라퓨틱스, 인크. | 내부 삽입 부위를 갖는 진화된 아데닌 데아미나제 및 rna-가이드 뉴클레아제 융합 단백질 및 사용 방법 |
| EP4634384A1 (en) * | 2022-12-16 | 2025-10-22 | Life Edit Therapeutics, Inc. | Guide rnas that target trac gene and methods of use |
| WO2024178397A2 (en) | 2023-02-24 | 2024-08-29 | Elevatebio Technologies, Inc. | Modified immune effector cells and methods of use |
| WO2025174908A1 (en) * | 2024-02-12 | 2025-08-21 | Life Edit Therapeutics, Inc. | Novel rna-guided nucleases and proteins for polymerase editing |
| WO2026003754A1 (en) | 2024-06-25 | 2026-01-02 | Life Edit Therapeutics, Inc. | Novel reverse transcriptases and uses thereof |
Family Cites Families (75)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4217344A (en) | 1976-06-23 | 1980-08-12 | L'oreal | Compositions containing aqueous dispersions of lipid spheres |
| US4196265A (en) | 1977-06-15 | 1980-04-01 | The Wistar Institute | Method of producing antibodies |
| US4235871A (en) | 1978-02-24 | 1980-11-25 | Papahadjopoulos Demetrios P | Method of encapsulating biologically active materials in lipid vesicles |
| US4186183A (en) | 1978-03-29 | 1980-01-29 | The United States Of America As Represented By The Secretary Of The Army | Liposome carriers in chemotherapy of leishmaniasis |
| US4261975A (en) | 1979-09-19 | 1981-04-14 | Merck & Co., Inc. | Viral liposome particle |
| US4485054A (en) | 1982-10-04 | 1984-11-27 | Lipoderm Pharmaceuticals Limited | Method of encapsulating biologically active materials in multilamellar lipid vesicles (MLV) |
| US4501728A (en) | 1983-01-06 | 1985-02-26 | Technology Unlimited, Inc. | Masking of liposomes from RES recognition |
| US5380831A (en) | 1986-04-04 | 1995-01-10 | Mycogen Plant Science, Inc. | Synthetic insecticidal crystal protein gene |
| US4946787A (en) | 1985-01-07 | 1990-08-07 | Syntex (U.S.A.) Inc. | N-(ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
| US4897355A (en) | 1985-01-07 | 1990-01-30 | Syntex (U.S.A.) Inc. | N[ω,(ω-1)-dialkyloxy]- and N-[ω,(ω-1)-dialkenyloxy]-alk-1-yl-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
| US5049386A (en) | 1985-01-07 | 1991-09-17 | Syntex (U.S.A.) Inc. | N-ω,(ω-1)-dialkyloxy)- and N-(ω,(ω-1)-dialkenyloxy)Alk-1-YL-N,N,N-tetrasubstituted ammonium lipids and uses therefor |
| US4797368A (en) | 1985-03-15 | 1989-01-10 | The United States Of America As Represented By The Department Of Health And Human Services | Adeno-associated virus as eukaryotic expression vector |
| US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
| US4774085A (en) | 1985-07-09 | 1988-09-27 | 501 Board of Regents, Univ. of Texas | Pharmaceutical administration systems containing a mixture of immunomodulators |
| US4853331A (en) | 1985-08-16 | 1989-08-01 | Mycogen Corporation | Cloning and expression of Bacillus thuringiensis toxin gene toxic to beetles of the order Coleoptera |
| US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
| US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
| US4837028A (en) | 1986-12-24 | 1989-06-06 | Liposome Technology, Inc. | Liposomes with enhanced circulation time |
| US5039523A (en) | 1988-10-27 | 1991-08-13 | Mycogen Corporation | Novel Bacillus thuringiensis isolate denoted B.t. PS81F, active against lepidopteran pests, and a gene encoding a lepidopteran-active toxin |
| KR920701453A (ko) | 1989-03-17 | 1992-08-11 | 미리엄 디. 멕코나헤이 | 유전자발현의 외부조절 |
| ES2187497T3 (es) | 1990-04-12 | 2003-06-16 | Syngenta Participations Ag | Promotores preferentemente en tejidos. |
| US5264618A (en) | 1990-04-19 | 1993-11-23 | Vical, Inc. | Cationic lipids for intracellular delivery of biologically active molecules |
| WO1991017424A1 (en) | 1990-05-03 | 1991-11-14 | Vical, Inc. | Intracellular delivery of biologically active substances by means of self-assembling lipid complexes |
| US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
| CA2051562C (en) | 1990-10-12 | 2003-12-02 | Jewel M. Payne | Bacillus thuringiensis isolates active against dipteran pests |
| US5173414A (en) | 1990-10-30 | 1992-12-22 | Applied Immune Sciences, Inc. | Production of recombinant adeno-associated virus vectors |
| US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
| US5604121A (en) | 1991-08-27 | 1997-02-18 | Agricultural Genetics Company Limited | Proteins with insecticidal properties against homopteran insects and their use in plant protection |
| TW261517B (zh) | 1991-11-29 | 1995-11-01 | Mitsubishi Shozi Kk | |
| US5587308A (en) | 1992-06-02 | 1996-12-24 | The United States Of America As Represented By The Department Of Health & Human Services | Modified adeno-associated virus vector capable of expression from a novel promoter |
| US5789156A (en) | 1993-06-14 | 1998-08-04 | Basf Ag | Tetracycline-regulated transcriptional inhibitors |
| US5814618A (en) | 1993-06-14 | 1998-09-29 | Basf Aktiengesellschaft | Methods for regulating gene expression |
| US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
| US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
| US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
| US5659026A (en) | 1995-03-24 | 1997-08-19 | Pioneer Hi-Bred International | ALS3 promoter |
| US6072050A (en) | 1996-06-11 | 2000-06-06 | Pioneer Hi-Bred International, Inc. | Synthetic promoters |
| ATE342985T1 (de) | 1998-02-26 | 2006-11-15 | Pioneer Hi Bred Int | Mais alpha-tubulin 3-18 promoter |
| US6534261B1 (en) | 1999-01-12 | 2003-03-18 | Sangamo Biosciences, Inc. | Regulation of endogenous gene expression in cells using zinc finger proteins |
| EP1173578A2 (en) | 1999-05-04 | 2002-01-23 | Monsanto Company | Coleopteran-toxic polypeptide compositions and insect-resistant transgenic plants |
| EP1218513A2 (en) | 1999-09-15 | 2002-07-03 | Monsanto Technology LLC | Lepidopteran-active bacillus thuringiensis delta-endotoxin compositions and methods of use |
| US20050183161A1 (en) | 2003-10-14 | 2005-08-18 | Athenix Corporation | AXMI-010, a delta-endotoxin gene and methods for its use |
| US7629504B2 (en) | 2003-12-22 | 2009-12-08 | Pioneer Hi-Bred International, Inc. | Bacillus thuringiensis cry9 nucleic acids |
| AU2007260716B2 (en) | 2006-06-14 | 2013-05-02 | BASF Agricultural Solutions Seed US LLC | Axmi-031, axmi-039, axmi-040 and axmi-049, a family of delta-endotoxin genes and methods for their use |
| EP3208339B1 (en) | 2008-09-15 | 2019-05-01 | The Children's Medical Center Corporation | Modulation of bcl11a for treatment of hemoglobinopathies |
| WO2011002992A1 (en) | 2009-07-02 | 2011-01-06 | Athenix Corp. | Axmi-205 pesticidal gene and methods for its use |
| WO2011084324A2 (en) | 2009-12-21 | 2011-07-14 | Pioneer Hi-Bred International, Inc. | Novel bacillus thuringiensis gene with lepidopteran activity |
| US10167547B2 (en) | 2009-12-24 | 2019-01-01 | Jx Nippon Mining & Metals Corporation | Gadolinium sputtering target and production method of said target |
| CA2807375A1 (en) | 2010-08-19 | 2012-02-23 | Pioneer Hi-Bred International, Inc. | Novel bacillus thuringiensis gene with lepidopteran activity |
| US9405700B2 (en) | 2010-11-04 | 2016-08-02 | Sonics, Inc. | Methods and apparatus for virtualization in an integrated circuit |
| PT3241902T (pt) * | 2012-05-25 | 2018-05-28 | Univ California | Métodos e composições para modificação de adn alvo dirigida por arn e para modulação dirigida por arn de transcrição |
| DK2872625T3 (en) | 2012-07-11 | 2017-02-06 | Sangamo Biosciences Inc | METHODS AND COMPOSITIONS FOR TREATING LYSOSOMAL STORAGE DISEASES |
| US20160298096A1 (en) * | 2013-11-18 | 2016-10-13 | Crispr Therapeutics Ag | Crispr-cas system materials and methods |
| US20150165054A1 (en) | 2013-12-12 | 2015-06-18 | President And Fellows Of Harvard College | Methods for correcting caspase-9 point mutations |
| EP3186375A4 (en) | 2014-08-28 | 2019-03-13 | North Carolina State University | Novel CAS9 PROTEINS AND CHARACTERISTICS FOR DNA TARGETING AND GENOME EDITING |
| US11208638B2 (en) * | 2015-01-12 | 2021-12-28 | The Regents Of The University Of California | Heterodimeric Cas9 and methods of use thereof |
| WO2016186953A1 (en) * | 2015-05-15 | 2016-11-24 | Pioneer Hi Bred International Inc | Guide rna/cas endonuclease systems |
| US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
| US10167457B2 (en) | 2015-10-23 | 2019-01-01 | President And Fellows Of Harvard College | Nucleobase editors and uses thereof |
| US20190161742A1 (en) * | 2016-03-11 | 2019-05-30 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
| EP3426778A1 (en) | 2016-03-11 | 2019-01-16 | Pioneer Hi-Bred International, Inc. | Novel cas9 systems and methods of use |
| EP3481857B1 (en) * | 2016-07-06 | 2026-02-11 | Vertex Pharmaceuticals Incorporated | Materials and methods for treatment of pain related disorders |
| KR20250103795A (ko) | 2016-08-03 | 2025-07-07 | 프레지던트 앤드 펠로우즈 오브 하바드 칼리지 | 아데노신 핵염기 편집제 및 그의 용도 |
| CN108070611B (zh) * | 2016-11-14 | 2021-06-29 | 中国科学院遗传与发育生物学研究所 | 植物碱基编辑方法 |
| US11542496B2 (en) * | 2017-03-10 | 2023-01-03 | President And Fellows Of Harvard College | Cytosine to guanine base editor |
| BR112019019655A2 (pt) * | 2017-03-23 | 2020-04-22 | Harvard College | editores de nucleobase que compreendem proteínas de ligação a dna programáveis por ácido nucleico |
| EP3601576A1 (en) * | 2017-03-24 | 2020-02-05 | CureVac AG | Nucleic acids encoding crispr-associated proteins and uses thereof |
| BR112019023377A2 (pt) * | 2017-05-11 | 2020-06-16 | Institute Of Genetics And Developmental Biology, Chinese Academy Of Sciences | Criação de um gene resistente a herbicida e uso do mesmo |
| CN110997728A (zh) * | 2017-05-25 | 2020-04-10 | 通用医疗公司 | 二分型碱基编辑器(bbe)结构和ii-型-cas9锌指编辑 |
| WO2019036185A1 (en) | 2017-08-15 | 2019-02-21 | The Regents Of The University Of California | COMPOSITIONS AND METHODS FOR IMPROVING GENOMIC SEQUENCE CORRECTION |
| WO2019051097A1 (en) * | 2017-09-08 | 2019-03-14 | The Regents Of The University Of California | RNA-GUIDED ENDONUCLEASE FUSION POLYPEPTIDES AND METHODS OF USING SAME |
| MA50877A (fr) * | 2017-11-21 | 2020-09-30 | Bayer Healthcare Llc | Matériaux et méthodes pour le traitement de la rétinite pigmentaire autosomique dominante |
| CA3084185A1 (en) * | 2017-12-06 | 2019-06-13 | Generation Bio Co. | Gene editing using a modified closed-ended dna (cedna) |
| KR20210089629A (ko) | 2018-06-05 | 2021-07-16 | 라이프에디트 테라퓨틱스, 인크. | Rna-가이드된 뉴클레아제 및 그의 활성 단편 및 변이체 및 사용 방법 |
| EP4023766B1 (en) * | 2018-09-20 | 2024-04-03 | Institute Of Zoology, Chinese Academy Of Sciences | Method for detecting nucleic acid |
-
2020
- 2020-08-11 CA CA3147783A patent/CA3147783A1/en active Pending
- 2020-08-11 BR BR112022002695A patent/BR112022002695A2/pt unknown
- 2020-08-11 CN CN202080068763.3A patent/CN114641568B/zh active Active
- 2020-08-11 KR KR1020227008114A patent/KR20220062289A/ko active Pending
- 2020-08-11 CN CN202411155276.7A patent/CN118813654A/zh active Pending
- 2020-08-11 TW TW109127218A patent/TW202120688A/zh unknown
- 2020-08-11 MX MX2022001849A patent/MX2022001849A/es unknown
- 2020-08-11 AU AU2020329912A patent/AU2020329912A1/en active Pending
- 2020-08-11 EP EP20761938.8A patent/EP4013864A1/en active Pending
- 2020-08-11 US US17/634,723 patent/US20220364074A1/en active Pending
- 2020-08-11 WO PCT/US2020/045759 patent/WO2021030344A1/en not_active Ceased
- 2020-08-11 JP JP2022509175A patent/JP7640527B2/ja active Active
-
2022
- 2022-02-13 IL IL290562A patent/IL290562A/en unknown
-
2025
- 2025-02-20 JP JP2025025892A patent/JP2025086912A/ja active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| KR20220062289A (ko) | 2022-05-16 |
| TW202120688A (zh) | 2021-06-01 |
| CN114641568A (zh) | 2022-06-17 |
| US20220364074A1 (en) | 2022-11-17 |
| CA3147783A1 (en) | 2021-02-18 |
| JP2022545385A (ja) | 2022-10-27 |
| MX2022001849A (es) | 2022-03-11 |
| AU2020329912A1 (en) | 2022-03-24 |
| JP7640527B2 (ja) | 2025-03-05 |
| BR112022002695A2 (pt) | 2022-08-23 |
| WO2021030344A1 (en) | 2021-02-18 |
| IL290562A (en) | 2022-04-01 |
| CN114641568B (zh) | 2024-09-06 |
| EP4013864A1 (en) | 2022-06-22 |
| JP2025086912A (ja) | 2025-06-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7640527B2 (ja) | Rna誘導ヌクレアーゼ及びその活性断片及び変異体ならびに使用方法 | |
| US12338455B2 (en) | RNA-guided nucleases and active fragments and variants thereof and methods of use | |
| US12188018B2 (en) | Polypeptides useful for gene editing and methods of use | |
| CN116096879A (zh) | Rna引导的核酸酶及其活性片段和变体以及使用方法 | |
| EA049684B1 (ru) | Рнк-направляемые нуклеазы, их активные фрагменты и варианты, а также способы применения | |
| EA047491B1 (ru) | Рнк-направляемые нуклеазы, их активные фрагменты и варианты, а также способы применения | |
| HK40063040A (zh) | 可用於基因编辑的多肽及使用方法 | |
| HK40063040B (zh) | 可用於基因编辑的多肽及使用方法 | |
| HK40050306B (zh) | Rna-指导的核酸酶及其活性片段和变体及其使用方法 | |
| HK40050306A (zh) | Rna-指导的核酸酶及其活性片段和变体及其使用方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |