CN119836432A

CN119836432A - 用于pcsk9表达的表观遗传调节的组合物和方法

Info

Publication number: CN119836432A
Application number: CN202380051043.XA
Authority: CN
Inventors: N·阿布巴克; A·弗里德兰; M·梅德; V·迈尔; F·特伦布雷; M·S·莫里森
Original assignee: Enkoloma Biological Co
Current assignee: Enkoloma Biological Co
Priority date: 2022-05-01
Filing date: 2023-05-01
Publication date: 2025-04-15
Also published as: KR20250060954A; CA3251776A1; JP2025516294A; MX2024013483A; WO2023215711A9; AU2023265968A1; EP4519293A1; IL316722A; WO2023215711A1

Abstract

本申请涉及包含用于PCSK9的表观遗传修饰的表观遗传编辑器的组合物和方法，以及编码该表观遗传编辑器的核酸和载体。还公开了由表观遗传编辑器表观遗传修饰的细胞。

Description

用于PCSK9表达的表观遗传调节的组合物和方法

相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求2022年5月1日提交的题为“用于PCSK9表达的表观遗传调节的组合物和方法”的美国临时申请No.63/337,164、2022年5月1日提交的题为“用于PCSK9表达的表观遗传调节的组合物和方法”的美国临时申请No.63/337,167和2022年6月23日提交的题为“用于PCSK9表达的表观遗传调节的组合物和方法”的美国临时申请No.63/355,083的权益，其各自的全部公开内容通过引用整体并入本文。

参考电子序列表

电子序列表(C169870034WO00-SEQ-AXW.xml；大小：1,831,551字节；和创建日期：2023年5月1日)的内容通过引用整体并入本文。

背景技术

十多年来，基因组编辑一直被认为是一种有前途的治疗遗传疾病的治疗方法。然而，考虑到不期望的双链DNA断裂、异质性修复(包括在预期位点的大的和小的插入和缺失)以及毒性的可能性，使用传统遗传编辑器在DNA水平上进行操作仍然是有风险的。相反，靶向表观遗传修饰提供了改变基因表达而不导致双链断裂诱导的遗传毒性的潜力。

一个有希望的表观遗传沉默候选物是前蛋白转化酶枯草杆菌蛋白酶/kexin 9型(PCSK9)基因。PCSK9是治疗心脏病的关键靶标，心脏病是全世界死亡的主要原因((Berberich et al.,Nature Rev Cardiol.(2019)16(1):9-20)。位于1号染色体上的人PCSK9基因与其食蟹猴和小鼠对应物分别具有约94％和80％的同源性。该基因在启动子区具有CpG岛，并且远离其他基因和顺式调节特征。PCSK9蛋白主要由肝脏产生。

在人类中，PCSK9由于与LDL受体(LDLR)结合而在调节低密度脂蛋白(LDL)颗粒的循环水平中起关键作用。LDLR通过介导LDL颗粒在细胞中的内吞和降解来降低LDL颗粒的循环浓度。在不存在PCSK9的情况下，或者如果PCSK9与LDLR的相互作用被阻断，则LDLR再循环到细胞表面的速率增加，并且再循环的LDLR蛋白继续从细胞外液中去除LDL颗粒(Tomblinget al.,Atherosclerosis(2021)330:52-60)。相反，当内吞的LDLR与PCSK9结合时，LDLR与其乘客LDL颗粒一起降解。临床和遗传学研究已经确定循环LDL导致动脉粥样硬化性心血管疾病(Ference et al.,Eur Heart J(2017)38:2459-72)。此外，PCSK9中的功能丧失突变与低LDL水平相关(Zhao et al.,Am J Hum Genet.(2006)79(3):514-23)。遗传或药理学降低PCSK9可减少心血管事件(Ference et al.,N Engl J Med.(2016)375(22):2144-53；Sabatine et al.,N Engl J Med.(2017)376(18):1713-22)。降低PCSK9表达有助于增加LDLR的再循环，这将导致较低的血液LDL颗粒浓度。

鉴于PCSK9在高胆固醇血症和心血管疾病发病机制中的关键作用，需要靶向PCSK9表达的新的和改进的疗法。

发明概述

本公开提供了用于表观遗传修饰的系统和组合物(本文中的“表观遗传编辑器”或“表观遗传编辑系统”)，以及使用其在PCSK9处产生表观遗传修饰的方法，包括在宿主细胞和生物体中。

在一些方面，本公开提供了用于抑制人细胞(任选地人肝细胞)中人PCSK9基因转录的系统，其包括：

a)一种或多种融合蛋白，其共同包含

DNA甲基转移酶(DNMT)结构域和/或招募DNMT的结构域，任选地其中所述DNMT结构域和/或所述招募结构域包含DNMT3A结构域和/或DNMT3L结构域，并且任选地其中所述招募的DNMT是DNMT3A，和

转录阻遏结构域，

每个结构域与结合人PCSK9基因中靶区域的DNA结合结构域连接；或

b)编码所述一种或多种融合蛋白的一种或多种核酸分子。

在一些实施方案中，DNA结合结构域结合SEQ ID NO:1488或1489中的靶序列。在某些实施方案中，DNA结合结构域将融合蛋白靶向PCSK9基因中选自SEQ ID NO:700-747和1036-1261的一个或多个序列。

在一些实施方案中，DNA结合结构域包含死亡CRISPR Cas(dCas)结构域、ZFP结构域或TALE结构域。例如，DNA结合结构域可以包含dCas9结构域，并且系统可以进一步包含(i)一种或多种指导RNA(例如，包含SEQ ID NO:1262-1487中的任一个)，或(ii)编码一种或多种指导RNA的核酸分子。在某些实施方案中，dCas结构域包含dCas9序列，例如与SEQ IDNO:12或13具有至少90％同一性的序列。

在一些实施方案中，融合蛋白包含死亡CRISPR Cas(dCas)结构域，并且系统包含本文提供的一种或多种结合PCSK9的指导RNA(gRNA)。在一些实施方案中，系统包含单个gRNA。在一些实施方案中，系统包含2个gRNA。在一些实施方案中，系统包含3个gRNA。在一些实施方案中，系统包含4个gRNA。在一些实施方案中，系统包含5个或更多个gRNA。在一些实施方案中，系统包含选自表2中提供的gRNA的gRNA。在一些实施方案中，系统包含选自表7中提供的gRNA的gRNA。在一些实施方案中，系统包含选自表8中提供的gRNA的gRNA。在一些实施方案中，系统包含选自表10中提供的gRNA的sgRNA。在一些实施方案中，系统包含选自表12中提供的gRNA的gRNA。

在一些实施方案中，系统包含含有表10的gRNA009的gRNA靶向序列的gRNA，或结合与gRNA009相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA003的gRNA靶向序列的gRNA，或结合与gRNA003相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA093的gRNA靶向序列的gRNA，或结合与gRNA093相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA011的gRNA靶向序列的gRNA，或结合与gRNA011相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA007的gRNA靶向序列的gRNA，或结合与gRNA007相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA077的gRNA靶向序列的gRNA，或结合与gRNA077相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA113的gRNA靶向序列的gRNA，或结合与gRNA113相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA004的gRNA靶向序列的gRNA，或结合与gRNA004相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA008的gRNA靶向序列的gRNA，或结合与gRNA008相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA012的gRNA靶向序列的gRNA，或结合与gRNA012相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA111的gRNA靶向序列的gRNA，或结合与gRNA111相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA005的gRNA靶向序列的gRNA，或结合与gRNA005相同的靶结构域序列的gRNA。在一些实施方案中，系统包含含有表10的gRNA013的gRNA靶向序列的gRNA，或结合与gRNA013相同的靶结构域序列的gRNA。

在一些实施方案中，系统包含融合蛋白9变体1(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白9变体2(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白10(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白11(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白12(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白13(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白14(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白15(实施例12)和gRNA g041。在一些实施方案中，系统包含融合蛋白9变体1(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白9变体2(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白10(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白11(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白12(实施例12)和gRNAg049。在一些实施方案中，系统包含融合蛋白13(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白14(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白15(实施例12)和gRNA g049。在一些实施方案中，系统包含融合蛋白9变体1(实施例12)以及gRNA g041和g049。在一些实施方案中，系统包含融合蛋白9变体2(实施例12)以及gRNAg041和g049。在一些实施方案中，系统包含融合蛋白10(实施例12)以及gRNA g041和g049。在一些实施方案中，系统包含融合蛋白11(实施例12)以及gRNA g041和g049。在一些实施方案中，系统包含融合蛋白12(实施例12)以及gRNA g041和g049。在一些实施方案中，系统包含融合蛋白13(实施例12)以及gRNA g041和g049。在一些实施方案中，系统包含融合蛋白14(实施例12)以及gRNA g041和g049。在一些实施方案中，系统包含融合蛋白15(实施例12)以及gRNA g041和g049。

在一些实施方案中，DNA结合结构域包含靶向选自SEQ ID NO:700-747的核苷酸序列的ZFP结构域。在某些实施方案中，ZFP结构域依次包含如表1中所示的ZF001至ZF048中任一个的F1-F6氨基酸序列。

在一些实施方案中，DNMT3A结构域包含与SEQ ID NO:574或575具有至少90％同一性的序列。

DNMT3L结构域可以包含例如与选自SEQ ID NO:578-581的序列具有至少90％同一性的序列。在一些实施方案中，DNMT3L结构域包含与选自SEQ ID NO:582-603的序列具有至少90％同一性的序列。在一些实施方案中，DNMT3L结构域包含与选自SEQ ID NO:601-603的序列具有至少90％同一性的序列。

在一些实施方案中，转录阻遏结构域包含与选自SEQ ID NO:33-570的序列具有至少90％同一性的序列。在某些实施方案中，转录阻遏结构域是衍生自KOX1、ZIM3、ZFP28或ZN627的KRAB结构域。KRAB结构域可以包含例如与选自SEQ ID NO:89、116、245和255的序列具有至少90％同一性的序列。在一些实施方案中，转录阻遏结构域包含ZIM3和KOX1 KRAB的N-和C-末端区域的融合物，并且任选地包含SEQ ID NO:571或572的氨基酸序列。在某些实施方案中，转录阻遏结构域衍生自KAP1、MECP2、HP1a/CBX5、HP1b、CBX8、CDYL2、TOX、TOX3、TOX4、EED、EZH2、RBBP4、RCOR1或SCML2。

在一些实施方案中，所述系统包括

a)融合蛋白，其包含DNMT3A结构域、DNMT3L结构域、转录阻遏结构域和DNA结合结构域，

任选地，其中所述DNMT3A结构域和所述DNMT3L结构域中的一个或两个是人的，并且

任选地，其中所述DNA结合结构域是死亡CRISPR Cas结构域或ZFP结构域；或

b)编码融合蛋白的核酸分子。

在某些实施方案中，融合蛋白从N末端到C末端包含DNMT3A结构域、第一肽接头、DNMT3L结构域、第二肽接头、DNA结合结构域、第三肽接头和转录阻遏结构域。例如，融合蛋白从N末端到C末端可以包含DNMT3A结构域、第一肽接头、DNMT3L结构域、第二肽接头、第一核定位信号(NLS)、DNA结合结构域、第二NLS、第三肽接头和转录阻遏结构域。融合蛋白从N末端到C末端可以包含第一NLS、DNMT3A结构域、第一肽接头、DNMT3L结构域、第二肽接头、DNA结合结构域、第三肽接头、转录阻遏结构域和第二NLS。融合蛋白从N末端到C末端可以包含第一和第二NLS、DNMT3A结构域、第一肽接头、DNMT3L结构域、第二肽接头、DNA结合结构域、第三肽接头、转录阻遏结构域以及第三和第四NLS。在特定的实施方案中，转录阻遏结构域是KRAB结构域，例如人KOX1、ZFP28、ZN627或ZIM3 KRAB结构域。在特定的实施方案中，第二和第三肽接头中的一个或两个是XTEN接头，其可以选自XTEN80(例如，SEQ ID NO:643)和XTEN16(例如，SEQ ID NO:638)，例如，其中第二肽接头是XTEN80，并且第三肽接头是XTEN16。

在一些实施方案中，融合蛋白从N末端到C末端可以包含人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、第一NLS、dSpCas9结构域、第二NLS、XTEN16肽接头和人KOX1 KRAB结构域。在某些实施方案中，融合蛋白包含SEQ ID NO:658或与其至少90％相同的序列。在某些实施方案中，融合蛋白包含SEQ ID NO:1495或与其至少90％相同的序列。

在一些实施方案中，融合蛋白从N末端到C末端包含人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、第一NLS、ZFP结构域、第二NLS、XTEN16接头和人KOX1 KRAB结构域。在某些实施方案中，融合蛋白包含SEQ ID NO:659或与其至少90％相同的序列，任选地其中ZFP依次包含如表1中所示的ZF001至ZF048中任一个的F1-F6氨基酸序列。在某些实施方案中，融合蛋白包含SEQ ID NO:1496或与其至少90％相同的序列，任选地其中ZFP依次包含如表1中所示的ZF001至ZF048中任一个的F1-F6氨基酸序列。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人KOX1KRAB结构域以及第三和第四NLS。在特定的实施方案中，融合蛋白可以包含SEQ ID NO:660的氨基酸序列或与其至少90％相同的序列。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人KOX1 KRAB结构域以及第三和第四NLS。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人ZFP28KRAB结构域以及第三和第四NLS。在特定的实施方案中，融合蛋白可以包含SEQ ID NO:661的氨基酸序列或与其至少90％相同的序列。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人ZFP28 KRAB结构域以及第三和第四NLS。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人ZN627KRAB结构域以及第三和第四NLS。在特定的实施方案中，融合蛋白可以包含SEQ ID NO:662的氨基酸序列或与其至少90％相同的序列。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人ZN627 KRAB结构域以及第三和第四NLS。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人ZIM3KRAB结构域以及第三和第四NLS。在特定的实施方案中，融合蛋白可以包含SEQ ID NO:663的氨基酸序列或与其至少90％相同的序列。

在一些实施方案中，融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人ZIM3 KRAB结构域以及第三和第四NLS。

在一些实施方案中，本文所述的融合蛋白中的NLS的至少一个是SV40 NLS(例如，SEQ ID NO:644)。

在一些实施方案中，系统包括：

a)包含第一DNA结合结构域并且包含或招募DNMT3A结构域的第一融合蛋白，

包含第二DNA结合结构域并且包含或招募DNMT3L结构域的第二融合蛋白，和

包含第三DNA结合结构域并且包含或招募转录阻遏结构域的第三融合蛋白；或

b)一种或多种编码融合蛋白的核酸分子。

本公开还提供了包含本文所述系统的人细胞或该细胞的后代。在一些实施方案中，所述细胞是肝细胞。

本公开还提供了药物组合物，其包含本文所述的系统和药学上可接受的赋形剂。在一些实施方案中，组合物包含脂质纳米颗粒(LNP)，其包含所述系统，和/或DNA结合结构域是dCas结构域，并且LNP还包含一种或多种gRNA。

本公开还提供了治疗有此需要的患者的方法，其包括向患者施用本文所述的系统或药物组合物(例如，静脉内)。在一些实施方案中，患者患有心脏病；低密度脂蛋白胆固醇(LDL-C)升高或高胆固醇血症；处于发展心肌梗塞、中风或不稳定型心绞痛的风险中；和/或患有原发性高脂血症(例如，杂合子家族性高胆固醇血症(HeFH)或纯合子家族性高胆固醇血症(HoFH))。

本公开还提供了本文所述的系统或药物组合物，其用于例如在本文所述的方法中治疗有此需要的患者。

本公开还提供了本文所述的系统在制备用于治疗有此需要的患者的药物中的用途，例如在本文所述的方法中。

本公开还提供了包含本文所述系统的制品和试剂盒。

所公开的方法和组合物的其他特征、目的和优点在下面的详细描述中是显而易见的。然而，应当理解，详细描述虽然指示了所公开的方法和组合物的实施例和实施方案，但仅以说明的方式给出，而不是限制。根据详细描述，本公开范围内的各种变化和修改对于本领域技术人员将成为显而易见的。

附图说明

图1是显示ZF蛋白和计算设计的gRNA在PCSK9基因上的预测结合位置的图。

图2是显示用CRISPR-off(DNMT3A-3L-dCas9-KRAB)处理的细胞中第7天的相对PCSK9表达(y轴)的散点图。从gRNA靶位点到PCSK9 TSS的基因组距离显示在x轴上。

图3是显示前40个gRNA与PCSK9基因重叠的图。

图4A是显示在用所示gRNA处理后第7天和第28天分泌的PCSK9水平的条形图。虚线显示野生型(WT)Cas9实现的沉默。

图4B是显示用gRNA处理后细胞中PCSK9 mRNA表达和PCSK9蛋白分泌的相关性的散点图。CRISPRi(dCas9-KRAB)代表dCas9-KRAB融合蛋白。

图5是显示用CRISPRi(dCas9-KRAB)、CRISPR-off(DNMT3A-3L-dCas9-KRAB)和所示gRNA处理后PCSK9沉默的线图。

图6是显示与仅用CRISPRoff系统处理的细胞相比，用CRISPRoff和辛伐他汀处理的细胞中PCSK9分泌的条形图。

图7是显示用CRISPRoff和给定gRNA处理的Huh7肝癌细胞中PCSK9分泌减少的条形图。

图8是显示247种靶向PCSK9的ZF蛋白的活性和毒性的散点图。相对PCSK9表达显示在x轴上，相对于pUC和脱靶对照的相应细胞计数显示在y轴上。对角线表示相对PCSK9表达与细胞计数之间的1：1相关性。

图9是显示用ZF-off(DNMT3A-3L-ZF-KRAB)构建体处理的细胞的相对PCSK9表达(y轴)和相对于PCSK9转录起始位点(TSS)的相应靶向基因组距离(x轴)的散点图。

图10是显示整个人PCSK9基因座侧接35.5kb和7kb的上游和下游基因组区域(67.5kb)被引入转基因小鼠并在转基因小鼠中表达的图。该转基因小鼠系在其自身(人)内源性启动子的控制下表达人PCSK9。

图11A显示了具有变体NLS构型的融合蛋白构建体的示意图。图11B显示了具有变体KRAB结构域的另外的融合蛋白构建体的示意图。

图12A-12B是显示在使用6.25ng RNA(图12A)或2.5ng RNA(图12B)在HeLa细胞中用具有各种NLS位置的融合蛋白构建体处理后测量的PCSK9蛋白水平的百分比的图。人和鼠DNMT3L序列分别表示为h3L和m3L。

图13是显示具有2X NLS的构建体在沉默Hepa1-6细胞中的mPcsk9方面比CRISPR-off高效3倍的图。

图14A是显示具有2X NLS的构建体在沉默Huh7细胞中的mPcsk9方面比CRISPR-off更有效的图。图14B-14C是显示在第5天(图14B)和第15天(图14C)在不同剂量下，具有2XNLS的构建体在沉默Huh7细胞中的mPcsk9方面也比CRISPR-off更有效的图。

图15是显示在Huh7细胞中，在其中dCas9被替换成锌指的CRISPR-off样型式中，2XNLS在多个ZF中提供改善的图。

图16是显示用细菌DNMT蛋白甲基化CTLA4启动子可以诱导基因座的表观遗传沉默的一组图。

图17是显示第30天用携带融合至dCas9的细菌DNA甲基转移酶的不同构建体处理的细胞的VIM3基因座处的甲基化谱的一组图。用M.SssI处理的样品甲基化了20％。

图18是显示第29天通过细胞的CLTA基因座处的杂交捕获的甲基化谱比较dCas9融合物中M.SssI与鼠DNMT3A/3L的一组图。

图19A-19D是显示当使用以CLTA-GFP作为标志物的0.5ng效应子DNA(图19A)、以GFP作为标志物的3ng效应子DNA(图19B)和以GFP作为标志物的0.5ng效应子DNA(图19C)时测试针对CRISPR-off的表观沉默活性的替代KRAB结构域的一组图。图19D显示了使用不同纳克量的效应子DNA 30天后的结果。

发明详述

本公开提供了用于调节PCSK9基因表达的表观遗传编辑器。通过改变PCSK9的表达，本文所述的系统、组合物和方法可用于治疗例如高胆固醇血症(例如，杂合子家族性高胆固醇血症(HeFH)、纯合子家族性高胆固醇血症(HoFH)、家族性高胆固醇血症(HF)或已确定的动脉粥样硬化性心血管疾病(ASCVD))或肾功能不全(RI)的病症。除非另有说明，“PCSK9”在本文中是指人PCSK9。人PCSK9基因序列可见于Ensembl登录号ENSG00000169174。与其他基因组工程方法相比，所述表观遗传编辑器具有几个优点，包括可逆性、易位风险降低和持久的可遗传沉默。

在一些实施方案中，靶向用于表观遗传调节的人PCSK9基因的区域长约2kb，并且约为PCSK9 TSS的+/-1kb。在某些实施方案中，该区域具有SEQ ID NO:1488的核苷酸序列。在一些实施方案中，被靶向的PCSK9区域长约1069bp，并且约为PCSK9 TSS的+/-500bp。在某些实施方案中，被靶向的区域具有SEQ ID NO:1489的核苷酸序列。PCSK9的TSS位于基因组GRCh38的#chr1：55039548。

在一些实施方案中，如本文所述的表观遗传编辑器可以包含一种或多种融合蛋白，其中每种融合蛋白包含DNA结合结构域，其与一个或多个用于表观遗传修饰的效应结构域连接。在某些实施方案中，其中DNA结合结构域是多核苷酸指导的DNA结合结构域，表观遗传编辑器可以进一步包含一个或多个指导多核苷酸。如本文所述的表观遗传编辑器的DNA结合结构域、效应结构域和指导多核苷酸可以以任何功能组合选自例如下文所述的那些。

本文所述的表观遗传编辑器可以在宿主细胞中瞬时表达，或者可以整合到宿主细胞的基因组中；本公开还考虑了此类细胞及其后代。瞬时表达和整合的表观遗传编辑器或其组分都可以实现稳定的表观遗传修饰。例如，在将本文所述的表观遗传编辑器引入宿主细胞后，宿主细胞中的靶基因可以被稳定地或永久地抑制或沉默。在一些实施方案中，与不存在表观遗传编辑器时的表达水平相比，靶基因的表达降低或沉默至少1周、至少2周、至少3周、至少4周、至少5周、至少6周、至少7周、至少2个月、至少3个月、至少4个月、至少5个月、至少6个月、至少1年、至少2年或者细胞或携带细胞的受试者的整个生命期。表观遗传修饰可以由引入表观遗传编辑器的宿主细胞的后代遗传。

可以将本发明的表观遗传编辑器引入有此需要的患者(例如，人患者)，例如引入患者的肝细胞、胆管上皮细胞(胆管细胞)、星状细胞、库普弗细胞和肝窦内皮细胞。

I.DNA结合结构域

本文所述的表观遗传编辑器可以包含一个或多个DNA结合结构域，其将表观遗传编辑器的效应结构域引导至PCSK9基因座内或附近的靶序列。如本文所述的DNA结合结构域可以是例如多核苷酸指导的DNA结合结构域、锌指蛋白(ZFP)结构域、转录激活因子样效应子(TALE)结构域、大范围核酸酶DNA结合结构域等。DNA结合结构域的示例可以在美国专利11,162,114中找到，其通过引用整体并入本文。

在一些实施方案中，本文所述的DNA结合结构域由其天然编码序列编码。在其他实施方案中，DNA结合结构域由已被密码子优化以在人细胞中最佳表达的核苷酸序列编码。

A.多核苷酸指导的DNA结合结构域

在一些实施方案中，本文的DNA结合结构域可以是由指导核酸序列(例如，指导RNA序列)引导至PCSK9基因座中的靶位点的蛋白质结构域。在某些实施方案中，蛋白质结构域可以衍生自CRISPR相关核酸酶，例如I类或II类CRISPR相关核酸酶。在一些实施方案中，蛋白质结构域可以衍生自Cas核酸酶，例如II型、IIA型、IIB型、IIC型、V型或VI型Cas核酸酶。在某些实施方案中，蛋白质结构域可以衍生自II类Cas核酸酶，所述II类Cas核酸酶选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cas14a、Cas14b、Cas14c、CasX、CasY、CasPhi、C2c4、C2c8、C2c9、C2c10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4及其同源物和修饰版本。“衍生自”用于表示蛋白质结构域包含亲本蛋白质的完整多肽序列，或包含其变体(例如，具有氨基酸残基缺失、插入和/或取代)。变体保留了亲本蛋白的所需功能(例如，与指导核酸序列和靶DNA形成复合物的能力)。

在一些实施方案中，CRISPR相关蛋白结构域可以是本文所述的Cas9结构域。例如，Cas9可以指与本文所述的野生型Cas9多肽具有至少约85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性和/或序列相似性的多肽。在一些实施方案中，所述野生型多肽是来自酿脓链球菌(Streptococcus pyogenes)的Cas9(NCBIRef.No.NC_002737.2(SEQ ID NO:1))和/或UniProt Ref.No.Q99ZW2(SEQ ID NO:2)。在一些实施方案中，所述野生型多肽是来自金黄色葡萄球菌(Staphylococcus aureus)的Cas9(SEQ ID NO:3)。在一些实施方案中，CRISPR相关蛋白结构域是Cpf1结构域或蛋白，或与本文所述的野生型Cpf1多肽(例如，来自新杀弗朗西斯菌(Franscisella novicida)的Cpf1(UniProt Ref.No.U2UMQ6或SEQ ID NO:4))具有至少约85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性和/或序列相似性的多肽。在某些实施方案中，CRISPR相关蛋白结构域可以是野生型蛋白的修饰形式，其包含一个或多个氨基酸残基变化，例如缺失、插入或取代；融合体或嵌合体；或其任何组合。

已描述了各种生物体的Cas9序列和变体Cas9直系同源物的结构。可衍生本文的Cas9结构域的示例性生物体包括，但不限于，酿脓链球菌、嗜热链球菌(Streptococcusthermophilus)、链球菌属(Streptococcus sp.)、金黄色葡萄球菌、无害李斯特菌(Listeria innocua)、格氏乳杆菌(Lactobacillus gasseri)、新杀弗朗西斯菌、产琥珀酸沃利氏菌(Wolinella succinogenes)、华德萨特菌(Sutterella wadsworthensis)、γ变形菌(Gamma proteobacterium)、脑膜炎奈瑟菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejuni)、多杀性巴氏杆菌(Pasteurella multocida)、产琥珀酸纤维杆菌(Fibrobacter succinogene)、深红红螺菌(Rhodospirillum rubrum)、达松维尔拟诺卡菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomyces viridochromogenes)、绿色产色链霉菌(Streptomycesviridochromogenes)、玫瑰链孢囊菌(Streptosporangium roseum)、酸热脂环酸芽孢杆菌(Alicyclobacillus acidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、砷还原芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacteriumsibiricum)、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillussalivarius)、布氏乳杆菌(Lactobacillus buchneri)、齿垢密螺旋体(Treponemadenticola)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏菌(Burkholderialesbacterium)、食萘极地单胞菌(Polaromonas naphthalenivorans)、极化单胞菌属(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝藻属(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻属(Synechococcus sp.)、阿拉伯糖醋杆菌(Acetohalobium arabaticum)、Ammonifex degensii、热解纤维素菌(Caldicelulosiruptor becscii)、脱硫假丝酵母(Candidatus Desulforudis)、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、嗜热丙酸厌氧肠状菌(Pelotomaculum thermopropionium)、嗜酸性喜温硫杆菌(Acidithiobacilluscaldus)、嗜酸性氧化亚铁硫杆菌(Acidithiobacillus ferrooxidans)、Allochromatiumvinosum、海杆菌属(Marinobacter sp.)、亚硝化嗜盐球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcus watsoni)、浮游假交替单胞菌(Pseudoalteromonashaloplanktis)、Ktedonobacter racemifer、Methanohalobium evestigatum、多变鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻属(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻属(Arthrospira sp.)、螺旋藻属(Lyngbya sp.)、原型微鞘藻(Microcoleuschthonoplastes)、颤藻属(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、巴氏链球菌(Streptococcus pasteurianus)、灰色奈瑟球菌(Neisseria cinerea)、红嘴鸥弯曲杆菌(Campylobacter lari)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、白喉棒状杆菌(Corynebacterium diphtheria)和Acaryochloris marina。Cas9序列还包括来自Chylinski et al.,RNA Biol.(2013)10(5):726-37中公开的生物体和基因座的序列。

在一些实施方案中，Cas9结构域来自酿脓链球菌(SpCas9)。在一些实施方案中，Cas9结构域来自金黄色葡萄球菌(SaCas9)。

其他Cas结构域也被考虑用于本文的表观遗传编辑器中。这些包括例如来自CasX(Cas12E)(例如SEQ ID NO:5)、CasY(Cas12d)(例如SEQ ID NO:6)、(CasPhi)(例如SEQID NO:7)、Cas12f1(Cas14a)(例如SEQ ID NO:8)、Cas12f2(Cas14b)(例如SEQ ID NO:9)、Cas12f3(Cas14c)(例如SEQ ID NO:10)和C2c8(例如SEQ ID NO:11)的Cas结构域。

对于表观遗传编辑，核酸酶衍生的蛋白质结构域(例如，Cas9或Cpf1结构域)可以通过突变而具有降低的核酸酶活性或无核酸酶活性，使得蛋白质结构域不切割DNA或具有降低的DNA切割活性，同时保留与指导核酸序列(例如，指导RNA)和靶DNA复合的能力。例如，与野生型结构域相比，核酸酶活性可以降低至少30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或99％。在一些实施方案中，本文所述的CRISPR相关蛋白结构域是无催化活性的(“死亡”)。此类结构域的示例包括例如dCas9(“死亡”Cas9)、dCpf1、ddCpf1、dCasPhi、ddCas12a、dLbCpf1和dFnCpf1。例如，与野生型Cas9相比，dCas9蛋白结构域可以包含消除其核酸酶活性的一个、两个或更多个突变。已知Cas9的DNA切割结构域包括两个亚结构域：HNH核酸酶亚结构域和RuvC1亚结构域。HNH亚结构域切割与gRNA互补的链，而RuvC1亚结构域切割非互补链。这些亚结构域内的突变可以沉默Cas9的核酸酶活性。例如，突变D10A(在RuvC1中)和H840A(在HNH中)使SpCas9的核酸酶活性完全失活。类似地，SaCas9可以通过突变D10A和N580A失活。在一些实施方案中，dCas9在HNH亚结构域和/或RuvC1亚结构域中包含降低或消除核酸酶活性的至少一个突变。在一些实施方案中，dCas9仅包含RuvC1亚结构域或仅包含HNH亚结构域。应当理解，使RuvC1和/或HNH结构域失活的任何突变可以包括在本文的dCas9中，例如，RuvC1结构域和/或HNH结构域中的插入、缺失或单个或多个氨基酸取代。

在一些实施方案中，本文的dCas9蛋白包含在对应于野生型SpCas9序列的位置D10(例如，D10A)、H840(例如，H840A)或两者的位置处的突变，如在UniProt登录号Q99ZW2(SEQID NO:2)提供的序列中编号的。在特定的实施方案中，dCas9包含dSpCas9(D10A和H840A)的氨基酸序列(SEQ ID NO:12)。

在一些实施方案中，如本文所述的dCas9蛋白包含在对应于野生型SaCas9序列(例如，SEQ ID NO:3)的位置D10(例如，D10A)、N580(例如，N580A)或两者的位置处的突变。在特定的实施方案中，dCas9包含dSaCas9(D10A和N580A)的氨基酸序列(SEQ ID NO:13)。

基于本公开和本领域知识，使Cas9失活的额外的合适突变对于本领域技术人员将是显而易见的，并且在本公开的范围内。此类突变可包括但不限于SpCas9中的D839A、N863A和/或K603R。本公开考虑降低或消除本文所述的任何Cas9的核酸酶活性的任何突变(例如，对应于本文所述的任何Cas9突变的突变)。

与野生型Cpf1相比，dCpf1蛋白结构域可以包含降低或消除其核酸酶活性的一个、两个或更多个突变。Cpf1蛋白具有与Cas9的RuvC结构域相似的RuvC样核酸内切酶结构域，但不具有HNH核酸内切酶结构域，并且Cpf1的N末端不具有Cas9的α-螺旋识别叶。在一些实施方案中，dCpf1包含对应于如在新杀弗朗西斯菌Cpf1蛋白(FnCpf1；SEQ ID NO:4)的序列中编号的位置D917A、E1006A或D1255A的一个或多个突变。在某些实施方案中，dCpf1蛋白包含对应于D917A、E1006A、D1255A、D917A/E1006A、D917A/D1255A、E1006A/D1255A或D917A/E1006A/D1255A的突变，或本文所述的任何Cpf1氨基酸序列中的相应突变。在一些实施方案中，dCpf1包含D917A突变。在特定的实施方案中，dCpf1包含dFnCpf1的氨基酸序列(SEQ IDNO:14)。

本文考虑的另外的核酸酶失活的CRISPR相关蛋白结构域包括来自例如dNmeCas9(例如，SEQ ID NO:15)、dCjCas9(例如，SEQ ID NO:16)、dSt1Cas9(例如，SEQ ID NO:17)、dSt3Cas9(例如，SEQ ID NO:18)、dLbCpf1(例如，SEQ ID NO:19)、dAsCpf1(例如，SEQ IDNO:20)、denAsCpf1(例如，SEQ ID NO:21)、dHFAsCpf1(例如，SEQ ID NO:22)、dRVRAsCpf1(例如，SEQ ID NO:23)、dRRAsCpf1(例如，SEQ ID NO:24)、dCasX(例如，SEQ ID NO:25)和dCasPhi(例如，SEQ ID NO:26)的核酸酶失活的CRISPR相关蛋白结构域。

在一些实施方案中，本文所述的Cas9结构域可以是高保真Cas9结构域，例如，包含降低Cas9结构域与DNA的糖-磷酸主链之间的静电相互作用以赋予增加的靶结合特异性的一个或多个突变。在某些实施方案中，所述高保真Cas9结构域可以是如本文所述的核酸酶失活的。

本文所述的CRISPR相关蛋白结构域可以识别靶基因中的原间隔区相邻基序(PAM)序列。“PAM”序列通常是紧接在CRISPR相关蛋白结构域靶向的序列之后的2至6bp DNA序列。PAM序列是CRISPR蛋白结合和切割所需要的，但不是靶序列的一部分。CRISPR相关蛋白结构域可以识别天然存在的或典型的PAM序列，或者可以具有改变的PAM特异性。结合非经典PAM序列的CRISPR相关蛋白结构域已在本领域中描述。例如，结合非典型PAM序列的Cas9结构域已在Kleinstiver et al.,Nature(2015)523(7561):481-5和Kleinstiver et al.,NatBiotechnol.(2015)33:1293-8中描述.此类Cas9结构域可以包括例如来自“VRER”SpCas9、“EQR”SpCas9、“VQR”SpCas9、“SpG Cas9”、“SpRYCas9”和“KKH”SaCas9的Cas9结构域。还考虑了这些Cas9结构域的核酸酶失活形式，例如核酸酶失活的VRER SpCas9(例如，SEQ ID NO:27)、核酸酶失活的EQR SpCas9(例如，SEQ ID NO:28)、核酸酶失活的VQR SpCas9(例如，SEQID NO:29)、核酸酶失活的SpG Cas9(例如，SEQ ID NO:30)、核酸酶失活的SpRY Cas9(例如，SEQ ID NO:31)和核酸酶失活的KKH SaCas9(例如，SEQ ID NO:32)。另一个示例是经工程化以识别5'-YG-3'(其中“Y”是嘧啶)的新杀弗朗西斯菌的Cas9。

基于本公开内容，另外合适的CRISPR相关蛋白、直系同源物和变体，包括核酸酶失活变体和序列，对于本领域技术人员将是显而易见的。

可以与本文的CRISPR相关蛋白结构域结合使用的指导RNA在下文第II节中进一步描述。

B.锌指蛋白结构域

在一些实施方案中，本文所述的表观遗传编辑器的DNA结合结构域包含锌指蛋白(ZFP)结构域(或如本文所用的“ZF结构域”)。ZFP是具有至少一个锌指的蛋白质，并且以序列特异性方式与DNA结合。“锌指”(ZF)或“锌指基序”(ZF基序)是指包含由锌离子稳定的β-β-α(ββα)-蛋白折叠的多肽结构域。ZF结合2至4个碱基对的核苷酸，通常为3或4个碱基对(连续或非连续)。每个ZF通常包含大约30个氨基酸。ZFP结构域可以含有与其靶核酸序列串联接触的多个ZF。可以工程化ZF的串联阵列以产生结合所需核酸靶标的人工ZFP。可以通过使用包含三联体(或四联体)核苷酸序列和单个ZF氨基酸序列的数据库来合理设计ZFP，其中每个三联体或四联体核苷酸序列与结合特定三联体或四联体序列的ZF的一个或多个氨基酸序列相关。参见例如美国专利6,453,242、6,534,261和8,772,453。

ZFP广泛存在于真核细胞中，并且可以属于例如C2H2类、CCHC类、PHD类或RING类。表征这些蛋白质的一类(C2H2类)的示例性基序是-Cys-(X)_2-4-Cys-(X)₁₂-His-(X)_3-5-His-(SEQ ID NO:657)，其中X是任何独立选择的氨基酸。在一些实施方案中，本文的ZFP结构域可包含ZF阵列，其包含各自接触三个或更多个连续核苷酸的连续C2H2-ZF。

本文所述的表观遗传编辑器的ZFP结构域可以包括2、3、4、5、6、7、8、9、10、11、12或更多个ZF。ZFP结构域可以包括双指或三指单元的阵列，例如3、4、5、6、7、8、9或10个或更多个单元，其中每个单元结合靶序列中的亚位点。在一些实施方案中，包含至少三个ZF的ZFP结构域识别9或10个核苷酸的靶DNA序列。在一些实施方案中，包含至少四个ZF的ZFP结构域识别12至14个核苷酸的靶DNA序列。在一些实施方案中，包含至少六个ZF的ZFP结构域识别18至21个核苷酸的靶DNA序列。

在一些实施方案中，本文所述的ZFP结构域中的ZF经由肽接头连接。肽接头的长度可以是例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或更多个氨基酸。在一些实施方案中，接头包含5个或更多个氨基酸。在一些实施方案中，接头包含7-17个氨基酸。接头可以是柔性的或刚性的。

在一些实施方案中，锌指阵列可以具有以下序列：

SRPGERPFQCRICMRNFSXXXXXXXHXXTHTGEKPFQCRICMRNFSXXXXXXXHXXTH[接头]FQCRICMRNFSXXXXXXXHXXTHTGEKPFQCRICMRNFSXXXXXXXHXXTH[接头]PFQCRICMRNFSXXXXXXXHXXTHTGEKPFQCRICMRNFSXXXXXXXHXXTHLRGS(SEQ ID NO:650),或与其至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％相同的序列，其中“XXXXXXX”代表ZF识别螺旋的氨基酸，其赋予锌指DNA结合特异性；每个X可以独立地选择。在上述序列中，斜体的“XX”可以是TR、LR或LK，并且“[接头]”表示接头序列。在一些实施方案中，接头序列是TGSQKP(SEQ IDNO:651)；当ZF靶向的亚位点相邻时，可以使用该接头。在一些实施方案中，接头序列是TGGGGSQKP(SEQ ID NO:652)；当锌指靶向的亚位点之间存在碱基时，可以使用该接头。所示的两个接头可以相同或不同。

本文中的ZFP结构域可以包含两个或更多个相邻ZF的阵列，所述两个或更多个相邻ZF彼此直接相邻(例如，被短(典型的)接头序列分开)，或被更长、柔性或结构化多肽序列分开。在一些实施方案中，直接相邻的指与连续的核酸序列结合，即与相邻的三核苷酸/三联体结合。在一些实施方案中，相邻的指在彼此各自的靶三联体之间交叉结合，这可有助于加强或增强靶序列的识别，并导致重叠序列的结合。在一些实施方案中，ZFP结构域内的远距离ZF可以识别(或结合)非连续核苷酸序列。

本文示例性ZFP结构域的ZF DNA识别螺旋的氨基酸序列及其PCSK9靶序列如下表1所示，其中括号内的数字表示SEQ ID NO。

表1.靶向PCSK9的示例性ZFP结构域的ZF序列

在一些实施方案中，表观遗传编辑器的ZFP结构域结合选自SEQ ID NO:700-747中任一个的靶序列。在进一步的实施方案中，ZFP结构域依次包含如表1中所示的ZF001-ZF048中任一个的F1-F6氨基酸序列。F1-F6氨基酸序列可置于SEQ ID NO:650的ZF框架序列内，或置于本领域已知的任何其它ZF框架内。

C.TALE

在一些实施方案中，本文所述的表观遗传编辑器的DNA结合结构域包含转录激活因子样效应子(TALE)结构域。TALE的DNA结合结构域包含约33-34个氨基酸的高度保守序列，在12和13位具有对识别特定核苷酸至关重要的重复可变二残基(RVD)。TALE可以被工程化以结合几乎任何期望的DNA序列。用于编程TALE的方法是本领域已知的。例如，此类方法描述于Carroll et al.,Genet Soc Amer.(2011)188(4):773-82；Miller et al.,NatBiotechnol.(2007)25(7):778-85；Christian et al.,Genetics(2008)186(2):757-61；Liet al.,Nucl Acids Res.(2010)39(1):359-72；和Moscou et al.,Science(2009)326(5959):1501。

D.其他DNA结合结构域

本文所述的表观遗传编辑器考虑了其他DNA结合结构域。在一些实施方案中，DNA结合结构域包含例如来自Natronobacterium gregoryi(NgAgo)的argonaute蛋白结构域。NgAgo是ssDNA引导的核酸内切酶，其由5'磷酸化ssDNA(gDNA)引导至其靶位点，在那里其产生双链断裂。与Cas9相反，NgAgo-gDNA系统不需要原间隔区相邻基序(PAM)。因此，使用核酸酶失活的NgAgo(dNgAgo)可以极大地扩展可以被靶向的碱基。NgAgo的表征和用途已在例如Gao et al.,Nat Biotechnol.(2016)34(7):768-73；Swarts et al.,Nature(2014)507(7491):258-61；和Swarts et al.,Nucl Acids Res.(2015)43(10):5120-9中描述。

在一些实施方案中，DNA结合结构域包含失活的核酸酶，例如失活的大范围核酸酶。DNA结合结构域的另外的非限制性示例包括四环素控制的阻遏物(tetR)DNA结合结构域、亮氨酸拉链、螺旋-环-螺旋(HLH)结构域、螺旋-转角-螺旋结构域、β-折叠基序、类固醇受体基序、bZIP结构域同源异型结构域和AT钩。

II.指导多核苷酸

本文所述的包含多核苷酸指导的DNA结合结构域的表观遗传编辑器还可以包括能够与DNA结合结构域形成复合物的指导多核苷酸。指导多核苷酸可以包含RNA、DNA或两者的混合物。例如，在多核苷酸指导的DNA结合结构域是CRISPR相关蛋白结构域的情况下，指导多核苷酸可以是指导RNA(gRNA)。“指导RNA”或“gRNA”是指能够与靶序列杂交并指导CRISPR-Cas复合物与靶序列结合的核酸。使用具有可编程DNA结合蛋白(例如CRISPR相关蛋白结构域)的指导多核苷酸序列进行位点特异性DNA靶向(例如修饰基因组)的方法是本领域已知的。

指导多核苷酸序列(例如，gRNA序列)可以包含两个部分：1)包含与靶核酸序列(“靶序列”)互补(例如与基因组靶位点中包含的核酸序列互补)的“靶向序列”的核苷酸序列；和2)结合多核苷酸引导的DNA结合结构域(例如，CRISPR-Cas蛋白结构域)的核苷酸序列。1)中的核苷酸序列可以包含与基因组核酸序列(例如基因组靶位点中包含的核酸序列)100％互补的靶向序列，并且因此可以与靶核酸序列杂交。1)中的核苷酸序列可以被称为例如crispr RNA或crRNA。2)中的核苷酸序列可以被称为指导核酸(例如tracrRNA)的支架序列或指导核酸的激活区，并且可以包含茎环结构。如上所述的部分1)和2)可以融合以形成一个单一指导(例如，单一指导RNA或sgRNA)，或者可以在两个单独的核酸分子上。在一些实施方案中，指导多核苷酸包含通过接头连接的部分1)和2)。在一些实施方案中，指导多核苷酸包含通过非核酸接头(例如肽接头或化学接头)连接的部分1)和2)。

如本文所述的指导多核苷酸的部分2(支架序列)可以是例如Jinek et al.,Science(2012)337:816-21；美国专利公开2016/0208288；或美国专利公开2016/0200779中所述。本公开还考虑了部分2)的变体。例如，gRNA支架(tracrRNA)序列的四环和茎环可以被修饰以包括RNA适体，其可以被特定的蛋白质结构域结合。在一些实施方案中，此类修饰的gRNA可用于促进与蛋白质相互作用RNA适体融合的抑制或激活结构域的招募。

本文提供的gRNA通常包含靶向结构域和结合结构域。靶向结构域(也称为“靶向序列”)可以包含结合靶位点(例如细胞内的基因组核酸分子)的核酸序列。靶位点可以是包含PAM序列以及靶序列的双链DNA序列，其位于与PAM序列相同的链上并且直接相邻。gRNA的靶向结构域可以包含对应于靶序列的RNA序列，即，其类似于靶结构域的序列，有时具有一个或多个错配，但通常包含RNA序列而不是DNA序列。因此，gRNA的靶向结构域可以和与靶序列互补的双链靶位点的序列碱基配对(完全或部分互补)，并且因此和与包含PAM序列的链互补的链碱基配对。应当理解，gRNA的靶向结构域通常不包括类似PAM序列的序列。还应理解，取决于所采用的核酸酶，PAM的位置可以是靶序列的5'或3'。例如，PAM通常位于Cas9核酸酶的靶序列的3'和Cas12a核酸酶的靶序列的5'。对于PAM的位置和gRNA与靶位点结合的机制的说明，参见例如Vanegas et al.,Fungal Biol Biotechnol.(2019)6:6的图1,其通过引用并入本文。对于RNA引导的核酸酶的gRNA靶向靶位点的机制的额外说明和描述，参见Fuetal.,Nat Biotechnol(2014)32(3):279-84和Sternberg et al.,Nature(2014)507(7490):62-7,各自通过引用并入本文。

在一些实施方案中，靶向结构域序列包含17至30个核苷酸并且完全对应于靶序列(即，没有任何错配核苷酸)。然而，在一些实施方案中，靶向结构域序列可以包含一个或多个但通常不超过4个错配，例如1、2、3或4个错配。由于靶向结构域是gRNA(其是RNA分子)的一部分，其通常将包含核糖核苷酸，而DNA靶向结构域将包含脱氧核糖核苷酸。

下面提供了包含22个核苷酸靶结构域和NGG PAM序列的Cas9靶位点，以及包含完全对应于靶序列(并且因此包含与包含靶序列和PAM的链互补的DNA链具有完全互补性的碱基对)的靶向结构域的gRNA的示例性说明：

下面提供了包含22个核苷酸靶结构域和TTN PAM序列的Cas12a靶位点，以及包含完全对应于靶序列(并且因此包含与包含靶序列和PAM的链互补的DNA链具有完全互补性的碱基对)的靶向结构域的gRNA的示例性说明：

虽然不希望受理论束缚，但至少在一些实施方案中，据信靶向结构域的长度和与靶序列的互补性有助于gRNA/Cas9分子复合物与靶核酸相互作用的特异性。在一些实施方案中，本文提供的gRNA的靶向结构域的长度为5至50个核苷酸。在一些实施方案中，靶向结构域的长度为15至25个核苷酸。在一些实施方案中，靶向结构域的长度为18至22个核苷酸。在一些实施方案中，靶向结构域的长度为19-21个核苷酸。在一些实施方案中，靶向结构域的长度为15个核苷酸。在一些实施方案中，靶向结构域的长度为16个核苷酸。在一些实施方案中，靶向结构域的长度为17个核苷酸。在一些实施方案中，靶向结构域的长度为18个核苷酸。在一些实施方案中，靶向结构域的长度为19个核苷酸。在一些实施方案中，靶向结构域的长度为20个核苷酸。在一些实施方案中，靶向结构域的长度为21个核苷酸。在一些实施方案中，靶向结构域的长度为22个核苷酸。在一些实施方案中，靶向结构域的长度为23个核苷酸。在一些实施方案中，靶向结构域的长度为24个核苷酸。在一些实施方案中，靶向结构域的长度为25个核苷酸。在某些实施方案中，靶向结构域完全对应于本文提供的靶序列或其部分，没有错配。在一些实施方案中，本文提供的gRNA的靶向结构域相对于本文提供的靶序列包含1个错配。在一些实施方案中，靶向结构域相对于靶序列包含2个错配。在一些实施方案中，靶结构域相对于靶序列包含3个错配。

用于设计、选择和验证gRNA的方法在本文中描述并且是本领域已知的。软件工具可用于优化对应于靶DNA序列的gRNA，例如以最小化整个基因组的总脱靶活性。例如，DNA序列搜索算法可用于鉴定与Cas9一起使用的gRNA的crRNA中的靶序列。示例性gRNA设计工具包括Bae et al.,Bioinformatics(2014)30:1473-5中描述的那些。

本文所述的指导多核苷酸(例如，gRNA)可以具有各种长度。在一些实施方案中，间隔区或靶向序列的长度取决于所使用的表观遗传编辑器系统的CRISPR相关蛋白组分。例如，来自不同细菌物种的Cas蛋白具有不同的最佳靶向序列长度。因此，间隔序列的长度可以包含例如5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或超过50个核苷酸。在一些实施方案中，间隔区的长度包含10-24、11-20、11-16、18-24、19-21或20个核苷酸。在一些实施方案中，指导多核苷酸(例如gRNA)的长度为15-100(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50)个核苷酸，并且包含与靶序列互补的至少10个(例如15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50)个连续核苷酸的间隔序列。在一些实施方案中，本文所述的指导多核苷酸可以被截短，例如截短1、2、3、4、5、10、15、20、25、30、40、50个或更多个核苷酸。

在某些实施方案中，PCSK9靶序列的3'末端紧邻PAM序列(例如，典型PAM序列，如SpCas9的NGG)。指导多核苷酸的靶向序列(例如，gRNA的间隔序列)与靶序列之间的互补程度可以是至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％。在特定的实施方案中，靶向序列和靶序列可以是100％互补的。在其他实施方案中，靶向序列和靶序列可以包含例如1、2、3、4、5、6、7、8、9或10个错配。

指导多核苷酸(例如gRNA)可以用例如化学改变和合成修饰来修饰。例如，经修饰的gRNA可以包括磷酸二酯主链键中的一个或两个非连接磷酸氧和/或一个或多个连接磷酸氧的改变或置换、核糖(例如核糖上的2'羟基)的改变、磷酸部分的改变、天然存在的核碱基的修饰或置换、核糖-磷酸主链的修饰或置换、寡核苷酸的3'末端和/或5'末端的修饰、末端磷酸基团的置换或部分、帽或接头的缀合或其任何组合。

在一些实施方案中，gRNA的一个或多个核糖基团可以被修饰。核糖基团的化学修饰的示例包括但不限于2'-O-甲基(2'-OMe)、2'-氟(2'-F)、2'-脱氧、2'-O-(2-甲氧基乙基)(2'-MOE)、2'-NH2、2'-O-烯丙基、2'-O-乙胺、2'-O-氰基乙基、2'-O-缩醛酯或双环核苷酸，如锁核酸(LNA)、2'-(5-限制性乙基(S-cEt))、限制性MOE或2'-0,4'-C-氨基亚甲基桥连核酸(2',4'-BNANC)。2'-O-甲基修饰和/或2'-氟修饰可以增加gRNA寡核苷酸的结合亲和力和/或核酸酶稳定性。

在一些实施方案中，gRNA的一个或多个磷酸基团可以被化学修饰。磷酸基团的化学修饰的示例包括但不限于硫代磷酸酯(PS)、膦酰基乙酸酯(PACE)、硫代膦酰基乙酸酯(硫代PACE)、酰胺、三唑、膦酸酯和磷酸三酯修饰。在一些实施方案中，本文所述的指导多核苷酸可以在5'端和/或3'端处或附近包含一个、两个、三个或更多个PS键；PS键可以是连续的或非连续的。

在一些实施方案中，本文的gRNA包含核糖核苷酸和脱氧核糖核苷酸的混合物和/或一个或多个PS键。

在一些实施方案中，gRNA的一个或多个核碱基可以被化学修饰。化学修饰的核碱基的示例包括但不限于2-硫尿苷、4-硫尿苷、N6-甲基腺苷、假尿苷、2,6-二氨基嘌呤、肌苷、胸苷、5-甲基胞嘧啶、5-取代嘧啶、异鸟嘌呤、异胞嘧啶和具有卤代芳族基团的核碱基。可以在间隔区、tracr RNA区、茎环或其任何组合中进行化学修饰。

下表2列出了用于人PCSK9的表观遗传修饰的示例性gRNA靶序列，以及人染色体1上被靶向位点的起始和终止位置的坐标(SEQ：SEQ ID NO)。该表还显示了PCSK9基因从起始坐标到TSS坐标的距离。

表2.靶向PCSK9的gRNA的示例性靶序列

在一些实施方案中，本文的gRNA不包含序列CCCGCACCUUGGCGCAGCGG(SEQ ID NO:1490)。

本领域已知的任何tracr序列可考虑用于本文所述的gRNA。在一些实施方案中，本文描述的gRNA具有下表3所示的tracr序列，或与下面所示的tracr序列至少70％、75％、80％、85％、90％、95％、96％、97％、98％或99％相同的tracr序列(SEQ：SEQ ID NO)。

表3.示例性TRACR序列

在一些实施方案中，本文的gRNA直接提供给细胞(例如，通过连同CRISPR相关蛋白结构域的RNP复合物)。在一些实施方案中，gRNA通过引入细胞中的表达载体(例如，质粒载体或病毒载体)提供给细胞，然后，其中细胞从表达载体表达gRNA。将gRNA和表达载体引入细胞的方法是本领域熟知的。

III.效应结构域

本文所述的表观遗传编辑器包括影响靶基因的表观遗传修饰的一个或多个效应蛋白结构域(也称为“表观遗传效应结构域”或“效应结构域”，如本文所用)。具有一个或多个效应结构域的表观遗传编辑器可以调节靶基因的表达而不改变其核碱基序列。在一些实施方案中，本文所述的效应结构域可以例如通过抑制转录或通过修饰或重塑染色质来提供靶基因例如PCSK9的表达的抑制或沉默。此类效应结构域在本文中也称为“抑制结构域”、“阻遏结构域”或“表观遗传阻遏结构域”。可由效应结构域介导的化学修饰的非限制性示例包括DNA或组蛋白残基的甲基化、去甲基化、乙酰化、去乙酰化、磷酸化、SUMO化和/或泛素化。

在一些实施方案中，本文所述的表观遗传编辑器的效应结构域可以进行组蛋白尾部修饰，例如通过在组蛋白尾部上添加或去除活性标记。

在一些实施方案中，本文所述的表观遗传编辑器的效应结构域可以包含或招募转录相关蛋白，例如转录阻遏物。转录相关蛋白可以是内源性的或外源性的。

在一些实施方案中，本文所述的表观遗传编辑器的效应结构域可以例如包含直接或间接阻断转录因子接近含有靶序列的目的基因的蛋白质。

效应结构域可以是保留表观遗传效应子功能的全长蛋白质或其片段(“功能结构域”)。能够调节(例如，抑制)基因表达的功能结构域可以衍生自较大的蛋白质。例如，可以基于阻遏蛋白的序列鉴定可以降低靶基因表达的功能结构域。调节基因表达的蛋白的氨基酸序列可以从可用的基因组浏览器获得，例如UCSD基因组浏览器或Ensembl基因组浏览器。蛋白质注释数据库如UniProt或Pfam可用于鉴定全蛋白质序列内的功能结构域。作为起点，可以测试包含由不同数据库鉴定的所有区域的最大序列的基因表达调节活性。然后可以测试各种截短物以识别最小功能单元。

本公开还考虑了本文所述的效应结构域的变体。变体可以例如是指与本文所述的野生型效应结构域具有至少约85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性和/或序列相似性的多肽。在特定的实施方案中，变体保留野生型效应结构域的至少约85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％的表观遗传效应子功能。

在一些实施方案中，本文所述的效应结构域可包含两个或更多个效应结构域(例如，KOX1 KRAB和ZIM3)的融合体。效应结构域可以例如包含2、3、4、5、6、7、8、9或10个效应结构域的融合体，例如本文所述的效应结构域。在某些实施方案中，效应结构域包含截短形式的效应结构域和第二效应结构域的融合体。在某些实施方案中，效应结构域包含两个效应结构域的截短形式的融合体(例如，两个效应结构域的N端和C端部分的融合体)。

在一些实施方案中，本文所述的表观遗传编辑器可以包含1个效应结构域、2个效应结构域、3个效应结构域、4个效应结构域、5个效应结构域、6个效应结构域、7个效应结构域、8个效应结构域、9个效应结构域、10个效应结构域或更多个。在某些实施方案中，表观遗传编辑器包含一个或多个融合蛋白(例如，一个、两个或三个融合蛋白)，每个融合蛋白具有与DNA结合结构域连接的一个或多个效应结构域(例如，一个、两个或三个效应结构域)。在一些实施方案中，效应结构域可以诱导表观遗传修饰的组合，例如转录抑制和DNA甲基化、DNA甲基化和组蛋白去乙酰化、DNA甲基化和组蛋白去甲基化、DNA甲基化和组蛋白甲基化、DNA甲基化和组蛋白磷酸化、DNA甲基化和组蛋白泛素化、DNA甲基化和组蛋白SUMO化。

在某些实施方案中，本文所述的效应结构域(例如，DNMT3A和/或DNMT3L)由在该效应结构域的天然基因组(例如，人或鼠)中发现的核苷酸序列编码。在其他实施方案中，本文所述的效应结构域由已被密码子优化以在人细胞中最佳表达的核苷酸序列编码。

本文所述的效应结构域可以包括例如转录阻遏物、DNA甲基转移酶和/或组蛋白修饰物，如下文进一步详述。

A.转录阻遏物

在一些实施方案中，本文所述的表观遗传效应结构域介导靶基因表达(例如，转录)的阻遏。效应结构域可以包含例如Krüppel相关盒(KRAB)阻遏结构域、阻遏物元件沉默转录因子(REST)阻遏结构域、KRAB相关蛋白1(KAP1)结构域、MAD结构域、FKHR(横纹肌肉瘤基因中的叉头)阻遏结构域、EGR-1(早期生长反应基因产物-1)阻遏结构域、ets2阻遏物因子阻遏结构域(ERD)、MAD smSIN3相互作用结构域(SID)、毛发相关碱性螺旋-环-螺旋(bHLH)阻遏物蛋白的WRPW基序、HP1αchromo-shadow阻遏结构域、HP1β阻遏结构域或其任何组合。效应结构域可以招募一个或多个抑制靶基因表达的蛋白质结构域，例如通过支架蛋白。在一些实施方案中，效应结构域可以招募支架蛋白结构域或与招募PRMT蛋白、HDAC蛋白、SETDB1蛋白或NuRD蛋白结构域的支架蛋白结构域相互作用。

在一些实施方案中，效应结构域包含衍生自锌指阻遏蛋白的功能结构域，例如KRAB结构域。在大约400种基于人ZFP的转录因子中发现了KRAB结构域。KRAB结构域的描述可以在例如Ecco et al.,Development(2017)144(15):2719-29和Lambert et al.,Cell(2018)172:650-65中找到。

在某些实施方案中，效应结构域包含衍生自KOX1/ZNF10、KOX8/ZNF708、ZNF43、ZNF184、ZNF91、HPF4、HTF10或HTF34的阻遏结构域(例如，KRAB)。在一些实施方案中，效应结构域包含衍生自ZIM3、ZNF436、ZNF257、ZNF675、ZNF490、ZNF320、ZNF331、ZNF816、ZNF680、ZNF41、ZNF189、ZNF528、ZNF543、ZNF554、ZNF140、ZNF610、ZNF264、ZNF350、ZNF8、ZNF582、ZNF30、ZNF324、ZNF98、ZNF669、ZNF677、ZNF596、ZNF214、ZNF37、ZNF34、ZNF250、ZNF547、ZNF273、ZNF354、ZFP82、ZNF224、ZNF33、ZNF45、ZNF175、ZNF595、ZNF184、ZNF419、ZFP28-1、ZFP28-2、ZNF18、ZNF213、ZNF394、ZFP1、ZFP14、ZNF416、ZNF557、ZNF566、ZNF729、ZIM2、ZNF254、ZNF764、ZNF785或其任意组合的阻遏结构域(例如，KRAB)。例如，阻遏结构域可以是衍生自KOX1、ZIM3、ZFP28或ZN627的KRAB结构域。在特定的实施方案中，阻遏结构域是ZIM3KRAB结构域。在另外的实施方案中，效应结构域衍生自人蛋白，例如人ZIM3、人KOX1、人ZFP28或人ZN627。

可以降低或沉默靶基因表达的示例性效应结构域的序列或含有它们的蛋白质序列提供于下表4中(SEQ：SEQ ID NO)。阻遏物和转录阻遏结构域的进一步示例可以在例如PCT专利公开WO 2021/226077和Tycko et al.,Cell(2020)183(7):2020-35中找到，其各自通过引用整体并入本文。

表4.可降低或沉默基因表达的示例性效应结构域

本公开涵盖任何上述蛋白质的功能类似物，即具有相同或基本上相同的生物学功能(例如，保留70％或更多、80％或更多、90％或更多、95％或更多或98％或更多的蛋白质的转录因子功能)的分子。例如，功能类似物可以是上面列出的蛋白质的同工型或变体，例如含有具有或不具有额外的氨基酸残基的上述蛋白质的一部分和/或含有相对于上述蛋白质的突变。在一些实施方案中，功能类似物与表4中列出的序列之一具有至少75％、80％、85％、90％、95％、98％或99％的序列同一性。还考虑了上述蛋白质的同源物、直系同源物和突变体。

在某些实施方案中，本文所述的表观遗传编辑器包含衍生自KOX1、ZIM3、ZFP28或ZN627的KRAB结构域，和/或衍生自KAP1、MECP2、HP1a、HP1b、CBX8、CDYL2、TOX、TOX3、TOX4、EED、EZH2、RBBP4、RCOR1或SCML2的效应结构域，任选地其中亲本蛋白是人蛋白。在特定的实施方案中，本文所述的表观遗传编辑器包含衍生自KOX1、ZIM3、ZFP28和/或ZN627的结构域，任选地其中亲本蛋白是人蛋白。在某些实施方案中，表观遗传编辑器可以包含衍生自KOX1(ZNF10)(例如人KOX1)的KRAB结构域。在某些实施方案中，表观遗传编辑器可以包含衍生自ZIM3(ZNF657或ZNF264)(例如人ZIM3)的KRAB结构域。在某些实施方案中，表观遗传编辑器可以包含衍生自ZFP28(例如人ZFP28)的KRAB结构域。在某些实施方案中，表观遗传编辑器可以包含衍生自ZN627(例如人ZN627)的KRAB结构域。在某些实施方案中，本文所述的表观遗传编辑器可以包含CDYL2(例如，人CDYL2)和/或与KOX1 KRAB结构域(例如，人KOX1 KRAB结构域)组合的TOX结构域(例如，人TOX结构域)。

在某些实施方案中，本文所述的表观遗传效应子包含衍生自KOX1/ZNF10(SEQ IDNO:89)的阻遏结构域。例如，阻遏结构域可以包含SEQ ID NO:89的序列，或与SEQ ID NO:89具有至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％同一性的序列。

在某些实施方案中，本文所述的表观遗传效应子包含衍生自KOX1/ZNF10的阻遏结构域，如下表5所示：

表5.衍生自KOX1/ZNF10的示例性效应结构域

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:565的氨基酸序列，或与SEQ ID NO:565至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:566的氨基酸序列，或与SEQ ID NO:566至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:567的氨基酸序列，或与SEQ ID NO:567至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:568的氨基酸序列，或与SEQ ID NO:568至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:569的氨基酸序列，或与SEQ ID NO:569至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:570的氨基酸序列，或与SEQ ID NO:570至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:571的氨基酸序列，或与SEQ ID NO:571至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，阻遏结构域可以包含SEQ ID NO:572的氨基酸序列，或与SEQ ID NO:572至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

B.DNA甲基转移酶

在一些实施方案中，本文所述的表观遗传编辑器的效应结构域通过DNA修饰如甲基化改变靶基因表达。DNA的高度甲基化区域往往比低度甲基化区域的转录活性低。DNA甲基化主要发生在CpG位点(“C-磷酸-G-”或“胞嘧啶-磷酸-鸟嘌呤”位点的简写)。许多哺乳动物基因具有靠近或包括CpG岛(具有高频率CpG二核苷酸的核酸区域)的启动子区。

本文所述的效应结构域可以是例如DNA甲基转移酶(DNMT)或其催化结构域，或者可以能够招募DNA甲基转移酶。DNMT涵盖催化甲基转移至DNA核苷酸的酶，例如催化甲基添加至基因组DNA的典型胞嘧啶-5DNMT(例如，DNMT1、DNMT3A、DNMT3B和DNMT3C)。该术语还涵盖本身不催化甲基化但招募(包括激活)催化活性DNMT的非典型家族成员；这种DNMT的非限制性示例是DNMT3L。参见例如Lyko,Nat Review(2018)19:81-92。除非另有说明，否则DNMT结构域可以指衍生自催化活性DNMT(例如，DNMT1、DNMT3A和DNMT3B)或衍生自非催化活性DNMT(例如，DNMT3L)的多肽结构域。DNMT可以通过招募抑制性调节蛋白来抑制靶基因的表达。在一些实施方案中，甲基化在CG(或CpG)二核苷酸序列处。在一些实施方案中，甲基化在CHG或CHH序列处，其中H是A、T或C中的任一个。

在一些实施方案中，本文所述的DNMT可以是动物DNMT(例如，哺乳动物DNMT)、植物DNMT、真菌DNMT或细菌DNMT。细菌DNMT可以获自细菌物种(例如球菌属细菌、芽孢杆菌属细菌、螺旋细菌或细胞内革兰氏阳性或革兰氏阴性细菌)。在某些实施方案中，细菌物种是支原体目细菌(Mycoplasmatales bacterium)、海洋支原体(Mycoplasma marinum)或中华螺原体(Spiroplasma chinense)。在某些实施方案中，细菌物种不是穿透支原体(M.penetrans)、S.monbiae、副流感嗜血杆菌(H.parainfluenzae)、藤黄节杆菌(A.luteus)、埃及嗜血杆菌(H.aegyptius)、溶血嗜血杆菌(H.haemolyticus)、莫拉氏菌(Moraxella)、大肠杆菌(E.coli)、水生栖热菌(T.aquaticus)、新月梭菌(C.crescentus)或艰难梭菌(C.difficile)。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT结构域，所述DNMT结构域包含SEQ ID NO:601或与SEQ ID NO:601至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT结构域，所述DNMT结构域包含SEQ ID NO:602或与SEQ IDNO:602至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT结构域，所述DNMT结构域包含SEQ ID NO:603或与SEQ ID NO:603至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在某些实施方案中，本文所述的表观遗传编辑器中的DNMT可以包括例如DNMT1、DNMT3A、DNMT3B和/或DNMT3C。在一些实施方案中，DNMT是哺乳动物(例如，人或鼠)DNMT。在特定的实施方案中，DNMT是DNMT3A(例如，人DNMT3A)。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT3A结构域，所述DNMT3A结构域包含SEQ ID NO:574或与SEQ ID NO:574至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT3A结构域，所述DNMT3A结构域包含SEQ ID NO:575或与SEQ ID NO:575至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在一些实施方案中，DNMT3A结构域可以具有例如在位置H739(如H739A或H739E)、R771(如R771L)和/或R836(如R836A或R836Q)或其任何组合处的突变(根据SEQ ID NO:574编号)。

在一些实施方案中，本文所述的效应结构域可以是DNMT样结构域。如本文所用，“DNMT样结构域”是可以激活或招募其他DNMT结构域，但本身不具有甲基化活性的DNMT的调节因子。在一些实施方案中，DNMT样结构域是哺乳动物(例如，人或小鼠)DNMT样结构域。在某些实施方案中，DNMT样结构域是DNMT3L，其可以是例如人DNMT3L或小鼠DNMT3L。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT3L结构域，所述DNMT3L结构域包含SEQ IDNO:578或与SEQ ID NO:578至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在某些实施方案中，本文的表观遗传编辑器包含DNMT3L结构域，所述DNMT3L结构域包含SEQ ID NO:579，或与SEQ ID NO:579至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT3L结构域，所述DNMT3L结构域包含SEQ ID NO:580或与SEQ ID NO:580至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在某些实施方案中，本文所述的表观遗传编辑器包含DNMT3L结构域，所述DNMT3L结构域包含SEQ ID NO:581，或与SEQ ID NO:581至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在一些实施方案中，DNMT3L结构域可以具有例如对应于位置D226(如D226V)、Q268(如Q268K)或两者处的突变(根据SEQ ID NO:578编号)。

在某些实施方案中，本文的表观遗传编辑器可以包括包含DNMT和DNMT样效应结构域两者。例如，表观遗传编辑器可以包含DNMT3A-3L结构域，其中DNMT3A和DNMT3L可以共价连接。在其他实施方案中，本文所述的表观遗传编辑器可以包含效应结构域，其仅包含DNMT3A结构域(例如，人DNMT3A)，或仅包含DNMT样结构域(例如，DNMT3L，其可以是人或小鼠DNMT3L)。

下表6提供了示例性DNMT，其可以是本文所述的表观遗传效应结构域的一部分，或者可以从中衍生本文所述的表观遗传编辑器的效应结构域。

表6.示例性DNMT序列

本公开涵盖任何上述蛋白质的功能类似物，即具有相同或基本上相同的生物学功能(例如，保留70％或更多、80％或更多、90％或更多、95％或更多、或98％或更多的蛋白质的DNA甲基化功能或招募功能)的分子。例如，功能类似物可以是上述蛋白质的同工型或变体，例如含有具有或不具有额外的氨基酸残基的上述蛋白质的一部分和/或含有相对于上述蛋白质的突变。在一些实施方案中，功能类似物与表6中列出的序列之一具有至少75％、80％、85％、90％、95％、98％或99％的序列同一性。在一些实施方案中，本文的效应结构域仅包含上述蛋白质的功能结构域(或其功能类似物)，例如催化结构域或招募结构域。在一些实施方案中，本文的效应结构域包含选自表6的一个或多个表观遗传效应结构域，或其功能同源物、直系同源物或变体。

如本文所用，DNMT结构域(例如，DNMT3A结构域或DNMT3L结构域)是指与亲本蛋白(例如，人或鼠DNMT3A或DNMT3L)相同的蛋白质结构域或其功能类似物(例如，具有亲本蛋白的功能片段，如催化片段或招募片段；和/或具有改善DNMT蛋白活性的突变)。

本文的表观遗传编辑器可以在靶基因或染色体中的例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000个或更多个CpG二核苷酸序列处实现甲基化。CpG二核苷酸序列可以位于CpG岛中的靶基因内或附近，或者可以位于不是CpG岛的区域中。CpG岛通常是指包含高频率CpG二核苷酸的核酸序列或染色体区域。例如，CpG岛可包含至少50％ GC含量。CpG岛可以具有高的观察与预期CpG比率，例如至少60％的观察与预期CpG比率。如本文所用，观察与预期CpG比率由CpG数量*(序列长度)/(C数量*G数量)确定。在一些实施方案中，CpG岛具有至少60％、70％、80％、90％或更高的观察与预期CpG比率。CpG岛可以是例如至少200、250、300、350、400、450、500、550、600、650、700、750或800个核苷酸的序列或区域。在一些实施方案中，仅1个或少于2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40或50个CpG二核苷酸被表观遗传编辑器甲基化。

在一些实施方案中，本文的表观遗传编辑器在低甲基化核酸序列(即，与标准对照相比，在5-甲基胞嘧啶核苷酸上(例如，在CpG中)可能缺乏甲基的序列)处实现甲基化。例如，相对于年轻细胞或非癌细胞，低甲基化可分别发生在衰老细胞或癌症(例如，瘤形成的早期阶段)中。

在一些实施方案中，本文所述的表观遗传编辑器在超甲基化核酸序列处诱导甲基化。

在一些实施方案中，甲基化可以由表观遗传编辑器在CpG二核苷酸以外的位点引入。例如，靶基因序列可以在CpA、CpT或CpC序列的C核苷酸处甲基化。在一些实施方案中，表观遗传编辑器包含DNMT3A结构域并在CpG、CpA、CpT、CpC序列或其任何组合处实现甲基化。在一些实施方案中，表观遗传编辑器包含缺乏调节亚结构域且仅维持催化结构域的DNMT3A结构域。在一些实施方案中，包含DNMT3A催化结构域的表观遗传编辑器仅在CpG序列处实现甲基化。在一些实施方案中，与包含野生型DNMT3A结构域的表观遗传编辑器相比，包含含有突变(例如R836A或R836Q突变(根据SEQ ID NO:574编号))的DNMT3A结构域的表观遗传编辑器在CpA、CpC和/或CpT序列处具有更高的甲基化活性。

C.组蛋白修饰剂

在一些实施方案中，本文表观遗传编辑器的效应结构域介导组蛋白修饰。组蛋白修饰在基因转录中发挥结构和生化作用，例如通过形成或破坏与组蛋白结合的核小体结构并阻止基因转录。组蛋白修饰可以包括例如乙酰化、去乙酰化、甲基化、磷酸化、泛素化、SUMO化等，例如在其N-末端(“组蛋白尾”)。这些修饰维持或特异性转化染色质结构，从而控制染色体DNA上发生的如基因表达、DNA复制、DNA修复等反应。组蛋白的翻译后修饰是一种表观遗传调控机制，被认为是真核细胞遗传调控所必需的。最近的研究表明，染色质重塑因子如SWI/SNF、RSC、NURF、NRD等，其通过修饰核小体结构促进转录因子接近DNA；组蛋白乙酰转移酶(HAT)，其调节组蛋白乙酰化状态；和组蛋白去乙酰酶(HDAC)，作为重要的调节因子。

特别地，组蛋白的非结构化N-末端可以通过乙酰化、去乙酰化、甲基化、泛素化、磷酸化、SUMO化、核糖基化、瓜氨酸化、O-GlcNAc化、巴豆酰化或其任何组合进行修饰。例如，组蛋白乙酰转移酶(HAT)利用乙酰辅酶A作为辅因子并催化乙酰基向赖氨酸侧链的ε氨基的转移。这中和了赖氨酸的正电荷，削弱了组蛋白和DNA之间的相互作用，从而打开了染色体以使转录因子结合并启动转录。组蛋白乙酰转移酶对组蛋白H3的K14和K9赖氨酸的乙酰化可能与人的转录能力有关。赖氨酸乙酰化可以直接或间接产生调节转录激活的染色质修饰酶的结合位点。另一方面，组蛋白H3赖氨酸9的组蛋白甲基化可能与异染色质或转录沉默染色质相关。

在某些实施方案中，本文所述的表观遗传编辑器的效应结构域包含组蛋白甲基转移酶结构域。效应结构域可以包含例如DOT1L结构域、SET结构域、SUV39H1结构域、G9a/EHMT2蛋白结构域、EZH1结构域、EZH2结构域、SETDB1结构域或其任何组合。在特定的实施方案中，效应结构域包含组蛋白-赖氨酸-N-甲基转移酶SETDB1结构域。

在一些实施方案中，效应结构域包含组蛋白去乙酰酶蛋白结构域。在某些实施方案中，效应结构域包含HDAC家族蛋白结构域，例如HDAC1、HDAC3、HDAC5、HDAC7或HDAC9蛋白结构域。在特定的实施方案中，效应结构域包含核小体重塑和去乙酰酶复合物(NURD)，其从组蛋白去除乙酰基。

D.其他效应结构域

在一些实施方案中，效应结构域包含含有三部分基序的蛋白质(TRIM28、TIF1-β或KAP1)。在某些实施方案中，效应结构域包含一种或多种KAP1蛋白。本文表观遗传编辑器中的KAP1蛋白可以与表观遗传编辑器的一个或多个其他效应结构域或参与细胞环境中基因表达调节的一种或多种蛋白形成复合物。例如，KAP1可以被转录阻遏物的KRAB结构域招募。KAP1蛋白结构域可以与降低或沉默基因表达的一种或多种蛋白复合物相互作用或招募这些蛋白复合物。在一些实施方案中，KAP1与组蛋白去乙酰酶蛋白、组蛋白-赖氨酸甲基转移酶蛋白、染色质重塑蛋白和/或异染色质蛋白相互作用或招募这些蛋白。例如，KAP1蛋白结构域可以与异染色质蛋白1(HP1)蛋白、SETDB1蛋白、HDAC蛋白和/或NuRD蛋白复合物组分相互作用或招募这些蛋白。在一些实施方案中，KAP1蛋白结构域与ZFP90蛋白(例如，ZFP90的同种型2)和/或FOXP3蛋白相互作用或招募这些蛋白。示例性KAP1氨基酸序列如SEQ ID NO:629所示。

在一些实施方案中，效应结构域包含与一个或多个DNA表观遗传标记相互作用或被一个或多个DNA表观遗传标记招募的蛋白质结构域。例如，效应结构域可以包含与靶基因中的甲基化DNA核苷酸(其可以在或可以不在靶基因的CpG岛处)相互作用的甲基CpG结合蛋白2(MECP2)蛋白。本文所述的表观遗传编辑器中的MECP2蛋白结构域可以诱导浓缩的染色质结构，从而降低或沉默靶基因的表达。在一些实施方案中，本文所述的表观遗传编辑器中的MECP2蛋白结构域可以与组蛋白去乙酰酶(例如HDAC)相互作用，从而抑制或沉默靶基因的表达。在一些实施方案中，本文所述的表观遗传编辑器中的MECP2蛋白结构域可以阻断转录因子或转录激活因子接近靶序列，从而抑制或沉默靶基因的表达。示例性MECP2氨基酸序列如SEQ ID NO:630所示。

还考虑作为本文所述的表观遗传编辑器的效应结构域的是，例如，chromoshadow结构域、泛素-2样Rad60 SUMO样(Rad60-SLD/SUMO)结构域、染色质组织修饰结构域(Chromo)结构域、Yaf2/RYBP C末端结合基序结构域(YAF2_RYBP)、CBX家族C末端基序结构域(CBX7_C)、锌指C3HC4型(环指)结构域(ZF-C3HC4_2)、细胞色素b5结构域(Cyt-b5)、螺旋-环-螺旋结构域(HLH)、螺旋-发夹-螺旋基序结构域(例如HHH_3)、高迁移率基团盒结构域(HMG-box)、碱性亮氨酸拉链结构域(例如bZIP_1或bZIP_2)、Myb_DNA结合结构域、同源异型结构域、具有FCS序列的MYM型锌指结构域(ZF-FCS)、干扰素调节因子2结合蛋白锌指结构域(IRF-2BP1_2)、SSX阻遏结构域(SSXRD)、B盒型锌指结构域(ZF-B_box)、CXXC锌指结构域(ZF-CXXC)、染色体缩合1结构域(RCC1)、SRC同源3结构域(SH3_9)、不育α基序结构域(SAM_1)、不育α基序结构域(SAM_2)、不育α基序/尖峰结构域(SAM_PNT)、Vestigial/Tondu家族结构域(Vg_Tdu)、LIM结构域、RNA识别基序结构域(RRM_1)、配对两亲性螺旋结构域(PAH)、蛋白酶体ATPase OB C末端结构域(Prot_ATP_ID_OB)、神经同源性2结构域(NHR2)、裂解刺激因子亚基2的铰链结构域(CSTF2_hinge)、PPAR gamma N末端区域结构域(PPARgamma_N)、CDC48 N末端结构域(CDC48_2)、WD40重复结构域(WD40)、Fip1基序结构域(Fip1)、PDZ结构域(PDZ_6)、血管性血友病因子C型结构域(VWC)、NAB保守区1结构域(NCD1)、S1 RNA结合结构域(S1)、HNF3 C末端结构域(HNF_C)、Tudor结构域(Tudor_2)、组蛋白样转录因子(CBF/NF-Y)和古细菌组蛋白结构域(CBFD_NFYB_HMF)、锌指蛋白结构域(DUF3669)、EGF样结构域(cEGF)、GATA锌指结构域(GATA)、TEA/ATTS结构域(TEA)、佛波醇酯/二酰甘油结合结构域(C1-1)、多梳状MTF2因子2结构域(Mtf2_C)、FOXO蛋白家族的转录激活结构域(FOXO-TAD)、同源异型盒KN结构域(Homeobox_KN)、BED锌指结构域(ZF-BED)、C3HC4型锌指的RING结构域(ZF-C3HC4_4)、RAD51相互作用基序结构域(RAD51_interact)、N乙基-CpG结合结构域蛋白MBD的p55结合区(MBDa)、Notch结构域、Raf样Ras结合结构域(RBD)、Spin/Ssty家族结构域(Spin-Ssty)、PHD指结构域(PHD_3)、低密度脂蛋白受体结构域A类(Ldl_recept_a)、CS结构域、DM DNA结合结构域和QLQ结构域。

在一些实施方案中，效应结构域是包含YAF2_RYBP结构域或同源异型结构域或其任何组合的蛋白质结构域。在某些实施方案中，YAF2_RYBP结构域的同源异型结构域是PRD结构域、NKL结构域、HOXL结构域或LIM结构域。在特定的实施方案中，YAF2_RYBP结构域可以包含32个氨基酸的Yaf2/RYBP C末端结合基序结构域(32aa RYBP)。

在一些实施方案中，效应结构域包含选自由以下组成的组的蛋白质结构域：SUMO3结构域、来自M期磷蛋白8(MPP8)的染色质结构域、来自Chromobox 1(CBX1)的chromoshadow结构域和来自Scm多梳组蛋白同源物1(SCMH1)的SAM_1/SPM结构域。

在一些实施方案中，效应结构域包含HNF3 C末端结构域(HNF_C)。HNF_C结构域可以来自FOXA1或FOXA2。在某些实施方案中，HNF_C结构域包含EH1(engrailed同源性1)基序。

在一些实施方案中，效应结构域可以包含干扰素调节因子2结合蛋白锌指结构域(IRF-2BP1_2)、来自DNA修复因子HERC2 E3连接酶的Cyt-b5结构域、来自桥接整合子1(BIN1)的变体SH3结构域(SH3_9)、来自转录因子TOX的HMG-box结构域或来自多梳组分PCGF2的ZF-C3HC4_2环指结构域、染色质结构域-解旋酶-DNA结合蛋白3(CHD3)结构域或ZNF783结构域。

IV.表观遗传编辑器

本文提供了表观遗传编辑器(即，表观遗传编辑系统)，其例如使用如本文所述的一个或多个DNA结合结构域和如本文所述的一个或多个效应结构域(例如，表观遗传阻遏结构域)以任何组合将表观遗传修饰引导至感兴趣基因中的靶序列。DNA结合结构域(与如本文所述的指导多核苷酸协同，其中DNA结合结构域是多核苷酸指导的DNA结合结构域)指导效应结构域表观遗传修饰靶序列，导致基因抑制或沉默，其可以是持久的并且可跨细胞世代遗传。在一些方面，本文所述的表观遗传编辑器可以可逆地或不可逆地抑制或沉默细胞中的基因。

在特定的实施方案中，本文所述的表观遗传编辑器包含一种或多种融合蛋白，各自包含(1)DNA结合结构域和(2)效应结构域。效应结构域可以在表观遗传编辑器包含的一种或多种融合蛋白上。例如，单个融合蛋白可以包含具有DNA结合结构域的所有效应结构域。或者，效应结构域或其子集可以在单独的融合蛋白上，每个融合蛋白具有DNA结合结构域(其可以相同或不同)。本文所述的融合蛋白可进一步包含一个或多个接头(例如，肽接头)、可检测标签、核定位信号(NLS)或其任何组合。如本文所用，“融合蛋白”是指其中两个或更多个编码序列(例如，DNA结合结构域和/或效应结构域)直接或间接共价或非共价连接的嵌合蛋白。

在一些实施方案中，本文所述的表观遗传编辑器包含2、3、4、5、6、7、8、9、10个或更多个效应(例如，抑制/阻遏)结构域，其可以是相同的或不同的。在某些实施方案中，两个或更多个所述效应结构域协同发挥作用。效应结构域的组合可以包含DNA甲基化结构域、组蛋白去乙酰化结构域、组蛋白甲基化结构域和/或招募上述任一种的支架结构域。例如，本文所述的表观遗传编辑器可以包含一个或多个转录阻遏结构域(例如KRAB结构域如KOX1、ZIM3、ZFP28或ZN627 KRAB)与一个或多个DNA甲基化结构域(例如DNMT结构域)和/或招募结构域(例如DNMT3L结构域)的组合。这种表观遗传编辑器可以包含例如KRAB结构域、DNMT3A结构域和DNMT3L结构域。在一些实施方案中，表观遗传编辑器进一步包含额外的效应结构域(例如，KAP1、MECP2、HP1b、CBX8、CDYL2、TOX、TOX3、TOX4、EED、RBBP4、RCOR1或SCML2结构域)。在一些实施方案中，额外的效应结构域是CDYL2、TOX、TOX3、TOX4或HP1a结构域。例如，本文所述的表观遗传编辑器可以包含CDYL2和/或TOX结构域与KRAB结构域(例如，KOX1KRAB结构域)的组合。

A.接头

如本文所述的融合蛋白可以包含连接表观遗传编辑器的组分的一个或多个接头。接头可以是肽或非肽接头。

在一些实施方案中，在本文提供的表观遗传编辑器中使用的一个或多个接头是肽接头，即包含肽部分的接头。肽接头可以是适用于本文所述的表观遗传编辑器融合蛋白的任何长度。在一些实施方案中，接头可包含1至200(例如，1至80)个氨基酸的肽。在一些实施方案中，接头包含长度为1至5、1至10、1至20、1至30、1至40、1至50、1至60、1至80、1至100、1至150、1至200、5至10、5至20、5至30、5至40、5至60、5至80、5至100、5至150、5至200、10至20、10至30、10至40、10至50、10至60、10至80、10至100、10至150、10至200、20至30、20至40、20至50、20至60、20至80、20至100、20至150、20至200、30至40、30至50、30至60、30至80、30至100、30至150、30至200、40至50、40至60、40至80、40至100、40至150、40至200、50至60、50至80、50至100、50至150、50至200、60至80、60至100、60至150、60至200、80至100、80至150、80至200、100至150、100至200或150至200个氨基酸。还可考虑更长或更短的接头。在一些实施方案中，肽接头的长度为3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、25、40、45、50、55、60、65、70、75、80、85、90、95或100个氨基酸。例如，肽接头的长度可以是4、5、16、20、24、27、32、40、64、92或104个氨基酸。肽接头可以是柔性或刚性接头。在特定的实施方案中，肽接头包含SEQ ID NO:631-637和664-665中任一个的氨基酸序列或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在某些实施方案中，肽接头是XTEN接头。此类接头可以包含XTEN序列的一部分(Schellenberger et al.,Nat Biotechnol(2009)27(1):1186-90)，其为仅由残基G、S、P、T、E和A组成的非结构化亲水性多肽。如本文所用，术语“XTEN”是指缺乏疏水性氨基酸残基的重组肽或多肽。XTEN接头通常是非结构化的并且包含一组有限的天然氨基酸。XTEN与蛋白质的融合改变了其流体动力学性质并降低了融合蛋白的清除和降解速率。这些XTEN融合蛋白使用重组技术产生，不需要化学修饰，并通过天然途径降解。XTEN接头的长度可以是例如5、10、16、20、26或80个氨基酸。在一些实施方案中，XTEN接头的长度为16个氨基酸。在一些实施方案中，XTEN接头的长度为80个氨基酸。在某些实施方案中，XTEN接头可以是XTEN10、XTEN16、XTEN20或XTEN80。在某些实施方案中，XTEN接头可以包含SEQ ID NO:638-643中任一个的氨基酸序列或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在特定的实施方案中，XTEN接头包含SEQ ID NO:638的氨基酸序列。在特定的实施方案中，XTEN接头包含SEQ ID NO:643的氨基酸序列。

在一些实施方案中，在本文提供的表观遗传编辑器中使用的一个或多个接头是非肽接头。例如，接头可以是碳键、二硫键或碳-杂原子键。在某些实施方案中，接头是酰胺连接键的碳-氮键。在某些实施方案中，接头是环状或非环状、取代或未取代、或支链或非支链脂肪族或杂脂肪族接头。

在一些实施方案中，在本文提供的表观遗传编辑器中使用的一个或多个接头是聚合的(例如，聚乙烯、聚乙二醇、聚酰胺、聚酯等)。接头可以包含例如氨基烷酸的单体、二聚体或聚合物；氨基烷酸(例如甘氨酸、乙酸、丙氨酸、β-丙氨酸、3-氨基丙酸、4-氨基丁酸、5-戊酸等)；氨基己酸(Ahx)的单体、二聚体或聚合物；或聚乙二醇部分(PEG)；或芳基或杂芳基部分。在某些实施方案中，接头可以基于碳环部分(例如，环戊烷或环己烷)或苯环。接头可以包括官能化部分以促进亲核试剂(例如硫醇、氨基)从肽附接到接头。任何亲电试剂都可以用作接头的一部分。示例性亲电试剂包括但不限于活化酯、活化酰胺、烷基卤化物、芳基卤化物、酰基卤化物和异硫氰酸酯。

可以在表观遗传编辑器的任何两个组分之间(例如，在效应结构域(例如，阻遏结构域)和DNA结合结构域(例如，Cas9结构域)之间、在第一效应结构域和第二效应结构域之间等)采用各种接头长度和柔性。接头的范围可以从非常柔性的接头(例如富含甘氨酸/丝氨酸的接头)到更刚性的接头，以实现针对特定应用的效应结构域活性的最佳长度。在一些实施方案中，更柔性的接头是富含甘氨酸/丝氨酸的接头(富含GS的接头)，其中超过45％(例如，超过48、50、55、60、70、80或90％)的残基是甘氨酸或丝氨酸残基。富含GS的接头的非限制性示例是(GGGGS)n(SEQ ID NO:664)、(G)n和W接头(SEQ ID NO:637)。在一些实施方案中，更刚性的接头呈(EAAAK)n(SEQ ID NO:665)、(SGGS)n(SEQ ID NO:631和(XP)n)的形式。在上述柔性接头和刚性接头的式中，n可以是1至30之间的任何整数。在一些实施方案中，n是1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。在一些实施方案中，接头包含(GGS)n基序，其中n是1、3或7。在一些实施方案中，接头包含(GGGGS)n基序，其中n是4(SEQ ID NO:636)。

在一些实施方案中，本文所述的表观遗传编辑器中的接头包含核定位信号，例如，具有SEQ ID NO:644-649中任一个的氨基酸序列。在一些实施方案中，本文所述的表观遗传编辑器中的接头包含表达标签，例如可检测标签，如绿色荧光蛋白。

B.核定位信号

本文所述的融合蛋白可以包含一个或多个核定位信号，并且在某些实施方案中，可以包含两个或更多个核定位信号。例如，融合蛋白可以包含1、2、3、4、5、6、7、8、9、10个或更多个核定位信号。如本文所用，“核定位信号”(NLS)是将蛋白质导向细胞核的氨基酸序列。在某些实施方案中，NLS可以是SV40 NLS(例如，具有SEQ ID NO:644的氨基酸序列)。融合蛋白可以在其N末端、C末端或两者处包含NLS，和/或NLS可以嵌入融合蛋白的中间(例如，在DNA结合结构域或效应结构域的N或C末端)。

在一些实施方案中，融合蛋白可以包含两个NLS。融合蛋白可以在其N末端或C末端包含两个NLS。融合蛋白可以包含位于其N末端的一个NLS和嵌入在融合蛋白中间的一个NLS，或位于其C末端的一个NLS和嵌入在融合蛋白中间的一个NLS。融合蛋白可以包含嵌入在融合蛋白中间的两个NLS。

在一些实施方案中，融合蛋白可以包含四个NLS。融合蛋白可以在其N末端或C末端包含至少两个(例如，两个、三个或四个)NLS。融合蛋白可以包含至少一个(例如，一个、两个、三个或四个)嵌入融合蛋白中间的NLS。在特定的实施方案中，融合蛋白可以在其N末端包含两个NLS并且在其C末端包含两个NLS。

本文所述的NLS可以是内源性NLS序列。在某些实施方案中，本文所述的NLS包含SEQ ID NO:644-649中任一个的氨基酸序列，或与所选序列至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在特定的实施方案中，NLS包含SEQ ID NO:644的氨基酸序列。额外的NLS是本领域已知的。

在一些实施方案中，与具有在N末端不具有至少一个NLS且在C末端不具有至少一个NLS的相应融合蛋白的表观遗传编辑器相比，包含在N末端包含至少一个NLS且在C末端包含至少一个NLS的融合蛋白的表观遗传编辑器可以将表观遗传编辑器的效率提高至少5％、至少10％、至少15％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少100％、至少200％、至少300％、至少400％、至少500％、至少600％、至少700％、至少800％、至少900％、至少1,000％、至少5,000％、至少10,000％、至少50,000％、至少100,000％或更多。

在一些实施方案中，与具有在N端不具有两个NLS且在C端不具有两个NLS的相应融合蛋白的表观遗传编辑器相比，包含在N端包含两个NLS且在C端包含两个NLS的融合蛋白的表观遗传编辑器可以将表观遗传编辑器的效率提高至少5％、至少10％、至少15％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少100％、至少200％、至少300％、至少400％、至少500％、至少600％、至少700％、至少800％、至少900％、至少1,000％、至少5,000％、至少10,000％、至少50,000％、至少100,000％或更多。

C.标签

本文提供的表观遗传编辑器可以包含用于跟踪、检测和定位编辑器的一个或多个额外的序列(“标签”)。在一些实施方案中，表观遗传编辑器包含1、2、3、4、5、6、7、8、9、10个或更多个可检测标签。每个可检测标签可以相同或不同。

例如，表观遗传编辑器融合蛋白可以包含细胞质定位序列、输出序列(例如核输出序列)或其他定位序列，以及可用于溶解、纯化或检测融合蛋白的序列标签。本文提供的合适的蛋白质标签包括但不限于生物素羧化酶载体蛋白(BCCP)标签、myc标签、钙调蛋白标签、FLAG标签、血凝素(HA)标签、聚组氨酸标签(也称为组氨酸标签或His-标签)、麦芽糖结合蛋白(MBP)标签、nus标签、谷胱甘肽-S-转移酶(GST)标签、绿色荧光蛋白(GFP)标签、硫氧还蛋白标签、S标签、Softag(例如，Softag 1或Softag 3)、strep标签、生物素连接酶标签、FlAsH标签、V5标签和SBP标签。额外的合适序列对于本领域技术人员将是显而易见的。

D.融合蛋白构型

本文所述的表观遗传编辑器的融合蛋白可以具有以不同构型构造的其组分。例如，DNA结合结构域可以在C末端、N末端或在两个或更多个表观遗传效应结构域或额外的结构域之间。在一些实施方案中，DNA结合结构域位于表观遗传编辑器的C末端。在一些实施方案中，DNA结合结构域位于表观遗传编辑器的N末端。在一些实施方案中，DNA结合结构域与一个或多个核定位信号连接。在一些实施方案中，DNA结合结构域在两侧侧接表观遗传效应结构域和/或额外的结构域。在一些实施方案中，其中“DBD”指示DNA结合结构域且“ED”指示效应结构域，表观遗传编辑器包含以下构型：

-N’]-[ED1]-[DBD]-[ED2]-[C’

-N’]-[ED1]-[DBD]-[ED2]-[ED3]-[C’

-N’]-[ED1]-[ED2]-[DBD]-[ED3]-[C’

或

-N’]-[ED1]-[ED2]-DBD]-[ED3]-[ED4]-[C’。

在一些实施方案中，表观遗传编辑器包含DNA结合结构域(DBD)、DNA甲基转移酶(DNMT)结构域和抑制或沉默靶基因表达的转录阻遏(“阻遏物”)结构域。DBD、DNMT和转录阻遏结构域可以是如本文所述的以任何组合方式的任何结构域。DBD、DNMT结构域和阻遏结构域可以是任何构型，例如，在融合蛋白的N末端、C末端或中间具有任何所述结构域。在一些实施方案中，表观遗传编辑器包含具有以下构型的融合蛋白：

N’]-[DNMT结构域]-[DBD]-[阻遏结构域]-[C’

N’]-[阻遏结构域]-[DBD]-[DNMT结构域]-[C’

N’]-[DNMT结构域]-[阻遏结构域]-[DBD]-[C’

或

N’]-[阻遏结构域]-[DNMT结构域]-[DBD]-[C’。

在一些实施方案中，表观遗传编辑器结构中的任一个中的连接结构“]-[”是接头，例如肽接头；可检测标签；肽键；核定位信号；和/或启动子或调节序列。在表观遗传编辑器结构中，多个连接结构“]-[”可以是相同的，或者可以各自是不同的接头、标签、NLS或肽键。在一些实施方案中，DNMT结构域可以包含表6中的任何一个结构域，或其任何组合或同源物。在特定的实施方案中，DNMT结构域包含DNMT3A或其截短型式、DNMT3L或其截短型式或两者。在特定的实施方案中，DBD是无催化活性的多核苷酸引导的DNA结合结构域(例如，dCas9)或ZFP结构域。在某些实施方案中，阻遏结构域包含表4或5中所示的结构域中的任一个，或其任何组合或同源物。例如，阻遏结构域可以是KRAB结构域。在某些实施方案中，阻遏结构域是ZFP28、ZN627、KAP1、MeCP2、HP1b、CBX8、CDYL2、TOX、Tox3、Tox4、EED、RBBP4、RCOR1或SCML2结构域，或所述结构域中的两个的融合体(例如，ZIM3和KOX1 KRAB的N-和C-末端区域的融合体)。在特定的实施方案中，阻遏结构域是来自ZFP28、ZN627、ZIM3或KOX1的KRAB结构域。

在一些实施方案中，表观遗传编辑器包含选自以下的构型：

N’]-[DNMT3A-DNMT3L]-[DBD]-[阻遏物]-[C’

N’]-[阻遏物]-[DBD]-[DNMT3A-DNMT3L]-[C’

N’]-[repressor]-[DBD]-[DNMT3A]-[C’

N’]-[DNMT3A]-[DBD]-[阻遏物]-[C’

N’]-[阻遏物]-[DBD]-[DNMT3A]-[DNMT3L]-[C’

N’]-[DNMT3A]-[DNMT3L]-[DBD]-[阻遏物]-[C’

N’]-[DNMT3A]-[DBD]-[C’

N’]-[DBD]-[DNMT3A]-[C’

N’]-[DNMT3L]-[DBD]-[C’

N’]-[DBD]-[DNMT3L]-[C’

其中[DNMT3A-DNMT3L]指示DNMT3A和DNMT3L结构域经由肽键直接融合，并且其中连接结构]-[是如本文所述的接头、可检测标签、亲和结构域、肽键、核定位信号、启动子和/或调节序列中的任一种。DBD、阻遏物、DNMT3A和DNMT3L结构域可以是如本文所述的以任何组合方式的任何结构域。例如，DNMT3A和DNMT3L结构域可以选自表6中的那些。在特定的实施方案中，DBD是CRISPR相关蛋白结构域(例如，dCas9)或ZFP结构域；阻遏结构域是衍生自KOX1、ZIM3、ZFP28或ZN627的KRAB结构域；DNMT3A结构域是人DNMT3A结构域；并且DNMT3L结构域是人或小鼠DNMT3L结构域；本公开还考虑了这些组分的任何组合。

在一些实施方案中，表观遗传编辑器包含选自以下的构型：

N’]-[DNMT3A]-[DBD]-[SETDB1]-[C’

N’]-[DNMT3A]-[DNMT3L]-[DBD]-[SETDB1]-[C’

N’]-[DNMT3A-DNMT3L]-[DBD]-[SETDB1]-[C’

N’]-[SETDB1]-[DBD]-[DNMT3A]-[DNMT3L]-[C’

N’]-[SETDB1]-[DBD]-[DNMT3A]-[C’

其中[DNMT3A-DNMT3L]指示DNMT3A和DNMT3L结构域经由肽键直接融合，并且其中连接结构]-[是如本文所述的接头、可检测标签、亲和结构域、肽键、核定位信号、启动子和/或调节序列中的任一种。DBD、SETDB1、DNMT3A和DNMT3L结构域可以是本文所述的以任何组合方式的任何结构域。在特定的实施方案中，DBD是CRISPR相关蛋白结构域(例如，dCas9)或ZFP结构域；SETDB1结构域衍生自人SETDB1、ZIM3、ZFP28或ZN627；DNMT3A结构域是人DNMT3A结构域；并且DNMT3L结构域是人或小鼠DNMT3L结构域；本公开还考虑这些组分的任何组合。

本文考虑的特定构建体包括：

DNMT3A-DNMT3L-XTEN80-NLS-dCas9-NLS-XTEN16-KOX1KRAB(构型1)，

DNMT3A-DNMT3L-XTEN80-NLS-ZFP结构域-NLS-XTEN16-KOX1KRAB(构型2)，

NLS-DNMT3A-DNMT3L-XTEN80-dCas9-XTEN16-KOX1 KRAB-NLS(构型3)，

NLS-DNMT3A-DNMT3L-XTEN80-ZFP结构域-XTEN16-KOX1KRAB-NLS(构型4)，

NLS-NLS-DNMT3A-DNMT3L-XTEN80-dCas9-XTEN16-KOX1KRAB-NLS-NLS(构型5)，和

NLS-NLS-DNMT3A-DNMT3L-XTEN80-ZFP结构域-XTEN16-KOX1KRAB-NLS-NLS(构型6)。

DNMT3L和DNMT3A可以衍生自人亲本蛋白、小鼠亲本蛋白或其任何组合。在某些实施方案中，DNMT3L和DNMT3A分别衍生自小鼠和人亲本蛋白(mDNMT3L和hDNMT3A)。在某些实施方案中，DNMT3L和DNMT3A均衍生自人亲本蛋白(hDNMT3L和hDNMT3A)。在一些实施方案中，dCas9是dSpCas9。在一些实施方案中，KOX1是人KOX1。还考虑了构型1-6中的任一种，其中KOX1 KRAB结构域被ZFP28、ZN627或ZIM3 KRAB结构域替换。在一些实施方案中，ZFP28、ZN627和ZIM3分别是人ZFP28、人ZN627和人ZIM3。在特定的实施方案中，融合构建体可以具有以下构型：

NLS-NLS-hDNMT3A-hDNMT3L-XTEN80-dCas9-XTEN16-KOX1KRAB-NLS-NLS(构型7)，

NLS-NLS-DNMT3A-DNMT3L-XTEN80-ZFP结构域-XTEN16-KOX1KRAB-NLS-NLS(构型8)，

NLS-NLS-hDNMT3A-hDNMT3L-XTEN80-dCas9-XTEN16-ZFP28KRAB-NLS-NLS(构型9),

NLS-NLS-DNMT3A-DNMT3L-XTEN80-ZFP结构域-XTEN16-ZFP28KRAB-NLS-NLS(构型10)，

NLS-NLS-hDNMT3A-hDNMT3L-XTEN80-dCas9-XTEN16-ZN627KRAB-NLS-NLS(构型11)，

NLS-NLS-DNMT3A-DNMT3L-XTEN80-ZFP结构域-XTEN16-ZN627KRAB-NLS-NLS(构型12)，

NLS-NLS-hDNMT3A-hDNMT3L-XTEN80-dCas9-XTEN16-ZIM3KRAB-NLS-NLS(构型13)，或

NLS-NLS-DNMT3A-DNMT3L-XTEN80-ZFP结构域-XTEN16-ZIM3KRAB-NLS-NLS(构型14)。

在特定的实施方案中，本文所述的融合构建体可以具有构型1并且包含SEQ IDNO:658或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在以下SEQ ID NO:658中，XTEN接头带下划线，W接头带粗体、下划线和斜体，NLS序列带粗体，DNMT3A序列带斜体，DNMT3L序列带下划线和斜体，dCas9结构域带粗体和斜体，KOX1 KRAB结构域带下划线和粗体：

DFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFD

SPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKK

DLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSP

EDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQA

ENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLS

QLGGDPKKKRKVSGSETPGTSESATPESTGRTLVTFKDVFVDFTREEWKLLDTAQQI

VYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP(SEQ ID NO:658)

在特定的实施方案中，本文所述的融合构建体可以包含以下提供的序列(SEQ IDNO:1495)，或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在以下SEQ ID NO:1495中，XTEN接头带下划线，W接头带粗体、下划线和斜体，NLS序列带粗体，DNMT3A序列带斜体，DNMT3L序列带下划线和斜体，dCas9结构域带粗体和斜体，KOX1 KRAB结构域带下划线和粗体：

在特定的实施方案中，本文所述的融合构建体可以具有构型2并且包含SEQ IDNO:659或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在以下SEQ ID NO:659中，XTEN接头带下划线，W接头带粗体、下划线和斜体，NLS序列带粗体和下划线，DNMT3A序列带斜体，DNMT3L序列带下划线和斜体，ZFP结构域带粗体，并且KOX1 KRAB结构域带下划线和粗体。由X表示的可变氨基酸是锌指的DNA识别螺旋的氨基酸，斜体的XX可以是TR、LR或LK。

在某些实施方案中，SEQ ID NO:659中的六个“XXXXXXX”区依次包含表1中针对ZF001-ZF048中任一个所示的F1-F6氨基酸序列。[接头]表示接头序列。在一些实施方案中，一个或两个接头序列可以是TGSQKP(SEQ ID NO:651)。在一些实施方案中，一个或两个接头序列可以是TGGGGSQKP(SEQ ID NO:652)。在一些实施方案中，一个接头序列可以具有SEQID NO:651的氨基酸序列，并且另一个接头序列可以具有SEQ ID NO:652的氨基酸序列。

在特定的实施方案中，本文所述的融合构建体可以包含以下提供的序列(SEQ IDNO:1496)，或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。在下面的SEQ ID NO:1496中，XTEN接头带下划线，W接头带粗体、下划线和斜体，NLS序列带粗体和下划线，DNMT3A序列带斜体，DNMT3L序列带下划线和斜体，ZFP结构域带粗体，KOX1 KRAB结构域带下划线和粗体。由X表示的可变氨基酸是锌指的DNA识别螺旋的氨基酸，斜体的XX可以是TR、LR或LK。

在某些实施方案中，SEQ ID NO:1496中的六个“XXXXXXX”区域依次包含表1中针对ZF001-ZF048中任一个所示的F1-F6氨基酸序列。[接头]表示接头序列。在一些实施方案中，一个或两个接头序列可以是TGSQKP(SEQ ID NO:651)。在一些实施方案中，一个或两个接头序列可以是TGGGGSQKP(SEQ ID NO:652)。在一些实施方案中，一个接头序列可以具有SEQID NO:651的氨基酸序列，并且另一个接头序列可以具有SEQ ID NO:652的氨基酸序列。

在一些实施方案中，融合蛋白可以进一步包含Dnmt3A ADD结构域，例如在上文公开的SEQ ID NO:658、659、1495或1496中公开的Dnmt3A结构域序列的下游。在一些实施方案中，ADD序列位于融合蛋白的Dnmt3A和Dnmt3L序列之间。在一些实施方案中，ADD序列位于Dnmt3A结构域的C末端。在一些实施方案中，Dnmt3A序列和ADD序列通过接头(例如本文公开的接头)分开。在一些实施方案中，ADD序列和Dnmt3L序列通过接头(例如本文公开的接头)分开。在一些实施方案中，ADD结构域包含序列：

MAAIPALDPEAEPSMDVILVGSSELSSSVSPGTGRDLIAYEVKANQRNIEDICICCGSLQVHTQHPLFEGGICAPCKDKFLDALFLYDDDGYQSYCSICCSGETLLICGNPDCTRCYCFECVDSLVGPGTSGKVHAMSNWVCYLCLPSSRSGLLQRRRKWRSQLKAFYDRESENPLEMFETVPVWRRQPVRVLSLFEDIKKELTSLGFLESGSDPGQLKHVVDVTDTVRKDVEEWGPFDLVYGATPPLGHTCDRPPSWYLFQFHRLLQYARPKPGSPRPFFWMFVDNLVLNKEDLDVASRFLEMEPVTIPDVHGGSLQNAVRVWSNIPAIRSRHWALVSEEELSLLAQNKQSSKLAAKWPTKLVKNCFLPLREYFKYFSTELTSSL(SEQ ID NO:1497)。

在特定的实施方案中，本文所述的融合构建体可以具有构型7并且包含SEQ IDNO:660或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，本文所述的融合构建体可以具有构型9并且包含SEQ IDNO:661或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，本文所述的融合构建体可以具有构型11并且包含SEQ IDNO:662或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在特定的实施方案中，本文所述的融合构建体可以具有构型13并且包含SEQ IDNO:663或与其至少75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的序列。

在一些实施方案中，本文所述的融合构建体(例如，构型1-14中任一个的融合构建体)在包含WPRE序列、聚腺苷酸化位点或两者的表达构建体内。在某些实施方案中，WPRE序列在3'非编码区中。在某些实施方案中，WPRE序列在聚腺苷酸化位点的上游。在特定的实施方案中，表达构建体包含融合构建体(例如，构型1-14中任一构型)和位于聚腺苷酸化位点上游的3'非编码区中的WPRE序列。

在一些实施方案中，本文所述的融合构建体可以具有如实施例12中所示的融合蛋白1-12中任一个的序列。

多种融合蛋白可用于实现靶基因或多个靶基因的激活或抑制。例如，包含DNA结合结构域(例如，dCas9结构域)和效应结构域的表观遗传编辑器融合蛋白可以与两个或更多个指导多核苷酸(例如，gRNA)共同递送，每个指导多核苷酸靶向不同的靶DNA序列。两个DNA结合结构域的靶位点可以相同或彼此附近，或者相隔例如约100个碱基对、约200个碱基对、约300个碱基对、约400个碱基对、约500个碱基对或约600个或更多个碱基对。另外，当靶向双链DNA如内源基因座时，指导多核苷酸可以靶向相同或不同的链(一条或多条针对正链和/或一条或多条针对负链)。

V.靶序列

本文的表观遗传编辑器可以针对PCSK9中的靶序列以实现PCSK9基因的表观遗传修饰。如本文所用，“靶序列”、“靶位点”或“靶区域”是存在于感兴趣的基因中的核酸序列；在一些情况下，靶序列可以在感兴趣的基因之外但在感兴趣的基因附近，其中靶序列的甲基化或阻遏物的结合抑制基因的表达。在一些实施方案中，靶序列可以是低甲基化或超甲基化的核酸序列。

靶序列可以在靶基因的任何部分中。在一些实施方案中，靶序列是基因的非编码序列的一部分或在其附近。在一些实施方案中，靶序列是基因的外显子的一部分。在一些实施方案中，靶序列是基因的转录调节序列(如启动子或增强子)的一部分或在其附近。在一些实施方案中，靶序列与CpG岛相邻、重叠或涵盖CpG岛。在某些实施方案中，靶序列在PCSK9TSS侧翼的约3000、2900、2800、2700、2600、2500、2400、2300、2200、2100、2000、1900、1800、1700、1600、1500、1400、1300、1200、1100、1000、900、800、700、600、500、400、300、200或100个碱基对(bp)内。在某些实施方案中，靶序列在PCSK9 TSS侧翼的500bp内。在某些实施方案中，靶序列在PCSK9 TSS侧翼的1000bp内。

在一些实施方案中，靶序列可以和与融合蛋白复合的指导多核苷酸序列(例如，gRNA)杂交，该融合蛋白包含多核苷酸指导的DNA结合结构域(例如，CRISPR蛋白，如dCas9)和效应结构域。指导多核苷酸序列可以被设计成与靶序列具有互补性，或与靶序列的相反链具有同一性。在一些实施方案中，指导多核苷酸包含与靶序列中的原间隔区序列约80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的间隔区序列。在特定的实施方案中，指导多核苷酸包含与靶序列中的原间隔区序列100％相同的间隔区序列。

在一些实施方案中，其中本文所述的表观遗传编辑器的DNA结合结构域是锌指阵列，靶序列可以被所述锌指阵列识别。

在一些实施方案中，其中本文所述的表观遗传编辑器的DNA结合结构域是TALE，靶序列可以被所述TALE识别。

本文所述的靶序列可以对靶基因的一个拷贝具有特异性，或者可以对靶基因的一个等位基因具有特异性。因此，表观遗传修饰及其表达调节可以对靶基因的一个拷贝或一个等位基因具有特异性。例如，表观遗传编辑器可以抑制含有由DNA结合结构域识别的靶序列的特定拷贝(例如，与疾病或病况相关的拷贝，或含有与疾病或病况相关的突变的拷贝)的表达。

在一些实施方案中，靶PCSK9基因组区域可以落入以下所示的序列(chr1：55038548-55040548)内，具有或不具有末端A：

TACCTCATGGAGTCACTGTCAACCCACTGGTTGCACTGTCTTTGTGCACTGGCTCTCTGGAGTGAGGTCTTTGCAAACAAAGTGGAAAGAGCATCAACTTTGGACTCCAGCACCTAGATTCAGAGCAGGCCATTTCACTCGGAATCTGCTGTGCATCTGCAAGGGAGGATCATAAATTCGCCTTTGTTTCTTCCCAGTATCGACAGCCCTTCCAGAAAGAGCAAGCCTCATGTCATGCCACATGTACAATCTGAGGCCAGGAGCTCTCTTTCCCCTTTTCATCCTCCTGCCTGGTACACAATAGGTGTTTACTGGATGCTTGTCCAGTTGATTTCTTGAACATGGTGTGTAAAAGGAATCTTTGCAAATTGAATCTTCTGGAAAGCTGAGCTTGTGCCTACCATAGAATTCTGAATGTACCTATATGACGTCTTTGCAAACTTAAAACCTGAATCTTTGTAGTATAAATCCCTTGAAATGCATGTAGGCTGGACATCAAAAGCAAGCAATCTCTTCAAGGAGCAGCTAGTTGGTAAGGTCAGTGTGCAGGGTGCATAAAGGGCAGAGGCCGGAGGGGGTCCAGGCTAAGTTTAGAAGGCTGCCAGGTTAAGGCCAGTGGAAAGAATTCGGTGGGCAGCGAGGAGTCCACAGTAGGATTGATTCAGAAGTCTCACTGGTCAGCAGGAGACAAGGTGGACCCAGGAAACACTGAAAAGGTGGGCCCGGCAGAACTTGGAGTCTGGCATCCCACGCAGGGTGAGAGGCGGGAGAGGAGGAGCCCCTAGGGCGCCGGCCTGCCTTCCAGCCCAGTTAGGATTTGGGAGTTTTTTCTTCCCTCTGCGCGTAATCTGACGCTGTTTGGGGAGGGCGAGGCCGAAACCTGATCCTCCAGTCCGGGGGTTCCGTTAATGTTTAATCAGATAGGATCGTCCGATGGGGCTCTGGTGGCGTGATCTGCGCGCCCCAGGCGTCAAGCACCCACACCCTAGAAGGTTTCCGCAGCGACGTCGAGGCGCTCATGGTTGCAGGCGGGCGCCGCCGTTCAGTTCAGGGTCTGAGCCTGGAGGAGTGAGCCAGGCAGTGAGACTGGCTCGGGCGGGCCGGGACGCGTCGTTGCAGCAGCGGCTCCCAGCTCCCAGCCAGGATTCCGCGCGCCCCTTCACGCGCCCTGCTCCTGAACTTCAGCTCCTGCACAGTCCTCCCCACCGCAAGGCTCAAGGCGCCGCCGGCGTGGACCGCGCACGGCCTCTAGGTCTCCTCGCCAGGACAGCAACCTCTCCCCTGGCCCTCATGGGCACCGTCAGCTCCAGGCGGTCCTGGTGGCCGCTGCCACTGCTGCTGCTGCTGCTGCTGCTCCTGGGTCCCGCGGGCGCCCGTGCGCAGGAGGACGAGGACGGCGACTACGAGGAGCTGGTGCTAGCCTTGCGTTCCGAGGAGGACGGCCTGGCCGAAGCACCCGAGCACGGAACCACAGCCACCTTCCACCGCTGCGCCAAGGTGCGGGTGTAGGGATGGGAGGCCGGGGCGAACCCGCAGCCGGGACGGTGCGGTGCTGTTTCCTCTCGGGCCTCAGTTTCCCCCCATGTAAGAGAGGAAGTGGAGTGCAGGTCGCCGAGGGCTCTTCGCTTGGCACGATCTTGGGGACTGCAGGCAAGGCGGCGGGGGAGGACGGGTAGTGGGGAGCACGGTGGAGAGCGGGGACGGCCGGCTCTTTGGGGACTTGCTGGGGCGTGCGGCTGCGCTATTCAGTGGGAAGGTTCGCGGGGTTGGGAGACCCGGAGGCCGAGGAAGGGCGAGCAGAGCACTGCCAGGATATCCTGCCCAGATTTCCCAGTTTCTGCCTCGCCGCGGCACAGGTGGGTGAAGGAGTGAATGCCTGGAACGTACTGGGAACTGCACCAGGCACAGAGAAAGCGGGCTTGCCATTATAGTGGGTTCCGATTTGGTTTGGAAAACATGGGCAGCGGAGGGTGGAGGGCCTGGAGAGAAGGCCCTACCCGA(SEQ ID NO:1488)

在一些实施方案中，靶序列可以是GRCh38 Chr1：55039228-55040296，如下所示：

GCAGGAGACAAGGTGGACCCAGGAAACACTGAAAAGGTGGGCCCGGCAGAACTTGGAGTCTGGCATCCCACGCAGGGTGAGAGGCGGGAGAGGAGGAGCCCCTAGGGCGCCGGCCTGCCTTCCAGCCCAGTTAGGATTTGGGAGTTTTTTCTTCCCTCTGCGCGTAATCTGACGCTGTTTGGGGAGGGCGAGGCCGAAACCTGATCCTCCAGTCCGGGGGTTCCGTTAATGTTTAATCAGATAGGATCGTCCGATGGGGCTCTGGTGGCGTGATCTGCGCGCCCCAGGCGTCAAGCACCCACACCCTAGAAGGTTTCCGCAGCGACGTCGAGGCGCTCATGGTTGCAGGCGGGCGCCGCCGTTCAGTTCAGGGTCTGAGCCTGGAGGAGTGAGCCAGGCAGTGAGACTGGCTCGGGCGGGCCGGGACGCGTCGTTGCAGCAGCGGCTCCCAGCTCCCAGCCAGGATTCCGCGCGCCCCTTCACGCGCCCTGCTCCTGAACTTCAGCTCCTGCACAGTCCTCCCCACCGCAAGGCTCAAGGCGCCGCCGGCGTGGACCGCGCACGGCCTCTAGGTCTCCTCGCCAGGACAGCAACCTCTCCCCTGGCCCTCATGGGCACCGTCAGCTCCAGGCGGTCCTGGTGGCCGCTGCCACTGCTGCTGCTGCTGCTGCTGCTCCTGGGTCCCGCGGGCGCCCGTGCGCAGGAGGACGAGGACGGCGACTACGAGGAGCTGGTGCTAGCCTTGCGTTCCGAGGAGGACGGCCTGGCCGAAGCACCCGAGCACGGAACCACAGCCACCTTCCACCGCTGCGCCAAGGTGCGGGTGTAGGGATGGGAGGCCGGGGCGAACCCGCAGCCGGGACGGTGCGGTGCTGTTTCCTCTCGGGCCTCAGTTTCCCCCCATGTAAGAGAGGAAGTGGAGTGCAGGTCGCCGAGGGCTCTTCGCTTGGCACGATCTTGGGGACTGCAGGCAAGGCGGCGGGGGAGGACGGGTAGTGGGGAGCACGGTGGAGAGCGGGGACGGCCGGCTCTTTGGGGACTTGCTGGGGCGTGCGGCTGCGCTATTCAG(SEQ ID NO:1489)

VI.表观遗传修饰

本文所述的表观遗传编辑器可以对含有靶序列的靶基因进行序列特异性表观遗传修饰(例如，化学修饰的改变)。这种表观遗传调节可以比由于基因编辑引起的调节(例如通过产生DNA双链断裂)更安全且更容易可逆。在一些实施方案中，表观遗传调节可以减少或沉默靶基因。在一些实施方案中，修饰在靶序列的特定位点处。在一些实施方案中，修饰在靶基因的特定等位基因处。因此，表观遗传修饰可以导致含有特定等位基因的靶基因的一个拷贝而不是靶基因的另一个拷贝的表达被调节(例如，降低)。在一些实施方案中，特定等位基因与疾病、病况或病症相关。

在一些实施方案中，表观遗传修饰减少或消除含有靶序列的靶基因的转录。在一些实施方案中，表观遗传修饰减少或消除含有由表观遗传编辑器识别的特定等位基因的靶基因拷贝的转录。在一些实施方案中，表观遗传编辑器降低由靶基因编码的蛋白质的水平或消除其表达。在一些实施方案中，表观遗传编辑器降低由含有表观遗传编辑器识别的特定等位基因的靶基因拷贝编码的蛋白质的水平或消除其表达。靶PCSK9基因可以在体外、离体或体内进行表观遗传修饰。

本文所述的表观遗传编辑器的效应结构域可以改变(例如，放置或去除)靶基因的核苷酸处或与靶基因相关的组蛋白处的化学修饰。化学修饰可以在单个核苷酸或单个组蛋白处改变，或者可以在2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1500、2000、2500、3000或更多个核苷酸处改变。

在一些实施方案中，本文所述的表观遗传编辑器的效应结构域可以改变靶基因内的CpG二核苷酸。在一些实施方案中，与基因的原始状态或未与表观遗传编辑器接触的可比细胞中的基因相比，靶序列侧翼2000、1500、1000、500或200bp内的所有CpG二核苷酸(例如，在如本文所述的改变位点中)根据本文所述的修饰类型被改变。在一些实施方案中，与基因的原始状态或未与表观遗传编辑器接触的可比细胞中的基因相比，至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700或更多个CpG二核苷酸被改变。在一些实施方案中，与基因的原始状态或未与表观遗传编辑器接触的可比细胞中的基因相比，至少5％、6％、7％、8％、9％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的CpG二核苷酸被改变。在一些实施方案中，与基因的原始状态或未与表观遗传编辑器接触的可比细胞中的基因相比，一个单一CpG二核苷酸被改变。

本文所述的表观遗传编辑器的效应结构域可以改变与靶基因相关或结合的组蛋白的组蛋白修饰状态。例如，效应结构域可以在与靶基因相关的组蛋白的组蛋白尾部的一个或多个赖氨酸残基上放置修饰。在一些实施方案中，效应结构域可导致与靶基因相关的组蛋白的一个或多个组蛋白尾的去乙酰化，从而降低或沉默靶基因的表达。在一些实施方案中，组蛋白修饰状态是甲基化状态。例如，效应结构域可导致与靶基因相关的一个或多个组蛋白尾部处的H3K9、H3K27或H4K20甲基化(例如，H3K9me2、H3K9me3、H3K27me2、H3K27me3和H4K20me3甲基化中的一个或多个)，从而降低或沉默靶基因的表达。

在一些实施方案中，与染色体的原始状态或未与表观遗传编辑器接触的可比细胞中的染色体相比，与靶序列侧翼2000、1500、1000、500或200bp内的DNA核苷酸结合的组蛋白的所有组蛋白尾根据本文所述的修饰类型被改变。在一些实施方案中，与染色体的原始状态或未与表观遗传编辑器接触的可比细胞中的染色体相比，结合的组蛋白的至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120或更多个组蛋白尾发生改变。在一些实施方案中，与染色体的原始状态或未与表观遗传编辑器接触的可比细胞中的染色体相比，结合的组蛋白的至少5％、6％、7％、8％、9％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％的组蛋白尾发生改变。例如，与染色体的原始状态或未与表观遗传编辑器接触的可比细胞中的染色体相比，结合的组蛋白的一个单一组蛋白尾可以被改变。作为另一个示例，与染色体的原始状态或未与表观遗传编辑器接触的可比细胞中的染色体相比，一个单一结合的组蛋白八聚体可以被改变。

放置在靶基因DNA核苷酸或组蛋白残基处的化学修饰可以位于或紧邻靶基因中的靶序列。在一些实施方案中，本文所述的表观遗传编辑器的效应结构域改变靶基因中的靶序列5'或3’处100-200、200-300、300-400、400-55、500-600、600-700或700-800个核苷酸的核苷酸或与其结合的组蛋白尾的化学修饰状态。在一些实施方案中，效应结构域改变靶序列侧翼的10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900或2000个核苷酸内的核苷酸或与其结合的组蛋白尾的化学修饰状态。如本文所用，“侧翼”是指特定序列(例如靶序列)的5'至5'末端和3'至3'末端的核苷酸位置。

在一些实施方案中，效应结构域介导或诱导远离靶序列的核苷酸或与其结合的组蛋白尾的化学修饰改变。这种修饰可以在靶序列附近起始，并且随后可以扩散到靶基因中远离靶序列的一个或多个核苷酸。例如，效应结构域可以起始靶序列侧翼的10、20、30、40、50、60、70、80、90、100、200、300、400、500个核苷酸内的一个或多个核苷酸或与其结合的一个或多个组蛋白残基的化学修饰状态的改变，并且化学修饰状态的改变可以扩散到靶基因中靶序列上游或下游距靶序列至少100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2500、3000或更多个核苷酸的一个或多个核苷酸。在某些实施方案中，化学修饰可以在靶基因中少于2、3、5、10、20、30、40、50或100个核苷酸处起始，并扩散至靶基因中至少100、200、300、400、500、600、700、800、900、1000、2000或更多个核苷酸。在一些实施方案中，化学修饰延伸至整个靶基因中的核苷酸。额外的蛋白质或转录因子，例如转录阻遏物、甲基转移酶或转录调节支架蛋白，可以参与化学修饰的扩散。或者，可以单独涉及表观遗传编辑器。

在一些实施方案中，与对照细胞、对照组织或对照受试者(例如，在没有表观遗传编辑器的情况下)相比，本文描述的表观遗传编辑器使靶基因的表达降低至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约99％或更多，如通过细胞、组织或受试者中靶基因的转录测量的。在一些实施方案中，与对照细胞、对照组织或对照受试者相比，本文所述的表观遗传编辑器将靶基因拷贝的表达降低至少约20％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约99％或更多，如通过在细胞、组织或受试者中靶基因拷贝的转录所测量的。在某些实施方案中，靶基因的拷贝具有由表观遗传编辑器识别的特定序列或等位基因。在特定的实施方案中，表观遗传修饰的拷贝编码功能性蛋白质，因此本文公开的表观遗传编辑器可以降低或消除蛋白质的表达和/或功能。例如，与对照细胞、对照组织或对照受试者相比，本文所述的表观遗传编辑器可以使细胞、组织或受试者中由靶基因编码的蛋白质的表达和/或功能降低至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少20倍、至少25倍、至少30倍、至少35倍、至少40倍、至少45倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍或至少100倍。

靶基因表达的调节可以通过确定受靶基因表达间接或直接影响的任何参数来测定。此类参数包括例如RNA或蛋白质水平的变化；蛋白质活性的变化；产品水平的变化；下游基因表达的变化；报告基因(如，例如荧光素酶、CAT、β-半乳糖苷酶或GFP)的转录或活性的变化；信号转导的变化；磷酸化和去磷酸化的变化；受体-配体相互作用的变化；第二信使(例如cGMP、cAMP、IP3和Ca²⁺)的浓度变化；细胞生长的变化；新生血管形成的变化；和/或基因表达的任何功能效应的变化。测量可以在体外、体内和/或离体进行，并且可以通过常规方法进行，例如测量RNA或蛋白质水平、测量RNA稳定性和/或鉴定下游或报告基因表达。读出可以通过例如化学发光、荧光、比色反应、抗体结合、诱导型标志物、配体结合测定、细胞内第二信使如cGMP和三磷酸肌醇(IP3)的变化、细胞内钙水平的变化；细胞因子释放等方式。

用于确定基因(例如表观遗传编辑器的靶标)的表达水平的方法可以包括例如通过逆转录PCR、定量RT-PCR、液滴数字PCR(ddPCR)、Northern印迹、RNA测序、DNA测序(例如，从RNA获得的互补脱氧核糖核酸(cDNA)的测序)；下一代(Next-Gen)测序、纳米孔测序、焦磷酸测序或纳米串测序来确定基因的转录物水平。从基因表达的蛋白质水平可以例如通过蛋白质印迹、酶联免疫吸附测定、质谱、免疫组织化学或流式细胞术分析来测定。可以将基因表达产物水平标准化为内标，例如总信使核糖核酸(mRNA)或特定基因(例如管家基因)的表达水平。

在一些实施方案中，可以使用报告系统检查表观遗传编辑器在调节靶基因表达中的作用。例如，表观遗传编辑器可以被设计成靶向编码报告蛋白(如荧光蛋白)的报告基因。可以通过例如流式细胞术、荧光激活细胞分选(FACS)或荧光显微镜监测报告基因在此类模型系统中的表达。在一些实施方案中，可以用含有报告基因的载体转染细胞群。可以构建载体，使得当载体转染细胞时报告基因表达。合适的报告基因包括编码荧光蛋白的基因，例如绿色、黄色、樱桃色、青色或橙色荧光蛋白。携带报告系统的细胞群可以用编码靶向报告基因的表观遗传编辑器的DNA、mRNA或载体转染。

VII.药物组合物

在一个方面，本公开提供了药物组合物，其包含作为活性成分(或作为唯一活性成分)的一种或多种本文所述的表观遗传编辑器或其组分(例如，融合蛋白和/或指导多核苷酸)，或编码所述表观遗传编辑器或其组分的核酸分子。例如，药物组合物可以包含编码本文所述的表观遗传编辑器的融合蛋白(和指导多核苷酸，如果适用)的核酸分子。在一些实施方案中，单独的药物组合物包含融合蛋白和指导多核苷酸。药物组合物还可以包含已经经历由本文提供的表观遗传编辑器介导或诱导的表观遗传修饰的细胞。

通常，本公开的本文所述的表观遗传编辑器或其组分，或编码所述表观遗传编辑器或其组分的核酸分子适合作为与一种或多种药学上可接受的赋形剂(例如，如下所述)联合的制剂施用。

术语“赋形剂”在本文中用于描述除本公开的化合物以外的任何成分。赋形剂的选择将在很大程度上取决于如特定施用模式、赋形剂对溶解度和稳定性的影响以及剂型的性质等因素。如本文所用，“药学上可接受的赋形剂”包括生理上相容的任何和所有溶剂、分散介质、包衣、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂等。药学上可接受的赋形剂的一些示例是水、盐水、磷酸盐缓冲盐水、葡萄糖、甘油、乙醇等，以及它们的组合。在许多情况下，优选在组合物中包括等渗剂，例如糖、多元醇如甘露醇、山梨醇或氯化钠。药学上可接受的物质的另外示例是润湿剂或少量的辅助物质，例如润湿剂或乳化剂、防腐剂或缓冲剂，其增强抗体的保质期或有效性。

适于肠胃外施用的药物组合物的制剂通常包含与药学上可接受的载体(例如无菌水或无菌等渗盐水)组合的活性成分。此类制剂可以以适于推注施用或连续施用的形式制备、包装或销售。

VIII.递送方法

在一些实施方案中，将表观遗传编辑器或其组分以编码表观遗传编辑器或其组分的核酸分子的形式引入靶细胞；因此，本文的药物组合物包含核酸分子。此类核酸分子可以是例如DNA、RNA或mRNA，和/或经修饰的核酸序列(例如，具有化学修饰、5'帽或一个或多个3'修饰)。在一些实施方案中，核酸分子可以例如通过转染或电穿孔作为裸DNA或RNA递送，或者可以与促进靶细胞摄取的分子(例如N-乙酰半乳糖胺)缀合。在一些实施方案中，核酸分子可以在核酸表达载体中，其可以包括表达控制序列，例如启动子、增强子、转录信号序列、转录终止序列、内含子、聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)等。此类表达控制序列是本领域熟知的。载体还可以包含编码信号肽(例如，用于核定位、核仁定位或线粒体定位)的序列，其与编码蛋白质的序列相关联(例如，插入或融合)。

载体的示例包括但不限于质粒载体；基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯疱疹病毒、人免疫缺陷病毒、逆转录病毒(例如鼠白血病病毒或脾坏死病毒，衍生自逆转录病毒的载体如劳斯肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人免疫缺陷病毒、骨髓增生性肉瘤病毒和乳腺肿瘤病毒)的病毒载体；和其它重组载体。在某些实施方案中，载体是质粒或病毒载体。病毒颗粒或病毒样颗粒(VLP)也可用于递送编码如本文所述的表观遗传编辑器或其组分的核酸分子。例如，可以组装“空”病毒颗粒以包含任何合适的货物。病毒载体和病毒颗粒也可以被工程化以掺入靶向配体来改变靶组织特异性。

在某些实施方案中，如本文所述的表观遗传编辑器或其组分由存在于一种或多种病毒载体中的核酸序列或任何病毒载体的合适衣壳蛋白编码。病毒载体的示例包括腺相关病毒载体(例如，衍生自AAV3、AAV3b、AAV4、AAV5、AAV6、AAV7、AAV8、AAV9、AAVrh8、AAV10和/或其变体)；逆转录病毒载体(例如，莫洛尼鼠白血病病毒，MML-V)、腺病毒载体(例如，AD100)、慢病毒载体(例如，基于HIV和FIV的载体)和疱疹病毒载体(例如，HSV-2)。

在一些实施方案中，递送涉及腺相关病毒(AAV)载体。当表观遗传编辑器融合蛋白的DNA结合结构域是锌指阵列时，AAV载体递送可能是特别有用的。不希望受任何理论的束缚，与较大的DNA结合结构域如Cas蛋白结构域相比，较小尺寸的锌指阵列可以允许将此类融合蛋白方便地包装在病毒载体如AAV载体中。

任何AAV血清型，例如人AAV血清型，可用于如本文所述的AAV载体，包括但不限于AAV血清型1(AAV1)、AAV血清型2(AAV2)、AAV血清型3(AAV3)、AAV血清型4(AAV4)、AAV血清型5(AAV5)、AAV血清型6(AAV6)、AAV血清型7(AAV7)、AAV血清型8(AAV8)、AAV血清型9(AAV9)、AAV血清型10(AAV10)和AAV血清型11(AAV11)及其变体。在一些实施方案中，AAV变体与野生型AAV具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％或99％氨基酸序列同一性。在某些实施方案中，可以工程化AAV变体，使得其衣壳蛋白在人中具有降低的免疫原性或增强的转导能力。在一些情况下，至少两种不同AAV血清型病毒的一个或多个区域被改组和重组以产生嵌合变体。例如，嵌合AAV可以包含与衣壳的血清型相比具有异源血清型的反向末端重复序列(ITR)。所得嵌合AAV与其亲本血清型相比可具有不同的抗原反应性或识别。在一些实施方案中，AAV的嵌合变体包括来自2、3、4、5或更多种不同AAV血清型的氨基酸序列。

非病毒系统也被考虑用于如本文所述的递送。非病毒系统包括但不限于核酸转染方法，包括电穿孔、声穿孔、磷酸钙转染、显微注射、DNA生物弹道、脂质介导的转染、通过热休克的转染、压缩DNA介导的转染、脂质转染、阳离子试剂介导的转染和用脂质体、免疫脂质体、外泌体或阳离子表面两亲物(CFA)转染。在某些实施方案中，编码如本文所述的表观遗传编辑器融合蛋白的一种或多种mRNA可以与如本文所述的一种或多种指导多核苷酸(例如，gRNA)共同电穿孔。非病毒核酸载体的一个重要类别是纳米颗粒，其可以是有机的(例如脂质)或无机的(例如金)。例如，在本公开的某些实施方案中，有机(例如脂质和/或聚合物)纳米颗粒可适合用作递送媒介物。

在一些实施方案中，使用脂质纳米颗粒(LNP)完成递送。LNP组合物的尺寸通常在微米或更小的数量级，并且可以包括脂质双层。在一些实施方案中，LNP是指直径小于1000nm、500nm、250nm、200nm、150nm、100nm、75nm、50nm或25nm的任何颗粒。在一些实施方案中，纳米颗粒的尺寸范围可以为1-1000nm、1-500nm、1-250nm、25-200nm、25-100nm、35-75nm或25-60nm。纳米颗粒组合物包括脂质纳米颗粒(LNP)、脂质体(例如脂质囊泡)和脂质复合物。

如本文所述的LNP可以由阳离子、阴离子或中性脂质制成。在一些实施方案中，LNP可以包含中性脂质，例如融合性磷脂1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)或膜组分胆固醇，作为辅助脂质以增强转染活性和纳米颗粒稳定性。在一些实施方案中，LNP可以包含疏水性脂质、亲水性脂质或疏水性和亲水性脂质两者。本领域已知的任何脂质或脂质组合可用于产生LNP。脂质可以以任何摩尔比组合以产生LNP。在一些实施方案中，LNP是靶向肝脏(例如，优先地或特异性地靶向肝脏)的LNP。

可以靶向任何类型的细胞以递送如本文所述的表观遗传编辑器或其组分。例如，细胞可以是真核的或原核的。在一些实施方案中，细胞是哺乳动物(例如人)细胞。人细胞可以包括例如肝细胞、胆管上皮细胞(胆管细胞)、星状细胞、库普弗细胞和肝窦内皮细胞。

在一些实施方案中，将本文所述的表观遗传编辑器或其组分递送至宿主细胞用于瞬时表达，例如经由瞬时表达载体。表观遗传编辑器或其组分的瞬时表达可以导致靶基因的延长的或永久的表观遗传修饰。例如，在将表观遗传编辑器引入宿主细胞后，表观遗传修饰可以稳定至少1、2、3、4、5、6、7、8、9、10、11、或12周或更长时间；或3、4、5、6、7、8、9、10、11或12个月或更长时间。表观遗传修饰可以在宿主细胞的一次或多次有丝分裂和/或减数分裂事件之后维持。在特定的实施方案中，表观遗传修饰在由宿主细胞产生或衍生的后代中跨代维持。

IX.表观遗传编辑器的治疗用途

本公开还提供了用于治疗或预防受试者的病症的方法，其包括向受试者施用如本文所述的表观遗传编辑器或药物组合物。表观遗传编辑器可以实现与受试者中的疾病、病况或病症相关的靶基因中的靶多核苷酸序列的表观遗传修饰，从而调节靶基因的表达以治疗或预防疾病、病况或病症。在一些实施方案中，表观遗传编辑器将靶基因的表达降低至足以实现期望效果的程度，例如治疗相关效果，如预防或治疗疾病、病况或病症。

在一些实施方案中，向受试者施用用于调节(例如，抑制)PCSK9表达的系统，其中所述系统包含(1)如本文所述的融合蛋白和(在相关的情况下)指导多核苷酸，或(2)编码所述融合蛋白和(在相关的情况下)指导多核苷酸的核酸分子。

“治疗(treat)”、“治疗(treating)”和“治疗(treatment)”是指减轻或消除生物病症和/或其伴随症状中的至少一种的方法。如本文所用，“减轻”疾病、病症或病况意指降低疾病、病症或病况的症状的严重性和/或发生频率。此外，本文提及的“治疗(treatment)”包括提及治愈性、姑息性和预防性治疗。在一些实施方案中，与等同的未治疗对照相比，缓解症状可涉及通过任何标准技术测量的症状减轻至少3％、5％、10％、20％、40％、50％、60％、80％、90％、95％、98％、99％、99.5％、99.9％或100％。

在一些实施方案中，受试者可以是哺乳动物，例如人。在一些实施方案中，受试者选自非人灵长类动物，例如黑猩猩、食蟹猴或猕猴，以及其他猿和猴物种。

在一些实施方案中，人患者患有选自高胆固醇血症(例如，家族性高胆固醇血症，如杂合性家族性高胆固醇血症(HeFH)或纯合性家族性高胆固醇血症(HoFH)，或已确定的动脉粥样硬化性心血管疾病(ASCVD))或肾功能不全(RI)的病况。

在一些实施方案中，待用本公开的表观遗传编辑器治疗的患者已经接受了针对待治疗病况(例如，高胆固醇血症(如HeFH、HoFH、HF或已确定的ASCVD)或RI)的先前治疗。在其他实施方案中，患者未接受此类先前治疗。在一些实施方案中，患者对该病况的先前治疗(例如，先前的高胆固醇血症治疗)失败。

本公开的表观遗传编辑器可以以治疗有效量施用于患有本文所述病况的患者。如本文所用，“治疗有效量”是指所施用的治疗剂的量，其将在一定程度上缓解所治疗的病症的一种或多种症状，和/或导致医疗保健专业人员期望的临床终点。治疗的有效量可以通过其稳定患者的疾病进展和/或改善症状的能力并且优选逆转疾病进展的能力来测量。本公开的表观遗传编辑器降低或沉默PCSK9表达的能力可以通过体外测定(例如，如本文所述)以及在预测对人有功效的合适动物模型中进行评估。将选择合适的剂量方案，以便在每种特定情况下提供最佳的治疗反应，例如，作为单次推注或作为连续输注施用，并且根据每个病例的紧急情况可能调整剂量。

本公开的表观遗传编辑器可以在没有额外治疗性治疗的情况下施用，即作为独立疗法(单一疗法)。或者，用本公开的表观遗传编辑器治疗可以包括至少一种额外的治疗性治疗(组合疗法)。在一些实施方案中，额外的治疗剂是本领域已知的用于治疗高胆固醇血症或RI的任何治疗剂。治疗剂包括但不限于他汀类、贝特类、HMG-CoA还原酶抑制剂、烟酸、胆汁酸调节剂或螯合剂、胆固醇吸收抑制剂或调节剂、CETP抑制剂、MTTP抑制剂和PPAR激动剂。

本公开的表观遗传编辑器或其组分(或编码表观遗传编辑器或其组分的核酸分子)可以通过本领域接受的任何方法施用，例如皮下、皮内、肿瘤内、结节内、肌肉内、静脉内、淋巴内或腹膜内。在特定的实施方案中，本公开的药物组合物静脉内施用至受试者。

X.定义

如本文所用，术语“核酸”是指含有单链或双链形式的核苷酸(例如脱氧核糖核苷酸或核糖核苷酸)的任何寡核苷酸或多核苷酸，并且包括DNA和RNA。“核苷酸”包含糖脱氧核糖(DNA)或核糖(RNA)、碱基和磷酸基团，并通过磷酸基团连接在一起。“碱基”包括嘌呤和嘧啶，其包括天然化合物如腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶、尿嘧啶、肌苷和天然类似物；以及嘌呤和嘧啶的合成衍生物，其包括但不限于放置新的反应性基团如胺、醇、硫醇、羧酸盐、卤代烷等的修饰形式。核酸可以含有已知的核苷酸类似物和/或修饰的主链残基或键，其可以是合成的、天然存在的和非天然存在的。此类核苷酸类似物、修饰残基和修饰键是本领域熟知的，并且在核酸酶存在下可以提供具有增强的细胞摄取、降低的免疫原性和/或增加的稳定性的核酸分子。

如本文所用，“分离的”或“纯化的”核酸分子是脱离其天然环境而存在的核酸分子。例如，“分离的”或“纯化的”核酸分子(1)已与其来源的基因组DNA或细胞RNA的核酸分离；和/或(2)在自然界中不存在。在一些实施方案中，“分离的”或“纯化的”核酸分子是重组核酸分子。

应当理解，除了本文提及的特定蛋白质和核酸分子之外，本公开还考虑使用其变体、衍生物、同源物和片段。任何给定序列的变体可以具有特定残基序列(无论是氨基酸残基还是核酸残基)，其修饰方式使得所讨论的多肽或多核苷酸基本上保留其至少一种内源功能。变体序列可以通过存在于天然存在的序列中的至少一个残基(在一些实施方案中，不超过1、2、3、4、5、6、7、8、9、10、15或20个残基)的添加、缺失、取代、修饰、置换和/或变异而获得。对于本文所述的特定蛋白质(例如，本文所述的KRAB、dCas9、DNMT3A和DNMT3L蛋白质)，本公开还考虑了保留其内源功能中的至少一种(例如，与所述的特定蛋白质相比，其功能的至少50％、60％、70％、80％、90％、85％、96％、97％、98％或99％)的任何蛋白质的天然存在形式或变体或同源物。

本文提供了本公开所包括的一些示例性融合蛋白。本领域技术人员将理解，这些示例性蛋白质是非限制性示例，并且额外的蛋白质在本公开的范围内。例如，在提供包含特定结构域(例如哺乳动物DNMT3A、DNMT3L和/或KRAB结构域(例如人或小鼠DNMT3A、DNMT3L和/或KRAB结构域)的融合示例性蛋白的情况下，本领域技术人员能够确定，在一些实施方案中，本公开还包括具有相同构型但其中一个或多个哺乳动物结构域取代了来自另一哺乳动物的同源结构域(例如一个或多个小鼠结构域取代了一个或多个人结构域)的融合蛋白。例如，在提供包含小鼠DNMT3L结构域的示例性融合蛋白的情况下，也包括具有相同结构但小鼠DNMT3L取代人DNMT3L结构域的融合蛋白。

如本文所用，本文所考虑的任何多肽或核酸序列的同源物包括与野生型氨基酸和核酸序列具有一定同源性的序列。同源序列可以包括与受试者序列至少50％、55％、65％、75％、85％、90％、91％、92％<93％、94％、95％、96％、97％、98％或99％相同的序列，例如氨基酸序列。在氨基酸或核苷酸序列的上下文中，术语“同一性百分比”是指当比对最大对应性时两个序列中相同的残基的百分比。在一些实施方案中，出于比较目的比对的参考序列的长度为参考序列的至少30％(例如，至少40％、50％、60％、70％、80％或90％或100％)。序列同一性可以使用序列分析软件(例如，威斯康星大学生物技术中心遗传学计算机组的序列分析软件包，1710University Avenue，Madison，Wis.53705，BLAST，BESTFIT，GAP或PILEUP/PRETTYBOX程序)来测量。此类软件通过将同源度分配给各种取代、缺失和/或其它修饰来匹配相同或相似的序列。在确定同一性程度的示例性方法中，可以使用BLAST程序，其中e-3和e-100之间的概率分数指示密切相关的序列。

两个核苷酸或多肽序列的同一性百分比通过例如使用默认参数(可在美国国家医学图书馆的国家生物技术信息中心网站获得)来确定。在一些实施方案中，出于比较目的比对的参考序列的长度为参考序列的至少30％(例如，至少40％、50％、60％、70％、80％或90％)。

应当理解，多肽序列中特定位置或残基的编号取决于所使用的特定蛋白质和编号方案。编号可能不同，例如在成熟蛋白的前体和成熟蛋白本身中，并且物种与物种之间序列的差异可能影响编号。本领域技术人员将能够通过本领域熟知的方法，例如通过序列比对和同源残基的测定，鉴定任何同源蛋白和相应编码核酸中的相应残基。

术语“调节”或“改变”是指功能的量、程度或范围的变化。例如，如本文所述的表观遗传编辑器可以通过与启动子内的基序结合来调节启动子序列的活性，从而诱导、增强或抑制与启动子序列可操作地连接的基因的转录。作为其他示例，如本文所述的表观遗传编辑器可以阻断RNA聚合酶转录基因，或者可以抑制mRNA转录物的翻译。当用于提及如本文所述的表观遗传编辑器或其组分时，术语“抑制(inhibit)”、“抑制(repress)”、“抑制(suppress)”、“沉默”等是指相对于不存在表观遗传编辑器或其组分时核酸序列或蛋白质的活性而言，降低或阻止核酸序列(例如，靶基因)或蛋白质的活性(例如，转录)。该术语可包括部分或完全阻断活性，或防止或延迟活性。被抑制的活性可以比对照的活性低例如10％、20％、30％、40％、50％、60％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％，或者可以比对照的活性低例如至少1.5倍、2倍、3倍、4倍、5倍或10倍。

术语“约”或“大约”意指在由本领域普通技术人员确定的特定值的可接受误差范围内，这将部分地取决于如何测量或确定该值，例如测量系统的限制。例如，根据惯例，“约”可以表示在给定值的一个或多于一个标准偏差内。在本申请和权利要求中描述特定值的情况下，除非另有说明，否则术语“约”应被假定为意指特定值的可接受误差范围。

本文提供的范围应理解为该范围内的所有值的简写。例如，1至50的范围应理解为包括选自由以下组成的组的任何数字、数字的组合或子范围：1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50，以及前述整数之间的所有中间十进制值，例如1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8和1.9。关于子范围，特别考虑从范围的任一端点延伸的“嵌套子范围”。例如，示例性范围1至50的嵌套子范围可以在一个方向上包括1至10、1至20、1至30和1至40，或者在另一个方向上包括50至40、50至30、50至20和50至10。

除非本文另有定义，否则结合本公开使用的科学和技术术语应具有本领域普通技术人员通常理解的含义。下面描述了示例性方法和材料，但是与本文所述的那些类似或等同的方法和材料也可以用于本公开的实践或测试中。在冲突的情况下，以包括定义的本说明书为准。此外，除非上下文另有要求，否则单数术语应包括复数，复数术语应包括单数。贯穿本说明书和实施例，词语“具有(have)”和“包含(comprise)”或诸如“具有(has)”、“具有(having)”、“包含(comprises)”或“包含(comprising)”的变体将被理解为暗示包括所述整数或整数组，但不排除任何其他整数或整数组。除非另有说明，否则本文的元素列表的叙述包括单独或以任何组合的任何元素。本文对实施方案的叙述包括该实施方案作为单个实施方案或与本文任何其他实施方案的组合。本文提及的所有出版物、专利、专利申请和其他参考文献通过引用整体并入。通过引用并入的参考文献与说明书中包含的公开内容出现相矛盾的程度时，说明书旨在取代和/或优先于任何此类矛盾材料。尽管本文引用了许多文献，但该引用并不构成承认这些文献中的任何一个成为本领域公知常识的一部分。

根据本公开，从属权利要求中的反向引用旨在作为一种简写，用于直接且无歧义地公开由反向引用指示的每个权利要求组合。此外，本文的标题是为了便于组织而创建的，并且不旨在以任何方式限制所要求保护的组合物和方法的范围。

本文提供的一些蛋白质序列，例如一些融合蛋白序列，包括肽标签，例如His6标签或DYKDDDDK(SEQ ID NO:1528)标签，其可用于检测和/或纯化带标签的蛋白质，但不影响蛋白质功能。这些肽标签和另外合适的肽标签是本领域技术人员熟知的。对于本领域技术人员将显而易见的是，所公开的标签可以替代其他合适的肽标签，并且具有相同或高度相似序列但不包括此类肽标签的融合蛋白(例如，肽标签已从中切割或在没有肽标签的情况下产生)也适合于实施本公开的实施方案。

为了更好地理解本公开，阐述了以下实施例。这些实施例仅用于说明的目的，并且不应被解释为以任何方式限制本公开的范围。

实施例

实施例1：融合蛋白的设计与合成

设计并构建了包含dCas9、DNMT3A、DNMT3L和KOX1KRAB(“CRISPR-off”)的融合蛋白。从N末端到C末端，蛋白质具有结构域DNMT3A-接头-DNMT3L-XTEN80-NLS-dspCas9-NLS-XTEN16-KOX1KRAB(SEQ ID NO:658和1495)。CRISPR-off质粒构建体已在(etal.,Cell(2021)184(9):2503-19)中描述，并且从Twist Biosciences订购。

还构建了包含DNMT3A、3L和KOX1 KRAB的ZF融合蛋白(“ZF-off”)。构建体具有一般结构DNMT3A-接头-DNMT3L-XTEN80-NLS-ZFP结构域-NLS-XTEN16-KOX1Krab(SEQ ID NO:659和1496)。

实施例2：用于gRNA表观遗传沉默的靶PCSK9序列的选择

使用Benchling gRNA平台(Benchling(2021)，从benchling.com检索)针对人(GRCh38)、小鼠(mm10)和猕猴(5.0)PCSK9计算设计靶向PCSK9 TSS的+/-1kb的gRNA。首先丢弃含有聚TTTT序列的gRNA。我们使用CasOFFinder进行gRNA脱靶分析(Bae et al.,Bioinformatics(2014)30(10):1473-5)。如果gRNA与每个独立物种的相应基因组构建中的多个位置匹配，则丢弃该gRNA。

对人PCSK9 gRNA进行交叉反应性序列分析，以注释与猕猴或小鼠gRNA序列的序列错配。具体地，进行gRNA序列比对以鉴定每个核苷酸处的DNA相似性程度，包括包含至多零个、一个或两个核苷酸错配的指导物的注释。选择最后一组226个gRNA序列用于HeLa细胞中的PCSK9初级筛选。

实施例3：ZF靶位点的选择和用于表观遗传沉默的ZF蛋白的设计

每个识别6bp DNA位点的两指ZFP(2F单元)文库用于设计靶向18bp DNA结合位点的更大的六指ZFP阵列。2F单元的来源是一组三指锌指蛋白，其已经使用细菌-2-杂交(B2H)选择系统选择以结合特定靶位点(Hurt etal.,PNAS(2003)100:12271-6；Maeder et al.,Mol Cell(2008)31(2):294-301)。通过产生文库中表示的6bp结合位点的所有可能的三联体组合并允许6bp靶位点之间的0或1bp来创建可靶向DNA位点的列表。为了鉴定PCSK9内的锌指靶位点，针对该列表对距TSS(人(GRCh38))+/-1kb的序列进行查询。对于每个鉴定的ZF靶位点，可以设计多种ZF蛋白。用于产生完整蛋白的六个识别螺旋的设计是通过选择双指单元并考虑许多因素进行的，例如锌指蛋白的已知结合偏好，在B2H选择系统中选择-1、2、3和6位氨基酸以结合期望的靶碱基的频率，避免在B2H中选择以结合多个不同碱基的-1、2、3和6位氨基酸，以及在可能的情况下通过匹配侧翼碱基来维持背景依赖性。完整的ZF序列衍生自天然存在的Zif268蛋白，并且选择的识别螺旋维持在其中它们在B2H中被选择的序列背景中(来自Zif268的指1-2或指2-3)。双指单元通过接头TGSQKP(SEQ ID NO:651)(其中6bp结合位点是连续的)并且通过接头TGGGGSQKP(SEQ ID NO:652)(其中1bp分隔6bp结合位点)连接。选择靶向49个不同结合位点的209个ZFP的最终集合用于HeLa细胞中的PCSK9初级筛选。

图1显示了映射到PCSK9靶区域的gRNA和锌指蛋白的重叠。

实施例4：HeLa细胞中的指导RNA筛选

在HeLa细胞中进行靶向PCSK9的gRNA的初级筛选。gRNA序列作为DNA片段从TwistBiosciences订购，其中u6启动子序列在gRNA编码序列之前。

用DNA形式的gRNA和CRISPR-off转染HeLa细胞。在含有补充有10％胎牛血清(Thermo Fisher目录号A4766)v/v、1x GlutaMAX^TM(Thermo Fisher目录号35050061)和1x青霉素-链霉素(Thermo Fisher目录号15140122)的DMEM(Thermo Fisher目录号11-965-092)的标准培养基中以12,000个HeLa细胞每孔(ATCC目录号CCL-2)接种6个96孔板(Sigma-Aldrich目录号M2936)。铺板后，使细胞在37℃、5％CO₂的培养箱中生长24小时。将25ng各gRNA片段和50ng CRISPR-OFF质粒(SEQ ID NO:658)重悬于DPBS缓冲液(Thermo Fisher目录号14190144)中至7.5ng/μL的浓度。另外，还将10ng的EF1a：嘌呤霉素抗性质粒添加到转染混合物中以实现85ng DNA的总有效载荷。按照制造商的说明，通过将重悬的DNA组分添加到转染试剂(Mirus目录号MIR2300)中来产生转染混合物。将10μL每种转染混合物一式两份加入总共六个筛选板中。使用的阳性对照是CRISPRi(dCas9-KRAB)，其具有两个gRNA靶向TSS附近的位点。使用的两种CRISPRi阳性对照gRNA是gRNA004和gRNA005，如gRNA序列表中注释的。这些对照条件在初级筛选数据表中分别称为“CRISPRi-1”和“CRISPRi-2”。阴性对照是不含gRNA的CRISPR-off、具有非PCSK9基因座(CD151)靶向gRNA的CRISPR-off和空载体(pUC19；NEB目录号N3041S)。

转染后24小时，进行嘌呤霉素抗性选择。将细胞培养基完全吸出，并将所有孔用DPBS缓冲液(Thermo Fisher目录号14190144)洗涤3次，并将200μL 1μg/μL嘌呤霉素添加到所有筛板孔中。

转染后48小时，传代细胞。将细胞培养基完全吸出，并将所有孔用DPBS缓冲液(Thermo Fisher目录号14190144)洗涤3次。通过添加25μL胰蛋白酶-EDTA(0.25％)(ThermoFisher目录号25200056)在37℃培养箱中孵育5分钟来酶促提取细胞。将胰蛋白酶化的细胞以1：8重悬于新鲜标准培养基中，并在更换培养基72小时后以1：4的比例重新铺板。

为了测量分泌的PCSK9蛋白的水平，在培养基更换后24小时收获培养基，并根据制造商的建议使用Promega细胞滴度Glo^TM方案(目录号G7570)测定细胞板进行相对细胞计数。使用BioLegend的LEGEND MAX^TM人PCSK9 ELISA试剂盒(目录号443107)评估PCSK9蛋白水平。将收获的培养基铺板，并完全根据制造商的建议进行所有后续步骤。在PerkinNivo^TMF仪器上进行450nm处的最终平板读数。使用GraphPad Prism软件将函数拟合到标准曲线并插入未知数。PCSK9 ELISA结果通过细胞滴度测定(Promega目录号G7571)结果归一化，以校正任何孔间细胞数量变异性。

测试了超过200个gRNA，其中40个被鉴定为靠前的序列(图2；靠前的序列指定为较黑的圆圈)。测试的gRNA的序列和功效示于表7(SEQ：SEQ ID NO)。相对PCSK9分泌(“对照PCSK9％”)表示经处理样品的平均PCSK9蛋白水平，其表示为相对于所有非靶向gRNA(CD151)阴性对照条件的平均值的百分比。在用多种gRNA候选治疗方法处理的细胞中观察到PCSK9的稳健沉默(阴性对照水平的30-40％)。选择具有最佳PCSK9蛋白敲除的前40个gRNA作为sgRNA进行进一步随访研究。

表7.测试的gRNA的靶向序列

发现表现最佳的gRNA与PCSK9基因转录起始位点紧密对齐(图3)。

在该初级筛选之后，所述前40个gRNA以RNA形式进行次级筛选。化学合成前40个指导物，并与体外转录的编码CRISPR-off、CRISPRi或WT Cas9构建体的mRNA共转染。在转染后7天和28天测量分泌的PCSK9水平。

为了产生体外转录的CRISPR-off、CRISPRi和WT Cas9效应子mRNA，使用的MfeI限制性酶(目录号R3589S)线性化编码这些蛋白质的质粒构建体。根据制造商的说明书，使用1μg线性化模板通过CellScript的T7 mScript^TM标准mRNA生产系统(目录号C-MSC100625)建立体外转录反应。所得RNA在5'末端具有帽1结构，并且是3'聚腺苷酸化的。使用Qiagen的迷你试剂盒(目录号74104)纯化转录的RNA。

从Integrated DNA Technologies获得使用标准脱盐纯化的末端修饰的sgRNA。每个指导物的5'末端的三个核苷酸和3'末端的三个核苷酸是2'-O-甲基修饰的。3’端的三个核苷间键和5’端的三个核苷间键是硫代磷酸酯核苷间键(表8；SEQ ID NO)。在表中，mX(即mA、mC、mG或mU)表示2′-O-甲基修饰的核糖核苷，rX(即rA、rC、rG或rU)表示天然核糖核苷，并且*表示硫代磷酸酯键。所有非硫代磷酸酯键的核苷间键都是磷酸酯键。

表8.次级HeLa细胞筛选的前40个gRNA的靶向序列

使用Mirus的转染试剂(目录号MIR6003)以96孔板形式用25ng效应子和12.5ng sgRNA反向转染HeLa细胞。每周收获条件培养基长达四周，并用于使用BioLegend的LEGEND MAX^TM人PCSK9 ELISA试剂盒(目录号443107)测量分泌的PCSK9水平。使用Promega的CellTiter-试剂盒(目录号G7571)将ELISA数据标准化为细胞数量。虽然PCSK9沉默在CRISPRi(dCas9-KRAB)中是短暂的，并且在第28天恢复到基线，但与CRISPR-off(DNMT3A-3L-dCas9-KRAB)构建体共转染的几种sgRNA显示出稳健和持久的沉默(图4A)。用CRISPR-off测试的40个指导物中的16个显示出大于WT Cas9的沉默效率(表9)。

表9.用修饰的gRNA和CRISPR-off处理的HeLa细胞中的相对PCSK9表达

在两周时间点，使用Zymo Research的Quick-RNA 96试剂盒(目录号R1053)提取RNA。使用Quantabio的qScript XLT一步RT-qPCR ToughMix(目录号95134-500)和TaqMan测定进行qPCR(PCSK9：Hs00545399_m1，PPIA：Hs99999904_m1)。PCSK9水平用PPIA标准化。使用δ-δCt方法进行相对定量。

发现PCSK9分泌的抑制与第14天的mRNA沉默相关(图4B)。

在HeLa细胞中测试modRNA004和modRNA111在60天内抑制PCSK9分泌(图5)。将WTCas9与modRNA180共转染作为阳性对照。用25ng效应物和12.5ng gRNA处理细胞。modRNA004和modRNA111显示能介导PCSK9的持久沉默，与在HeLa细胞中通过WT Cas9经由基因编辑实现的沉默相当。

此外，结果表明在用辛伐他汀处理的HeLa细胞中维持表观遗传沉默。已知他汀类药物治疗可经由转录机制增加PCSK9分泌。在表观遗传沉默的HeLa细胞中，他汀类药物治疗显示不增加PCSK9分泌(图6)。

实施例5：Huh7肝癌细胞系中的指导RNA测定

Huh7肝癌细胞系适于高通量筛选和转染。在Huh7肝癌细胞系中测试来自HeLa筛选的与食蟹猴PCSK9基因具有完全同源性或单个错配的前13个指导物。用CRISPR-off构建体的表观遗传沉默显示在7天内是稳定的(图7)。

实施例6：原代人和食蟹猴肝细胞中的指导RNA测定

BioIVT的原代人和食蟹猴培养物用于测试gRNA在原代肝细胞中的功效。根据制造商的建议维持培养物。简而言之，将维持培养基解冻并在细胞到达后30分钟内补充。培养基更换后，使细胞在37℃、10％CO₂培养箱中适应两天。在接收后的第二天，按照制造商的说明，使用SPARK^TM(Precision Nanosystems)和hepato9mRNA LNP制剂试剂盒(目录号NWS0016)配制不同浓度的CRISPR-off+sgRNA、GFP-mRNA和WT CRISPR Cas9的LNP。随后，通过Quant-it^TMRiboGreen RNA测定试剂盒表征LNP的包封效率和总mRNA有效载荷递送。然后将LNP以指定量的总mRNA添加到培养基中以实现PCSK9沉默的临床相关水平。培养基每隔一天更换一次，持续长达四周，以评估沉默的持久性和/或遗传性。通过ELISA每七天评估PCSK9沉默以测量培养基中分泌的PCSK9水平。将使用人白蛋白ELISA(Thermo)将PCSK9浓度控制至总肝细胞。然后将数据表示为总PCSK9分泌占GFP-mRNA阴性对照的百分比。可以通过使用基于磁珠的抗体方法(MiltenyiBiotec)从小鼠成纤维细胞饲养层分离原代人和食蟹猴肝细胞来评估特异性。在从饲养层分离原代肝细胞后，处理细胞用于RNAseq评估和全基因组亚硫酸氢盐测序。

选择RNA形式的前13个gRNA在原代人肝细胞(PHH)中测试。基于以下来选择靠前的gRNA：(i)在HeLa细胞中的PCSK9沉默效率和持久性，(ii)它们是否与人PCSK9基因完美比对并且与非人灵长类PCSK9基因至多一个错配。还测试gRNA的组合以确定其功效和持久性。阴性对照为只有CRISPR-off、只有gRNA片段(modRNA003)和只有CRISPRi。阳性对照是与modRNA004共转染的CRISPRi(表10；SEQ：SEQ ID NO；NHP：非人灵长类)。预测所有测试的gRNA结合人和非人灵长类PCSK9两者。

表10.在原代人肝细胞中筛选gRNA

观察到稳健的PCSK9沉默。对于一些gRNA，在第7天观察到分泌的PCSK9减少>70％(取决于转染效率)。

实施例7：HeLa细胞中的ZF测定

从ZF文库设计针对49个PCSK9靶位点(选自GRCh38染色体1，在55038548至55040548之间)的共209个锌指蛋白(结构如SEQ ID NO:659所示)。靶位点在人基因组(GRCh38)中没有其他精确匹配。

用DNA形式的ZF-off构建体转染HeLa细胞。在含有补充有10％胎牛血清(ThermoFisher目录号A4766)v/v、1x GlutaMAX^TM(Thermo Fisher目录号35050061)和1x青霉素-链霉素(Thermo Fisher目录号15140122)的DMEM(Thermo Fisher目录号11-965-092)的标准培养基中以12,000个HeLa细胞每孔(ATCC目录号CCL-2)接种6个96孔板(Sigma-Aldrich目录号M2936)。铺板后，使细胞在37℃培养箱中于5％CO₂下生长24小时。将10ng ZF-OFF质粒重悬于DPBS缓冲液(Thermo Fisher目录号14190144)中至7.5ng/μL的浓度。此外，还将10ng的EF1a：嘌呤霉素抗性质粒和65ng的空载体(pUC19)添加到转染混合物中以实现85ng DNA的总有效载荷。通过在无血清OPTI-MEM培养基(Thermo目录号31985062)中添加重悬的DNA并按照制造商的说明添加转染试剂(MIR2300)来构建转染混合物。将10μL转染混合物一式两份添加到总共六个筛选板中。阳性对照是具有高性能gRNA(gRNA009)的CRISPR-off(SEQ ID NO:658)。阴性对照是ZF-off，具有非PCSK9基因座靶标(CLTA)和空载体(pUC19；NEB目录号N3041S)。

ZF筛选产生了活性与CRISPR相当的命中(图8)。具有高沉默效率的候选物被带到后续实验中。图9显示了以到TSS的距离划分的ZF筛选结果。总共筛选了209个ZF，其相对于阴性对照的PCSK9敲低活性如下表11所示。

表11.ZF-off构建体活性

与WTCas9以及CRISPR-off和gRNA003组合相比，几种ZF-off构建体在沉默PCSK9方面显示更有效。这些ZF-off构建体中ZFP结构域的靶位点和ZF序列(F1至F6)如表1所示。

实施例8：构建体在原代人肝细胞中的全特异性筛选

在原代人肝细胞中测试CRISPR-off和ZF-off构建体沉默PCSK9的特异性。评估特异性的读出是RNAseq、甲基化阵列和全基因组亚硫酸氢盐测序测定。表观遗传编辑后与阴性对照相比的全基因组表达和甲基化变化将被分析。

实施例9：CpG甲基化模式

研究了用CRISPR-off或ZF-off处理的人肝细胞(例如原代细胞或细胞系)中的CpG甲基化模式。对亚硫酸氢盐处理的DNA进行杂交捕获测定，以研究在PCSK9 TSS周围1kb区域由CRISPR-Off或ZF-Off诱导的CpG位点的甲基化模式。

实施例10：通过表观遗传编辑在具有野生型PCSK9的小鼠中稳定的PCSK9沉默

测试CRISPR-off和ZF-off构建体在体内介导内源性PCSK9的表观遗传沉默的能力。使用单次IV施用配制到LNP中的mRNA(以及对于CRISPR-off沉默，gRNA)来递送构建体。在野生型小鼠中对沉默进行了为期两到六个月的测试。读出是血清PCSK9水平和血清胆固醇水平。选择每个队列的子集用于肝脏苏木精和伊红(H&E)染色RNAseq和分析。对于几种构建体，观察到稳健、稳定和可遗传的PCSK9沉默。

实施例11：通过表观遗传编辑在表达转基因人PCSK9的小鼠中稳定的PCSK9沉默

使用表达转基因人PCSK9的三种不同小鼠品系：hPCSK9-Tg(mPCSK9+/-)杂合小鼠、hPCSK9-Tg(mPCSK9+/+)纯合小鼠和hPCSK9-Tg(mPCSK9-/-)小鼠。使用的hPCSK9-Tg(mPCSK9-/-)小鼠系是C57BL/6J-Pcsk9-/-Tg(RP11-55M23-AbsI)，其在自身启动子的控制下表达人PCSK9(图10)。参见例如Weider et al.,J Biol Chem(2016)291(32):16659-71。

测试CRISPR-off和ZF-off构建体。经由单次IV施用配制到LNP中的mRNA/gRNA递送构建体。读出是肝脏H&E染色、测量PCSK9 mRNA水平的RNAseq和AST/ASL测量。还测试了功效，包括通过血清PCSK9蛋白水平测量的PCSK9沉默在三至四个月内的持久性。对于一些构建体，观察到血清PCSK9水平的持久和显著降低。

持久性测试超过六至十二个月。读出是血清PCSK9水平和血清胆固醇水平。选择队列的子集用于肝脏H&E和RNAseq分析。

实施例12：具有变体NLS构型的融合蛋白

使用变体核定位序列(NLS)构型开发了几种改进的融合蛋白构建体，以具有显著更高的表观沉默活性。

构建具有NLS结构域变体构型的几种构建体(图11A和11B)，并在HeLa细胞的PCSK9基因座中测试(图12A-12B)。另外在Hepa1-6(图13)和HuH7(图14A-14C和图15)中的PCSK9基因座中测试构建体。示例性融合蛋白构建体氨基酸和DNA序列如下所示：

图14A中的序列可以在下面找到：

图15中的序列可以在下面找到：

细胞培养和转染

在含有10％FBS的DMEM中培养HeLa(ATCC-CRM-CCL-2)、Hepa1-6(PCSK9-IRES-TdTomato)、Huh7(Sekisui XenoTech，LLC)和HEK293TGriptite(CLTA-GFP)细胞。使用化学合成的指导RNA和体外转录的效应子构建体在HeLa和Huh7细胞中进行所有实验。使用Mirus的TransIT-X2转染试剂(目录号MIR6003)反向转染HeLa细胞。使用Invitrogen的MessengerMAX试剂(目录号LMRNA003)反向转染Huh7细胞。使用Biolegend的LEGEND MAX^TM人PCSK9 ELISA试剂盒(目录号443107)在指定时间点测量分泌的PCSK9水平。使用Promega的CellTiter-Glo试剂盒(目录号G7571)将所有ELISA数据标准化为细胞数量。

使用Mirus的TransIT-X2转染试剂(Cat#MIR6003)，将GFP敲入CLTA基因座作为框内CLTA融合物的HEK293T Griptite细胞与编码效应子构建体和人CLTA指导RNA的质粒共转染。通过FACS测量GFP表达，以GFP表达作为CLTA表达的替代。

使用Lonza的Amaxa 4D核转染装置中的SF细胞系96孔核转染试剂盒(目录号V4SC-2096，程序代码：CM-138)，将编码效应子构建体和小鼠PCSK9引导RNA的质粒共转染到Hepa1-6细胞中。在指定的时间点，对细胞进行FACS分析TdTomato表达，以TdTomato表达作为PCSK9水平的替代。

效应子构建体和合成gRNA的体外转录

根据制造商的说明，通过CellScript的T7 mScript^TM标准mRNA生产系统(目录号C-MSC100625)用1μg线性化效应子模板建立体外转录反应，以获得在5'末端具有Cap 1结构并被3'多腺苷酸化的RNA。从Integrated DNA Technologies获得末端修饰的sgRNA，其在5'和3'末端两者上具有三个具有硫代磷酸酯键的2'O-甲基修饰的核苷酸。

甲基化谱

使用DNAdvance DNA提取自组织试剂盒(Beckman Coulter)从96孔培养板的每个孔中提取基因组DNA。在通过高灵敏度DNA 1X试剂盒(Quant-IT)定量基因组DNA后，根据制造商的说明，使用EZ-96DNA甲基化-Gold MagPrep试剂盒(Zymo Research)将每个基因组DNA样品亚硫酸氢盐转化。对于杂交捕获实验，使用xGen^TM甲基-Seq DNA文库制备试剂盒(IDT)制备DNA文库，并使用xGen^TMDNA文库杂交捕获试剂盒(IDT)进行杂交捕获。对于扩增子测序实验，使用xGen^TM甲基-Seq DNA文库制备试剂盒(IDT)制备DNA文库，并使用xGen^TMDNA文库杂交捕获(IDT)进行杂交捕获。使用铂Taq试剂盒(Invitrogen)，将来自每个样品的亚硫酸氢盐转化的DNA用于接种对应于两个VIM扩增子中的每一个的PCR。在通过商业的服务(Azenta)测序之前，使用AMPure XP试剂盒(Beckman Coulter)清洁合并的产物，并通过Tapestation 4200(Agilent)上的D1000筛选胶带评估片段大小。

实施例13：细菌DNA甲基转移酶

在该实验中，筛选了一组细菌蛋白在哺乳动物细胞中的DNA甲基转移酶活性。通过使用实施例1的实验程序将这些细菌DNA甲基转移酶(表12)N-末端融合至dCas9结构域来测试表观遗传沉默活性。然后将这些构建体转染到在CTLA4的哺乳动物启动子控制下表达GFP的报告细胞系中。

表12：细菌DNA甲基转移酶

M.SssIDNA甲基转移酶能够有效地甲基化哺乳动物细胞中的DNA(图16)，稳定的沉默长达30天。图16中的序列可以在下面找到：

描述	序列	SEQ ID NO:
			TAR087靶DNA序列	GGCGGAAGTGCTGCCTGATA	667
TAR089靶DNA序列	GCAACACCGCCTAGACCGAC	668
			TAR090靶DNA序列	GGAGGTTCAGAAAGCCTAAG	669
TAR091靶DNA序列	GCAGCACTAGAGTCCCCTCA	670
			TAR092靶DNA序列	GAACAACTCGTGACTGGGGT	671
TAR093靶DNA序列	GGGAGAGGAGGACAAGCGCC	672
			TAR094靶DNA序列	GGACCCACCGACACCACGCC	673
TAR114靶DNA序列	CGCGGGAAAATGCAAGACGA	674

还在第29天分析了这些细胞的甲基化谱，证实了靶基因的20％甲基化(图17-18)。

使用实施例1的实验程序鉴定预测与M.SssI密切相关的另外三种直系同源DNA甲基转移酶并测试表观遗传沉默活性(表13)。

表13：细菌甲基转移酶

描述	SEQ ID NO
		DNA胞嘧啶甲基转移酶支原体目细菌	601
DNA胞嘧啶甲基转移酶海洋支原体	602
		DNA (胞嘧啶-5-)-甲基转移酶中华螺原体	603

预测表13的DNA甲基转移酶具有与M.SssI相似或改进的功能。在CRISPR-off的背景下测试序列，代替鼠DNMT3A/DNMT3L，并将它们的功能与M.SssIDNA甲基转移酶在HeLaTdTomato系统中沉默PCSK9基因座中的功能进行比较，以鉴定新的特征和改进的功能。

实施例14：替代的KRAB结构域

在该实施例中，融合蛋白用替代的KRAB结构域(表14)构建，并且当使用实施例1的实验程序测试时，与CRISPR-off相比显示出改善的活性(图19A-19D)。

表14：替代的KRAB结构域

实施例15：ZIM 3融合构建体

产生了ZIM3和KOX1KRAB的新融合物。ZIM 3和KOX1KRAB都是具有广泛同源性的KRAB家族蛋白。因此，设计了代表ZIM3和KOX1KRAB之间中点的序列。这些KOX1KRAB和ZIM3构建体编码集中在蛋白质锌指结构域周围的KOX1KRAB和ZIM3的小区域。虽然KOX1KRAB和ZIM3使用的区域在其序列的前75bp内非常相似，但ZIM3在C末端也具有一个小的α-螺旋区域，KOX1KRAB中不存在。KOX1KRAB-FL序列包括相当于该额外片段的KOX1 KRAB序列，而ZIM3截短从ZIM3序列中去除该额外片段。ZIM3/KOX1KRAB嵌合体是两种蛋白质的N-和C-末端片段的融合体。ZIM3样KOX1KRAB变体都是通过以下来组装：第一，来自非人物种的ZIM3或KOX1KRAB蛋白的BLAST，以组装每个基因最接近的100个同源物(“家族”)；第二，鉴定与ZIM3最相似的KOX1KRAB家族的3个成员和与KOX1KRAB最相似的ZIM3家族的3个成员；第三，合理地修饰KOX1KRAB-FL序列以类似于每组的三个(表15)。

表15：ZIM-KOX1KRAB嵌合蛋白

序列

下面列出了本公开中描述的核苷酸(nt)和氨基酸(aa)序列的SEQ ID NO(SEQ)。

Claims

1.用于抑制人细胞中，任选地人肝细胞中人PCSK9基因转录的系统，所述系统包括

a)一种或多种融合蛋白，其共同包含

DNA甲基转移酶(DNMT)结构域和/或招募DNMT的结构域，任选地其中所述DNMT结构域和/或所述招募结构域包含DNMT3A结构域和/或DNMT3L结构域，并且任选地其中所招募的DNMT是DNMT3A，和

转录阻遏结构域，

每个结构域与DNA结合结构域连接，所述DNA结合结构域结合所述人PCSK9基因中的靶区域；或

b)编码所述一种或多种融合蛋白的一种或多种核酸分子。

2.根据权利要求1所述的系统，其中所述DNA结合结构域结合SEQ ID NO:1488或1489中的靶序列。

3.根据权利要求1或2所述的系统，其中所述DNA结合结构域将所述融合蛋白靶向所述PCSK9基因中选自SEQ ID NO:700-747和1036-1261的一个或多个序列。

4.根据权利要求1-3中任一项所述的系统，其中所述DNA结合结构域包括死亡CRISPRCas(dCas)结构域、ZFP结构域或TALE结构域。

5.根据权利要求4所述的系统，其中所述DNA结合结构域包含dCas9结构域，并且所述系统还包括(i)一种或多种指导RNA，其包含SEQ ID NO:1262-1487中的任一个，或(ii)编码所述一种或多种指导RNA的核酸分子。

6.根据权利要求4或5所述的系统，其中所述dCas结构域包含dCas9序列，任选地与SEQID NO:12或13具有至少90％同一性的序列。

7.根据权利要求4所述的系统，其中所述ZFP结构域靶向选自SEQ ID NO:700-747的核苷酸序列。

8.根据权利要求7所述的系统，其中所述ZFP结构域包含如表1中所示的ZF001至ZF048中任一个的F1-F6氨基酸序列。

9.根据权利要求1-8中任一项所述的系统，其中所述DNMT3A结构域包含与SEQ ID NO:574或575具有至少90％同一性的序列。

10.根据权利要求1-9中任一项所述的系统，其中所述DNMT3L结构域包含与选自SEQ IDNO:578-581的序列具有至少90％同一性的序列。

11.根据权利要求1-9中任一项所述的系统，其中所述DNMT3L结构域包含与选自SEQ IDNO:582-603的序列具有至少90％同一性的序列。

12.根据权利要求1-8中任一项所述的系统，其中所述DNMT结构域包含与选自SEQ IDNO:601-603的序列具有至少90％同一性的序列。

13.根据权利要求1-12中任一项所述的系统，其中所述转录阻遏结构域包含与选自SEQID NO:33-570的序列具有至少90％同一性的序列。

14.根据权利要求1-12中任一项所述的系统，其中所述转录阻遏结构域包含衍生自KOX1、ZIM3、ZFP28或ZN627的KRAB结构域。

15.根据权利要求14所述的系统，其中所述KRAB结构域包含与选自SEQ ID NO:89、116、245和255的序列具有至少90％同一性的序列。

16.根据权利要求1-12中任一项所述的系统，其中所述转录阻遏结构域包含ZIM3和KOX1 KRAB的N-和C-末端区域的融合体，并且任选地包含SEQ ID NO:571或572的氨基酸序列。

17.根据权利要求1-12中任一项所述的系统，其中所述转录阻遏结构域衍生自KAP1、MECP2、HP1a/CBX5、HP1b、CBX8、CDYL2、TOX、TOX3、TOX4、EED、EZH2、RBBP4、RCOR1或SCML2。

18.根据权利要求1-17中任一项所述的系统，其中所述系统包括

a)融合蛋白，其包含所述DNMT3A结构域、所述DNMT3L结构域、所述转录阻遏结构域和所述DNA结合结构域，

b)编码所述融合蛋白的核酸分子。

19.根据权利要求18所述的系统，其中所述融合蛋白从N-末端到C-末端包含所述DNMT3A结构域、第一肽接头、所述DNMT3L结构域、第二肽接头、所述DNA结合结构域、第三肽接头和所述转录阻遏结构域。

20.根据权利要求19所述的系统，其中所述融合蛋白从N-末端到C-末端包含所述DNMT3A结构域、所述第一肽接头、所述DNMT3L结构域、所述第二肽接头、第一核定位信号(NLS)、所述DNA结合结构域、第二NLS、所述第三肽接头和所述转录阻遏结构域。

21.根据权利要求18所述的系统，其中所述融合蛋白从N-末端到C-末端包含第一核定位信号(NLS)、所述DNMT3A结构域、第一肽接头、所述DNMT3L结构域、第二肽接头、所述DNA结合结构域、第三肽接头、所述转录阻遏结构域和第二NLS。

22.根据权利要求18所述的系统，其中所述融合蛋白从N-末端到C-末端包含第一和第二核定位信号(NLS)、所述DNMT3A结构域、第一肽接头、所述DNMT3L结构域、第二肽接头、所述DNA结合结构域、第三肽接头、所述转录阻遏结构域以及第三和第四NLS。

23.根据权利要求18-22中任一项所述的系统，其中所述转录阻遏结构域是KRAB结构域，任选地是人KOX1、ZFP28、ZN627或ZIM3KRAB结构域。

24.根据权利要求19-23中任一项所述的系统，其中所述第二肽接头和所述第三肽接头中的一个或两个是XTEN接头，任选地选自XTEN80和XTEN16，并且进一步任选地其中所述第二肽接头是XTEN80，并且所述第三肽接头是XTEN16。

25.根据权利要求18所述的系统，其中所述融合蛋白从N-末端到C-末端包含人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、第一NLS、dSpCas9结构域、第二NLS、XTEN16肽接头和人KOX1 KRAB结构域。

26.根据权利要求25所述的系统，其中所述融合蛋白包含SEQ ID NO:658或与其至少90％相同的序列，或者SEQ ID NO:1495或与其至少90％相同的序列。

27.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、第一NLS、ZFP结构域、第二NLS、XTEN16接头和人KOX1 KRAB结构域。

28.根据权利要求27所述的系统，其中所述融合蛋白包含SEQ ID NO:659或与其至少90％相同的序列，或者SEQ ID NO:1496或与其至少90％相同的序列，任选地其中所述ZFP包含如表1中所示的ZF001至ZF048中任一个的F1-F6氨基酸序列。

29.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人KOX1 KRAB结构域以及第三和第四NLS。

30.根据权利要求29所述的系统，其中所述融合蛋白包含SEQ ID NO:660或与其至少90％相同的序列。

31.根据权利要求18所述的系统，其中所述融合蛋白从N-末端到C-末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人KOX1 KRAB结构域以及第三和第四NLS，任选地其中所述融合蛋白包含SEQ IDNO:1514或与其至少90％相同的序列，或者SEQ ID NO:1523或与其至少90％相同的序列。

32.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人ZFP28 KRAB结构域以及第三和第四NLS。

33.根据权利要求32所述的系统，其中所述融合蛋白包含SEQ ID NO:661或与其至少90％相同的序列，或者SEQ ID NO:1516或与其至少90％相同的序列。

34.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人ZFP28 KRAB结构域以及第三和第四NLS。

35.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人ZN627 KRAB结构域以及第三和第四NLS。

36.根据权利要求35所述的系统，其中所述融合蛋白包含SEQ ID NO:662或与其至少90％相同的序列，或SEQ ID NO:1520或与其至少90％相同的序列。

37.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人ZN627 KRAB结构域以及第三和第四NLS。

38.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、dSpCas9结构域、XTEN16肽接头、人ZIM3 KRAB结构域以及第三和第四NLS。

39.根据权利要求38所述的系统，其中所述融合蛋白包含SEQ ID NO:663或与其至少90％相同的序列，或者SEQ ID NO:1518或与其至少90％相同的序列。

40.根据权利要求18所述的系统，其中所述融合蛋白从N末端到C末端包含第一和第二NLS、人DNMT3A结构域、第一肽接头、人DNMT3L结构域、XTEN80肽接头、ZFP结构域、XTEN16肽接头、人ZIM3 KRAB结构域以及第三和第四NLS。

41.根据权利要求20-40中任一项所述的系统，其中所述NLS中的至少一个是SV40 NLS。

42.根据权利要求1-17中任一项所述的系统，其中所述系统包括：

a)第一融合蛋白，其包含第一DNA结合结构域并且包含或招募所述DNMT3A结构域，

第二融合蛋白，其包含第二DNA结合结构域并且包含或招募所述DNMT3L结构域，和

第三融合蛋白，其包含第三DNA结合结构域并且包含或招募所述转录阻遏结构域；或

b)一种或多种编码所述融合蛋白的核酸分子。

43.包含根据权利要求1-42中任一项所述的系统的人细胞，或所述细胞的后代，任选地其中所述细胞是肝细胞。

44.药物组合物，其包含根据权利要求1-42中任一项所述的系统和药学上可接受的赋形剂，任选地其中

所述组合物包含含有所述系统的脂质纳米颗粒(LNP)，和/或

所述DNA结合结构域是dCas结构域，并且所述LNP进一步包含一种或多种gRNA。

45.治疗有此需要的患者的方法，所述方法包括向所述患者施用根据权利要求1-42中任一项所述的系统或根据权利要求44所述的药物组合物，任选地静脉内施用。

46.根据权利要求45所述的方法，其中所述患者

患有心脏病，

具有升高的低密度脂蛋白胆固醇(LDL-C)或高胆固醇血症，

处于发展心肌梗塞、中风或不稳定型心绞痛的风险中，和/或

患有原发性高脂血症，任选地杂合子家族性高胆固醇血症(HeFH)或纯合子家族性高胆固醇血症(HoFH)。

47.根据权利要求1-42中任一项所述的系统或根据权利要求44所述的药物组合物，其用于治疗有此需要的患者，任选地在根据权利要求45或46所述的方法中。

48.根据权利要求1-42中任一项所述的系统在制备用于治疗有此需要的患者的药物中的用途，任选地在根据权利要求45或46所述的方法中。