CN119432832A

CN119432832A - 分区域蛋白定向进化系统和区块化定向进化目的蛋白的方法

Info

Publication number: CN119432832A
Application number: CN202411279510.7A
Authority: CN
Inventors: 张数一; 马梓源
Original assignee: Tsinghua University
Current assignee: Tsinghua University
Priority date: 2024-09-12
Filing date: 2024-09-12
Publication date: 2025-02-14

Abstract

本发明提出了一种基于分区域搜索的蛋白定向进化系统，所述系统包括：待定向进化元件，基因靶向突变元件以及噬菌体定向筛选元件，其中，待定向进化元件设置于噬菌体基因组载体上，所述噬菌体基因组载体的噬菌体定向筛选元件缺失；所述噬菌体定向筛选元件设置于第二载体上，所述第二载体适于在细菌或真菌中表达；所述待定向进化元件的表达产物调控所述噬菌体定向筛选元件的表达，所述待定向进化元件的表达产物的活性与所述噬菌体定向筛选元件的表达呈正相关。该系统能够以高效率、低成本、多捕获中间突变体的方式对待进化蛋白进行分区域的定向改造。

Description

分区域蛋白定向进化系统和区块化定向进化目的蛋白的方法

技术领域

本发明涉及蛋白进化领域，具体地，本发明涉及分区域蛋白定向进化系统和区块化定向进化目的蛋白的方法，更具体地，本发明涉及一种噬菌体辅助的基因突变、蛋白表达、表型选择与筛选的分区域定向进化系统与区块化定向进化目的蛋白的方法。

背景技术

蛋白质改造是一项重要的研究领域，它涉及对蛋白质结构和功能进行修改和优化。蛋白质是生物体内广泛存在的大分子，扮演着许多生物过程中关键的角色，包括催化反应、信号传导、结构支持等。

蛋白质改造目前主要通过随机突变、有针对性的突变、DNA重组和引物扩增四种方式进行。其中，随机突变通过随机引物、低精度PCR或突变体库构建方法(例如DNA疾病处理法)来实现；有针对性的突变(有针对性的点突变、重组、插入或删除)可以根据目标性质进行精确的设计；DNA重组将来自不同蛋白质源的片段或基因进行重组生成新的蛋白质变体；引物扩增生成包含蛋白质变体的DNA片段库，通过PCR反应，使用不同的引物或引物组合来扩增蛋白质的编码序列。然而，目前蛋白质改造的方法筛选得到的活性突变体的效率低、人工成本高。

因此，亟需开发一种蛋白质改造方法，以提高获得活性突变体的效率，降低人工成本。

发明内容

本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。

发明人发现，现有的蛋白质改造方法效率低、人工成本高、并且会遗漏中间一些表现不如终点的突变体。为了克服这一问题，发明人构建了高效率的定向进化系统，在保证相对较低的成本的同时，获得一定数量的多点位突变的组合突变体，并捕捉进化过程中的中间态突变体以满足针对待进化蛋白的全面性改造。

在本发明的第一个方面，本发明提出了一种分区域蛋白定向进化系统。根据本发明的实施例，所述系统包括：待定向进化元件，基因靶向突变元件以及噬菌体定向筛选元件，其中，待定向进化元件设置于噬菌体基因组载体上，所述噬菌体基因组载体的噬菌体定向筛选元件缺失；所述噬菌体定向筛选元件设置于第二载体上，所述第二载体适于在细菌或真菌中表达；所述基因靶向突变元件包括基因定向进化工具和基因靶向指示元件，所述基因定向进化工具和所述基因靶向指示元件设置于同一或不同载体上，优选为设置于不同载体上；所述基因定向进化工具的表达产物适于对待定向进化元件进行基于分区域的定向进化处理，所述基因定向进化工具设置于所述第三载体上，所述第三载体适于在细菌或真菌中表达；所述基因靶向指示元件设置于所述第二载体上；所述待定向进化元件的表达产物调控所述噬菌体定向筛选元件的表达，所述待定向进化元件的表达产物的活性与所述噬菌体定向筛选元件的表达呈正相关。根据本发明实施例的系统，能够以高效率、低成本、多捕获中间突变体的方式对待进化蛋白进行分区域的定向改造。

在本发明的第二个方面，本发明提出了一种区块化定向进化目的蛋白的方法。根据本发明的实施例，所述方法利用携带所述待定向进化目的蛋白的本发明第一方面所述的蛋白定向进化系统对待定向进化目的蛋白进行改造处理。根据本发明实施例的方法，能够以高效率、低成本、多捕获中间突变体的方式对待进化蛋白进行全面的定向改造。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明EvoScan系统原理图。

图2为本发明EvoScan组合突变流程图(以AmeR为例)。

图3为本发明EvoScan进化路径中“一步”的流程图。

图4为实施例1中对EGFP纳米抗体进化基因回路设计。

图5为实施例1中EGFP-纳米抗体互作的EvoScan流程及结果展示。

图6为实施例2中M^pro的EvoScan体系搭建及效果测试图。

图7为实施例2中M^pro逃逸小分子抑制的EvoScan进化设计，噬菌体增殖情况及突变体汇总。

图8为实施例3中AmeR抑制作用的EvoScan进化系统设计图。

图9为实施例3中AmeR的EvoScan进化流程及结果统计。

图10为实施例3中AmeR抑制效应的诱导表达实验结果图。

图11为对比例1中EGFP纳米抗体与EGFP互作的PANCE进化设计及结果图。

图12为对比例2中M^pro逃逸GC376抑制的PANCE进化设计及结果图。

图13为对比例3中AmeR抑制效应的PANCE进化设计及进化结果图。

图14为对比例1中MP6突变质粒的图谱。

图15为实施例4中HCV蛋白酶的反向双杂系统体系搭建图及效果测试图。

图16为实施例4中HCV蛋白酶的反向双杂系统的效果测试图。

具体实施方式

下面详细描述本发明的实施例。下面描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

需要说明的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。进一步地，在本发明的描述中，除非另有说明，“多个”的含义是两个或两个以上。

在本文中，术语“包含”或“包括”为开放式表达，即包括本发明所指明的内容，但并不排除其他方面的内容。

在本文中，术语“任选地”、“任选的”或“任选”通常是指随后所述的事件或状况可以但未必发生，并且该描述包括其中发生该事件或状况的情况，以及其中未发生该事件或状况的情况。

在本文中，术语“蛋白定向进化系统”(Protein Directed Evolution System)是一种用于改造蛋白质功能和性质的实验方法。它结合了蛋白质工程和进化生物学的原理，旨在通过人为导向的进化过程，创造出具有特定性能的蛋白质分子。蛋白定向进化系统通常包括以下步骤：多样性引入(Diversity Introduction)：通过引入随机突变或者重组的方式，创造出具有多样性的蛋白质库。这可以通过基因突变、DNA重组或者其他方法来实现；选择或筛选(Selection or Screening)：将蛋白质库中的成员暴露在特定条件下，然后通过筛选或选择的方式，挑选出具有目标功能或性质的蛋白质变体。这可以通过高通量筛选、功能鉴定或者其他技术手段来进行；扩增与重复(Amplification and Repetition)：将经过选择的蛋白质变体进行扩增，以增加其数量，并将其作为下一轮进化的起点。这个过程可以通过PCR(聚合酶链式反应)或其他扩增技术来完成；迭代(Iterations)：重复进行选择/筛选、扩增与重复的步骤，逐渐优化蛋白质的性能。每一轮进化都可以产生更接近目标功能的蛋白质变体。通过多次迭代，蛋白定向进化系统可以在相对短的时间内，通过模拟自然进化的原理，创造出具有特定功能或性质的蛋白质分子。这种方法在药物研发、酶工程、材料科学等领域具有广泛的应用潜力。根据本发明的实施例，本文中的“蛋白定向进化系统”命名为“EvoScan系统”。

在本文中，术语“分区域”是指EvoScan系统区别于传统定向进化系统，使用基于CRISPR-cas9的基因靶向编辑技术，将定向进化中用以多样性引入的enCas9-PolIM5复合体应用于目标基因的某一个较精确的，长度有限的区域，并通过设计合适的选择，筛选，迭代的方式对于整个基因的不同区域，分别地引入突变进行定向进化过程，从而达到“分区域”定向进化的目的。

在本文中，术语“CRISPR-Cas-DNA聚合酶系统”、“ZFNs-DNA聚合酶系统”、“TALENs-DNA聚合酶系统”是指基因编辑系统和聚合酶系统的复合。根据本发明的实施例，“CRISPR-Cas-DNA聚合酶系统”是指既有“CRISPR-Cas系统”的编辑功能又有“DNA聚合酶系统”的聚合修复功能的复合系统。根据本发明的实施例，“CRISPR-Cas-DNA聚合酶系统”为“enCas9-PolIM5复合蛋白”，其中，Cas9切口酶经过改造后可以在指导RNA(guide RNA,gRNA)的帮助下对于M13基因组的复制形态进行单链切割，而经过突变后失去错配修复能力的蛋白质聚合酶I则通过修复M13基因组上的切口引入新的碱基，在这个过程会有一定的概率引入突变，最后通过宿主体内的DNA连接酶修复切口。利用聚合酶I的修复功能主要覆盖gRNA靶向的20个碱基左右的特质，可以在一个相对限定的区域内高效引入突变体。

在本文中，术语“多区域扫描突变”是蛋白质定向进化中的一种策略，用于同时探索和优化蛋白质的多个区域。在蛋白质结构中，不同的区域可能对蛋白质的功能和性质产生重要影响，因此通过同时引入突变并评估多个区域，可以更全面地了解和改变蛋白质的性能。根据本发明的实施例，在多区域扫描突变中，本领域的技术人员选择了需要关注的多个蛋白质区域，通常是基于已有的结构和功能信息。然后，在这些选定的区域内，通过引入多样性的突变(例如氨基酸替换、插入或删除)来创建蛋白质变体库。接下来，这些蛋白质变体将经过筛选或选择过程，以挑选出具有目标性能或功能的变体。筛选的方法可以根据具体的应用需求而定，可能涉及酶活性测定、配体结合实验、高通量筛选等。通过多区域扫描突变的方法，可以在同一轮进化中同时优化多个蛋白质区域，从而更有效地改变蛋白质的性质和功能。这种策略可以帮助本领域的技术人员在蛋白质工程中更全面地探索和改造蛋白质，以满足特定的应用需求。

在本文中，术语“适应性景观”是指蛋白质序列与其适应性(如功能、稳定性等)之间关系的概念。它可以被视为一个多维的空间，其中每个点代表一个可能的蛋白质序列，而每个点的高度(或者称为能量)表示该蛋白质在生物系统中的适应性。适应性景观可以帮助本领域技术人员理解蛋白质序列空间中的各种性质和功能。在适应性景观中，蛋白质序列的邻近点表示具有相似序列的变体，而较远的点表示差异较大的序列。较低的能量或高度表示较高的适应性，而较高的能量或低度表示较低的适应性。

本发明提出了一种分区域蛋白定向进化系统和一种区块化定向进化目的蛋白的方法，下面将分别对其进行详细描述。

分区域蛋白定向进化系统

在本发明的一个方面，本发明提出了一种分区域蛋白定向进化系统。根据本发明的实施例，所述系统包括：待定向进化元件，基因靶向突变元件以及噬菌体定向筛选元件，其中，待定向进化元件设置于噬菌体基因组载体上，所述噬菌体基因组载体的噬菌体定向筛选元件缺失；所述噬菌体定向筛选元件设置于第二载体上，所述第二载体适于在细菌或真菌中表达；所述噬菌体定向筛选元件设置于第二载体上，所述第二载体适于在细菌或真菌中表达；所述基因靶向突变元件包括基因定向进化工具和基因靶向指示元件，所述基因定向进化工具和所述基因靶向指示元件设置于同一或不同载体上，优选为设置于不同载体上；

所述基因定向进化工具的表达产物适于对待定向进化元件进行基于分区域的定向进化处理，所述基因定向进化工具设置于所述第三载体上，所述第三载体适于在细菌或真菌中表达；所述基因靶向指示元件设置于所述第二载体上；所述待定向进化元件的表达产物调控所述噬菌体定向筛选元件的表达，所述待定向进化元件的表达产物的活性与所述噬菌体定向筛选元件的表达呈正相关。通过使用基于gRNA靶向的CRISPR-cas9系统作为引入突变的定向方式，突变引入的范围会受到gRNA靶向序列长度，及DNA聚合酶修复可及性的限制，利用这种特性，可以在序列的不同区域上相对独立地引入不同的突变及突变组合，通过该方式既可以达到分区域定向进化的效果。根据本发明实施例的系统，将其命名为EvoScan系统，EvoScan系统的原理图如图1所示，EvoScan系统核心涉及到两个生物单元：作为待进化蛋白表达载体的M13噬菌体，及作为噬菌体突变筛选的宿主的大肠杆菌细胞S2060。发明人将待进化的蛋白对应的编码序列插入M13噬菌体的基因组中，取代原有的帮助噬菌体侵染和释放的核心基因III(gIII),称其为筛选噬菌体(Selection Phage，SP)。与此同时将gIII的表达放到宿主细胞中，通过设计辅助质粒(Accessory Plasmid，AP)来将gIII的表达量与待进化的蛋白功能进行耦连，并设计靶向突变质粒(Targetedmutagenesis Plasmid，TP)来对待进化的目标基因进行基因组突变。SP将侵染包含AP以及TP的S2060宿主菌中，其单链DNA将复制成双链并进行基因表达，这个过程中TP可以针对这个双链DNA引入靶向突变。TP的设计使用了Halperin,S.O.et al.CRISPR-guidedDNApolymerases enablediversification ofall nucIeotides in a tunablewindow.Nature 560,248-252(2018).中的EvolvR系统当中的enCas9-PolIM5复合蛋白，其中Cas9切口酶经过改造后可以在指导RNA(guide RNA，gRNA)的帮助下对于M13基因组的复制形态进行单链切割，而经过突变后失去错配修复能力的蛋白质聚合酶I则通过修复M13基因组上的切口引入新的碱基，在这个过程会有一定的概率引入突变，最后通过宿主体内的DNA连接酶修复切口。利用聚合酶I的修复功能主要覆盖gRNA靶向的20个碱基左右的特质，可以在一个相对限定的区域内高效引入突变体。通过突变的基因表达出来的目标蛋白突变体会通过AP的辅助控制细胞内gIII的表达，进而控制释放出S2060的SP的数量。利用M13侵染会阻断其他个体继续侵染宿主的特性，合理的AP设计可以让蛋白的功能活性与增殖形成正相关，即活性越高的突变体能释放出的SP会越多。释放出的SP在收集，传代之后在下一个宿主体系中浓度会被稀释，活性相对较高的突变体在传代过程中将被富集，在下一次传代中继续侵染；而活性较低的个体将在这一过程中被逐渐淘汰。这种高效率，多轮次的定向进化方法，相比于传统的随机序列建库，错配PCR建库等方式，以及通过非连续的载体多次重复构建表达体系筛选的定向进化体系，具备简单，高效，低成本的优势。由于筛选体系与蛋白功能活性高度耦连，通过筛选得到的突变体绝大多数都具备比原有蛋白更加高的功能活性，相比于随机建库及计算功能预测来讲能得到的有功能活性突变体比例相对更高，后者通常得到的绝大多数突变都是使得蛋白活性有所损失甚至失活的突变体，得到有活性突变体的效率相对较低，成本也更昂贵。蛋白大小差异巨大，而一个gRNA通常只能比较高效地控制7-8个氨基酸的突变，所以需要设计大量的符合PAM位点设计的gRNA，于是发明人选择在AP上插入gRNA的表达框，来构建复数个AP来分别进化蛋白的不同位点，如图2和图3所示。通过在不同位点上进行进化引入突变的手段，来实现突变位点的组合，进而发现多种中间状态的，满足蛋白功能活性的突变体。相比于其它噬菌体连续进化体系，EvoScan捕捉到的活性中间态突变体对于后续蛋白质适应性景观的研究将提供更完善的帮助。

根据本发明的实施例，基于不同的基因线路调控，蛋白定向进化系统包括蛋白-蛋白定向进化系统、蛋白-小分子定向进化系统和蛋白-核酸定向进化系统。

根据本发明的实施例，所述第二载体包括1号第二载体、2号第二载体和3号第二载体。

其中，需要解释说明的是，根据本发明的实施例，本发明中的1号第二载体对应蛋白-蛋白定向进化系统、2号第二载体对应蛋白-小分子定向进化系统、3号第二载体对应蛋白-核酸定向进化系统。

根据本发明的实施例，所述定向进化处理是通过如下方式进行：利用所述基因定向进化工具元件对所述待定向进化元件的表达产物进行切割处理，以便将切割处理产物引入突变。

根据本发明的实施例，所述基因定向进化工具元件选自CRISPR-Cas-DNA聚合酶系统、ZFNs-DNA聚合酶系统和TALENs-DNA聚合酶系统中的至少之一。

根据本发明的实施例，所述CRISPR-Cas-DNA聚合酶系统中的CRISPR-Cas蛋白包括Cas9切口酶(nCas9)，enCas9，nSaCas9等其他同源Cas9切口酶，改造Cas9切口酶，其他切割DNA双联的Cas蛋白切口酶等中的至少之一。需要解释说明的是，Cas9是一种CRISPR关联蛋白质，广泛应用于基因编辑和基因工程领域。它是CRISPR系统中的核酸酶，能够与CRISPRRNA(crRNA)和转录单元的转录单元RNA(tracrRNA)形成复合物，通过识别和切割特定的DNA序列来实现基因组编辑；enCas9(enhanced Cas9)是对Cas9进行了改良和优化的变体，旨在提高其编辑效率和特异性，enCas9通常通过结构改造、蛋白工程或突变来实现，这些改进可以包括增强Cas9与目标DNA序列的结合能力、改善Cas9的核酸酶活性或减少非特异性的剪切；SaCas9(Staphylococcus aureus Cas9)是来自金黄色葡萄球菌(Staphylococcusaureus)的另一种类型的Cas9蛋白质，与传统的Cas9相比，SaCas9具有较小的分子尺寸，因此在某些情况下更适合在细胞内进行基因编辑，SaCas9在一些基因编辑应用中具有潜在的优势，尤其是在需要递送到细胞内的载体尺寸受限的情况下；enSaCas9(enhanced SaCas9)是对SaCas9进行改良和优化的变体，类似于enCas9对Cas9的优化，enSaCas9旨在提高SaCas9的编辑效率、特异性和其他相关特性，通过改进和优化SaCas9的结构和性能，enSaCas9可以更好地满足特定基因编辑需求。Cas9、enCas9、SaCas9和enSaCas9都是CRISPR关联蛋白质，用于基因编辑和工程。它们的改良和优化旨在提高编辑效率、特异性和其他相关特性，以扩展CRISPR技术的应用范围和效能。

根据本发明的实施例，所述基因靶向指示元件包括gRNA表达元件，所述gRNA具有待定向进化元件的表达产物的靶向结合活性。

根据本发明的实施例，所述CRISPR-Cas-DNA聚合酶系统中的CRISPR-Cas蛋白选自Cas9切口酶、enCas9、nSaCas9和改造Cas9切口酶中的至少之一。

根据本发明的实施例，所述CRISPR-Cas-DNA聚合酶系统中的DNA聚合酶包括易错DNA聚合酶I,优选为PolIM5聚合酶、PolIM3聚合酶和PolIM3-TBD聚合酶中的至少之一。

根据本发明的实施例，所述CRISPR-Cas-DNA聚合酶系统选自Cas9-PolIM5和enCas9-PolIM3-TBD中的至少之一。根据本发明实施例的系统，能够以高效率、低成本、多捕获中间突变体的方式对待进化蛋白进行全面的定向改造。其中，所述Cas9-PolIM5能够高效地改造待进化蛋白。

根据本发明的实施例，所述第二载体和第三载体为同一载体或不同的载体，优选为不同的载体。

根据本发明的实施例，所述第三载体进一步包括：第一启动子元件；以及第一诱导元件；其中，所述第一启动子元件、第一诱导元件、基因定向进化工具元件可操作地连接。

根据本发明的实施例，所述第三载体进一步包括抗性基因元件。

根据本发明的实施例，所述第一启动子元件选自T7启动子和J23系启动子中的至少之一。

根据本发明的实施例，所述诱导元件包括pVanA-VanR诱导元件、pBAD-araC诱导元件、pTet-tetR元件和pTac-LacI诱导元件中的至少之一。根据本发明的实施例，这些诱导元件是用于调控基因表达的序列，可以通过适当的条件或信号来诱导目标基因的表达。其中，pVanA-VanR诱导元件是指pVanA-VanR系统相关的诱导元件，pVanA-VanR系统是一种广谱β-内酰胺类抗生素耐药性系统，可以在特定条件下调节耐药基因的表达，该诱导元件可以通过引入pVanA-VanR系统相关的基因或序列来实现对基因的诱导；pBAD-araC诱导元件是指araC家族相关的诱导元件，araC是一种转录调控蛋白质，可以与ara操作子序列结合并调控下游基因的表达，通过引入araC诱导元件或相关的基因组片段，可以实现对基因表达的诱导；pTet-tetR元件是指Tet诱导元件，是来自Tn10转座子的调控序列，Tet元件可以响应四环素类抗生素的存在，并调控下游基因的表达，引入Tet元件或相关的基因片段可以实现对基因的诱导。除了上述提到的诱导元件，本发明的实施例可能还使用其他未提及的诱导元件，这些元件根据具体实验需求或研究对象的特定条件而选择。

根据本发明的实施例，所述pVanA-VanR诱导元件包括VanR转录因子和pVanA启动子。根据本发明的实施例，VanR转录因子是与pVanA-VanR系统相关的蛋白质，参与调控特定基因的转录。VanR转录因子能够结合到特定DNA序列上，并通过激活或抑制转录过程来调控下游基因的表达。pVanA启动子是与pVanA-VanR系统相关的启动子序列，位于目标基因的上游区域。启动子是基因表达的关键元件，可以提供转录机器的结合位点和调控蛋白质的结合位点，从而调控基因的转录起始。通过组合VanR转录因子和pVanA启动子，pVanA-VanR诱导元件能够实现对目标基因的诱导表达。VanR转录因子与pVanA启动子相互作用，绑定到pVanA启动子上，从而激活或抑制目标基因的转录过程。需要注意的是，pVanA-VanR系统和pVanA启动子是本发明中特定的诱导元件示例，用于说明基因调控的原理。在实际应用中，根据具体需求和研究目的，可能还会使用其他诱导元件或调控机制来实现基因的诱导表达。

根据本发明的实施例，所述pBAD-araC诱导元件包括araC转录因子和pBAD启动子。

根据本发明的实施例，所述pTet-tetR诱导元件包括tetR转录因子和pTet启动子。

根据本发明的实施例，所述pTac-LacI诱导元件包括LacI转录因子和pTac启动子。

根据本发明的实施例，所述抗性基因元件包括选自壮观霉素抗性基因、氨苄青霉素酶基因、卡那霉素抗性基因、链霉素抗性基因和氯霉素抗性基因中的至少之一。根据本发明的实施例，这些抗性基因是指能够使宿主细胞对特定抗生素或毒性化合物具有抗性的基因，它们通常来自于自然界中的耐药基因或工程构建的耐药基因，可以在适当的条件下使宿主细胞对相应的抗生素或毒性化合物具有耐受性。

根据本发明的实施例，所述第三载体从5'端到3'端依次为第一启动子元件、VanR转录因子、pVanA启动子、基因定向进化工具元件、抗性基因元件。

根据本发明的实施例，所述第三载体具有如SEQ ID NO:1所示的核苷酸序列。

根据本发明的实施例，所述噬菌体定向筛选元件包括gIII。根据本发明的实施例，gIII是噬菌体(bacteriophage)基因组中的一个基因，它编码了噬菌体颗粒(phageparticIe)的释放蛋白质。噬菌体定向筛选元件通常指的是与噬菌体释放过程相关的基因或序列，包括参与噬菌体颗粒从宿主细胞中释放出来的各种组分。在噬菌体感染宿主细胞后，噬菌体基因组会利用宿主细胞的生物合成机制进行复制和转录。在适当的时机，噬菌体需要释放出新产生的噬菌体颗粒，以便感染其他宿主细胞。噬菌体定向筛选元件中的gIII基因编码的蛋白质在这个释放过程中起着重要的作用。具体来说，gIII编码的蛋白质可能参与噬菌体颗粒的组装和成熟过程，并与宿主细胞膜相互作用，导致细胞膜的破裂，从而释放出噬菌体颗粒。

根据本发明的实施例，以下为本发明的蛋白定向进化系统为蛋白-蛋白定向进化系统时的具体情况：

根据本发明的实施例，所述待定向进化元件的表达产物与靶点的相互作用调控cIp22-cI434四聚体的生成调控所述噬菌体定向筛选元件的表达。

根据本发明的实施例，所述第二载体进一步包括第二诱导元件。

根据本发明的实施例，所述第二诱导元件包括第二启动子、第三启动子和第一抑制子，所述第二启动子启动第一抑制子的表达，所述第一抑制子适于抑制所述第三启动子的表达。

根据本发明的实施例，所述第二诱导元件设置于所述第二载体上。

根据本发明的实施例，所述第二启动子选自T7启动子和J23系启动子中的至少之一，所述第三启动子选自pTac，pVanR，pTet和pBAD中的至少之一，第一抑制子选自LacI，VanR，tetR和araC中的至少之一。

根据本发明的实施例，所述第一抑制子在IPTG环境中适于解除对第三启动子的抑制。

根据本发明的实施例，所述待定向进化元件与cIp22表达元件相连，所述cIp22与所述待定向进化元件的表达产物融合表达；cI434表达元件与编码第一靶点的元件相连，cI434表达元件与编码第一靶点的元件设置于所述第二载体上，所述cI434与所述第一靶点融合表达，所述待定向进化元件的表达产物具有结合所述第一靶点的活性。

根据本发明的实施例，所述第一靶点为在所述受体菌中可溶性表达的受体蛋白，所述待定向进化元件的表达产物包括在所述受体菌中可溶性表达的与受体蛋白相互作用的目标进化蛋白，所述目标进化蛋白包括抗体，纳米抗体，短肽，蛋白伴侣和级联转录因子中的至少之一。

根据本发明的实施例，所述第一靶点包括EGFP，所述待定向进化元件的表达产物包括但不限于抗EGFP的纳米抗体或其他可在原核系统内正常表达的互作蛋白。

根据本发明的实施例，所述cIp22-cI434四聚体适于通过结合第一操作子元件抑制第四启动子的表达，所述第四启动子适于启动第二抑制子的表达，所述第二抑制子适于抑制第五启动子的表达，第五启动子适于启动所述噬菌体定向筛选元件的表达，所述第四启动子、所述第一操作子元件、所述第二抑制子、所述第五启动子和所述噬菌体定向筛选元件可操作地连接。根据本发明的实施例，发明人基于反向双杂系统(reverse two-hybridsystem,RTHS)将蛋白质互作亲和力与M13噬菌体gIII表达耦连起来。具体来说，cI434和cIp22是两个经过改造之后高度同源但不相互作用的两个抑制元件，其组合起来的四聚体可以抑制启动子p434上的两个操作子元件，达到抑制启动子的作用。两个互作的蛋白质可以将与其连接的cI434与cIp22两个抑制元件组合到一起，进而实现对于下游启动子p434的抑制，再通过连接一个抑制子PhlF的表达将互作亲和力与gIII的表达正向关联起来。此外，根据本发明的实施例，这种设计利用了基因调控元件之间的相互作用和调控级联效应。cIp22-cI434四聚体通过结合第一操作子元件可以抑制第四启动子的表达，从而抑制与第四启动子相关的基因的转录和表达。第四启动子的启动活性可以被设计为调控第二抑制子的表达。第二抑制子的表达会抑制第五启动子的表达，进而阻止与第五启动子相关的基因的转录和表达。最后，第五启动子被设计为启动噬菌体定向筛选元件的表达，从而调控噬菌体的释放过程。通过将这些基因调控元件按照特定的顺序连接在一起，可以实现级联的调控效应，从而实现对目标基因的精确调控。需要注意的是，具体的连接方式和序列设计取决于实施例中所使用的调控元件以及目标基因的需求。这种设计允许对基因表达进行精确的调控和调节，以满足特定的研究目的和应用需求。

根据本发明的实施例，所述cI434与第一靶点融合表达元件、第四启动子、第一操作子元件、第二抑制子、第五启动子设置于1号第二载体上。

根据本发明的实施例，所述第四启动子包括p434。在本发明的实施例中，第四启动子使用p434作为其序列，以启动与之相连的第二抑制子的表达。这意味着p434序列通过与适当的转录因子和调控蛋白相互作用，可以诱导第二抑制子的转录和表达，从而调控与第二抑制子相关的基因的表达水平。

根据本发明的实施例，所述第五启动子选自pPhlF、pQacR、pMcbR中的至少之一。在本发明的实施例中，第五启动子使用pPhlF作为其序列，以启动与之相连的噬菌体定向筛选元件的表达。这意味着pPhlF序列通过与适当的转录因子和调控蛋白相互作用，可以诱导噬菌体定向筛选元件的转录和表达，从而调控噬菌体颗粒的释放过程。

根据本发明的实施例，所述第一操作子元件包括p434操作子。

根据本发明的实施例，所述第二抑制子包括但不限于与第五启动子匹配的PhlF、QacR、Mcb等tetR家族中的抑制子蛋白。在本发明的实施例中，第二抑制子使用PhlF作为其序列，用于抑制与之相连的第五启动子的表达。这意味着PhlF序列通过与适当的转录因子和调控蛋白相互作用，可以抑制第五启动子的转录和表达，从而调控与第五启动子相关的基因的表达水平。

根据本发明的实施例，本发明的蛋白定向进化系统为蛋白-蛋白互作定向进化系统时，以EGFP纳米抗体进化为例，分区域定向进化E103K突变体，采用的gRNA的核苷酸序列如SEQ ID NO:51～SEQ ID NO:54所示，对应三个E103K突变体的CDR区域(CDR1-CDR3)，以及一个脱靶gRNA，来对E103K突变体分区域进行四个不同的进化。相同的构造可用于进化诸如抗体，纳米抗体，短肽，蛋白伴侣和级联转录因子中的至少之一。

根据本发明的实施例，以下为本发明的蛋白定向进化系统为蛋白-小分子互作定向进化系统时的具体情况：

根据本发明的实施例，cIp22表达元件与cI434表达元件相连，所述cIp22与所述cI434融合表达，所述待定向进化元件的表达产物适于切割cIp22与cI434融合表达产物。

根据本发明的实施例，所述cIp22与所述cI434通过连接肽相连。

根据本发明的实施例，所述连接肽具有待定向进化元件的表达产物的识别位点。

根据本发明的实施例，所述待定向进化元件的表达产物包括能在所述受体菌中可溶性表达的蛋白酶，所述可溶性表达的蛋白酶包括但不限于M^pro、TEV蛋白酶和HCV蛋白酶中的其中之一。

根据本发明的实施例，所述cIp22-cI434四聚体适于通过结合第二操作子元件抑制第六启动子的表达，所述第六启动子适于启动所述噬菌体定向筛选元件的表达，所述第六启动子、所述第二操作子元件和所述噬菌体定向筛选元件可操作地连接。

根据本发明的实施例，所述第六启动子包括p434。

根据本发明的实施例，所述第二操作子元件包括p434操作子。

根据本发明的实施例，所述cIp22与cI434融合表达元件、第六启动子、第二操作子元件设置于所述2号第二载体上。

根据本发明的实施例，本发明的蛋白定向进化系统为蛋白-小分子互作定向进化系统时，分区域定向进化M^pro，采用的gRNA的核苷酸序列如SEQ ID NO:55～SEQ ID NO:86所示，来对M^pro分区域进行不同的进化。

根据本发明的实施例，以下为本发明的蛋白定向进化系统为蛋白-核酸互作定向进化系统时的具体情况：

根据本发明的实施例，所述3号第二载体上进一步包括第八启动子、第三抑制子、第七启动子，所述第三抑制子的表达产物适于通过抑制第七启动子的活性抑制所述噬菌体定向筛选元件的表达，所述待定向进化元件的表达产物适于抑制所述第八启动子的表达，所述第八启动子、第三抑制子、第七启动子与所述噬菌体定向筛选元件可操作地连接。

根据本发明的实施例，所述待定向进化元件的表达产物通过抑制第八启动子的表达活性抑制所述第三抑制子的表达。

根据本发明的实施例，所述第三抑制子选自tetR家族转录因子，如PhlF、QacR和McbR中的至少之一。

根据本发明的实施例，所述待定向进化元件的表达产物包括与特定DNA序列结合的蛋白，优选为转录因子，更优选为tetR家族转录因子，如AmeR和McbR中的至少之一。

根据本发明的实施例，所述第七启动子包括与所述第三抑制子匹配的pPhlF、pQacR和pMcbR中的至少之一。

根据本发明的实施例，所述第八启动子包括与所述待进化转录因子结合的DNA序列作为操作子的常表达启动子，优选为pAmeR。

根据本发明的实施例，所述第七启动子适于与所述第八启动子及其配套结合蛋白正交，所述第八启动子适于与所述第七启动子及其配套结合蛋白正交。

根据本发明的实施例，所述第三抑制子为PhlF，所述待定向进化元件的表达产物为AmeR，所述第七启动子为pPhlF，所述第八启动子为pAmeR。

根据本发明的实施例，所述第二载体进一步包括第九启动子，所述第九启动子和gRNA表达元件可操作地连接。

根据本发明的实施例，所述1号第二载体从5'端到3'端依次为第九启动子、gRNA表达元件、第三启动子、cI434与第一靶点融合表达元件、第四启动子、第一操作子元件、第二抑制子、第五启动子、噬菌体定向筛选元件、第二启动子和第一抑制子。

根据本发明的实施例，所述1号第二载体具有如SEQ ID NO:2～SEQ ID NO:5所示的核苷酸序列。

根据本发明的实施例，所述2号第二载体从5'端到3'端依次为第九启动子、gRNA表达元件、第三启动子、cIp22与cI434融合表达元件、第六启动子、第二操作子元件、噬菌体定向筛选元件、第二启动子和第一抑制子。

根据本发明的实施例，所述2号第二载体具有如SEQ ID NO:6～SEQ ID NO:37所示的核苷酸序列。

根据本发明的实施例，所述3号第二载体从5'端到3'端依次为第九启动子、gRNA表达元件、第八启动子、第三抑制子、第七启动子、噬菌体定向筛选元件。

根据本发明的实施例，所述3号第二载体具有如SEQ ID NO:38～SEQ ID NO:50所示的核苷酸序列。

根据本发明的实施例，所述第二载体与所述第三载体不同，所述第二载体选自pUC，ColE1，p15A，CloDF13，pSC101和pBR322中的至少之一；所述第三载体选自pUC，ColE1，p15A，CloDF13，pSC101和pBR322中的至少之一。

根据本发明的实施例，第二载体为p15A载体。根据本发明的实施例，p15A是一种常用的质粒载体，广泛用于分子生物学研究和基因工程实验中，它具有较小的大小和中等复制数，适用于在大肠杆菌等细菌中进行复制和表达。

根据本发明的实施例，第三载体为ColE1载体。根据本发明的实施例，ColE1是一种广泛应用于分子生物学研究和基因工程实验中的质粒载体，它具有较小的大小和高复制数，在大肠杆菌等细菌中能够高效地进行复制和表达。

根据本发明的实施例，所述细菌或真菌包括天然宿主菌，或者经过遗传改造后的非天然宿主菌。

根据本发明的实施例，所述细菌为大肠杆菌。

根据本发明的实施例，所述大肠杆菌为S2060。

根据本发明的实施例，本发明的分区域蛋白定向进化系统为蛋白-核酸互作定向进化系统时，分区域定向进化AmeR，采用的gRNA的核苷酸序列如SEQ ID NO:87～SEQ IDNO:99所示，来对AmeR分区域进行不同的进化。

区块化定向进化目的蛋白的方法

根据本发明的实施例，所述改造处理是通过如下方式实现的：将所述蛋白定向进化系统中的第二载体和第三载体转导入受体菌中；将包括本发明第一方面所述的蛋白定向进化系统中的携带噬菌体定向筛选元件的噬菌体侵染所述受体菌；以及将经过转导和侵染的受体菌进行培养处理，以便使得所述待定向进化目的蛋白在受体菌中进行改造。根据本发明的实施例，在培养过程中，待定向进化目的蛋白将在受体菌中进行改造，会应用特定的培养条件和选择压力，以促进目标蛋白的进化和改良。根据本发明实施例的方法，能够以高效率、低成本、多捕获中间突变体的方式对待进化蛋白进行全面的定向改造。

根据本发明的实施例，将所述蛋白定向进化系统中的所述第二载体导入受体菌中是在第一诱导剂存在的条件下进行的。

根据本发明的实施例，将所述蛋白定向进化系统中的所述第三载体导入受体菌中是在第二诱导剂存在的条件下进行的。

根据本发明的实施例，所述第一诱导剂选自IPTG、香草酸和阿拉伯糖中的至少之一。

根据本发明的实施例，所述第二诱导剂选自PTG、香草酸和阿拉伯糖中的至少之一。

根据本发明的实施例，所述第一诱导剂与第二诱导剂相同或不同，优选为所述第一诱导剂与所述第二诱导剂不同。

根据本发明的实施例，所述IPTG的浓度为0-1mM，所述香草酸的浓度为0-100μM，所述四环素的浓度为0-100μM，所述阿拉伯糖的浓度为0.5-2％(w/v)。

根据本发明的实施例，所述培养处理的条件为在摇床中培养12～18h。

根据本发明的实施例，所述培养处理的温度为37℃。

根据本发明的实施例，所述培养处理后，进一步包括将接培养处理产物进行离心处理，以及对离心处理产物进行测序处理，以便获得改造后的目的蛋白的核苷酸序列。根据本发明的实施例，经过培养处理后，将产物进行离心处理，离心是一种分离和沉淀悬浮物的常用方法，可以将细胞或细胞碎片与培养介质分离开来，通过离心处理，可以分离目的蛋白或与其相关的组分；对离心处理后的产物进行测序处理，测序是一种分析DNA或RNA序列的方法，可以确定蛋白质的基因序列，在本发明的实施例中，测序处理用于确定改造后的目的蛋白的序列，以验证蛋白质是否经过了预期的改造。根据本发明实施例的方法，能够进一步以高效率、低成本、多捕获中间突变体的方式对待进化蛋白进行全面的定向改造。

本发明的序列如下表所示

序列表

下面将结合实施例对本发明的方案进行解释。本领域本领域的技术人员将会理解，下面的实施例仅用于说明本发明，而不应视为限定本发明的范围。实施例中未注明具体技术或条件的，按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。

实施例1：

本实施例通过构建如图4所示的EvoScan系统对EGFP纳米抗体突变体进行定向进化。

具体实验流程流程如下：

(1)构建噬菌体基因组载体、1号第二载体、第三载体。

噬菌体基因组载体(简称SP质粒)的构建：基于已有的M13噬菌体基因组骨架，在gIII启动子之后插入强度合适的核糖体结合序列(Ribosome binding site,RBS)以及与EGFP相互作用连有cIp22的纳米抗体，随后，将EGFP纳米抗体上互补性决定区域3(Complementarity Determining Region 3，CDR3)上103位的谷氨酸突变成赖氨酸来破坏其与EGFP的相互作用；1号第二载体(第二载体简称AP质粒，AP质粒的载体为p15A)的构建：发明人首先设计了4个不同的gRNA(核苷酸序列如SEQ ID NO:51～SEQ ID NO:54所示)对应三个E103K突变体的CDR区域(CDR1-CDR3)，以及一个脱靶gRNA，来对E103K突变体进行四个不同的进化，并将荧光蛋白EGFP连接到cI434上，构建到4个1号第二载体中，AP质粒分别从5'端到3'端依次为p15A启动子、gRNA1～4、pTac启动子、cI434-EGFP融合表达产物、p434启动子、p434操作子、PhlF抑制子、pPhlF启动子、gIII释放元件、p15A启动子、lacI抑制子，4个1号第二载体的核苷酸序列分别如SEQ ID NO:2～SEQ ID NO:5所示；第三载体(简称TP质粒，TP质粒的载体为CoIE1)的构建：在ColE1复制起始位点的质粒上插入壮观霉素抗性，并加上pVanA-VanR系统以诱导表达具备一定毒性的enCas9-PolIM5蛋白复合体，保证其在未被噬菌体侵染的时间里能够尽可能减少对宿主细胞的毒害作用，同时又能够在进化系统工作时高效表达突变体系。

(2)构建受体菌及载体噬菌体。

对于受体菌，发明人利用Inoue法制备S2060超级化学感受态细胞，并将上述构建好的AP与TP质粒分别转化其中得到不同的受体菌S2060-AP，TP。

对于载体噬菌体，发明人首先将噬菌体基因组骨架通过PCR的方式得到双链片段，再将RBS和EGFP纳米抗体E103K突变体连接起来组成完整的环形双链DNA。

制备S2208(S2060+pJC175e)化学感受态细胞，并将构建好的片段转化入其中，pJC175e上有噬菌体侵染激活的启动子，可以启动下游的gIII表达，噬菌体其他的蛋白都由转化进入的骨架提供，这样就可以在噬菌体基因组上没有gIII的情况下产生新的噬菌体。噬菌体会通过离心收集上清液的方式收集，并且通过0.22微米的细菌滤器来过滤掉上清液中的S2208细胞。

(3)对于具备进化潜力的区域进行搜索。

针对每一种S2060-AP，TP，发明人均进行噬菌体非连续进化。一次传代遵循以下步骤：首先将过夜培养的饱和受体菌，转接培养到快速增殖期(log phase)，加入浓度为5×10⁷p.f.u./mL的SP，以及50μM的香草酸来诱导TP上负责突变的蛋白复合体的表达，进而让加入的SP发生突变。并添加1mM IPTG控制靶点蛋白的表达量进而控制gIII的表达，帮助M13噬菌体的增殖过程。整个体系在37℃的摇床中过夜培养不低于16h，次日将体系进行离心取上清，作为下一批传代的噬菌体。对于得到的噬菌体，利用PCR的方法得到待进化基因的序列片段，利用噬菌斑实验(plaque assay)可以对现有的噬菌体体系进行浓度测定，通过Sanger测序获得EvoScan系统进化EGFP纳米抗体E103K突变体的测序结果。

结果如图5所示，在两代传代后，只有CDR3对应的组别gRNA3有了噬菌体效价的提升，而其他三组直到第四次传代都在持续下降。对于本实施例的四组噬菌体进行测序后可以发现，gRNA3靶向的组别发生了突变，103位的赖氨酸回复突变成为谷氨酸，这说明了本实施例构建的EvoScan系统具备定向进化EGFP纳米抗体E103K突变体的能力。

实施例2：

本实施例通过采用实施例1中的方法构建如图6所示的EvoScan系统对M^pro进行系统性的突变。其中，与实施例1不同的实验流程如下：

构建噬菌体基因组载体、2号第二载体

噬菌体基因组载体(简称SP质粒)的构建：基于已有的M13噬菌体基因组骨架，在gIII启动子之后插入强度合适的核糖体结合序列(Ribosome binding site,RBS)以及M^pro；2号第二载体(第二载体简称AP质粒，AP质粒的载体为p15A)的构建：发明人设计了32个不同的gRNA(核苷酸序列如SEQ ID NO:55～SEQ ID NO:86所示)来覆盖整个M^pro基因，构建32个2号第二载体，AP质粒分别从5'端到3'端依次为p15A启动子、gRNA5～36、pTac启动子、cIp22-cI434融合表达产物、p434启动子、p434操作子、gIII释放元件、p15A启动子、lacI抑制子，32个2号第二载体的核苷酸序列分别如SEQ ID NO:6～SEQ ID NO:37所示；

经过八次传代，发明人将得到的噬菌体进行测序。结果如图7所示，产生的突变分布在整个基因上，其中一些突变如F140L、E166V、S144A等突变已被公开，一定程度上证明了本实施例构建的系统的可靠性。其中，很多突变位点尚未被公开，如S62、L75、N119、S144、T169、A191、P241、以及G302等，说明EvoScan系统可以比较全面地进化得到新的突变体。

实施例3：

本实施例通过采用实施例1中的方法构建如图8所示的EvoScan系统对AmeR进行定向进化。其中，与实施例1不同的实验流程如下：

构建噬菌体基因组载体、3号第二载体

噬菌体基因组载体(简称SP质粒)的构建：基于已有的M13噬菌体基因组骨架，在gIII启动子之后插入强度合适的核糖体结合序列(Ribosome binding site,RBS)以及AmeR；3号第二载体(第二载体简称AP质粒，AP质粒的载体为p15A)的构建：发明人设计了13个不同的gRNA(SEQ ID NO:87～SEQ ID NO:99)来覆盖整个AmeR基因，构建13个2号第二载体，AP质粒分别从5'端到3'端依次为p15A启动子、gRNA37～49、pAmeR启动子、PhlF抑制子、pPhlF启动子、gIII释放元件，13个3号第二载体的核苷酸序列分别如SEQ ID NO:38～SEQID NO:50所示；

结果如图7所示，经过四次传代，最终有8个组别在上清液中富集出有效突变，利用这8个组别发明人随机设计了如图9所示的8条进化路径，并且在每条路径的每一步上收集得到的突变体，最终发明人一共收集到82个突变体，涉及52种突变，39个氨基酸残基。

对于以上突变体，发明人设计了如图10所示的荧光检测体系测试突变体的抑制效果，如图10所示。可以看到绝大多数突变体相比于野生型都有抑制效果的提升，有些突变体提升效果可能达到20倍以上，这说明了EvoScan系统的有效性。

实施例4：

本实施例与实施例2基本相同，区别在于，采用实施例2中的方法中构建的如图15所示的反向双杂系统对HCV蛋白酶进行系统性的突变，检测其切割活性。其中，与实施例2不同的实验流程如下：在反向双杂系统中选择HCV蛋白酶进行流式荧光测试，进行切割活性的验证，具体构建为：由香草酸控制蛋白酶的诱导表达，由IPTG控制cI434-蛋白酶底物-cIp22复合物表达，具体实验浓度为：IPTG:100μM,香草酸：0，50，100，200μM。测试结果如图16所示，随着蛋白表达量增加，切割后荧光上升，说明其能反映蛋白酶切割活性。

对比例1：

本对比例通过参考文献Miller SM,Wang T,Liu DR.Phage-assisted continuousand non-continuous evolution.Nat Protoc.2020Dec；15(12):4101-4127中的方法构建如图11所示的噬菌体非连续进化实验(Phage-assisted non-continuous evolution,PANCE)系统对EGFP纳米抗体进行定向进化，与实施例1中的EvoScan系统相比，两套系统的区别在于靶向的TP与非靶向的MP6突变质粒不同，具体在于TP质粒核心表达复合蛋白enCas9-PolIM5中Cas9的部分功能实现需要gRNA引导靶向到特定区域，再通过错配率高的DNA聚合酶引入突变；而MP6突变质粒系统不具备这套CRISPR-cas系统，其引入突变的方式在于利用脱氨基等方式引入直接碱基突变，并影响进化系统内错配修复的准确率的方式(MP6的具体结构如图14所示)，因此本对比例中的AP质粒中无需插入gRNA，本对比例的AP质粒从5'端到3'端依次为pTac启动子、cI434-EGFP融合表达产物、p434启动子、p434操作子、PhlF抑制子、pPhlF启动子、gIII释放元件、p15A启动子、lacI抑制子，利用PANCE系统对EGFPE103K突变体进行定向进化。

结果如图11所示，经过8次PANCE传代，以及对于传代产物的测序，发明人发现纳米抗体上没有引入新的突变，反而是五代传递之后，cIp22上出现了N29D突变，经验证这一突变会使得两个cI抑制元件发生自结合，而不需要它们连接的蛋白发生相互作用。这说明对于靶向位点，实施例1中构建的蛋白定向进化系统(EvoScan系统)的TP相比于本对比例1中构建的PANCE系统的MP6突变效率更高。

对比例2：

与对比例1相同，本对比例通过对比例1中的方法构建PANCE系统针对M^pro进行系统性的突变，与实施例2中的EvoScan系统相比，两套系统的区别在于靶向的TP与非靶向的MP6突变质粒不同，因此本对比例中的AP质粒中无需插入gRNA，参照对比例1中的方法，利用PANCE系统对M^pro突变体进行定向进化。其中，与对比例1不同的实验流程如下：AP质粒分别从5'端到3'端依次为pTac启动子、cIp22-cI434融合表达产物、p434启动子、p434操作子、gIII噬菌体定向筛选元件、p15A启动子、lacI抑制子。

结果如图12所示，PANCE系统针对M^pro进行系统性的突变在经过36次传代后依然无法富集出有效的突变，而在经历96次传代后，4个组别分别富集出具有较高逃逸效应的突变体，其中包含实施例2中的EvoScan系统仅经过8次传代就得到的N119D与A191V，这些结果证明了实施例2构建的EvoScan系统比对比例2构建的PANCE系统更高效

对比例3：

与对比例1相同，本对比例通过对比例1中的方法构建如图13所示的PANCE系统针对AmeR进行定向进化。与实施例3中的EvoScan系统相比，两套系统的区别在于靶向的TP与非靶向的MP6突变质粒不同，因此本对比例中的AP质粒中无需插入gRNA，参照对比例1中的方法，利用PANCE系统对AmeR进行定向进化。其中，与对比例1不同的实验流程如下：AP质粒分别从5'端到3'端依次为pAmeR启动子、PhlF抑制子、pPhlF启动子、gIII释放元件。

结果如图13所示，经过多次传代后PANCE系统仅得到S57R与R43S两个突变，相比实施例3中4次传代得到8个显著突变的EvoScan系统来说，本对比例构建的PANCE系统的进化效率较低。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通本领域的技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种分区域蛋白定向进化系统，其特征在于，包括：

待定向进化元件，基因靶向突变元件以及噬菌体定向筛选元件，

其中，所述待定向进化元件设置于噬菌体基因组载体上，所述噬菌体基因组载体的噬菌体定向筛选元件缺失；

所述噬菌体定向筛选元件设置于第二载体上，所述第二载体适于在细菌或真菌中表达；

所述基因靶向突变元件包括基因定向进化工具和基因靶向指示元件，所述基因定向进化工具和所述基因靶向指示元件设置于同一或不同载体上，优选为设置于不同载体上；

所述基因定向进化工具的表达产物适于对待定向进化元件进行基于分区域的定向进化处理，所述基因定向进化工具设置于第三载体上，所述第三载体适于在细菌或真菌中表达；

所述基因靶向指示元件设置于所述第二载体上；

所述待定向进化元件的表达产物调控所述噬菌体定向筛选元件的表达，所述待定向进化元件的表达产物的活性与所述噬菌体定向筛选元件的表达呈正相关；

任选地，分区域蛋白定向进化系统包括蛋白-蛋白定向进化系统、蛋白-小分子定向进化系统和蛋白-核酸定向进化系统；

任选地，所述第二载体包括1号第二载体、2号第二载体和3号第二载体。

2.根据权利要求1所述的分区域蛋白定向进化系统，其特征在于，所述定向进化处理是通过如下方式进行：利用所述基因定向进化工具对所述待定向进化元件的基因的特定区域进行切割处理，以便将切割处理产物引入突变；

任选地，所述基因定向进化工具元件选自CRISPR-Cas-DNA聚合酶系统、ZFNs-DNA聚合酶系统和TALENs-DNA聚合酶系统中的至少之一；

任选地，所述基因靶向指示元件包括gRNA表达元件，所述gRNA具有待定向进化元件的表达产物的靶向结合活性；

任选地，所述CRISPR-Cas-DNA聚合酶系统中的CRISPR-Cas蛋白选自Cas9切口酶、enCas9、nSaCas9和改造Cas9切口酶中的至少之一；

任选地，所述CRISPR-Cas-DNA聚合酶系统中的DNA聚合酶包括易错DNA聚合酶I,优选为PolIM5聚合酶、PolIM3聚合酶和PolIM3-TBD聚合酶中的至少之一；

任选地，所述CRISPR-Cas-DNA聚合酶系统选自enCas9-PolIM5和enCas9-PolIM3-TBD中的至少之一。

3.根据权利要求2所述的分区域蛋白定向进化系统，其特征在于，所述第二载体和第三载体为同一载体或不同的载体，优选为不同的载体。

4.根据权利要求2或3所述的分区域蛋白定向进化系统，其特征在于，所述第三载体进一步包括：

第一启动子元件；以及

第一诱导元件；

其中，所述第一启动子元件、所述第一诱导元件、所述基因定向进化工具元件可操作地连接；

任选地，所述第三载体进一步包括抗性基因元件；

任选地，所述第一启动子元件选自T7启动子和J23系启动子中的至少之一；

任选地，所述第一诱导元件选自pVanA-VanR诱导元件、pBAD-araC诱导元件、pTet-tetR诱导元件和pTac-LacI诱导元件中的至少之一；

任选地，所述pVanA-VanR诱导元件包括VanR转录因子和pVanA启动子；

任选地，所述pBAD-araC诱导元件包括araC转录因子和pBAD启动子；

任选地，所述pTet-tetR诱导元件包括tetR转录因子和pTet启动子；

任选地，所述pTac-LacI诱导元件包括LacI转录因子和pTac启动子；

任选地，所述抗性基因元件选自壮观霉素抗性基因、氨苄青霉素酶基因、卡那霉素抗性基因、链霉素抗性基因和氯霉素抗性基因中的至少之一；

任选地，所述第三载体从5'端到3'端依次为第一启动子元件、转录因子、转录因子调控启动子、基因定向进化工具元件、抗性基因元件；

任选地，所述第三载体具有如SEQ ID NO:1所示的核苷酸序列。

5.根据权利要求1所述的分区域蛋白定向进化系统，其特征在于，所述噬菌体定向筛选元件包括gIII。

6.根据权利要求1所述的分区域蛋白定向进化系统，其特征在于，所述待定向进化元件的表达产物与靶点的相互作用调控蛋白-蛋白互作多聚体的生成调控所述噬菌体定向筛选元件的表达；

任选地，所述第二载体进一步包括第二诱导元件；

任选地，所述第二诱导元件包括第二启动子、第三启动子和第一抑制子，所述第二启动子启动所述第一抑制子的表达，所述第一抑制子适于抑制所述第三启动子的表达；

任选地，所述第二诱导元件设置于所述第二载体上；

任选地，所述第二启动子选自T7启动子和J23系启动子中的至少之一，所述第三启动子选自pTac，pVanR，pTet和pBAD中的至少之一，所述第一抑制子选自LacI，VanR，tetR和araC中的至少之一；

任选地，所述第一抑制子在对应诱导剂环境中适于解除对第三启动子的抑制。

7.根据权利要求6所述的分区域蛋白定向进化系统，其特征在于，所述待定向进化元件与cIp22表达元件相连，所述cIp22与所述待定向进化元件的表达产物融合表达；

cI434表达元件与编码第一靶点的元件相连，cI434表达元件与编码第一靶点的元件设置于所述第二载体上，所述cI434与所述第一靶点融合表达，所述待定向进化元件的表达产物具有结合所述第一靶点的活性；

任选地，所述第一靶点为在受体菌中可溶性表达的受体蛋白，所述待定向进化元件的表达产物包括在所述受体菌中可溶性表达的与受体蛋白相互作用的目标进化蛋白，所述目标进化蛋白包括抗体，纳米抗体，短肽，蛋白伴侣和级联转录因子中的至少之一；

任选地，所述第一靶点包括EGFP，所述待定向进化元件的表达产物包括抗EGFP的纳米抗体。

8.根据权利要求6所述的分区域蛋白定向进化系统，其特征在于，所述cIp22-cI434四聚体适于通过结合第一操作子元件抑制第四启动子的表达，所述第四启动子适于启动第二抑制子的表达，所述第二抑制子适于抑制第五启动子的表达，第五启动子适于启动所述噬菌体定向筛选元件的表达，所述第四启动子、所述第一操作子元件、所述第二抑制子、所述第五启动子和所述噬菌体定向筛选元件可操作地连接；

任选地，所述cI434与第一靶点融合表达元件、第四启动子、第一操作子元件、第二抑制子、第五启动子设置于1号第二载体上；

任选地，所述第四启动子包括p434；

任选地，所述第五启动子选自pPhlF、pQacR和pMcbR中的至少之一；

任选地，所述第一操作子元件包括p434操作子；

任选地，所述第二抑制子选自PhlF、QacR和McbR中的至少之一。

9.根据权利要求6所述的分区域蛋白定向进化系统，其特征在于，cIp22表达元件与cI434表达元件相连，所述cIp22与所述cI434融合表达，所述待定向进化元件的表达产物在小分子作用下适于切割cIp22与cI434融合表达产物；

任选地，所述cIp22与所述cI434通过连接肽相连；

任选地，所述连接肽具有待定向进化元件的表达产物的识别位点；

任选地，所述待定向进化元件的表达产物包括能在受体菌中可溶性表达的蛋白酶，优选为Mpro、TEV蛋白酶和HCV蛋白酶中的其中之一。

10.根据权利要求9所述的分区域蛋白定向进化系统，其特征在于，所述cIp22-cI434四聚体适于通过结合第二操作子元件抑制第六启动子的表达，所述第六启动子适于启动所述噬菌体定向筛选元件的表达，所述第六启动子、所述第二操作子元件和所述噬菌体定向筛选元件可操作地连接；

任选地，所述第六启动子包括p434；

任选地，所述第二操作子元件包括p434操作子；

任选地，所述cIp22与cI434融合表达元件、第六启动子、第二操作子元件设置于所述2号第二载体上。

11.根据权利要求1所述的分区域蛋白定向进化系统，其特征在于，所述3号第二载体上进一步包括第八启动子、第三抑制子、第七启动子，所述第三抑制子的表达产物适于通过抑制第七启动子的活性抑制所述噬菌体定向筛选元件的表达，所述待定向进化元件的表达产物适于抑制所述第八启动子的表达，所述第八启动子、第三抑制子、第七启动子与所述噬菌体定向筛选元件可操作地连接；

任选地，所述待定向进化元件的表达产物通过抑制第八启动子的表达活性抑制所述第三抑制子的表达；

任选地，所述第三抑制子选自PhlF、QacR和McbR中的至少之一；

任选地，所述待定向进化元件的表达产物包括与特定DNA序列结合的蛋白，优选为转录因子，更优选为AmeR和McbR中的至少之一；

任选地，所述第七启动子包括与所述第三抑制子匹配的pPhlF、pQacR和pMcbR中的至少之一；

任选地，所述第八启动子包括与待进化转录因子结合的DNA序列作为操作子的常表达启动子，优选为pAmeR；

任选地，所述第七启动子适于与所述第八启动子及其配套结合蛋白正交，所述第八启动子适于与所述第七启动子及其配套结合蛋白正交。

12.根据权利要求2所述的分区域蛋白定向进化系统，其特征在于，所述第二载体进一步包括第九启动子，所述第九启动子和所述gRNA表达元件可操作地连接。

13.根据权利要求6～8、12任一项所述的分区域蛋白定向进化系统，其特征在于，所述1号第二载体从5'端到3'端依次为第九启动子、gRNA表达元件、第三启动子、cI434与第一靶点融合表达元件、第四启动子、第一操作子元件、第二抑制子、第五启动子、噬菌体定向筛选元件、第二启动子和第一抑制子；

任选地，所述1号第二载体具有如SEQ ID NO:2～SEQ ID NO:5所示的核苷酸序列。

14.根据权利要求6、9～10、12任一项所述的分区域蛋白定向进化系统，其特征在于，所述2号第二载体从5'端到3'端依次为第九启动子、gRNA表达元件、第三启动子、cIp22与cI434融合表达元件、第六启动子、第二操作子元件、噬菌体定向筛选元件、第二启动子和第一抑制子；

任选地，所述2号第二载体具有如SEQ ID NO:6～SEQ ID NO:37所示的核苷酸序列。

15.根据权利要求11或12所述的分区域蛋白定向进化系统，其特征在于，所述3号第二载体从5'端到3'端依次为第九启动子、gRNA表达元件、第八启动子、第三抑制子、第七启动子、噬菌体定向筛选元件；

任选地，所述3号第二载体具有如SEQ ID NO:38～SEQ ID NO:50所示的核苷酸序列。

16.根据权利要求1所述的蛋白定向进化系统，其特征在于，所述第二载体与所述第三载体不同，所述第二载体选自pUC，ColE1，p15A，CloDF13，pSC101和pBR322中的至少之一；所述第三载体选自pUC，ColE1，p15A，CloDF13，pSC101和pBR322中的至少之一。

17.根据权利要求1或2所述的分区域蛋白定向进化系统，其特征在于，所述细菌或真菌包括天然宿主菌，或者经过遗传改造后的非天然宿主菌；

任选地，所述细菌为大肠杆菌；

任选地，所述大肠杆菌为S2060。

18.一种区块化定向进化目的蛋白的方法，其特征在于，利用携带所述待定向进化目的蛋白的权利要求1～17任一项所述的蛋白定向进化系统对待定向进化目的蛋白进行改造处理。

19.根据权利要求18所述的方法，其特征在于，所述改造处理是通过如下方式实现的：

将所述蛋白定向进化系统中的第二载体和第三载体转导入受体菌中；

将包括权利要求1～17任一项所述的蛋白定向进化系统中的携带噬菌体定向筛选元件的噬菌体侵染所述受体菌；以及

将经过转导和侵染的受体菌进行培养处理，以便使得所述待定向进化目的蛋白在受体菌中进行改造。

20.根据权利要求19所述的方法，其特征在于，将所述蛋白定向进化系统中的所述第二载体导入受体菌中是在第一诱导剂存在的条件下进行的；

任选地，将所述蛋白定向进化系统中的所述第三载体导入受体菌中是在第二诱导剂存在的条件下进行的；

任选地，所述第一诱导剂选自IPTG、香草酸、四环素和阿拉伯糖中的至少之一；

任选地，所述第二诱导剂选自IPTG、香草酸、四环素和阿拉伯糖中的至少之一；

任选地，所述第一诱导剂与所述第二诱导剂相同或不同，优选为所述第一诱导剂与所述第二诱导剂不同；

任选地，所述IPTG的浓度为0-1mM，所述香草酸的浓度为0-100μM，所述四环素的浓度为0-100μM，所述阿拉伯糖的浓度为0.5-2％(w/v)；

任选地，所述培养处理的条件为在摇床中培养12～18h；

任选地，所述培养处理的温度为37℃；

任选地，所述培养处理后，进一步包括将接培养处理产物进行离心处理，以及对离心处理产物进行测序处理，以便获得改造后的目的蛋白的核苷酸序列。