CN104838003A

CN104838003A - Rasamsonia转化体

Info

Publication number: CN104838003A
Application number: CN201380013996.3A
Authority: CN
Inventors: 埃里克·皮特·洛斯; 伊万内·约翰内斯·奥迪利亚·亚伦德森; 阿德里安努斯·维尔赫穆斯·赫曼努斯·沃勒布里吉特
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2012-03-12
Filing date: 2013-03-12
Publication date: 2015-08-12
Also published as: EP2825659A1; US20150020235A1; BR112014022467A2; US9631197B2; WO2013135732A1

Abstract

本发明涉及在Rasamsonia细胞的靶位点实施重组的方法，其中所述方法包括：-提供两种或多种核酸，它们总共包含：(a)能够与靶位点的侧翼序列同源重组的序列；(b)两个或多个位点特异性重组位点；(c)编码识别位点特异性重组位点的重组酶的序列；和(d)编码标记的序列，其中所述的两种或多种核酸能够相互同源重组以产生一种核酸，和其中所述的两种或多种核酸中的至少两种各包含编码无功能的部分标记的序列；和-在Rasamsonia细胞中，使所述的两种或多种核酸相互重组并与靶位点的侧翼序列重组，以在靶位点插入编码有功能标记的连续核酸序列和编码重组酶的序列，所述编码标记和/或编码重组酶的序列的侧翼是至少两个位点特异性重组位点且所述位点特异性重组位点的侧翼是能够与靶位点的侧翼序列同源重组的序列，从而在Rasamsonia细胞的靶位点实施重组。所述方法可被用于产生无标记的Rasamsonia细胞。

Description

Rasamsonia转化体

发明领域

本发明涉及在Rasamsonia细胞的靶位点实施重组的方法。本发明还涉及Rasamsonia细胞，例如通过这种方法产生的Rasamsonia细胞。本发明进一步涉及使用这种Rasamsonia细胞的工艺和产生的酶组合物。本发明进一步涉及核酸和氨基酸序列。

发明背景

碳水化合物组成地球上最丰量的有机化合物。然而，许多这类碳水化合物隐蔽在复杂聚合物中，包括淀粉(种子和谷物中的主要储存碳水化合物)和被称为木质纤维素的碳水化合物与木质素的集合。木质纤维素的主要碳水化合物组分是纤维素、半纤维素和果胶。这些复杂的聚合物通常被统称为木质纤维素。

从由于OPEC减少石油输出而导致石油危机爆发的70年代开始，可再生的木质纤维素生物质生物转化为可发酵的糖吸引了研究人员强烈的注意力，所述可发酵的糖随后被发酵以产生作为液体燃料的替代品的醇(例如乙醇)。在过去二十年间，乙醇在美国作为与汽油的10％的掺合物或在巴西作为车辆的纯燃料已被广泛使用。更近期，实现了E85(85％乙醇掺合物)的使用，特别是用于清洁城市应用。燃料生物乙醇的重要性将会随着油价的提高及油来源的逐渐耗尽而提高。另外，可发酵的糖被用于生产塑料、聚合物和其他基于生物的产品，并且预期这一工业将大幅增长，从而提高了对丰富低成本的可发酵糖的需求，所述可发酵糖可以被用作原料来代替基于石油的原料。

这类大量碳水化合物在植物生物质中的储集提供了糖(五碳糖以及六碳糖)形式的大量潜在的能量来源，所述糖能够被用于大量工业和农业过程。然而，这些碳水化合物的大量能源潜力目前利用不足，因为糖封闭在复杂聚合物中并因此不容易进行发酵。从植物生物质产生糖的方法会提供大量的、经济上有竞争性的原料，用于发酵成化学品、塑料例如琥珀酸和(生物)燃料包括乙醇、甲醇、丁醇、合成液体燃料和沼气。

无论何种纤维素原料，酶的成本和水解效率是限制生物质生物转化方法商业化的主要因素。微生物生产的酶的生产成本与产酶菌株的生产力和发酵液中最终活性产率密切相关。

尽管过去几十年为了理解酶促木质纤维素生物质降解和纤维素酶生产而进行了持续的研究，但是仍然期望发现或者改造新的有高度活性的纤维素酶和半纤维素酶。还高度期望构建能够进行迅速和有效的木质纤维素材料生物降解的高效的酶组合物。

此类酶组合物可被用来生产糖以用于发酵为化学品、塑料例如琥珀酸和(生物)燃料包括乙醇、甲醇、丁醇、合成液体燃料和沼气；用于青贮；并在其他工业方法例如食品或饲料、纺织、制浆或造纸或洗涤剂工业和其他工业中用作酶。

已知生产用于酶促木质纤维素生物质降解的合适的酶的微生物的一个属是Rasamsonia属。Rasamsonia是丝状真菌，它有时被称Talaromyces。

Jain，S.et al，Mol Gen Genet(1992)，234，489-493公开了真菌Talaromyces sp CL240的转化体系。没有公开多肽的表达。

Murray，F.R.et al，Curr Genet(1997)，32，367-375公开了来自Talaromyces flavus的葡萄糖氧化酶基因在Talaromyces macrosporus中的过表达。研究了真菌分离株对V.dahliae的生长抑制作用。

WO200170998公开了Talaromyces emersoniiβ-葡聚糖酶。在16页，其描述了β-葡聚糖酶的多核苷酸可在宿主例如酵母细胞中异源表达。

WO200224926公开了Talaromyces emersonii木聚糖酶。在24页第5段，其描述了可通过木聚糖酶DNA序列在合适的同源或异源宿主细胞中重组表达来实现多肽的生产。在第7段，其讲述了宿主细胞可过表达多肽，用于工程制造过表达的技术是从W099/32617中已知的。W099/32617涉及表达克隆，但没公开在Talaromyces宿主中的克隆。

WO2007091231公开了热稳定的并编码热稳定酶的Talaromycesemersonii菌株，还公开了由Talaromyces emersonii菌株生产的酶组合物。没有公开同源或异源多肽的重组生产。在表1中显示了诱导性碳源被以0.2-6％的量添加。Solka floc和葡萄糖(2％)被包括用于比较目的。在78页28行，其讲述了“葡萄糖未完全抑制通过T.emersonii菌株的葡糖苷外切酶生产”(表31A)。表31A示出了用葡萄糖作为碳源，IMI393751产生31.90IU的β-葡糖苷酶活性，但没有其他纤维素酶活性例如葡聚糖酶或木糖酶活性。由于缺少此类酶活性，菌株IMI393751不适于生产葡萄糖作为碳源时用于转化木质纤维素的纤维素酶。

WO2011054899公开了Talaromyces转化体和利用Talaromyces转化体生产多肽的方法。利用选择标记(例如抗腐草霉素标记)选择感兴趣的多核苷酸被引入的转化体，其中所述选择标记与感兴趣的多核苷酸被同时引入。

额外的遗传工具是必需的以更有效地利用Rasamsonia生产酶或其它工业相关产品。

发明概述

本发明涉及在Rasamsonia细胞的靶位点(例如在靶基因组内)实施重组的方法。本发明所述的重组方法导致靶位点的改变，例如在靶位点插入核酸序列。可实施所述的方法以使在靶位点插入新的序列并伴随从靶位点除去现存的序列。也就是说，所述方法可被用于将靶位点上的序列替换为替代性序列。所述方法可便于在宿主细胞体内实施。

通常，当在体内实施时，不对人类或动物细胞实施本发明所述的方法。也就是说，通常不以治疗方法的形式实施本发明所述的方法。可以离体或体外方式实施本发明所述的方法。术语离体或体外应被理解为包括对微生物(对完整活细胞或非细胞物质二者)实施的方法，但排除对人类或动物实施的方法。

通常，实施所述的方法使至少部分插入在靶位点的序列随后被移除。如果实施所述的方法以在靶位点替换序列并随后移除插入的序列，那么结果可以是使靶位点的序列缺失。

因此，可实施本发明所述的方法以改变靶位点的序列。这种改变可以是，例如添加新的序列、替换现存的序列和/或缺失/去除现存的序列。

因此，所述方法可被用于产生Rasamsonia无标记的缺失菌株。也就是说，可以用标记序列替换靶序列，然后移除标记序列。

在Rasamsonia细胞体内实施本发明。优选地，Rasamsonia细胞可产生感兴趣的化合物，例如酶，特别是一种或多种纤维素酶。

应用本发明的方法之前，Rasamsonia细胞可以能够产生感兴趣的化合物。在这种情况下，可利用本发明的方法修饰靶位点以改变宿主细胞对感兴趣的化合物的生产，例如可增加产量。或者，作为应用本发明的方法的结果，宿主细胞可产生感兴趣的化合物。

特别地，可利用所述方法产生非同源重组(NHR)/同源重组(HR)的比率降低的Rasamsonia细胞，以使所产生的细胞在靶位点靶向整合多核苷酸的效率提高。此外，可利用所述方法使编码蛋白酶pepA的基因缺失，以使所产生的细胞显示出异源基因的生产的增加。

因此，利用本发明的方法产生的Rasamsonia细胞可以不含标记、显示较高程度的HR和显示活性降低或有缺陷的蛋白酶pepA。这些细胞形成了本发明的一部分。

因此，本发明提供在Rasamsonia细胞的靶位点实施重组的方法，其中所述方法包括：

-提供两种或多种核酸，它们总共包含：(a)能够与靶位点的侧翼序列同源重组的序列；(b)两个或多个位点特异性重组位点；(c)编码识别位点特异性重组位点的重组酶的序列；和(d)编码标记的序列，

其中所述的两种或多种核酸能够相互同源重组以产生一种核酸，和

其中所述的两种或多种核酸中的至少两种各包含编码无功能的部分标记的序列；和

-在Rasamsonia细胞中，使所述的两种或多种核酸相互重组并与靶位点的侧翼序列重组，以在靶位点插入编码有功能标记的连续核酸序列和编码重组酶的序列，所述编码标记和/或编码重组酶的序列的侧翼是至少两个位点特异性重组位点且所述位点特异性重组位点的侧翼是能够与靶位点的侧翼序列同源重组的序列，

从而在Rasamsonia细胞的靶位点实施重组。

因此，所述的两种或多种核酸中的至少两种各包含编码无功能的部分标记基因的序列，即各包含重组后编码有功能标记的部分序列(其中所述部分自身不编码有功能标记)。本发明还提供：

-通过本发明的方法产生的Rasamsonia细胞；

-无标记的Rasamsonia细胞；

-Rasamsonia细胞，其是亲本Rasamsonia的变体，其中突变体中的NHR/HR的比率比在相同条件下在所述亲本细胞中测量到的所述比率低；

-Rasamsonia细胞，其中NHR/HR的比率低于约50，优选地低于约10，甚至更优选地低于约1，最优选地低于约0.001。

-Rasamsonia细胞，其基因组中具有修饰以使其在产生至少一种天冬氨酸蛋白酶pepA方面存在缺陷；

-用于生产一种或多种酶的多肽组合物的方法，其包括下述步骤：

(a)通过在合适的培养基中培养本发明所述的Rasamsonia细胞生产多肽组合物，其中所述细胞能够产生期望的多肽，例如酶，任选地其由重组核酸编码；和

(b)任选地，回收所述多肽组合物；

-用于生产包含纤维素、半纤维素和/或果胶中的一种或多种的多肽组合物的方法，其包括下述步骤：

(a)通过在合适的培养基中培养根据本发明所述的Rasamsonia细胞生产多肽组合物，其中所述细胞能够产生纤维素、半纤维素和/或果胶中的一种或多种，任选地其由重组核酸编码；和

(b)任选地，回收所述多肽组合物；

-可来源于Rasamsonia细胞、优选的是Rasamsonia emersonii细胞的核酸序列，其编码参与非同源末端连接的多肽，其中所述核酸序列是：

a.SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:47、SEQ ID NO:50或SEQ ID NO:53所示的核酸序列；或者

b.编码与SEQ ID NO SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51或SEQ ID NO:54所示的氨基酸序列有至少60％序列同一性的多肽的核酸序列；

-可来源于Rasamsonia细胞、优选的是Rasamsonia emersonii细胞的核酸序列，其编码pepA天冬氨酸蛋白酶，其中所述核酸序列是：

a.SEQ ID NO:58所示的核酸序列，或者

b.编码与SEQ ID NO SEQ ID NO:59所示的氨基酸序列有至少60％序列同一性的多肽的核酸序列；

-包含本发明所述的核酸序列的重组核酸构建体；和

-由本发明的DNA序列编码的多肽。

附图简述

图1展示了质粒pDELNicB-3的示意图，其是用于使A.niger中的nicB基因失活的替换盒的基础。替换盒包含nicB的侧翼区域、hygB标记盒、突变loxP位点和E.coli DNA。在实施例部分(参见下文)可以找到关于pDELNicB-3的更多细节。

图2展示了质粒pDEL_PdxA-2的示意图，其是用于使A.niger中的pdxA基因失活的替换盒的基础。替换盒包含pdxA的侧翼区域、ble标记盒、突变loxP位点和E.coli DNA。在实施例部分(参见下文)可以找到关于pDEL_PdxA-2的更多细节。

图3展示了质粒pDEL_EPO_Hyg-1的示意图，其包含使A.niger中的epo基因失活的替换盒的一部分。替换盒包含epo的侧翼区域、hygB标记盒的一部分、突变loxP位点和E.coli DNA。在实施例部分(参见下文)可以找到关于pDEL_EPO_Hyg-1的更多细节。

图4展示了质粒pDEL_EPO_CRE-1的示意图，其包含使A.niger.中的epo基因失活的替换盒的一部分。替换盒包含epo的侧翼区域、hygB标记盒的一部分、突变loxP位点、cre重组酶表达盒和E.coli DNA。在实施例部分(参见下文)可以找到关于pDEL_EPO_CRE-1的更多细节。

图5展示了片段产生以及A.niger中的转化和重组中这些片段的使用的示意图。顶部展示了利用PCR扩增产生“二重左”(“bipartite left“)和“二重右”(“bipartite right“)片段。底部图中展示了通过二重左片段和二重右片段在基因组内的同源重组转化A.niger。

图6展示了片段产生以及A.niger中的转化和重组中这些片段的使用的示意图(同样展示于图5)。这个特定实施例中的各二重(bipartit)片段不同，因为它们另外包含Cre重组酶盒。最后的图展示了Cre诱导的重组事件之后产生的基因组位点的布局。

图7展示了Cre诱导的侧翼为loxP的hygB选择标记的丢失。上部板是Cre未诱导的转化体。下部板是通过涂布在作为碳源的木糖上而使Cre被诱导。百分比展示了Cre诱导后，A.niger菌落中标记移除的百分比。

图8描述了用于在真菌中瞬时表达cre重组酶的pEBA513的图谱。pEBA513是pAMPF21衍生的载体，其包含AMA1区域和CAT氯霉素抗性基因。显示的是cre重组酶基因(cre)表达盒，其包含A.niger glaA启动子(Pgla)、cre重组酶编码区和niaD终止子。此外，还展示了由A.nidulansgpdA启动子(PgpdA)、hygB编码区和P.chrysogenum penDE终止子组成的潮霉素抗性盒。

图9展示了利用PCR检测R.emersonii基因组中的pGBTOPEBA-205表达质粒。分离并利用PCR分析来自转化体A-A4(泳道2-4)和空菌株(泳道5-7)的基因组DNA。质粒DNA被用作PCR反应的对照模板：pGBTOPEBA-4(泳道8)、pGBTOPEBA-8(泳道9)和pGBTOPEBA-205(泳道10)。在PCR反应中，加入针对pGBTOPEBA-4(泳道2、5和8，预计片段：256bp)、pGBTOPEBA-8(泳道3、6和9，预计片段：306bp)和pGBTOPEBA-205(泳道4、7和10，预计片段：452bp)的引物。泳道1和11含有分子量标记。

图10展示了无标记的R.emersonii转化体的表型分析和PCR分析。用milliQ水(对照)或pEBA513构建体转化转化体A-A4以使cre重组酶瞬时表达，其中转化体A-A4含有多拷贝的R.emersonii CbhI和含有侧翼为loxP的ble表达盒的pDEL_Pdx-A2质粒。

(图10A):生长于含10μg/ml腐草霉素的PDA培养基(左侧图)和无选择的PDA(右侧图)的转化体和空菌株的MTP板的图片。行A展示了A-A4的两种milliQ对照转化体，其中A-A4包含具有侧翼为loxP的ble表达盒(lox-ble-lox)的pDEL_Pdx-A2。行B展示了pEBA513转化的两种A-A4转化体(lox-ble-lox+pEBA513)的生长。亲本转化体A-A4(lox-ble-lox，转化前)生长于行C。最后，行D展示了空菌株的生长。

(图10B):利用cre重组酶移除标记之前和之后的转化体以及cre重组酶构建体的PCR分析。泳道2和泳道3展示了通过两种milliQ对照A-A4转化体的PCR分析得到的PCR片段，其中使用针对ble表达构建体中的pdx侧翼的引物。如果转化体仍然含有ble选择标记，那么2752bp的PCR条带是预计被扩增的PCR片段。泳道5和6展示了用pEBA513转化的两种A-A4转化体的PCR分析，其中使用针对pEBA513cre重组酶表达质粒的hygB基因的引物(314bp片段)。泳道8和9展示了用pEBA513转化的两种A-A4转化体的PCR片段，其中使用针对ble表达构建体的pdx侧翼的引物。881bp的PCR片段指示来源于R.emersonii转化体的ble表达盒的缺失。泳道1、4和7含有分子量标记。

图11描述了pEBA1001载体。部分载体片段和pEBA1002载体联合用于二重基因靶向方法以使Rasamsonia emersonii中的ReKu80ORF缺失。所述载体包含2500bp5’上游侧翼区、lox66位点、由A.nidulans gpdA启动子驱动的ble编码序列的5’部分和pUC19骨架(Invitrogen，Breda，荷兰)。转化R.emersonii菌株之前，用限制性酶Notl消化除去E.coli DNA。

图12描述了pEBA1002载体。部分载体片段和pEBA1001载体联合用于二重基因靶向方法以使Rasamsonia emersonii中的ReKu80ORF缺失。所述载体包含ble编码区的3’部分、A.nidulans trpC终止子、lox71位点、ReKu80ORF的2500bp3’下游侧翼区和pUC19骨架(Invitrogen，Breda，荷兰)。转化R.emersonii菌株之前，用限制性酶Notl消化除去E.coli DNA。

图13描述了用于使R.emersonii的ReKu80基因缺失的策略。用于缺失ReKu80的载体包含侧翼为loxP位点的重叠无功能ble选择标记片段(分裂标记)和用于靶向的ReKu80基因的5’和3’同源区(1)。构建体通过在基因组ReKu80位点和在重叠的同源无功能ble选择标记片段处的三同源重组(X)进行整合(2)，并且替换基因组ReKu80基因拷贝(3)。随后，通过cre重组酶的瞬时表达导致lox66和lox71位点之间的重组移除选择标记，从而使ble基因缺失且剩余双突变的lox72位点留在基因组中(4)。使用这种总体策略，ReKu80ORF被移除出基因组。

图14展示了ReKu80敲除菌株的Southern印迹分析。从菌株中分离基因组DNA，然后用限制性酶HindIII消化。使用针对ReKu80基因的3’区的探针进行Southern印迹杂交。泳道1：野生型菌株；泳道2和3：两种腐草霉素抗性菌株显示出正确的ReKu80敲除整合的片段大小；泳道4：被标记的分子量标记；泳道5和6：带有正确的ReKu80敲除整合的片段大小的两种腐草霉素敏感菌株。

图15描述了pEBA1005载体，它和pEBA1006载体被联合用于二重基因靶向方法(bipartite gene-targeting method)以缺失Rasamsonia emersonii中的RePepA ORF。所述载体包含2500bp5’上游侧翼区、lox66位点、由A.nidulans gpdA启动子驱动的ble编码区的5’部分和pUC19骨架(Invitrogen，Breda，荷兰)。

图16描述了pEBA1006载体，它和pEBA1005载体被联合用于二重基因靶向方法以缺失Rasamsonia emersonii中的RePepA ORF。所述载体包含ble编码区的3’部分、A.nidulans trpC终止子、lox71位点、ReKu80ORF的2500bp3’侧翼区和pUC19骨架(Invitrogen，Breda，荷兰)。

图17描述了用于删除Rasamsonia emersonii中的RePepA ORF的pEBA10056载体。所述载体包含2500bp5’侧翼区，lox66位点，由A.nidulans gpdA启动子、ble编码区和A.nidulans trpC终止子组成的ble表达盒，lox71位点，ReKu80ORF的2500bp3’侧翼区和pUC19骨架(Invitrogen，Breda，荷兰)。

图18展示了补充有1％酪蛋白钠盐的PDA平板图，其具有用包含2.5kb侧翼的RePepA缺失构建体转化的TEC-142S和ΔReKu80-2菌株。

图19展示了质粒pPepAHyg的示意图，其包含使R.emersonii中的RePepA基因失活的替换盒的一部分。替换盒包含1500个核苷酸的RePepA5’侧翼区、hygB标记盒的一部分、突变的loxP位点和E.coli DNA。在实施例部分(参见下文)可以找到关于pPepAHyg的更多细节。

图20展示了质粒pPepACre的示意图，其包含使R.emersonii中的RePepA基因失活的替换盒的一部分。替换盒包含RePepA3’侧翼区、hygB标记盒的一部分、突变的loxP位点、cre重组酶表达盒和E.coli DNA。在实施例部分(参见下文)可以找到关于pPepACre的更多细节。

图21展示了用于R.emersonii中的转化和重组的片段的示意图。用于缺失RePepA的载体包含侧翼为loxP位点的重叠无功能hygB选择标记片段(分裂标记)和用于靶向的RePepA基因的5’和3’同源区(1)。构建体通过在基因组RePepA位点和在重叠的同源无功能hygB选择标记片段处的三同源重组(X)进行整合(2)，并且替换基因组RePepA基因拷贝(3)。随后，通过在木糖上培养转化体以诱导cre重组酶的表达导致lox66和lox71位点之间的重组移除选择标记，从而缺失hygB和Cre表达盒且剩余的双突变的lox72位点留在基因组中(4)。

图22展示了Rasamsonia emersonii中Cre诱导的侧翼为loxP的hygB选择标记的丢失。带有侧翼为loxP的hygB选择标记和cre重组酶表达盒被整合至PePepA位点的转化体被涂布在碳源为木糖的平板上以诱导cre重组酶。cre被诱导之后，将菌落转移至无选择的PDA(左)和潮霉素B选择的PDA(右)。空菌株作为选择对照被包括在内。

序列表说明

SEQ ID NO:1展示了突变的lox P位点，lox66。

SEQ ID NO:2展示了突变的lox P位点，lox71。

SEQ ID NO:3展示了双突变的lox72位点。

SEQ ID NO:4展示了第一无功能的hygB标记片段(缺失hygB的3’末端编码序列的最后27个碱基的PgpdA-HygB序列)。

SEQ ID NO:5展示了第二无功能的hygB片段(缺失hygB的5’末端编码序列的开始44个碱基的HygB-TtrpC序列)。

SEQ ID NO:6展示了含有A.nidulans木聚糖酶A启动子、cre重组酶和木聚糖酶A终止子的cre重组酶盒，以允许cre重组酶的木糖可诱导表达。

SEQ ID NO:7展示了Ble-正向PCR引物的DNA序列；

SEQ ID NO:8展示了Ble-反向PCR引物的DNA序列；

SEQ ID NO:9展示了EBA205-正向PCR引物的DNA序列；

SEQ ID NO:10展示了EBA205-反向PCR引物的DNA序列；

SEQ ID NO:11展示了pGBTOPEBA4-正向PCR引物的DNA序列；

SEQ ID NO:12展示了pGBTOPEBA4-反向PCR引物的DNA序列；

SEQ ID NO:13展示了pGBTOPEBA8-正向PCR引物的DNA序列；

SEQ ID NO:14展示了pGBTOPEBA8-反向PCR引物的DNA序列；

SEQ ID NO:15展示了Pdx-正向PCR引物的DNA序列；

SEQ ID NO:16展示了Pdx-反向PCR引物的DNA序列；

SEQ ID NO:17展示了Hyg-正向PCR引物的DNA序列；

SEQ ID NO:18展示了Hyg-反向PCR引物的DNA序列；

SEQ ID NO:19展示了ReKu70基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:20展示了ReKu70cDNA的核酸序列；

SEQ ID NO:21展示了ReKu70多肽的氨基酸序列；

SEQ ID NO:22展示了ReKu80基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:23展示了ReKu80cDNA的核酸序列；

SEQ ID NO:24展示了ReKu80多肽的氨基酸序列；

SEQ ID NO:25展示了ReRad50基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:26展示了ReRad50cDNA的核酸序列；

SEQ ID NO:27展示了ReRad50多肽的氨基酸序列；

SEQ ID NO:28展示了ReRad51基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:29展示了ReRad51cDNA的核酸序列；

SEQ ID NO:30展示了ReRad51多肽的氨基酸序列；

SEQ ID NO:31展示了ReRad52基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:32展示了ReRad52cDNA的核酸序列；

SEQ ID NO:33展示了ReRad52多肽的氨基酸序列；

SEQ ID NO:34展示了ReRad54a基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:35展示了ReRad54a cDNA的核酸序列；

SEQ ID NO:36展示了ReRad54a多肽的氨基酸序列；

SEQ ID NO:37展示了ReRad54b基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:38展示了ReRad54bcDNA的核酸序列；

SEQ ID NO:39展示了ReRad54b多肽的氨基酸序列；

SEQ ID NO:40展示了ReRad55基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:41展示了ReRad55cDNA的核酸序列；

SEQ ID NO:42展示了ReRad55多肽的氨基酸序列；

SEQ ID NO:43展示了ReRad57基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:44展示了ReRad57cDNA的核酸序列；

SEQ ID NO:45展示了ReRad57多肽的氨基酸序列；

SEQ ID NO:46展示了ReCDC2基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:47展示了ReCDC2cDNA的核酸序列；

SEQ ID NO:48展示了ReCDC2多肽的氨基酸序列；

SEQ ID NO:49展示了ReLIG4基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:50展示了ReLIG4cDNA的核酸序列；

SEQ ID NO:51展示了ReLIG4多肽的氨基酸序列；

SEQ ID NO:52展示了ReMRE11基因组区的核酸序列(包含侧翼序列)；

SEQ ID NO:53展示了ReMRE11cDNA的核酸序列；

SEQ ID NO:54展示了ReMRE11多肽的氨基酸序列；

SEQ ID NO:55展示了Ku80-正向PCR引物的DNA序列；

SEQ ID NO:56展示了Ku80-反向PCR引物的DNA序列；

SEQ ID NO:57展示了Rasamsonia emersonii pepA基因组区和侧翼的核酸序列。

SEQ ID NO:58展示了Rasamsonia emersonii pepA cDNA的核酸序列。

SEQ ID NO:59展示了Rasamsonia emersonii pepA多肽的氨基酸序列。

SEQ ID NO:60展示了第一无功能的ble标记片段(缺失ble的3’末端编码序列的最后104个碱基的PgpdA-ble序列)。

SEQ ID NO:61展示了第二无功能的ble片段(缺失ble的5’末端编码序列的开始12个碱基的ble-TtrpC序列)。

发明详述

在本说明书和所附权利要求书通篇中，词语“包括”、“包含”和“具有”应被解释为开放性的。也就是说，在上下文允许时，这些词语旨在表达可能包括未明确指出的其他要素或成分。

不使用数量词时表示一个或多于一个(即一个或至少一个)的客体。例如，“要素”可表示一个要素或多于一个要素。

根据本发明所述的方法被用于在靶位点实施重组。重组指的是核酸的分子被打断然后被连上不同核酸分子的过程。本发明的重组过程通常涉及人工有目的地重组不同核酸分子(其可来自于相同或不同生物体)以创造重组的核酸。

术语“重组”的意思是，例如核酸序列是通过人工组合两种否则分开的序列区段得到的，例如通过化学合成或通过用基因工程技术处理分离的核酸。

本发明所述的方法依赖于同源重组和位点特异性重组的结合。

“同源重组”指的是具有包含相似核苷酸序列的对应位点的核苷酸序列(即同源序列)之间的反应，通过所述反应分子能够相互作用(重组)以形成新的、重组的核酸序列。相似核苷酸序列的位点在本文中被分别称为“同源序列”。通常，同源重组的频率随着同源序列的长度的增加而增加。因此，虽然同源重组能够在不完全相同的两种核酸序列之间发生，但随着两种序列之间的差异的增加，重组频率(或效率)下降。可使用将被结合的两种分子的每一种上的一种同源序列以实现重组，从而产生“单交换”的重组产物。或者，两种同源序列可被放置将被重组的两种分子的每一种上。供体上的两种同源序列和靶标上的两种同源序列之间的重组产生了“双交换”的重组产物。

如果供体分子上的同源序列的侧翼是将被操作的序列(例如感兴趣的序列)，那么与靶标分子的双交换重组将产生重组的产物，其中感兴趣的序列替换本来位于靶标分子上的同源序列之间的DNA序列。

“位点特异性重组”(也被称为保守的位点特异性重组)是核酸链的交换发生在仅具有有限程度的序列同源性的区段之间的一类重组。位点特异性重组酶识别和结合短DNA序列(位点)，在此处裂解DNA骨架、交换参与的两种DNA螺旋并重新连接DNA链，从而使核酸片段重新排列。在一些位点特异性重组系统中，仅仅具有重组酶连同重组位点就足以执行所有这些反应；但在另一些系统中，可能还需要一些辅助蛋白和辅助位点。

所述方法可被用于在靶位点实施重组以导致靶位点的修饰。因此，本发明可被用于添加、缺失或以另外的方式改变靶位点。靶位点可以是编码序列或非编码序列。可利用本发明所述的方法以使这种编码或非编码序列可被破坏和/或部分或完全缺失和/或替换。因此，本发明所述的方法可被用于替换靶位点的序列，例如用编码标记的序列。

在Rasamsonia细胞体内实施本发明。优选地，Rasamsonia细胞可产生感兴趣的化合物。应用本发明所述的方法之前，所述细胞可以能够产生感兴趣的化合物。在这种情况下，本发明所述的方法可被用于修饰靶位点以使所述细胞的感兴趣的化合物的产生改变，例如增加产量。或者，作为应用本发明所述的方法的结果，Rasamsonia细胞可产生感兴趣的化合物。

因此，本发明可被用于，例如最优化细胞的生产力和/或使用它们的工艺。或者，本发明可被用以，例如引入新的核酸以使宿主细胞能够产生感兴趣的新化合物。本发明可被连续使用以引入多个新的核酸序列至宿主细胞，从而引入全新的通路或代谢通路。

靶位点可以是待修饰的任何核酸序列。通常，靶位点可以是基因组(生物体的完整遗传物质)内的序列，例如染色体上的位点。这种染色体可以是线型或环形的染色体。然而，靶位点可以在染色体外，例如质粒、微型染色体或人工染色体上的位点。靶位点可以位于质粒、噬菌体或任何其它能够在体外或在Rasamsonia细胞中复制或者被复制的核酸序列。

本发明所述的方法包括：

-在Rasamsonia细胞中，使所述的两种或多种核酸相互重组并与靶位点的侧翼序列重组，以在靶位点插入编码有功能标记的连续核酸序列和编码重组酶的序列，所述编码标记和/或编码重组酶的序列的侧翼是至少两个位点特异性重组位点且所述位点特异性重组位点的侧翼是能够与靶位点的侧翼序列同源重组的序列。

本发明中，两种或多种核酸中的至少两种各包含编码无功能的部分标记的序列。也就是说，编码标记的序列在两种或多种核酸中的至少两种之间分开。因此，该方法可被称为分开标记法(split-marker approach)。

可以在体内实施位点特异性重组位点之间的核酸序列(例如标记)的外重组。

本发明所述的方法中，在体内实施核酸之间的相互重组以及与靶位点的重组。

本发明所述的方法中，提供两种或多种核酸。所述的两种或多种核酸总共提供：(a)能够与靶位点的侧翼序列同源重组的序列；(b)两个或多个位点特异性重组位点；(c)编码识别位点特异性重组位点的重组酶的序列；和(d)编码标记的序列。

这并不意味着两种或多种核酸中的每一种都包含(a)、(b)、(c)和(d)中所描述的序列。而是，两种或多种核酸被总合在一起成为小组时，这些核酸必须包含(a)、(b)、(c)和(d)中所描述的序列。因此，一种核酸可包含(a)、(b)、(c)和(d)中所描述的一种或多种序列，第二种核酸可包含(a)、(b)、(c)和(d)中所描述的其它序列。通常，两种或多种核酸中的每一种都将包含(a)、(b)、(c)和(d)中所描述的至少一种序列。然而，也可以提供不包含(a)、(b)、(c)或(d)中所描述的至少一种序列的额外核酸。

图6展示了所述方法的一种方式，其中使用两种核酸，但技术人员将很容易想到更多的方式。所述方法中使用的核酸的数目可以是2、3、4、5、6或更多。

通常，编码标记的序列在两种核酸序列之间分开(这两种核酸序列中的每一种都编码无功能的部分标记，但当二者被重组时将编码有功能标记)。然而，编码标记的序列可被分开为3种、4种或多种核酸序列。

当编码标记的序列在两种核酸序列之间分开时，通常这两种序列中的每一种都还可以包含位点特异性重组位点。图6中展示了这种方法。或者，位点特异性重组位点可由能够与包含编码标记的序列的核酸序列重组的额外核酸序列提供。在本发明所述的方法中，两种或多种核酸能够相互同源重组以产生一种核酸。由于能够与靶位点的侧翼序列同源重组的序列的存在，核酸在靶位点被合并成为一种连续序列。此外，两种或多种核酸中的至少两种各包含编码无功能的部分标记的序列。

因此，在本发明的方法中，两种或多种核酸相互重组并与靶位点的侧翼序列重组。以这种方式，编码有功能标记的连续核酸序列可与编码重组酶的序列和至少两个位点特异性重组位点一起被插入至靶位点。这种编码有功能标记的序列通常被插入在靶位点以使其侧翼是至少两个位点特异性重组位点。当重组酶表达时，位于位点特异性重组位点之间的序列可被外重组(out-recombined)。如果编码标记和/或编码重组酶的序列位于位点特异性重组位点之间，那么它/它们将被外重组。然而，如果编码标记和/或编码重组酶的序列位于位点特异性重组位点之外，那么其将被保留在靶位点。

当重组发生后，位点特异性重组位点、标记和重组酶序列的侧翼将会是能够与靶位点的侧翼序列同源重组的序列。

还可以通过单独加入重组酶实施本发明所述的方法，使用例如质粒(包含编码重组酶的序列)，或者通过使用直接加入的重组酶蛋白。

可实施本发明所述的方法以同时靶向多于1个(例如2、3、4、5或更多个)靶位点。以这种方式，所述的两种或多种核酸总共包含能够与两个或多个靶位点的侧翼序列同源重组的序列。以这种方式，所述的两种或多种核酸相互重组并与靶位点的侧翼序列重组，从而导致每个靶位点至少插入两个位点特异性重组位点。所提供的两种或多种核酸使得编码有功能重组酶的核酸序列被插入在至少一个靶位点，任选地，所述靶位点位于至少两个位点特异性重组位点之间。其它靶位点不必须地包含编码有功能重组酶的序列，但每个靶位点将包含至少两个位点特异性重组位点(可被重组酶靶向)。至少提供两种各包含编码无功能标记的序列的核酸。因此，一种或多种编码有功能标记的序列可被插入在一个或多个靶位点。但也可实施本发明所述的方法以在所有或一些靶位点插入编码有功能标记的序列。

再次，在每个靶位点，所述的位点特异性重组位点以及任何编码标记和编码重组酶的序列的侧翼都将是能够与靶位点的侧翼序列同源重组的序列。

本发明的方法中，所述的两种或多种核酸能够相互重组以产生一种核酸。由于能够与靶位点的侧翼序列同源重组的序列的存在，核酸在靶位点被合并成为一种连续的序列。

更详细地，本发明所提供的两种或多种核酸总共包含能够同源重组针对靶位点的两个或多个同源重组位点的序列。通常当所述方法靶向单一的靶位点时，所述的两种或多种核酸将提供两种这样的序列。这些序列被提供以使包含至少两种或多种核酸的连续核酸序列(当被相互重组时)通过与靶序列侧翼的基本同源的序列重组而被插入在靶位点。

为了通过双交换事件实现同源重组，需要这些侧翼序列出现在通过所述的两种或多种核酸的重组得到的连续序列的两侧/端且与靶位点两侧的序列基本同源，这对技术人员而言是显而易见的，因此，能够同源重组的序列通常被提供以使它们位于通过所述的两种或多种核酸的重组得到的核酸序列的“5”和“3”末端。

此外，根据本发明所提供的至少两种核酸能够相互重组。因此，核酸的末端被方便地设计以使相互重组能够发生且核酸将以期望的方向和顺序被组装。因此，所提供的核酸的末端序列将与想要与之重组的核酸的末端序列基本同源。

本发明所使用的术语“基本同源”的意思是：第一个核酸序列与想要与之重组的第二个核酸序列在不多于约3kb，优选地不多于约2kb，更优选地不多于约1kb，甚至更优选地不多于约0.5kb，甚至更优选地不多于约0.2kb，甚至更优选地不多于约0.1kb，如不多于约0.05kb，例如不多于约0.03kb的区域中的同一性程度为至少约70％，至少约80％，优选地至少约90％，至少95％，至少98％，至少99％，最优选地100％。在丝状真菌中，最佳大小可从约500bp至约2.5kb。因此，所需的同一性程度可取决于基本同源序列的长度。同源序列越短，同源性百分比可越高。

在本发明中，所述的两种或多种核酸总共包含两个或多个位点特异性重组位点。这些位点特异性重组位点被由两种或多种核酸总共编码的重组酶识别。

所述的位点特异性重组位点和重组酶被选择以使重组酶可以靶向位点特异性重组位点，从而导致位于重组位点之间的序列被外重组(out-recombination)。

术语“重组酶”或“位点特异性重组酶”或其类似物指的是识别和结合至短核酸位点或“位点特异性重组位点”(即重组酶识别位点)并催化与这些位点相关的核酸重组的酶或重组酶。这些酶包括重组酶、转座酶和整合酶。

“位点特异性重组位点”或其类似物指的是短核酸位点或序列(即重组酶识别位点)，其被序列或位点特异性重组酶识别并在位点特异性重组事件过程中变成交换(crossover)区域。序列特异性重组酶靶位点的实例包括但不限于lox位点、att位点、dif位点和frt位点。

本文中使用的术语“lox位点”指的是一种核酸序列，其中噬菌体P1的cre基因的产物(即Cre重组酶)能够在该序列上催化位点特异性重组事件。本领域已知的多种lox位点，包括天然存在的loxP、loxB、loxL和loxR以及大量突变的或变体lox位点，例如lox66、lox71、loxP511、loxP514、loxΔ86、loxΔ117、loxC2、loxP2、loxP3和lox P23。

本文中使用的术语“frt位点”指的是一种核酸序列，其中酵母2微米质粒的FLP基因的产物(即FLP重组酶)能够在该序列上催化位点特异性重组。

位点特异性重组位点可使重组酶表达后的外重组在靶位点产生不被重组酶识别的单个突变位点特异性重组位点。特别地，所述lox位点可以是lox66和lox71(Albert，H.，Dale，E.C.，Lee，E.，&Ow，D.W.(1995)).Site-specific integration of DNA into wild-type and mutant loxsites placed in the plant genome.Plant Journal，7(4)，649-659)。在一个具体的实施方式中，lox66和lox71位点特异性重组位点可使重组酶表达后的外重组在靶位点产生不被重组酶识别的lox72突变位点特异性重组位点。

本发明所实施的方法中，除了重组酶、位点特异性重组位点和能够与靶位点的侧翼序列同源重组的序列之外，两种或多种核酸总共还包含编码标记的序列以使所述的两种或多种核酸的重组导致所述的编码标记基因的序列被插入在靶位点。这种编码标记的序列可位于至少两种能够与靶位点的侧翼序列同源重组的序列之间。

关键地，两种或多种核酸被提供以使至少两种核酸各包含编码无功能的部分标记编码序列的序列。当所述的两种或多种核酸被重组时，将产生编码有功能标记的连续序列。因此，本发明的方法被称为“分开标记”法。

在本发明的上下文中，无功能指的是无法编码能够担当有功能选择标记的产物的序列。因此，如果可供使用的标记集合有限，则本发明特别适用。

通常，可实施所述方法以使编码标记的序列位于两个或多个位点特异性重组位点之间。以这种方式，标记基因可通过重组酶的表达被外重组。因此，所述方法可被用于显性标记和反向选择标记。

以这种方式，可以使用相同的标记以重复模式实施所述方法，其中所述重复模式具有不止一个循环的与靶位点的侧翼序列的同源重组，然后在重组酶表达后外重组。可进一步将这种方法与突变位点特异性重组位点的使用相结合，其中一旦标记被外重组，所述位点就不能被重组酶靶向。

本发明的一个优势在于：它允许同时、连续或分别实施多个重组事件。

因此，可使用相同的标记以具有不止一个重组循环的重复模式实施所述方法。因此，本发明特别适用于可供使用的标记集合有限的情况。可进一步将这种方法与突变位点特异性重组位点的使用相结合，其中一旦标记被外重组，所述位点就不能被重组酶靶向。由于标记通过重组酶的激活而被消除，因此这个方法允许靶向多个位点且被靶向的位点的数目不受不同标记的可用性的限制。

在本发明的方法中，两种或多种核酸总共可包含两种或多种不同的标记编码序列以使所述的两种或多种核酸的重组导致所述的两种或多种不同的标记基因编码序列被插入在靶位点。可提供能够与两个或多个靶位点的侧翼序列同源重组的序列以实施这种方法。进一步，可以使用一种标记靶向至少两个靶位点，使用不同的标记靶向一个或多个其它靶位点。

在本发明的方法中，编码标记的序列之一将是分开的。在本发明的另一个优选的实施方式中，两种或更多种或甚至所有的编码标记的序列通常都将是分开的。也就是说，对于每一个标记，两种或多种核酸被提供以使至少两种核酸各包含编码无功能的部分标记编码序列的序列。所述的两种或多种核酸的重组产生编码有功能标记的连续序列。本发明所述的方法可包括至少一种分开的标记。通常，所用的所有编码标记的序列都以分开的形式被提供。

可实施所述的方法以使一种或多种相同的或不同的标记被重组至细胞，其中每个标记的侧翼均为lox位点。然后，本发明所述的方法可被用于提供进一步的重组事件，同时除去所有这些标记。

在本发明所述的方法中，靶位点包含被破坏和/或部分或全部缺失的编码序列。通常，所述方法在靶位点增加新序列；这种新序列通常将替换、缺失和/或修饰靶位点的序列。

如上所述，当在宿主细胞体内实施重组时，替换序列可以例如赋予可选择的表型。在这种情况下，所述替换序列包含选择标记。优选地，实施这种方法以使标记可通过重组酶的表达被外重组。

替换序列还可以是靶序列的经修饰形式，例如以改变对感兴趣的序列的调控或表达与原始基因产物相比性质改变的经修饰的基因产物。

替换序列还可以组成已存在于宿主细胞基因组中的感兴趣的序列的额外拷贝，以扩增所述的感兴趣的序列。

替换序列可以相对于宿主细胞是同源的或异源的序列。其可以从任何合适的来源获得或者可通过订制合成制备。

靶序列可以是任何感兴趣的序列。例如，靶序列可以是利用失活或修饰该序列而被研究其功能的序列。靶序列还可以是这样的序列，其失活、修饰或过表达是期望的以赋予宿主细胞期望的表型。通常，本发明所述的方法将导致靶位点的一些核酸序列被移除。然而，本发明所述的方法可被用于在靶位点插入序列而不从靶位点丢失任何序列。

在本公开的上下文中，术语“核酸”、“核酸序列”、“多核苷酸”、“多核苷酸序列”、“核酸片断”、“分离的核酸片段”在本文中可被交换使用。

这些术语包括核苷酸序列及其类似物。核酸可以是单链或双链的DNA或RNA的聚合物，任选地，其含有合成的、非天然的或改变的核苷酸碱基。

DNA聚合物形式的核酸可包括cDNA、基因组DNA或合成DNA或其混合物中的一种或多种区段。

术语“分离的核酸”和其类似物指的是大体上不含其它核酸序列(例如但不限于其它染色体的和染色体外的DNA和/或RNA)的核酸。可从分离的核酸天然存在的宿主细胞中将其纯化。

可使用技术人员已知的常规核酸纯化方法获得分离的核酸。该术语还包括重组的核酸和化学合成的核酸。通常，可利用本领域已知的任何扩增方法(例如PCR、RT-PCR等)产生适用于本发明的两种或多种核酸中的每一种。本文中使用的术语“扩增”或“扩增反应”指的是用于增加核酸中靶序列拷贝的任何体外方法。有时候，扩增指的是靶核酸的“指数”增加。然而，本文中使用的“扩增”还可以指选择的核酸靶序列的数目线性增加，但通常不同于一次、单引物延伸步骤。

通常，两种或多种核酸被引入宿主细胞以使重组事件可发生。可使用本领域的技术人员公知的多种技术将所述的两种或多种核酸引入宿主细胞。被用于引入异源的核酸至多种生物体的方法的非限制性实例包括：转化、转染、转导、电穿孔、超声介导的转化、粒子轰击等。在某些情况下，加入载体分子能够增加通常被认为很难通过常规方法转化的细胞对DNA的摄取。技术人员易于得知转化的常规方法。

用于产生两种或多种核酸以及之后将它们引入宿主细胞的程序是本领域的技术人员公知的。(参见，例如Sambrook&Russell，MolecularCloning:A Laboratory Manual，3rd Ed.，CSHL Press，Cold SpringHarbor，NY，2001；和Ausubel et al.，Current Protocols in MolecularBiology，Wiley InterScience，NY，1995)。

此外，标准的分子生物学技术(例如DNA分离、凝胶电泳、核酸的酶促限制性修饰、Southern分析、细胞的转化等)是技术人员已知的且被例如Sambrook et al.(1989)"Molecular Cloning:a laboratory manual"，Cold Spring Harbor Laboratories，Cold Spring Harbor，New York and Inniset al.(1990)"PCR protocols，a guide to methods and applications"Academic Press，San Diego描述。

可以按照标准的PCR扩增技术，使用cDNA、mRNA或者基因组DNA作为模板和恰当的寡核苷酸引物扩增适用于本发明所述的方法的核酸。由此扩增的核酸可被克隆至恰当的载体(如果期望)和/或通过核酸序列分析被表征。

可实施本发明所述的方法以使两种或多种核酸被重组为一种核酸，之后其与靶位点重组。

可实施本发明所述的方法，其中所述的两种或多种核酸的相互重组以及与靶位点的重组同时发生。

在本发明所述的方法中，至少两种核酸中的两种可各包含编码标记的序列的一部分以使它们总共包含完整的编码标记的序列。

可实施本发明所述的方法以表达针对位点特异性重组位点的重组酶，从而使位于两个位点特异性重组位点之间的序列被外重组。

标记和重组酶的表达通常受控制序列调控，其中所述控制序列包括能够使重组酶在宿主细胞表达的启动子。也就是说，编码标记和重组酶的序列通常与启动子序列可操作地连接。

术语“可操作地连接”或其类似物在本文中被定义为下述构型：其中控制序列被放置在相对于DNA序列的编码序列的恰当位置以使控制序列指导mRNA或多肽的产生。

术语“控制序列”在本文中被定义为包括对在体外或宿主细胞中产生mRNA或多肽而言是必须的或有益的所有组分。每个控制序列相对编码多肽的核酸序列而言可以是天然或外源的。这种控制序列包括但不限于引导子(leader)、Shine-Delgarno序列、最佳的翻译起始序列(如Kozak，1991，J.Biol.Chem.266:19867-19870中所述)、聚腺苷酸化序列、原-肽序列(pro-peptide sequence)、前-原-肽序列(pre-pro-peptide sequence)、启动子、信号序列和转录终止子。控制序列至少包括启动子、转录终止信号以及翻译起始信号和翻译终止信号。可针对控制序列的特定目的而对其进行优化。本发明中使用的优选的优化控制序列是W02006/077258中描述的那些。

术语“启动子”在本文中被定义为下述DNA序列：其与RNA聚合酶结合并且将聚合酶引导至编码生物化合物的核酸序列的正确下游转录起始位点以起始转录。RNA聚合酶有效地催化与编码区的合适DNA链互补的信使RNA的组装。术语“启动子”还可被理解为包括用于在转录成mRNA之后的翻译的5’-非编码区(启动子和翻译起点之间)、顺式作用转录控制元件(如增强子)和能与转录因子相互作用的其它核苷酸序列。

因此，可通过提供位于第一核酸上的启动子和位于第二核酸上的编码序列以分开标记，从而使启动子和编码序列通过重组被可操作地连接，即重组将产生有功能的编码标记的序列。

启动子可以是适用于显示转录活性的真核或原核宿主细胞的任何适当的启动子序列，其包括突变的启动子、截短的启动子和杂合的启动子，可以从编码相对于细胞是同源的(天然的)或异源的(外源的)的胞外或胞内多肽的多核苷酸中获得启动子。启动子可以是组成型或诱导型启动子。通过诱导性启动子表达重组酶将允许位于位点特异性重组位点之间的序列的外重组被控制，例如包括编码重组酶的序列。

启动子可以是组成型或诱导型启动子。

可使用的诱导型启动子的实例是淀粉-、纤维素-、半纤维素(比如木聚糖-和/或木糖-诱导型)、铜-、油酸-诱导型启动子。启动子可选自下述组，该组包括但不限于从编码以下的多核苷酸中获得的启动子：A.oryzaeTAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸稳定的α-淀粉酶、A.niger或A.awamori葡糖淀粉酶(glaA)、A.niger或A.awamori木聚糖内切酶(xlnA)或β-木糖苷酶(xlnD)、T.reesei纤维二糖水解酶I(CBHI)、R.miehei脂肪酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶、Fusarium venenatum淀粉葡糖苷酶(W000/56900)、Fusarium venenatumDania(W000/56900)、Fusarium venenatum Quinn(W000/56900)、Fusarium oxysporum类胰蛋白酶蛋白酶(W096/00787)、Trichodermareeseiβ-葡萄糖苷酶、Trichoderma reesei纤维二糖水解酶I、Trichodermareesei纤维二糖水解酶II、Trichoderma reesei内切葡聚糖酶I、Trichodermareesei内切葡聚糖酶II、Trichoderma reesei内切葡聚糖酶III、Trichodermareesei内切葡聚糖酶IV、Trichoderma reesei内切葡聚糖酶V、Trichodermareesei木聚糖酶I、Trichoderma reesei木聚糖酶II和Trichoderma reeseiβ-木聚苷酶，和NA2_tpi启动子(来自于编码A.niger中性α-淀粉酶和A.0ryzae磷酸丙糖异构酶的多核苷酸的启动子的杂合物)及其突变的、截短的和杂合的启动子。启动子的其它实例是W02006/092396和W02005/100573中描述的启动子，其通过引用而被并入本文。使用启动子的另一实例描述于W02008/098933中。诱导型(异源的)启动子的其它实例是醇诱导型启动子alcA、使用四环素-响应启动子的tet系统、雌激素-响应启动子(Pachlinger et al.(2005)，Appl&Environmental Microbiol672-678)。

控制序列还可以包括合适的转录终止子(终止子)序列，其被丝状真菌细胞识别以终止转录。终止子序列与编码多肽的核酸序列的3’-末端可操作地连接。在细胞中有功能的任何终止子都可被用于本发明。

控制序列还可以是合适的引导序列(引导子)，其是对丝状真菌细胞的翻译很重要的mRNA的非翻译区。引导序列与编码多肽的核酸序列的5’-端可操作地连接。在细胞中有功能的任何引导序列都可被用于本发明。

取决于宿主，可以从编码A.oryzae TAKA淀粉酶、A.nidulans丙糖憐酸异构酶以及A.niger GlaA和植酸酶的多核苷酸中获得合适的引导子。

可以从Penicillium IPNS基因、pcbC基因或β微管蛋白基因中分离其它的控制序列。WOO1/21779中引用的所有的控制序列均通过引用被并入本文。

控制序列还可以是聚腺苷酸化序列，其与核酸序列的3’-末端可操作地连接，转录时，其被丝状真菌细胞识别为将聚腺苷残基添加至转录的mRNA的信号。在细胞中有功能的任何聚腺苷酸化序列都可被用于本发明。

如本文所述，在本发明所述的方法中，所述的两种或多种核酸总共包含编码标记的序列以使所述的两种或多种核酸的重组导致所述的编码标记的序列被定位于同源重组位点之间。

两种或多种核酸的重组可导致所述编码标记的序列被定位于位点特异性重组位点之间以使标记可通过重组酶的表达而被外重组。

可以使用任何合适的标记并且公知这种标记用于确定核酸是否被包括在细胞内。通常，标记(例如可选择标记)允许易于选择被转化的细胞。可选择标记是其产物提供杀虫剂或病毒抗性、重金属抗性、对营养缺陷型的原养型等的基因。

标记基因的实例包括但不限于：(1)核酸区段，其编码的产物提供对否则有毒的化合物的抗性(例如抗生素)；(2)核酸区段，其编码在受体细胞中否则缺乏的产物(例如必需产物、tRNA基因、营养缺陷型标记)；(3)核酸区段，其编码的产物抑制基因产物的活性；(4)核酸区段，其编码的产物易于被鉴定(例如表型标记(例如抗生素抗性标记(例如β-内酰胺酶))、β-半乳糖苷酶、荧光或其它有色标记(例如绿色荧光蛋白(GFP)、黄色荧光蛋白(YFP)、红色荧光蛋白(RFP)和青色荧光蛋白(CFP)和细胞表面蛋白)；(5)核酸区段，其与否则对细胞生存和/或功能有害的产物结合；(6)核酸区段，其否则抑制以上1-5中所述的任何核酸区段的活性(例如反义寡核苷酸)；(7)核酸区段，其与修饰底物的产物结合(例如限制性内切酶)；(8)核酸区段，其可被用于分离或鉴定期望的分子(例如特异性蛋白结合位点)；(9)核酸区段，其编码否则可无功能的特定核苷酸序列(例如分子亚群的PCR扩增)；(10)核酸区段，当其缺失时，将直接或间接授予对特定化合物的抗性或敏感性；(11)核酸区段，其编码在受体细胞中有毒的或将相对无毒的化合物转化为有毒的化合物的产物(例如单纯疱疹胸苷激酶、胞嘧啶脱氨酶)；(12)核酸区段，其抑制含有它们的核酸分子的复制、分离或遗传性；(13)核酸区段，其编码条件性复制功能(例如在某些宿主或宿主细胞株中或者在某些环境条件(例如温度、营养条件等)下复制)；和/或编码必需基因的核酸区段。

在Rasamsonia细胞中使用的可选择标记可选自下述组，该组包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、bleA(腐草霉素结合)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、NAT或NTC(诺尔斯菌素)和trpC(邻氨基苯甲酸合酶)以及来源于其它物种的等同物。

在本发明的方法中，在Rasamsonia细胞中实施体内重组。因此，用于本发明的细胞属于Rasamsonia(又名Talaromyces)属，更优选地宿主细胞属于Talaromyces emersonii(又名Rasamsonia emersonii)物种。当根据本发明的宿主细胞是Talaromyces emersonii(又名Rasamsonia emersonii)宿主细胞时，所述宿主细胞优选地是TEC-142S(TEC-142(CBS124.902)的单个分离株)或其衍生物。

本公开的范围包括Rasamsonia和Talaromyces细胞，例如嗜热或耐热的Talaromyces菌株，例如Talaromyces bacillisporus、Talaromycesleycettanus和Talaromyces thermophilus。

通常，用于根据本发明的方法的Rasamsonia细胞可适于生产感兴趣的化合物。特定的用途包括但不限于食物、(动物)饲料、药物、农业(例如作物保护)和/或个人护理应用。

本发明所述的方法可被用于授予Rasamsonia细胞产生感兴趣的化合物或修饰产生现存的感兴趣的化合物的途径的能力，例如增加这种感兴趣的化合物的产量。

本发明涉及通过本文所述的方法产生的Rasamsonia细胞。这种细胞通常将包含至少一个位点特异性重组酶识别位点，例如loxP位点。优选地，本发明的这种细胞将包含不能被重组酶识别的突变的loxP位点(例如lox72位点)。以这种方式，本发明的细胞可被用于在靶位点进行系列的多轮重组。因此，通过本发明的方法产生的Rasamsonia细胞可包含不止一个突变的loxP位点，例如2、3、4、5或更多个这种位点。

本发明涉及的Rasamsonia细胞是无标记的Rasamsonia细胞。通常，这种Rasamsonia细胞无标记且包含一种或多种重组基因，例如编码一种或多种纤维素酶。本发明涉及通过本发明的方法产生的Rasamsonia细胞。通常，这种细胞将是无标记的细胞且通常将是作为亲本Rasamsonia的变体的Rasamsonia细胞，其中突变体中NHR/HR的比率比在相同条件下测量到的所述亲本细胞中的所述比率低。也就是说，本发明的Rasamsonia细胞可以是突变的细胞。

真核细胞具有至少两种分别的、通过其核酸(尤其是DNA)可被整合至宿主基因组的途径(一种通过同源重组(HR)，一种通过非同源重组(NHR))。酵母Saccharomyces cerevisiae是优先同源重组(HR)的生物。这种生物中非同源重组相对于同源重组(NHR/HR)的比率可在约0.07-0.007之间变化。

WO02/052026公开了具有提高的DNA序列进入其基因组的靶向效率的S.cerevisiae的突变体。这种突变体菌株缺少参与NHR的基因(KU70)。

与S.cerevisiae相反，大部分更高等的真核生物(例如丝状真菌细胞至哺乳动物细胞)优先NHR。在丝状真菌中，NHR/HR的比率的范围在1和大于100之间。在这种生物体中，靶向整合频率相当低。

因此，为了提高多核苷酸在靶位点组装的效率，本发明涉及同源重组(HR)效率增强的Rasamsonia细胞。本发明所述的方法可被用于产生这种细胞。

因此，本发明提供了Rasamsonia细胞，例如根据本发明的重组方法产生的Rasamsonia细胞，其可以是亲本Rasamsonia的突变体，其中突变体中非同源重组/同源重组的比率比在相同条件下测量到的所述亲本细胞中的所述比率低。

因此，优选地，在根据本发明的方法中，所提供的Rasamsonia细胞的同源重组(HR)效率提高(任选地以诱导型方式)。

由于NHR和HR路径是互联的，因此可通过调控一个或两个路径增加HR效率。HR组分表达的增加将提高HR的效率并且减小NHR/HR的比率。NHR组分表达的减少也将减小NHR/HR的比率。根据本发明的载体-宿主系统的宿主细胞中的HR效率的增加优选地被描述为NHR/HR的比率减小，并且优选地相对于其中HR和/或NHR路径未被调整的亲本宿主细胞计算。HR和NHR二者的效率均可通过本领域技术人员可利用的多种方法测量。一个优选的方法包括测定单个载体构建体在亲本和经调整的宿主细胞中靶向整合和异位整合的效率。然后可计算两种细胞类型的NHR/HR的比率。随后，可计算NHR/HR的比率的减小。在W02005/095624中，描述了该优选的方法。不过技术人员可使用其它方法测定NHR/HR的比率。

可以通过提高HR路径的效率和/或通过降低NHR路径的效率修饰亲本真核细胞以获得较之亲本细胞具有降低的NHR/HR的比率的Rasamsonia细胞。优选地，NHR/HR的比率因而减小至少2倍，优选地至少4倍，更优选地至少10倍。优选地，根据本发明的载体-宿主系统的宿主细胞中的NHR/HR的比率比亲本宿主细胞降低至少5％，更优选地至少10％，甚至更优选地至少20％，甚至更优选地至少30％，甚至更优选地至少40％，甚至更优选地至少50％，甚至更优选地至少60％，甚至更优选地至少70％，甚至更优选地至少80％，甚至更优选地至少90％和最优选地至少100％。

在本发明的Rasamsonia细胞中，可通过提高HR组分的表达水平降低NHR/HR的比率。HR组分在本文被定义为：参与控制靶向整合多核苷酸进入宿主的基因组的所有基因和元件，所述多核苷酸与靶向整合的宿主基因组的某预定位点具有一定的同源性。

在本发明的Rasamsonia细胞中，可通过降低NHR组分的表达水平减小NHR/HR的比率。NHR组分在本文被定义为：参与控制多核苷酸整合进入宿主基因组的所有基因和元件，而不管所述多核苷酸与宿主基因组序列的同源性程度。NHR组分对本领域的技术人员是公知的。

优选的NHR组分是选自参与NHR路径的酵母基因在Rasamsonia细胞中的同源物或直系同源物(ortholog)的组分:KU70、KU80、RAD50、MRElU XRS2、LIG4、LIF1、NEJl和SIR4(van den Bosch et al.，2002，Biol.Chem.383:873-892和Allen et al.，2003，Mol.Cancer Res.1:913-920)。最优选的是KU70、KU80和LIG4之一以及KU70和KU80二者。可使用如本文所述的用于在靶位点实施重组的方法实现NHR组分表达水平的降低，即NHR组分可被破坏或完全缺失。

在本发明的Rasamsonia细胞中(其为亲本Rasamsonia的突变体)，突变体中的NHR/HR的比率可以比在相同条件下测量到的所述亲本细胞中所述比率低。

本发明的合适的Rasamsonia细胞可缺乏编码参与NHR的组分的基因，和/或可具有降低的参与NHR的组分水平。

这种Rasamsonia细胞可缺乏与酵母基因Ku70、Ku80、Rad50、Rad51、Rad52、Rad54、Rad55、Rad57、CDC2、LIG4或MRE11中的任何一个相对应的Rasamsonia基因的产物或者可具有降低的上述产物的活性。

本文报道了与来自S.cerevisiae的Ku70、Ku80、Rad50、Rad51、Rad52、Rad54、Rad55、Rad57、CDC2、LIG4或MRE11基因相对应的来自于Rasamsonia emersonii的基因的鉴定。因此，本发明的Rasamsonia细胞可以是这样的Rasamsonia细胞，其基因组中与SEQ ID NO SEQ IDNO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51or SEQ ID NO:54中的任何一种所示的多肽具有至少30％序列同一性的多肽的编码序列可具有修饰。

所述修饰导致Rasamsonia细胞产物的量和/或活性降低(相对于不带有修饰的亲本Rasamsonia细胞)。所述修饰可以是缺失完整的序列。

优选地，本发明的Rasamsonia细胞基因组的修饰是基因组中与SEQID NO SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51or SEQ ID NO:54中的任何一种所示的序列具有至少35％同一性，更优选地至少40％同一性，更优选地至少45％同一性，更优选地至少50％同一性，甚至更优选地至少55％同一性，甚至更优选地至少60％同一性，甚至更优选地至少65％同一性，甚至更优选地至少70％同一性，甚至更优选地至少75％同一性，甚至更优选地至少80％同一性，甚至更优选地至少85％同一性，甚至更优选地至少90％同一性，例如至少91％同一性，例如至少92％同一性，例如至少93％同一性，例如至少94％同一性，例如至少95％同一性，例如至少96％同一性，例如至少97％同一性，例如至少98％同一性，例如至少99％同一性，例如至少100％同一性的多肽的编码序列的修饰。

本发明还提供与SEQ ID NO SEQ ID NO:21、SEQ ID NO:24、SEQID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ IDNO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51或SEQ ID NO:54中的任何一种所示的多肽具有至少30％序列同一性的多肽。

这种多肽可与SEQ ID NO SEQ ID NO:21、SEQ ID NO:24、SEQ IDNO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51or SEQ ID NO:54中的任何一种所示的序列具有至少35％同一性，更优选地至少40％同一性，更优选地至少45％同一性，更优选地至少50％同一性，甚至更优选地至少55％同一性，甚至更优选地至少60％同一性，甚至更优选地至少65％同一性，甚至更优选地至少70％同一性，甚至更优选地至少75％同一性，甚至更优选地至少80％同一性，甚至更优选地至少85％同一性，甚至更优选地至少90％同一性，例如至少91％同一性，例如至少92％同一性，例如至少93％同一性，例如至少94％同一性，例如至少95％同一性，例如至少96％同一性，例如至少97％同一性，例如至少98％同一性，例如至少99％同一性，例如至少100％同一性。

本发明的Rasamsonia细胞可具有低于约50，优选地低于约10，优选地低于约9，优选地低于约1，甚至更优选地低于约1和最优选地低于约0.001的NHR/HR的比率。

因为有可能降低参与NHR的组分的表达可导致不利的表型效果，所以优选地在根据本发明的Rasamsonia细胞中，同源重组效率的提高是诱导型的。这可通过本领域技术人员已知的方法来实现，例如通过使用NHR组分的诱导型方法(例如通过将NHR组分置于诱导型启动子之后)或通过使用NHR组分的瞬时破坏或通过将编码NHR组分的基因放置回基因组。

本发明进一步提供Rasamsonia细胞，例如根据本发明的方法产生的Rasamsonia细胞，在其基因组中包含编码主要细胞外天冬氨酸蛋白酶PepA的多核苷酸的一种或多种修饰，以至于细胞具有数量/活性降低的或缺乏主要天冬氨酸蛋白酶pepA。因此，本发明提供Rasamsonia细胞，其基因组被修饰以使这种修饰产生活性降低的或缺乏编码蛋白酶PepA的基因的产物。

这种Rasamsonia细胞可包含编码与具有SEQ ID NO 59所示序列的多肽有至少30％序列同一性的蛋白酶pepA的序列的修饰。

优选地，本发明的Rasamsonia细胞基因组的修饰是基因组中编码与SEQ ID NO 59所示的多肽有至少35％同一性，更优选地至少40％同一性，更优选地至少45％同一性，更优选地至少50％同一性，甚至更优选地至少55％同一性，甚至更优选地至少60％同一性，甚至更优选地至少65％同一性，甚至更优选地至少70％同一性，甚至更优选地至少75％同一性，甚至更优选地至少80％同一性，甚至更优选地至少85％同一性，甚至更优选地至少90％同一性，例如至少91％同一性，例如至少92％同一性，例如至少93％同一性，例如至少94％同一性，例如至少95％同一性，例如至少96％同一性，例如至少97％同一性，例如至少98％同一性，例如至少99％同一性，例如至少100％同一性的蛋白酶pepA的核酸序列中的至少一种在至少一个位置的修饰。

Rasamsonia细胞，例如根据本发明的方法产生的Rasamsonia细胞，在其基因组中包含一种或多种编码主要细胞外天冬氨酸蛋白酶PepA的多核苷酸的修饰，以至于细胞具有数量/活性降低的或缺乏主要的天冬氨酸蛋白酶PepA，通常意味着这种细胞是基因工程的或经典突变的细胞，其具有通过不可逆的失活而被失活的基因。这种失活包括编码蛋白的区域的失活。Rasamsonia细胞产生主要细胞外天冬氨酸蛋白酶PepA蛋白的缺乏在本文中被定义为由于基因组的修饰而导致的细胞的下述表型特征：与其基因组未被根据本发明修饰的亲本微生物宿主细胞相比，当在基本相同的条件下分析时，a)产生较少的主要细胞外天冬氨酸蛋白酶PepA蛋白和/或b)从编码主要细胞外天冬氨酸蛋白酶PepA蛋白的基因转录的mRNA的表达水平降低和/或c)产生的主要细胞外天冬氨酸蛋白酶PepA蛋白具有降低的蛋白活性或降低的蛋白比活性和/或d)由主要细胞外天冬氨酸蛋白酶PepA蛋白产生的产物减少和这些可能性中的一种或多种的组合。

因此，可通过如下测量微生物宿主细胞的失活：测量由基因组被修饰的微生物宿主细胞产生的主要细胞外天冬氨酸蛋白酶PepA蛋白的数量和/或(比)活性，和/或测量从编码主要细胞外天冬氨酸蛋白酶PepA蛋白的基因转录的mRNA的数量，和/或测量如上所述在基因组被修饰的微生物宿主细胞中由含主要细胞外天冬氨酸蛋白酶PepA的蛋白产生的产物的数量，和/或通过基因或基因组测序测量(如果与基因组未被修饰的亲本宿主细胞相比)。可利用技术人员可用的任何试验测量主要细胞外天冬氨酸蛋白酶PepA蛋白的产生的失活，例如转录图谱、Southern印迹、Northern印迹、RT-PCR、Q-PCR、MALDI-TOF分析、LC-MS、LC/MS-MS和Western印迹。还可以通过比较经修饰的细胞的DNA序列和未经修饰的细胞的序列确定DNA序列的修饰。如Elaine R.Mardis(2008)，Next-Generation DNA Sequencing Methods，Annual Review of Genomics andHuman Genetics9:387-402中所综述的，可使用本领域技术人员已知的标准方法完成DNA测序和基因组测序，例如使用Sanger测序技术和/或新一代测序技术(例如Illumina GA2、Roche454等)。也可以通过比较经修饰细胞的RNA序列与未经修饰细胞的序列以确定RNA序列的修饰。如Pareek et al.，2011Sequencing technologies and genome sequencing，J ApplGenetics52:413–435中所综述的，可使用本领域技术人员已知的标准方法完成RNA测序，例如使用新一代测序技术(例如Illumina GA2、Roche454等)。

本发明提供来源于Rasamsonia细胞，优选地是Rasamsonia emersonii细胞的编码参与非同源末端连接的多肽的核酸序列，其中所述核酸序列是：

a.SEQ ID NO:20、SEQ ID NO:23、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:44、SEQ ID NO:47、SEQ ID NO:50或SEQ ID NO:53所示的核酸序列；或

b.编码与SEQ ID NO SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51或SEQ ID NO:54所示的氨基酸序列有至少60％序列同一性的多肽的核酸序列。

本发明还提供来源于Rasamsonia细胞，优选地是Rasamsoniaemersonii细胞的编码天冬氨酸蛋白酶PepA的核酸序列，其中所述核酸序列是：

a.SEQ ID NO:58所示的核酸序列；或

b.编码与SEQ ID NO SEQ ID NO:59所示的氨基酸序列有至少60％序列同一性的多肽的核酸序列。

在一个优选的实施方式中，本发明的多核苷酸编码参与非同源末端连接的多肽或天冬氨酸蛋白酶PepA，其与序列SEQ ID NO SEQ ID NO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:54或SEQ ID NO:59之一有至少约62％，至少约65％，至少约68％，至少约70％，至少约75％，至少约80％，至少约85％，至少约90％，更优选地至少约95％，更优选地至少约97％，更优选地至少约98％，更优选地至少约99％，最优选地至少约100％的序列同一性。由这种多核苷酸编码的多肽是本发明的一部分。

本发明还提供包含本发明的核酸序列的重组核酸构建体。进一步提供本发明的核酸编码的多肽。

本发明的Rasamsonia细胞可以能够产生期望的化合物，例如酶，任选地其可以由被引入细胞的重组核酸编码。

通常，这种Rasamsonia细胞可含有一种或多种能够表达能水解(半)纤维素的酶的基因，例如表达纤维素酶、半纤维素酶和/或果胶酶。所述的一种或多种能表达纤维素酶、半纤维素酶和/或果胶酶的核酸序列可包括纤维二糖水解酶、内切葡聚糖酶、GH61-酶和/或β-葡糖苷酶基因。合适的纤维二糖水解酶是纤维二糖水解酶I和/或纤维二糖水解酶II。因此，本发明的细胞可适用于原料水解(例如木质纤维素降解)和生物燃料(例如乙醇)的制备。

然后，本发明的Rasamsonia细胞通常将是产生感兴趣的化合物的Rasamsonia细胞。宿主细胞可在应用本发明的方法之前就能产生感兴趣的化合物。在这种情况下，本发明的方法可被用于修饰靶位点以使宿主细胞的感兴趣的化合物的产生被改变，例如产量可被增加。或者，作为应用本发明的方法的结果，宿主细胞可产生感兴趣的化合物。

因此，宿主细胞优选地包含重组的多核苷酸构建体，其包含编码参与合成感兴趣的化合物的化合物的多核苷酸。多核苷酸还可以直接编码感兴趣的化合物。编码感兴趣的化合物或者参与合成感兴趣的生物化合物的多肽的重组多核苷酸构建体可位于染色体外的载体上或宿主细胞的基因组位点。

感兴趣的化合物可以是初级代谢产物、次级代谢产物、生物聚合物(例如肽或多肽)或者可以包括包含宿主细胞自身的生物质。所述化合物可由单一的多核苷酸或组成生物合成或代谢通路的一系列多核苷酸编码，或者可以是单一多核苷酸的直接产物或者可以是一系列多核苷酸的产物。生物化合物相对于宿主细胞可以是天然的或者异源的。可根据WO2010/102982修饰生物化合物。

术语“异源的生物化合物”在本文中被定义为相对于细胞非天然的生物化合物；或天然生物化合物，其中已经进行结构修饰以改变天然生物化合物。

术语“代谢产物”包括初级和次级代谢产物；代谢产物可以是任何代谢产物。优选的代谢产物是柠檬酸，葡糖酸、丁二酸、抗生素，生物活性药物、生物燃料和生物材料构建单元。

代谢产物可以由一个或多个基因(例如在生物合成或代谢路径中)编码。初级代谢产物是细胞的初级或一般代谢的产物，其涉及能量代谢、生长和结构。次级代谢产物是次级代谢的产物(参见，例如R.B.Herbert，Biosynthesis of secondary Metabolites，Chapman and Hall，New York，1981)。

初级代谢产物可以是但不限于氨基酸、羧酸、脂肪酸、核苷、核苷酸、糖、甘油三酯或维生素。

术语“生物聚合物”在本文中被定义为相同的、类似的或不类似的亚基(单体)的链(或聚合物)。生物聚合物可以是任何生物聚合物。生物聚合物可以是例如但不限于核酸、多胺、多元醇、多肽(或聚酰胺)或多糖。

生物聚合物可以是多肽。多肽可以是具有感兴趣的生物活性的任何多肽。术语“多肽”在本文中不用于指特定长度的编码产物，因此包括肽、寡肽和蛋白质。多肽进一步包括上述多肽和杂合多肽的天然存在的等位变体和工程改造变体。多肽可以是根据W02010/102982被修饰的多肽。

根据本发明的感兴趣的多核苷酸可编码参与合成初级或次级代谢产物(例如有机酸、类胡萝卜素、抗生素、抗癌药、色素类异戊二烯、醇、脂肪酸和维生素)的酶。这些代谢产物可被认为是根据本发明的生物化合物。

感兴趣的化合物可以是选自以下的有机化合物：葡糖二酸、葡糖酸、戊二酸、己二酸、丁二酸、酒石酸、草酸、乙酸、乳酸、甲酸、苹果酸、马来酸、丙二酸、柠檬酸、富马酸、衣康酸、乙酰丙酸、木质酸、乌头酸、抗坏血酸、曲酸、香豆酸、氨基酸、多不饱和脂肪酸、乙醇、1，3-丙二醇、乙烯、甘油、木糖醇、胡萝卜素、虾青素、番茄红素和叶黄素。

或者，感兴趣的化合物可以是β-内酰胺抗生素，例如青霉素G或青霉素V和其发酵衍生物、头孢菌素、环孢素或洛伐他汀。次级代谢产物可以是抗生素、拒食素(antifeedant)、引诱剂、杀细菌剂、杀真菌剂、激素、杀虫剂或杀鼠剂。优选的抗生素是头孢菌素类和β-内酰胺类。

生物聚合物可以是多糖。多糖可以是任何多糖，其包括但不限于粘多糖(例如肝素和透明质酸)和含氮多糖(例如几丁质)。在一个更优选的选择中，多糖是透明质酸。

感兴趣的化合物可以是选自寡肽、多肽、(制药的或工业的)蛋白和酶的肽。在这些方法中，优选地由宿主细胞分泌肽，更优选地肽被分泌至培养基以使所述肽可易于通过分离宿主细胞的生物质和含有肽的培养基而被回收，例如通过离心或(超)滤。

多肽可以是具有感兴趣的生物活性的任何多肽。术语“多肽”在本文中不旨在指特定长度的编码产物，因此包括肽、寡肽和蛋白质。多肽进一步包括上述多肽和杂合多肽的天然存在的等位变体和工程变体。多肽可以是根据W02010/102982被修饰的多肽。多肽对于宿主细胞可以是天然的或异源的。多肽可以是胶原或明胶或其变体或杂合体。多肽可以是抗体或其部分、抗原、凝集因子、酶、激素或激素变体、受体或其部分、调节蛋白、结构蛋白、报告子(reporter)或转运蛋白、参与分泌过程的蛋白、参与折叠过程的蛋白、分子伴侣、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、胞内蛋白。胞内蛋白可以是酶，例如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶、非核糖体合成酶或聚酮合成酶。多肽可以是胞外分泌的酶。

可在本发明的方法中生产的具有工业应用的蛋白质或(多)肽的实例包括酶，例如脂肪酶(例如用于清洁工业)，蛋白酶(用于清洁工业、酿造等，例如蓑肽酶、内切蛋白酶、金属-蛋白酶、丝氨酸-蛋白酶)，碳水化合物酶和细胞壁降解酶(例如淀粉酶、葡糖苷酶、纤维素酶(例如内切葡聚糖酶、β-葡聚糖酶、纤维二糖水解酶、GH61酶或β-葡糖苷酶)、GH61-酶、半纤维素酶或果胶分解酶、β-1,3/4和β-1,6-葡糖聚酶、糖醛酸酶(rhamnoga-lacturonase)、甘露聚糖酶、木聚糖酶、支链淀粉酶、半乳聚糖酶、酯酶等)，用于水果加工、酿酒等(或饲料)，植酸酶、磷脂酶、天冬酰胺酶、糖苷酶(例如淀粉酶、β-葡糖苷酶、阿拉伯糖苷酶、鼠李糖苷酶、洋芹糖苷酶(apiosidases)等)、乳制品酶和产物(例如凝乳酶、酪蛋白)、氧化还原酶(例如氧化酶、转移酶或异构酶)或多肽(例如聚赖氨酸及其类似物、藻青素及其衍生物)。

具有治疗、化妆品或诊断应用的哺乳动物(优选的是人类)多肽包括但不限于胶原和明胶、胰岛素、血清白蛋白(HSA)、乳铁蛋白和免疫球蛋白，包括其片段。所述多肽可以是抗体或其部分、抗原、凝集因子、酶、激素或激素变体、受体或其部分、调节蛋白、结构蛋白、报告子(reporter)或转运蛋白、参与分泌过程的蛋白、参与折叠过程的蛋白、分子伴侣、肽氨基酸转运蛋白、糖基化因子、转录因子、合成肽或寡肽、胞内蛋白。胞内蛋白可以是酶，例如蛋白酶、神经酰胺酶、环氧化物水解酶、氨肽酶、酰基转移酶、醛缩酶、羟化酶、氨肽酶、脂肪酶。

根据本发明，多肽还可以是融合的或杂合的多肽，其中另一个多肽被融合至所述多肽或其片段的N-末端或C-末端。融合多肽是通过将编码一种多肽的核酸序列(或其一部分)融合至编码另一种多肽的核酸序列(或其一部分)产生的。

产生融合多肽的技术是本领域已知的，其包括：连接编码多肽的编码序列以使它们在框架内且融合多肽的表达受相同的启动子和终止子的控制。杂合的多肽可包含从至少两种不同的多肽获得的部分或完整多肽序列的组合，其中一种或多种相对于宿主细胞可以是异源的。

感兴趣的化合物还可以是可选择标记的产物。可选择标记是感兴趣的多核苷酸的产物，该产物提供杀虫剂或病毒抗性、重金属抗性、对营养缺陷型的原养型等。可选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、trpC(邻氨基苯甲酸合酶)、ble(腐草霉素抗性蛋白)及其等同物。

当感兴趣的生物化合物是如本文之前定义的生物聚合物时，宿主细胞可以已经能产生生物聚合物。还可以向宿主细胞提供重组的同源或异源多核苷酸构建体，其中所述构建体编码参与生产感兴趣的生物化合物的多肽。本领域技术人员知道怎样修饰微生物宿主细胞以使其能生产参与产生感兴趣的生物化合物的化合物。

术语“重组多核苷酸”在本文指的是被引入Rasamsonia细胞的单链或双链的核酸分子，例如以正常情况下不会存在的形式或位点出现在细胞中的核酸(相对于不包含重组多核苷酸的相应细胞)。

术语“重组多核苷酸构建体”在本文中指的是单链或双链的核酸分子，其分离自天然存在的基因或其已经被修饰以含有自然中不会存在的方式结合的和并置的核酸区段。当核酸构建体含有表达编码序列所需的所有控制序列时，术语重组多核苷酸构建体与术语“表达盒”同义，其中所述控制序列与所述编码序列可操作地连接。本文中描述了合适的控制序列。

本发明的Rasamsonia细胞可包含一种或多种重组多核苷酸或重组多核苷酸构建体以使感兴趣的化合物可被生产。

为了促进表达，编码参与产生感兴趣的化合物的多肽的多核苷酸可以是合成的多核苷酸。优选地，根据W02006/077258或W02008/000632中描述的方法，可对合成的多核苷酸的密码子使用进行优化。W02008/000632解决了密码对优化。密码对优化是这样的方法，其中编码多肽的核苷酸序列已经针对它们的密码子使用特别是被使用的密码对被修饰，以获得编码多肽的核苷酸序列的改进表达和/或所编码的多肽的改进生产。密码对被定义为在编码序列(CDS)中的一组两个相继的三联体(密码子)。

此外，标准分子克隆技术(例如DNA分离、凝胶电泳、核酸的酶促限制性修饰、Southern分析、细胞的转化等)是技术人员已知的并且被例如Sambrook et al.(1989)"Molecular Cloning:a laboratory manual"，ColdSpring Harbor Laboratories，Cold Spring Harbor，New York and Innis et al.(1990)"PCR protocols，a guide to methods and applications"AcademicPress，San Diego描述。

可以使用cDNA、mRNA或基因组DNA作为模板和恰当的寡核苷酸引物，根据标准PCR扩增技术扩增核酸。如此扩增的核酸可被克隆进适当的运载体并且通过DNA序列分析表征。

可使用本领域已知的程序培养根据本发明的Rasamsonia细胞(转化体)。对于启动子和宿主细胞的每一种组合，有利于编码多肽的DNA序列的表达的培养条件是可以得到的。达到期望的细胞密度或多肽效价之后，停止培养并利用已知的程序回收多肽。

发酵培养基可包括含有碳源(例如葡萄糖、麦芽糖、糖浆、淀粉、纤维素、木聚糖、果胶、木质纤维素生物质水解产物等)、氮源(例如硫酸铵、硝酸铵、氯化铵等)、有机氮源(例如酵母提取物、麦芽提取物、蛋白胨等)和无机营养源(例如磷酸盐、镁、钾、锌、铁等)的培养基。任选地，还可包括诱导物(例如纤维素、果胶、木聚糖、麦芽糖、麦芽糊精或木半乳糖醛酸聚糖)。

适当培养基的选择可基于表达宿主的选择和/或基于表达构建体的调节需要。这种培养基对本领域技术人员是已知的。如果期望，培养基可含有其它成分，所述成分相对于其它潜在的污染微生物有利于经转化的表达宿主。

发酵可进行从大约0.5到大约30天的时间。其可以是合适地在例如从大约20到大约90℃，优选地20-55℃，更优选地40-50℃的范围内的温度下和/或在例如从大约2到大约8，优选地从大约3到大约5的pH下的分批、补料分批或连续方法。适当的条件通常是基于表达宿主的选择和待表达的多肽来选择。

发酵后，必要时，可通过离心或过滤手段从发酵液中去除细胞。在发酵已停止后或细胞去除后，然后可回收本发明的多肽，如果期望，通过常规手段纯化并分离所述多肽。

为了实现本发明的目的，此处定义：为了判断两种氨基酸序列或两种核酸序列的同一性百分比，以达到最佳的比较目的比对完整的序列。为了优化两种序列之间的比对，可在任何被比较的两种序列中引入缺口。在被比较的序列的全长之上实施这种比对。同一性是报告的比对区域中两种序列之间的同一性匹配的百分比。

可使用数学算法完成两种序列之间的序列比较和同一性百分比的判断。技术人员将了解下述事实：一些不同的计算机程序可被用于比对两种不同的序列并判断两种序列之间的序列同源性(Kruskal，J.B.(1983)An overview of sequence comparison In D.Sankoff和J.B.Kruskal，(ed.)，Time warps，string edits and macromolecules:the theory andpractice of sequence comparison，pp.1-44Addison Wesley)。可使用Needleman和Wunsch算法判断两种氨基酸序列之间的同一性百分比以比对两种序列(Needleman，S.B.and Wunsch，C.D.(1970)J.Mol.Biol.48，443-453)。所述算法比对氨基酸序列以及核酸序列。Needleman-Wunsch算法已被应用于计算机程序NEEDLE。为了实现本发明的目的，使用源于EMBOSS包的NEEDLE程序(版本2.8.0或更高、EMBOSS:TheEuropean Molecular Biology Open Software Suite(2000)Rice，P.Longden，I.and Bleasby，A.Trends in Genetics 16、(6)pp276—277、http://emboss.bioinformatics.nl/)。对于蛋白序列，EBLOSUM62被用作替代矩阵。对于核苷酸序列，使用EDNAFULL。可指定其它矩阵。为了实现本发明的目的，用于比对氨基酸序列的参数是：缺口空缺罚分为10，缺口延伸罚分为0.5。技术人员将意识到：当使用不同的算法时，所有这些不同的参数将产生略微不同的结果，但两种序列总体的同一性百分比不会显著改变。

本文提到的蛋白序列可进一步被用作“查询序列”以针对数据库进行搜索，例如以鉴定其它的家族成员或相关的序列。可使用BLAST程序进行这种搜索。进行BLAST分析的软件通过国家生物技术信息中心(http://www.ncbi.nlm.nih.gov)是公开可用的。BLASTP被用于氨基酸序列，BLASTN被用于核苷酸序列。在BLAST程序中，可使用下述默认值设置：

-缺口空缺损失：默认值＝5(对核苷酸)/11(对蛋白质)

-缺口延伸损失：默认值＝2(对核苷酸)/1(对蛋白质)

-核苷酸错配罚分：默认值＝-3

-核苷酸匹配奖励：默认值＝1

-预计值：默认值＝10

-字节：默认值＝11(对核苷酸)/28(对megablast)/3(对蛋白质)

本文提到的核酸序列可被进一步用作“查询序列”以针对公共数据库进行搜索，例如以鉴定其它的家族成员或相关的序列。可使用Altschul，et al.(1990)J.Mol.Biol.215:403—10中的NBLAST和XBLAST程序(版本2.0)进行这种搜索。可以利用NBLAST程序进行BLAST核苷酸搜索以得到与本发明的核酸分子同源的核苷酸序列，其中分数＝100，字长＝12。

本文提供的序列信息不应被狭隘地解释为需要包含被错误鉴定的碱基。本文公开的特定序列可容易地被用于从丝状真菌分离完整的基因，特别是A.niger，其反过来能够易于经受进一步的序列分析从而鉴定测序错误。

除非特别声明，通过对本文的DNA分子测序确定的所有核苷酸序列都是使用自动DNA测序仪测定的，且所有由在本文中测定的DNA分子编码的多肽的氨基酸序列均通过以上确定的核酸序列的翻译而被预测。因此，如本领域所知，对于任何通过这种自动的方法测定的DNA序列，本文测定的任何核苷酸序列可能含有一些错误。通过自动化测定的核苷酸序列典型地至少约90％，更典型地至少约95％到至少约99.9％与被测序DNA分子的实际核苷酸序列相同。可通过其它方法更精确地测量实际的序列，其中所述方法包括本领域公知的手工DNA测序法。本领域还了解，与实际序列相比，测定的核苷酸序列中单一的插入或缺失将导致核苷酸序列翻译的移码突变，从而所预测的由测定的核苷酸序列编码的氨基酸序列将从这种插入或缺失点开始完全不同于由被测序的DNA分子实际编码的氨基酸序列。

本领域的技术人员能够鉴定这种被错误鉴定的碱基并知道怎么纠正这种错误。

本文引用的专利文件或作为现有技术给出的其它材料不能被认为是承认在任何权利要求的优先权日之前，所述文件或材料是已知的或者其包含的信息是公共常识的一部分。

本文所述的任何参考文献的公开内容均通过引用被整体并入本文。

通过下述实施例进一步阐释本发明。

实施例

需要了解的是，当表明本发明的优选实施例时，这些实施例仅以实例说明被给出。从上述讨论和这些实施例中，本领域的技术人员能够确定本发明的必要技术特征；且在不脱离其宗旨和范围时，本领域的技术人员可对本发明做出各种改变和修饰以适应各种用途和条件。因此，从前面的描述中，除了本发明展示和描述的那些之外的多种改变对本领域技术人员而言是明显的。这种改变也意图落入所附的权利要求的范围内。

菌株

WT1：这种Aspergillus niger菌株被用作野生型菌株。这种菌株被保藏在CBS研究所，保藏号为CBS513.88。A.niger菌株CBS513.88于1988年8月10日被保藏在Centraalbureau voor Schimmelcultures，Utrecht，荷兰。

GBA302：菌株Aspergillus niger GBA302(ΔglaA、ΔpepA、ΔhdfA)被用作转化中的受体菌株。WO2011009700中描述了GBA302的构建。

本文中使用的Rasamsonia emersonii(R.emersonii)菌株来源于ATCC16479，其被用作野生型菌株。ATCC16479以前也被称为Talaromyces emersonii和Penicillium geosmithia emersonii。使用名称Rasamsonia emersonii也表示Talaromyces emersonii。R.emersoniiATCC16479的其它菌株名称是CBS393.64、IFO31232和IMI116815。

Rasamsonia(Talaromyces)emersonii菌株TEC-142于2009年7月1日被保藏在CENTRAAL BUREAU VOOR SCHIMMELCULTURES，Uppsalalaan8，P.O.Box85167，NL-3508AD Utrecht，荷兰，登录号为CBS124902。TEC-142S是TEC-142的单分离株。

分子生物学技术

在这些菌株中，使用技术人员已知的分子生物学技术(参见：Sambrook&Russell，Molecular Cloning:A Laboratory Manual，3rd Ed.，CSHL Press，Cold Spring Harbor，NY，2001)，一些基因被过表达且另一些基因被下调(如下所述)。过表达基因的表达载体和用于下调的破坏载体的一般设计、转化、标记和选择培养基的使用的实例可在例如WO199846772、WO199932617、WO2001121779、WO2005095624、EP635574B和WO2005100573中找到。

培养基和溶液

马铃薯葡萄糖琼脂，PDA，(Fluka，Cat.No.70139)

基本培养基琼脂平板

8.8g葡萄糖、6.6g琼脂，加H₂O至400ml。在115℃下高压灭菌20分钟，然后冷却至55℃。加入溶液I，混合并倒板。

溶液I

11ml储液A、11ml储液B、0.44ml微量元素储液(1000×)、4.4ml青霉素/链霉素溶液和13.2ml H₂O。

储液A

120g NaNO₃、10.4g KCl、30.4g KH₂PO₄、22.5ml4M KOH，加H₂O至500ml。

在120℃下高压灭菌20分钟。

储液B(40×)

10.4g MgSO₄.7H₂O，加H₂O至500ml。在120℃下高压灭菌20分钟。

微量元素储液(1000×)

2.2g ZnSO₄.7H₂O、1.1g H₃BO₃、0.5g FeSO₄.7H₂O、0.17g CoCl₂.6H₂O、0.16g CuSO₄.5H₂O、0.5g MnCl₂.4H₂O、0.15g Na₂MoO₄.2H₂O、5.0g EDTA。

将EDTA和ZnSO₄.7H₂O溶解至75ml milliQ水中，然后用1M NaOH将pH设为6.0。当维持pH在6.0时，逐个溶解组分。就绪后，用1M HCl将pH设为4.0，然后用milliQ水调整体积至100ml。在120℃下高压灭菌20分钟。

Rasamsonia琼脂培养基

盐级分组合物

“3号盐级分”与WO98/37179中表1的公开内容相符。与这个表中组合物的差异是：CaCl₂.2H₂O1.0g/l、KCl1.8g/L和一水柠檬酸0.45g/L(螯合剂)。

Rasamsonia摇瓶培养基

Rasamsonia培养基1

Rasamsonia培养基2

Rasamsonia孢子批量制备

来自储备的菌株在10cm直径培养皿中的Rasamsonia琼脂培养基上在40℃下生长5-7天。对于MTP发酵，菌株生长于含有Rasamsonia琼脂培养基的96孔板中。菌株储备在-80℃下存储于10％甘油中。

染色体DNA分离

菌株在42℃、250rpm的条件下于YGG培养基(每升：8g KCl、16g葡萄糖.H₂O、20ml 10％酵母提取物、10ml 100x青霉素/链霉素、6.66g YNB+氨基酸、1.5g柠檬酸和6g K₂HPO₄)中生长16小时，然后使用DNeasy植物小提试剂盒(Qiagen，Hilden，德国)分离染色体DNA。

Rasamsonia的MTP发酵

含有形成孢子的Rasamsonia菌株的96孔微量滴定板(MTP)被用于收获MTP发酵的孢子。为此，向每个孔中加入200μl Rasamsonia培养基1，重悬混合物，然后在湿度瓶(Infors)中孵育100μl孢子悬浮液，孵育条件为：44℃，550rpm，80％湿度，持续16小时。随后，使用50μl预培养物接种至MTP板中的250μl Rasamsonia培养基2。在44℃，550rpm和80％湿度的条件下，在湿度瓶(Infors)中孵育96孔板6天。离心板并收获上清液。

蛋白分析

在还原条件下，在NuPAGE4-12％Bis-Tris凝胶(Invitrogen，Breda，荷兰)上分离蛋白样品并根据指示染色。根据制造商的说明，用InstantBlue(Expedeon，Cambridge，英国)、SimplyBlue safestain(Invitrogen，Breda，荷兰)或Sypro Ruby(Invitrogen，Breda，荷兰)染色凝胶。

对于Western印迹，蛋白质被转移至硝酸纤维素。用含有3％脱脂乳的TBST(含有0.1％Tween40的Tris缓冲盐水)封闭硝酸纤维素滤膜，然后用抗FLAG M2抗体(Sigma，Zwijndrecht，荷兰)孵育16小时。用TBST洗涤印迹两次10分钟，然后用缀合辣根过氧化物酶的兔-抗-小鼠抗体(DAKO、Glostrup、丹麦)染色1小时。用TBST洗涤印迹五次10分钟后，使用SuperSignal(Pierce，Rockford，美国)显现蛋白。

酶活性的测量

脯氨酸特异性内切蛋白酶活性

在37℃下，利用pH为5的柠檬酸盐/磷酸二钠缓冲液中的CBZ-Gly(甘氨酸)-Pro(甘氨酸)-pNA，适时使用分光光度计在410nm处测量脯氨酸特异性内切蛋白酶的蛋白水解活性。1U脯氨酸特异性内切蛋白酶被定义为：在上述条件下在pH5和37℃下，每分钟转化1μmol(微摩)CBZ-Gly(甘氨酸)-Pro(甘氨酸)-pNA的酶的量。

纤维素酶试验：麦秸检验(WSU试验)

预处理的、经洗涤的麦秸底物的制备

分析之前，用水洗涤被稀酸预处理过的麦秸直至含有麦秸的溶液的pH为6.5或更高，然后使用分散机(ultra-turrax)将物质均化，冻干并磨碎。为了获得预处理的麦秸，可利用如Linde，M.et al，Biomass andBioenergy32(2008)，326-332中所述的稀酸预处理和如Schell，D.J.，Applied Biochemistry and Biotechnology(2003)，vol.105-108，pp69-85中所述的设备。

以WSU/ml表示的纤维素酶活性的测量

1WSU表示：在65℃、pH4.50下，通过200μl酶混合物中的20小时，2.1重量/体积％经洗涤的预处理麦秸释放0.119mg/ml葡萄糖。

葡萄糖释放不是组合物中酶的量的线性函数。换言之，相同时间内两倍量的酶不必然产生两倍量的葡萄糖。因此，优选地，选择待被检测WSU活性的组合物的稀释度以使WSU不超过40。

从摇瓶实验中收获的400μl上清液被稀释4.5倍。稀释的样品被用于执行两种测量，其中分析200μl稀释的样品。第一种测量中，200μl稀释的样品被转移至小瓶，其中含有含3％(重量/体积)经预处理的、洗涤的麦秸底物的干物质的700μl水和的100μl250mM柠檬酸盐缓冲液，终pH被调至pH4.5。第二种测量中，200μl稀释的样品(空白样品)被转移至小瓶，其中含有代替经预处理的、洗涤的麦秸底物的700μl水和100μl250mM柠檬酸盐缓冲液，终pH被调至pH4.5。在65℃下孵育试验样品20小时。试验样品被孵育后，加入100μl内部标准溶液(D2O中20g/L马来酸和40g/L EDTA)。葡萄糖释放量基于在27℃下、由在500MHz的质子频率下操作的1D1H NMR测定的相对于二甲基-硅-戊烷-磺酸盐的5.20ppm处的信号。利用从在用麦秸孵育的样品中测量到的葡萄糖的量中减去在空白样品中检测到的葡萄糖的量的数据计算WSU数。

实施例1：构建并描述Aspergillus缺失载体

在A.niger CBS513.88的基因组序列中鉴定候选被破坏的三个基因。A.niger基因的所有核苷酸序列和它们的基因组环境可从例如EMBL(http://www.ebi.ac.uk/embl/)的NCBI(http://www.ncbi.nlm.nih.gov/)中得到。nicB基因由ORF An11g10910编码，PdxA基因由An03g04280编码，epo基因由An08g04490编码。

根据已知的原理设计并根据EP635574B和WO98/46772中同样描述的常规克隆程序构建基因替换载体。大体上，这些载体包含各个ORF序列的约1-2kb侧翼区以在预定的基因组位点靶向同源重组。它们可以含有例如A.nidulans双向amdS选择标记、潮霉素B标记或腐草霉素选择标记以进行转化。本文的所有实施例中实施基因替换的方法都使用线型DNA，其通过双交换在侧翼序列的同源位点整合至基因组，从而用标记基因(例如amdS基因)替换待被缺失的基因。amdS标记的丢失例如可通过涂板至氟-乙酰胺培养基而被选择。

基于基因组序列，nicB、PdxA和epo的基因替换载体被设计如下：大体上，nicB缺失载体pDELNicB-3包含nicB ORF的约1000bp5’上游侧翼区(Nic-US)和1000bp3’下游侧翼区(Nic-DS)以允许在预定的基因组nicB位点靶向同源重组。此外，pDELNicB-3含有潮霉素B选择标记盒(来自pAN7-1、NCBI gi:475166)且突变的loxP位点(lox66和lox71，分别地SEQ ID No:1和2)如所示被放置于HygB标记周围(pDELNicB-3的总体布局请参见图1)。

用于pdxA缺失的pDEL_PdxA-2载体被类似地构建，其含有相似长度的PdxA ORF的5’侧翼区(Pdx-US)和3’侧翼区(Pdx-DS)。与pDEL_NicB-3不同，pDEL_PdxA-2载体包含腐草霉素选择标记(如pAN8-1中的腐草霉素标记，NCBI gi:475899)且突变的loxP位点(lox66和lox71，分别地SEQID No:1和2)位于标记盒周围(pDEL_PdxA-2的总体布局请参见图2)。SEQ ID NO:3展示了双突变的lox72位点以供参考。

用于缺失epo基因的载体以略微不同的方式被设计，其包含构建和使用两种不同的载体。两个载体的插入片段一起能被应用于所谓的“二重基因靶向”方法(Nielsen et al.，2006，43:54-64)。这种方法使用重叠的选择标记的两个无功能DNA片段(二重方法的更多细节请参见WO2008113847)连同基因靶向序列。正确的同源重组后，选择标记通过在同源靶位点的整合变得有功能。如WO2008113847中同样详述的，设计和构建两个不同的缺失载体pDEL_EPO_Hyg-1和pDEL_EPO_CRE-1以能够提供用于二重基因靶向的两个重叠的DNA分子。第一个载体pDEL_EPO_Hyg-1(总体布局请参见图3)包含第一个无功能的hygB标记片段(PgpdA-HygB序列缺失hygB的3’末端编码序列的最后27个碱基，SEQ ID NO:4)和位于hygB盒一端的lox71序列位点以及epo ORF的5’上游基因侧翼区(EPO-US)。第二个pDEL_EPO_CRE-1载体(总体布局请参见图4)包含第二个无功能的hygB片段(HygB-TtrpC序列缺失hygB的5’末端编码序列的开始44个碱基，SEQ ID NO:5)以及位于hygB盒一端的cre重组酶盒、lox66序列位点以及epo ORF的3’下游基因侧翼区(EPO-DS)。cre重组酶盒含有A.nidulans木聚糖酶A启动子、cre重组酶和木聚糖酶A终止子以允许cre重组酶(SEQ ID NO:6)的木糖诱导型表达。同源重组后，第一个和第二个无功能的片段变得有功能，其产生有功能的hygB盒。epo上游和下游基因侧翼区都在预定的epo基因组位点靶向二重片段的同源重组。

在下述实施例中，我们将展示：本文中使用的cre-lox系统是用于单次转化之后基因破坏和标记移除的非常有效的系统。此外，当使用NHEJ存在缺陷的菌株时，二重基因靶向方法结合cre-lox系统产生用于制造具有确定修饰的无标记菌株的高效系统。

实施例2：使用无有功能标记的多个重叠DNA片段(二重基因靶向方法)和小的重叠序列进行有效缺失基因

这个实验中研究了无功能标记片段的重叠序列大小对通过双同源重组的转化效率和靶向频率的影响。利用pDELNicB-3质粒作为模板产生足量的PCR片段，所述片段包含变化的hygB标记长度，其侧翼是1kb NicB侧翼区(参见图5)。用2μg每种PCR片段转化菌株GBA302(ΔglaA、ΔpepA、ΔhdfA)的原生质体。基于潮霉素B抗性选择转化体，然后根据如EP635574B中所述的标准程序纯化菌落，纯化之后进行分析。利用诊断PCR判断靶向频率，其中所用的引物一个在hygB盒内，一个在基因组侧翼区内但在靶向核苷酸区域之外(参见图5)。表1中显示的数据清楚地证明：在良好的转化效率下，对于不同大小的重叠标记序列，整合盒的靶向频率都高且有效。因此，我们得出以下结论：比在本文的实施例1和WO2008113847的实施例4中提到的约1kb的大小更小的重叠序列对靶向频率没有副作用。以这种方式，通过PCR或DNA合成的片段产生被简化，因此破坏突变的构建体更为有效。

表1：使用长度变化的重叠标记序列时，NicB缺失盒的转化效率和靶向频率

重叠长度(bp)	转化体的数量	靶向(％)
			960	236	100
750	240	95
			640	88	85
380	252	100

实施例3：使用不具有有功能标记且具有loxP位点的多个重叠DNA片段同时缺失基因并在一个转化步骤之后移除标记

编码参与NHEJ的组分的基因存在缺陷的突变体(例如至少一个hdf基因的失活)的使用导致通过(双)同源重组的整合载体的靶向效率显著增加(例如，如先前在WO2005095624和WO2008113847中所述)。

此外，可依照WO2008113847中所述获得同源重组靶向效率的提高。这种二重基因靶向方法包括提供两组DNA分子，其中第一组包括这样的DNA分子，其各包含感兴趣的替换序列的第一个无功能片段，其5’端侧翼是与靶序列侧翼的染色体DNA序列基本同源的DNA序列；第二组包括这样的DNA分子，其各包含与第一个无功能片段重叠的感兴趣的DNA替换序列的第二个无功能片段，其3’端侧翼是与靶序列侧翼的染色体DNA序列基本同源的DNA序列，其中第一个和第二个无功能片段经重组变得有功能。

基因替换载体pDEL_EPO_Hyg-1和pDEL_EPO_CRE-1(布局如实施例1中所述)都包含用于在epo ORF同源重组的约1kb侧翼区。此外，它们都含有(无功能的)hygB选择标记和loxP位点(lox71和lox66)。pDEL_EPO_CRE-1构建体还含有受A.nidulans木聚糖酶A启动子控制的噬菌体P1Cre基因以允许基于木糖诱导的诱导型Cre表达。

使用pDEL_EPO_Hyg-1和pDEL_EPO_CRE-1质粒作为模板，利用PCR产生足量的用于破坏epo的两种线型二重基因靶向片段。在这种情况下，两种核苷酸片段在无功能hygB基因处的重叠约为1kb。对于每种片段，使用2μg DNA转化Aspergillus niger GBA302。基于潮霉素B抗性选择转化体，然后根据如EP635574B中所述的标准程序纯化菌落，之后纯化后进行分析。从实施例2中可以了解到：使用1kb侧翼序列得到大部分转化体且和1kb重叠导致在同源的epo位点的高频率靶向整合，从而用有功能的hygB基因替换靶位点(如图6所示)。

为了诱导受木聚糖酶启动子控制的cre重组酶，使用含1％木糖和1％葡萄糖的基本培养基(木聚糖酶诱导培养基)琼脂平板。将转化体从PDA平板转移至木聚糖酶诱导培养基。随后，在30℃下孵育平板5天。当Cre重组酶被木糖诱导时，可通过切除发生位于两个特异的loxP位点之间的DNA盒的缺失。检验在木糖酶诱导培养基上生长之后产生的菌落的潮霉素B抗性。使用牙签将来自转化体的孢子转移至含有和不含潮霉素B(60μg/ml)的PDA平板。在30℃下孵育平板48小时。

在于PDA淀粉上生长后的24个最初的潮霉素B抗性菌落中，4个转化体自发地丢失了它们的潮霉素B抗性(菌株检测请参见图7)。在于木糖上生长后的24个最初的潮霉素B抗性菌落中，19个转化体丢失了它们的潮霉素B抗性。潮霉素B抗性的丢失可与通过cre重组酶活性的hygB标记盒的丢失相联系。事实上，利用epo位点的PCR分析证实了标记的移除。

这个实施例显示：在NHEJ缺陷的菌株中，联合使用二重基因靶向和根据本发明的诱导型重组系统允许构造无标记菌株时非常有效的菌株构建/破坏，而不需要菌株构建中的第二次转化或反向选择程序。

实施例4：使用不具有有功能标记的多个重叠DNA片段同时缺失多个基因并在一个转化步骤之后移除多个标记

在这个实施例中，我们描述了显著缩短的菌株构建程序的方法，其通过在NHEJ缺陷宿主菌株中联合使用多个二重片段和cre-lox以获得多基因缺失。为了便于在单个转化步骤中移除多个标记，至少一个构建体含有携带诱导型木聚糖酶A启动子的Cre基因是必需的。

使用pDEL_Pdx-2和pDEL_EPO_Hyg-1&pDEL_EPO_CRE-1质粒作为模板，利用PCR产生足量的分别用于破坏pdxA和epo的双倍的两种线型二重基因靶向片段。这两种核苷酸片段在无功能的腐草霉素ble基因处的重叠约为350bp，对于hygB基因则约为1kb。对于四种片段中的每一种，使用2μgDNA转化Aspergillus niger GBA302。在含有潮霉素B和腐草霉素的培养基上选择双缺失的转化体。菌落被纯化的菌株通过下述方式被检验：正确的表型和利用PCR判断pdxA和epo的基因替换。通过转移至含有木糖的生长培养基诱导CRE后，两种选择标记都被移除。利用PCR分析NicB和PdxA位点证实了标记的移除。

这个实施例显示：在NHEJ缺陷的菌株中，联合使用多个二重基因靶向和根据本发明的诱导型重组系统允许构造具有两个修饰的无标记菌株时非常高效的菌株构建/破坏，而不需要菌株构建中的第二次或第三次转化步骤或者反向选择程序。

实施例5：转化Rasamsonia emersonii产生能够生产由被引入转化体的基因编码的期望的酶的无选择标记转化体

本实施例描述了含有一个或多个额外Cbhl拷贝的无标记的R.emersonii转化体的构建。通过在R.emersonii转化体中瞬时表达cre重组酶移除标记。

克隆编码cre重组酶的瞬时表达质粒pEBA513

pEBA513由DNA2.0(Menlo Park、USA)构建，其含有下述组分：由A.niger glaA启动子、编码cre重组酶的ORF(AAY56380)和A.nidulansniaD终止子组成的表达盒；由A.nidulans gpdA启动子、编码潮霉素B抗性蛋白的ORF和P.chrysogenum penDE终止子(Genbank:M31454.1，核苷酸1750-2219)组成的表达盒；含有AMA1区域和CAT氯霉素抗性基因的pAMPF21衍生质粒。图8展示了pEBA513的图谱。

用pDEL PdxA-2和CbhI表达构建体pGBTOP205转化R.emersonii

为了获得过表达Cbhl的R.emersonii菌株，R.emersonii被转化以获得多拷贝Cbhl菌株。WO2011\054899中描述的受A.niger葡糖淀粉酶启动子控制的编码R.emersonii CbhI的质粒pGBTOPEBA205被用于转化。使用1μg ofpDEL_pPdxA-2(克隆细节和说明请参见实施例1和图2)和9μg ofpGBTOPEBA205共转化R.emersonii，然后利用PCR分析鉴定共转化体。使用引物Ble-For(SEQ ID NO:7)和Ble-Rev(SEQ ID NO:8)判断pDEL_PdxA-2质粒的存在，使用引物EBA205-For(SEQ ID NO:9)和EBA205-Rev(SEQ ID NO:10)判断pGBTOPEBA205的存在。针对pGBTOPEBA4(SEQ ID NO:11和12)和pGBTOPEBA8(SEQ ID NO:13和14)的引物被用作对照。

Ble-For(SEQ ID NO:7):5’-AGTTGACCAGTGCCGTTCC-3’；和

Ble-Rev(SEQ ID NO:8):5’-CACGAAGTGCACGCAGTTG-3’。

EBA205-For(SEQ ID NO:9):5’-CTTCTGCTGAGCAGCTCTGCC-3’；和

EBA205-Rev(SEQ ID NO:10):5’-GTTCAGACCGCAAGGAAGGTTG-3’。

EBA4-For(SEQ ID NO:11):5’-CGAGAACCTGGCCTACTCTCC-3’

EBA4-Rev(SEQ ID NO:12):5’-CAGAGTTGTAGTCGGTGTCACG-3’

EBA8-For(SEQ ID NO:13):5’-GAAGGGTATCAAGAAGCGTGCC-3’

EBA8-Rev(SEQ ID NO:14):5’-GCCGAAGTTGTGAGGGTCAATG-3’

PCR反应条件：根据Phusion高保真聚合酶操作手册(Finnzymes，Espoo，芬兰)，含5μl模板DNA、20pmol每种引物、0.2mM dNTPs、1x Phusion HF缓冲液和1U Phusion DNA-聚合酶的50μl反应混合物在98℃下变性30秒，扩增30个循环(10秒98℃、10秒55℃、15秒72℃)以及最后在72℃下孵育10分钟。

转化体A-A4是含有一个或多个pGBTOPEBA205拷贝的共转化体。在泳道4，在转化体中观察到了期望的pGBTOPEBA-205的452bp PCR产物(图9，泳道4)，其在使用pGBTOPEBA205作为模板的对照PCR中被检测到(泳道10)，但在空菌株中未被检测到(泳道7)。在EBA4和EBA8PCR反应中，转化体中未观察到特定条带，但当使用质粒DNA作为模板时，分别产生了期望的256bp和306bp PCR产物(泳道8和9)。

总之，产生了带有多拷贝R.emersonii CbhI的R.emersonii转化体。

纤维素酶活性试验

在MTP中发酵转化体A-A4和对照菌株，然后在WSU纤维素酶活性试验中分析上清液的纤维素酶活性。与空菌株相比，在转化体A-A4的上清液中观察到的纤维素酶活性的1.25倍增加，这表明得到的带有多拷贝R.emersonii CbhI的转化体具有提高的纤维素酶活性。

用携带cre重组酶基因的AMA质粒pEBA513转化腐草霉素抗性R. emersonii转化体并选择腐草霉素-敏感转化体

在R.emersonii转化体A-A4中瞬时表达cre重组酶以通过在lox66和lox71位点上的重组移除侧翼为loxP的腐草霉素抗性基因。用milliQ水(对照)或10μg携带Cre重组酶和潮霉素表达盒的pEBA513转化转化体。被pEBA513转化的原生质体涂布在含有50μg/ml潮霉素B的再生培养基上层。使潮霉素抗性转化体生长在含有50μg/ml潮霉素B的PDA上以允许cre重组酶的表达。使转化体生长在含有和不含10μg/ml腐草霉素的培养基上，通过表型检验ble标记的移除。用pEBA513(携带cre重组酶)转化后的大部分(＞90％)转化体对腐草霉素敏感，这表明cre重组酶在R.emersonii中高效工作且转化体在重组酶的诱导和表达后丢失了(ble)标记。图10A中展示了含有10μg/ml腐草霉素的PDA和PDA上的不同转化体和空菌株的实例。

还利用PCR分析了一部分转化体。使转化体在44℃、250rpm下，在YGG培养基中生长16小时，然后使用DNeasy植物小提试剂盒(Qiagen，Hilden，德国)分离染色体DNA。利用PCR分析含有侧翼为loxP的ble基因的亲本菌株和过表达cre重组酶的转化体，其中使用针对紧邻loxP位点外的侧翼序列的pdx引物：

Pdx-For(SEQ ID NO:15):5’-TTGAGCTGTTGCTCCGGTAG-3’；和

Pdx-Rev(SEQ ID NO:16):5’-CTCCGTAGTCATCGTCAATGG-3’

此外，使用针对质粒的HygB选择标记的引物，利用PCR判断pEBA513的存在。

Hyg-For(SEQ ID NO:17):5’-GCGTCGGTTTCCACTATC-3’

Hyg-Rev(SEQ ID NO:18):5’-GAGGTCGCCAACATCTTC-3’

PCR条件如上所述。图10B中展示了琼脂糖凝胶的结果。在含有侧翼为loxP的ble表达盒的转化体中观察到了2752bp特定PCR条带(泳道2和3)。与此不同，在ble重组酶通过cre重组酶被移除的转化体中，881bpPCR片段被扩增(泳道8和9)，这表明ble基因通过cre重组酶被移除。因此，我们成功地利用cre-lox系统从R.emersonii转化体中移除了侧翼为loxP的ble选择标记。

通过HygB PCR判断pEBA513AMA-Cre质粒的存在。有趣的是，两个转化体中有一个没有检测到HygB片段。由于转化体在无hygB选择的条件下生长，因此转化体可能已经丢失了附加型cre表达质粒和与其相连的hygB标记。

移除pEBA513质粒以获得无标记的转化体

移除ble选择标记之后，鉴定自发丢失pEBA513质粒的菌株。当在含有和不含腐草霉素的PDA板上选择腐草霉素-敏感克隆时，我们已经观察到部分转化体已经丢失了AMA质粒。为了检验转化体于无潮霉素选择的条件下生长后，附加型AMA质粒pEBA513的自发性丢失，将孢子转移至含有和不含潮霉素B的板上。在一轮无选择的生长之后，利用hygB PCR证实(如上所述)50-75％的转化体已对潮霉素B敏感。

标记被移除后，转化体仍然含有多拷贝R.emersonii CbhI，且与空菌株相比，纤维素酶活性仍有1.25倍的提高。

总之，我们通过使用两个显性标记成功地产生了无标记的R.emersonii转化体，所述的两个显性标记是：被用于和感兴趣的基因一起共转化的侧翼为loxP的ble标记，和用携带cre重组酶基因的AMA质粒被用于瞬时转化R.emersonii转化体的潮霉素标记。用cre重组酶瞬时转化R.emersonii足以移除侧翼为loxP的ble标记。

实施例6：鉴定参与非同源末端连接的Rasamsonia emersonii基因并构建缺失载体

对Rasamsonia emersonii菌株CBS393.64的基因组DNA测序并分析。表2中列出了翻译的蛋白质被注释为参与非同源末端连接的已知基因的同源物的基因。

表2：在Rasamsonia emersonii中参与非同源末端连接的基因以及它们在A.niger、P.chrysogenum和S.cerevisiae中的同源物

参与非同源末端连接的Rasamsonia emersonii基因序列包含开放阅读框(ORF)(含内含子)以及约1500bp5’和3’侧翼区域的基因组序列、cDNA和蛋白序列。

根据常规克隆程序构建两个ReKu80替换载体：pEBA1001和pEBA1002(参见图11和12)。这两个载体的插入片段一起能够被应用于所谓的“二重基因靶向”方法(Nielsen et al.，2006，43:54-64)。这种方法使用选择标记的两个重叠的无功能DNA片段(二重方法的更多细节请参见WO2008113847)和基因靶向序列。正确的同源重组后，选择标记通过在同源靶位点整合变得有功能。如WO2008113847所述设计缺失载体pEBA1001和pEBA1002，以能够提供用于二重基因靶向的两个重叠的DNA分子。

pEBA1001载体包含用于在ReKu80位点靶向的ReKu80ORF的2500bp5’侧翼区、lox66位点和由A.nidulans gpdA启动子驱动的ble编码区的无功能的5’部分(PgpdA-ble序列丢失了ble的3’末端编码序列的最后104个碱基的，SEQ ID NO:60)(图11)。pEBA1002载体包含ble编码区的无功能的3’部分、A.nidulans trpC终止子(ble-TtrpC序列丢失了ble的5’末端编码序列的最初12个碱基，SEQ ID NO:61)、A.nidulans trpC终止子、lox71位点和用于在ReKu80位点靶向的ReKu80ORF的2500bp3’侧翼区(图12)。

实施例7：使ReKu80基因在Rasamsonia emersonii中失活

使用之前WO2011\054899中所述的方法，分离缺失构建体pEBA1001和pEBA1002的线型DNA并用其转化Rasamsonia emersonii菌株TEC-142S。这些线型DNA能够在ReKu80位点整合至基因组，从而用ble基因替换ReKu80基因(如图13所示)。在腐草霉素培养基上选择转化体，然后纯化菌落，之后根据如WO2011\054899中所述的程序进行检测。利用PCR判断生长的菌落中ReKu80位点的整合，其中使用缺失盒的gpdA启动子中的引物和针对紧邻5’靶向区域上游的基因组序列的引物。约250个转化体的库中，4个菌株显示出基因组ReKu80基因的移除。

随后，用pEBA513转化3个候选ReKu80敲除菌株以通过瞬时表达cre重组酶移除ble选择标记。将pEBA513转化体涂布在含有50μg/ml潮霉素B的再生培养基上层。使潮霉素抗性转化体生长在含有50μg/ml潮霉素B的PDA上以允许cre重组酶的表达。将单菌落涂布在非选择性的Rasamsonia琼脂培养基上以获得纯化的孢子批。使转化体生长在含有和不含10μg/ml腐草霉素的培养基上，通过表型检验ble标记的移除。用pEBA513(携带cre重组酶)转化后的大部分(＞90％)转化体对腐草霉素敏感，这表明基于pEBA1001和pEBA1002的ble标记被移除。随后，使转化体生长在含有和不含50μg/ml潮霉素的培养基上，通过表型判断ble-阴性菌株中pEBA513构建体的移除。由于pEBA513质粒的自发丢失，约50％转化体丢失了潮霉素抗性。

利用Southern分析检测候选无标记敲除菌株中ReKu80基因的缺失。分离染色体DNA并用限制性酶HindIII消化。用针对ReKu80基因3’区域的探针与Southern印迹杂交(图14)。下述引物被用于产生探针：

SEQ ID NO:Ku80-For:AGGGTATATGTGGTCTAGTAACGC(SEQID NO:55)

SEQ ID NO:Ku80-Rev:TCACAAGTCCATCACGGAACCGGG(SEQID NO:56)

野生型菌株、腐草霉素抗性ReKu80敲除菌株和腐草霉素敏感菌株中预计的片段大小分别为4132bp、3197bp和1246bp。野生型对照菌株显示出预计的4132bp片段(图14，泳道1)。2个候选腐草霉素抗性ReKu80敲除菌株确实显示出预计的3197bp片段(泳道2和3)。利用cre重组酶移除ble基因导致片段大小减小；通过Southern印迹可检测到1246bp条带(泳道5和6)。总之，我们利用Southern印迹证实：我们获得了2个独立的无标记ReKu80缺失菌株。

菌株ΔReKu80-2被选为ReKu80基因失活的代表菌株。

实施例8：克隆RePepA缺失载体

对Rasamsonia emersonii菌株CBS393.64的基因组DNA测序并分析。鉴定其翻译蛋白被注释为蛋白酶pepA的基因。Rasamsonia emersonii pepA(RePepA)序列包括ORF和约2500bp的5’和3’侧翼区的基因组序列、cDNA和蛋白序列，它们被分别展示于序列表57、58和59。

使用二重基因靶向方法设计并根据常规克隆程序构建用于RePepA的基因替换载体(参见图15和16)。pEBA1005载体包含用于在RePepA位点靶向的RePepA ORF的2500bp5’侧翼区、lox66位点和由A.nidulans gpdA启动子驱动的ble编码区的5’部分(PgpdA-ble序列丢失了ble的3’末端编码序列的最后104个碱基，SEQ ID NO:60)(图15)。pEBA1006载体包含ble编码区的3’部分(ble-TtrpC序列丢失了ble的5’末端编码序列的最初12个碱基，SEQ ID NO:61)、A.nidulans trpC终止子、lox71位点和用于在RePepA位点靶向的RePepA ORF的2500bp3’侧翼区(图16)。此外，构建带有完整的RePepA缺失盒的pEBA10056(图17)。pEBA10056构建体包含用于在RePepA位点靶向的RePepA ORF的2500bp5’侧翼区、lox66位点、含有A.nidulans gpdA启动子的ble表达盒、ble编码区和A.nidulans trpC终止子、lox71位点和用于在RePepA位点靶向的RePepA ORF的2500bp 3’侧翼区。

除了含有1500bp RePepA侧翼的pEBA1005和pEBA1006之外，还产生由500、1000和1500bp RePepA侧翼构成的构建体以检测最佳的侧翼长度。pEBA1005和pEBA1006是仅侧翼长度不同的这些构建体的代表。

实施例9：提高RePepA位点的同源重组事件的靶向

通过用缺失载体转化TEC-142S和ΔReKu80-2菌株评估ReKu80敲除菌株相对于野生型菌株的靶向效率，其中缺失载体被设计为使编码主要细胞外酸性天冬氨酸蛋白酶的RePepA基因在基因组失活。利用PCR扩增RePepA缺失载体，然后使用PCR产物转化TEC-142S和ΔReKu80-2菌株的原生质体。根据实施例7中所述选择转化体。

利用指示RePepA失活的基于活性的平板试验评估靶向效率。通过使转化体在提供有1％酪蛋白钠盐的PDA平板上繁殖实施平板试验。在总共20个转化体中，分析每个转化体的晕轮(halo)形成。被2.5kb RePepA缺失构建体转化后，大部分CBS393.64转化体仍显示晕轮形成，然而ΔReKu80-2转化体中没有观察到晕轮形成(图18)。表3中展示了根据酪蛋白平板上的晕轮形成判断的靶向频率。

表3.带有不同侧翼长度的RePepA缺失载体在ΔReKu80-2菌株与CBS393.64菌株中相比的靶向频率。用“(二重)”指示使用二重基因靶向方法的缺失载体。

*，由于转化体量少而未检测

与CBS393.64菌株相比，ΔReKu80-2菌株中的靶向效率显著提高。在野生型菌株中，当应用2.5kb侧翼并使用二重基因靶向方法时，观察到最高的靶向效率(10％)。使用携带完整缺失盒的质粒使RePepA缺失在ΔReKu80-2菌株90％的转化体是成功。当使用二重基因靶向方法时，在ΔReKu80-2菌株中，1.5kb侧翼已足以获得100％靶向，1kb侧翼已足以高效获得正确的转化体。

这些发现表明：在使至少一个参与Rasamsonia emersonii非同源末端连接的基因失活后，菌株同源重组的提高的效率导致通过双同源重组的整合载体的靶向效率显著提高。本实施例中，ReKU80的破坏已经阐明了这一点。

实施例10：构建Rasamsonia缺失载体用于使用不具有有功能标记和具有loxP位点的多个重叠DNA片段同时缺失基因并在一个转化步骤之后移除标记

如实施例3所述使用二重靶向方法设计RePepA基因替换载体，其中有一个例外：约1500bp RePepA侧翼区域被用于在RePepA ORF同源重组。第一个载体pPepAHyg(总体布局请参见图19)包含第一个无功能的hygB标记片段(PgpdA-HygB序列缺失hygB的3’末端编码序列的最后27个碱基，SEQ ID NO:4)和位于hygB盒一端的lox71序列位点以及RePepA ORF的5’上游基因侧翼区(5’区pepA)。第二个pPepACre载体(总体布局请参见图20)包含无功能的hygB片段(HygB-TtrpC序列缺失hygB的5’末端编码序列的开始44个碱基，SEQ ID NO:5)以及位于hygB盒一端的cre重组酶、lox66序列位点以及RePepA ORF的3’下游基因侧翼区(3’区RePepA)。cre重组酶盒含有A.nidulans木聚糖酶A启动子、cre重组酶和木聚糖酶A终止子以允许cre重组酶(SEQ ID NO:6)的木糖诱导型表达。同源重组后，第一个和第二个无功能的片段变得有功能并能产生有功能的hygB盒。RePepA上游和下游基因侧翼区都靶向在预定的RePepA基因组位点二重片段的同源重组。

在下述实施例中，我们将展示：本文中使用的cre-lox系统是用于单次转化之后基因破坏和标记移除的非常有效的系统。此外，当使用NHEJ缺陷的菌株时，二重基因靶向方法结合cre-lox系统产生用于制造具有确定修饰的无标记菌株的高效系统。

实施例11：使用不具有有功能标记的多个重叠DNA片段(二重基因靶向方法)和小的重叠序列有效缺失基因

使用编码参与NHEJ的组分的基因存在缺陷的突变体(例如至少一个Ku基因的失活)导致通过(双)同源重组的整合载体的靶向效率显著提高(参见实施例9)。

此外，可依照实施例9中所述提高同源重组的靶向效率。这种二重基因靶向方法包括提供两组DNA分子，其中第一组包括这样的DNA分子，其各包括感兴趣的替换序列的第一个无功能片段，其5’端侧翼是与靶序列侧翼的染色体DNA序列基本同源的DNA序列；第二组包括这样的DNA分子，其各包括与第一个无功能片段重叠的感兴趣的替换序列的第二个无功能片段，其3’端侧翼是与靶序列侧翼的染色体DNA序列基本同源的DNA序列，其中第一个和第二个无功能片段经重组变得有功能。

基因替换载体pPepAHyg和pPepACre(布局如实施例10中所述)都包含用于在RePepA开放阅读框同源重组的约1.5kb侧翼区。此外，它们都含有(无功能的)hygB选择标记和loxP位点(lox71或lox66)。pPepACre构建体还含有受A.nidulans木聚糖酶A启动子控制的噬菌体P1Cre基因以允许基于木糖诱导的诱导型Cre表达。

使用pPepAHyg和pPepACre质粒作为模板，利用PCR产生足量的用于破坏RePepA的两种线型二重基因靶向片段。在这种情况下，两种核苷酸片段在无功能hygB基因处的重叠约为1kb。这些线型DNA分子能够在RePepA位点整合至基因组，从而用hygB基因替换RePepA基因(如图21所示)。

对于每种片段，使用2μg DNA转化R.emersonii菌株ΔReKu80-2。基于潮霉素B抗性选择转化体，然后根据如实施例5中所述的标准程序纯化菌落，之后进行纯化后分析。

为了诱导受木聚糖酶启动子控制的cre重组酶，使用含1％木糖和1％葡萄糖的基本培养基(木聚糖酶诱导培养基)琼脂平板和0.2％酵母提取物。将转化体从PDA平板转移至含酵母提取物的木聚糖酶诱导培养基。随后，在42℃下孵育平板5天。在木糖上生长后产生的菌落被涂布在非选择性Rasamsonia琼脂培养基上以获得纯化的孢子批。当Cre重组酶被木糖诱导时，可通过剪切删除位于两个特异的loxP位点之间的DNA盒。使转化体生长在含有和不含50μg/ml潮霉素B的培养基上，通过表型判断hygB标记的移除。约65％cre被诱导的转化体不能在潮霉素B上生长(图22)。潮霉素B抗性的丢失可通过cre重组酶活性与hygB标记盒的丢失相联系。事实上，通过利用RePepA位点的PCR分析证实了标记的移除。

这个实施例显示：在NHEJ缺陷的菌株中，将二重基因靶向的使用与根据本发明的诱导型重组系统联合允许在构造无标记菌株时非常高效地构建/破坏菌株，而不需要菌株构建中的第二次转化或反向选择程序。

Claims

1.在Rasamsonia细胞的靶位点实施重组的方法，其中所述方法包括：

-提供两种或更多种核酸，它们总共包含：(a)能够与靶位点的侧翼序列同源重组的序列；(b)两个或更多个位点特异性重组位点；(c)编码识别位点特异性重组位点的重组酶的序列；和(d)编码标记的序列，

其中所述两种或更多种核酸能够相互同源重组以产生一种核酸，和

其中所述两种或更多种核酸中的至少两种各包含编码无功能的部分标记的序列；和

-在Rasamsonia细胞中使所述两种或更多种核酸相互重组和与靶位点的侧翼序列重组，以在靶位点插入编码有功能标记的连续核酸序列和编码重组酶的序列，所述编码标记和/或编码重组酶的序列的侧翼是至少两个位点特异性重组位点，而且所述位点特异性重组位点的侧翼是能够与靶位点的侧翼序列同源重组的序列，

从而在Rasamsonia细胞的靶位点实施重组。

2.根据权利要求1所述的方法，其中所述两种或更多种核酸总共包含能够与两个或更多个靶位点的侧翼序列同源重组的序列，以使所述两种或更多种核酸相互重组和与靶位点的侧翼序列重组导致在每个靶位点插入至少两个位点特异性重组位点，其中所述两种或更多种核酸的重组导致：

每个靶位点都存在编码有功能标记的连续序列；

至少一个靶位点存在编码有功能重组酶的序列；

所述编码标记和/或编码重组酶的序列位于至少两个位点特异性重组位点之间；和

所述位点特异性重组位点的侧翼是能够与靶位点的侧翼序列同源重组的序列。

3.根据权利要求1或2所述的方法，其中所述的至少两种核酸中的两种各包含编码无功能的部分重组酶的序列以使它们总共包含编码有功能重组酶的核酸序列。

4.根据前述权利要求中的任一项所述的方法，其包括表达重组酶以使位于位点特异性重组位点之间的序列被外重组。

5.根据权利要求4所述的方法，其中标记被外重组。

6.根据权利要求4或5所述的方法，其中重组酶的表达被诱导型启动子控制。

7.根据权利要求2至6中的任一项所述的方法，其中所述两种或更多种核酸总共包含编码至少两种不同标记的序列，其中对于每一种标记，所述两种或更多种核酸中的至少两种各包含编码无功能的部分标记的序列，以使所述两种或更多种核酸的重组导致不同的标记基因编码序列被插入在各靶位点。

8.根据权利要求7所述的方法，其中所述两种或更多种核酸的重组导致所述标记编码序列被插入在各靶位点，以使它们位于位点特异性重组位点之间并可通过重组酶的表达从靶位点被外重组。

9.根据前述权利要求中的任一项所述的方法，其中在体内实施所述核酸的相互重组和与靶位点的侧翼序列的重组。

10.根据权利要求4-9中的任一项所述的方法，其中在体内实施位于位点特异性重组位点之间的核酸序列的外重组。

11.根据前述权利要求中的任一项所述的方法，其中在Rasamsoniaemersonii细胞中实施体内重组。

12.根据前述权利要求中的任一项所述的方法，其中宿主细胞是亲本宿主细胞的变体，所述亲本宿主细胞优先进行非同源重组，其中所述变体中非同源重组/同源重组的比例比在相同条件下测量的所述亲本生物中的所述比例低。

13.根据前述权利要求中的任一项所述的方法，其中：所述位点特异性重组位点是lox位点，以及所述重组酶是Cre；所述位点特异性重组位点是FRT位点，以及所述重组酶是Flp；所述重组位点是Vlox位点，以及所述重组酶是VCre；或者所述重组位点是Slox，以及所述重组酶是SCre。

14.根据权利要求4-13中的任一项所述的方法，其中所述位点特异性重组位点使得表达重组酶之后的外重组在靶位点产生不被重组酶识别的一个突变的位点特异性重组位点。

15.根据前述权利要求中的任一项所述的方法，其中所述靶位点包含被破坏和/或部分或完全缺失的编码序列。

16.通过根据前述权利要求中的任一项所述的方法产生的Rasamsonia细胞。

17.根据权利要求16所述的Rasamsonia细胞，其是无标记的Rasamsonia细胞。

18.Rasamsonia细胞，其是无标记的并且其包含一种或更多种重组核酸序列。

19.根据权利要求16-18中的任一项所述的Rasamsonia细胞，其是亲本Rasamsonia的变体，其中突变体中NHR/HR的比例比在相同条件下测量的所述亲本细胞中的所述比例低。

20.Rasamsonia细胞，其是亲本Rasamsonia的变体，其中突变体中NHR/HR的比例比在相同条件下测量的所述亲本细胞中的所述比例低。

21.根据权利要求19或20所述的Rasamsonia细胞，其中编码参与NHR的组分的基因有缺陷，和/或参与NHR的组分的水平降低。

22.根据权利要求16-21中的任一项所述的Rasamsonia细胞，其中与Saccharomyces cerevisiae基因Ku70、Ku80、Rad50、Rad51、Rad52、Rad54、Rad55、Rad57、CDC2、LIG4或MRE11中的任意一种相对应的Rasamsonia基因的产物活性降低或有缺陷。

23.根据权利要求22所述的Rasamsonia细胞，其中在其基因组中，在编码以下多肽的序列中Rasamsonia基因具有修饰，所述多肽与SEQ IDNO:21、SEQ ID NO:24、SEQ ID NO:27、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:48、SEQ ID NO:51或SEQ ID NO:54中的任一种SEQID NO所示的多肽有至少30％的序列同一性。

24.Rasamsonia细胞，其中NHR/HR的比例低于约50，优选地低于约10，甚至更优选地低于约1，以及最优选地低于约0.001。

25.根据权利要求16-24中的任一项所述的Rasamsonia细胞，其在基因组中具有修饰以使其在产生至少一种天冬氨酸蛋白酶pepA方面有缺陷。

26.Rasamsonia细胞，其在基因组中具有修饰以使其在产生至少一种天冬氨酸蛋白酶pepA方面有缺陷。

27.根据权利要求25或26所述的Rasamsonia细胞，其中在其基因组中，在编码天冬氨酸蛋白酶pepA的序列中Rasamsonia基因具有修饰，所述天冬氨酸蛋白酶pepA与SEQ ID NO:59所示的多肽有至少30％的序列同一性。

28.根据权利要求16-27中的任一项所述的Rasamsonia细胞，所述Rasamsonia细胞能够产生期望的化合物，例如酶，任选地其由重组核酸编码。

29.根据权利要求16-28中的任一项所述的Rasamsonia细胞，其含有编码纤维素、半纤维素或果胶酶的重组核酸。

30.根据权利要求16-29中的任一项所述的Rasamsonia细胞，其是Rasamsonia emersonii细胞。

31.用于生产一种或更多种酶的多肽组合物的方法，所述方法包括下述步骤：

(a)通过在合适的培养基中培养根据权利要求16-30中的任一项所述的Rasamsonia细胞生产多肽组合物，其中所述细胞能够产生期望的多肽，例如酶，任选地其由重组核酸编码；和

(b)任选地，回收所述多肽组合物。

32.用于生产包含纤维素、半纤维素和/或果胶酶中的一种或更多种的多肽组合物的方法，其中所述方法包括下述步骤：

(a)通过在合适的培养基中培养根据权利要求16-31中的任一项所述的Rasamsonia细胞生产多肽组合物，其中所述细胞能够产生纤维素、半纤维素和/或果胶酶中的一种或更多种，任选地其由重组核酸编码；和

(b)任选地，回收所述多肽组合物。

33.能够来源于Rasamsonia细胞、优选Rasamsonia emersonii细胞的核酸序列，其编码参与非同源末端连接的多肽，其中所述核酸序列是：

34.能够来源于Rasamsonia细胞、优选Rasamsonia emersonii细胞的核酸序列，其编码pepA天冬氨酸蛋白酶，其中所述核酸序列是：

a.SEQ ID NO:58所示的核酸序列，或者

35.重组的核酸构建体，其包含根据权利要求33或34所述的核酸序列。

36.多肽，其由权利要求33或34所述的核酸编码。