CN119885826B - 一种基于多目标优化的菌株改造方法、系统、设备及介质 - Google Patents
一种基于多目标优化的菌株改造方法、系统、设备及介质Info
- Publication number
- CN119885826B CN119885826B CN202411775557.2A CN202411775557A CN119885826B CN 119885826 B CN119885826 B CN 119885826B CN 202411775557 A CN202411775557 A CN 202411775557A CN 119885826 B CN119885826 B CN 119885826B
- Authority
- CN
- China
- Prior art keywords
- nth
- population
- individuals
- parent population
- strain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/08—Probabilistic or stochastic CAD
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/10—Numerical modelling
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Physiology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种基于多目标优化的菌株改造方法、系统、设备及介质,本方法通过根据菌株改造的任务和需求,建立菌株改造的数学模型;根据菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法;根据菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;获取第N父代种群;根据第N父代种群交叉变异,得到第N变异种群;计算第N变异种群的更新性能指标,并根据更新性能指标确定第N+1父代种群;若第N+1父代种群符合预设条件,则根据第N+1父代种群生成菌株最优改造方案,能够利用多目标规划,以获取既能大量产出目标产物,又能实现稳态生长的菌株,进而提高特定化合物的产量,实现生产性能的增强。
Description
技术领域
本申请涉及优化菌株改造技术领域,尤其是涉及一种基于多目标优化的菌株改造方法、系统、设备及介质。
背景技术
随着信息技术的不断提高,在现代生物技术中,通过改变微生物的自然代谢途径可以提高特定化合物的产量,或引入新途径来生产非天然产品。在当前菌株改造技术中,现有的遗传算法优化仅仅考虑单因素的影响,无法达到最佳改造效果,而且通过现有技术对菌株采取不同的改造培育,无法对反应网络进行广泛修改,试验优化手段的可行性和效率,存在试验周期长、培育效果不理想以及效率低的技术问题。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本公开实施例的主要目的在于提出一种基于多目标优化的菌株改造方法、系统、设备及存储介质,能够优化细胞生长以及生长耦合合成,对高质量的优化策略进行识别和筛选,提高生产产量和生产性能。
本申请实施例的第一方面提供了一种基于多目标优化的菌株改造方法,用于中央控制器,所述方法包括:
根据菌株改造的任务和需求,建立所述菌株改造的数学模型;
根据所述菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法,以用于根据所述搜寻方法减少所述菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量;
根据所述菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;
获取第N父代种群;如果N为1,则所述第N父代种群是从所述初代种群中选择得到的,如果N为大于1的正整数,则所述第N父代种群是基于第N-1父代种群生成;
根据所述第N父代种群交叉变异,得到第N变异种群;
计算所述第N变异种群的更新性能指标,并根据所述更新性能指标确定第N+1父代种群;若所述第N+1父代种群符合预设条件,则根据所述第N+1父代种群生成菌株最优改造方案;
其中,所述从所述初代种群中选择第N父代种群的过程包括:
从所述初始种群中随机选择两个初始种群的个体;分别计算所述初始种群的个体的适应度,将所述适应度较大的个体作为第N前沿父代种群的个体;其中,如果两个所述初始种群的个体的适应度相同,则分别计算所述初始种群的个体的拥挤距离,将所述拥挤距离较大的个体作为第N前沿父代种群的个体;
分别计算所有所述初始种群中非第N前沿父代种群个体的适应度;根据所述初始种群中非第N前沿父代种群个体的适应度计算所有所述初始种群中非第N前沿父代种群个体的选中概率;利用轮盘赌方法,根据所述初始种群中非第N前沿父代种群个体的选中概率确定第N后续父代种群的个体;
将所述第N前沿父代种群和第N后续父代种群作为所述第N父代种群。
本申请实施例提供了一种基于多目标优化的菌株改造方法,通过根据菌株改造的任务和需求,建立菌株改造的数学模型;根据菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法;根据菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;获取第N父代种群;根据第N父代种群交叉变异,得到第N变异种群;计算第N变异种群的更新性能指标,并根据更新性能指标确定第N+1父代种群;若第N+1父代种群符合预设条件,则根据第N+1父代种群生成菌株最优改造方案,能够利用多目标规划,以获取既能大量产出目标产物,又能实现稳态生长的菌株,进而提高特定化合物的产量,实现生产性能的增强。
在本申请的一些实施例中,所述菌株改造的数学模型包括:
设定一个菌株含有m个代谢物和n个反应的代谢网络,所述代谢网络的代谢空间定义为:
FS(v)={v∈Rn|Sv=0,lb≤v≤ub};
其中,FS(v)表示v的代谢空间,S为反应m行和n列的化学计量系数矩阵,v为代谢网络上反应速率向量,lb和ub为v的范围值;
构建满足如下条件的两个优化目标:最坏情况下最大化给定产物P的产率max minwP,wP为菌株改造后产物P的产率和最大化产率与菌株生长的耦合强度max min Cs:
u∈FS(u),w∈FS(w);
其中,u和w分别代表了野生型和扰动稳态的速率向量,F>1为用户定义的u和w之间的变化倍数,J为可改动的反应的集合,是二元0-1变量,分别表示j∈J的上调、下调和敲除操作,K为预设的修改数量的最大值,限制条件确保了候选反应只能执行上调、下调、敲除中的一种操作,max或max(A(B=C))是指计算在B=C时A的最大或最小值,wg和wp分别为在所考虑的设计策略下扰动网络的生长速率和生产速率,为最大生长速率。
在本申请的一些实施例中,所述根据所述搜寻方法减少所述菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量,包括:
根据所述搜寻方法,剔除所述代谢网络中不符合预设条件的菌株反应;
对所述菌株反应进行压缩,得到作为所述菌株改造的数学模型所描述的多目标智能优化任务中的候选变量;
所述提出基于多目标优化的菌株改造靶点的搜寻方法之后,还包括:
根据所述代谢网络对所述菌株反应进行染色体编码,得到多个菌株染色体,所述菌株染色体包含至少一个所述菌株反应。
在本申请的一些实施例中,所述根据所述第N父代种群交叉变异,得到第N变异种群,包括:
从所述第N父代种群的个体中随机选择一个染色体位置作为交叉点;
在所述交叉点处将所述第N父代种群的个体的染色体片段进行交换,得到处理后的第N父代种群的个体;
从所述处理后的第N父代种群的个体中随机选择至少一个染色体位置作为变异点;
在所有所述变异点处将所述处理后的第N父代种群的个体对应的染色体进行变异,得到第N子代种群的个体;
将所述第N父代种群与所述第N子代种群结合,得到所述第N变异种群。
在本申请的一些实施例中,所述计算所述第N变异种群的更新性能指标,根据所述更新性能指标确定所述第N+1父代种群,包括:
根据所述菌株改造的数学模型计算所有所述第N变异种群中个体的目标值;
根据所述第N变异种群中个体的目标值对所述第N变异种群的个体进行非支配度排序,确定每个所述第N变异种群的个体的非支配层级;
计算每一所述非支配层级中个体的拥挤距离;
根据所述第N变异种群的个体的非支配层级确定所述第N+1父代种群的个体,在所述非支配层级中个体数量大于第N+1父代种群大小的情况下,将所述非支配层级中个体的拥挤距离最高的个体作为所述第N+1父代种群的个体。
在本申请的一些实施例中,所述计算所述第N变异种群的更新性能指标,根据所述更新性能指标确定所述第N+1父代种群,包括:
根据所述代谢网络计算所有所述第N变异种群中个体的目标值;
根据所述第N变异种群中个体的目标值对所述第N变异种群的个体进行非支配度排序,确定每个所述第N变异种群的个体的非支配层级;
计算每一所述非支配层级中个体的拥挤距离;
根据所述第N变异种群的个体的非支配层级确定所述第N+1父代种群的个体,在所述非支配层级中个体数量大于第N+1父代种群大小的情况下,将所述非支配层级中个体的拥挤距离最高的个体作为所述第N+1父代种群的个体。
在本申请的一些实施例中,所述计算拥挤距离的公式包括:
CDfirst,n=CDend,n=1;
其中,yi-1,n表示第i-1个个体的第n个目标值,yi+1,n表示第i+1个个体的第n个目标值,yfirst,n表示当前父代种群第一个个体的第n个目标值,yend,n表示当前父代种群中最后一个个体的第n个目标值,CDi,n代表第i个个体第n个目标值yi,n的拥挤距离,CDi代表第i个个体中拥挤距离的总值。
为实现上述目的,本发明实施例的第二方面提供一种基于多目标优化的菌株改造系统,所述系统包括:
建立模块,用于根据菌株改造的任务和需求,建立所述菌株改造的数学模型;
优化模块,用于根据所述菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法,以用于根据所述搜寻方法减少所述菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量;
构建模块,用于根据所述菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;
获取模块,用于获取第N父代种群;如果N为1,则所述第N父代种群是从所述初代种群中选择得到的,如果N为大于1的正整数,则所述第N父代种群是基于第N-1父代种群生成;
迭代模块,用于根据所述第N父代种群交叉变异,得到第N变异种群;
更新模块,用于计算所述第N变异种群的更新性能指标,并根据所述更新性能指标确定所述第N+1父代种群;若所述第N+1父代种群符合预设条件,则根据所述第N+1父代种群生成菌株最优改造方案;
其中,所述从所述初代种群中选择第N父代种群的过程包括:
从所述初始种群中随机选择两个初始种群的个体;分别计算所述初始种群的个体的适应度,将所述适应度较大的个体作为第N前沿父代种群的个体;其中,如果两个所述初始种群的个体的适应度相同,则分别计算所述初始种群的个体的拥挤距离,将所述拥挤距离较大的个体作为第N前沿父代种群的个体;
分别计算所有所述初始种群中非第N前沿父代种群个体的适应度;根据所述初始种群中非第N前沿父代种群个体的适应度计算所有所述初始种群中非第N前沿父代种群个体的选中概率;利用轮盘赌方法,根据所述初始种群中非第N前沿父代种群个体的选中概率确定第N后续父代种群的个体;
将所述第N前沿父代种群和第N后续父代种群作为所述第N父代种群。
为实现上述目的,本发明实施例的第三方面提供一种电子设备,包括:至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行上述的一种基于多目标优化的菌株改造方法。
为实现上述目的,本发明实施例的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述的一种基于多目标优化的菌株改造方法。
可以理解的是,上述第二方面至第四方面和相关技术相比存在的有益效果和上述第一方面和相关技术相比存在的有益效果相同,可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请实施例提供的一种基于多目标优化的菌株改造方法的流程示意图;
图2是本申请实施例提供的一种基于多目标优化的菌株改造方法的迭代示意图;
图3是本申请实施例提供的一实施方式的生成的最后种群的帕累托前沿;
图4是本申请实施例提供的一种基于多目标优化的菌株改造系统的结构示意图;
图5是本申请实施例提供的电子设备的硬件结构示意图。
具体实施方式
下面详细描述本申请的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。
在本申请的描述中,如果有描述到第一、第二等只是用于区分技术特征为目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量或者隐含指明所指示的技术特征的先后关系。
在本申请的描述中,需要理解的是,涉及到方位描述,例如上、下等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
本申请的描述中,需要说明的是,除非另有明确的限定,设置、安装、连接等词语应做广义理解,所属技术领域技术人员可以结合技术方案的具体内容合理确定上述词语在本申请中的具体含义。
首先,对本申请中涉及的若干名词进行解析:
在菌株培育设计领域,多目标优化菌株指的是利用多目标规划,实现对菌株培育的产能提高,并优化菌株培育效果。
微生物细胞工厂(MCFs)是通过现代生物技术手段改造的生物系统,能够高效地生产目标产品,其主要涉及改变微生物的自然代谢途径,以提高特定化合物的产量,或引入新途径来生产非天然产品。
在实际工业生产中,微生物细胞工厂的可行性需要对反应网络进行广泛修改,以增强其生产性能。然而在当前菌株改造技术中,现有的遗传算法优化仅仅考虑单因素的影响,无法达到最佳改造效果,而且通过现有技术对菌株采取不同的改造培育,无法对反应网络进行广泛修改,试验改造手段的可行性和效率,存在试验周期长、培育效果不理想以及效率低的技术问题。
基于此,本申请实施例提供了一种基于多目标优化的菌株改造方法、系统、电子设备及介质,旨在改造细胞生长以及生长耦合合成,对高质量的优化策略进行识别和筛选,提高生产产量和生产性能。
本申请实施例提供的基于多目标优化的菌株改造方法、系统、电子设备及介质,具体通过如下实施例进行说明,首先描述本申请实施例中的基于多目标优化的菌株改造方法。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
本申请实施例提供的基于多目标优化的菌株改造方法,涉及菌株改造技术领域。本申请实施例提供的基于多目标优化的菌株改造方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现基于多目标优化的菌株改造的应用等,但并不局限于以上形式。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
需要说明的是,在本申请的各个具体实施方式中,当涉及到需要根据用户信息、用户行为数据,用户历史数据以及用户位置信息等与用户身份或特性相关的数据进行相关处理时,都会先获得用户的许可或者同意,而且,对这些数据的收集、使用和处理等,都会遵守相关法律法规和标准。此外,当本申请实施例需要获取用户的敏感个人信息时,会通过弹窗或者跳转到确认页面等方式获得用户的单独许可或者单独同意,在明确获得用户的单独许可或者单独同意之后,再获取用于使本申请实施例能够正常运行的必要的用户相关数据。
为此,参照图1,本申请实施例提供了一种基于多目标优化的菌株改造方法,本方法应用于中央控制器,控制器可以是服务器,可以是电子设备,也可以是移动终端等,这里不作具体限定,方法包括如下步骤S110至步骤S160:
步骤S110、根据菌株改造的任务和需求,建立菌株改造的数学模型。
在本步骤中,首先根据菌株改造的任务和需求,通过实验室技术(如质谱分析)来确定特定条件下菌株产生的代谢产物,也可以利用已有的生物信息学数据库(如KEGG,MetaCyc等),根据菌株名称或基因组信息查询其可能的代谢路径及参与的酶,获取菌株代谢物和菌株反应,进而建立菌株改造的数学模型。
以下对菌株改造的数学模型进行具体解释:
设定一个菌株含有m个代谢物和n个反应的代谢网络,代谢网络的代谢空间定义为:
FS(v)={v∈rn|Sv=0,lb≤v≤ub};
其中,FS(v)表示v的代谢空间,S为反应m行和n列的化学计量系数矩阵,v为代谢网络上反应速率向量,lb和ub为v的范围值;
构建满足如下条件的两个优化目标:最坏情况下最大化给定产物P的产率max minwP2,wP为菌株改造后产物P的产率和最大化产率与菌株生长的耦合强度max min CS:
耦合强度约束表示为:
速率上调约束表示为:
速率下调约束表示为:
反应敲除约束表示为:
可行操作约束表示为:
操作数量约束表示为:
通量空间约束表示为:
u∈FS(u),w∈FS(w);
操作变量约束表示为:
其中,为目标代谢物的生产速率,u和w分别代表了野生型和扰动稳态的速率向量,F>1为用户定义的u和w之间的变化倍数,J为可改动的反应的集合,是二元0-1变量,分别表示j∈J的上调、下调和敲除操作,K为预设的修改数量的最大值,限制条件确保了候选反应只能执行上调、下调、敲除中的一种操作,max或max(A(B=C))是指计算在B=C时A的最大或最小值,wg和wp分别为在所考虑的设计策略下扰动网络的生长速率和生产速率,为最大生长速率。
步骤S120、根据菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法,以用于根据搜寻方法减少菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量。
在本步骤中,菌株改造靶点指根据菌株改造的数学模型,确定最终菌株改造的主要靶点的反应,根据菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法具体包括对菌株的代谢网络进行全面分析,识别所有潜在的可调控反应,进而根据识别出的可调控反应和分析结果确定减少菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量,不仅能够有效地减少多目标智能优化任务中作为候选变量的菌株反应数量,还能够在保证细胞稳态的前提下提高目标产物的生产效率。
在一些实施例中,在步骤S120中根据搜寻方法减少菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量,包括如下步骤:
步骤S210、根据搜寻方法,剔除代谢网络中不符合预设条件的菌株反应;
步骤S220、对菌株反应进行压缩,得到作为菌株改造的数学模型所描述的多目标智能优化任务中的候选变量。
在本实施例中,根据基于多目标优化的菌株改造靶点的搜寻方法所识别出的可调控反应和分析结果确定减少菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量,首先剔除那些在代谢网络中始终不活跃或具有恒定通量值的菌株反应,即不会影响细胞稳态和产物产量的菌株反应,然后对线性反应路径压缩,具体可以为对于仅有一个反应产物作为另一反应唯一底物的情况进行合并处理,以减少代谢网络中的冗余反应数,从而可以简化模型,确保原始代谢网络与简化后的代谢网络的化学计量矩阵S保持一致,同时减少了J中元素的数量,同时保持整体代谢流的一致性。
在一些实施例中,在步骤S120提出基于多目标优化的菌株改造靶点的搜寻方法之后,还包括如下步骤:
根据代谢网络对菌株反应进行染色体编码,得到多个菌株染色体,菌株染色体包含至少一个菌株反应。
在一实施方式中,首先进行染色体的编码,代谢网络中有n个可调控反应,将染色体定义为一个包含n个元素的向量,每个元素对应一个反应的操作,每个反应可以被上调、下调、停用,或不进行扰动。因此,染色体的每个元素可以采取四种操作之一:0(无扰动)、1(上调)、2(下调)、3(敲除),通过对染色体进行编码,使得问题可以通过改进后的非0-1编码遗传算法迭代求解,且有利于在计算机设备上实现。
在本步骤中,根据代谢网络对菌株反应进行染色体编码,是将每个可调控的菌株反应转化为一个数字或符号,以便在遗传算法中处理,使得问题可以通过改进后的非0-1编码遗传算法迭代求解,且有利于在计算机设备上实现。
步骤S130、根据菌株改造的数学模型所描述的多目标智能优化任务构建初代种群。
步骤S140、获取第N父代种群;如果N为1,则第N父代种群是从初代种群中选择得到的,如果N为大于1的正整数,则第N父代种群是基于第N-1父代种群生成。
在本步骤中,第1父代种群是从初代种群中选择得到的,当N为大于1的正整数时,则第N父代种群是基于第N-1父代种群生成。
以下解释从初代种群中选择第N父代种群的过程包括:
从初始种群中随机选择两个初始种群的个体;分别计算初始种群的个体的适应度,将适应度较大的个体作为第N前沿父代种群的个体;其中,如果两个初始种群的个体的适应度相同,则分别计算初始种群的个体的拥挤距离,将拥挤距离较大的个体作为第N前沿父代种群的个体;
分别计算所有初始种群中非第N前沿父代种群个体的适应度;根据初始种群中非第N前沿父代种群个体的适应度计算所有初始种群中非第N前沿父代种群个体的选中概率;利用轮盘赌方法,根据初始种群中非第N前沿父代种群个体的选中概率确定第N后续父代种群的个体;
将第N前沿父代种群和第N后续父代种群作为第N父代种群。
在一实施方式中,建立改进的非支配排序遗传算法II(NSGA-II),形成初始的设计种群,并执行初次评估,然后通过随机生成的方式建立初始种群,另外,考虑到实际应用中难以修改代谢网络中的大量反应,因而将非零条目设定为式中的K值。同时,考虑到过多反应的敲除可能导致细胞死亡,为了增加生成可行解的可能性,将敲除反应的数量限制为最多3个,使得初始生成的种群具有合理性和可实现性。
进一步地,为了选择交叉变异的个体,采用了轮盘赌选择和锦标赛选择相结合的方法。其中第N前沿父代种群表示用于在前20%的迭代中被选择的父代种群,应用2-锦标赛选择方法,根据染色体在非支配排序中的排名进行选择;若出现平局,则比较染色体的拥挤距离。第N后续父代种群表示用于在随后的80%迭代中被选择的父代种群,采用轮盘赌选择,依据染色体的适应度(定义为染色体的拥挤距离),边界个体的适应度被设定为1。
通过在交叉个体的选择采用锦标赛与轮盘赌相结合的方式进行,使得高质量的染色体具有更高的交叉概率,从而引导种群迭代朝着更好的解决方案发展,同时设置了交叉位点至少存在一个非零项,保证了交叉的有效性。
以下解释计算拥挤距离的公式包括:
CDfirst,n=CDend,n=1;
其中,yi-1,n表示第i-1个个体的第n个目标值,yi+1,n表示第i+1个个体的第n个目标值,yfirst,n表示当前父代种群第一个个体的第n个目标值,yend,n表示当前父代种群中最后一个个体的第n个目标值,CDi,n代表第i个个体第n个目标值yi,n的拥挤距离,CDi代表第i个个体中拥挤距离的总值。
在一实施方式中,对初始种群中的每个个体根据适应度值(即细胞生长率和目标反应的产率)进行单独评估,并结合拥挤距离计算和非支配排序,其结果将用于配对选择,以执行交叉操作。
步骤S150、根据第N父代种群交叉变异,得到第N变异种群。
在本步骤中,首先根据第N父代种群交叉变异,得到第N子代种群,然后将第N父代种群与第N子代种群结合,得到第N变异种群。
在一些实施例中,在步骤S150中根据第N父代种群交叉变异,得到第N变异种群,包括如下步骤:
步骤S310、从第N父代种群的个体中随机选择一个染色体位置作为交叉点;
步骤S320、在交叉点处将第N父代种群的个体的染色体片段进行交换,得到处理后的第N父代种群的个体;
步骤S330、从处理后的第N父代种群的个体中随机选择至少一个染色体位置作为变异点,在所有变异点处将处理后的第N父代种群的个体对应的染色体进行变异,得到第N子代种群的个体;
步骤S340、将第N父代种群与第N子代种群结合,得到第N变异种群。
在本实施例中,交叉操作采用了简单的单点交叉方法,从第N父代种群的个体中随机选择一个染色体位置作为交叉点,在交叉点处将第N父代种群的个体的染色体片段进行交换,得到处理后的第N父代种群的个体,交叉时要保证至少一个非零点位参与了交叉,以确保交叉操作的有效性。
进一步地,变异操作采用多点变异生成变异染色体,从处理后的第N父代种群的个体中随机选择至少一个染色体位置作为变异点,在所有变异点处将处理后的第N父代种群的个体对应的染色体进行变异,得到第N子代种群的个体;进而将第N父代种群与第N子代种群结合,得到第N变异种群。
在一实施方式中,在步骤S330中将处理后的第N父代种群的个体对应的染色体进行变异的过程,包括如下步骤:
步骤S410、随机生成第一变异值;
步骤S420、在第一变异值小于或等于预设变异概率的情况下,将处理后的第N父代种群的个体对应的染色体替换为第二变异值,得到变异后第N父代种群的个体;在第一变异值大于预设变异概率的情况下,将处理后的第N父代种群的个体作为变异后第N父代种群的个体,其中,第二变异值为预设范围内随机生成的数值;
步骤S430、根据变异后第N父代种群的个体确定变异后第N父代种群中个体的非零元素;
步骤S440、在非零元素的数量大于预设数量的情况下,随机将变异后第N父代种群的个体中至少一个非零元素替换为零元素,直至非零元素的数量小于等于预设数量,以得到第N子代种群的个体;
步骤S450、在非零元素的数量小于或等于预设数量的情况下,将变异后第N父代种群的个体作为第N子代种群的个体。
在本实施例中,第一变异值优选为0~1范围内的随机数字,在第一变异值小于或等于预设变异概率的情况下,将处理后的第N父代种群的个体对应的染色体替换为第二变异值,得到变异后第N父代种群的个体;在第一变异值大于预设变异概率的情况下,将处理后的第N父代种群的个体作为变异后第N父代种群的个体,其中,第二变异值优选为0到3之间的随机整数,对于变异后得到的新个体,统计其染色体上非零元素的数量,如果非零元素的数量超过了预设的最大数量限制,则随机选择至少一个非零元素并将其置为0,直到非零元素的数量满足要求为止,在非零元素的数量小于或等于预设数量的情况下,将变异后第N父代种群的个体作为第N子代种群的个体,确保变异操作不会破坏染色体的基本结构。
在一实施方式中,将随机生成的数字r(范围在[0,1]内)与预定义的变异概率Pm进行比较,如果r≤Pm,则相应位置会发生变异,原始值被替换为0到3之间的随机整数。对变异后的解进行可行性检查。特别地,如果变异解中非零元素的数量超过K,则会随机选择一些非零元素并将其重置为零,直到非零元素的总数不超过K。变异后,将原始种群和变异个体结合,并进一步进行非支配排序和环境选择等操作。
步骤S160、计算第N变异种群的更新性能指标,并根据更新性能指标确定第N+1父代种群;若第N+1父代种群符合预设条件,则根据第N+1父代种群生成菌株最优改造方案。
在本步骤中,根据代谢网络计算所有第N变异种群中个体的目标值,根据第N变异种群中个体的目标值对第N变异种群的个体进行非支配度排序,确定每个第N变异种群的个体的非支配层级,计算每一非支配层级中个体的拥挤距离,根据第N变异种群的个体的非支配层级确定第N+1父代种群的个体,在非支配层级中个体数量大于第N+1父代种群大小的情况下,将非支配层级中个体的拥挤距离最高的个体作为第N+1父代种群的个体。
在一些实施例中,在步骤S160中计算第N变异种群的更新性能指标,根据更新性能指标确定第N+1父代种群,包括如下步骤:
步骤S510、根据代谢网络计算所有第N变异种群中个体的目标值;
步骤S520、根据第N变异种群中个体的目标值对第N变异种群的个体进行非支配度排序,确定每个第N变异种群的个体的非支配层级;
步骤S530、计算每一非支配层级中个体的拥挤距离;
步骤S540、根据第N变异种群的个体的非支配层级确定第N+1父代种群的个体,在非支配层级中个体数量大于第N+1父代种群大小的情况下,将非支配层级中个体的拥挤距离最高的个体作为第N+1父代种群的个体。
在本实施例中,构建并执行非支配度排序与拥挤度排序,对经过交叉变异的种群个体进行评估,并筛选优秀个体形成新的子代,通过计算变异种群中个体的目标值进行量化评估考量,为进一步的筛选形成新的父代提供数据的支撑。
对于任一父代种群中第i个个体的第n个目标值yi,n,利用如下公式计算该个体拥挤距离:
CDfirst,n=CDend,n=1;
其中,yi-1,n表示第i-1个个体的第n个目标值,yi+1,n表示第i+1个个体的第n个目标值,yfirst,n表示当前父代种群第一个个体的第n个目标值,yend,n表示当前父代种群中最后一个个体的第n个目标值,CDi,n代表第i个个体第n个目标值yi,n的拥挤距离,CDi代表第i个个体中拥挤距离的总值,拥挤度值用于区分同一前沿上的个体,值高的个体相对更加分散,在选择时可以优先考虑更具多样性的个体。
其中,个体x1对另一个个体x2的支配关系是指x1的目标值大于x2的目标值,因此确定支配关系后,未被任何其他个体支配的个体被归类为第一前沿个体。仅被第一前沿个体支配的个体被归类为第二前沿个体,以此类推,完成所有个体的前沿分配,之后将每个前沿的个体按目标值降序排列。
最后,依据非支配度前沿等级选择个体,当超过设定的种群数量上限时,选取拥挤度更高的个体形成新的父代,进入下一次循环,直至满足迭代要求,此处迭代要求并不限定。
在本实施例的一实施方式中,结合大肠杆菌中过量生产琥珀酸这一案例对本发明所提出的方法进行说明,我们旨在将我们的方法应用于这一任务,以期识别出合理的设计策略,在保证大肠杆菌存活生长的同时,以实现高琥珀酸生产。
本发明提出了一种基于多目标改造的偶联型细胞菌株的设计方法,包括以下步骤:
首先,建立大肠杆菌的代谢模型。在本案例中,采用了最新的大肠杆菌基因组规模代谢网络模型iML1515。同时,建立多目标的数学优化模型如下:
u∈FS(u),w∈FS(w);
其中,为琥珀酸(succinate)的生产速率,u和w分别代表了野生型和扰动稳态的通量向量,F>1为用户定义的u和w之间的变化倍数,在本实现方式中设定其为2,J为可改动的反应的集合。是二元0-1变量,分别表示j∈J的上调、下调和敲除操作,K代表着人为设定的修改数量的最大值,在本实现方式中设定为10。
进一步地,建立简化模型,剔除在代谢网络中始终不活跃或具有恒定通量值的反应,并对线性反应进行压缩。iML1515模型包含1515个与2719个反应相连的基因,涉及1192种代谢物。经过模型压缩和候选反应的筛选,我们获得了352个聚合反应作为干扰候选。这352个聚合反应构成了集合J。
进一步地,运行NSGA-II算法,NSGA-II算法的流程图如图2所示,在本实施方式中,设定种群的数量为100,并改造最多100代。交叉率设定为0.9,突变率为1/L,其中L是二进制决策变量的总数。对种群进行初始化,同时满足以及敲除数量不超过三个的初始条件,进而进行初次的非支配度与拥挤度排序,以便于初次的交叉操作。
进一步地,进行交叉变异操作,依据交叉概率计算发生交叉的个体,采用锦标赛与轮盘赌结合的方式进行个体选择,在前20%的迭代中,应用2-锦标赛选择方法,根据染色体在非支配排序中的排名进行选择;若出现平局,则比较染色体的拥挤距离。在随后的80%迭代中,采用轮盘赌选择,依据染色体的适应度(定义为染色体的拥挤距离),边界个体的适应度被设定为1。发生单点交叉,并保证交叉的有效性,禁止出现0-0交叉。
进一步地,设定变异概率Pm为1/L,将随机生成的数字r(范围在[0,1]内)与预定义的变异概率Pm进行比较。如果r≤Pm,则相应位置会发生变异,原始值被替换为0到3之间的随机整数。对变异后的解进行可行性检查。特别地,如果变异解中非零元素的数量超过K,则会随机选择一些非零元素并将其重置为零,直到非零元素的总数不超过K。变异后,将原始种群和变异个体结合,并进一步进行非支配排序和环境选择等操作。
进一步地,进行非支配度排序,确定支配关系后,未被任何其他个体支配的个体被归类为第一前沿个体,仅被第一前沿个体支配的个体被归类为第二前沿个体,以此类推,完成所有个体的前沿分配,之后将每个前沿的个体按目标值降序排列。
最后,依据非支配度前沿等级对种群进化进行选择,根据迭代条件判断,当超过设定的种群数量上限时,选取拥挤度更高的个体形成新的父代,进入下一次循环,直至完成100次迭代,其中,生成的最后种群的帕累托前沿如图3所示,最后选择的优秀个体修改状况如表1所示。
表1
| 结果 | 上调 | 下调 | 敲除 | 修改次数 |
| 1 | RBFK | \ | R5PP | 2 |
| 2 | DHORD5 | ALLTN,DHORTS | ACHBS,FLVR,PETNT181pp,R5PP | 7 |
在本实施例中,首先对菌株进行建模,建立代谢网络模型并引入改进过的非支配排序遗传算法通过数学建模,建立该类设计的多目标优化问题模型,初始化过程强调合理性与可实现性,既保证个体的存活,又符合实际,能实现对高质量的优化策略进行识别和筛选。与传统的交叉个体选择方法不同,通过设计锦标赛与轮盘赌结合的交叉个体选择方法,加快种群的收敛速度。根据非支配度排序和拥挤度排序的结果筛选个体成为新的父代,使得种群向着最优解的方向不断改造的同时,保持了一定的种群多样性,而且可以将产物生产与生长相耦合,并提供相应的个体修改策略,在提高产量的同时保持细胞的稳态,在菌株设计上有着广泛的应用,体现了其在生物制造领域设计高产菌株方面的前景。
如图4所示,本申请的一些实施例,提供了一种基于多目标优化的菌株改造系统,系统包括建立模块410、优化模块420、构建模块430、获取模块440、迭代模块450、更新模块460,具体的:
建立模块410,用于根据菌株改造的任务和需求,建立菌株改造的数学模型;
优化模块420,用于根据菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法,以用于根据搜寻方法减少菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量;
构建模块430,用于根据菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;
获取模块440,用于获取第N父代种群;如果N为1,则第N父代种群是从初代种群中选择得到的,如果N为大于1的正整数,则第N父代种群是基于第N-1父代种群生成;
迭代模块450,用于根据第N父代种群交叉变异,得到第N变异种群;
更新模块460,用于计算第N变异种群的更新性能指标,并根据更新性能指标确定第N+1父代种群;若第N+1父代种群符合预设条件,则根据第N+1父代种群生成菌株最优改造方案;
其中,从初代种群中选择第N父代种群的过程包括:
从初始种群中随机选择两个初始种群的个体;分别计算初始种群的个体的适应度,将适应度较大的个体作为第N前沿父代种群的个体;其中,如果两个初始种群的个体的适应度相同,则分别计算初始种群的个体的拥挤距离,将拥挤距离较大的个体作为第N前沿父代种群的个体;
分别计算所有初始种群中非第N前沿父代种群个体的适应度;根据初始种群中非第N前沿父代种群个体的适应度计算所有初始种群中非第N前沿父代种群个体的选中概率;利用轮盘赌方法,根据初始种群中非第N前沿父代种群个体的选中概率确定第N后续父代种群的个体;
将第N前沿父代种群和第N后续父代种群作为第N父代种群。
在一些实施方式中,建立模块410可以包括:
设定一个菌株含有m个代谢物和n个反应的代谢网络,代谢网络的代谢空间定义为:
FS(v)={v∈Rn|Sv=0,lb≤v≤ub};
其中,FS(v)表示v的代谢空间,S为反应m行和n列的化学计量系数矩阵,v为代谢网络上反应速率向量,lb和ub为v的范围值;
构建满足如下条件的两个优化目标:最坏情况下最大化给定产物P的产率max minwP,wP为菌株改造后产物P的产率和最大化产率与菌株生长的耦合强度max min Cs:
u∈FS(u),w∈FS(w);
其中,u和w分别代表了野生型和扰动稳态的反应的速率向量,F>1为用户定义的u和w之间的变化倍数,J为可改动的反应的集合,是二元0-1变量,分别表示j∈J的上调、下调和敲除操作,K为预设的修改数量的最大值,限制条件确保了候选反应只能执行上调、下调、敲除中的一种操作,max或max(A(B=C))是指计算在B=C时A的最大或最小值,wg和wp分别为在所考虑的设计策略下扰动网络的生长速率和生产速率,为最大生长速率。
在一些实施方式中,优化模块420可以包括:根据搜寻方法,剔除代谢网络中不符合预设条件的菌株反应。
在一些实施方式中,优化模块420可以包括:对菌株反应进行压缩,得到作为菌株改造的数学模型所描述的多目标智能优化任务中的候选变量。
在一些实施方式中,优化模块420可以包括:根据代谢网络对菌株反应进行染色体编码,得到多个菌株染色体,菌株染色体包含至少一个菌株反应。
在一些实施方式中,迭代模块450可以包括:从第N父代种群的个体中随机选择一个染色体位置作为交叉点。
在一些实施方式中,迭代模块450可以包括:在交叉点处将第N父代种群的个体的染色体片段进行交换,得到处理后的第N父代种群的个体。
在一些实施方式中,迭代模块450可以包括:从处理后的第N父代种群的个体中随机选择至少一个染色体位置作为变异点。
在一些实施方式中,迭代模块450可以包括:在所有变异点处将处理后的第N父代种群的个体对应的染色体进行变异,得到第N子代种群的个体。
在一些实施方式中,迭代模块450可以包括:将第N父代种群与第N子代种群结合,得到第N变异种群。
在一些实施方式中,迭代模块450可以包括:随机生成第一变异值。
在一些实施方式中,迭代模块450可以包括:在第一变异值小于或等于预设变异概率的情况下,将处理后的第N父代种群的个体对应的染色体替换为第二变异值,得到变异后第N父代种群的个体;在第一变异值大于预设变异概率的情况下,将处理后的第N父代种群的个体作为变异后第N父代种群的个体,其中,第二变异值为预设范围内随机生成的数值。
在一些实施方式中,迭代模块450可以包括:根据变异后第N父代种群的个体确定变异后第N父代种群中个体的非零元素。
在一些实施方式中,迭代模块450可以包括:在非零元素的数量大于预设数量的情况下,随机将变异后第N父代种群的个体中至少一个非零元素替换为零元素,直至非零元素的数量小于等于预设数量,以得到第N子代种群的个体。
在一些实施方式中,迭代模块450可以包括:在非零元素的数量小于或等于预设数量的情况下,将变异后第N父代种群的个体作为第N子代种群的个体。
在一些实施方式中,更新模块460可以包括:根据代谢网络计算所有第N变异种群中个体的目标值。
在一些实施方式中,更新模块460可以包括:根据第N变异种群中个体的目标值对第N变异种群的个体进行非支配度排序,确定每个第N变异种群的个体的非支配层级。
在一些实施方式中,更新模块460可以包括:计算每一非支配层级中个体的拥挤距离。
在一些实施方式中,更新模块460可以包括:根据第N变异种群的个体的非支配层级确定第N+1父代种群的个体,在非支配层级中个体数量大于第N+1父代种群大小的情况下,将非支配层级中个体的拥挤距离最高的个体作为第N+1父代种群的个体。
在一些实施方式中,更新模块460可以包括:
CDfirst,n=CDend,n=1;
其中,yi-1,n表示第i-1个个体的第n个目标值,yi+1,n表示第i+1个个体的第n个目标值,yfirst,n表示当前父代种群第一个个体的第n个目标值,yend,n表示当前父代种群中最后一个个体的第n个目标值,CDi,n代表第i个个体第n个目标值yi,n的拥挤距离,CDi代表第i个个体中拥挤距离的总值。
需要注意的是,本实施例提供的基于多目标优化的菌株改造系统与上述的基于多目标优化的菌株改造方法是基于相同的发明构思,因此上述的基于多目标优化的菌株改造方法的相关内容同样适用于基于多目标优化的菌株改造系统的内容,因此,此处不再赘述。
为了解决现有技术耗时长、改造效果不好以及效率低的技术问题,系统通过根据菌株改造的任务和需求,建立菌株改造的数学模型;根据菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法;根据菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;获取第N父代种群;根据第N父代种群交叉变异,得到第N变异种群;计算第N变异种群的更新性能指标,并根据更新性能指标确定第N+1父代种群;若第N+1父代种群符合预设条件,则根据第N+1父代种群生成菌株最优改造方案,能够利用多目标规划,以获取既能大量产出目标产物,又能实现稳态生长的菌株,进而提高特定化合物的产量,实现生产性能的增强。
本申请实施例还提供了一种电子设备,电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述基于多目标优化的菌株改造方法。
如图5,图5为本申请实施例提供的电子设备的硬件结构示意图,电子设备包括:
至少一块电池;
至少一个存储器;
至少一个处理器;
至少一个程序;
程序被存储在存储器中,处理器执行至少一个程序以实现本公开实施上述的一种基于多目标优化的菌株改造方法。
该电子设备可以为包括手机、平板电脑、个人数字助理(PersonalDigitalAssistant,PDA)、车载电脑等任意智能终端。
下面对本申请实施例的电子设备进行详细介绍。
处理器1600,可以采用通用的中央处理器(Central Processing Unit,CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本公开实施例所提供的技术方案;
存储器1700,可以采用只读存储器(Read Only Memory,ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory,RAM)等形式实现。存储器1700可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1700中,并由处理器1600来调用执行本公开实施例的一种基于多目标优化的菌株改造方法。
输入/输出接口1800,用于实现信息输入及输出;
通信接口1900,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信;
总线2000,在设备的各个组件(例如处理器1600、存储器1700、输入/输出接口1800和通信接口1900)之间传输信息;
其中处理器1600、存储器1700、输入/输出接口1800和通信接口1900通过总线2000实现彼此之间在设备内部的通信连接。
本公开实施例还提供了一种存储介质,该存储介质是计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,该计算机可执行指令用于使计算机执行上述一种基于多目标优化的菌株改造方法。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本公开实施例描述的实施例是为了更加清楚的说明本公开实施例的技术方案,并不构成对于本公开实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本公开实施例提供的技术方案对于类似的技术问题,同样适用。
本领域技术人员可以理解的是,图中示出的技术方案并不构成对本公开实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台电子设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序的介质。
以上是对本申请实施例的较佳实施进行了具体说明,但本申请实施例并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请实施例精神的前提下还可作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请实施例权利要求所限定的范围内。
上面结合附图对本申请实施例作了详细说明,但本申请不限于上述实施例,在所属技术领域普通技术人员所具备的知识范围内,还可以在不脱离本申请宗旨的前提下作出各种变化。
Claims (9)
1.一种基于多目标优化的菌株改造方法,其特征在于,所述方法包括:
根据菌株改造的任务和需求,建立所述菌株改造的数学模型;
根据所述菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法,以用于根据所述搜寻方法减少所述菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量;
根据所述菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;
获取第N父代种群;如果N为1,则所述第N父代种群是从所述初代种群中选择得到的,如果N为大于1的正整数,则所述第N父代种群是基于第N-1父代种群生成;
根据所述第N父代种群交叉变异,得到第N变异种群;
计算所述第N变异种群的更新性能指标,并根据所述更新性能指标确定第N+1父代种群;若所述第N+1父代种群符合预设条件,则根据所述第N+1父代种群生成菌株最优改造方案;
其中,所述从所述初代种群中选择第N父代种群的过程包括:
从所述初代种群中随机选择两个初始种群的个体;分别计算所述初始种群的个体的适应度,将所述适应度较大的个体作为第N前沿父代种群的个体;其中,如果两个所述初始种群的个体的适应度相同,则分别计算所述初始种群的个体的拥挤距离,将所述拥挤距离较大的个体作为第N前沿父代种群的个体;
分别计算所有所述初始种群中非第N前沿父代种群个体的适应度;根据所述初始种群中非第N前沿父代种群个体的适应度计算所有所述初始种群中非第N前沿父代种群个体的选中概率;利用轮盘赌方法,根据所述初始种群中非第N前沿父代种群个体的选中概率确定第N后续父代种群的个体;
将所述第N前沿父代种群和第N后续父代种群作为所述第N父代种群;
所述菌株改造的数学模型包括:
设定一个菌株含有m个代谢物和n个反应的代谢网络,所述代谢网络的代谢空间定义为:
FS(v)={v∈Rn|Sv=0,lb≤v≤ub};
其中,FS(v)表示v的代谢空间,S为反应m行和n列的化学计量系数矩阵,v为代谢网络上反应速率向量,lb和ub为v的范围值;
构建满足如下条件的两个优化目标:最坏情况下最大化给定产物P的产率max min wP,wP为菌株改造后产物P的产率和最大化产率与菌株生长的耦合强度max min Cs:
u∈FS(u),w∈FS(w);
其中,u和w分别代表了野生型和扰动稳态的反应的速率向量,F>1为用户定义的u和w之间的变化倍数,J为可改动的反应的集合,是二元0-1变量,分别表示j∈J的上调、下调和敲除操作,K为预设的修改数量的最大值,限制条件确保了候选反应只能执行上调、下调、敲除中的一种操作,max或max(A(B=C))是指计算在B=C时A的最大或最小值,wg和wp分别为在所考虑的设计策略下扰动网络的生长速率和生产速率,为最大生长速率。
2.根据权利要求1所述的基于多目标优化的菌株改造方法,其特征在于,所述根据所述搜寻方法减少所述菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量,包括:
根据所述搜寻方法,剔除所述代谢网络中不符合预设条件的菌株反应;
对所述菌株反应进行压缩,得到作为所述菌株改造的数学模型所描述的多目标智能优化任务中的候选变量;
所述提出基于多目标优化的菌株改造靶点的搜寻方法之后,还包括:
根据所述代谢网络对所述菌株反应进行染色体编码,得到多个菌株染色体,所述菌株染色体包含至少一个所述菌株反应。
3.根据权利要求1所述的基于多目标优化的菌株改造方法,其特征在于,所述根据所述第N父代种群交叉变异,得到第N变异种群,包括:
从所述第N父代种群的个体中随机选择一个染色体位置作为交叉点;
在所述交叉点处将所述第N父代种群的个体的染色体片段进行交换,得到处理后的第N父代种群的个体;
从所述处理后的第N父代种群的个体中随机选择至少一个染色体位置作为变异点;
在所有所述变异点处将所述处理后的第N父代种群的个体对应的染色体进行变异,得到第N子代种群的个体;
将所述第N父代种群与所述第N子代种群结合,得到所述第N变异种群。
4.根据权利要求3所述的基于多目标优化的菌株改造方法,其特征在于,所述将所述处理后的第N父代种群的个体对应的染色体进行变异的过程,包括:
随机生成第一变异值;
在所述第一变异值小于或等于预设变异概率的情况下,将所述处理后的第N父代种群的个体对应的染色体替换为第二变异值,得到所述变异后第N父代种群的个体;在所述第一变异值大于预设变异概率的情况下,将所述处理后的第N父代种群的个体作为所述变异后第N父代种群的个体,其中,所述第二变异值为预设范围内随机生成的数值;
根据所述变异后第N父代种群的个体确定所述变异后第N父代种群中个体的非零元素;
在所述非零元素的数量大于预设数量的情况下,随机将所述变异后第N父代种群的个体中至少一个非零元素替换为零元素,直至所述非零元素的数量小于等于所述预设数量,以得到所述第N子代种群的个体;
在所述非零元素的数量小于或等于预设数量的情况下,将所述变异后第N父代种群的个体作为所述第N子代种群的个体。
5.根据权利要求1所述的基于多目标优化的菌株改造方法,其特征在于,所述计算所述第N变异种群的更新性能指标,根据所述更新性能指标确定所述第N+1父代种群,包括:
根据所述菌株改造的数学模型计算所有所述第N变异种群中个体的目标值;
根据所述第N变异种群中个体的目标值对所述第N变异种群的个体进行非支配度排序,确定每个所述第N变异种群的个体的非支配层级;
计算每一所述非支配层级中个体的拥挤距离;
根据所述第N变异种群的个体的非支配层级确定所述第N+1父代种群的个体,在所述非支配层级中个体数量大于第N+1父代种群大小的情况下,将所述非支配层级中个体的拥挤距离最高的个体作为所述第N+1父代种群的个体。
6.根据权利要求5所述的基于多目标优化的菌株改造方法,其特征在于,所述计算拥挤距离的公式包括:
CDfirst,n=CDend,n=1;
其中,yi-1,n表示第i-1个个体的第n个目标值,yi+1,n表示第i+1个个体的第n个目标值,yfirst,n表示当前父代种群第一个个体的第n个目标值,yend,n表示当前父代种群中最后一个个体的第n个目标值,CDi,n代表第i个个体第n个目标值yi,n的拥挤距离,CDi代表第i个个体中拥挤距离的总值。
7.一种基于多目标优化的菌株改造系统,其特征在于,所述系统包括:
建立模块,用于根据菌株改造的任务和需求,建立所述菌株改造的数学模型;
优化模块,用于根据所述菌株改造的数学模型,提出基于多目标优化的菌株改造靶点的搜寻方法,以用于根据所述搜寻方法减少所述菌株改造的数学模型所描述的多目标智能优化任务中作为候选变量的菌株反应的数量;
构建模块,用于根据所述菌株改造的数学模型所描述的多目标智能优化任务构建初代种群;
获取模块,用于获取第N父代种群;如果N为1,则所述第N父代种群是从所述初代种群中选择得到的,如果N为大于1的正整数,则所述第N父代种群是基于第N-1父代种群生成;
迭代模块,用于根据所述第N父代种群交叉变异,得到第N变异种群;
更新模块,用于计算所述第N变异种群的更新性能指标,并根据所述更新性能指标确定第N+1父代种群;若所述第N+1父代种群符合预设条件,则根据所述第N+1父代种群生成菌株最优改造方案;
其中,所述从所述初代种群中选择第N父代种群的过程包括:
从所述初代种群中随机选择两个初始种群的个体;分别计算所述初始种群的个体的适应度,将所述适应度较大的个体作为第N前沿父代种群的个体;其中,如果两个所述初始种群的个体的适应度相同,则分别计算所述初始种群的个体的拥挤距离,将所述拥挤距离较大的个体作为第N前沿父代种群的个体;
分别计算所有所述初始种群中非第N前沿父代种群个体的适应度;根据所述初始种群中非第N前沿父代种群个体的适应度计算所有所述初始种群中非第N前沿父代种群个体的选中概率;利用轮盘赌方法,根据所述初始种群中非第N前沿父代种群个体的选中概率确定第N后续父代种群的个体;
将所述第N前沿父代种群和第N后续父代种群作为所述第N父代种群;
所述菌株改造的数学模型包括:
设定一个菌株含有m个代谢物和n个反应的代谢网络,所述代谢网络的代谢空间定义为:
FS(v)={v∈Rn|Sv=0,lb≤v≤ub};
其中,FS(v)表示v的代谢空间,S为反应m行和n列的化学计量系数矩阵,v为代谢网络上反应速率向量,lb和ub为v的范围值;
构建满足如下条件的两个优化目标:最坏情况下最大化给定产物P的产率max min wP,wP为菌株改造后产物P的产率和最大化产率与菌株生长的耦合强度max min Cs:
u∈FS(u),w∈FS(w);
其中,u和w分别代表了野生型和扰动稳态的反应的速率向量,f>1为用户定义的u和w之间的变化倍数,j为可改动的反应的集合,是二元0-1变量,分别表示j∈J的上调、下调和敲除操作,K为预设的修改数量的最大值,限制条件确保了候选反应只能执行上调、下调、敲除中的一种操作,max或max(A(B=C))是指计算在B=C时A的最大或最小值,wg和wp分别为在所考虑的设计策略下扰动网络的生长速率和生产速率,为最大生长速率。
8.一种电子设备,其特征在于:包括至少一个控制处理器和用于与所述至少一个控制处理器通信连接的存储器;所述存储器存储有可被所述至少一个控制处理器执行的指令,所述指令被所述至少一个控制处理器执行,以使所述至少一个控制处理器能够执行权利要求1至6任一项所述的一种基于多目标优化的菌株改造方法。
9.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行权利要求1至6任一项所述的一种基于多目标优化的菌株改造方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411775557.2A CN119885826B (zh) | 2024-12-05 | 2024-12-05 | 一种基于多目标优化的菌株改造方法、系统、设备及介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202411775557.2A CN119885826B (zh) | 2024-12-05 | 2024-12-05 | 一种基于多目标优化的菌株改造方法、系统、设备及介质 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN119885826A CN119885826A (zh) | 2025-04-25 |
| CN119885826B true CN119885826B (zh) | 2025-07-25 |
Family
ID=95423208
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202411775557.2A Active CN119885826B (zh) | 2024-12-05 | 2024-12-05 | 一种基于多目标优化的菌株改造方法、系统、设备及介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN119885826B (zh) |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110913875A (zh) * | 2017-01-06 | 2020-03-24 | 同生运营公司 | 程序化以在肿瘤细胞中产生免疫调节子和抗癌治疗剂的微生物 |
| CN111787787A (zh) * | 2018-02-27 | 2020-10-16 | 马克思—普朗克科学促进协会公司 | 用于丛枝菌根真菌在植物中的根定殖的叶标志物 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11636917B2 (en) * | 2017-06-28 | 2023-04-25 | The Regents Of The University Of California | Simulating the metabolic pathway dynamics of an organism |
| CN112403542B (zh) * | 2020-11-05 | 2021-09-28 | 清华大学 | 定量研究生物被膜的微流控芯片及其制作方法 |
| CN116705142B (zh) * | 2023-05-04 | 2025-01-03 | 江南大学 | 基于二进制量子粒子群优化算法与通量平衡分析混合算法的代谢产物优化方法 |
-
2024
- 2024-12-05 CN CN202411775557.2A patent/CN119885826B/zh active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110913875A (zh) * | 2017-01-06 | 2020-03-24 | 同生运营公司 | 程序化以在肿瘤细胞中产生免疫调节子和抗癌治疗剂的微生物 |
| CN111787787A (zh) * | 2018-02-27 | 2020-10-16 | 马克思—普朗克科学促进协会公司 | 用于丛枝菌根真菌在植物中的根定殖的叶标志物 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN119885826A (zh) | 2025-04-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Kumar | Encoding schemes in genetic algorithm | |
| Wang et al. | A Pareto-based estimation of distribution algorithm for the multi-objective flexible job-shop scheduling problem | |
| CN113935235B (zh) | 基于遗传算法和代理模型的工程设计优化方法及装置 | |
| Zhang et al. | Efficient and merged biogeography-based optimization algorithm for global optimization problems | |
| Zhang et al. | UCPSO: A uniform initialized particle swarm optimization algorithm with cosine inertia weight | |
| CN117290721A (zh) | 数字孪生建模方法、装置、设备及介质 | |
| CN109815541B (zh) | 轨道交通车辆产品零部件模块划分方法、装置与电子设备 | |
| CN106991442A (zh) | 混合蛙跳算法的自适应核k‑means方法与系统 | |
| CN116705142B (zh) | 基于二进制量子粒子群优化算法与通量平衡分析混合算法的代谢产物优化方法 | |
| Bi et al. | Self-adaptive Teaching-learning-based Optimizer with Improved RBF and Sparse Autoencoder for Complex Optimization Problems. | |
| Li et al. | AngClust: angle feature-based clustering for short time series gene expression profiles | |
| Dai et al. | Feature selection of high-dimensional biomedical data using improved SFLA for disease diagnosis | |
| CN119885826B (zh) | 一种基于多目标优化的菌株改造方法、系统、设备及介质 | |
| CN116579420A (zh) | 项目集群优化方法、装置及系统 | |
| CN118890632B (zh) | 一种天线规划方法、系统、设备及介质 | |
| CN114037006A (zh) | 电力系统典型日负荷曲线生成方法 | |
| Guo et al. | [Retracted] PLncWX: A Machine‐Learning Algorithm for Plant lncRNA Identification Based on WOA‐XGBoost | |
| CN113191555A (zh) | 一种基于改进文化算法的迭代自组织聚类组合算法 | |
| Mohamed | Differential evolution (DE): A short review | |
| CN117349341A (zh) | 一种基于模拟退火遗传算法的数据挖掘方法及系统 | |
| Liu et al. | Multi-objective evolutionary algorithm for mining 3D clusters in gene-sample-time microarray data | |
| Choon et al. | Identifying gene knockout strategies using a hybrid of bees algorithm and flux balance analysis for in silico optimization of microbial strains | |
| CN108460147A (zh) | 基于多子种群协同进化构建信息核的推荐方法 | |
| JP2019095819A (ja) | 情報処理装置及びプログラム | |
| Zhu et al. | CNV_IWOABP: Collaboration of improved whale optimization algorithm and BP neural networks for copy number variations |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |