CN111052248A - 细菌菌株对治疗组合物的敏感性谱的确定方法 - Google Patents
细菌菌株对治疗组合物的敏感性谱的确定方法 Download PDFInfo
- Publication number
- CN111052248A CN111052248A CN201880057328.3A CN201880057328A CN111052248A CN 111052248 A CN111052248 A CN 111052248A CN 201880057328 A CN201880057328 A CN 201880057328A CN 111052248 A CN111052248 A CN 111052248A
- Authority
- CN
- China
- Prior art keywords
- bacterial
- therapeutic composition
- host
- machine learning
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/30—Unsupervised data analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Epidemiology (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Medicines Containing Material From Animals Or Micro-Organisms (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
用于模式搜索和分析以鉴定和选择可以用于治疗细菌感染或污染的治疗性分子的方法和系统。实例包括用于模式搜索和分析以基于查询细菌和/或查询噬菌体株的基因组与细菌菌株和/或噬菌体株的治疗性分子‑宿主训练集的比较来鉴定和选择细菌噬菌体的方法和系统,在所述训练集中所述噬菌体株(或其它治疗性分子)已经被证实具有通过杀死所述训练集中的所述细菌菌株、在所述细菌菌株中复制、裂解所述细菌菌株和/或抑制所述细菌菌株的生长而用作抗细菌剂的能力。然后可以将使用本文所述的方法鉴定的包括噬菌体的治疗组合物用于治疗受试者的细菌感染和/或环境中的污染。
Description
技术领域
本发明涉及可用于预测细菌对包括噬菌体、抗生素和/或其它杀细菌化合物的治疗组合物的敏感性的无细胞方法和试剂盒。还可以使用本文所述的无细胞方法和试剂盒来预测治疗组合物之间的协同杀细菌活性。
背景技术
在以下论述中,出于背景和介绍目的,将描述某些制品和方法。本文中所含的任何内容都不应当被解释为对现有技术的“承认”。申请人明确地保留在适当的情况下依照适用的法律规定证明本文引用的制品和方法不构成现有技术的权利。
多药耐药性(MDR)细菌正以惊人的速度出现。目前,据估计,在美国每年有至少2百万例感染是由MDR生物体引起的,导致约23,000例死亡。此外,认为遗传工程化和合成生物学也可能导致另外的高毒性微生物的产生。
例如,金黄色葡萄球菌(Staphylococcus aureus)是可以导致皮肤和软组织感染(SSTI)、肺炎、坏死性筋膜炎和血流感染的革兰氏阳性细菌。甲氧西林抗性金黄色葡萄球菌(“MRSA”)是在临床环境中非常关注的一种MDR生物体,这是因为MRSA导致超过80,000例侵袭性感染,接近12,000例相关死亡,并且是医院获得性感染的主要原因。此外,世界卫生组织(World Health Organization,WHO)已经将MRSA鉴定为国际关注的生物体。
鉴于迅速出现和传播的毒性微生物的潜在威胁和抗微生物剂抗性,正在开发针对细菌感染的替代性临床治疗。针对MDR感染的一种这样的潜在治疗包括使用噬菌体。细菌噬菌体(“噬菌体”)是在特定细菌宿主内复制并且可以杀死所述特定细菌宿主的一组多样的病毒。在20世纪早期最初分离出噬菌体之后对利用噬菌体作为抗细菌剂的可能性进行了研究,并且在一些国家,它们已经在临床上被用作抗细菌剂并获得了一定的成功。尽管如此,在发现青霉素之后,在美国基本上放弃了噬菌体疗法,并且直到最近才重新引起对噬菌体治疗剂的关注。
噬菌体的成功治疗用途取决于给药可以杀死与感染相关的细菌分离株或抑制所述细菌分离株生长的噬菌体株的能力。此外,鉴于细菌的突变率和与噬菌体株相关的窄宿主范围,最初有效作为抗细菌剂的噬菌体株在临床治疗期间可能会迅速变得无效,这是因为最初的靶细菌宿主发生突变或被消除并且自然地被对用作抗细菌剂的初始噬菌体具有抗性的一种或多种突现的细菌菌株取代。
已经开发了经验实验室技术来筛选噬菌体对细菌菌株的敏感性。然而,这些技术是耗时的并且依赖于获得每一种特定细菌菌株的细菌生长曲线。例如,目前通过使用液体培养物或在琼脂培养基上生长的细菌菌苔针对特定患者的细菌分离株测试单独的噬菌体株来筛选噬菌体株裂解(杀死)或抑制细菌生长的能力。该生长要求无法被加快并且只有在数小时,并且在一些情况下,数日的筛选之后才能产生敏感性结果。在获得敏感性结果方面的这种延迟可能会导致患有全身性细菌感染的患者的治疗延迟和并发症。
因此,需要开发不依赖于细菌培养物的生长的用于预测细菌对特定噬菌体株的敏感性的快速筛选方法。
发明内容
提供本发明内容而以简化形式介绍一系列概念,这些概念在下文进一步描述于具体实施方式中。本发明内容既不意图确定所要求保护的主题的关键特征或必要特征,也不意图用于限制所要求保护的主题的范围。根据以下书面的具体实施方式,包括附图中所示和所附权利要求书中所限定的那些方面,所要求保护的主题的其它特征、细节、效用和优势将是显而易见的。
本发明涉及用于快速预测细菌对治疗组合物,如一种或多种噬菌体株、一种或多种抗生素和/或一种或多种其它杀细菌化合物或其任何组合的敏感性的基于无细胞的试剂盒和方法。例如,本发明赋予处理速度和噬菌体株成功感染特定细菌分离株的能力的改善,从而消除了对细菌生长曲线的依赖。受过训练的机器学习治疗组合物模型,包括一种或多种噬菌体模型、细菌宿主模型、抗生素模型和/或其它杀细菌化合物模型的产生使得能够快速产生对特定噬菌体、抗生素和/或治疗性治疗或其任何组合的临床预测性细菌敏感性结果。
可以用于产生所述机器学习模型的优选的细菌菌株包括但不限于ESKAPE病原体,如沙门氏菌(salmellonella)、粪肠球菌(Enterococcus faecium)、金黄色葡萄球菌、肺炎克雷伯氏杆菌(Klebsiella pneumonia)、鲍曼不动杆菌(Acinetobacter baumannii)、铜绿假单胞菌(Pseudomonas aeruginosa)和肠杆菌属菌种(Enterobacter sp.)的菌株。本发明的方法和试剂盒是基于以下发现,即通过使用机器学习,可以在特定细菌中鉴定基因组模式,并且在一些实施方案中,在特定噬菌体中鉴定基因组模式,所述基因组模式可预测该细菌被特定噬菌体、抗生素和/或其它杀细菌化合物(包括这些治疗组合物的组合)杀死或抑制的敏感性。与敏感性表型或抗性表型相关的这些基因组序列模式可以用于预测随后测试的查询细菌是否也将对治疗组合物具有敏感性或抗性,所述治疗组合物包括但不限于特定噬菌体株、抗生素和/或其它杀细菌化合物和/或其任何组合。在优选的实施方案中,细菌的基因组和/或细菌的基因组与噬菌体的基因组的组合中的这些“预测性基因组模式”可以用作诊断工具,从而预测细菌对噬菌体株的敏感性和/或抗性。此外,这些预测性基因组模式还可以用于鉴定治疗组合物之间,并且优选地,噬菌体株、抗生素和/或其它杀细菌化合物之间的协同组合。在一个实施方案中,通过将机器学习和模式识别应用于不同细菌菌株与噬菌体株集的组合的噬菌体-细菌训练集,可以将查询细菌基因组与噬菌体-宿主训练集进行比较并且可以预测对噬菌体株的敏感性而无需细胞培养物的生长。这种类似的方法也可以用于任何治疗组合物(如抗生素或其它杀细菌化合物)以预测细菌菌株对治疗组合物(包括其组合)的敏感性而无需细胞培养物的生长。
广泛地,对多种(例如一百或数百种)不同细菌菌株的基因组以及经实验得出的细菌宿主对多种治疗组合物的敏感性谱进行测序,并且使用本领域已知的计算机实施的机器学习和/或模式识别软件对所产生的序列数据进行分析和比较以分类和鉴定细菌基因组之间的同一性模式。然后将这些同一性模式与敏感性表型或抗性表型或协同治疗组合物宿主表型相关联。优选的是,可以使用采用人工智能的程序,包括采用诸如贝叶斯机器学习(Bayesian machine learning)和/或神经网络(例如在基因组内搜索模式)的工具的程序,来对与敏感性/抗性/协同治疗组合物宿主谱相关的同一性和/或高度相似性区域进行分类。可以使用有监督学习方法和无监督学习方法两者。
在一个实例中,对多种(例如一百或数百种)不同细菌菌株的基因组,并且在优选的实施方案中,对所述基因组与噬菌体株的基因组的组合以及经实验得出的细菌噬菌体-宿主对多种噬菌体株的敏感性谱进行测序,并且使用本领域已知的计算机实施的机器学习和/或模式识别软件对所产生的序列数据进行分析和比较以分类和鉴定细菌基因组之间和噬菌体基因组之间的同一性模式。然后将这些同一性模式与敏感性表型或抗性表型或协同噬菌体-宿主表型相关联。优选的是,可以使用采用人工智能的程序,包括采用诸如贝叶斯机器学习和/或神经网络(例如在基因组内搜索模式)的工具的程序,来对与敏感性/抗性/协同宿主-噬菌体谱相关的同一性和/或高度相似性区域进行分类。这些模型可以与针对诸如抗生素和/或其它杀细菌化合物的其它治疗组合物而产生的宿主模型组合,以鉴定将具有最有效的治疗潜力的那些组合。可以使用有监督学习方法和无监督学习方法两者。
例如,在鉴定细菌菌株之间共同的基因组模式时,图1A中所示的方框130使用计算方法来训练机器学习模型(例如统计方法、有监督学习、强化学习、无监督学习、特征检测、人工智能方法、神经网络模型、生物信息学方法等)。在一些实施方案中,训练所述模型以识别细菌菌株之间和/或噬菌体株之间或对治疗组合物具有敏感性的细菌菌株之间的基因组序列中共同的和不相似的模式。然后用噬菌体-宿主敏感性数据对这些模式进行表征以标记这些相似的和不相似的序列,如方框150和方框160中所示,以产生噬菌体-宿主机器学习模型。在一些实施方案中,也可以保存噬菌体-宿主敏感性序列(方框180)。
用于鉴定基因组模式、表征治疗组合物敏感性数据(例如噬菌体-宿主敏感性数据、抗生素-宿主敏感性数据、杀细菌剂-宿主敏感性数据和/或组合的敏感性数据)和/或选择包括噬菌体、抗生素、杀细菌剂和组合的敏感性治疗组合物的计算方法(如方框130、方框140、方框150、方框160、方框170、方框180中所示)可以另外地或可替选地利用任何其它合适的算法来执行这些步骤。例如,所述算法的特征可以在于学习方式,包括以下任何一种或多种:有监督学习(例如使用逻辑回归、使用反向传播神经网络)、无监督学习(例如使用先验算法(Apriori algorithm)、使用K均值聚类)、半监督学习、强化学习(例如使用Q学习算法、使用时间差分学习)和任何其它合适的学习方式。在一些实施方案中,有监督学习方法使用所述序列作为输入并且将治疗敏感性数据(例如噬菌体-宿主敏感性数据、抗生素-宿主敏感性数据、杀细菌剂-宿主敏感性数据和/或组合的敏感性数据)作为输出数据(目标)。在一些实施方案中,半监督学习方法可以包括序列的无监督学习(例如聚类),继而使用噬菌体-宿主敏感性数据进行特征检测。所述序列数据可以是多种细菌菌株的序列数据或多种细菌菌株和多种噬菌体株两者的序列数据。此外,所述算法可以实施以下任何一种或多种:回归算法(例如普通最小二乘、逻辑回归、逐步回归、多元自适应回归样条、局部估计的散点图平滑等)、基于实例的方法(例如k最近邻、学习向量量化、自组织映射等)、正则化方法(例如岭回归、最小绝对收缩与选择算子、弹性网络等)、决策树学习方法(例如分类和回归树、迭代二叉树3代、C4.5、卡方自动交互检测、决策树桩、随机森林、多元自适应回归样条、梯度提升机等)、贝叶斯方法(例如朴素贝叶斯法、平均单依赖估计法、贝叶斯信念网络等)、核方法(例如支持向量机、径向基函数、线性判别分析等)、聚类方法(例如k均值聚类、期望最大化等)、关联规则学习算法(例如先验算法、Eclat算法等)、人工神经网络模型(例如感知器法、反向传播法、Hopfield网络法、自组织映射法、学习向量量化法等)、深度学习算法(例如受限玻尔兹曼机、深度信念网络法、卷积网络法、堆栈自动编码器法等)、降维方法(例如主成分分析、偏最小二乘回归、Sammon映射、多维缩放、投影追踪等)、集成方法(例如提升法、自举汇聚法、AdaBoost、堆栈泛化、梯度提升机法、随机森林法等)和任何合适形式的算法。在一些实施方案中,训练所述机器学习方法以鉴定被估计为会杀死或抑制样品中存在的细菌的包括噬菌体、抗生素、杀细菌剂、其它治疗性分子或组合的一种或多种治疗组合物,而无需明确地鉴定特定基因组序列,或至少,无需明确地输出特定基因组序列。也就是说,虽然这样的机器学习方法和分类器可以在序列数据上训练并且利用序列数据,但是产生分类决策的特定序列可能不是显而易见的,并且可以存储在内部模型中或存储为所述方法用来对输入序列进行分类的权重和/或参数的内部集合。在一些实施方案中,机器学习方法接收来自靶细菌的序列数据作为输入,并且输出一种或多种治疗组合物和每一种治疗组合物对靶细菌的特异性(治疗特异性)的估计值。这可以包括噬菌体和每一种噬菌体对靶细菌的特异性(噬菌体-宿主特异性)的估计值、抗生素和每一种抗生素对靶细菌的特异性(抗生素-宿主特异性)的估计值、杀细菌剂和每一种杀细菌剂对靶细菌的特异性(杀细菌剂-宿主特异性)的估计值或组合和组合对靶细菌的特异性的估计值。在一些实施方案中,所述机器学习模型是深度学习系统,其使用在合适的训练数据上训练的多个内部分层的分类器和/或神经网络对样品进行分类,而无需明确地鉴定特定基因组序列。深度学习分类器通常需要大量的训练数据。因此,在一些实施方案中,随着接收到另外的临床样品和结果,随时间推移而开发或改进深度学习分类器。在一些实施方案中,机器学习方法可以产生噬菌体对输入细菌序列的有效性或特异性的概率估计值。
一旦已经产生治疗组合物机器学习模型,就可以处理查询细菌以预测治疗特异性(例如噬菌体-宿主特异性、抗生素特异性、杀细菌剂特异性和/或组合的特异性),而所有这些都无需湿实验室数据。然后可以使用被鉴定为对查询细菌具有特异性的治疗组合物,如噬菌体、抗生素、杀细菌剂、治疗性分子或组合作为治疗剂或去污剂。在另外的优选的实施方案中,可以在本文所述的方法中鉴定多种治疗组合物(例如一种或多种噬菌体株、一种或多种抗生素、一种或多种杀细菌剂和/或一种或多种治疗性分子)并且将其用于产生混合物,然后可以将所述混合物用于治疗细菌感染或污染。在优选的实施方案中,所述混合物中的多种治疗组合物(例如多种噬菌体株或噬菌体、抗生素、杀细菌剂和/或治疗性分子的各种组合)具有不同的特异性模式,这可以有助于降低细菌噬菌体抗性的发生率。
在另一个优选的实施方案中,使用相似性和/或同一性模式(也被统称为“预测性模式”或治疗组合物敏感性序列,包括“噬菌体-宿主敏感性序列”、“抗生素-宿主敏感性序列”和“杀细菌剂-宿主敏感性序列”)将细菌菌株分类为至少2个、至少3个、至少4个主要的治疗剂-宿主敏感性谱组,如噬菌体-宿主敏感性谱组、抗生素-宿主敏感性谱组、其它杀细菌化合物-宿主敏感性谱组和/或协同治疗性分子-宿主敏感性谱组。
在另外的优选的实施方案中,可以产生混合物,所述混合物包含选自具有不同敏感性谱的一些或所有敏感性组的治疗组合物的混合物。这些混合物可以用于治疗细菌感染或污染。在优选的实施方案中,治疗组合物的选择可以增强对于细菌对该混合物出现抗性的抵抗力。
在优选的实施方案中,使用本领域技术人员已知的快速测序技术对细菌和/或噬菌体基因组进行测序。这样的技术的实例包括但不限于快速纳米孔基因组测序。
优选的是,所述方法包括根据敏感性将被鉴定为具有特定治疗剂-宿主敏感性谱的菌株进行亚型分型的另外的步骤。因此,例如,可以根据噬菌体、抗生素、杀细菌剂或组合敏感性将被鉴定为对噬菌体、抗生素、杀细菌剂或组合具有敏感性、不敏感性或中等敏感性的一种细菌菌株或多种细菌菌株进行亚型分型和进一步分类。
在一种实施方案中,描述了一种用于产生治疗组合物机器学习模型的计算方法,其中所述方法包括:
(a)在计算机数据库系统中编译来自多种细菌菌株的数据,其中所述数据包含多种细菌菌株的基因组序列数据;
(b)在计算机系统的CPU和存储器单元上至少使用多种细菌菌株的基因组序列数据来训练机器学习模型;和
(c)存储治疗组合物机器学习模型,所述治疗组合物机器学习模型被配置成接收查询细菌基因组并且选择基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种治疗组合物。
所述基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种治疗组合物可以包含基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的一种或多种噬菌体、抗生素、杀细菌剂、治疗性分子或组合。
在一种实施方案中,所述至少一种治疗组合物包含至少一种噬菌体,
并且在步骤(a)中,所述数据还包含
多种噬菌体株的基因组序列数据;
并且在步骤(b)中,训练机器学习模型在计算机系统的CPU和存储器单元上至少使用多种细菌菌株的基因组序列数据和多种噬菌体株的基因组序列数据;和
在步骤(c)中,被配置成接收查询细菌基因组的治疗组合物机器学习模型被配置成选择基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种噬菌体。
在一些实施方案中,其中所述机器学习模型产生治疗组合物敏感性序列。这些可以是噬菌体-宿主敏感性序列、抗生素-宿主敏感性序列、杀细菌剂-宿主敏感性序列或其它治疗性分子-宿主敏感性序列。在一些实施方案中,所述方法还包括接收从多种治疗剂经实验得出的所述细菌菌株的经实验得出的治疗组合物-宿主敏感性谱,并且产生所述治疗组合物敏感性序列包括使用所述治疗组合物-宿主敏感性谱进行特征检测,包括:
(1)鉴定在具有相似或相同的治疗组合物-宿主敏感性谱的细菌菌株之间共有的共同基因组序列模式;和/或
(2)鉴定在具有不相似的治疗组合物-宿主敏感性谱的细菌菌株之间共有的不相似基因组序列模式;
并且训练所述模型还包括通过将治疗组合物敏感性序列与治疗组合物-宿主敏感性谱相关联来表征每一种细菌菌株并且产生每一种细菌菌株的治疗组合物-宿主特异性的预测谱。
在一种实施方案中,所述方法还包括接收另外的多种细菌的基因组序列数据和治疗组合物-宿主敏感性谱并且改进所述机器学习模型。在一种实施方案中,在无监督过程中训练所述机器学习模型。
在一种实施方案中,描述了一种用于产生治疗组合物机器学习模型的计算方法,其中所述方法包括:
(a)在计算机数据库系统中编译来自多种细菌菌株的数据,其中所述数据包含(1)多种细菌菌株的基因组序列数据;和(2)从多种治疗剂经实验得出的所述细菌菌株的经实验得出的治疗组合物-宿主敏感性谱;
(b)在计算机系统的CPU和存储器单元上使用多种细菌菌株的基因组序列数据和经实验得出的治疗组合物-宿主敏感性谱来训练机器学习模型;
(c)存储治疗组合物机器学习模型,所述治疗组合物机器学习模型被配置成接收查询细菌基因组并且选择基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种治疗组合物,所述至少一种治疗组合物包含一种或多种噬菌体、抗生素、杀细菌剂、治疗性分子或组合。
所述至少一种治疗组合物可以包含至少一种噬菌体、至少一种抗生素、至少一种杀细菌剂或组合。所述治疗组合物-宿主敏感性谱可以是噬菌体-宿主敏感性谱、抗生素-宿主敏感性谱、杀细菌剂-宿主敏感性谱或其它治疗性分子-宿主敏感性谱。这些可以是经实验得出的多种噬菌体、抗生素、杀细菌剂、治疗性分子等。
在优选的实施方案中,使用本领域技术人员已知的快速测序技术对细菌和/或噬菌体基因组进行测序。这样的技术的实例包括但不限于快速纳米孔基因组测序。
在优选的实施方案中,所述机器学习和模式识别分析包含神经网络分析,包括深度神经网络学习或人工神经网络分析,或经典模型,例如贝叶斯、高斯分析、回归分析和/或树分析。
在另外的优选的实施方案中,通过进行噬斑测定来产生经实验得出的治疗组合物-宿主敏感性数据。在优选的实施方案中,测量噬斑的尺寸、浑浊度、透明度和/或晕圈的存在。在其它优选的实施方案中,使用选自荧光、吸收和透射测定的光度测定来产生经实验得出的治疗组合物-宿主敏感性数据。
在一种实施方案中,通过接收(1)另外的多种细菌菌株的基因组序列数据;和(2)从多种治疗组合物经实验得出的所述另外的细菌菌株的经实验得出的治疗组合物-宿主敏感性谱,来更新机器学习模型。使用所接收的信息重新训练(或更新)机器学习模型。
一种用于预测查询细菌的治疗组合物-宿主敏感性的计算机实施的方法,所述方法包括:(a)接收本文所述的噬菌体-宿主机器学习模型;(b)接收查询细菌的基因组序列数据;和(c)基于训练后的机器学习模型预测查询细菌的治疗组合物-宿主敏感性。在一些实施方案中,所述机器学习模型是在无监督过程、有监督过程中训练的和/或包含神经网络分析,包括深度神经网络学习或人工神经网络分析,或经典模型,例如贝叶斯、高斯分析、回归分析和/或树分析。
在另外的优选的实施方案中,通过这样的方法选择治疗组合物,所述方法包括基于由作为输入而提供给治疗组合物-宿主机器学习模型的查询细菌基因组产生的谱匹配分数来选择至少一种治疗组合物,其中更高的谱匹配分数代表更高的治疗组合物-宿主敏感性。这种方法中使用的机器学习和模式识别包含神经网络分析,包括深度神经网络学习或人工神经网络分析,或经典模型,例如贝叶斯、高斯分析、回归分析和/或树分析。
考虑了多种噬菌体(和/或多种其它治疗组合物)的选择以及将所选择的噬菌体(和其它治疗组合物)配制成药学上可接受的组合物。
在优选的实施方案中,所选择的治疗组合物的组合物包含具有不同宿主范围的治疗组合物,包含具有宽宿主范围的治疗组合物和具有窄宿主范围的治疗组合物的混合物,和/或彼此协同作用。
本文所述的治疗组合物可以对细菌具有多种活性,包括但不限于:(a)细菌生长的延迟;(b)没有出现噬菌体抗性细菌生长;(c)更低的毒性;(d)恢复对一种或多种药物的敏感性;和/或(e)表现出降低的在受试者中生长的适应性。
包含本文所述的治疗组合物的组合物以及使用如本文所述的组合物治疗患有细菌感染的受试者或环境污染的方法是优选的实施方案。在优选的实施方案中,待治疗的细菌感染或细菌污染选自伤口感染、手术后感染和全身性菌血症。在另外的优选的实施方案中,细菌感染/污染选自由“ESKAPE”病原体(粪肠球菌、金黄色葡萄球菌、肺炎克雷伯氏杆菌、鲍曼不动杆菌、铜绿假单胞菌和肠杆菌属菌种)所引起的感染。
在另外的实施方案中,本文所述的系统包含:一个或多个处理器;存储器;和一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并且被配置成由所述一个或多个处理器执行,所述一个或多个程序包括用于执行本文所述的方法中的任一种的指令。在优选的实施方案中,如本文所述的方法或组合物的多种细菌菌株、查询细菌基因组和/或细菌感染的细菌菌株选自a)多药耐药性细菌;b)引起受试者感染的临床细菌分离株;c)引起受试者感染并且具有多药耐药性的临床细菌分离株;d)从真实的人类感染中获得的;或e)从不同来源获得的。在优选的实施方案中,所述不同来源可以选自土壤、水处理厂、原污水、海水、湖泊、河流、溪流、固定式污水池、动物和人类的肠道以及粪便。
还描述了根据本文所述的方法中的任一种而创建的治疗组合物-宿主机器学习模型以及这样的治疗组合物-宿主机器学习模型用于预测查询细菌的治疗组合物-宿主敏感性的用途。
附图说明
参照以下具体实施方式和附图,可以更好地理解本发明的目的和特征。
图1A提供了产生多种细菌菌株的治疗组合物-宿主训练集的流程图。
图1B提供了流程图,其示出了将训练机器学习模块。
图1C提供了流程图,其示出了无监督机器学习模块和在另外的数据变得可用时更新模型。
图1D提供了流程图,其示出了涉及训练集、验证集和测试集以产生机器学习模型的迭代有监督机器学习。
图2A是使用根据图1A至图1D产生的治疗组合物-宿主训练集预测查询细菌的治疗组合物-宿主特异性谱的流程图。图2A还示出了治疗组合物步骤的另外的选择。
图3示出了可用于本文所述的方法和系统的示例性机器学习模型。
图4A示出了用于本文所述的方法和系统中的包含多个内部层的深度学习模型的示例性架构。
图4B示出了用于本文所述的方法和系统中的深度学习模型中的层中的神经元之间的连接。
在各个附图中,相同的附图标记和名称指示相同的要素。
具体实施方式
为下文书面描述中使用的特定术语提供以下定义。
定义
除非上下文另外明确规定,否则如说明书和权利要求书中所用的不带具体数量的单数形式和“所述”包括复数指代对象。例如,术语“细胞”包括多个细胞,包括其混合物。术语“核酸分子”包括多个核酸分子。“噬菌体混合物”可以意指至少一种噬菌体混合物,以及多种噬菌体混合物,即多于一种噬菌体混合物。如本领域技术人员所了解的那样,术语“噬菌体”可以用于指单一噬菌体或多于一种噬菌体。
本发明可以“包含”(开放式)本发明的组成部分以及本文所述的其它成分或要素或“基本上由本发明的组成部分以及本文所述的其它成分或要素组成”。如本文所用的“包含”意指所叙述的要素,或它们在结构或功能上的等同物,加上未叙述的任何其它一个要素或多个要素。除非上下文另外说明,否则术语“具有”和“包括”也应当被解释为开放式的。如本文所用的“基本上由……组成”意指本发明可以包括除了权利要求中所述的那些成分之外的成分,但是只有在所述另外的成分不会实质上改变所要求保护的发明的基本和新颖特征的情况下才如此。
如本文所用的“受试者”是脊椎动物,优选地是哺乳动物,更优选地是人类。哺乳动物包括但不限于鼠类、猿猴、人类、农场动物、运动动物和宠物。在其它优选的实施方案中,“受试者”是啮齿类动物(例如豚鼠、仓鼠、大鼠、小鼠)、鼠类(例如小鼠)、犬科动物(例如狗)、猫科动物(例如猫)、马科动物(例如马)、灵长类动物、猿猴(例如猴或猿)、猴(例如狨猴、狒狒)或猿(例如大猩猩、黑猩猩、猩猩、长臂猿)。在其它实施方案中,可以使用非人类哺乳动物,特别是常规用作用于证实在人类中的治疗功效的模型的哺乳动物(例如鼠类、灵长类动物、猪科动物、犬科动物或兔科动物)。优选的是,“受试者”涵盖任何生物体,例如任何动物或人类,其可能患有细菌感染,特别是由多药耐药性细菌所引起的感染。
如本文所理解的“有需要的受试者”包括患有细菌感染的任何人类或动物,所述细菌感染包括但不限于多药耐药性细菌感染。实际上,虽然在本文中考虑了本发明的方法可以用于靶向特定的病原性物种,但是所述方法也可以用于对抗基本上所有的人类和/或动物细菌病原体,包括但不限于多药耐药性细菌病原体。因此,在一种特定的实施方案中,通过采用本发明的方法,本领域技术人员可以设计和产生针对许多不同临床相关细菌病原体,包括多药耐药性(MDR)细菌病原体的个性化治疗组合物(例如噬菌体和/或噬菌体/抗生素混合物)。
如本文所理解的药物组合物的“有效量”指的是适于在受试者中引起治疗有益响应,例如在受试者中根除细菌病原体的组合物的量。这样的响应可以包括例如预防、改善、治疗、抑制和/或减轻与细菌感染相关的一种或多种病理状况。
如本文所用的术语“剂量”指的是适于向受试者给药的物理上离散的单元,每一个剂量含有经计算以产生所期望的响应的预定量的活性药物成分。
术语“约”或“近似”意指在如由本领域的普通技术人员所确定的具体值的可接受的范围内,这将部分地取决于如何测量或确定该值,例如测量系统的局限性。例如,“约”可以意指给定值的最多20%,优选地最多10%,更优选地最多5%,并且还更优选地最多1%的范围。可选地,特别是对于生物系统或方法,所述术语可以意指在值的数量级内,优选地在5倍以内,并且更优选地在2倍以内。除非另有说明,否则术语“约”意指在具体值的可接受的误差范围内,如±1%-20%,优选地±1%-10%并且更优选地±1%-5%。在更进一步的实施方案中,“约”应当被理解为意指+/-5%。
在提供值的范围的情况下,应当了解的是,在该范围的上限和下限与在该所述范围内的任何其它陈述值或中间值之间的每一个中间值都被涵盖在本发明内。这些更小范围的上限和下限可以独立地被包括在更小的范围内,并且也被涵盖在本发明内,受限于在所述范围内任何具体排除的限值。在所述范围包括这些限值中的一个或两个的情况下,排除那些所包括的限值中的任何一个或两个的范围也被包括在本发明中。
本文所述的所有范围均包括端点,包括叙述为两个值“之间”的范围的那些范围。诸如“约”、“一般”、“基本上”、“近似”等的术语应当被解释为修饰术语或值以使得它不是绝对值,但是不以现有技术为基础。这样的术语将由它们所修饰的情况和术语来定义,因为那些术语是为本领域技术人员所了解的。这至少包括用于测量值的给定技术的预期实验误差、技术误差和仪器误差的程度。
在本文中使用的情况下,术语“和/或”在用于两个或多个项目的清单中时意指可以存在所列特征中的任一个,或可以存在所列特征中的两个或多个的任何组合。例如,如果组合物被描述为含有特征A、B和/或C,那么所述组合物可以含有单独的A特征;单独的B特征;单独的C特征;A和B的组合;A和C的组合;B和C的组合;或A、B和C的组合。
如本文所用的“治疗组合物”是可以用于感染细菌、杀死细菌或抑制细菌生长的任何分子。这样的治疗组合物的实例包括但不限于噬菌体、抗生素、杀细菌化合物和具有杀细菌活性的其它治疗性分子(如小分子或生物制剂)。
术语“敏感性”或“敏感性谱”意指对于被治疗组合物感染和/或杀死和/或抑制生长敏感的细菌菌株。例如,术语“噬菌体敏感性”或“噬菌体敏感性谱”意指对于被噬菌体感染和/或杀死和/或抑制生长敏感的细菌菌株。
术语“不敏感性”或“具有抗性的”或“抗性”或“抗性谱”意指对于被治疗组合物感染和/或杀死和/或抑制生长不敏感,并且优选地高度不敏感的细菌菌株。例如,术语“噬菌体不敏感性”或“对噬菌体具有抗性的”或“噬菌体抗性”或“噬菌体抗性谱”意指对于被噬菌体感染和/或杀死和/或抑制生长不敏感,并且优选地高度不敏感的细菌菌株。
术语“中等敏感性”意指表现出对于被治疗组合物感染和/或杀死和/或抑制生长的敏感性的细菌菌株,所述敏感性介于敏感性菌株与不敏感性菌株对治疗组合物的敏感性之间。例如,术语“中等噬菌体敏感性”意指表现出对于被噬菌体感染和/或杀死和/或抑制生长的敏感性的细菌菌株,所述敏感性介于噬菌体敏感性菌株与噬菌体不敏感性菌株的敏感性之间。
如本文所用的“预测性模式”、“治疗组合物-宿主敏感性序列”或“噬菌体-宿主敏感性序列”是在构成训练集的多种细菌菌株和/或多种噬菌体株中被鉴定为与细菌的“敏感性谱”、“抗性谱”或“中等敏感性谱”相关的基因组模式。
如本文所用的“治疗组合物-宿主特异性谱”与“治疗组合物-宿主敏感性谱”可互换使用并且包含与细菌对多种不同的治疗组合物的敏感性或抗性有关的数据。例如,“噬菌体-宿主特异性谱”与“噬菌体-宿主敏感性谱”可互换使用并且包含与细菌对多种不同的噬菌体的敏感性或抗性有关的数据。所述治疗组合物-宿主特异性谱可以是经实验得出的(如用于治疗组合物-宿主训练集)或通过执行如本文所述的方法而预测的(参见方框220)。
如本文所用的“治疗组合物混合物”、“治疗有效的组合物混合物”或类似术语指的是包含多种治疗组合物,如由一种或多种噬菌体、抗生素或杀细菌剂构成的组合物,当向有需要的受试者给药时,其可以针对细菌感染提供临床上有益的治疗。在一些实施方案中,“治疗性噬菌体混合物”、“治疗有效的噬菌体混合物”、“噬菌体混合物”将指的是包含多种噬菌体的组合物。优选的是,治疗有效的治疗组合物混合物能够感染感染性亲本细菌菌株以及在消除亲本细菌菌株之后可能长出的新兴抗性细菌菌株。
如本文所用的术语“组合物”涵盖了如本文所公开的“治疗组合物混合物”,例如“噬菌体混合物”、“抗生素混合物”和/或“其它杀细菌化合物混合物”(以及噬菌体、抗生素和杀细菌剂的组合),其包括但不限于包含多种治疗组合物如多种纯化的噬菌体的药物组合物。“药物组合物”是本领域技术人员熟悉的并且通常包含与非活性成分组合配制的活性药物成分,所述非活性成分选自多种常规的药学上可接受的赋形剂、载体、缓冲剂和/或稀释剂。术语“药学上可接受的”用于指的是与诸如细胞、细胞培养物、组织或生物体的生物系统相容的无毒材料。药学上可接受的赋形剂、载体、缓冲剂和/或稀释剂的实例是本领域技术人员熟悉的并且可以参见于例如Remington's Pharmaceutical Sciences(《雷明顿药物科学》)(最新版),宾夕法尼亚州伊斯顿的麦克出版公司(Mack Publishing Company,Easton,Pa)中。例如,药学上可接受的赋形剂包括但不限于润湿剂或乳化剂、pH值缓冲物质、粘合剂、稳定剂、防腐剂、增量剂、吸附剂、消毒剂、洗涤剂、糖醇、胶凝剂或增粘剂、调味剂和着色剂。药学上可接受的载体包括大分子,如蛋白质、多糖、聚乳酸、聚乙醇酸、聚合氨基酸、氨基酸共聚物、海藻糖、脂质聚集体(如油滴或脂质体)和非活性病毒粒子。药学上可接受的稀释剂包括但不限于水、盐水和甘油。
待使用本文所述的混合物和组合物治疗的细菌包括对受试者健康构成威胁的任何细菌病原体。这些细菌包括但不限于“ESKAPE”病原体(粪肠球菌、金黄色葡萄球菌、肺炎克雷伯氏杆菌、鲍曼不动杆菌、铜绿假单胞菌和肠杆菌属菌种),其在性质上常常是院内感染的并且可以导致严重的局部感染和全身感染。在这些ESKAPE病原体中,鲍曼不动杆菌是一种革兰氏阴性的包囊的机会病原体,其容易在医院重症监护病房中传播。许多鲍曼不动杆菌临床分离株也是MDR,这严重限制了可用的治疗选择方案,创伤性伤口中的不可治疗的感染往往导致愈合时间延长,需要广泛的手术清创术,并且在一些情况下,导致进一步或完全截肢。进一步优选的细菌菌株包括蜡螟(G.mellonella)。
本领域技术人员将了解的是,经受本文所述的方法的细菌包括但不限于多药耐药性细菌菌株。如本文所了解的术语“多药耐药性的”、“多重药物耐药性的”、“多药耐药性”(MDR)和类似术语在本文中可以互换使用,并且是本领域技术人员熟悉的,即多药耐药性细菌是对多种抗细菌药物例如抗生素表现出抗性的生物体。
在优选的实施方案中,MDR细菌的实例是甲氧西林抗性金黄色葡萄球菌(MRSA)和万古霉素抗性肠球菌(VRE)。
如本文所理解的术语“不同来源”包括在环境中可以发现噬菌体的各种各样不同的地方,包括但不限于细菌可能繁殖的任何地方。实际上,噬菌体在环境中普遍丰富,从而使得新噬菌体的分离非常简单。影响这样的噬菌体的成功分离的主要因素是用作宿主的大量临床上相关的细菌病原体的可用性以及不同环境采样点的可进入性。
可以使用筛选方法来快速分离和扩增对所关注的细菌病原体具有特异性的裂解性噬菌体以用于产生噬菌体-宿主训练集,并且可以研究它们的治疗潜力。可能的来源包括例如环境中的天然来源,如土壤、海水、动物的肠道(例如人类的肠道),以及人为来源,如未处理的污水和来自废水处理厂的水。来自受感染的患者的临床样品也可以用作噬菌体的来源。在一个实施方案中,噬菌体的不同来源可以选自土壤、来自废水处理厂的水、原污水、海水以及动物和人类的肠道。此外,噬菌体可以源自于全球范围内多个不同地点的任何地方,例如在美国内和国际上。优选的是,噬菌体可以从不同的环境来源中分离,包括土壤、水处理厂、原污水、海水、湖泊、河流、溪流、固定式污水池、动物和人类的肠道或粪便、有机基质、生物膜或医疗/医院来源。
如本文所理解的“不同且重叠的细菌宿主范围”的概念指的是对于治疗组合物来说特定的细菌宿主范围。在噬菌体的情况下,“不同且重叠的细菌宿主范围”的概念指的是对于给定的噬菌体来说特定的细菌宿主范围,但是其可以与不同噬菌体的不同宿主范围重叠。例如,所述概念类似于维恩图的集合;每一个圆圈可以代表个体噬菌体的宿主范围(或其它治疗组合物的宿主范围),其可以与一种或多种其它噬菌体(或其它治疗组合物)的宿主范围相交。
如本文所用的术语“纯化的”指的是在组成中基本上不含不想要的物质的制品,所述不想要的物质包括但不限于生物材料,例如毒素,例如内毒素;核酸、蛋白质、碳水化合物、脂质或亚细胞细胞器和/或其它杂质,例如金属或其它痕量元素,其可能会干扰混合物的有效性。如本文所用的如“高滴度和高纯度”和“非常高滴度和非常高纯度”的术语指的是本领域技术人员所熟悉的纯度和滴度的程度。
如本文所用的术语“确定”涵盖了多种动作。例如,“确定”可以包括演算、计算、处理、推导、研究、查找(例如在表、数据库或另一数据结构中查找)、探知等。此外,“确定”可以包括接收(例如接收信息)、访问(例如访问存储器中的数据)等。此外,“确定”可以包括解析、选择、选取、建立等。
细菌对治疗组合物的敏感性/抗性谱
确定特定治疗性分子的“细菌宿主范围”指的是鉴定对治疗组合物具有敏感性或具有抗性的细菌菌株的过程。可以使用本领域技术人员熟悉(以及如实施例中所述)的常规方法进行筛选以确定细菌宿主范围,包括但不限于使用机器人技术的测定和其它高通量方法。
与具有窄宿主范围(例如对少于5种细菌菌株具有杀细菌活性)的分子相比,治疗组合物可以被分类为具有宽宿主范围(例如能够对多于10种细菌菌株具有杀细菌活性)。抗生素例如被分类为广谱抗生素或窄谱抗生素。
用于人类的广谱抗生素的实例包括但不限于:氨基糖苷类(除链霉素外)、氨苄西林、阿莫西林、阿莫西林/克拉维酸(奥格门汀)、碳青霉烯类(例如亚胺培南)、哌拉西林/他唑巴坦、喹诺酮类(例如环丙沙星)、四环素类、氯霉素、替卡西林和甲氧苄啶/磺胺甲唑(复方新诺明)。用于兽医学用途的广谱抗生素的实例包括但不限于复合阿莫西林-克拉维酸(co-amoxiclav)(在小型动物中);青霉素和链霉素以及氧四环素(在农场动物中);青霉素和增效型磺酰胺(在马中)。
当创建治疗性分子-宿主敏感性谱时可以考虑的杀细菌活性的实例包括裂解和/或细菌生长的延迟。
在另外的优选的实施方案中,杀细菌活性可以通过以下测量:(a)在浊度上至少0.1、至少0.125、至少0.15、至少0.175、至少0.2或0.1至0.2OD600吸光度差异的细菌生长延迟;(b)在至少4小时、至少5小时、至少6小时、至少7小时或4小时至6小时内没有出现细菌生长;(c)在宿主范围快速测试中处理至少4小时、至少5小时、至少6小时、至少7小时或4小时至6小时之后存活细菌的生长曲线降低;或(d)使用对来自宿主范围快速测试的经过处理的细菌进行的Omnilog生物测定,由活性细菌代谢引起的基于四唑染料的颜色变化中至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个或50个至200个相对呼吸单位的阻止或延迟。
在一些实施方案中,在建立机器学习模型时,可以将相同物质的细菌病原体用于训练集、验证集和测试集以训练机器学习模型。在一种不同的实施方案中,可以将不同物种的细菌病原体用于训练集、验证集和测试集以训练宿主机器学习模型。在另一种实施方案中,可以使用包含细菌病原体的临床上、基因型上和/或代谢上不同的菌株的细菌菌株来产生机器学习模型。代谢上不同的菌株的实例包括但不限于抗生素抗性、利用各种糖的能力、利用各种碳源的能力、在各种盐上生长的能力、在有氧或无氧条件下生长的能力或细菌运动性。
在一些实施方案中,所述模型将多种细菌菌株中的基因组区域鉴定为与对治疗组合物的“敏感性”或“抗性”谱相关(“预测性模式”),并且该信息可以用于基于在查询细菌内存在或不存在所述预测性模式来预测查询细菌是否将对治疗组合物具有敏感性或具有抗性。在一种实施方案中,从患有细菌感染的受试者获取临床样品。通常,但不一定,所述受试者感染了MDR细菌。在一种实施方案中,优选地使用快速测序方法对查询细菌的完整基因组进行测序。在一些实施方案中,所述模型可以明确地输出基因组区域和相关的权重或参数(治疗组合物-宿主敏感性序列),并且在其它实施方案中,所述信息可以被隐藏或体现在模型内(例如在分层神经网络或分类器中)。例如,可以利用深度学习机器学习模型(和方法),其包含多个内部分层的分类器和/或神经网络。在一些模型中,基因组区域可以有效地隐藏在模型中的权重和连接内。
如方框200中所述,处理序列数据导致预测查询细菌的治疗组合物-宿主特异性。在其它实施方案中,不是对整个细菌的基因组进行测序,而是可以对预测性模式进行扩增和/或测序以确定细菌的敏感性/抗性谱。
如本文所用的“细菌基因组”的“测序”涵盖了整个细菌基因组的完整测序或已经被鉴定为“预测性模式”的一部分的所关注的关键区域的测序。在优选的实施方案中,完整(或基本上完整,如>99%)的细菌基因组。据估计,细菌基因组中多达60%或80%的基因含有防御其它噬菌体感染的基因和机制。因此,优选的是,对完整的细菌基因组进行测序,或可替选地,对很大一部分(例如60%、70%、80%、90%或更多)进行测序以增加可以被鉴定并且因此被机器学习模型使用以改善预测性能的基因和特征的数量。在另外的优选的实施方案中,对细菌基因组的基因编码区进行测序。在另外的优选的实施方案中,对下表1中所列的基因进行测序。在另外的优选的实施方案中,对被所公开的方法鉴定为包含预测性模式的区域进行测序。
一旦产生机器学习模型,就可以(通过将查询细菌的基因组与治疗组合物-噬菌体机器学习模型进行比较)快速地鉴定将会对查询细菌具有杀细菌活性的治疗组合物。这种鉴定查询细菌的治疗组合物-宿主谱的能力不依赖于细胞培养,并且因此,可以快速地进行,从而以更快速的方式向受试者提供急需的疗法。此外,随着另外的临床和/或另外的序列数据出现,可以重新训练和改进所述模型。
细菌对噬菌体的敏感性/抗性谱
确定噬菌体的“细菌宿主范围”指的是鉴定易于被给定噬菌体感染的细菌菌株的过程。给定噬菌体的宿主范围对特定菌株水平具有特异性。可以使用本领域技术人员熟悉(以及如实施例中所述)的常规方法进行筛选以确定噬菌体的细菌宿主范围,包括但不限于使用机器人技术的测定和其它高通量方法。
具有宽宿主范围(例如能够感染多于10种细菌菌株)的噬菌体一般表明所述噬菌体的受体在这些菌株中是普遍的。窄宿主范围(例如能够感染少于5种细菌菌株)可能表明独特的受体。
确定细菌的“噬菌体-宿主敏感性谱”依赖于用于分析噬菌体的细菌宿主范围的相同类型的测定。在此,目的在于针对多种不同的噬菌体对一种细菌菌株进行筛选以将能够感染和/或裂解细菌的那些噬菌体(“敏感性谱”)或不能感染和/或裂解细菌的那些噬菌体(“抗性谱”)进行分类。
当创建噬菌体-宿主敏感性谱时可以考虑的杀细菌活性的实例包括裂解、细菌生长的延迟或没有出现噬菌体抗性细菌生长。在另外的优选的实施方案中,可以通过噬斑测定来测量杀细菌活性。可以从噬斑测定得出的数据包括但不限于:测量噬斑的尺寸、浑浊度和/或透明度和/或噬斑周围晕圈的存在。
在另外的优选的实施方案中,杀细菌活性可以通过以下测量:(a)可以在细菌样品上产生透明点噬斑的噬菌体;(b)在平板上使用快速划线法表现出裂解特征的噬菌体;(c)通过小批量或大批量测定,在浊度上至少0.1、至少0.2、至少0.3、至少0.4、至少0.5或0.1至0.5OD600吸光度差异的细菌裂解;(d)在细菌抑制性噬菌体感染中,在浊度上至少0.1、至少0.125、至少0.15、至少0.175、至少0.2或0.1至0.2OD600吸光度差异的细菌生长延迟;(e)在感染后至少4小时、至少5小时、至少6小时、至少7小时或4小时至6小时内没有出现噬菌体抗性细菌生长;(f)在宿主范围快速测试中噬菌体感染至少4小时、至少5小时、至少6小时、至少7小时或4小时至6小时之后存活细菌的生长曲线降低;或(g)使用对来自宿主范围快速测试的受噬菌体感染的细菌进行的Omnilog生物测定,由活性细菌代谢引起的基于四唑染料的颜色变化中至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个或50个至200个相对呼吸单位的阻止或延迟。
在一些实施方案中,在建立噬菌体-宿主机器学习模型时,可以将相同物种的细菌病原体用于训练集、验证集和测试集以训练噬菌体-宿主机器学习模型。在一种不同的实施方案中,可以将不同物种的细菌病原体用于训练集、验证集和测试集以训练噬菌体-宿主机器学习模型。在另一种实施方案中,可以使用包含细菌病原体的临床上、基因型上和/或代谢上不同的菌株的细菌菌株来产生机器学习模型。代谢上不同的菌株的实例包括但不限于抗生素抗性、利用各种糖的能力、利用各种碳源的能力、在各种盐上生长的能力、在有氧或无氧条件下生长的能力或细菌运动性。
在一些实施方案中,所述模型将多种细菌菌株和/或多种噬菌体株和/或其组合中的基因组区域鉴定为与“敏感性”或“抗性”噬菌体-宿主谱相关(“预测性模式”),并且该信息可以用于基于在查询细菌内存在或不存在所述预测性模式来预测查询细菌是否将对噬菌体具有敏感性或具有抗性。在一种实施方案中,从患有细菌感染的受试者获取临床样品。通常,但不一定,所述受试者感染了MDR细菌。在一种实施方案中,优选地使用快速测序方法对查询细菌的完整基因组进行测序。在一些实施方案中,所述模型可以明确地输出基因组区域和相关的权重或参数(噬菌体-宿主敏感性序列),并且在其它实施方案中,所述信息可以被隐藏或体现在模型内(例如在分层神经网络或分类器中)。
如方框200中所述,处理序列数据导致预测查询细菌的噬菌体-宿主特异性。在其它实施方案中,不是对整个细菌的基因组进行测序,而是可以对预测性模式进行扩增和/或测序以确定感染性细菌的敏感性/抗性谱。
如本文所用的“细菌基因组”和/或“噬菌体基因组”的“测序”涵盖了整个细菌/噬菌体基因组的完整测序或已经被鉴定为“预测性模式”的一部分的所关注的关键区域的测序。在优选的实施方案中,对整个基因组或细菌/噬菌体基因组的至少90%、至少80%、至少70%或至少60%进行测序。在另外的优选的实施方案中,对细菌基因组的基因编码区进行测序。在另外的优选的实施方案中,对下表1中所列的基因进行测序。在另外的优选的实施方案中,对被所公开的方法鉴定为包含预测性模式的区域进行测序。
一旦产生机器学习模型,就可以(通过将查询细菌的基因组与宿主-噬菌体机器学习模型进行比较)快速地鉴定将会能够感染和杀死查询细菌的噬菌体。这种鉴定查询细菌的噬菌体-宿主谱的能力不依赖于细胞培养,并且因此,可以快速地进行,从而以更快速的方式向受试者提供急需的疗法。
机器学习模型
图1A示出了本发明的一种实施方案,其包括可以由电子设备执行的示例性方法,所述电子设备具有至少一个处理器和其中存储有用于执行该过程的指令的存储器。所述方法包括计算机(120),其接收多种细菌菌株的基因组序列的基因组序列数据(100)。在一些实施方案中,所述序列数据还可以包括多种细菌菌株和多种噬菌体株两者的基因组序列。在一些实施方案中,还提供了多种细菌菌株的治疗组合物-宿主敏感性谱数据(例如噬菌体-宿主敏感性谱数据、抗生素-宿主敏感性谱、杀细菌剂-宿主敏感性谱和/或组合的敏感性谱)(110)。在(130)处,基于输入数据(例如数据集100和数据集110)训练机器学习模型。在其它实施方案中,迭代地执行训练步骤130,如135处的箭头所示。所产生的输出是包括深度学习模型的机器学习模型(180)。这可以是具有人类可读的输出或参数的计算模型,如包含序列和权重的治疗组合物-宿主敏感性序列(例如噬菌体-宿主敏感性序列、抗生素-宿主敏感性序列和/或杀细菌剂-宿主敏感性序列)(180)的集合,或所述计算模型可以是隐藏、分层或复杂模型中的隐藏模型,在给出输入序列的情况下,其简单地产生输出敏感性估计值。
图1B示出了如何训练机器学习模型(130)以产生治疗组合物-宿主特异性(例如噬菌体-宿主特异性、抗生素-宿主特异性、杀细菌剂-宿主特异性和/或组合的特异性)的预测谱(170)的一种实施方案。具体地,通过将序列模式与治疗组合物-宿主敏感性谱(例如噬菌体-宿主敏感性谱、抗生素-宿主敏感性谱、杀细菌剂-宿主敏感性谱和/或组合的敏感性谱)相关联来对多种细菌菌株进行表征(140)。这是通过针对相似的和不相似的治疗组合物-宿主敏感性谱鉴定相似的和不相似的基因组序列模式(150和160)而实现的。在步骤170处,对于每一种细菌菌株输出治疗组合物-宿主特异性的预测谱。然而,在一些实施方案中,不是输出治疗组合物-宿主特异性的预测谱(步骤170),而是所述预测谱由受过训练的机器学习模型存储在内部,例如存储为各种内部权重和模型参数。
图1C提供了流程图,其示出了根据一种实施方案的无监督机器学习模块和在另外的数据变得可用时更新模型。在该实施方案中,使用无监督模型拟合基因组序列数据(100),所述基因组序列数据可以关于(a)多种细菌菌株的基因组序列或(b)多种细菌菌株和多种噬菌体株两者的基因组序列。例如,可以将所述数据进行聚类,拟合神经网络(包括分层神经网络)或使用潜在变量模型以产生噬菌体宿主敏感性序列。在一些实施方案中,可以使用治疗组合物-宿主敏感性谱(例如噬菌体-宿主敏感性谱、抗生素-宿主敏感性谱、杀细菌剂-宿主敏感性谱和/或组合的敏感性谱)来辅助特征检测(182)。图1C还示出了模型更新过程。例如,当另外的基因组序列数据变得可用时,将其提供给所述模型以重新拟合和改进所述模型。例如,该另外的数据可以是在自上次产生所述模型以来一段较长的时间(例如12个月)内获得的一组患者的查询细菌的集合。使用另外的数据对模型进行改进可以对于本文所述的任何机器学习模型进行。
图1D提供了流程图,其示出了根据一种实施方案的涉及训练集、验证集和测试集以产生机器学习模型的迭代有监督机器学习。在这个实例中,首先选择模型算法(例如分类器或神经网络)。接下来,定义训练集132、验证集133和测试集134,它们各自使用基因组序列数据100和治疗组合物-宿主敏感性谱110作为标记(目标或输出)。使用基因组序列数据和治疗组合物-宿主敏感性谱110针对训练集132拟合模型136以根据一些预定义标准确定将所述数据最佳拟合的模型权重和/或参数。然后使用验证集来验证所拟合的模型137,如通过提供输入验证基因组序列并且将模型结果与相关的噬菌体-宿主敏感性谱进行比较。然后调整模型138(例如使用反向传播技术)并且重新运行拟合和验证步骤。进行该迭代拟合直到在验证集上获得令人满意的性能为止。一旦获得令人满意的性能,就使用测试集134来测试模型的性能139并且保存最终的模型并且存储输出性能。
图2示出了可以如何使用所产生的机器学习模型(180)来对查询细菌进行治疗组合物-宿主特异性预测(例如噬菌体-宿主特异性、抗生素特异性、杀细菌剂特异性和/或组合的特异性)(200)以及选择治疗组合物(如噬菌体、抗生素、杀细菌剂和/或组合)(230)。将查询细菌的基因组序列(190)作为输入提供给受过训练的机器学习模型(130)。在一些实施方案中,所述机器学习模型将查询细菌的基因组序列(190)与机器学习模型(130)进行比较并且处理以与治疗组合物-宿主机器学习模型相比,鉴定相似的和/或不相似的序列模式(210)。然后作出查询细菌的特异性预测(220)。这些可以呈谱匹配分数的形式,其中更高的谱匹配分数代表更高的治疗组合物-宿主敏感性。在其它实施方案中,可以对于每一对噬菌体-宿主估计敏感性概率并且将其输出。可以采取另一个步骤来选择由(200)的过程鉴定为对查询细菌具有特异性的治疗组合物(例如噬菌体、抗生素、杀细菌剂和/或组合)以用于治疗细菌感染或污染。然而,在一些实施方案中,受过训练的模型可以在内部存储治疗组合物-宿主特异性信息或所学习的共同基因组序列模式,而不是输出所鉴定的相似性序列或治疗组合物-宿主敏感性序列(步骤210)。在这些实施方案中,受过训练的机器学习模型在内部处理输入的基因组序列并且直接输出针对查询细菌的预测220。也就是说,将查询细菌的基因组序列190作为输入提供给受过训练的模型,所述模型估计查询细菌的治疗组合物-宿主特异性预测(220)并且所述模型如何确切地产生这些估计值的方式被隐藏或以对于人工检查不明显的形式存储。
图3描绘了被配置成执行本文所述的过程中的任一个的示例性计算系统。在这种背景下,计算系统可以包括例如处理器、存储器、存储设备和输入/输出设备(例如监视器、键盘、磁盘驱动器、互联网连接等)。然而,所述计算系统可以包括用于执行所述过程的一些或所有方面的电路或其它专用硬件。在一些操作设置中,所述计算系统可以被配置成包括一个或多个单元的系统,所述单元中的每一个被配置成在软件、硬件或其某种组合中执行所述过程的一些方面。所述计算机系统可以是包括基于云的计算系统的分布式系统。
具体地,图3描绘了具有可以用于执行本文所述的过程的许多部件的计算系统(300)。例如,输入/输出(“I/O”)接口330、一个或多个中央处理单元(“CPU”)(340)和存储器部分(350)。I/O接口(330)与输入和输出设备如显示器(320)、键盘(310)、磁盘存储单元(390)和媒体驱动单元(360)连接。媒体驱动单元(360)可以读取/写入计算机可读介质(370),所述计算机可读介质可以含有程序(380)和/或数据。I/O接口可以包含网络接口和/或使用预定义的通信协议(例如蓝牙、Zigbee、IEEE 802.15、IEEE 802.11、TCP/IP、UDP等)与其他设备中的等效通信模块进行通信的通信模块。
可以保存基于本文所述的过程的结果的至少一些值以供后续使用。此外,可以使用非瞬时性计算机可读介质来存储(例如有形地体现)一个或多个计算机程序以用于借助于计算机来执行上述过程中的任一个。计算机程序可以例如以通用编程语言(例如Pascal、C、C++、Java、Python、JSON、Perl、MATLAB、R等)或某种专用特定应用语言编写。也可以使用一系列机器学习和深度学习软件库,如TensorFlow、scikit-learn、Theano、Apache SparkMLlib、Amazon Machine Learning、Deeplearning4j等。图4A示出了用于本文所述的方法和系统中的包含多个内部层(402至414)的深度学习模型的示例性架构。例如,所述深度学习模型可以是卷积神经网络模型,其具有输入层401,和使用修正线性单元(ReLU)激活(也被称为修正激活函数)的一组卷积滤波器402至414,和输出层415。在其它实施方案中,可以使用如上文所述的其它深度学习模型。图4B示出了用于本文所述的方法和系统中的深度学习模型中的层中的神经元之间的连接。例如,第一层421中的第一组神经元与第二层422中的第二组神经元连接。这些进而与第三层423中的第三组神经元连接。将权重应用于每一个连接(即每一个箭头)。在训练过程中,通过模型处理输入,并且损失(或成本或误差)函数估计性能,如通过将预测与已知的结果(有监督学习)或基准进行比较。然后可以例如使用反向传播技术改变单个层上的权重,并且重新处理输入并且重新计算损失函数。重复该训练过程直到实现可接受的性能为止。此外,随着获得另外的数据(例如来自使用特定噬菌体或治疗组合物对抗特定细菌的临床结果),可以对模型进行改进和重新训练。
还提供了一种非瞬时性计算机可读存储介质,其包含用于执行本文所述的方法中的任一种的计算机可执行指令。还提供了一种计算机系统,其包含一个或多个处理器、存储器和一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并且被配置成由所述一个或多个处理器执行,所述一个或多个程序包括用于执行本文所述的方法中的任一种的指令。
组合物和治疗方法
在另一个方面,本发明涉及在被描述为方框200的过程中鉴定的治疗组合物(“混合物”),其包含噬菌体、抗生素和/或杀细菌剂(包括噬菌体、抗生素和/或杀细菌剂的混合物)。在一种具体的实施方案中,所述组合物是在自然界中不存在的非常高滴度和纯度的治疗有效的噬菌体混合物。此外,虽然本文所述的方法可以用于配制针对受试者的特定细菌感染的个性化噬菌体混合物,但是在本文中考虑了所述混合物可以用于治疗感染了具有如由机器学习系统所识别和定义的感染性模式的相同或非常相似的细菌菌株的其它个体。因此,所述方法可以用于产生具有广泛治疗用途的噬菌体混合物。
此外并且在另一个方面,本发明涉及在被描述为方框200的过程中鉴定的治疗组合物,其包含治疗性分子,如抗生素或其它杀细菌化合物(包括混合物)。在优选的实施方案中,所述治疗组合物彼此协同作用,例如与一种或多种抗生素和/或其它杀细菌化合物组合给药的噬菌体混合物。
如由本领域技术人员所理解的那样,药物组合物中包括的药学上可接受的附加组分的类型和量可以例如根据所期望的给药途径和所期望的身体状态、组合物的溶解度、稳定性和体内释放速率而变化。
如本文中所考虑,噬菌体混合物,并且特别是噬菌体混合物的药物组合物在适于向受试者给药的重量或体积单位中包含一定量的噬菌体。向受试者给药的组合物的体积(剂量单位)将取决于给药方法并且是本领域技术人员可辨别的。例如,在注射剂的情况下,给药体积通常可以是0.1ml至1.0ml,例如约0.5ml,其中注射产品中内毒素的最大允许水平是5EU/kg/小时或对于70公斤的人350EU/小时。
对于通过静脉内、皮肤、皮下或其它注射方式给药,药物制剂通常呈具有合适的pH值和稳定性的肠胃外可接受的水溶液的形式,并且可以含有等渗媒剂以及药学上可接受的稳定剂、防腐剂、缓冲剂、抗氧化剂或本领域技术人员熟悉的其它添加剂。
治疗方法
根据本发明的方法产生的治疗组合物,例如噬菌体混合物可以用于治疗受试者的细菌感染或环境中的细菌污染。这样的治疗方法包括向有需要的受试者给药有效量的本文所述的组合物(例如噬菌体混合物)。
应当了解的是,活性化合物或活性剂的适当剂量可以因患者而异。确定最佳剂量一般将涉及治疗益处水平与给药的任何风险或有害副作用之间的平衡。所选择的剂量水平将取决于多种因素,包括但不限于给药途径、给药时间、活性化合物的排泄速率、组合使用的其它药物、化合物和/或材料以及患者的年龄、性别、体重、病症、一般健康状况和既往病史。活性化合物的数量和给药途径最终将由医师决定,尽管一般,剂量将在不引起显著的不良或有害副作用的情况下在治疗部位达到活性化合物的浓度。
一般,活性化合物或活性剂的合适剂量在每公斤体重约1μg或更低至约100μg或更高的范围内。作为一般指导,本发明的噬菌体混合物的合适的量可以是每剂量约0.1μg至约10mg的量。
此外,本文所述的包括噬菌体混合物和/或与一种或多种抗生素的组合的治疗组合物可以以多种剂型给药。这些包括例如液体制剂和悬浮液,包括用于肠胃外、皮下、真皮内、肌内、腹膜内、鼻内(例如气雾剂)或静脉内给药(例如注射给药)的制剂,如无菌等渗水溶液、悬浮液、乳液或黏性组合物,其可以被缓冲到所选择的pH值。在一个具体的实施方案中,在本文中考虑了将噬菌体混合物作为注射剂向受试者给药,包括但不限于用于通过肌内、静脉内、皮下或透皮注射递送的可注射组合物。这样的组合物可以使用本领域技术人员熟悉的各种药物赋形剂、载体或稀释剂来配制。
在另一个具体的实施方案中,包括本文所述的噬菌体混合物的治疗组合物可以口服给药。根据本发明的方法给药的口服制剂可以包括各种剂型,例如溶液、粉剂、悬浮液、片剂、丸剂、胶囊、囊片、持续释放制剂或定时释放制剂或具有液体填充物的制剂,例如明胶覆盖的液体,由此明胶在胃中溶解以向肠道递送。这样的制剂可以包括本文所述的各种药学上可接受的赋形剂,包括但不限于甘露糖醇、乳糖、淀粉、硬脂酸镁、糖精钠、纤维素和碳酸镁。
在一个具体的实施方案中,在本文中考虑了用于口服给药的组合物可以是液体制剂。这样的制剂可以包含药学上可接受的增稠剂,其可以产生具有提高的黏度的组合物,所述粘度有助于活性剂的粘膜递送,例如通过提供延长的与胃粘膜的接触时间。这样的黏性组合物可以由本领域技术人员采用常规方法并且采用药物赋形剂和试剂例如甲基纤维素、黄原胶、羧甲基纤维素、羟丙基纤维素和卡波姆而制得。
在本文中考虑了适用于经鼻或呼吸道(粘膜)给药的其它剂型,例如呈挤压喷雾分配器、泵分配器或气雾剂分配器的形式。在本文中还考虑了适用于直肠或阴道递送的剂型。本发明的构建体、缀合物和组合物也可以被冻干并且可以在有或没有使用常规方法进行再水化的情况下向受试者递送。
如本文中所理解的那样,向受试者给药治疗组合物(包括本文所述的噬菌体混合物和/或与抗生素或其它杀细菌化合物的组合)的方法可以经由不同的方案进行,即以足以向受试者提供临床上有意义的益处的量和方式以及持续时间进行。用于本发明的合适的给药方案可以由本领域技术人员根据常规方法确定。例如,在本文中考虑了可以将有效量以单次剂量、在几天时间内给药的一系列多次剂量,或先以单次剂量,之后以加强剂量向受试者给药。
给药方案,例如给药量、治疗次数和每单位剂量的有效量等将取决于专业人员的判断并且取决于受试者。在这方面要考虑的因素包括受试者的身体和临床状态、给药途径、预期的治疗目标以及包括噬菌体混合物的治疗组合物的效力、稳定性和毒性。如本领域技术人员所理解的那样,“加强剂量”可以包含与初始剂量相同的剂量或不同的剂量。实际上,当给药一系列剂量以在受试者中产生所期望的响应时,本领域技术人员将明白的是,在这种情况下,“有效量”可以涵盖多于一次给药剂量。
尽管在本文已经参照实施方案描述了本发明,但是应当了解的是,这些实施方案和本文提供的实施例仅仅说明了本发明的原理和应用。因此,应当理解的是,在不脱离如由所附权利要求所限定的本发明的精神和范围的情况下,可以对说明性实施方案和实施例进行许多修改并且可以设计其它布置。本文引用的所有专利申请、专利、著作和参考文献在此以引用的方式整体并入本文。
实施例
现在将参照以下实施例进一步说明本发明。应当了解的是,以下所述仅作为实例并且可以对细节进行修改而仍落入本发明的范围内。
实施例1:从环境来源中进行噬菌体分离/表征。
可以将粉末状TSB培养基(BD公司(Becton,Dickinson and Company))与原污水混合达到3%w/v的最终浓度。可以使不同的细菌菌株生长到指数期,并且将1mL的每一种菌株添加到TSB-污水混合物的100mL等分试样中,并且在37℃和250rpm下温育过夜。第二天,收获1mL受感染的TSB-污水混合物并且将其以8,000×g离心5分钟以使细胞和碎片沉淀。将上清液转移到无菌的0.22μm离心管过滤器(纽约州的康宁公司(Coming,NY))中并且以6,000×g离心以去除任何残留的细菌。将滤液的10μL等分试样与100μL细菌菌株的指数生长培养物混合,在37℃下温育20分钟,与2.5mL回火到50℃的熔融顶层琼脂(0.6%琼脂)混合,并且倒在TSB琼脂平板(1.5%TSB琼脂)上。将平板在37℃下温育过夜,并且使用例如Sambrook等所述的标准程序在适当的细菌菌株分离物上将后续的噬菌体噬斑单独地收获并纯化3次。
如果需要的话,可以通过本领域技术人员已知的标准程序在相应的宿主细菌中繁殖和扩增高滴度噬菌体原液。可以通过氯化铯密度离心来纯化大规模噬菌体制品,并且将其通过0.22μm过滤器(马萨诸塞州比尔里卡的密理博公司(Millipore Corporation,Billerica,MA))过滤。
例如,可以通过本领域公知的氯化铯梯度来纯化噬菌体。在此,可以在4℃下用10%聚乙二醇8000(西格玛-奥德里奇公司(Sigma-Aldrich))和0.5M氯化钠使所产生的纯化的噬菌体悬浮液(1ml)沉淀过夜。随后,可以将悬浮液以17,700g离心15分钟并且去除上清液。可替选地,可以将噬菌体悬浮液透析。将PEG/盐诱导的沉淀物重悬在0.5ml的TE缓冲液(pH 9.0)中并且在56℃下用20μl的20mg/ml蛋白酶K处理20分钟,继而在65℃下用SDS以2%的最终浓度处理20分钟。然后将该混合物用苯酚/氯仿(25:24:1的苯酚:氯仿:异戊醇,西格玛-奥德里奇公司)处理至少2次,然后用2.5倍体积的冰冷96%乙醇和0.1倍体积的乙酸钠(pH 4.8)使水相沉淀。在离心之后,将沉淀物在70%乙醇中洗涤并且重悬在100μl的TE缓冲液(pH 8.0)中。然后可以将噬菌体原液无限期地储存在4℃下。可以通过将十倍连续稀释液平板接种并且计算噬斑形成单位(PFU)来评估噬菌体滴度。
噬菌体纯化的其它方法包括但不限于使用辛醇或丁醇进行分配分离。在这种技术中,噬菌体通常保持在水相中,而内毒素倾向于被醇相吸收。
实施例2:用于产生噬菌体-宿主敏感性谱的测定。
为了实施所公开的方法,需要比较具有相似的或相同的噬菌体-宿主敏感性谱的多种不同细菌菌株的基因组。如果细菌的噬菌体-宿主敏感性谱是已知的,那么不需要进行以下测定。然而,如果细菌的噬菌体-宿主敏感性谱是未知的,那么可以使用以下测定中的任一种来确定或经实验得出这样的谱。
确定细菌的敏感性/抗性谱的一种方法依赖于自动化的间接的液体裂解测定。简单地说,将细菌菌株的过夜培养物接种到含有与1%v/v四唑染料混合的TSB的96孔板的孔中。然后将噬菌体添加到每一个孔中,并且将板在OmniLogTM系统(加利福尼亚州海沃德的Biolog公司(Biolog,InC,Hayward,CA))中在37℃下温育过夜。参见Henry,Bacteriophage2:3,159-167(2012)。四唑染料间接地测量了细菌细胞的呼吸。呼吸引起四唑染料的还原,从而使颜色变为紫色。将每一个孔的颜色强度定量为细菌生长的相对单位。对于宿主范围确定,以每孔105个菌落形成单位(CFU)接种细菌并且以每孔106个噬斑形成单位(PFU)的浓度添加噬菌体以达到10的MOI。对于混合物协同效应研究,可以以每孔106CFU接种细菌并且以每孔108PFU的浓度添加噬菌体以达到100的MOI。
也可以使用第二种测定法来确定细菌的敏感性/抗性谱。在该测定法中,使用稀释系列点样平板测定来观测噬斑形成。具体地,使用50μL细菌的过夜培养物来单独地对5mL回火到55℃的熔融顶层琼脂进行接种。然后通过短暂涡旋将经接种的琼脂充分混合,然后铺在正方形LB琼脂平板上。使顶层琼脂凝固约45分钟,此时将每一种噬菌体的10倍稀释液中1010至102PFU的4μL等分试样点样在表面上。使斑点完全吸收到顶层琼脂中,之后将平板在37℃下温育24小时。然后可以评估噬斑形成。
也可以使用时间-杀菌实验来提供细菌的定量敏感性/抗性谱。在此,将细菌的过夜培养物在新鲜的LB肉汤中1:1000稀释到约1×106CFU/mL的最终浓度。然后将20mL等分试样转移到250mL锥形瓶中并且在37℃下在以200rpm振荡下温育2小时。然后用2×1011PFU/mL的噬菌体或等体积的无菌磷酸盐缓冲盐水(PBS)攻击样品并且重新温育。在0小时、2小时、4小时和24小时取100μL的等分试样,在PBS中连续稀释,并且平板接种在LB琼脂上。将平板在37℃下温育24小时并且评价噬斑形成。
也可以使用拉曼光谱法监测由于噬菌体暴露而引起的细菌变化。在此,从LB琼脂平板获得每一个样品并且将其直接转移到一次性称量盘中以进行光谱收集。可以使用830nm拉曼PhA T系统(美国密歇根州安娜堡的凯撒光学系统公司(Kaiser OpticalSystems,InC,Ann Arbor,MI,USA))收集拉曼光谱。使用3mm光斑尺寸的透镜(以100秒的总采集时间)和1mm光斑尺寸的透镜(以100秒的总采集时间)收集时间-杀菌测定样品的光谱。然后在分析之前通过使用六阶多项式进行基线去除并且相对于1445cm-1拉曼振动谱带进行强度归一化来对光谱进行预处理。
当创建敏感性/抗性谱时可以考虑的杀细菌活性的其它实例包括裂解、细菌生长的延迟或没有出现噬菌体抗性细菌生长。在另外的优选的实施方案中,杀细菌活性可以通过以下测量:(a)可以在细菌样品上产生透明点噬斑的噬菌体;(b)在平板上使用快速划线法表现出裂解特征的噬菌体;(c)通过小批量或大批量测定,在浊度上至少0.1、至少0.2、至少0.3、至少0.4、至少0.5或0.1至0.5OD600吸光度差异的细菌裂解;(d)在细菌抑制性噬菌体感染中,在浊度上至少0.1、至少0.125、至少0.15、至少0.175、至少0.2或0.1至0.2OD600吸光度差异的细菌生长延迟;(e)在感染后至少4小时、至少5小时、至少6小时、至少7小时或4小时至6小时内没有出现噬菌体抗性细菌生长;(f)在宿主范围快速测试中噬菌体感染至少4小时、至少5小时、至少6小时、至少7小时或4小时至6小时之后存活细菌的生长曲线降低;或(g)使用对来自宿主范围快速测试的受噬菌体感染的细菌进行的Omnilog生物测定,由活性细菌代谢引起的基于四唑染料的颜色变化中至少50个、至少75个、至少100个、至少125个、至少150个、至少175个、至少200个或50个至200个相对呼吸单位的阻止或延迟。
使用这些测定,可以针对一组不同的细菌菌株测试多种噬菌体以创建噬菌体-宿主敏感性谱。该谱可以基于噬菌体感染细菌的能力,并且还可以基于例如每一种噬菌体可以阻止细菌宿主在液体中生长的小时数(保持时间)和/或噬斑的透明度/浊度。一旦通过实验产生了多种细菌菌株的噬菌体-宿主敏感性谱,就可以使用如本文所述的过程将这些菌株分类为表现出相似谱的组。
本实施例中描述的测定法可以容易地修改以筛选如本文所述待使用的其它杀细菌化合物。
实施例3:基因组测序、汇编和注释
可以使用标准测序技术对噬菌体和/或细菌的基因组进行测序并且使用本领域公知的重叠群分析进行汇编。例如,可以提取从噬菌体或细菌中分离的5μg DNA并且将其运送到合同测序设施。在454FLX仪器上使用焦磷酸测序技术获得40倍至65倍的测序覆盖率。将由454FLX仪器生成的文件用GS assembler(康涅狄格州布兰福德的454公司(454,Branford,Conn.))汇编以产生共有序列。基因组序列的质量改善可以涉及对整个基因组中15个-25个PCR产物进行测序以确保正确的汇编、双链形成以及解决在同聚核苷酸束内发生的任何剩余碱基冲突。可以使用本领域已知的标准程序(如BLASTP)预测编码蛋白质的开放阅读框(ORF),继而进行人工评估并且在必要时进行校正。
实施例4:查询细菌的噬菌体-宿主谱的预测
尽管实施例4和实施例5旨在鉴定细菌和噬菌体之间核苷酸序列的模式,但是可以容易地修改同一种方法以鉴定反映对任何治疗组合物如抗生素和/或其它杀细菌化合物(或治疗性分子)的敏感性或抗性的细菌的基因组模式。
所公开的方法基于计算机AI神经网络分析能够发现基因组序列模式以有助于识别特定噬菌体的能力,所述基因组序列模式使得该噬菌体具有用作临床分离的细菌菌株的有效抗细菌剂的能力。为了实现这个目的,我们使用机器学习,如神经网络分析以在(a)细菌或(b)细菌和噬菌体两者的基因组中搜索核苷酸序列的模式,以预测特定噬菌体是否可以通过杀死临床分离的细菌菌株、在临床分离的细菌菌株中复制、裂解临床分离的细菌菌株或抑制临床分离的细菌菌株的生长而用作抗细菌剂。这样的基于计算机的预测将显著缩短找到用于治疗感染的噬菌体所需的时间。
这种方法与早期的尝试不同,所述早期的尝试使用计算机来寻找影响某些细菌菌株的噬菌体之间的关联,或反之亦然。先前的方法搜索已知的攻击性和防御性噬菌体和细菌系统,包括细菌菌株上的噬菌体受体位点或基于核苷酸同源性的匹配(参考文献6-7)。然而,由于在噬菌体-细菌相互作用的40亿年的过程中发展的攻击性和防御性工具之间的相互作用的复杂性,因此这样的匹配将不太可能提供可靠的临床指导(参考文献1-7)。
发现细菌进化以保护其自身免受噬菌体侵害的机制和由噬菌体产生的对策目前是深入研究活动的主题。迄今为止揭露的机制众多并且往往很复杂。它们包括最近阐明的噬菌体使用特定蛋白质来防御成簇的规律间隔的短回文重复序列(CRISPR)-Cas噬菌体免疫机制。例如,以下从Sampson等,“Revenge of The Phages:Defeating BacterialDefenses(噬菌体的复仇:击败细菌防御)”,Nat.Rev.Microbiol.11:675-687,2013的综述中转载的表1概述了一些细菌防御和噬菌体已经进化以克服它们的机制。
表1|噬菌体用于绕过细菌抗病毒系统的策略的汇总
表1(续)|噬菌体用于绕过细菌抗病毒系统的策略的汇总
表1(续)|噬菌体用于绕过细菌抗病毒系统的策略的汇总
Cas:CRISPR相关蛋白;CRISPR:成簇的规律间隔的短回文重复序列;EPS:胞外多糖;LPS:脂多糖;mtd:主要嗜性决定因子;PAM:前间区序列邻近基序;RBP:受体结合蛋白;REase:限制性核酸内切酶。
考虑到地球上估计有1031种噬菌体并且有1030种细菌,表1只是我们描绘细菌防御机制武器库和噬菌体对这些机制的响应的早期开端。即使在该发现水平上,我们也需要意识到细菌防御通常是多层的,并且每一种细菌菌株可能包含这些防御机制中的超过一种。
对于在当前的基因组“匹配搜索”中无法描绘的相互作用类型的实例,涉及某些大肠杆菌菌株,其已经进化出可以用作噬菌体感染屏障的特定多糖外荚膜。为了对抗这种防御,噬菌体已经进化出与它们的尾丝连接的蛋白质(酶),其具有消化特定多糖外荚膜的能力。然而,需要不同的酶来“消化”已经进化以保护细菌“宿主”的特定多糖外荚膜中的每一种。基于细菌序列与病毒序列之间的同源性的基因组“匹配搜索”不可能识别特定噬菌体蛋白的基因,所述基因编码可以降解在细菌中由多种酶合成的细菌多糖外荚膜的酶,并且当然,此时,不可能根据噬菌体酶的序列数据预测噬菌体酶对特定多糖的特异性(参见Scholl等的参考文献,即参考文献:8-10)。
因此,对于基于已知的攻击性和防御性噬菌体-细菌系统或基于核苷酸同源性的匹配的策略所指出的局限性可以通过使用机器学习/人工计算机智能来搜索(a)细菌或(b)细菌和噬菌体基因组的核苷酸序列中的预测性模式,或基于序列数据以其它方式对噬菌体-宿主特异性进行分类或鉴定的本文所述的方法克服。
例如,以这样的方式使用计算机“神经网络分析”或深度学习方法来搜索噬菌体和它们的“宿主”细菌的基因组,所述方式类似于Google用于结合贝叶斯机器学习来开发基于计算机的翻译和游戏程序的“深度思维(Deep Mind)”方法,如由IBM“Watson”系统所采用。通过“训练”计算机以针对临床细菌分离株的核苷酸模式来“识别”特定噬菌体株中的核苷酸模式,可以有助于发现这样的模式,所述特定噬菌体株已经被证明可有效作为抗细菌剂,所述临床细菌分离株已经被证明对那些噬菌体株敏感。这样的尝试还将会需要使用对特定噬菌体株具有抗性的细菌训练计算机系统。
开发“神经网络分析”或其它机器学习平台以搜索噬菌体基因组和细菌宿主基因组这两者的如本文所述的核苷酸序列中的预测性模式可以提供满足对于在不需要执行细胞杀死曲线的情况下预测细菌菌株对用于临床/环境应用的特定噬菌体株的敏感性的快速方式的未满足需求的主要途径。鉴于使用这些数据集进行“足够的”训练,预期人工计算机智能系统将能够基于所提供的基因组序列数据预测哪种噬菌体可以成功地感染特定细菌以及预测对感染具有抗性的细菌。
参考文献:
1.Intriguing arms race between phages and hosts and implications forbetter anti-infectives(噬菌体与宿主之间有趣的军备竞赛和对更好的抗感染药的意义),Zhang Z,Huang C,Pan W,Xie J.Crit Rev Eukaryot Gene Expr.2013;23(3):215-26。
2.Revenge of the phages:defeating bacterial defenses(噬菌体的复仇:击败细菌防御),Samson JE,Magadán AH,Sabri M,Moineau S.Nat Rev Microbiol.2013年10月;11(10):675-687。
3.Bacteriophage resistance mechanisms(细菌噬菌体抗性机制),Labrie SJ,Samson JE,Moineau S.Nat Rev Microbiol.2010年5月;8(5):317-327。
4.Molecular mechanisms of CRISPR-mediated microbial immunity(CRISPR介导的微生物免疫的分子机制),Gasiunas G,Sinkunas T,Siksnys V.,Cell Mol LifeSci.2014年2月;71(3):449-65。
5.Inhibition of CRISPR-Cas9 with Bacteriophage Proteins(细菌噬菌体蛋白对CRISPR-Cas9的抑制),Rauch,B.J.,Melanie,R.S.,Judd,F.H.,Christopher,S.W.,Michael,J.M.,Nevan,J.K.和Joseph,B-D.,Cell 168:1-9,2017年1月12日。
6.Computational approaches to predict bacteriophage-hostrelationships(预测细菌噬菌体-宿主关系的计算方法),Edwards,R.A.,Katelyn McNair,K.,Faust,K.,Raes,J.和Dutilh,B.E.,FEMS Microbiology Reviews,fuv048,40:258-272,2016。
7.HostPhinder:A Phage Host Prediction Tool(HostPhinder:噬菌体宿主预测工具),Villarroel,J.,Kleinheinz,K.A.,Jurtz,V.I.,Zschach,H.,Lund,O.,Nielsen,M.和Larsen,M.,V.,Viruses 8:116-138,2016。
8.Scholl,D.,Adhya,S.和Merril,C.R.,The E.coli K1 capsule acts as abarrier to phage T7(大肠杆菌K1荚膜充当针对噬菌体T7的屏障),Applied AndEnvironmental Microbiology,71:4872-4874,2005。
9.Scholl,D.和Merril,C.R.,Polysaccharide Degrading Phages(多糖降解噬菌体),(Waldor,M.K.,Friedman,D.I.和Adhya,S.L.编著),Phage:Their role in BacterialPathogenesis and Biotechnology(《噬菌体:它们在细菌发病机制和生物技术中的作用》),美国微生物学会(American Society of Microbiology)400--414,2005。
10.Scholl,D.和Merril,C.R.,The Genome of Bacteriophage K1F,a T7-LikePhage That Has Acquired the Ability To Replicate on K1 Strains of Escherichiacoli(已经获得在大肠杆菌K1菌株上复制的能力的T7样噬菌体细菌——噬菌体K1F的基因组),Journal of Bacteriology,187:8499-8503,2005。
11.Artificial Neural Network Prediction of Viruses in Shellfishs(贝类中的病毒的人工神经网络预测),Brion G.,Viswanathan C,Neelakantan TR,LingireddyS,Girones R,Lees D,Allard A,Vantarakis A.,Appl Environ Microbiol.9月;71(9):5244-5253.2005。
实施例5:通过多重PCR扩增预测性区域。
在本实施例中,可以如方框130中所述,分析包含通过本文所述的方法针对噬菌体-宿主敏感性谱所鉴定的预测性区域的基因组序列。使用该数据,可以设计引物以将这些预测性区域与对照一起扩增。多重PCR可以包括不同组的引物,然后在以下条件下应用于在宿主范围分析中评估的菌株:95℃持续6分钟;继而进行95℃持续15秒,57℃持续30秒和72℃持续1分钟的31个循环;以及在72℃下进行最终延伸步骤7分钟。
本发明不限于本文之前描述的实施方案,所述实施方案可以在不脱离本发明的精神的情况下在构造和细节上有所改变。本文引用的任何专利、专利申请或其它出版物的全部教导以引用的方式并入本文,就如同在本文中将全文列出一样。
Claims (36)
1.一种用于产生治疗组合物机器学习模型的计算方法,其中所述方法包括:
(a)在计算机数据库系统中编译来自多种细菌菌株的数据,其中所述数据包含多种细菌菌株的基因组序列数据;
(b)在计算机系统的CPU和存储器单元上至少使用所述多种细菌菌株的基因组序列数据来训练机器学习模型;和
(c)存储治疗组合物机器学习模型,所述治疗组合物机器学习模型被配置成接收查询细菌基因组并且选择基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种治疗组合物。
2.权利要求2的方法,其中所述基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种治疗组合物包含基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的一种或多种噬菌体、抗生素、杀细菌剂、治疗性分子或组合。
3.权利要求2的计算方法,其中所述至少一种治疗组合物包含至少一种噬菌体,并且
在步骤(a)中,所述数据还包含:
多种噬菌体株的基因组序列数据;
并且在步骤(b)中,训练机器学习模型在计算机系统的CPU和存储器单元上至少使用所述多种细菌菌株的基因组序列数据和所述多种噬菌体株的基因组序列数据;并且
在步骤(c)中,被配置成接收查询细菌基因组的所述治疗组合物机器学习模型被配置成选择基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种噬菌体。
4.权利要求1的方法,其中所述机器学习模型产生治疗组合物敏感性序列。
5.权利要求4的方法,所述方法还包括接收从多种治疗剂经实验得出的所述细菌菌株的经实验得出的治疗组合物-宿主敏感性谱,并且产生所述治疗组合物敏感性序列包括使用所述治疗组合物-宿主敏感性谱进行特征检测,包括:
(1)鉴定在具有相似或相同的治疗组合物-宿主敏感性谱的细菌菌株之间共有的共同基因组序列模式;和/或
(2)鉴定在具有不相似的治疗组合物-宿主敏感性谱的细菌菌株之间共有的不相似基因组序列模式;
并且训练所述模型还包括通过将所述治疗组合物敏感性序列与治疗组合物-宿主敏感性谱相关联来表征每一种细菌菌株并且产生每一种细菌菌株的治疗组合物-宿主特异性的预测谱。
6.权利要求5的方法,所述方法还包括接收另外的多种细菌的基因组序列数据和治疗组合物-宿主敏感性谱并且改进所述机器学习模型。
7.权利要求1至6任一项的方法,其中在无监督过程中训练所述机器学习模型。
8.权利要求1至7任一项的方法,其中所述机器学习模型是基于深度学习的模型。
9.一种用于产生治疗组合物机器学习模型的计算方法,其中所述方法包括:
(a)在计算机数据库系统中编译来自多种细菌菌株的数据,其中所述数据包含
(1)多种细菌菌株的基因组序列数据;
和
(2)从多种治疗组合物经实验得出的所述细菌菌株的经实验得出的治疗组合物-宿主敏感性谱;
(b)在计算机系统的CPU和存储器单元上使用所述多种细菌菌株的基因组序列数据和所述经实验得出的治疗组合物-宿主敏感性谱来训练机器学习模型;
(c)存储治疗组合物机器学习模型,所述治疗组合物机器学习模型被配置成接收查询细菌基因组并且选择基于受过训练的机器学习模型被估计为对所述细菌基因组具有敏感性的至少一种治疗组合物。
10.权利要求9的方法,其中所述至少一种治疗组合物包含至少一种噬菌体、至少一种抗生素、至少一种杀细菌剂或组合。
11.权利要求9或10的方法,其中使用有监督学习或强化学习方法来迭代地训练所述机器学习模型。
12.权利要求9、10或11的方法,其中所述机器学习模型是深度学习模型。
13.权利要求9至12任一项的方法,所述方法还包括接收多种噬菌体株的基因组序列数据;并且使用所接收的多种噬菌体株的基因组序列数据来训练所述机器学习模型。
14.权利要求9至13任一项的方法,所述方法还包括通过以下步骤产生治疗组合物-宿主敏感性序列:
(1)鉴定在具有相似或相同的治疗组合物-宿主敏感性谱的细菌菌株之间共有的共同基因组序列模式;和/或
(2)鉴定在具有不相似的治疗组合物-宿主敏感性谱的细菌菌株之间共有的不相似基因组序列模式;和
通过将所述治疗组合物-宿主敏感性序列与治疗组合物-宿主敏感性谱相关联来表征每一种细菌菌株并且产生每一种细菌菌株的治疗组合物-宿主特异性的预测谱。
15.权利要求1至14任一项的方法,其中所述机器学习模型包含神经网络分析,包括深度神经网络学习或人工神经网络分析,或经典模型,例如贝叶斯、高斯分析、回归分析和/或树分析。
16.权利要求5至15任一项的方法,其中通过进行噬斑测定来产生所述经实验得出的治疗组合物-宿主敏感性数据。
17.权利要求16的方法,其中测量噬斑的尺寸、浑浊度、透明度和/或晕圈的存在。
18.权利要求5至16任一项的方法,其中使用选自荧光、吸收和透射测定的光度测定来产生所述经实验得出的治疗组合物-宿主敏感性数据。
19.权利要求1至18任一项的方法,所述方法还更新所述机器学习模型,包括接收:
(1)另外的多种细菌菌株的基因组序列数据;
和
(2)从多种治疗组合物经实验得出的所述另外的细菌菌株的经实验得出的治疗组合物-宿主敏感性谱;和
重新训练所述机器学习模型。
20.一种用于预测查询细菌的治疗组合物-宿主敏感性的计算机实施的方法,所述方法包括:
(a)接收权利要求1至19任一项的机器学习模型;
(b)接收所述查询细菌的基因组序列数据;
(c)基于所述机器学习模型预测所述查询细菌的治疗组合物-宿主敏感性。
21.一种用于选择治疗组合物的方法,其中所述方法包括基于由作为输入而提供给权利要求1至17任一项的机器学习模型的查询细菌基因组产生的谱匹配分数来选择至少一种治疗组合物,其中更高的谱匹配分数代表更高的治疗组合物敏感性。
22.权利要求20或21的方法,其中选择多种治疗组合物。
23.权利要求22的方法,其中所述多种治疗组合物被配制成药学上可接受的组合物。
24.权利要求19至23任一项的方法,其中所选择的治疗组合物具有不同的宿主范围。
25.权利要求19至23任一项的方法,其中所选择的治疗组合物包含具有宽宿主范围的治疗组合物和具有窄宿主范围的治疗组合物的混合物。
26.权利要求19至25任一项的方法,其中所选择的治疗组合物彼此协同作用。
27.权利要求19至26任一项的方法,其中所述治疗组合物具有选自以下的活性:
(a)细菌生长的延迟;
(b)没有出现噬菌体抗性细菌生长;
(c)更低的毒性;
(d)恢复对一种或多种药物的敏感性;和/或
(e)表现出降低的在受试者中生长的适应性。
28.一种组合物,所述组合物包含在权利要求19至27任一项中选择的治疗组合物。
29.一种治疗有需要的受试者的细菌感染或细菌污染的方法,所述方法包括向所述受试者给药有效量的权利要求28的组合物。
30.权利要求29的方法,其中待治疗的细菌感染或细菌感染选自伤口感染、手术后感染和全身性菌血症。
31.权利要求29或30的方法,其中所述细菌感染和/或污染是由选自“ESKAPE”病原体(粪肠球菌(Enterococcus faecium)、金黄色葡萄球菌(Staphylococcus aureus)、肺炎克雷伯氏杆菌(Klebsiella pneumonia)、鲍曼不动杆菌(Acinetobacter baumannii)、铜绿假单胞菌(Pseudomonas aeruginosa)和肠杆菌属菌种(Enterobacter sp))的细菌所引起的。
32.一种系统,其包含:一个或多个处理器;存储器;和一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并且被配置成由所述一个或多个处理器执行,所述一个或多个程序包括用于执行权利要求1至31任一项的指令。
33.权利要求1至32任一项的方法,其中所述多种细菌菌株、所述查询细菌基因组和/或所述细菌感染的细菌菌株中的至少一种是:
a)多药耐药性的;
b)引起受试者感染的临床细菌分离株;
c)引起受试者感染并且具有多药耐药性的临床细菌分离株;
d)从真实的人类感染中获得的;或
e)从不同来源获得的。
34.权利要求33的方法,其中所述不同来源选自土壤、水处理厂、原污水、海水、湖泊、河流、溪流、固定式污水池、动物和人类的肠道以及粪便。
35.一种机器学习模型,其是根据权利要求1-27任一项的方法而创建的。
36.权利要求35的机器学习模型用于预测查询细菌的治疗组合物-宿主敏感性的用途。
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201762554529P | 2017-09-05 | 2017-09-05 | |
| US62/554,529 | 2017-09-05 | ||
| US201762597151P | 2017-12-11 | 2017-12-11 | |
| US62/597,151 | 2017-12-11 | ||
| US201862673162P | 2018-05-18 | 2018-05-18 | |
| US62/673,162 | 2018-05-18 | ||
| PCT/US2018/049481 WO2019050902A1 (en) | 2017-09-05 | 2018-09-05 | METHODS OF DETERMINING THE SENSITIVITY PROFILE OF A BACTERIAL STRAIN TO A THERAPEUTIC COMPOSITION |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN111052248A true CN111052248A (zh) | 2020-04-21 |
| CN111052248B CN111052248B (zh) | 2024-04-02 |
Family
ID=63708448
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201880057328.3A Active CN111052248B (zh) | 2017-09-05 | 2018-09-05 | 细菌菌株对治疗组合物的敏感性谱的确定方法 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US20210065844A1 (zh) |
| EP (1) | EP3679579A1 (zh) |
| JP (2) | JP7320844B2 (zh) |
| CN (1) | CN111052248B (zh) |
| CA (1) | CA3074655A1 (zh) |
| WO (1) | WO2019050902A1 (zh) |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN114913939A (zh) * | 2022-07-19 | 2022-08-16 | 北京科技大学 | 高通量平台和机器学习优化的药物组合设计方法及装置 |
| CN115116624A (zh) * | 2022-06-29 | 2022-09-27 | 广西大学 | 基于半监督迁移学习的药物敏感性预测方法和装置 |
| WO2023077316A1 (zh) * | 2021-11-03 | 2023-05-11 | 深圳华大生命科学研究院 | 预测噬菌体和细菌侵染关系的方法 |
| CN116660243A (zh) * | 2023-05-30 | 2023-08-29 | 重庆大学 | 基于Python的角分辨极化拉曼光谱的作图方法 |
| CN118918944A (zh) * | 2024-08-13 | 2024-11-08 | 安徽大学 | 一种噬菌体特异性的抗细菌肽数据处理应用方法 |
| CN120870090A (zh) * | 2025-09-24 | 2025-10-31 | 农业农村部环境保护科研监测所 | 一种基于sers和机器学习的大肠杆菌抗生素耐药性的检测方法 |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111798935B (zh) * | 2019-04-09 | 2024-07-05 | 南京药石科技股份有限公司 | 基于神经网络的普适性化合物结构-性质相关性预测方法 |
| CN111223520B (zh) * | 2019-11-20 | 2023-09-12 | 云南省烟草农业科学研究院 | 一种预测烟草尼古丁含量的全基因组选择模型及其应用 |
| CN110782943B (zh) * | 2019-11-20 | 2023-09-12 | 云南省烟草农业科学研究院 | 一种预测烟草株高的全基因组选择模型及其应用 |
| CA3159797A1 (en) * | 2019-12-31 | 2021-07-08 | Rob Cohen | Machine learning system for interpreting host phage response |
| JP2023509609A (ja) * | 2020-01-03 | 2023-03-09 | アダプティブ ファージ セラピューティクス, インコーポレイテッド | 時間および位置に基づいてファージ療法を選択するシステムおよび方法 |
| WO2022060535A1 (en) * | 2020-09-21 | 2022-03-24 | Bayer Healthcare Llc | Pathogen clearance system and method |
| CN114068038A (zh) * | 2021-11-26 | 2022-02-18 | 东南大学成贤学院 | 一种融合改进cnn和lstm的抗菌药物耐药性预测方法 |
| US20230207064A1 (en) * | 2021-12-29 | 2023-06-29 | Illumina, Inc. | Inter-model prediction score recalibration during training |
| US20240087684A1 (en) * | 2022-06-17 | 2024-03-14 | Phagelab Chile Spa | Methods and systems for designing phage cocktails |
| CN115732040A (zh) * | 2022-12-05 | 2023-03-03 | 西安电子科技大学 | 基于抗菌活性指导搜索优化的抗生素生成方法 |
| US12368503B2 (en) | 2023-12-27 | 2025-07-22 | Quantum Generative Materials Llc | Intent-based satellite transmit management based on preexisting historical location and machine learning |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TW200804413A (en) * | 2005-11-23 | 2008-01-16 | Illumigen Biosciences Inc | Novel pharmaceutical compositions for the treatment of virus infection and cancer |
| CN103173282A (zh) * | 2004-06-16 | 2013-06-26 | 帝斯曼知识产权资产管理有限公司 | 对叶绿素进行酶促脱色的组合物和方法 |
| CN104411823A (zh) * | 2012-05-04 | 2015-03-11 | 纳幕尔杜邦公司 | 包含具有大范围核酸酶活性的序列的组合物和方法 |
| CN104519893A (zh) * | 2012-03-19 | 2015-04-15 | 药物技术业制药技术股份有限公司 | 用于治疗细菌感染的包含抗细菌噬菌体的混合物的组合物及其使用方法 |
| CN106536739A (zh) * | 2014-04-14 | 2017-03-22 | 内梅西斯生物有限公司 | 治疗剂 |
| CN107090445A (zh) * | 2011-11-25 | 2017-08-25 | 诺维信公司 | 具有溶菌酶活性的多肽和编码所述多肽的多核苷酸 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| ES2334011T3 (es) * | 2000-06-08 | 2010-03-04 | Virco Bvba | Metodo para predecir la resistencia a los agentes terapeuticos utilizando redes neurales. |
| WO2009103156A1 (en) * | 2008-02-20 | 2009-08-27 | Mcmaster University | Expert system for determining patient treatment response |
| EP3209803A4 (en) * | 2014-10-21 | 2018-06-13 | Ubiome, Inc. | Method and system for microbiome-derived diagnostics and therapeutics |
-
2018
- 2018-09-05 WO PCT/US2018/049481 patent/WO2019050902A1/en not_active Ceased
- 2018-09-05 CA CA3074655A patent/CA3074655A1/en active Pending
- 2018-09-05 JP JP2020512827A patent/JP7320844B2/ja active Active
- 2018-09-05 EP EP18779489.6A patent/EP3679579A1/en not_active Withdrawn
- 2018-09-05 CN CN201880057328.3A patent/CN111052248B/zh active Active
- 2018-09-05 US US16/644,203 patent/US20210065844A1/en not_active Abandoned
-
2023
- 2023-01-17 JP JP2023005263A patent/JP7475085B2/ja active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103173282A (zh) * | 2004-06-16 | 2013-06-26 | 帝斯曼知识产权资产管理有限公司 | 对叶绿素进行酶促脱色的组合物和方法 |
| TW200804413A (en) * | 2005-11-23 | 2008-01-16 | Illumigen Biosciences Inc | Novel pharmaceutical compositions for the treatment of virus infection and cancer |
| CN107090445A (zh) * | 2011-11-25 | 2017-08-25 | 诺维信公司 | 具有溶菌酶活性的多肽和编码所述多肽的多核苷酸 |
| CN104519893A (zh) * | 2012-03-19 | 2015-04-15 | 药物技术业制药技术股份有限公司 | 用于治疗细菌感染的包含抗细菌噬菌体的混合物的组合物及其使用方法 |
| CN104411823A (zh) * | 2012-05-04 | 2015-03-11 | 纳幕尔杜邦公司 | 包含具有大范围核酸酶活性的序列的组合物和方法 |
| CN106536739A (zh) * | 2014-04-14 | 2017-03-22 | 内梅西斯生物有限公司 | 治疗剂 |
Non-Patent Citations (1)
| Title |
|---|
| DIOGO MANUEL CARVALHO LEITE ET AL.: "Computational prediction of host-pathogen interactions through omics data analysis and machine learning" * |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2023077316A1 (zh) * | 2021-11-03 | 2023-05-11 | 深圳华大生命科学研究院 | 预测噬菌体和细菌侵染关系的方法 |
| CN115116624A (zh) * | 2022-06-29 | 2022-09-27 | 广西大学 | 基于半监督迁移学习的药物敏感性预测方法和装置 |
| CN115116624B (zh) * | 2022-06-29 | 2024-07-09 | 广西大学 | 基于半监督迁移学习的药物敏感性预测方法和装置 |
| CN114913939A (zh) * | 2022-07-19 | 2022-08-16 | 北京科技大学 | 高通量平台和机器学习优化的药物组合设计方法及装置 |
| CN114913939B (zh) * | 2022-07-19 | 2022-11-15 | 北京科技大学 | 高通量平台和机器学习优化的药物组合设计方法及装置 |
| CN116660243A (zh) * | 2023-05-30 | 2023-08-29 | 重庆大学 | 基于Python的角分辨极化拉曼光谱的作图方法 |
| CN118918944A (zh) * | 2024-08-13 | 2024-11-08 | 安徽大学 | 一种噬菌体特异性的抗细菌肽数据处理应用方法 |
| CN118918944B (zh) * | 2024-08-13 | 2025-09-05 | 安徽大学 | 一种噬菌体特异性的抗细菌肽数据处理应用方法 |
| CN120870090A (zh) * | 2025-09-24 | 2025-10-31 | 农业农村部环境保护科研监测所 | 一种基于sers和机器学习的大肠杆菌抗生素耐药性的检测方法 |
| CN120870090B (zh) * | 2025-09-24 | 2025-12-30 | 农业农村部环境保护科研监测所 | 一种基于sers和机器学习的大肠杆菌抗生素耐药性的检测方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023052444A (ja) | 2023-04-11 |
| CN111052248B (zh) | 2024-04-02 |
| JP7320844B2 (ja) | 2023-08-04 |
| JP7475085B2 (ja) | 2024-04-26 |
| CA3074655A1 (en) | 2019-03-14 |
| JP2020532980A (ja) | 2020-11-19 |
| EP3679579A1 (en) | 2020-07-15 |
| US20210065844A1 (en) | 2021-03-04 |
| WO2019050902A1 (en) | 2019-03-14 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111052248B (zh) | 细菌菌株对治疗组合物的敏感性谱的确定方法 | |
| Fodor et al. | Multidrug resistance (MDR) and collateral sensitivity in bacteria, with special attention to genetic and evolutionary aspects and to the perspectives of antimicrobial peptides—a review | |
| Dalmasso et al. | Three new Escherichia coli phages from the human gut show promising potential for phage therapy | |
| Schwartz et al. | Positively selected FimH residues enhance virulence during urinary tract infection by altering FimH conformation | |
| Chen et al. | Positive selection identifies an in vivo role for FimH during urinary tract infection in addition to mannose binding | |
| Sasikala et al. | Characterization of potential lytic bacteriophage against Vibrio alginolyticus and its therapeutic implications on biofilm dispersal | |
| Nasser et al. | Specification of bacteriophage isolated against clinical methicillin-resistant Staphylococcus aureus | |
| Whittard et al. | Phenotypic and genotypic characterization of novel polyvalent bacteriophages with potent in vitro activity against an international collection of genetically diverse Staphylococcus aureus | |
| Gholizadeh et al. | The potential use of bacteriophages as antibacterial agents against Klebsiella pneumoniae | |
| Lerdsittikul et al. | A novel virulent Litunavirus phage possesses therapeutic value against multidrug resistant Pseudomonas aeruginosa | |
| Zhang et al. | Indole contributes to tetracycline resistance via the outer membrane protein OmpN in Vibrio splendidus | |
| Unnikrishnan et al. | Genome analysis of triple phages that curtails MDR E. coli with ML based host receptor prediction and its evaluation | |
| Morris et al. | Phage-antibiotic synergy to combat multidrug resistant strains of Gram-negative ESKAPE pathogens | |
| Celik et al. | Characterization and genomic analysis of PA-56 Pseudomonas phage from Istanbul, Turkey: antibacterial and antibiofilm efficacy alone and with antibiotics | |
| Kamyab et al. | Isolation, characterization, and genomic analysis of vB_PaeS_TUMS_P81, a lytic bacteriophage against Pseudomonas aeruginosa | |
| Chen et al. | Draft genome sequences for the obligate bacterial predators Bacteriovorax spp. of four phylogenetic clusters | |
| Das et al. | Genome sequencing and annotation of multi-virulent Aeromonas veronii XhG1. 2 isolated from diseased Xiphophorus hellerii | |
| Lu et al. | Isolation and characterization of SGF3, a novel Microviridae phage infecting Shigella flexneri | |
| Knupp et al. | Ultraviolet light differentially reduces viability of fish‐and fish farm‐associated flavobacteria (families Flavobacteriaceae and Weeksellaceae) | |
| Esteves et al. | Serratia marcescens ATCC 274 increases production of the red pigment prodigiosin in response to Chi phage infection | |
| CN115038799A (zh) | 治疗细菌感染的方法 | |
| Su et al. | Comparative transcriptomic immune responses of mullet (Mugil cephalus) infected by planktonic and biofilm Lactococcus garvieae | |
| Nagar et al. | Characterization and genome analyses of the novel phages P2 and vB_AhydM-H1 targeting Aeromonas hydrophila | |
| Ndiaye et al. | Characterization of broad host range bacteriophages vKpIN31 and vKpIN32 against hospital-acquired Klebsiella pneumoniae in Dakar, Senegal | |
| Sundaramoorthy et al. | Genome Analysis of Bacteriophage (U1G) of Schitoviridae, Host Receptor Prediction using Machine Learning Tools and its Evaluation to Mitigate Colistin Resistant Clinical Isolate of Escherichia Coli In Vitro and In Vivo |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| TR01 | Transfer of patent right |
Effective date of registration: 20240925 Address after: U.S.A. Patentee after: Adaptive Phage Therapy Co.,Ltd. Country or region after: U.S.A. Address before: American Maryland Patentee before: Adaptive phage therapy Co. Country or region before: U.S.A. |
|
| TR01 | Transfer of patent right |