[go: up one dir, main page]

CN117907511B - 一种多组分重叠峰的自动化解析方法、装置及电子设备 - Google Patents

一种多组分重叠峰的自动化解析方法、装置及电子设备 Download PDF

Info

Publication number
CN117907511B
CN117907511B CN202410317097.2A CN202410317097A CN117907511B CN 117907511 B CN117907511 B CN 117907511B CN 202410317097 A CN202410317097 A CN 202410317097A CN 117907511 B CN117907511 B CN 117907511B
Authority
CN
China
Prior art keywords
peak
spectrum
target
interval
peaks
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410317097.2A
Other languages
English (en)
Other versions
CN117907511A (zh
Inventor
马攀
马煜宁
周海波
李斯文
韦一韬
王淼
余昌桂
刘建鑫
顾海涛
桑强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FOCUSED PHOTONICS (HANGZHOU) Inc
Zhejiang Lingxi Photoelectric Technology Co ltd
Zhejiang Lingxi Jingyi Technology Development Co ltd
Original Assignee
FOCUSED PHOTONICS (HANGZHOU) Inc
Zhejiang Lingxi Photoelectric Technology Co ltd
Zhejiang Lingxi Jingyi Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FOCUSED PHOTONICS (HANGZHOU) Inc, Zhejiang Lingxi Photoelectric Technology Co ltd, Zhejiang Lingxi Jingyi Technology Development Co ltd filed Critical FOCUSED PHOTONICS (HANGZHOU) Inc
Priority to CN202410317097.2A priority Critical patent/CN117907511B/zh
Publication of CN117907511A publication Critical patent/CN117907511A/zh
Application granted granted Critical
Publication of CN117907511B publication Critical patent/CN117907511B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8696Details of Software
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本说明书实施例公开了一种多组分重叠峰的自动化解析方法、装置及电子设备。该方法包括获取第一矩阵数据;对每个离子谱数据进行小波峰检测,确定谱峰;对所有谱峰进行分组;计算第一目标区间内的各目标谱峰的锐度值,将锐度值最大的目标谱峰作为候选模型谱峰;确定候选模型谱峰的解卷积区间,构建第二矩阵数据;基于高斯相似性确定解卷积区间中待优化的重叠谱峰,并基于LM算法优化重叠谱峰后,重构质谱轮廓。本说明书实施例实现了对多种复杂重叠体系的自动解卷积分离过程,减少了人工干预,且解析结果中确定出的重叠组分个数更准确,峰形轮廓优化效果更好,提高了根据解析结果进行定性定量分析的准确性。

Description

一种多组分重叠峰的自动化解析方法、装置及电子设备
技术领域
本说明书一个或多个实施例涉及数据处理技术,尤其涉及一种多组分重叠峰的自动化解析方法、装置及电子设备。
背景技术
在光谱色谱质谱联用仪器的化学分析中,组分共洗脱是普遍存在的现象,而目前通过实验参数优化往往只能解决部分分离问题。为了对更多重叠组分进行更加精准的定性、定量分析,采用数学解析(即解卷积)的方式是一种更加简单且更优的选择。
然而,由于测量体系的复杂性,目前数学解析方法存在一些局限性。最常规的方法是通过峰参数如峰锐度值、峰强度挑选模型谱峰,利用模型谱峰直接进行解析,但该方式在解析过程中由于没有对谱峰形状进行任何优化,结果往往受挑选谱峰的准确性影响。另一种接受度较广的方式是采用多元分辨技术从矩阵分解的方式进行解析,代表性的方法有多元曲线分辨-迭代最小二乘法(MCR-ALS)和平行因子分析2(PARAFAC2)。这类方法需要预先给定矩阵中的组分个数和色谱(或光谱或质谱)初始估计,但由于一些共线性成分、高相似性或者含有较小肩峰的重叠体系,可能导致给定组分数和初始估计不准确,从而显著影响最终的解析结果。此外,一些数学解析方法需要人工对谱峰数据进行切割,样品数量多、组分多的情况下,对于人员操作要求高、强度大、控制准确度低,从而对解析结果准确度的影响也很大。因此,目前的数学解析方法在复杂重叠体系的解析中,无法满足自动化分离的需求,且解析结果的准确性不够理想。
发明内容
为了解决上述问题,本说明书一个或多个实施例描述了一种多组分重叠峰的自动化解析方法、装置及电子设备。
根据第一方面,提供了一种多组分重叠峰的自动化解析方法,所述方法包括:
获取待解析混合物的第一矩阵数据,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度;
确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,所述离子谱数据为所述第一矩阵数据中的一列数据;
基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点;
针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰;
针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定;
针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓。
优选的,所述获取待解析混合物的第一矩阵数据,包括:
基于预设格式读取待解析混合物的原始数据,并基于所述原始数据构建第一矩阵数据,所述预设格式包括cdf格式、mzXML格式和mzML格式中的至少一种。
优选的,所述分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,包括:
基于墨西哥帽小波函数分别对每个所述离子谱数据进行卷积运算,确定每个所述离子谱数据对应的谱峰,并基于小波空间中的局部极大值和局部极小值确定所述谱峰的峰信息,所述峰信息包括峰位置、峰起点、峰终点和谱轮廓,所述局部极大值的位置为峰位置,所述局部极小值的位置分别为峰起点和峰终点,所述峰起点和峰终点之间的部分为谱轮廓。
优选的,所述基于各所述第一目标区间对所有谱峰进行分组之后,还包括:
针对每个所述第一目标区间,两两计算所述第一目标区间内各所述谱峰之间的保留时间差值,并将所述保留时间差值不大于预设差值的所述谱峰合并。
优选的,所述确定所述候选模型谱峰的解卷积区间,包括:
基于候选模型谱峰顶点和预设倍数的候选模型谱峰宽构建第二目标区间,确定所述第二目标区间中的重叠峰,生成解卷积区间,所述解卷积区间的左边界为最左侧峰的起点,所述解卷积区间的右边界为最右侧峰的终点。
优选的,所述基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰,包括:
对所述解卷积区间中的所述候选模型谱峰进行高斯相似性计算,确定高斯模型谱峰和/或待优化的重叠谱峰,所述高斯模型谱峰为高斯相似性不小于预设数值的谱峰,所述重叠谱峰为高斯相似性小于所述预设数值的谱峰;
基于修正高斯模型对所述重叠谱峰进行优化,得到修正高斯谱峰,并基于LM算法优化高斯模型参数,得到所述第二矩阵数据中的每个目标离子谱峰,所述目标离子谱峰基于所述修正高斯谱峰和高斯模型谱峰的线性加和表示。
优选的,所述重构所述第二矩阵数据对应的质谱轮廓,包括:
将各所述目标离子谱峰拼接为最优谱峰,并基于最小二乘算法重构所述最优谱峰的质谱轮廓。
根据第二方面,提供了一种多组分重叠峰的自动化解析装置,所述装置包括:
获取模块,用于获取待解析混合物的第一矩阵数据,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度;
第一确定模块,用于确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,所述离子谱数据为所述第一矩阵数据中的一列数据;
第二确定模块,用于基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点;
计算模块,用于针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰;
第三确定模块,用于针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定;
重构模块,用于针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓。
根据第三方面,提供了一种电子设备,包括处理器以及存储器;
所述处理器与所述存储器相连;
所述存储器,用于存储可执行程序代码;
所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于执行如第一方面或第一方面的任意一种可能的实现方式提供的方法的步骤。
根据第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机可读存储介质中存储有指令,当所述指令在计算机或处理器上运行时,使得所述计算机或处理器执行如第一方面或第一方面的任意一种可能的实现方式提供的方法。
本说明书实施例提供的方法及装置,能够通过小波峰检测确定重叠组分个数,并通过锐度值和高斯相似性确定解卷积区间的候选模型谱峰中待优化的重叠谱峰,再根据LM算法优化峰形后重构质谱轮廓,实现了对多种复杂重叠体系的自动解卷积分离过程,减少了人工干预,且解析结果中确定出的重叠组分个数更准确,峰形轮廓优化效果更好,提高了根据解析结果进行定性定量分析的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例中所需使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书一个实施例中在一种多组分重叠峰的自动化解析方法的流程示意图。
图2是本说明书一个实施例中在一种多组分重叠峰的自动化解析装置的结构示意图。
图3是本说明书一个实施例中在一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
在下述介绍中,术语“第一”、“第二”仅为用于描述的目的,而不能理解为指示或暗示相对重要性。下述介绍提供了本申请的多个实施例,不同实施例之间可以替换或者合并组合,因此本申请也可认为包含所记载的相同和/或不同实施例的所有可能组合。因而,如果一个实施例包含特征A、B、C,另一个实施例包含特征B、D,那么本申请也应视为包括含有A、B、C、D的一个或多个所有其他可能的组合的实施例,尽管该实施例可能并未在以下内容中有明确的文字记载。
下面的描述提供了示例,并且不对权利要求书中阐述的范围、适用性或示例进行限制。可以在不脱离本申请内容的范围的情况下,对描述的元素的功能和布置做出改变。各个示例可以适当省略、替代或添加各种过程或组件。例如所描述的方法可以以所描述的顺序不同的顺序来执行,并且可以添加、省略或组合各种步骤。此外,可以将关于一些示例描述的特征组合到其他示例中。
参见图1,图1是本申请实施例提供的一种多组分重叠峰的自动化解析方法的流程示意图。在本申请实施例中,所述方法包括:
S101、获取待解析混合物的第一矩阵数据。
其中,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度。
本申请的执行主体可以是云端服务器。
在本说明书实施例中,云端服务器会以矩阵数据的形式获取待解析混合物的原始数据,以便后续步骤中能够通过第一矩阵数据进行谱分析。第一矩阵数据的行用以表征目标维度,列用以表征质荷比维度,质荷比维度一般取0-800Da的范围。其中,根据实际情况的不同,可以调整第一矩阵数据的目标维度,如果需要获取色谱轮廓进行分析,则目标维度设置为时间维度,如果需要光谱轮廓进行分析,则目标维度设置为波长维度。如果同时需要色谱轮廓和光谱轮廓,则可以同时生成不同的两个第一矩阵数据,分别进行解析计算。
在一种可实施方式中,所述获取待解析混合物的第一矩阵数据,包括:
基于预设格式读取待解析混合物的原始数据,并基于所述原始数据构建第一矩阵数据,所述预设格式包括cdf格式、mzXML格式和mzML格式中的至少一种。
在本说明书实施例中,云端服务器可能无法直接读取到符合后续解析需求的矩阵数据,这种情况下,云端服务器会读取cdf、mzXML或者mzML等格式的原始数据,并根据行和列的维度对原始数据进行拼接,以形成第一矩阵数据。
S102、确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰。
其中,所述离子谱数据为所述第一矩阵数据中的一列数据。
在本说明书实施例中,云端服务器将选取不同的质荷比数值,分别确定各个离子谱。接着云端服务器将通过小波峰检测的方式,对离子谱数据进行卷积运算,以实现峰值检测,生成每一个离子谱数据的谱峰。确定了谱峰后,便可以确定出每个谱峰的峰信息,进而能够确定出每个谱峰的峰位置、谱轮廓等数据,以便后续对谱峰的解析计算。其中,小波峰检测使用的小波函数可以是墨西哥帽小波函数、莫莱特小波函数、哈尔小波函数、多贝西小波函数等。
在一种可实施方式中,所述分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,包括:
基于墨西哥帽小波函数分别对每个所述离子谱数据进行卷积运算,确定每个所述离子谱数据对应的谱峰,并基于小波空间中的局部极大值和局部极小值确定所述谱峰的峰信息,所述峰信息包括峰位置、峰起点、峰终点和谱轮廓,所述局部极大值的位置为峰位置,所述局部极小值的位置分别为峰起点和峰终点,所述峰起点和峰终点之间的部分为谱轮廓。
在本说明书实施例中,将以墨西哥帽小波函数为例来对离子谱数据进行卷积计算,以得到离子谱数据对应的谱峰。在得到谱峰后,云端服务器还会计算小波空间中的局部极大值和局部极小值,局部极大值所在的位置即为峰位置,局部极小值所在的位置会有两个,这两个位置在坐标系中从左到右分别是峰起点和峰终点,而峰起点和峰终点之间的谱峰部分即为谱轮廓。这些数据共同组成峰信息,用于后续解析过程的计算。
墨西哥帽小波函数对离子谱数据进行卷积运算的公式为:
其中,t为离子谱数据中不同时间点的强度,为小波空间数据(即第一矩阵数据中的一行),为控制墨西哥帽小波宽度的参数,为圆周率,e为自然指数。
S103、基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组。
其中,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点。
在本说明书实施例中,确定出所有谱峰后,云端服务器将使用匹配过滤器对所有谱峰进行分组,也就是对所有峰顶点进行划区(峰顶点分布区域)。每个区域对应一组峰,每组峰即对应为一个成分。匹配过滤器对应的目标向量的公式为:
其中,N为第一矩阵数据的行数,Coef为系数,为第一目标区间的宽度控制参数,用以确定多宽时间范围的峰顶点会被认定为属于同一组,p取默认值10。该向量的极小值为第一目标区间的分割点,也即为根据各个极小值点分割出各个第一目标区间。
在一种可实施方式中,所述基于各所述第一目标区间对所有谱峰进行分组之后,还包括:
针对每个所述第一目标区间,两两计算所述第一目标区间内各所述谱峰之间的保留时间差值,并将所述保留时间差值不大于预设差值的所述谱峰合并。
在本说明书实施例中,每个组(即每个第一目标区间)中,云端服务器会分别计算任意两个谱峰之间的保留时间差值。对于保留时间差值不大于预设差值(例如2个扫描点距离)的谱峰将会被认为是同一峰而被合并。
S104、针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰。
其中,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰。
在本说明书实施例中,云端服务器会对每个第一目标区间中的各谱峰进行强度值的计算,确定出最强度值最大的最强谱峰,并将强度值大于最强谱峰强度值预设比例(例如90%)的谱峰作为目标谱峰。接着,将对目标谱峰进行锐度值计算,选择锐度值最大的目标谱峰作为候选模型谱峰,后续步骤中将以候选模型谱峰为基准进行解卷积的过程。
S105、针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数。
其中,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定。
在本说明书实施例中,云端服务器会为每个候选模型谱峰构建解卷积区间,并根据解卷积区间的区间范围来构建第二矩阵数据。由于不同的候选模型谱峰之间可能存在重叠,导致解卷积区间中可能涵盖多个候选模型谱峰,这种情况下会将这些候选模型谱峰都放到同一个第二矩阵数据进行后续解析处理,且此时解卷积区间中候选模型谱峰的个数即为组分的个数。这样通过小波峰检测确定谱峰并分组,再确定每组峰中的候选模型谱峰,最后根据解卷积区间中的候选模型谱峰的数量确定组分个数的方式,能够更为准确的确定出组分的个数,不容易被干扰。其中,解卷积区间的确定方式,可以是根据候选模型谱峰的宽度的预设倍率进行设置,也可以是首先确定一定范围内的重叠峰,再以这个范围内最左侧峰和最右侧峰的位置进行设置,还可以是其他可实施方式。此外,根据目标维度的不同,目标点数维度也会相应的不同,即时间维度对应时间点数维度,波长维度对应波长点数维度。
其中,第二矩阵数据相当于根据解卷积区间的范围所截取的一段第一矩阵数据,在第二矩阵数据中的离子谱数据即为目标离子谱数据,其对应的谱峰即为目标离子谱峰。
在一种可实施方式中,所述确定所述候选模型谱峰的解卷积区间,包括:
基于候选模型谱峰顶点和预设倍数的候选模型谱峰宽构建第二目标区间,确定所述第二目标区间中的重叠峰,生成解卷积区间,所述解卷积区间的左边界为最左侧峰的起点,所述解卷积区间的右边界为最右侧峰的终点。
在本说明书实施例中,首先会根据候选模型谱峰顶点和预设倍数的候选模型谱峰宽构建第二目标区间,假设预设倍数为1.5倍,候选模型谱峰宽为w,则第二目标区间可以为[-1.5*w,1.5*w]。接着,云端服务器将候选模型谱峰的起点和终点与相邻峰的终点和起点进行差值计算,若差值的绝对值小于2个点数,则表明两个峰重叠。云端服务器将分别确定区间左侧[-1.5*w,0]和区间右侧[0,1.5*w]中的重叠峰,并将最左侧峰的起点作为解卷积区间的左边界t1,最右侧峰的终点作为解卷积区间的右边界t2,第二矩阵数据的行则表示为t1到t2范围内的目标点数。
S106、针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓。
在本说明书实施例中,对复杂重叠体系的解析,一般需要解析区分出不同的成分、每种成分中的组分个数、光谱轮廓、色谱轮廓、质谱轮廓等,以便根据谱轮廓进行定量分析,根据质谱轮廓进行定性分析。因此,在前述步骤解析出了光谱轮廓和/或色谱轮廓和组分个数后,还需要确定质谱轮廓。由于每一个第一目标区间都可能包含多个离子通道的谱峰,其中部分谱峰具有较好的峰形(高斯相似性值高,通常这些谱峰为选择性离子碎片,是该组分独有的离子)和部分重叠谱峰(与相邻成分都含有的离子),故首先需要对峰形不好的谱峰(一般是指重叠峰)进行谱轮廓优化。具体而言,将通过高斯相似性计算解卷积区间中的谱峰,确定高斯相似性值低于预设值的重叠谱峰。接着,云端服务器将采用Levenberg-Marquardt 迭代优化算法对重叠谱峰的轮廓进行优化。最终通过优化后所有候选模型谱峰的线性加和能够表示出第二矩阵数据中的每个离子谱峰,并根据这些离子谱峰可以重构出质谱轮廓,这样得到的质谱轮廓,由于重叠谱峰进行了轮廓优化,且以优化后的各个候选模型谱峰的线性加和表示每个离子谱峰,最终得到的质谱轮廓的准确性更高。
在一种可实施方式中,所述基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰,包括:
对所述解卷积区间中的所述候选模型谱峰进行高斯相似性计算,确定高斯模型谱峰和/或待优化的重叠谱峰,所述高斯模型谱峰为高斯相似性不小于预设数值的谱峰,所述重叠谱峰为高斯相似性小于所述预设数值的谱峰;
基于修正高斯模型对所述重叠谱峰进行优化,得到修正高斯谱峰,并基于LM算法优化高斯模型参数,得到所述第二矩阵数据中的每个目标离子谱峰,所述目标离子谱峰基于所述修正高斯谱峰和高斯模型谱峰的线性加和表示。
在本说明书实施例中,首先对解卷积区间中的候选模型谱峰进行高斯相似性计算,判断谱峰参数是否需要进行形状优化,计算公式如下:
其中,H为峰高,A为峰面积,Si为高斯相似性,W为半高峰宽。高斯相似性大于等于0.95的谱峰将被确定为高斯模型谱峰,小于0.95的谱峰将被确定为重叠谱峰。重叠谱峰即为需要进行形状优化的谱峰。
接着,将利用修正高斯模型对重叠谱峰的形状进行修正,公式如下:
其中,为峰位置,w为峰宽相关量,为修正因子,erf为误差函数,t为采集时间序列,为修正高斯谱峰。此时的高斯模型参数是未知的,还需要进行最优参数的求解。
对于第二矩阵数据中任一存在重叠的目标离子谱峰而言,其轮廓可以表示为n个修正高斯谱峰和m个高斯模型谱峰的线性加和,如下公式所示:
其中,为第i个修正高斯谱峰的高斯模型参数,为第j个高斯模型谱峰,为候选模型色谱峰或候选模型光谱峰的谱轮廓,其中为拟合残差。
LM算法优化的函数为:
通过迭代优化,可以得到最优的参数,最终得到确切的目标离子谱峰。
在一种可实施方式中,所述重构所述第二矩阵数据对应的质谱轮廓,包括:
将各所述目标离子谱峰拼接为最优谱峰,并基于最小二乘算法重构所述最优谱峰的质谱轮廓。
在本说明书实施例中,对于第二矩阵数据(其中M为质荷比范围上限),最优谱峰可以表示为各个目标离子谱峰的线性加和,表示为如下公式:
其中,为第i个目标离子谱峰,为第i个重构质谱轮廓,为拟合残差。
接着,采用非负最小二乘算法对重构的质谱轮廓进行求解,求解公式如下:
下面将结合附图2,对本申请实施例提供的多组分重叠峰的自动化解析装置进行详细介绍。需要说明的是,附图2所示的多组分重叠峰的自动化解析装置,用于执行本申请图1所示实施例的方法,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请图1所示的实施例。
请参见图2,图2是本申请实施例提供的一种多组分重叠峰的自动化解析装置的结构示意图。如图2所示,所述装置包括:
获取模块201,用于获取待解析混合物的第一矩阵数据,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度;
第一确定模块202,用于确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,所述离子谱数据为所述第一矩阵数据中的一列数据;
第二确定模块203,用于基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点;
计算模块204,用于针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰;
第三确定模块205,用于针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定;
重构模块206,用于针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓。
在一种可实施方式中,获取模块201具体用于:
基于预设格式读取待解析混合物的原始数据,并基于所述原始数据构建第一矩阵数据,所述预设格式包括cdf格式、mzXML格式和mzML格式中的至少一种。
在一种可实施方式中,第一确定模块202具体用于:
基于墨西哥帽小波函数分别对每个所述离子谱数据进行卷积运算,确定每个所述离子谱数据对应的谱峰,并基于小波空间中的局部极大值和局部极小值确定所述谱峰的峰信息,所述峰信息包括峰位置、峰起点、峰终点和谱轮廓,所述局部极大值的位置为峰位置,所述局部极小值的位置分别为峰起点和峰终点,所述峰起点和峰终点之间的部分为谱轮廓。
在一种可实施方式中,第二确定模块203具体用于:
针对每个所述第一目标区间,两两计算所述第一目标区间内各所述谱峰之间的保留时间差值,并将所述保留时间差值不大于预设差值的所述谱峰合并。
在一种可实施方式中,第三确定模块205具体用于:
基于候选模型谱峰顶点和预设倍数的候选模型谱峰宽构建第二目标区间,确定所述第二目标区间中的重叠峰,生成解卷积区间,所述解卷积区间的左边界为最左侧峰的起点,所述解卷积区间的右边界为最右侧峰的终点。
在一种可实施方式中,重构模块206具体用于:
对所述解卷积区间中的所述候选模型谱峰进行高斯相似性计算,确定高斯模型谱峰和/或待优化的重叠谱峰,所述高斯模型谱峰为高斯相似性不小于预设数值的谱峰,所述重叠谱峰为高斯相似性小于所述预设数值的谱峰;
基于修正高斯模型对所述重叠谱峰进行优化,得到修正高斯谱峰,并基于LM算法优化高斯模型参数,得到所述第二矩阵数据中的每个目标离子谱峰,所述目标离子谱峰基于所述修正高斯谱峰和高斯模型谱峰的线性加和表示。
在一种可实施方式中,重构模块206具体还用于:
将各所述目标离子谱峰拼接为最优谱峰,并基于最小二乘算法重构所述最优谱峰的质谱轮廓。
本领域的技术人员可以清楚地了解到本申请实施例的技术方案可借助软件和/或硬件来实现。本说明书中的“单元”和“模块”是指能够独立完成或与其他部件配合完成特定功能的软件和/或硬件,其中硬件例如可以是现场可编程门阵列(Field-ProgrammableGate Array,FPGA)、集成电路(Integrated Circuit,IC)等。
本申请实施例的各处理单元和/或模块,可通过实现本申请实施例所述的功能的模拟电路而实现,也可以通过执行本申请实施例所述的功能的软件而实现。
参见图3,其示出了本申请实施例所涉及的一种电子设备的结构示意图,该电子设备可以用于实施图1所示实施例中的方法。如图3所示,电子设备300可以包括:至少一个处理器301,至少一个网络接口304,用户接口303,存储器305,至少一个通信总线302。
其中,通信总线302用于实现这些组件之间的连接通信。
其中,用户接口303可以包括显示屏(Display)、摄像头(Camera),可选用户接口303还可以包括标准的有线接口、无线接口。
其中,网络接口304可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
其中,处理器301可以包括一个或者多个处理核心。处理器301利用各种接口和线路连接整个电子设备300内的各个部分,通过运行或执行存储在存储器305内的指令、程序、代码集或指令集,以及调用存储在存储器305内的数据,执行电子设备300的各种功能和处理数据。可选的,处理器301可以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器301可集成中央中央处理器(Central Processing Unit,CPU)、图像中央处理器(Graphics ProcessingUnit,GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系统、用户界面和应用程序等;GPU用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器301中,单独通过一块芯片进行实现。
其中,存储器305可以包括随机存储器(Random Access Memory,RAM),也可以包括只读存储器(Read-OnlyMemory)。可选的,该存储器305包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器305可用于存储指令、程序、代码、代码集或指令集。存储器305可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及到的数据等。存储器305可选的还可以是至少一个位于远离前述处理器301的存储装置。如图3所示,作为一种计算机存储介质的存储器305中可以包括操作系统、网络通信模块、用户接口模块以及程序指令。
在图3所示的电子设备300中,用户接口303主要用于为用户提供输入的接口,获取用户输入的数据;而处理器301可以用于调用存储器305中存储的多组分重叠峰的自动化解析应用程序,并具体执行以下操作:
获取待解析混合物的第一矩阵数据,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度;
确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,所述离子谱数据为所述第一矩阵数据中的一列数据;
基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点;
针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰;
针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定;
针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述方法的步骤。其中,计算机可读存储介质可以包括但不限于任何类型的盘,包括软盘、光盘、DVD、CD-ROM、微型驱动器以及磁光盘、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、闪速存储器设备、磁卡或光卡、纳米系统(包括分子存储器IC),或适合于存储指令和/或数据的任何类型的媒介或设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(Read-Only Memory, ROM)、随机存取存储器(Random Access Memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通进程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(Read-Only Memory, ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。

Claims (10)

1.一种多组分重叠峰的自动化解析方法,其特征在于,所述方法包括:
获取待解析混合物的第一矩阵数据,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度;
确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,所述离子谱数据为所述第一矩阵数据中的一列数据;
基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点;
针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰;
针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定;
针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓;
其中,所述匹配过滤器对应的目标向量的公式为:
其中,N为第一矩阵数据的行数;Coef为系数;为第一目标区间的宽度控制参数,用以确定多宽时间范围的峰顶点会被认定为属于同一组;p取默认值10;所述目标向量的极小值为所述第一目标区间的分割点。
2.根据权利要求1所述的方法,其特征在于,所述获取待解析混合物的第一矩阵数据,包括:
基于预设格式读取待解析混合物的原始数据,并基于所述原始数据构建第一矩阵数据,所述预设格式包括cdf格式、mzXML格式和mzML格式中的至少一种。
3.根据权利要求1所述的方法,其特征在于,所述分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,包括:
基于墨西哥帽小波函数分别对每个所述离子谱数据进行卷积运算,确定每个所述离子谱数据对应的谱峰,并基于小波空间中的局部极大值和局部极小值确定所述谱峰的峰信息,所述峰信息包括峰位置、峰起点、峰终点和谱轮廓,所述局部极大值的位置为峰位置,所述局部极小值的位置分别为峰起点和峰终点,所述峰起点和峰终点之间的部分为谱轮廓。
4.根据权利要求1所述的方法,其特征在于,所述基于各所述第一目标区间对所有谱峰进行分组之后,还包括:
针对每个所述第一目标区间,两两计算所述第一目标区间内各所述谱峰之间的保留时间差值,并将所述保留时间差值不大于预设差值的所述谱峰合并。
5.根据权利要求1所述的方法,其特征在于,所述确定所述候选模型谱峰的解卷积区间,包括:
基于候选模型谱峰顶点和预设倍数的候选模型谱峰宽构建第二目标区间,确定所述第二目标区间中的重叠峰,生成解卷积区间,所述解卷积区间的左边界为最左侧峰的起点,所述解卷积区间的右边界为最右侧峰的终点。
6.根据权利要求1所述的方法,其特征在于,所述基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰,包括:
对所述解卷积区间中的所述候选模型谱峰进行高斯相似性计算,确定高斯模型谱峰和/或待优化的重叠谱峰,所述高斯模型谱峰为高斯相似性不小于预设数值的谱峰,所述重叠谱峰为高斯相似性小于所述预设数值的谱峰;
基于修正高斯模型对所述重叠谱峰进行优化,得到修正高斯谱峰,并基于LM算法优化高斯模型参数,得到所述第二矩阵数据中的每个目标离子谱峰,所述目标离子谱峰基于所述修正高斯谱峰和高斯模型谱峰的线性加和表示。
7.根据权利要求6所述的方法,其特征在于,所述重构所述第二矩阵数据对应的质谱轮廓,包括:
将各所述目标离子谱峰拼接为最优谱峰,并基于最小二乘算法重构所述最优谱峰的质谱轮廓。
8.一种多组分重叠峰的自动化解析装置,其特征在于,所述装置包括:
获取模块,用于获取待解析混合物的第一矩阵数据,所述第一矩阵数据的行用以表征目标维度,所述第一矩阵数据的列用以表征质荷比维度,所述目标维度在解析色谱时为时间维度、在解析光谱时为波长维度;
第一确定模块,用于确定所述第一矩阵数据的所有离子谱数据,分别对每个所述离子谱数据进行小波峰检测,确定每个所述离子谱数据对应的谱峰,所述离子谱数据为所述第一矩阵数据中的一列数据;
第二确定模块,用于基于匹配过滤器确定用以分组的第一目标区间后,基于各所述第一目标区间对所有谱峰进行分组,所述匹配过滤器对应目标向量的极小值为各所述第一目标区间的分割点;
计算模块,用于针对每个所述第一目标区间,计算所述第一目标区间内的各目标谱峰的锐度值,将所述锐度值最大的目标谱峰作为候选模型谱峰,所述目标谱峰为所述第一目标区间内强度值大于最强谱峰强度值的预设比例的所述谱峰;
第三确定模块,用于针对每个所述候选模型谱峰,确定所述候选模型谱峰的解卷积区间,构建第二矩阵数据,并根据所述解卷积区间中的所述候选模型谱峰个数确定组分个数,所述第二矩阵数据的行用以表征目标点数维度,所述第二矩阵数据的列用以表征所述质荷比维度,所述目标点数维度的范围基于所述解卷积区间的区间范围确定;
重构模块,用于针对每个所述解卷积区间,基于高斯相似性确定所述解卷积区间中待优化的重叠谱峰,并基于LM算法优化所述重叠谱峰后,重构所述第二矩阵数据对应的质谱轮廓;
其中,所述匹配过滤器对应的目标向量的公式为:
其中,N为第一矩阵数据的行数;Coef为系数;为第一目标区间的宽度控制参数,用以确定多宽时间范围的峰顶点会被认定为属于同一组;p取默认值10;所述目标向量的极小值为所述第一目标区间的分割点。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机可读存储介质中存储有指令,当所述指令在计算机或处理器上运行时,使得所述计算机或处理器执行如权利要求1-7任一项所述方法的步骤。
CN202410317097.2A 2024-03-20 2024-03-20 一种多组分重叠峰的自动化解析方法、装置及电子设备 Active CN117907511B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410317097.2A CN117907511B (zh) 2024-03-20 2024-03-20 一种多组分重叠峰的自动化解析方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410317097.2A CN117907511B (zh) 2024-03-20 2024-03-20 一种多组分重叠峰的自动化解析方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN117907511A CN117907511A (zh) 2024-04-19
CN117907511B true CN117907511B (zh) 2024-06-14

Family

ID=90686307

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410317097.2A Active CN117907511B (zh) 2024-03-20 2024-03-20 一种多组分重叠峰的自动化解析方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN117907511B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116642989A (zh) * 2023-05-29 2023-08-25 大连大学 一种靶向液-质代谢组学数据的自动定量分析方法

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4353242A (en) * 1980-12-16 1982-10-12 University Of Utah Research Foundation Multichannel detection and resolution of chromatographic peaks
JPH06201673A (ja) * 1992-12-30 1994-07-22 Shimadzu Corp クロマトグラムのピーク検出方法
JPH06324027A (ja) * 1993-05-12 1994-11-25 Hitachi Ltd 自動液体クロマトグラフ
US5644503A (en) * 1994-03-28 1997-07-01 Hitachi, Ltd. Methods and apparatuses for analyzing multichannel chromatogram
US6748333B1 (en) * 1999-09-27 2004-06-08 Hitachi, Ltd. Method and apparatus for chromatographic data processing, and chromatograph
US6787761B2 (en) * 2000-11-27 2004-09-07 Surromed, Inc. Median filter for liquid chromatography-mass spectrometry data
US6873915B2 (en) * 2001-08-24 2005-03-29 Surromed, Inc. Peak selection in multidimensional data
JP3583771B2 (ja) * 2002-10-10 2004-11-04 株式会社日立製作所 クロマトグラム解析方法
EP1749272A4 (en) * 2004-02-13 2010-08-25 Waters Technologies Corp DEVICE AND METHOD FOR IDENTIFYING TIPS IN DATA OF LIQUID CHROMATOGRAPHY / MASS SPECTROMETRY AND FOR FORMING SPECTRAS AND CHROMATOGRAMS
US7804062B2 (en) * 2006-04-05 2010-09-28 National Research Council Of Canada Blind extraction of pure component mass spectra from overlapping mass spectrometric peaks
US8296078B1 (en) * 2009-06-25 2012-10-23 Sandia Corporation Method of multi-dimensional moment analysis for the characterization of signal peaks
JP5375411B2 (ja) * 2009-07-29 2013-12-25 株式会社島津製作所 クロマトグラフ質量分析データ解析方法及び装置
JP2013040808A (ja) * 2011-08-12 2013-02-28 Shimadzu Corp 質量分析データ解析方法及び解析装置
DE112012005677T5 (de) * 2012-01-16 2014-10-23 Leco Corporation Systeme und Verfahren zur Verarbeitung von Daten in chromatographischen Systemen.
US10416134B2 (en) * 2014-09-03 2019-09-17 Shimadzu Corporation Chromatogram data processing method and chromatogram data processing apparatus
GB201421065D0 (en) * 2014-11-27 2015-01-14 Shimadzu Corp Fourier Transform mass spectrometry
WO2017077618A1 (ja) * 2015-11-05 2017-05-11 株式会社島津製作所 クロマトグラフ質量分析データ処理方法及び処理装置
CN107860845B (zh) * 2017-11-09 2020-05-12 宁夏医科大学 自动解析gc-ms重叠峰准确识别化合物的方法
EP3752826A1 (en) * 2018-02-15 2020-12-23 Regeneron Pharmaceuticals, Inc. Systems and methods for failure mode detection in process chromatography
KR102853122B1 (ko) * 2018-04-20 2025-09-01 얀센 바이오테크 인코포레이티드 항-tnf 항체 조성물을 생성하기 위한 제조 방법에 있어서의 크로마토그래피 컬럼 적격성 평가
CN109507315B (zh) * 2018-11-15 2021-06-25 宁夏医科大学 复杂样本gc-ms自动解析实现化合物准确鉴别与差异性组分筛查的方法
CN111272925A (zh) * 2020-02-18 2020-06-12 湘潭大学 一种基于特征值确认的全二维气相色谱调制峰多层次限制归类方法
CN112415078B (zh) * 2020-11-18 2023-11-14 深圳市步锐生物科技有限公司 一种质谱数据谱图信号校准方法及装置
CN112730712B (zh) * 2020-12-31 2022-06-07 杭州谱育科技发展有限公司 提高lc-ms数据信噪比的方法
JP7517295B2 (ja) * 2021-09-27 2024-07-17 株式会社島津製作所 データ処理方法及びデータ処理システム
CN115166120B (zh) * 2022-06-23 2024-12-24 中国科学院苏州生物医学工程技术研究所 一种谱峰识别方法、设备、介质及产品
CN117146977A (zh) * 2023-08-30 2023-12-01 杭州奥盛仪器有限公司 一种针对单色器光谱的寻峰方法、装置与电子设备

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116642989A (zh) * 2023-05-29 2023-08-25 大连大学 一种靶向液-质代谢组学数据的自动定量分析方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
余玲玲 等.液质联用技术用于复杂混合物体系中小分子化合物的分析.中国科学:化学.2017,第47卷(第12期),1379-1391. *

Also Published As

Publication number Publication date
CN117907511A (zh) 2024-04-19

Similar Documents

Publication Publication Date Title
US7676329B2 (en) Method and system for processing multi-dimensional measurement data
US20110282588A1 (en) Method to automatically identify peaks and monoisotopic peaks in mass spectral data for biomolecular applications
EP2438436B1 (en) Methods of automated spectral peak detection and quantification without user input
US8604421B2 (en) Method and system of identifying a sample by analyising a mass spectrum by the use of a bayesian inference technique
EP1623351A2 (en) Computational method and system for mass spectral analysis
CN114372063A (zh) 一种基于色谱仪的故障检测方法及电子设备
US20240068936A1 (en) Adaptive characteristic spectral line screening method and system based on atomic emission spectrum
CN115856180B (zh) 数据处理方法及数据处理系统
CN109073615A (zh) 数据处理装置
CN113610817B (zh) 一种特征峰识别方法及计算设备、存储介质
US20210063362A1 (en) Techniques for exception-based validation of analytical information
Stanford et al. Informed baseline subtraction of proteomic mass spectrometry data aided by a novel sliding window algorithm
CN117907511B (zh) 一种多组分重叠峰的自动化解析方法、装置及电子设备
US11913919B2 (en) Techniques for acquisition-stage peak width determination and baseline offset estimation
WO2007092575A2 (en) A two-step method to align three dimensional lc-ms chromatographic surfaces
US9773090B2 (en) Method computer program and system to analyze mass spectra
CA2523976C (en) Computational methods and systems for multidimensional analysis
US20120318970A1 (en) Ion selection optimization for mass spectrometry
US20200217829A1 (en) Rapid Scoring of LC-MS/MS Peptide Data
CN113469235B (zh) 用水波动异常识别方法及装置、计算机装置及存储介质
JP2013145245A (ja) 質量分析データ処理方法及び装置
US20230132326A1 (en) Data processing method, data processing system, and computer program
Llambrich et al. GcDUO: an open-source software for GC× GC–MS data analysis
EP3924730B1 (en) Apparatus and method for targeted compound analysis
US20250385084A1 (en) Compound mass spectrometry analysis system and the server thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant