[go: up one dir, main page]

WO2018134998A1 - クロマトグラムデータ処理装置 - Google Patents

クロマトグラムデータ処理装置 Download PDF

Info

Publication number
WO2018134998A1
WO2018134998A1 PCT/JP2017/002132 JP2017002132W WO2018134998A1 WO 2018134998 A1 WO2018134998 A1 WO 2018134998A1 JP 2017002132 W JP2017002132 W JP 2017002132W WO 2018134998 A1 WO2018134998 A1 WO 2018134998A1
Authority
WO
WIPO (PCT)
Prior art keywords
peak
same component
peaks
data processing
derived
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2017/002132
Other languages
English (en)
French (fr)
Inventor
真一 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shimadzu Corp
Original Assignee
Shimadzu Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shimadzu Corp filed Critical Shimadzu Corp
Priority to PCT/JP2017/002132 priority Critical patent/WO2018134998A1/ja
Priority to JP2018562849A priority patent/JP6760400B2/ja
Priority to US16/346,152 priority patent/US20200088700A1/en
Publication of WO2018134998A1 publication Critical patent/WO2018134998A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N30/8631Peaks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/62Detectors specially adapted therefor
    • G01N30/72Mass spectrometers
    • G01N30/7233Mass spectrometers interfaced to liquid or supercritical fluid chromatograph
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8651Recording, data aquisition, archiving and storage
    • G01N30/8655Details of data formats
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis
    • G01N30/8624Detection of slopes or peaks; baseline correction
    • G01N2030/8648Feature extraction not otherwise provided for
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N30/00Investigating or analysing materials by separation into components using adsorption, absorption or similar phenomena or using ion-exchange, e.g. chromatography or field flow fractionation
    • G01N30/02Column chromatography
    • G01N30/86Signal analysis

Definitions

  • the present invention relates to a chromatogram data processing apparatus that processes data collected by a chromatograph using a mass spectrometer or an absorption spectroscopic detector as a detector, and more specifically, based on data obtained for each of a plurality of samples.
  • the present invention relates to a chromatogram data processing apparatus for processing such data for the purpose of performing statistical analysis or the like.
  • Liquid chromatograph (LC) and gas chromatograph (GC) using a mass spectrometer as a detector that is, liquid chromatograph mass spectrometer (LC-MS) and gas chromatograph mass spectrometer (GC-MS)
  • LC-MS liquid chromatograph mass spectrometer
  • GC-MS gas chromatograph mass spectrometer
  • the elution time of the same component in different samples may vary due to variations or fluctuations in LC separation conditions (mobile phase linear velocity, etc.).
  • a shift in elution time is automatically corrected by a holding time alignment function.
  • the components of the peak derived from the component having a short elution time based on the similarity of the shape of the peak on the extracted ion chromatogram, that is, the chromatogram created for each mass to charge ratio When it is determined that the peaks are derived from the same component, the information on the retention time is adjusted so that the retention times are aligned.
  • the present invention has been made to solve the above-mentioned problems, and its object is to obtain peak information obtained by performing peak picking or the like on data on a plurality of samples obtained by a chromatographic apparatus. It is to provide a chromatogram data processing apparatus capable of improving the accuracy of a table-like data list created by organizing data and thereby improving the accuracy of analysis such as statistical analysis based on the data list. .
  • the present invention provides a chromatograph that separates a plurality of components contained in a sample in the time direction, and a dimension that is different from the time direction with respect to the sample separated by the chromatograph.
  • a chromatogram data processing device for processing data on a plurality of samples collected using an analyzer comprising a detection unit for acquiring signal intensity, a) a peak detector that performs peak detection on chromatogram data for a plurality of samples and collects peak information including retention time for each detected peak; b) When at least the retention times of a plurality of peaks derived from different samples are the same or within a predetermined range, the signal intensity waveform along the direction of the different dimensions or the similarity of the signal intensity values in one value of the dimensions Based on the determination of whether or not it is a peak derived from the same component, and, if necessary, the same component determination unit for correcting the retention time and / or the dimension value for those peaks, and c) Based on the data corrected by the same component determination unit, the holding time and the dimension are arranged in one of the column direction or the row direction, and information for identifying a plurality of samples is arranged in the other of the column direction or the row direction, A data list creation unit that creates a data list
  • the “chromatograph” is usually LC or GC.
  • the “dimension” is a mass-to-charge ratio
  • the “detection unit” is a PDA detector, an ultraviolet-visible absorption spectroscopic detector, or a spectrofluorescence detector. In some cases, the “dimension” is a wavelength.
  • the mass spectrometer includes a mass spectrometer capable of MS / MS analysis or MS n analysis, such as a tandem quadrupole mass spectrometer, The mass spectrum includes an MS / MS spectrum or an MS n spectrum. Further, the holding time may be a holding index.
  • the peak detector executes peak detection at least in the time direction for chromatogram data for a plurality of samples. Then, peak information such as holding time and signal intensity value is collected for each detected peak.
  • the algorithm for peak detection may be a conventionally used one.
  • the same component determination unit compares at least the retention time (or retention index corresponding to the retention time) of peaks derived from different samples, and extracts a plurality of peaks having the same retention time or within a predetermined range. .
  • a plurality of peaks may be extracted by determining not only the holding time but also whether the different dimension values are the same or within a predetermined range.
  • the same component determination unit determines whether the plurality of peaks extracted as described above are based on the similarity of signal intensity waveforms along the direction of different dimensions or the similarity of signal intensity values in one value of the dimensions. Then, it is determined whether or not the peaks are derived from the same component. For example, when the “detection unit” is a mass spectrometer and the “dimension” is a mass-to-charge ratio, the signal intensity waveforms along different dimension directions are mass spectrum waveforms, and thus correspond to a plurality of peaks, respectively. What is necessary is just to determine whether the some peak is a peak derived from the same component based on the similarity of the spectrum pattern of several mass spectrum. If the retention times of the plurality of peaks determined to be peaks derived from the same component or the dimension values (for example, mass-to-charge ratio values) are different, the peaks are corrected so as to be aligned.
  • the retention time and dimension value of peaks derived from the same component for different samples are the same by the above processing, so the data list creation unit creates a data list in a table format based on the data thus corrected. As a result, information on the same component for different samples is not arranged in different rows or columns on the data list, and an organized and highly accurate data list can be obtained.
  • the same component determination unit calculates the similarity of the signal intensity waveform in the dimension direction during the peak top retention time of each of a plurality of peaks derived from different samples. And it can be set as the structure which determines whether it is a peak derived from the same component based on the similarity.
  • This aspect is effective when a substantially continuous signal intensity in the direction of a dimension different from time can be obtained at each holding time as in the mass spectrum or the absorption spectrum described above.
  • similarity for example, Pearson's product-moment correlation coefficient and distances in various spaces such as Euclidean distance can be used.
  • the same component determination unit includes a signal intensity value for one or a plurality of dimension values in a peak top retention time of each of a plurality of peaks derived from different samples. It is good also as a structure which calculates the difference or distance of these, and determines whether it is a peak derived from the same component based on the difference or distance.
  • This aspect is also effective when a substantially continuous signal strength in the direction of the dimension different from the time is obtained at each holding time as described above, but a predetermined one or a plurality (usually a small number) is obtained. This is effective when the signal intensity can be obtained only at the dimension value.
  • chromatogram data processing apparatus of the present invention data for a plurality of samples obtained by an analyzer such as LC-MS, GC-MS, or LC using a PDA detector as a detector is derived from the same component. Even if the peak retention time or mass-to-charge ratio value is shifted, this can be corrected accurately to create a highly accurate data list. In particular, even when multiple peaks with similar mass-to-charge ratios and wavelengths appear from different components appear in close retention time, the identity of the components is determined based on the similarity of the mass spectrum and the entire absorption spectrum. By doing so, it can recognize that it is a different component exactly. Thus, the accuracy of statistical analysis can be improved by providing a more accurate data list for statistical analysis than in the past.
  • an analyzer such as LC-MS, GC-MS, or LC using a PDA detector as a detector
  • FIG. 1 is a schematic configuration diagram of the LC-MS of the present embodiment.
  • the LC-MS of the present embodiment includes a measurement unit 1 that performs measurement on a sample, a data processing unit 2, an input unit 3 that is a user interface, and a display unit 4.
  • the measurement unit 1 includes a liquid chromatograph unit (LC unit) 11 and a mass spectrometer (MS unit) 12.
  • the LC unit 11 includes a pump that feeds the mobile phase at a constant flow rate, an injector that injects a sample into the fed mobile phase, and a column that temporally separates various components contained in the sample. ,including.
  • the MS unit 12 includes an ion source that ionizes components in the eluate eluted from the column outlet of the LC unit 11 in the preceding stage, a quadrupole mass filter that separates the generated ions according to the mass-to-charge ratio, and a flight A mass separator such as a time-type mass separator and a detector for detecting separated ions are included.
  • the data processing unit 2 includes, as functional blocks, a data storage unit 20, a peak detection unit 21, an identical component candidate extraction unit 22, a spectrum similarity determination unit 23, a retention time / m / z value correction unit 24, a data arrangement table creation unit 25 and a multivariate analysis processing unit 26.
  • the data storage unit 20 stores, for each sample, a data file storing signal intensity value data having two parameters of retention time and mass-to-charge ratio, that is, three-dimensional chromatogram data.
  • the entity of the data processing unit 2 is a personal computer. And the function of each said part can be implement
  • FIG. 2 is a flowchart showing a characteristic data processing procedure performed by the data processing unit 2 of the LC-MS of the present embodiment
  • FIG. 3 is a conceptual diagram for explaining the data processing
  • FIG. 4 is a data arrangement table. It is a figure which shows an example.
  • This data processing is to perform multivariate analysis for examining differences and similarities between samples based on data files for a plurality of samples stored in advance in the data storage unit 20.
  • the operator designates a plurality of data files to be subjected to multivariate analysis processing from the input unit 3 (step S1).
  • the peak detection unit 21 reads the designated data file from the data storage unit 20.
  • peak picking is performed on the three-dimensional chromatogram data stored in each data file in accordance with a predetermined standard, and the retention time at the peak top, the mass-to-charge ratio, and the signal intensity value are collected as peak information (step) S2).
  • peak information step S2
  • Usually, a large number of peaks are detected from data in one data file corresponding to one sample.
  • the same component candidate extraction unit 22 extracts, for a plurality of peaks extracted from different data files, a peak whose difference in retention time is within a predetermined allowable value and whose difference in mass to charge ratio is within a predetermined allowable value.
  • allowable values may be determined appropriately in advance.
  • the allowable value of the retention time may be determined in consideration of, for example, variations or fluctuations in the flow rate of the mobile phase in the LC unit 11.
  • the allowable value of the mass to charge ratio may be determined in consideration of the performance of the apparatus, such as the mass accuracy of the MS unit 12.
  • a set of peaks extracted from different data files is a candidate for a peak derived from the same component.
  • the spectrum similarity determination unit 23 retains a plurality of peaks included in one peak set extracted as described above based on the data in the data file, that is, a candidate derived from the same component. Create mass spectra at. Then, the similarity of the spectrum pattern of the mass spectrum is calculated according to a predetermined algorithm (step S3). If a plurality of peaks are truly peaks derived from the same component, the spectrum pattern of the mass spectrum corresponding to each of the plurality of peaks should exhibit a high degree of similarity. Therefore, it is determined whether or not the calculated similarity is equal to or higher than a predetermined threshold (step S4). If the similarity is equal to or higher than the threshold, it is determined that the plurality of peaks are peaks derived from the same component (step S4). S5).
  • the difference ⁇ RT between the retention times RT1 and RT2 between a certain peak in the sample 1 and a certain peak in the sample 2 is within a predetermined allowable value, and the mass-to-charge ratio m / z1, It is assumed that the difference ⁇ M of m / z2 is within a predetermined allowable value. In this case, these peaks are extracted as candidates for peaks derived from the same component.
  • mass spectra are generated at the retention times RT1 and RT2 of the respective peaks, as shown in FIG. 3B, if the spectrum patterns of the two mass spectra are similar as a whole, the degree of similarity increases.
  • FIG. 3A the difference ⁇ RT between the retention times RT1 and RT2 between a certain peak in the sample 1 and a certain peak in the sample 2 is within a predetermined allowable value, and the mass-to-charge ratio m / z1, It is assumed that the difference ⁇ M of m / z2 is within a predetermined
  • the similarity is low if the spectrum patterns of the two mass spectra are not similar as a whole.
  • FIG. 3B it can be determined that these two peaks are highly likely to be derived from the same component.
  • FIG. 3 (c) although the peaks exist by chance at m / z1 and m / z2 where the difference ⁇ M in the mass-to-charge ratio is small on the mass spectrum, the other peaks hardly coincide. Therefore, it can be determined that there is a high possibility that these two peaks are not derived from the same component.
  • the holding time / m / z value correcting unit 24 uses one or both of the holding times to align the holding times. For example, an average of a plurality of holding times may be calculated and the holding times may be aligned with the average value.
  • the holding time / m / z value correcting unit 24 can either The mass-to-charge ratio is made uniform using both mass-to-charge ratios (step S6).
  • step S7 it is determined whether or not the processing of steps S3 to S6 has been executed for all the peaks that are extracted from the same component and extracted based on the retention time and the mass-to-charge ratio. If there is a peak, the process returns from step S7 to S3. Therefore, by repeating the processes in steps S3 to S7, it is determined whether or not all the peaks extracted based on the retention time and the mass-to-charge ratio are peaks derived from the same component. For these peaks, a process for adjusting the retention time and mass-to-charge ratio is performed.
  • step S7 the data array table creation unit 25, based on the peak information after the retention time and mass-to-charge ratio are corrected, as shown in FIG. 4, the retention time and mass in the vertical direction.
  • a data array table or matrix is created in which the charge ratios are arranged with sample identification information (for example, sample number and sample name) in the horizontal direction, and the signal intensity value is an element of each column (step S8).
  • sample identification information for example, sample number and sample name
  • step S3 various values can be used as similarities between a plurality of mass spectra.
  • Pearson's product-moment correlation coefficient can be used.
  • Pearson's product moment correlation coefficient is the same as the cosine of two vectors.
  • Euclidean distance, Mahalanobis distance, Minkowski distance, Chebyshev distance, Manhattan distance, and the like can also be used as the similarity.
  • the chromatogram data processing apparatus can be applied not only to LC-MS and GC-MS but also to processing of data obtained by various other chromatograph apparatuses.
  • LC using PDA detector UV-visible absorption spectroscopic detector, spectrofluorescence detector, differential refractive index detector, electrical conductivity detector, etc., or thermal conductivity detector, electron capture
  • the present invention can also be applied to processing data obtained by GC using a type detector, a flame photometric detector, a flame ionization detector, or the like as a detector.

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

ピーク検出部(21)は、複数の試料に対してLC/MS分析を行うことで得られたデータについてそれぞれピーク検出を実行しピーク情報を収集する。同一成分候補抽出部(22)は異なる試料に対する複数のピークについて保持時間の差及びm/z値の差が許容値以内であるピークを抽出し、スペクトル類似性判定部(23)はその複数のピークにそれぞれ対応するマススペクトルの類似度を算出する。そして、その類似度が所定値以上であればその複数のピークは同一成分由来であると判断し、保持時間・m/z値修正部(24)はそれらピークの保持時間及びm/z値にずれがあれば同一になるように修正する。データ配列テーブル作成部(25)は保持時間及びm/z値が修正されたピーク情報に基づきデータ配列テーブルを作成する。これにより、異なる試料に対する同一成分由来のピークの情報がテーブル上で同じ行(又は列)に配置された、精度の高いテーブルを得ることができる。

Description

クロマトグラムデータ処理装置
 本発明は、質量分析装置や吸光分光検出器などを検出器とするクロマトグラフにより収集されたデータを処理するクロマトグラムデータ処理装置に関し、さらに詳しくは、複数の試料についてそれぞれ得られたデータに基づく統計解析を行う等の目的で、それらデータを処理するクロマトグラムデータ処理装置に関する。
 質量分析装置を検出器とする液体クロマトグラフ(LC)やガスクロマトグラフ(GC)、つまり液体クロマトグラフ質量分析装置(LC-MS)やガスクロマトグラフ質量分析装置(GC-MS)では、質量分析装置において所定の質量電荷比範囲に亘る質量分析を繰り返すことで、保持時間、質量電荷比、及び信号強度という三つのディメンジョンを持つ3次元クロマトグラムデータを得ることができる。また、フォトダイオードアレイ(PDA)検出器や紫外可視吸光分光検出器を検出器とするLCでは、検出器において所定の波長範囲の吸光スペクトルを繰り返し取得することで、保持時間、波長、及び信号強度(吸光度)という三つのディメンジョンを持つ3次元クロマトグラムデータを得ることができる。
 近年、医薬品、食品、環境など様々な分野において、多数の試料について上記のようなクロマトグラフ装置でそれぞれ分析を行うことで得られた大量のデータについて多変量解析の手法を用いた解析が盛んに行われている。こうした多変量解析の際には、ウメトリクス(Umetrics)社製のSIMCA-P等の市販の統計解析計算ソフトウェアがしばしば用いられる。例えば多数の試料についてLC-MSを用いて収集された3次元クロマトグラムデータを上記のような汎用ソフトウェアで処理するためには、データを所定形式で整理して該ソフトウェアに入力する必要がある。こうしたデータ処理のためのソフトウェアとして非特許文献1に記載の「Profiling Solution」が知られている。「Profiling Solution」では、複数の試料についてそれぞれ得られた3次元クロマトグラムデータに対しピークピッキングが行われ、検出された各ピークの保持時間、質量電荷比、及び信号強度がテーブル形式で整理されて出力されるようになっている。
 例えばLC-MSで得られたクロマトグラムデータにおいては、LC分離条件(移動相の線速度等)のばらつきや変動によって、異なる試料における同じ成分の溶出時間にずれが生じることがある。上述した非特許文献1に記載のソフトウェアや特許文献1に記載の装置では、保持時間のアライメント機能により、そうした溶出時間のずれが自動的に補正されるようになっている。例えば特許文献1に記載の装置においては、質量電荷比毎に作成されるクロマトグラム、つまりは抽出イオンクロマトグラム上のピークの形状の類似性に基づいて溶出時間が近い成分由来のピークの成分同一性が判定され、同一の成分由来のピークであると判定されると保持時間が揃うように該保持時間の情報が調整される。
 しかしながら、質量分析装置の質量精度があまり良好でない(例えば1Da程度のずれがあり得る)場合や、クロマトグラム上で時間方向に近接して質量電荷比が同じピークが出現する場合などには、上述したような保持時間のアライメントが適切に行われないことがある。その結果、テーブル形式のデータリストにおいて、同じ成分由来であって本来は同じ質量電荷比を有するイオンに対応する信号強度が、同じ行ではなく複数の行に分かれてしまうことがある。また逆に、異なる成分由来であって本来は異なる質量電荷比を有するイオンに対応する信号強度が、同じ行に配置されてしまうこともある。このような正確性を欠くテーブル形式のデータリストを多変量解析に供すると、当然のことながら、誤った解析結果を導出するおそれがある。
国際公開特許第2013/001618号
「LCMS-IT-TOF 液体クロマトグラフ質量分析計 LCMS-IT-TOF用メタボロミクスソフトウェア Profiling Solution」、株式会社島津製作所、[online]、[2017年1月18日検索]、インターネット<URL :http://www.an.shimadzu.co.jp/lcms/it-tof6.htm>
 本発明は上記課題を解決するために成されたものであり、その目的とするところは、クロマトグラフ装置で得られた複数の試料についてのデータに対しピークピッキング等を行うことで得られるピーク情報を整理して作成されるテーブル状のデータリストの精度を向上させ、それによって該データリストに基づく統計解析などの解析の正確性を向上させることができるクロマトグラムデータ処理装置を提供することである。
 上記課題を解決するために成された本発明は、試料に含まれる複数の成分を時間方向に分離するクロマトグラフと、該クロマトグラフで分離されたあとの試料に対し時間方向とは異なるディメンジョンにおける信号強度を取得する検出部と、を具備する分析装置を用いて収集された、複数の試料についてのデータを処理するクロマトグラムデータ処理装置であって、
 a)複数の試料についてのクロマトグラムデータに対しピーク検出を実行し、検出された各ピークについて保持時間を含むピーク情報を収集するピーク検出部と、
 b)異なる試料に由来する複数のピークの少なくとも保持時間が同じ又は所定範囲以内であるとき、前記異なるディメンジョンの方向に沿った信号強度波形又はそのディメンジョンの一つの値における信号強度値の類似性に基づいて、同一成分由来のピークであるか否か判定するとともに、必要に応じてそれらピークについての保持時間及び/又は前記ディメンジョンの値を修正する同一成分判定部と、
 c)前記同一成分判定部による修正後のデータに基づいて、保持時間及び前記ディメンジョンを列方向又は行方向の一方、複数の試料を識別するための情報を列方向又は行方向の他方に並べ、或る試料の或る保持時間及び或るディメンジョンの値における信号強度値を行列要素としたテーブル形式のデータリストを作成するデータリスト作成部と、
 を備えることを特徴としている。
 上記「クロマトグラフ」は通常、LC又はGCである。また、上記「検出部」が質量分析装置である場合、上記「ディメンジョン」は質量電荷比であり、上記「検出部」がPDA検出器や紫外可視吸光分光検出器、或いは分光蛍光検出器である場合には上記「ディメンジョン」とは波長である。また、上記「検出部」が質量分析装置である場合、該質量分析装置はタンデム四重極型質量分析装置のようにMS/MS分析又はMSn分析が可能な質量分析装置を含み、その場合、マススペクトルはMS/MSスペクトル又はMSnスペクトルを含む。また、上記保持時間は保持指標でもよい。
 本発明に係るクロマトグラムデータ処理装置において、ピーク検出部は、複数の試料についてのクロマトグラムデータに対しそれぞれ、少なくとも時間方向にピーク検出を実行する。そして、検出された各ピークについて保持時間や信号強度値などのピーク情報を収集する。ピーク検出のアルゴリズムは従来用いられているものでよい。同一成分判定部は、それぞれ異なる試料に由来するピークについて少なくとも保持時間(又は保持時間に相当する保持指標など)を比較し、保持時間が同一である又は所定範囲以内である複数のピークを抽出する。なお、保持時間のみならず、上記の異なるディメンジョンの値について同一であるか又は所定範囲以内であるかを併せて判定することで、複数のピークを抽出してもよい。
 同一成分判定部は、上述したように抽出された複数のピークについて、異なるディメンジョンの方向に沿った信号強度波形の類似性、又はそのディメンジョンの一つの値における信号強度値の類似性のいずれに基づいて、同一成分由来のピークであるか否か判定する。例えば上記「検出部」が質量分析装置であり、上記「ディメンジョン」が質量電荷比である場合、異なるディメンジョンの方向に沿った信号強度波形はマススペクトル波形であるから、複数のピークにそれぞれ対応する複数のマススペクトルのスペクトルパターンの類似性に基づいて、その複数のピークが同一成分由来のピークであるか否か判定すればよい。そして、同一成分由来のピークであると判定された複数のピークの保持時間、或るいは上記ディメンジョンの値(例えば質量電荷比値)が異なる場合には、それらを揃えるように修正する。
 上記処理によって、異なる試料に対する同一成分由来のピークの保持時間やディメンジョン値は同一になるので、データリスト作成部は、こうして修正された後のデータに基づいてテーブル形式のデータリストを作成する。その結果、異なる試料に対する同じ成分についての情報が、データリスト上で異なる行又は列に配置されることがなくなり、整理された精度の高いデータリストを得ることができる。
 本発明に係るクロマトグラムデータ処理装置の一態様において、前記同一成分判定部は、異なる試料に由来する複数のピークそれぞれのピークトップの保持時間における前記ディメンジョンの方向の信号強度波形の類似度を算出し、その類似度に基づいて同一成分由来のピークであるか否かを判定する構成とすることができる。
 この態様は、上述したマススペクトル或いは吸光スペクトルのように、各保持時間において時間とは異なるディメンジョンの方向の実質的に連続的な信号強度が得られる場合に有効である。
 ここで類似度としては例えば、ピアソンの積率相関係数や、ユークリッド距離などの様々な空間における距離を利用することができる。
 また本発明に係るクロマトグラムデータ処理装置の別の態様において、前記同一成分判定部は、異なる試料に由来する複数のピークそれぞれのピークトップの保持時間における一つ又は複数のディメンジョン値に対する信号強度値の差又は距離を算出し、その差又は距離に基づいて同一成分由来のピークであるか否かを判定する構成としてもよい。
 この態様は、上述したように各保持時間において時間とは異なるディメンジョンの方向の実質的に連続的な信号強度が得られる場合にも有効であるが、所定の一又は複数(通常は少数)のディメンジョンの値においてのみしか信号強度が得られない場合に有効である。
 本発明に係るクロマトグラムデータ処理装置によれば、LC-MS、GC-MS、或いはPDA検出器を検出器として用いたLCなどの分析装置で得られた複数の試料に対するデータについて、同一成分由来のピークの保持時間や質量電荷比値などがずれている場合でも、これを的確に修正し精度の高いデータリストを作成することができる。特に、異なる成分に由来する、質量電荷比や波長が近い複数のピークが近い保持時間に現れるような場合であっても、マススペクトルや吸光スペクトル全体の類似性に基づいて成分の同一性を判定することで、的確に異なる成分であることを認識することができる。こうして、従来に比べて正確なデータリストを統計解析に提供することで、統計解析の正確性を向上させることができる。
本発明に係るクロマトグラムデータ処理装置を用いたLC-MSの一実施例の概略構成図。 本実施例のLCーMSのデータ処理部で実施される特徴的なデータ処理の手順を示すフローチャート。 本実施例のLCーMSにおけるデータ処理を説明するための概念図。 データ配列テーブルの一例を示す図。
 本発明に係るクロマトグラムデータ処理装置を用いた分析装置の一実施例であるLC-MSについて、添付図面を参照して説明する。
 図1は本実施例のLC-MSの概略構成図である。
 本実施例のLC-MSは、試料に対する測定を実行する測定部1と、データ処理部2と、ユーザーインターフェイスである入力部3及び表示部4と、を含む。
 測定部1は、液体クロマトグラフ部(LC部)11と、質量分析装置(MS部)12とを含む。図示しないが、LC部11は、移動相を一定流速で送給するポンプと、送給された移動相中に試料を注入するインジェクタと、試料に含まれる各種成分を時間的に分離するカラムと、を含む。一方、MS部12は、前段のLC部11のカラム出口から溶出する溶出液中の成分をイオン化するイオン源と、生成されたイオンを質量電荷比に応じて分離する四重極マスフィルタ、飛行時間型質量分離器等である質量分離器と、分離されたイオンを検出する検出器と、を含む。
 データ処理部2は、機能ブロックとして、データ格納部20、ピーク検出部21、同一成分候補抽出部22、スペクトル類似性判定部23、保持時間・m/z値修正部24、データ配列テーブル作成部25、及び、多変量解析処理部26、を備える。データ格納部20には、試料毎に、保持時間、質量電荷比の二つのパラメータを有する信号強度値のデータ、つまりは3次元クロマトグラムデータが格納されたデータファイルが保存される。
 なお、データ処理部2の実体はパーソナルコンピュータである。そして、そのパーソナルコンピュータにインストールされた専用のデータ処理ソフトウェアを該コンピュータで実行することにより、上記各部の機能が実現されるものとすることができる。
 図2は本実施例のLCーMSのデータ処理部2で実施される特徴的なデータ処理の手順を示すフローチャート、図3はそのデータ処理を説明するための概念図、図4はデータ配列テーブルの一例を示す図である。
 これら図を参照しつつ、本実施例のLC-MSにおける特徴的なデータ処理を説明する。このデータ処理は、データ格納部20に予め格納されている、複数の試料に対するデータファイルに基づいて、試料間の相違性や類似性を調べる多変量解析を行うものである。
 操作者(ユーザー)は入力部3から、多変量解析処理する対象の複数のデータファイルを指定する(ステップS1)。処理が開始されると、ピーク検出部21は指定されたデータファイルをデータ格納部20から読み出す。そして、各データファイルに格納されている3次元クロマトグラムデータに対し所定の基準に従ってピークピッキングを行い、ピークのピークトップにおける保持時間、質量電荷比、及び信号強度値をピーク情報として収集する(ステップS2)。通常、一つの試料に対応する一つのデータファイル中のデータから多数のピークが検出される。
 同一成分候補抽出部22は、異なるデータファイルから抽出された複数のピークについて、保持時間の差が所定許容値以内で且つ質量電荷比の差が所定の許容値以内であるピークを抽出する。それら許容値は予め適宜に定めておけばよい。保持時間の許容値は例えばLC部11における移動相の流速のばらつきや変動などを考慮して決めておけばよい。一方、質量電荷比の許容値は主としてMS部12の質量精度など、装置の性能を考慮して決めておけばよい。上記のように異なるデータファイルからそれぞれ抽出されたピークの組は同一成分由来であるピークの候補である。
 次いで、スペクトル類似性判定部23は、データファイル中のデータに基づいて、上記のように抽出された、つまりは同一成分由来の候補である一つのピークの組に含まれる複数のピークの保持時間におけるマススペクトルをそれぞれ作成する。そして、そのマススペクトルのスペクトルパターンの類似度を所定のアルゴリズムに従って算出する(ステップS3)。仮に複数のピークが真に同一成分由来のピークであるとすると、それら複数のピークにそれぞれ対応するマススペクトルのスペクトルパターンは高い類似度を示す筈である。そこで、算出された類似度が所定の閾値以上であるか否かを判定し(ステップS4)、類似度が閾値以上であればそれら複数のピークは同一成分由来のピークであると判断する(ステップS5)。
 図3(a)に示すように、試料1における或るピークと試料2における或るピークとの保持時間RT1、RT2の差ΔRTが所定の許容値以内であり、且つ質量電荷比m/z1、m/z2の差ΔMが所定の許容値以内であるとする。この場合、これらピークは同一成分由来のピークの候補として抽出される。それぞれのピークの保持時間RT1、RT2におけるマススペクトルを作成したとき、図3(b)に示すように、その二つのマススペクトルのスペクトルパターンが全体として類似していれば類似度は高くなる。一方、図3(c)に示すように、その二つのマススペクトルのスペクトルパターンが全体として類似していなければ類似度は低くなる。図3(b)の場合には、それら二つのピークは同一成分由来である可能性が高いと判断できる。一方、図3(c)の場合には、マススペクトル上で質量電荷比の差ΔMが小さいm/z1、m/z2にそれぞれピークが偶然存在しているものの、それ以外のピークは殆ど一致しないため、それら二つのピークは同一成分由来でない可能性が高いと判断できる。
 複数のピークが同一成分由来のピークであると判断された場合、その複数のピークに保持時間のずれがあれば、それは本来同じにすべきものである。そこで、保持時間・m/z値修正部24は、いずれか一方又は両方の保持時間を用いて保持時間を揃える。例えば複数の保持時間の平均を計算し、その平均値に保持時間を揃えればよい。一方、複数のピークに質量電荷比のずれがあった場合にも、それは本来同じにすべきものであるから、保持時間・m/z値修正部24は、保持時間と同様に、いずれか一方又は両方の質量電荷比を用いて質量電荷比を揃える(ステップS6)。
 そして、保持時間及び質量電荷比に基づいて抽出された、同一成分由来のピーク候補である全てのピークについて、ステップS3~S6の処理を実行したか否かを判定し(ステップS7)、未処理のピークがあればステップS7からS3へと戻る。したがって、ステップS3~S7の処理の繰り返しによって、保持時間及び質量電荷比に基づいて抽出された全てのピークについて同一成分由来のピークであるか否かを判定し、同一成分由来であるとみなせる複数のピークについては保持時間及び質量電荷比を揃える処理が実施される。
 ステップS7でYesと判定されると、データ配列テーブル作成部25が、保持時間及び質量電荷比が修正された後のピーク情報に基づいて、図4に示すように、縦方向に保持時間及び質量電荷比を、横方向に試料の識別情報(例えば試料番号や試料名など)をそれぞれ並べ、信号強度値を各欄の要素としたデータ配列テーブル又は行列を作成する(ステップS8)。上述したように、異なる試料であっても同一成分由来のピークの保持時間及び質量電荷比は同じになっているので、同一成分由来のピークの信号強度値は同じ行に配置される。多変量解析処理部26はこうして作成されたデータ配列テーブルを読み込み、このテーブルに基づいて所定の多変量解析処理を実行する(ステップS9)。
 以上のようにして、本実施例のLC-MSでは、異なる試料に対して得られたデータにおいて同一成分の保持時間ずれや質量電荷比ずれがあった場合でも、それらずれを適切に修正して同じピークとして扱うことができる。それによって、データ配列テーブルに基づく多変量解析結果の精度が向上する。
 上記ステップS3において複数のマススペクトルの類似度としては様々なものを利用することができるが、例えばピアソンの積率相関係数を用いることができる。よく知られているように、ピアソンの積率相関係数は二つのベクトルの余弦(cos)と同じである。また、そのほか、ユークリッド距離、マハラノビス距離、ミンコフスキー距離、チェビシェフ距離、マンハッタン距離などを類似度として用いることもできる。
 また、マススペクトルのスペクトルパターンの類似度ではなく、特定の質量電荷比における信号強度値や複数の質量電荷比における信号強度値の比などについての類似度、つまりは差や距離を用いて同一成分由来であるか否かを判定してもよい。
 また、上記説明から明らかであるように、マススペクトルのスペクトルパターンが単純過ぎると同一成分由来のピークであるか否かを判定しにくい。そのため、例えばプロトン付加(又はプロトン脱離)イオンのみが観測されるようなマススペクトルは同一成分由来の判定にはあまり適さず、例えば電子イオン化(EI)法によるフラグメントを利用したマススペクトルやインソース解離(ISD)を利用したISDスペクトルなど、化合物の構造が反映されるマススペクトルがより適している。また、同じ理由から、MS/MS分析やMSn分析により得られるMS/MS(MSn)スペクトルも同一成分由来の判定に適している。
 また、本発明に係るクロマトグラムデータ処理装置は、LC-MSやGC-MSのみならず、他の様々なクロマトグラフ装置で得られたデータの処理に適用することができる。具体的には、PDA検出器、紫外可視吸光分光検出器、分光蛍光検出器、示差屈折率検出器、電気伝導度検出器などを検出器とするLC、或いは、熱伝導度検出器、電子捕獲型検出器、炎光光度検出器、水素炎イオン化検出器などを検出器とするGCで得られたデータを処理する際にも適用が可能である。
 また、上記実施例は本発明の一例にすぎず、上記記載した以外の点において、本発明の趣旨の範囲で適宜変形、修正、追加などを行っても本願特許請求の範囲に包含されることは明らかである。
1…測定部
11…液体クロマトグラフ部(LC部)
12…質量分析装置(MS部)
2…データ処理部
20…データ格納部
21…ピーク検出部
22…同一成分候補抽出部
23…スペクトル類似性判定部
24…保持時間・m/z値修正部
25…データ配列テーブル作成部
26…多変量解析処理部
3…入力部
4…表示部

Claims (5)

  1.  試料に含まれる複数の成分を時間方向に分離するクロマトグラフと、該クロマトグラフで分離されたあとの試料に対し時間方向とは異なるディメンジョンにおける信号強度を取得する検出部と、を具備する分析装置を用いて収集された、複数の試料についてのデータを処理するクロマトグラムデータ処理装置であって、
     a)複数の試料についてのクロマトグラムデータに対しピーク検出を実行し、検出された各ピークについて保持時間を含むピーク情報を収集するピーク検出部と、
     b)異なる試料に由来する複数のピークの少なくとも保持時間が同じ又は所定範囲以内であるとき、前記異なるディメンジョンの方向に沿った信号強度波形又はそのディメンジョンの一つの値における信号強度値の類似性に基づいて、同一成分由来のピークであるか否か判定するとともに、必要に応じてそれらピークについての保持時間及び/又は前記ディメンジョンの値を修正する同一成分判定部と、
     c)前記同一成分判定部による修正後のデータに基づいて、保持時間及び前記ディメンジョンを列方向又は行方向の一方、複数の試料を識別するための情報を列方向又は行方向の他方に並べ、或る試料の或る保持時間及び或るディメンジョンの値における信号強度値を行列要素としたテーブル形式のデータリストを作成するデータリスト作成部と、
     を備えることを特徴とするクロマトグラムデータ処理装置。
  2.  請求項1に記載のクロマトグラムデータ処理装置であって、
     前記同一成分判定部は、異なる試料に由来する複数のピークそれぞれのピークトップの保持時間における前記ディメンジョンの方向の信号強度波形の類似度を算出し、その類似度に基づいて同一成分由来のピークであるか否かを判定することを特徴とするクロマトグラムデータ処理装置。
  3.  請求項1に記載のクロマトグラムデータ処理装置であって、
     前記同一成分判定部は、異なる試料に由来する複数のピークそれぞれのピークトップの保持時間における一つ又は複数のディメンジョン値に対する信号強度値の差又は距離を算出し、その差又は距離に基づいて同一成分由来のピークであるか否かを判定することを特徴とするクロマトグラムデータ処理装置。
  4.  請求項1に記載のクロマトグラムデータ処理装置であって、
     前記検出部は質量分析装置であり、前記同一成分判定部は、マススペクトル波形の類似性に基づいて同一成分由来のピークであるか否か判定することを特徴とするクロマトグラムデータ処理装置。
  5.  請求項1に記載のクロマトグラムデータ処理装置であって、
     前記検出部はフォトダイオードアレイ検出器又は紫外可視吸光分光検出器であり、前記同一成分判定部は、吸光スペクトル波形の類似性に基づいて同一成分由来のピークであるか否か判定することを特徴とするクロマトグラムデータ処理装置。
PCT/JP2017/002132 2017-01-23 2017-01-23 クロマトグラムデータ処理装置 Ceased WO2018134998A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
PCT/JP2017/002132 WO2018134998A1 (ja) 2017-01-23 2017-01-23 クロマトグラムデータ処理装置
JP2018562849A JP6760400B2 (ja) 2017-01-23 2017-01-23 クロマトグラムデータ処理装置
US16/346,152 US20200088700A1 (en) 2017-01-23 2017-01-23 Chromatogram data processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2017/002132 WO2018134998A1 (ja) 2017-01-23 2017-01-23 クロマトグラムデータ処理装置

Publications (1)

Publication Number Publication Date
WO2018134998A1 true WO2018134998A1 (ja) 2018-07-26

Family

ID=62908008

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2017/002132 Ceased WO2018134998A1 (ja) 2017-01-23 2017-01-23 クロマトグラムデータ処理装置

Country Status (3)

Country Link
US (1) US20200088700A1 (ja)
JP (1) JP6760400B2 (ja)
WO (1) WO2018134998A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023004872A (ja) * 2021-06-25 2023-01-17 株式会社島津製作所 クロマトグラフ用データ処理システム
WO2024247575A1 (ja) * 2023-05-30 2024-12-05 株式会社島津製作所 データ処理装置、データ処理方法、データ処理プログラム、およびデータ処理システム

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6658884B2 (ja) * 2016-07-08 2020-03-04 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置
CN115841845A (zh) * 2021-09-18 2023-03-24 成都先导药物开发股份有限公司 一种lcms图谱质量检测系统及lcms数据自动化处理解析收集系统
US20240095517A1 (en) * 2022-09-20 2024-03-21 Advanced Micro Devices, Inc. Framework for compression-aware training of neural networks
CN120992829B (zh) * 2025-10-23 2025-12-26 北京智想创源科技有限公司 一种多维生素同步定量检测方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090526A1 (ja) * 2003-03-31 2004-10-21 Medical Proteoscope Co., Ltd. 試料解析方法及び試料解析プログラム
JP2008249440A (ja) * 2007-03-30 2008-10-16 Hitachi High-Technologies Corp クロマトグラフィー質量分析方法、及びクロマトグラフ質量分析装置
JP2009156722A (ja) * 2007-12-27 2009-07-16 Hitachi High-Technologies Corp 質量分析スペクトル分析方法
JP2011153966A (ja) * 2010-01-28 2011-08-11 Shimadzu Corp 三次元クロマトグラム用データ処理方法及びデータ処理装置
WO2013001618A1 (ja) * 2011-06-29 2013-01-03 株式会社島津製作所 分析データ処理方法及び装置
WO2014108992A1 (ja) * 2013-01-08 2014-07-17 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置
WO2015033397A1 (ja) * 2013-09-04 2015-03-12 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090526A1 (ja) * 2003-03-31 2004-10-21 Medical Proteoscope Co., Ltd. 試料解析方法及び試料解析プログラム
JP2008249440A (ja) * 2007-03-30 2008-10-16 Hitachi High-Technologies Corp クロマトグラフィー質量分析方法、及びクロマトグラフ質量分析装置
JP2009156722A (ja) * 2007-12-27 2009-07-16 Hitachi High-Technologies Corp 質量分析スペクトル分析方法
JP2011153966A (ja) * 2010-01-28 2011-08-11 Shimadzu Corp 三次元クロマトグラム用データ処理方法及びデータ処理装置
WO2013001618A1 (ja) * 2011-06-29 2013-01-03 株式会社島津製作所 分析データ処理方法及び装置
WO2014108992A1 (ja) * 2013-01-08 2014-07-17 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置
WO2015033397A1 (ja) * 2013-09-04 2015-03-12 株式会社島津製作所 クロマトグラフ質量分析用データ処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023004872A (ja) * 2021-06-25 2023-01-17 株式会社島津製作所 クロマトグラフ用データ処理システム
WO2024247575A1 (ja) * 2023-05-30 2024-12-05 株式会社島津製作所 データ処理装置、データ処理方法、データ処理プログラム、およびデータ処理システム

Also Published As

Publication number Publication date
US20200088700A1 (en) 2020-03-19
JP6760400B2 (ja) 2020-09-23
JPWO2018134998A1 (ja) 2019-06-27

Similar Documents

Publication Publication Date Title
JP6760400B2 (ja) クロマトグラムデータ処理装置
EP2728350B1 (en) Method and system for processing analysis data
JP4983451B2 (ja) クロマトグラフ質量分析データ処理装置
US9348787B2 (en) Method and system for processing analysis data
JP6573028B2 (ja) データ処理装置
CN105008908B (zh) 数据处理装置以及数据处理方法
US9989505B2 (en) Mass spectrometry (MS) identification algorithm
WO2018087824A1 (ja) クロマトグラフ質量分析用データ解析装置
JPWO2018134952A1 (ja) 分析データ解析方法および分析データ解析装置
JPWO2020044435A1 (ja) データ解析方法、データ解析装置、及びデータ解析用の学習モデル作成方法
US12163936B2 (en) Methods, mediums, and systems to compare data within and between cohorts
JP7334788B2 (ja) 波形解析方法及び波形解析装置
JP6288313B2 (ja) 質量分析方法、クロマトグラフ質量分析装置、及び質量分析用プログラム
CN119291068A (zh) 筛查待测样品中具有生物蓄积潜力的化合物的方法和装置
Erny et al. Algorithm for comprehensive analysis of datasets from hyphenated high resolution mass spectrometric techniques using single ion profiles and cluster analysis
JP7327431B2 (ja) 質量分析データの解析方法、プログラム及び質量分析データの解析装置
Carlson et al. Extracting homologous series from mass spectrometry data by projection on predefined vectors
US12444481B2 (en) Data-analyzing method, data-analyzing device, and sample analyzer
Cain et al. Comprehensive Two-Dimensional Chromatography with Chemometric Data Analysis
Armstrong et al. PARAFAC2 $\times $ N: Coupled Decomposition of Multi-modal Data with Drift in N Modes
Hyötyläinen et al. Data handling
de Godoy et al. Application of multiway calibration in comprehensive two-dimensional gas chromatography
Wang A two-stage peak alignment
Hoggard Automation of parallel factor analysis (PARAFAC) for peak resolution in GC x GC-TOFMS data

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17893295

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2018562849

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17893295

Country of ref document: EP

Kind code of ref document: A1