[go: up one dir, main page]

JP2009276204A - Method, device, and program for analysis of gene expression - Google Patents

Method, device, and program for analysis of gene expression Download PDF

Info

Publication number
JP2009276204A
JP2009276204A JP2008127666A JP2008127666A JP2009276204A JP 2009276204 A JP2009276204 A JP 2009276204A JP 2008127666 A JP2008127666 A JP 2008127666A JP 2008127666 A JP2008127666 A JP 2008127666A JP 2009276204 A JP2009276204 A JP 2009276204A
Authority
JP
Japan
Prior art keywords
amount
data
nucleic acid
gene expression
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2008127666A
Other languages
Japanese (ja)
Inventor
Takeshi Hamada
雄 浜田
Go Asakawa
剛 浅川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2008127666A priority Critical patent/JP2009276204A/en
Publication of JP2009276204A publication Critical patent/JP2009276204A/en
Abandoned legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

【課題】精度を向上し得る遺伝子発現解析方法、遺伝子発現解析装置及びプログラムを提案する。
【解決手段】複数の核酸プローブごとに、標的細胞から抽出される標的核酸との相補鎖形成量を示すデータを取得し、取得された複数のデータごとに、当該データが示す各相補鎖形成量の総量に占めるアデニン、グアニン、シトシン及びチミンの成分量を算出し、算出された各塩基の成分量から、データ間における比較の基準値を決定する。
【選択図】図13
The present invention proposes a gene expression analysis method, a gene expression analysis apparatus, and a program capable of improving accuracy.
For each of a plurality of nucleic acid probes, data indicating a complementary strand formation amount with a target nucleic acid extracted from a target cell is obtained, and for each of the plurality of acquired data, each complementary strand formation amount indicated by the data is obtained. The component amount of adenine, guanine, cytosine and thymine in the total amount is calculated, and a reference value for comparison between the data is determined from the calculated component amount of each base.
[Selection] Figure 13

Description

本発明は、DNAチップなどのバイオアッセイ用の基盤を用いて得られた遺伝子発現量の規格化、解析又は補正に係る技術分野に属するものである。   The present invention belongs to a technical field related to normalization, analysis or correction of gene expression levels obtained using a bioassay platform such as a DNA chip.

従来、設計された複数のDNAプローブと、サンプル細胞から抽出されたmRNAを逆転写酵素で変換したcDNAとの相補鎖の形成量を蛍光強度により測定し、当該測定結果からサンプル細胞に発現している遺伝子発現量を検出する技術がある。   Conventionally, the amount of complementary strand formation between a plurality of designed DNA probes and cDNA obtained by converting mRNA extracted from a sample cell with reverse transcriptase was measured by fluorescence intensity, and the measurement result was expressed in the sample cell. There is a technique for detecting the gene expression level.

この遺伝子発現量は、抽出対象のサンプル細胞に対する外部ストレスや、該サンプル細胞からmRNAを抽出するときの条件又は技量の相違等の外的要因によって変化するものである。したがって、例えば、同一の組織におけるサンプル細胞について単位時間ごとの遺伝子発現量の相違を調査する場合や、異なる組織におけるサンプル細胞について遺伝子発現量の相違を調査する場合等のように、異なるDNAチップから得られる遺伝子発現量を示すデータを比較する場合、外的要因が同一ではないことから、データ間における遺伝子発現量を規格化することが重要となる。   This gene expression level varies depending on external factors such as external stress on the sample cell to be extracted and differences in conditions or skill when extracting mRNA from the sample cell. Therefore, for example, when investigating a difference in gene expression level per unit time for sample cells in the same tissue, or when investigating a difference in gene expression level for sample cells in different tissues, etc. When comparing the data indicating the gene expression levels obtained, it is important to normalize the gene expression levels between the data because the external factors are not the same.

この規格化手法として、DNAサンプル中に存在する反復配列の数はそのハイブリダイゼーション量と強く相関する一方、ゲノム中には反復配列がほぼ一定の割合で存在するため、DNAサンプル中に存在する反復配列が細胞数とも強く相関することに着目し、細胞数を指標として、取得した遺伝子発現量を、単位細胞数あたりの値に換算することにより、他の遺伝子発現量と比較可能な値に規格化するといったものが提案されている(例えば特許文献1参照)。
特開2006−170670公報
As a standardization technique, the number of repetitive sequences present in a DNA sample strongly correlates with the amount of hybridization, but the repetitive sequences are present in the genome at a substantially constant rate, so that the repetitive sequences present in the DNA sample are present. Focusing on the fact that the sequence strongly correlates with the number of cells, using the number of cells as an index, the obtained gene expression level is converted to a value per unit cell number, so that it can be compared with other gene expression levels. Have been proposed (see, for example, Patent Document 1).
JP 2006-170670 A

ところがかかる規格化手法は、細胞数を得るためのコントロールをDNAチップに固定しなければならない。したがって、この規格化手法では、コントロールの固定を行うまでの過程での環境あるいは手技の違い等の外的要因によって、コントロール自体に変化が生じることもあり、規格化精度の信頼性が乏しいものとなる。   However, in such a standardization method, a control for obtaining the number of cells must be fixed to the DNA chip. Therefore, in this standardization method, the control itself may change due to external factors such as the environment or procedure in the process until the control is fixed, and the reliability of standardization accuracy is poor. Become.

本発明は以上の点を考慮してなされたもので、精度を向上し得る遺伝子発現解析方法、遺伝子発現解析装置及びプログラムを提案しようとするものである。   The present invention has been made in consideration of the above points, and intends to propose a gene expression analysis method, a gene expression analysis apparatus, and a program capable of improving accuracy.

かかる課題を解決するため本発明は、遺伝子発現解析方法であって、標的細胞で発現されるmRNAの量を示すデータを取得する取得ステップと、取得ステップで取得されたデータが示す量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する成分量算出ステップと、成分量算出ステップでデータごとに算出された成分量から、データ間における比較の基準値を決定する比較基準決定ステップとを経るようにする。   In order to solve this problem, the present invention provides a gene expression analysis method, an acquisition step for acquiring data indicating the amount of mRNA expressed in a target cell, and adenine in the amount indicated by the data acquired in the acquisition step And a component amount calculation step for calculating at least one component amount among the component amounts of guanine, cytosine, and thymine or uracil, and the component amount calculated for each data in the component amount calculation step, between the data A comparison reference determination step for determining a reference value for comparison is performed.

また本発明は、遺伝子発現解析装置であって、標的細胞で発現されるmRNAの量を示すデータを取得する取得部と、取得部により取得されたデータが示す量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する成分量算出部と、成分量演算部によりデータごとに算出された成分量から、データ間における比較の基準値を決定する比較基準決定部とを含む構成とする。   Further, the present invention is a gene expression analyzer, an acquisition unit for acquiring data indicating the amount of mRNA expressed in a target cell, adenine in the amount indicated by the data acquired by the acquisition unit, guanine, A component amount calculation unit that calculates at least one of the component amounts of cytosine and thymine or uracil, and a reference value for comparison between the data from the component amounts calculated for each data by the component amount calculation unit It is set as the structure containing the comparison reference | standard determination part to determine.

また本発明は、プログラムであって、取得部に対して、標的細胞で発現されるmRNAの量を示すデータを取得すること、成分量算出部に対して、取得部により取得されたデータが示す量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出すること、比較基準決定分に対して、成分量算出部によりデータごとに算出された成分量から、データ間における比較の基準値を決定することを実行させるようにする。   Moreover, this invention is a program, Comprising: Acquiring the data which shows the quantity of mRNA expressed by a target cell with respect to an acquisition part, The data acquired by the acquisition part with respect to a component amount calculation part show Calculate at least one component amount among the component amounts of adenine, guanine, cytosine, thymine or uracil in the amount, and the component amount calculation unit calculates for each data with respect to the comparison reference determination The determination of the reference value for comparison between the data is performed from the amount of the component.

一般に、細胞は内部においてATP(アデノシン3リン酸)量等の各種物質を一定に保とうとしていることが知られている(ホメオスタシス)。このことから、細胞内で発現する個々の遺伝子の遺伝子発現量は変化しても、該遺伝子発現量の総量としてはおおよそ一定となることが考えられ、このことは本出願人により既に確認された。したがって、標的細胞で発現されるmRNAの量に占める塩基の総成分量は、比較対象のデータ間における比較基準を得るための指標値となる。   In general, it is known that cells try to keep various substances such as the amount of ATP (adenosine triphosphate) in the inside (homeostasis). From this, even if the gene expression level of each gene expressed in the cell changes, the total amount of the gene expression level is considered to be approximately constant, and this has already been confirmed by the present applicant. . Therefore, the total amount of base components in the amount of mRNA expressed in the target cell serves as an index value for obtaining a comparison standard between the data to be compared.

本発明は、標的細胞で発現されるmRNAの量に占める塩基の総成分量を、演算により求めているため、指標値又は基準値を得るためのコントロールがなくても、データ間における比較の基準値を決定することができ、この結果、コントロール自体に起因する基準値の変化を排除できる。かくして精度を向上し得る遺伝子発現解析方法、遺伝子発現解析装置及びプログラムを実現できる。   In the present invention, since the total amount of base components in the amount of mRNA expressed in the target cells is obtained by calculation, a reference for comparison between data even without a control for obtaining an index value or a reference value The value can be determined, and as a result, changes in the reference value due to the control itself can be eliminated. Thus, it is possible to realize a gene expression analysis method, a gene expression analysis apparatus, and a program that can improve accuracy.

以下図面について本発明の一実施の形態を詳述する。   Hereinafter, an embodiment of the present invention will be described in detail with reference to the drawings.

(1)測定システムの全体構成
図1において、本実施の形態による測定システム1の全体構成を示す。この測定システム1は、核酸チップ2x(x=1、2、……、又はj(jは整数))、蛍光強度読取装置3及び遺伝子発現解析装置4によって構成される。これら核酸チップ2x、蛍光強度読取装置3及び遺伝子発現解析装置4に関して順に説明する。
(1) Overall Configuration of Measurement System FIG. 1 shows the overall configuration of the measurement system 1 according to this embodiment. The measurement system 1 includes a nucleic acid chip 2x (x = 1, 2,..., Or j (j is an integer)), a fluorescence intensity reader 3 and a gene expression analyzer 4. The nucleic acid chip 2x, the fluorescence intensity reader 3 and the gene expression analyzer 4 will be described in order.

(2)核酸チップ
核酸チップ2xは、真核生物又は原核生物等の標的(ターゲット)細胞に含まれる全部又は一部の遺伝子に対応する核酸プローブが配置される基盤である。核酸プローブは、特定の遺伝子を検出するための探り針(検出子)として機能する1本鎖のヌクレオチドである。
(2) Nucleic acid chip The nucleic acid chip 2x is a base on which nucleic acid probes corresponding to all or part of genes contained in target cells such as eukaryotes or prokaryotes are arranged. A nucleic acid probe is a single-stranded nucleotide that functions as a probe (detector) for detecting a specific gene.

一般に、核酸プローブは、特定の遺伝子全体と相互作用する塩基配列をもつヌクレオチドではなく、当該遺伝子において特異的とされる塩基配列を含む複数のプローブ断片(以下、これをプローブセットとも呼ぶ)としてデザインされる。具体的には、18〜60[mer]程度のDNA(deoxyribonucleic acid) 断片、cDNA(complementary DNA) 断片又はPNA(peptide nucleic acid)などにデザインされる。   In general, a nucleic acid probe is not a nucleotide having a base sequence that interacts with an entire specific gene, but is designed as a plurality of probe fragments (hereinafter also referred to as a probe set) that contain a base sequence that is specific to the gene. Is done. Specifically, it is designed as a DNA (deoxyribonucleic acid) fragment, cDNA (complementary DNA) fragment or PNA (peptide nucleic acid) of about 18 to 60 [mer].

この実施の形態の場合、核酸チップ2xの配置面には、例えば図2に示すように、測定対象とされる遺伝子数に対応するk個(kは2以上の整数)の領域(図中、破線で囲まれた部分)が割り当てられ、当該領域ごとに、1つのプローブセットと、該プローブセットにおける各プローブ断片に対するコントロール(以下、これを断片コントロールと呼ぶ)とがx行y列に配列される。   In the case of this embodiment, on the arrangement surface of the nucleic acid chip 2x, for example, as shown in FIG. 2, k regions (k is an integer of 2 or more) corresponding to the number of genes to be measured (in the figure, A portion surrounded by a broken line) is assigned, and for each region, one probe set and a control for each probe fragment in the probe set (hereinafter referred to as a fragment control) are arranged in x rows and y columns. The

また核酸チップ2xでは、各領域のプローブセットに対して、標的細胞から抽出された標的核酸が与えられ、当該核酸プローブ(プローブセット)と、標的核酸との相補鎖の形成反応(以下、これをハイブリダイゼーションとも呼ぶ)が行われる。標的核酸は、一般に、mRNAもしくはpre-mRNA又はその断片そのものが用いられるのではなく、該mRNAもしくはpre-mRNA又はその断片を逆転写酵素により変換したものが用いられる。   In the nucleic acid chip 2x, the target nucleic acid extracted from the target cell is given to the probe set in each region, and a complementary strand formation reaction between the nucleic acid probe (probe set) and the target nucleic acid (hereinafter referred to as this). Also referred to as hybridization). In general, mRNA or pre-mRNA or a fragment thereof is not used as the target nucleic acid, but one obtained by converting the mRNA or pre-mRNA or a fragment thereof with a reverse transcriptase is used.

この実施の形態の場合、標的細胞における遺伝子発現量の推移を測定するため、継代した標的細胞から所定時間経過時点で標的核酸が抽出され、各時点の標的核酸は、対応する核酸チップ2x、2、……における各プローブセットに与えられる。また標的核酸には、ハイブリダイゼーション前後に標識物質が付加される。この標識物質には、一般に、ビオチンまたはFITC(fluorescein isothiocyanate)等の蛍光色素が用いられるが、これに限定されるものではなく、例えば放射性同位元素等であってもよい。 In the case of this embodiment, in order to measure the transition of the gene expression level in the target cell, the target nucleic acid is extracted from the passaged target cell at a predetermined time point, and the target nucleic acid at each time point corresponds to the corresponding nucleic acid chip 2x 1. Is given to each probe set at 2 2 ,. Further, a labeling substance is added to the target nucleic acid before and after hybridization. The labeling substance is generally a fluorescent dye such as biotin or FITC (fluorescein isothiocyanate), but is not limited thereto, and may be, for example, a radioisotope.

(3)蛍光強度読取装置
蛍光強度読取装置3(図1)は、遺伝子発現解析装置4から読取要求が与えられた場合、所定の読取位置に配される核酸チップ2xの配置面に対して、標的核酸に付加される標識物質の励起光を照射する。核酸プローブと標的核酸とが相補鎖を形成する場合、標的核酸に付加された標識物質が励起光により発光する。この発光量は、標的核酸との相補鎖の形成量と相関があり、当該標的核酸と核酸プローブとの相補鎖の形成量が多いほど発光量が強くなる。
(3) Fluorescence intensity reading device The fluorescence intensity reading device 3 (FIG. 1) is arranged on the arrangement surface of the nucleic acid chip 2x arranged at a predetermined reading position when a reading request is given from the gene expression analysis device 4. Irradiate the excitation light of the labeling substance added to the target nucleic acid. When the nucleic acid probe and the target nucleic acid form a complementary strand, the labeling substance added to the target nucleic acid emits light by excitation light. The amount of luminescence correlates with the amount of complementary strand formed with the target nucleic acid, and the amount of luminescence increases as the amount of complementary strand formed between the target nucleic acid and the nucleic acid probe increases.

蛍光強度読取装置3は、核酸チップ2xに配置されたプローブセットを単位として、プローブ断片及び断片コントロールでの発光量を読み取り、該読み取った発光量のデータ(以下、これを蛍光強度データと呼ぶ)を遺伝子発現解析装置4に出力するようになされている。   The fluorescence intensity reading device 3 reads the amount of light emitted from the probe fragment and the fragment control in units of probe sets arranged on the nucleic acid chip 2x, and the read light amount data (hereinafter referred to as fluorescence intensity data). Is output to the gene expression analyzer 4.

(4)遺伝子発現解析装置
(4−1)遺伝子発現解析装置の回路構成
遺伝子発現解析装置4は、図3に示すように、この遺伝子発現解析装置4全体の制御を司るCPU(Central Processing Unit)10に対して、遺伝子発現解析処理を実行するためのプログラム(以下、これを遺伝子発現解析プログラムとも呼ぶ)などが格納されるROM(Read Only Memory)11、CPUのワークメモリとなるRAM(Random Access Memory)12、操作部13、記憶部14、インターフェース15及び表示部16をそれぞれバス17を介して接続することにより構成される。
(4) Gene Expression Analyzer (4-1) Circuit Configuration of Gene Expression Analyzer As shown in FIG. 3, the gene expression analyzer 4 is a CPU (Central Processing Unit) that controls the entire gene expression analyzer 4 10, a ROM (Read Only Memory) 11 in which a program for executing gene expression analysis processing (hereinafter also referred to as a gene expression analysis program) is stored, and a RAM (Random Access as a work memory of the CPU) Memory) 12, operation unit 13, storage unit 14, interface 15, and display unit 16 are connected to each other via a bus 17.

CPU10は、ROM11に記憶された遺伝子発現解析プログラムをRAM12に展開した場合、該遺伝子発現解析プログラムに基づいて記憶部14、インターフェース15及び表示部16を適宜制御し、遺伝子発現解析処理を実行するようになされている。   When the gene expression analysis program stored in the ROM 11 is expanded in the RAM 12, the CPU 10 appropriately controls the storage unit 14, the interface 15 and the display unit 16 based on the gene expression analysis program, and executes the gene expression analysis process. Has been made.

(4−2)遺伝子発現解析プログラムに基づくCPUの処理内容
遺伝子発現解析プログラムをRAMに展開したCPU10は、機能的には、図4に示すように、塩基数取得部21、蛍光強度取得部22、発現量演算部23、塩基成分量算出部24、比較基準決定部25、正規化部26及び通知部27の各処理部に分類することができる。
(4-2) Processing Contents of CPU Based on Gene Expression Analysis Program The CPU 10 that has expanded the gene expression analysis program in the RAM functionally has a base number acquisition unit 21 and a fluorescence intensity acquisition unit 22 as shown in FIG. , Expression level calculation unit 23, base component amount calculation unit 24, comparison criterion determination unit 25, normalization unit 26, and notification unit 27.

塩基数取得部21は、操作部13(図3)から、塩基数の入力要求を待ち受け、該入力要求を受けた場合、例えば表示部16(図3)を用いて、核酸チップ2xに配置されるプローブセットごとに、各プローブ断片のアデニン数、グアニン数、シトシン数及びチミン数(以下、これを4塩基数とも呼ぶ)を入力すべきことを要求する。ちなみに、この4塩基数に関する概念図を図5に示す。   The base number acquisition unit 21 waits for an input request for the number of bases from the operation unit 13 (FIG. 3). When the input request is received, the base number acquisition unit 21 is arranged on the nucleic acid chip 2x using, for example, the display unit 16 (FIG. 3). For each probe set, it is required that the number of adenine, guanine, cytosine and thymine (hereinafter also referred to as 4 base numbers) of each probe fragment should be input. Incidentally, the conceptual diagram regarding this 4 base number is shown in FIG.

また塩基数取得部21は、入力要求の応答として、各プローブセットの4塩基数示すデータ(以下、これを4塩基数データとも呼ぶ)が入力された場合、この4塩基数データを記憶部14(図3)に記憶させる。   Further, when data indicating the number of 4 bases of each probe set (hereinafter also referred to as 4 base number data) is input as a response to the input request, the base number acquiring unit 21 stores the 4 base number data in the storage unit 14. (FIG. 3).

蛍光強度取得部22は、操作部13(図3)から、核酸チップ2xに対する蛍光強度の読取要求を待ち受け、該読取要求を受けた場合、インターフェース15(図3)を用いて、該インターフェース15に接続される蛍光強度読取装置3(図1)に対して読取要求する。   The fluorescence intensity acquisition unit 22 waits for a fluorescence intensity reading request for the nucleic acid chip 2x from the operation unit 13 (FIG. 3). When the reading request is received, the interface 15 (FIG. 3) is used to A reading request is made to the connected fluorescence intensity reading device 3 (FIG. 1).

また蛍光強度取得部22は、読取要求の応答として、蛍光強度読取装置3から蛍光強度データを取得した場合、例えば取得日付及び取得番号を、当該核酸チップ2xに関する識別子のデータ(以下、これをチップ識別データと呼ぶ)として生成するようになされている。   Further, when the fluorescence intensity acquisition unit 22 acquires fluorescence intensity data from the fluorescence intensity reader 3 as a response to the reading request, for example, an acquisition date and an acquisition number are used as identifier data (hereinafter referred to as a chip) for the nucleic acid chip 2x. (Referred to as identification data).

発現量演算部23は、蛍光強度取得部22が蛍光強度データを取得した場合、該蛍光強度データに基づいて、プローブセットごとに遺伝子発現量を算出し、該算出した各プローブセットの遺伝子発現量を示すデータ(以下、これを発現量データと呼ぶ)を、当該蛍光強度データの取得元を示すチップ識別データと関連付けて、記憶部14(図3)に保存するようになされている。   When the fluorescence intensity acquisition unit 22 acquires fluorescence intensity data, the expression level calculation unit 23 calculates a gene expression level for each probe set based on the fluorescence intensity data, and the calculated gene expression level of each probe set (Hereinafter referred to as expression level data) is stored in the storage unit 14 (FIG. 3) in association with chip identification data indicating the acquisition source of the fluorescence intensity data.

遺伝子発現量は、標的細胞内において発現している遺伝子を示す推定量であり、標的核酸と核酸プローブとの相補鎖の形成量に相関する発光量を、真の相補鎖の形成量に近づくように統計学的に補正されたものである。   The amount of gene expression is an estimated amount that indicates the gene expressed in the target cell, and the amount of luminescence correlated to the amount of complementary strand formation between the target nucleic acid and nucleic acid probe approaches the amount of true complementary strand formation. Is statistically corrected.

この実施の形態の場合、遺伝子発現量は、Affymetrix社のMAS(Micro Array Suite)と呼ばれるデータ解析ソフトウェアのバージョン5を用いて、発光量の割合として算出される。   In the case of this embodiment, the gene expression level is calculated as a ratio of the luminescence level by using version 5 of data analysis software called MAS (Micro Array Suite) of Affymetrix.

ここで、このMAS5を、1つのプローブセットに着目して簡単に説明する。MAS5では、(1)プローブセットにおける各プローブ断片での発光量から、局所的な物理的影響(バックグランド)が排除される。(2)各プローブ断片(パーフェクトマッチプローブと呼ばれる)の発光量が、当該プローブ断片と対応する断片コントロール(ミスマッチプローブと呼ばれる)との差に応じて適宜補正される。(3)各プローブ断片(パーフェクトマッチプローブと呼ばれる)の発光量が対数変換により遺伝子発現量として算出される。   Here, the MAS 5 will be briefly described by paying attention to one probe set. In MAS5, (1) the local physical influence (background) is excluded from the light emission amount of each probe fragment in the probe set. (2) The light emission amount of each probe fragment (referred to as a perfect match probe) is appropriately corrected according to the difference between the probe fragment and the corresponding fragment control (referred to as a mismatch probe). (3) The amount of luminescence of each probe fragment (referred to as a perfect match probe) is calculated as a gene expression level by logarithmic conversion.

詳細には、I.S.Kohane / A.T.Kho / A.J.Butte 星田有人著、統合ゲノミクスのためのマイクロアレイデータアナリシス、シュプリンガー・ジャパン出版、p.58−74を参照されたい。   For details, see I.S.Kohane / A.T.Kho / A.J.Butte by Yoshi Hoshida, Microarray Data Analysis for Integrated Genomics, Springer Japan Publishing, p. 58-74.

塩基成分量算出部24は、操作部13(図3)から、核酸チップ間における遺伝子発現量の比較解析要求を待ち受け、該比較解析要求を受けた場合、2以上のチップ識別データと、4塩基数データとが記憶部14(図3)に保存されている否かを認識する。   The base component amount calculation unit 24 waits for a comparative analysis request for gene expression levels between nucleic acid chips from the operation unit 13 (FIG. 3), and when receiving the comparative analysis request, two or more chip identification data and four bases Whether the numerical data is stored in the storage unit 14 (FIG. 3) is recognized.

ここで、2以上のチップ識別データが記憶部14に存在しない場合、このことは、2以上の核酸チップ2、2……から未だ蛍光強度データが読み取られていないため、発現量データ間における遺伝子発現量の比較解析ができないことを意味する。また4塩基数データが記憶部14に存在しない場合、このことは、発現量データ間における遺伝子発現量の比較基準を得るために必須となる4塩基数データがないため、遺伝子発現量の比較解析ができないことを意味する。これらの場合、塩基成分量算出部24は、発現量データ間における遺伝子発現量の比較解析ができない旨及びその原因を、例えば表示部16(図3)を介して通知する。 Here, when two or more chip identification data do not exist in the storage unit 14, this means that the fluorescence intensity data has not yet been read from the two or more nucleic acid chips 2 1 , 2 2. It means that comparative analysis of gene expression level cannot be performed. In addition, when the 4-base number data does not exist in the storage unit 14, this means that there is no 4-base number data that is essential for obtaining a reference standard for gene expression levels between the expression level data. Means you can't. In these cases, the base component amount calculation unit 24 notifies, for example, via the display unit 16 (FIG. 3) that the gene expression level cannot be compared and analyzed between the expression level data and the cause thereof.

これに対して、2以上のチップ識別データ及び4塩基数データの双方が記憶部14に存在する場合、塩基成分量算出部24は、該記憶部14に保存される全てのチップ識別データと、該チップ識別データに関連付けられた発現量データと、4塩基数データとを読み出し、これらデータに基づいて、標的細胞において発現している遺伝子に占める塩基成分量を算出する。   On the other hand, when both the two or more chip identification data and the 4-base number data exist in the storage unit 14, the base component amount calculation unit 24 includes all the chip identification data stored in the storage unit 14, The expression level data associated with the chip identification data and the 4-base number data are read out, and based on these data, the base component amount in the gene expressed in the target cell is calculated.

すなわち、塩基成分量算出部24は、記憶部14から読み出したチップ識別データ及び発現量データに基づいて、例えば図6に示すように、核酸チップ2x(各経過時点)ごとに、各プローブセットにおける遺伝子発現量を認識するとともに、4塩基数データに基づいて各プローブセットにおけるアデニン数、グアニン数、シトシン数及びチミン数(図5)を認識する。   That is, the base component amount calculation unit 24, based on the chip identification data and expression level data read from the storage unit 14, for example, in each probe set for each nucleic acid chip 2x (each elapsed time point) as shown in FIG. In addition to recognizing the gene expression level, the number of adenine, guanine, cytosine and thymine (FIG. 5) in each probe set is recognized based on the 4-base number data.

そして塩基成分量算出部24は、図7に示すように、核酸チップ2xごとに、各プローブセットにおける遺伝子発現量と、アデニン数、グアニン数、シトシン数及びチミン数とを乗算する。この乗算結果は、プローブセットでの遺伝子発現量に占める各塩基の成分量を意味する。   Then, as shown in FIG. 7, the base component amount calculation unit 24 multiplies the gene expression level in each probe set by the adenine number, guanine number, cytosine number, and thymine number for each nucleic acid chip 2x. This multiplication result means the amount of each base component in the gene expression level in the probe set.

この後、塩基成分量算出部24は、図8に示すように、核酸チップ2xごとに、乗算結果を同一種類の塩基単位で加算する。この加算結果は、核酸チップ2xにおける各プローブセットの総遺伝子発現量に占める塩基成分量、つまり標的細胞において発現している遺伝子に占める各塩基の塩基成分量を意味する。   Thereafter, as shown in FIG. 8, the base component amount calculation unit 24 adds the multiplication results in units of the same type for each nucleic acid chip 2x. This addition result means the amount of base components in the total gene expression level of each probe set in the nucleic acid chip 2x, that is, the amount of base components of each base in the gene expressed in the target cell.

上述のように、細胞内で発現する個々の遺伝子の遺伝子発現量は変化しても、該遺伝子発現量の総量としてはおおよそ一定となることが考えられ、このことは本出願人により既に確認された。したがって、加算結果(標的細胞において発現している遺伝子に占める各塩基の塩基成分量)は、発現量データ間(核酸チップ間)における遺伝子発現量の比較解析の基準を得るための指標値となる。   As described above, even if the gene expression level of each gene expressed in a cell changes, the total amount of the gene expression level is considered to be approximately constant. This has already been confirmed by the present applicant. It was. Therefore, the addition result (the amount of base components of each base in the gene expressed in the target cell) is an index value for obtaining a reference for comparative analysis of gene expression levels between expression level data (between nucleic acid chips). .

ここで、実験結果を図9〜図11に示す。図9は、結腸癌細胞に対してKLF4(Kruppel Like Factor 4) を刺激として与え続け、所定期間経過(核酸チップ2x)ごとの各塩基の成分量の推移を示したものである。ちなみに、核酸チップは、Affymetrix社におけるGDS1942-HG-U133Aを用い、遺伝子発現量は、Affymetrix社におけるMAS5により算出されたものである。   Here, experimental results are shown in FIGS. FIG. 9 shows the transition of the amount of each base component for a predetermined period of time (nucleic acid chip 2x) while KLF4 (Kruppel Like Factor 4) is continuously applied to the colon cancer cells as a stimulus. Incidentally, as the nucleic acid chip, GDS1942-HG-U133A from Affymetrix was used, and the gene expression level was calculated by MAS5 from Affymetrix.

図10は、乳癌細胞に対して表皮増殖因子(EGF:(Epidermal Growth Factor))を刺激として与え続け、所定期間経過(核酸チップ2x)ごとの各塩基の成分量の推移を示したものである。ちなみに、核酸チップは、Affymetrix社におけるGDS2324-HG-U133Aを用い、遺伝子発現量は、Affymetrix社におけるMAS5により算出されたものである。   FIG. 10 shows the transition of the amount of each base component for a predetermined period of time (nucleic acid chip 2x) by continuously giving epidermal growth factor (EGF) as a stimulus to breast cancer cells. . Incidentally, GDS2324-HG-U133A from Affymetrix is used as the nucleic acid chip, and the gene expression level is calculated by MAS5 from Affymetrix.

図11は、正常卵巣上皮に対してTGFb1を加え、所定期間経過(核酸チップ2x)ごとの各塩基の成分量の推移を示したものである。ちなみに、核酸チップは、Affymetrix社におけるGSE6653-HG-133を用い、遺伝子発現量は、タカラバイオ社におけるRMA(Robust Multichip Analysis) により算出されたものである。   FIG. 11 shows changes in the amount of each base component after a predetermined period of time (nucleic acid chip 2x) when TGFb1 is added to normal ovarian epithelium. Incidentally, GSE6653-HG-133 from Affymetrix was used as the nucleic acid chip, and the gene expression level was calculated by RMA (Robust Multichip Analysis) from Takara Bio.

これら図9〜図11からも明らかなように、各塩基の成分量は、どの経過時間(核酸チップ2x)であってもおおよそ一定になることが分かる。これは、上述したように、生きた細胞で発現される個々の遺伝子の発現量は異なるが、該細胞で発現される各遺伝子の総発現量は一定となるからである。したがって、核酸チップ2xに配置されるプローブセット数が多いほど、いいかえれば、標的細胞において発現され得る総遺伝子に対応するプローブセット数に近づくほど、核酸チップ2xにおける各塩基の成分量は、発現量データ間(核酸チップ間)における遺伝子発現量の比較解析の基準を得るための指標値として、確からしさ(信頼性)が増すこととなる。   As is clear from FIGS. 9 to 11, it can be seen that the component amount of each base is approximately constant regardless of the elapsed time (nucleic acid chip 2x). This is because, as described above, the expression level of each gene expressed in a living cell is different, but the total expression level of each gene expressed in the cell is constant. Therefore, as the number of probe sets arranged on the nucleic acid chip 2x increases, in other words, as the number of probe sets corresponding to the total genes that can be expressed in the target cell approaches, the amount of each base component in the nucleic acid chip 2x becomes the expression level. As an index value for obtaining a reference for comparative analysis of gene expression levels between data (between nucleic acid chips), certainty (reliability) is increased.

比較基準決定部25は、核酸チップ2xにおける総遺伝子発現量に占める各塩基成分量が算出された場合、同種の塩基単位で、発現量データ間(核酸チップ間)における遺伝子発現量の比較解析の基準値を決定する。   When the amount of each base component occupying the total gene expression level in the nucleic acid chip 2x is calculated, the comparison criterion determination unit 25 performs a comparative analysis of the gene expression level between the expression level data (between the nucleic acid chips) in the same type of base unit. Determine the reference value.

この実施の形態の場合、各塩基に対する基準値は、図12に示すように、各核酸チップ2x(各経過時間)における塩基成分量の平均とされる。   In this embodiment, as shown in FIG. 12, the reference value for each base is the average of the amount of base components in each nucleic acid chip 2x (each elapsed time).

正規化部26は、各塩基に対する基準値が算出された場合、同種の塩基単位で、各核酸チップ2x(各経過時間)における塩基成分量と基準値との差(ばらつき度)を算出する。この差が所定の閾値未満となる場合、このことは、局所的な物理的影響(バックグランド)など、遺伝子発現量以外のノイズ要素が小さいことを意味する。   When the reference value for each base is calculated, the normalization unit 26 calculates the difference (variation degree) between the base component amount and the reference value in each nucleic acid chip 2x (each elapsed time) in the same type of base unit. When this difference is less than a predetermined threshold value, this means that noise elements other than the gene expression level, such as local physical influence (background), are small.

正規化部26は、各核酸チップ2x(各経過時間)のうち、各塩基に対する基準値との差がそれぞれ閾値未満となる塩基成分量をもつ核酸チップについて、各塩基の塩基成分量が一定となるように補正した後、各核酸チップ2x(各経過時間)における遺伝子発現量を、所定の表示態様で表示部16に表示させるようになされている。   The normalization unit 26 determines that the base component amount of each base is constant for each nucleic acid chip having a base component amount whose difference from the reference value for each base is less than a threshold value in each nucleic acid chip 2x (each elapsed time). After being corrected, the gene expression level in each nucleic acid chip 2x (each elapsed time) is displayed on the display unit 16 in a predetermined display mode.

この補正では、例えば、基準値との差に応じて重み付けされた補正量で補正する等、所定の統計学的手法が採用される。   In this correction, for example, a predetermined statistical method such as correction with a correction amount weighted according to the difference from the reference value is employed.

通知部27は、各核酸チップ2x(各経過時間)のうち、各塩基に対する基準値との差が1つでも閾値以上未満となる塩基成分量をもつ核酸チップについて、低い信頼性である可能性が高いことと、再実験すべきこととの双方又は一方を、例えば表示部16に表示させて通知するようになされている。   The notification unit 27 may have low reliability with respect to a nucleic acid chip having a base component amount that is less than a threshold value at least even one reference value for each base among the nucleic acid chips 2x (each elapsed time). For example, the display unit 16 is notified of both or one of the high and high values to be re-experimented.

このように、遺伝子発現解析プログラムをRAMに展開したCPU10は、各核酸チップ2x(各経過時間)における総遺伝子発現量のうち、各塩基の塩基成分量それぞれの相対的なばらつきが小さければ、核酸チップ間における遺伝子発現量の比較可能であるとして、当該各塩基の塩基成分量を一定に補正するようになされている。   As described above, the CPU 10 that has expanded the gene expression analysis program in the RAM can reduce the nucleic acid if the relative variation in the amount of each base component of each base out of the total gene expression amount in each nucleic acid chip 2x (each elapsed time) is small. Assuming that gene expression levels can be compared between chips, the base component amount of each base is corrected to be constant.

(4−3)遺伝子発現解析処理手順
上述の遺伝子発現解析処理は、図13に示すフローチャートにしたがって行われる。ただし、この図13は、4塩基データが既に取得された場合の手順を示すものである。
(4-3) Gene Expression Analysis Process Procedure The gene expression analysis process described above is performed according to the flowchart shown in FIG. However, FIG. 13 shows the procedure when 4-base data has already been acquired.

すなわちCPU10は、例えば電源投入時をトリガーとしてこの測定処理を開始し、ステップSP1において、核酸チップ2xでの蛍光強度の取得要求を受けたか否かを判定する。   That is, the CPU 10 starts this measurement process with, for example, power-on as a trigger, and determines whether or not a request for obtaining fluorescence intensity at the nucleic acid chip 2x has been received in step SP1.

ここで、蛍光強度の取得要求を受けた場合、CPU10は、ステップSP2に進んで、蛍光強度読取装置3から与えられる蛍光強度データから遺伝子発現量を示す発現量データを生成し、これをチップ識別データと関連付けて記憶部14に保存し、ステップSP1に戻る。これに対して、蛍光強度の取得要求を受けていない場合、CPU10は、ステップSP3に進んで、発現量の比較解析要求を受けたか否かを判定し、該要求を受けていない場合には、ステップSP1に戻る。   Here, when receiving the fluorescence intensity acquisition request, the CPU 10 proceeds to step SP2 to generate expression amount data indicating the gene expression amount from the fluorescence intensity data given from the fluorescence intensity reader 3, and this is chip-identified. The data is stored in the storage unit 14 in association with the data, and the process returns to step SP1. On the other hand, if the acquisition request for fluorescence intensity has not been received, the CPU 10 proceeds to step SP3 to determine whether or not a request for comparative analysis of the expression level has been received. Return to step SP1.

一方、CPU10は、発現量の比較解析要求を受けた場合には、ステップSP4に進んで、記憶部14に保存されているデータに基づいて、比較要求解析の前提条件を満たすか否かを判定する。   On the other hand, if the CPU 10 receives the expression level comparison analysis request, the CPU 10 proceeds to step SP4 and determines whether or not the comparison request analysis precondition is satisfied based on the data stored in the storage unit 14. To do.

ここで、上述したように、2以上のチップ識別データ及び4塩基数データの双方が記憶部14に存在していない場合、比較要求解析の前提条件を満たしていないことを意味しており、この場合、CPU10は、ステップSP5に進んで、核酸チップ間における遺伝子発現量の比較解析ができない旨及びその原因を通知し、ステップSP1に戻る。   Here, as described above, when both of the two or more chip identification data and the 4-base number data are not present in the storage unit 14, it means that the precondition for the comparison request analysis is not satisfied. In this case, the CPU 10 proceeds to step SP5 to notify that the gene expression level cannot be compared and analyzed between the nucleic acid chips and the cause thereof, and returns to step SP1.

このようにしてCPU10は、比較要求解析の前提条件を満たすまで、各核酸チップ2x(各経過時間)の発現量データを記憶部14に保存するようになされている。   In this manner, the CPU 10 stores the expression level data of each nucleic acid chip 2x (each elapsed time) in the storage unit 14 until the precondition for the comparison request analysis is satisfied.

CPU10は、比較要求解析の前提条件を満たす場合、ステップSP6に進んで、核酸チップ2x(所定の経過時間)ごとに、総遺伝子発現量に占める各塩基の塩基成分量を算出し(図7及び図8)、続くステップSP7において、該算出結果から、各塩基の指標値を算出する(図12)。   When the preconditions for the comparison request analysis are satisfied, the CPU 10 proceeds to step SP6 and calculates the base component amount of each base in the total gene expression amount for each nucleic acid chip 2x (predetermined elapsed time) (FIG. 7 and FIG. 7). 8), in the subsequent step SP7, the index value of each base is calculated from the calculation result (FIG. 12).

またCPU10は、ステップSP8に進んで、同種の塩基単位で、各核酸チップ2x(各経過時間)における塩基成分量と指標値とのばらつき度を算出し、各塩基の指標値とのばらつき度が1つでも閾値以上未満となる塩基成分量をもつ核酸チップがある場合、ステップと9において、その核酸チップについて再実験すべき旨を通知し、ステップSP10に進む。   Further, the CPU 10 proceeds to step SP8 to calculate the degree of variation between the amount of the base component and the index value in each nucleic acid chip 2x (each elapsed time) in the same base unit, and the degree of variation from the index value of each base. If there is at least one nucleic acid chip having a base component amount that is less than or equal to the threshold value, in step and 9, it is notified that the nucleic acid chip should be re-experimented, and the process proceeds to step SP10.

そしてCPU10は、このステップSP10において、各塩基の指標値とのばらつき度がそれぞれ閾値未満となる塩基成分量をもつ核酸チップについて、各塩基の塩基成分量が一定となるように補正し、該補正結果に基づいて、各核酸チップ2x(各経過時間)における遺伝子発現量を所定の表示態様で表示部16に表示させた後に、この測定処理手順を終了する。   Then, in step SP10, the CPU 10 corrects the base component amount of each base so that the base component amount of each base is constant for the nucleic acid chip having the base component amount whose variation from the index value of each base is less than the threshold value. Based on the result, the gene expression level in each nucleic acid chip 2x (each elapsed time) is displayed on the display unit 16 in a predetermined display mode, and then the measurement processing procedure is terminated.

このようにしてCPU10は、測定処理手順を実行し、遺伝子発現量の比較可能である核酸チップについて所定の表示態様で表示部16に表示させることができるようになされている。   In this manner, the CPU 10 can execute the measurement processing procedure and display the nucleic acid chip whose gene expression level can be compared on the display unit 16 in a predetermined display mode.

(5)動作及び効果
以上の構成において、この遺伝子発現解析装置4は、複数の核酸プローブごとに標的核酸との遺伝子発現量を示す複数の発現量データを取得する。そして遺伝子発現解析装置4は、発現量データごとに、当該発現量データが示す各遺伝子発現量の総量に占めるアデニン、グアニン、シトシン、チミンの成分量を算出し(図6〜図8)、該算出した成分量から、発現量データ間における比較の基準値を決定する(図12)。
(5) Operation and Effect In the above configuration, the gene expression analyzer 4 acquires a plurality of expression level data indicating the gene expression level with the target nucleic acid for each of the plurality of nucleic acid probes. Then, the gene expression analyzer 4 calculates the amount of components of adenine, guanine, cytosine, and thymine in the total amount of each gene expression level indicated by the expression level data for each expression level data (FIGS. 6 to 8). A reference value for comparison between the expression level data is determined from the calculated component amount (FIG. 12).

細胞内に存する物質は一定に保とうとすることに起因して、遺伝子発現量の総量としてもおおよそ一定となることから、発現量データが示す遺伝子発現量の総量に占める塩基成分量は、発現量データ間(核酸チップ間)における遺伝子発現量の比較解析の基準を得るための指標値となる。   The amount of base components in the total amount of gene expression indicated by the expression level data is the expression level because the total amount of gene expression level is roughly constant due to the fact that the substances present in the cells are kept constant. This is an index value for obtaining a standard for comparative analysis of gene expression levels between data (between nucleic acid chips).

遺伝子発現解析装置4は、発現量データが示す遺伝子発現量の総量に占める塩基成分量を、演算により求めているので、指標値を得るためのコントロールがなくても、発現量データ間における比較の基準値を決定することが可能となる。   Since the gene expression analyzer 4 calculates the amount of the base component in the total amount of gene expression indicated by the expression level data, even if there is no control for obtaining the index value, comparison between the expression level data is possible. The reference value can be determined.

通常、コントロールは、核酸チップ2xに対しての指標となるものであり、核酸チップ間の指標となるものではない。したがって、異なる実験室で得られた発現量データを比較する場合、実験室単位で異なる条件下であることに起因した差であるのか否かについては分からない。この点、この遺伝子発現解析装置4は、指標値を得るためのコントロールがなくても、発現量データ間における比較の基準値を決定することが可能であることから、異なる実験室で得た発現量データを比較する場合等には特に有用となる。   Usually, the control serves as an index for the nucleic acid chip 2x, and does not serve as an index between the nucleic acid chips. Therefore, when comparing the expression level data obtained in different laboratories, it is not known whether the difference is due to different conditions in each laboratory. In this regard, the gene expression analyzer 4 can determine a reference value for comparison between expression level data without the control for obtaining the index value. This is particularly useful when comparing quantitative data.

ここで、発現量データは、複数の核酸プローブに対する標的核酸との相補鎖形成量がセンサによって物理量(本実施の形態では発光量)として読み取られ、該物理量に対して統計学的手法により変換されたものである。   Here, in the expression level data, the amount of complementary strand formation with a target nucleic acid for a plurality of nucleic acid probes is read as a physical quantity (in this embodiment, the amount of luminescence) by a sensor, and the physical quantity is converted by a statistical method. It is a thing.

この統計学的手法によってバックグラウンド(局所的な物理的影響)等が排除されるので、センサによって読み取られた物理量を示すデータの場合に比して、塩基成分量の算出もととなるデータの信頼性が高い。したがって、この遺伝子発現解析装置4は、物理量を示すデータの場合に比して、発現量データ間における比較の基準値を、標的細胞に対する外部ストレスや、該サンプル細胞からmRNAを抽出するときの条件又は技量の相違等の外的要因のない真値に近いものとして決定することができる。ただし、塩基成分量の算出もととなるデータを、発現量データに代えて物理量を示すデータとしも、発現量データ間における比較の基準値を決定することが可能であり、また上述した有用性はある。   Since this statistical method eliminates background (local physical effects), etc., the data used as the basis for calculating the amount of base components is less than in the case of data indicating physical quantities read by sensors. High reliability. Therefore, the gene expression analysis apparatus 4 uses a reference value for comparison between expression level data as a condition for extracting external stress on a target cell or mRNA from the sample cell, as compared with data indicating a physical quantity. Alternatively, it can be determined as close to a true value without external factors such as a difference in skill. However, it is possible to determine the reference value for comparison between the expression level data, even if the data that is the basis for calculating the amount of the base component is data indicating the physical quantity instead of the expression level data, and it is possible to determine the usefulness described above. There is.

また、塩基成分量は、各核酸プローブと、標的核酸との相補鎖形成量それぞれの総量に占めるものであることから、該核酸プローブ数が多いほど(核酸チップ2xに配置される核酸プローブ数(プローブセット数)が多いほど)よい。一方、上述したように、細胞内に一定で存するATP量に相関をもつ遺伝子発現量の総和は一定となる。したがって、核酸プローブ数を、標的細胞において発現され得る総遺伝子に対応する数とすれば、発現量データが示す遺伝子発現量の総量に占める塩基成分量の信頼性については最も高いものとなる。   In addition, since the base component amount occupies the total amount of each nucleic acid probe and the complementary strand formation amount with the target nucleic acid, the larger the number of nucleic acid probes (the number of nucleic acid probes arranged on the nucleic acid chip 2x ( The higher the number of probe sets), the better. On the other hand, as described above, the total sum of gene expression levels correlated with the amount of ATP existing in cells is constant. Therefore, if the number of nucleic acid probes is the number corresponding to the total gene that can be expressed in the target cell, the reliability of the amount of base component in the total amount of gene expression indicated by the expression level data is the highest.

また、この遺伝子発現解析装置4は、各塩基の成分量のうち、基準値との差が閾値以上となる成分量がある場合、該成分量の算出もとの発現量データについて、再実験すべきことを通知する。したがって、この遺伝子発現解析装置4は、比較対象となる複数の発現量のデータのうち、標的細胞に対する外部ストレスや、該サンプル細胞からmRNAを抽出するときの条件又は技量の相違等の外的要因の大きい発現量データがどれであったかを特定し提示できるため、全ての実験のやり直しを回避できる。また、異なる実験室で得た発現量データを比較する場合等には、外的要因の大きい発現量データを得た実験室を特定することが可能となるため、その実験室での外的要因を究明することができ、この結果、各実験室間の実験精度の向上も可能となる。   In addition, when there is a component amount in which the difference from the reference value is greater than or equal to a threshold value among the component amounts of each base, the gene expression analyzer 4 re-experiments the expression amount data from which the component amount is calculated. Notify what to do. Therefore, this gene expression analysis apparatus 4 uses external factors such as external stress on the target cell and differences in conditions or skill when extracting mRNA from the sample cell among a plurality of expression level data to be compared. Since it is possible to identify and present which expression level data is large, it is possible to avoid redoing all experiments. In addition, when comparing the expression level data obtained in different laboratories, it is possible to specify the laboratory that obtained the expression level data with a large external factor. As a result, it is possible to improve the experimental accuracy between laboratories.

また、この遺伝子発現解析装置4は、各塩基の成分量のうち、基準値との差が閾値未満となる成分量が一定となるように補正する。したがって、この遺伝子発現解析装置4は、測定結果が極端に悪いものを除いて、当該測定に関する手技や環境要因に起因する誤差を省くことができる。   Moreover, this gene expression analyzer 4 correct | amends so that the component quantity from which the difference with a reference value is less than a threshold value among the component quantities of each base may become fixed. Therefore, the gene expression analyzer 4 can eliminate errors due to procedures and environmental factors related to the measurement except for extremely bad measurement results.

以上の構成によれば、複数の核酸プローブごとに標的核酸との遺伝子発現量を示す複数の発現量データを取得し、取得した発現量データごとに、当該発現量データが示す各遺伝子発現量の総量に占めるアデニン、グアニン、シトシン、チミンの成分量を算出し、これら成分量から、発現量データ間における比較の基準値を決定するようにしたことにより、コントロールがなくても、発現量データ間における比較の基準値を決定することが可能となるため、コントロール自体に起因する基準値の変化を排除でき、かくして精度を向上し得る遺伝子発現会席装置4を実現できる。   According to the above configuration, a plurality of expression level data indicating a gene expression level with a target nucleic acid is acquired for each of a plurality of nucleic acid probes, and for each acquired expression level data, each gene expression level indicated by the expression level data is obtained. By calculating the amount of components of adenine, guanine, cytosine, and thymine in the total amount, and by determining the reference value for comparison between the expression amount data from these component amounts, even if there is no control, between the expression amount data Since it is possible to determine the reference value for comparison in the above, it is possible to eliminate the change in the reference value caused by the control itself, and thus to realize the gene expression banquet apparatus 4 that can improve the accuracy.

(6)他の実施の形態
標的細胞で発現されるmRNAの量を示すデータを取得する取得態様として、上述の実施の形態では、核酸チップ2を用いて細胞中の標的核酸の遺伝子発現量を示す発現量データを取得するようにした。しかしながら、取得態様はこの実施の形態に限定されるものではない。例えば、標的細胞で発現される各mRNAを抽出し、これらをリアルタイムPCR(Polymerase Chain Reaction)を用いて、一定量に増殖することにより直接的に取得するといった態様も適用可能である。
(6) Other Embodiments As an acquisition mode for acquiring data indicating the amount of mRNA expressed in the target cell, in the above-described embodiment, the gene expression level of the target nucleic acid in the cell is determined using the nucleic acid chip 2. The expression level data shown was acquired. However, the acquisition mode is not limited to this embodiment. For example, an embodiment in which each mRNA expressed in the target cell is extracted and directly obtained by proliferating to a certain amount using real-time PCR (Polymerase Chain Reaction) is also applicable.

また例えば、mRNAの量を示すデータが格納されるデータ格納媒体から取得するといった態様も適用可能である。この態様を適用した場合、例えば遠方となる複数の実験場所で得られたmRNAの量を示すデータを用いて、当該実験場所で平均的な指標値を算出することが可能となる。   In addition, for example, a mode in which data indicating the amount of mRNA is acquired from a data storage medium is also applicable. When this aspect is applied, for example, it is possible to calculate an average index value at the experimental location using data indicating the amount of mRNA obtained at a plurality of remote experimental locations.

なお、データ格納媒体としては、例えばフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、DVD(Digital Versatile Disc)等のパッケージメディアや、データが一時的若しくは永続的に格納される半導体メモリや磁気ディスク等がある。またこれらデータ格納媒体からデータを取得する方法としては、ローカルエリアネットワークやインターネット、ディジタル衛星放送等の有線又は無線の通信媒体を利用することができる。   Examples of the data storage medium include package media such as a flexible disk, CD-ROM (Compact Disk-Read Only Memory), and DVD (Digital Versatile Disc), a semiconductor memory in which data is temporarily or permanently stored, There are magnetic disks. In addition, as a method for acquiring data from these data storage media, a wired or wireless communication medium such as a local area network, the Internet, or digital satellite broadcasting can be used.

また、読取量として、上述の実施の形態では光学的に発光量を読み取るようにした。しかしながら、読取量はこの実施の形態に限定されるものではない。例えば、電磁学的に電気量又はインピーダンス量等を適用することもできる。要は、所定の物理量を読み取るセンサによって読み取られた読取量を適用することができる。なお、核酸チップ2xとしては、例えば、Affymetorix社製、スタンフォード型等を適用することができ、これら以外のものを適用することもできる。   Further, as the reading amount, in the above-described embodiment, the light emission amount is optically read. However, the reading amount is not limited to this embodiment. For example, an electromagnetic quantity or an impedance quantity can be applied electromagnetically. In short, a reading amount read by a sensor that reads a predetermined physical quantity can be applied. As the nucleic acid chip 2x, for example, a Stanford type manufactured by Affymetorix can be applied, and other than these can also be applied.

また、読取場所として、上述の実施の形態では核酸チップ2xとした。しかしながら、読取場所はこれに限定されるものではない。例えば、組織切片を適用することができ、これ以外の場所も適用することができる。   In addition, the reading place is the nucleic acid chip 2x in the above-described embodiment. However, the reading place is not limited to this. For example, a tissue section can be applied and other locations can also be applied.

また、遺伝子発現量の演算手法として、上述の実施の形態ではMASを適用した。しかしながら、演算手法はこれに限定されるものではない。例えば、RMA等の既知のデータ解析ソフトウェア、その他の新規の演算手法を適用することができる。要は、センサから読み取られた、相補鎖の形成量を示すデータを統計学的手法を用いて補正するものであればよい。   Further, MAS is applied as a method for calculating the gene expression level in the above-described embodiment. However, the calculation method is not limited to this. For example, known data analysis software such as RMA or other new calculation methods can be applied. In short, it is sufficient if data indicating the amount of complementary strand formation read from the sensor is corrected using a statistical method.

また、塩基成分量の算出手法として、上述の実施の形態では核酸プローブと標的核酸との形成量に占めるアデニンと、グアニンと、シトシンと、チミン(核酸プローブがmRNAの場合にはウラシル)との成分量それぞれを算出するようにした。しかしながら、これら成分量のうち少なくとも1以上の成分量を算出していればよい。   In addition, as a method for calculating the amount of base component, in the above-described embodiment, adenine, guanine, cytosine, and thymine (occupying uracil when the nucleic acid probe is mRNA) occupying the formation amount of the nucleic acid probe and the target nucleic acid. Each component amount was calculated. However, it is only necessary to calculate at least one of these component amounts.

ちなみに、例えばアデニンのみの成分量を算出する場合、アデニン以外の塩基の正規化は、グアニンの塩基成分量に対してグアニン数/アデニン数を乗算したもの、シトシンの塩基成分量に対してシトシン数/アデニン数を乗算したものが補正対象となる。またチミン(ウラシル)の塩基成分量に対してチミン(ウラシル)数/アデニン数を乗算したもの補正対象となる。このようにすれば上述の実施の形態の場合と同様の効果を得ることができる。もっとも、この補正以外の手法により補正するようにしてもよい。   Incidentally, for example, when calculating the component amount of only adenine, normalization of bases other than adenine is obtained by multiplying the base component amount of guanine by the guanine number / adenine number, and the cytosine number with respect to the base component amount of cytosine. / Adenine number multiplied is the correction target. Also, the amount of base component of thymine (uracil) multiplied by the number of thymine (uracil) / adenine is to be corrected. In this way, the same effect as in the case of the above-described embodiment can be obtained. But you may make it correct | amend by methods other than this correction | amendment.

また、指標値の算出手法として、上述の実施の形態では各核酸チップ2x(各経過時間)における塩基成分量の平均とした。しかしながら、指標値の算出手法この実施の形態に限定されるものではない。例えば、各核酸チップ2x(各経過時間)における塩基成分量の最大値、もしくは最小値又はこれらの中間値等を適用することができる。   In addition, as a method for calculating the index value, in the above-described embodiment, the average amount of base components in each nucleic acid chip 2x (each elapsed time) is used. However, the index value calculation method is not limited to this embodiment. For example, the maximum value, the minimum value, or the intermediate value of the base component amount in each nucleic acid chip 2x (each elapsed time) can be applied.

また、指標値の算出対象として、上述の実施の形態では同一の細胞としたが、異種の細胞としてもよい。異種の細胞における指標値を算出するには、異種の細胞における標的核酸と核酸プローブとの形成量に占める各塩基の成分量に対して、異種細胞間の遺伝子総数の比を乗算すればよい。異種細胞間の遺伝子総数は、例えば、細胞の種と、該種における遺伝子の総数との対応付けを核酸チップの種(型)ごとにサーバーにアップロードし、該サーバーから取得するといった形態が考えられる。   In addition, the calculation target of the index value is the same cell in the above-described embodiment, but it may be a heterogeneous cell. In order to calculate the index value in a heterogeneous cell, the component amount of each base occupying the amount of target nucleic acid and nucleic acid probe formed in the heterologous cell may be multiplied by the ratio of the total number of genes between the different cells. The total number of genes between different types of cells can be obtained, for example, by uploading the association between the cell species and the total number of genes in the species to the server for each species (type) of the nucleic acid chip, and obtaining from the server. .

また、各プローブセットの4塩基数の取得手法として、上述の実施の形態では操作部13から入力されたものを取得するようにした。しかしながら、取得手法はこの実施の形態に限定されるものではない。例えば、核酸チップに配置されるプローブセットと、そのプローブセットでの4塩基数との組み合わせを、核酸チップの種(型)ごとにサーバーにアップロードしておき、該サーバーから、有線又は無線の通信媒体を用いて選択し取得するといった態様を適用することが可能である。   In addition, as a method for acquiring the number of four bases of each probe set, the one input from the operation unit 13 is acquired in the above embodiment. However, the acquisition method is not limited to this embodiment. For example, a combination of a probe set arranged on a nucleic acid chip and the number of four bases in the probe set is uploaded to a server for each type (type) of nucleic acid chip, and wired or wireless communication is performed from the server. It is possible to apply a mode of selecting and acquiring using a medium.

本発明は、遺伝子実験、医薬の創製又は患者の経過観察などのバイオ産業上において利用可能である。   The present invention can be used in the bio-industry such as genetic experiments, creation of medicines, or patient follow-up.

本実施の形態による測定システムの全体構成を示す略線図である。It is a basic diagram which shows the whole structure of the measurement system by this Embodiment. プローブセットとコントロールの固定の説明に供する略線図である。It is a basic diagram with which it uses for description of fixation of a probe set and a control. 遺伝子発現解析装置の回路構成を示すブロック図である。It is a block diagram which shows the circuit structure of a gene expression analyzer. 遺伝子発現解析処理モード時のCPUの機能的構成を示すブロック図である。It is a block diagram which shows the functional structure of CPU at the time of gene expression analysis processing mode. プローブセットにおける4塩基数の説明に供する略線図である。It is a basic diagram with which it uses for description of 4 base number in a probe set. 各核酸チップにおけるプローブセットの発現量の説明に供する略線図である。It is a basic diagram with which it uses for description of the expression level of the probe set in each nucleic acid chip. プローブセットにおける塩基成分量の算出の説明に供する略線図である。It is a basic diagram with which it uses for description of calculation of the amount of base components in a probe set. 各核酸チップにおける塩基成分量の算出の説明に供する略線図である。It is a basic diagram with which it uses for description of calculation of the amount of base components in each nucleic acid chip. 実験結果(1)を示すグラフである。It is a graph which shows an experimental result (1). 実験結果(2)を示すグラフである。It is a graph which shows an experimental result (2). 実験結果(3)を示すグラフである。It is a graph which shows an experimental result (3). 各塩基に対する基準値の算出の説明に供する略線図である。It is a basic diagram with which it uses for description of calculation of the reference value with respect to each base. 遺伝子発現解析処理手順を示すフローチャートである。It is a flowchart which shows a gene expression analysis processing procedure.

符号の説明Explanation of symbols

1……測定システム、2x……核酸チップ、3……蛍光強度読取装置、4……遺伝子発現解析装置、10……CPU、11……ROM、12……RAM、13……操作部、14……記憶部、15……インターフェイス、16……表示部、21……塩基数取得部、22……蛍光強度取得部、23……発現量演算部、24……塩基成分量算出部、25……比較基準決定部、26……正規化部、27……通知部。   DESCRIPTION OF SYMBOLS 1 ... Measuring system, 2x ... Nucleic acid chip, 3 ... Fluorescence intensity reader, 4 ... Gene expression analyzer, 10 ... CPU, 11 ... ROM, 12 ... RAM, 13 ... Operation part, 14 ...... Storage unit, 15 ... Interface, 16 ... Display unit, 21 ... Base number acquisition unit, 22 ... Fluorescence intensity acquisition unit, 23 ... Expression amount calculation unit, 24 ... Base component amount calculation unit, 25 …… Comparison criteria determination unit, 26 …… Normalization unit, 27 …… Notification unit.

Claims (11)

標的細胞で発現されるmRNAの量を示すデータを取得する取得ステップと、
上記取得ステップで取得されたデータが示す量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する成分量算出ステップと、
上記成分量算出ステップでデータごとに算出された成分量から、データ間における比較の基準値を決定する比較基準決定ステップと
を有する遺伝子発現解析方法。
An acquisition step of acquiring data indicating the amount of mRNA expressed in the target cell;
A component amount calculating step for calculating at least one component amount among the component amounts of adenine, guanine, cytosine, and thymine or uracil in the amount indicated by the data acquired in the acquisition step;
A gene expression analysis method comprising: a comparison reference determination step for determining a reference value for comparison between data from the component amount calculated for each data in the component amount calculation step.
上記取得ステップでは、
複数の核酸プローブごとに、標的細胞から抽出される標的核酸との相補鎖形成量を示すデータを取得し、
上記成分量算出ステップでは、
上記取得ステップで取得された複数のデータごとに、当該データが示す各相補鎖形成量の総量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する、請求項1に記載の遺伝子発現解析方法。
In the above acquisition step,
For each of the plurality of nucleic acid probes, obtain data indicating the amount of complementary strand formation with the target nucleic acid extracted from the target cell,
In the component amount calculating step,
For each of a plurality of data acquired in the acquisition step, at least one component amount of the component amounts of adenine, guanine, cytosine, and thymine or uracil occupying the total amount of each complementary strand formation indicated by the data The gene expression analysis method according to claim 1, wherein
標的細胞で発現されるmRNAの量を示すデータを取得する取得部と、
上記取得部により取得されたデータが示す量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する成分量算出部と、
上記成分量演算部によりデータごとに算出された成分量から、データ間における比較の基準値を決定する比較基準決定部と
を有する遺伝子発現解析装置。
An acquisition unit for acquiring data indicating the amount of mRNA expressed in the target cell;
A component amount calculation unit that calculates at least one component amount among the component amounts of adenine, guanine, cytosine, and thymine or uracil in the amount indicated by the data acquired by the acquisition unit;
A gene expression analysis apparatus comprising: a comparison reference determination unit that determines a reference value for comparison between data from the component amount calculated for each data by the component amount calculation unit.
上記取得部は、
複数の核酸プローブごとに、標的細胞から抽出される標的核酸との相補鎖形成量を示すデータを取得し、
上記比較基準決定部は、
上記取得部により取得された複数のデータごとに、当該データが示す各相補鎖形成量の総量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する、請求項3に記載の遺伝子発現解析装置。
The acquisition unit
For each of the plurality of nucleic acid probes, obtain data indicating the amount of complementary strand formation with the target nucleic acid extracted from the target cell,
The comparison criterion determination unit
For each of a plurality of data acquired by the acquisition unit, at least one component amount of the component amounts of adenine, guanine, cytosine, and thymine or uracil occupying the total amount of each complementary strand formation indicated by the data The gene expression analysis apparatus according to claim 3, wherein
上記複数の核酸プローブは、標的細胞で発現し得る全遺伝子に対応したプローブを有する、請求項4に記載の遺伝子発現解析装置。   The gene expression analysis apparatus according to claim 4, wherein the plurality of nucleic acid probes have probes corresponding to all genes that can be expressed in a target cell. 上記成分量算出部によりデータごとに算出された成分量のうち、上記比較基準決定部により決定された基準値との差が閾値以上となる成分量がある場合、該成分量の算出もとのデータについて、再実験すべきことを通知する通知部
を有する請求項4に記載の遺伝子発現解析装置。
Among the component amounts calculated for each piece of data by the component amount calculation unit, when there is a component amount whose difference from the reference value determined by the comparison reference determination unit is equal to or greater than a threshold, the calculation source of the component amount The gene expression analysis apparatus according to claim 4, further comprising a notification unit that notifies that data should be re-experimented.
上記成分量算出部は、
上記複数の核酸プローブにおけるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの塩基数のうち少なくとも1以上の塩基数を取得する塩基数取得部と、
上記複数のデータごとに、当該データが示す各相補鎖形成量と、上記塩基数取得部により取得された塩基数とを乗算し、各乗算値を加算する演算部と
を有する請求項4に記載の遺伝子発現解析装置。
The component amount calculation unit
A base number acquisition unit that acquires at least one base number among the base numbers of adenine, guanine, cytosine, and thymine or uracil in the plurality of nucleic acid probes;
The arithmetic unit that multiplies each of the plurality of data by each complementary strand formation amount indicated by the data and the number of bases acquired by the base number acquisition unit, and adds each multiplication value. Gene expression analyzer.
上記成分量算出部によりデータごとに算出された成分量のうち、上記比較基準決定部により決定された基準値との差が閾値未満となる成分量が一定となるように補正する正規化部
を有する請求項4に記載の遺伝子発現解析装置。
A normalization unit that corrects the component amount calculated for each piece of data by the component amount calculation unit so that the component amount whose difference from the reference value determined by the comparison reference determination unit is less than a threshold value is constant. The gene expression analyzer according to claim 4.
上記データは、
複数の核酸プローブごとに、上記標的核酸との相補鎖形成量がセンサによって読み取られ、該読み取られた物理量に対して、上記相補鎖形成量に近づくように統計学的に変換されたものである、請求項4に記載の遺伝子発現解析装置。
The above data is
For each of a plurality of nucleic acid probes, the amount of complementary strand formation with the target nucleic acid is read by a sensor, and the read physical quantity is statistically converted so as to approach the amount of complementary strand formation. The gene expression analysis apparatus according to claim 4.
取得部に対して、標的細胞で発現されるmRNAの量を示すデータを取得すること、
成分量算出部に対して、上記取得部により取得されたデータが示す量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出すること、
比較基準決定分に対して、上記成分量算出部によりデータごとに算出された成分量から、データ間における比較の基準値を決定すること
を実行させるプログラム。
Acquiring the data indicating the amount of mRNA expressed in the target cell to the acquisition unit,
Calculating at least one component amount among the component amounts of adenine, guanine, cytosine, and thymine or uracil in the amount indicated by the data acquired by the acquisition unit for the component amount calculation unit;
A program for executing a determination of a reference value for comparison between data from a component amount calculated for each piece of data by the component amount calculation unit with respect to a comparison reference determination part.
上記取得部に対して、複数の核酸プローブごとに、標的細胞から抽出される標的核酸との相補鎖形成量を示すデータを取得すること、
上記成分量算出部に対して、上記取得部により取得された複数のデータごとに、当該データが示す各相補鎖形成量の総量に占めるアデニンと、グアニンと、シトシンと、チミンもしくはウラシルとの成分量のうち少なくとも1以上の成分量を算出する、請求項10に記載のプログラム。
For the acquisition unit, for each of a plurality of nucleic acid probes, acquiring data indicating the amount of complementary strand formation with the target nucleic acid extracted from the target cell,
A component of adenine, guanine, cytosine, and thymine or uracil occupying the total amount of complementary strand formation indicated by the data for each of a plurality of data acquired by the acquisition unit with respect to the component amount calculation unit The program according to claim 10, wherein at least one component amount among the amounts is calculated.
JP2008127666A 2008-05-14 2008-05-14 Method, device, and program for analysis of gene expression Abandoned JP2009276204A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008127666A JP2009276204A (en) 2008-05-14 2008-05-14 Method, device, and program for analysis of gene expression

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008127666A JP2009276204A (en) 2008-05-14 2008-05-14 Method, device, and program for analysis of gene expression

Publications (1)

Publication Number Publication Date
JP2009276204A true JP2009276204A (en) 2009-11-26

Family

ID=41441773

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008127666A Abandoned JP2009276204A (en) 2008-05-14 2008-05-14 Method, device, and program for analysis of gene expression

Country Status (1)

Country Link
JP (1) JP2009276204A (en)

Similar Documents

Publication Publication Date Title
JP7115779B2 (en) Methods and uses thereof for standardized sequencing of nucleic acids
US20080209978A1 (en) System and Method for Instrument Calibration
JP6463332B2 (en) Calibration method, apparatus and computer program product
CN112823392B (en) Methods and systems for assessing microsatellite instability status
US20230193379A1 (en) Calibration panels and methods for designing the same
JP2016047046A (en) Analysis method and system for analyzing nucleic acid amplification reaction
CN107075578B (en) Method and device for comparative analysis of miRNA expression levels
US9926597B2 (en) Control nucleic acid sequences for use in sequencing-by-synthesis and methods for designing the same
JP2009276204A (en) Method, device, and program for analysis of gene expression
JP4650702B2 (en) Gene classification method, gene classification program, and gene classification apparatus
US20150347674A1 (en) System and method for analyzing biological sample
JP4666237B2 (en) GENE TEST METHOD, GENE TEST PROGRAM, AND GENE TEST DEVICE
JP5787517B2 (en) System and method for determining the amount of starting reagent using polymerase chain reaction
JP4487218B2 (en) Gene expression level analysis method, gene expression level analysis program, and gene expression level analysis apparatus
JP2010046011A (en) Method, program and apparatus for normalizing gene expression amount
JP4266575B2 (en) Gene expression data processing method and processing program
JP2010113413A (en) Apparatus, method and program for analyzing gene control network
Held et al. Comparison of Amersham and Agilent microarray technologies through quantitative noise analysis
WO2006030822A1 (en) Gene expression data processing method and processing program
JP2023057038A (en) Method, device, and program for processing data on gene expression level
JP4619639B2 (en) Method for determining grain variety and calculating the mixing rate
KR20070086142A (en) Gene Expression Standardization Methods, Programs and Systems
CN114787382A (en) Method and device for determining the copy number of a DNA sequence contained in a fluid
US20080108510A1 (en) Method for estimating error from a small number of expression samples
JP2006010391A (en) Manufacturing method of specimen for organism-related substance, and testing device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110502

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20130213