明細書
デイジイタルハイブリダイゼ一シヨンスクリ一二ング 技術分野
本発明は、大量の検体を効率的にスクリーニングする方法に関する。詳細には、
A群の検体と B群の検体が、 物質間の相互作用を持つときに、 その対応関係を効 率的に見出すための方法に関する。 例えば本発明の方法は、 特にゲノム構造解析 等に有用である。
背景技術
現在のゲノム構造解析研究は、 様々な手法でゲノムの地図を作成しながら断片 化された多数のゲノム DNAの位置決め (整列化) を行い染色体 DNAの構造を再構 築する 「ゲノムマッピング」 と、 整列化された DNA断片の塩基配列を決定してゲ ノムの塩基配列を解明する 「シークェンシング」 とに分けることができる。 本発 明は特にゲノムマッピングに有用である。
従来、 A群の検体と B群の検体が、 物質間の相互作用を持つときに、 その対応 関係を見出すには、 A群の中から 1つずつ検体を順に取り出し、 それぞれに対し て B群の検体それぞれが対応するかどうかを検定しなければならなかった。 従つ て、 A群が m個の検体、 B群が n個の検体より成る場合、 (m個) x ( n個) 回 のスクリーニングが必要であつた。
このような従来のスク リ一ニング法の具体的な例としては、 例えば、 STS( Sequence Tagged Site)マーカー ( A群) を BAC ( Bacterial Artificial Chromosome) クローン (B群) に対応づける方法を挙げることができる。 STS は ヒトゲノムに系統的に目印をつけるための概念である(Olson M. et al. , Science 245 : 1434-1435, 1989 ) o STSは 200- 300bp程度の短い塩基配列で、 同じ配列がゲノ ムのほかの場所には見つからないものである。 複数のクローンに同じ STSが含ま れていれば、 それらのクローンは重複した領域を持つことがわかる。 STS に対し て設計されたプライマ一を使い、 ゲノム DNAを錡型として PCRを行えば STSに対
応した長さの増幅生成物が単一のバンドとして確認できる (S. B. Primrose, "Principles of Genome Analysis" Blackwell Science Ltd. 199o 0 STS マ一力 ― ( A群) と BACクローン (B群) の組み合わせにおいては、 STSマ一力一 1つ 1つと BACクローンとをそれぞれ PCRスクリーニングあるいはハイブリダィゼー シヨンスクリーニングによって、 STSマーカーに対応する BACクローンを見出す 方法が取られていた。
STS を使って物理地図を作成する方法は、 多くの研究者によって限られた範囲 で利用されている。 30の YACクローンでカバーされた 7番染色体の嚢胞性繊維症 の病因遺伝子領域が 1.5Mb以上の長さを持つ 1つの整列化クローンに統合された (Green & Olson, Science 250, 94- 98, 1990)。 Footeらはヒト Y染色体のュ一クロ マチン領域の 98%以上をカバ一する 196のクローンを整列させた(Foote et al ., Science 258, 60-66, 1992)。 物理地図と遺伝地図の両方を整合させた 21番染色体 長腕の YAC-STS整合地図も作成されている(Chumakov et al ., Nature 359, 380- 387, 1992)。
一方、 現在では BACライブラリ一や PAC(P1- derived artificial chromosome) ライブラリーを STSマーカ一プローブと組み合わせれば、 ヒトゲノムの大部分を カバーすることも可能である。 ところが、 このような規模の大きなライブラリ一 に対して多数の STSの対応を見出すための効率的な方法は知られていない。
従来のこれらの方法では、 A群の検体数および B群の検体数が増すと、 その対 応を見出すためのスクリーニングの回数が幾何級数的に増大するので、 膨大な時 間と労力を必要とするという問題があつた。
例えばゲノムマヅプの作成等においては、 一般的に DNAラィブラリ一のスクリ —ニングにはフィル夕一ハイブリダイゼーションの何回もの繰り返し、 あるいは 特有のライブラリ一に対する一連の P C R分析(Asakawa et al . , Gene 191 :69- 79, 1997)を必要とする。 したがってヒトゲノム全体をカバ一するライブラリー酉己 列を決定するためには膨大な組み合わせについてスクリーニングを実施しなけれ
ばならない。
ところでゲノム解析においては、 DNAチップの利用により迅速なスクリ一ニン グが可能となるのではないかと期待されている。 DNAチップ上には任意の塩基配 列を持つオリゴヌクレオチドを高密度に集積できることから、 1回のハイプリダ ィゼ一シヨンによつて多数の組み合わせについてハイブリダィゼ一シヨンアツセ ィを実施することができる。 実際に MAチップを利用して 256種の STSマ一力一 を酵母コスミ ドクローンに対してマッピングした報告も有る(Sapolsky R.J. et al ., Genomics 33, 445-456, 1996 ) o しかしながら従来のアプローチにしたがえば、 DNAチップを利用したとしても想定される全ての組み合わせについて対応関係を 確認しなければならないことにかわりは無い。 つまり、 多数の組み合わせについ て効率的に対応関係を見出すことができる新たな原理を与えるものではない。 発明の開示
本発明者らは、 混合した検体を利用することによって、 検体間の相互作用の検 出作業を軽減することができるのではないかと考えた。 当然のことながら、 無秩 序に混合したのでは最終的に検体間の相互作用に基づいた対応関係を明らかにす ることはできない。 本発明者らは、 2 進法に基づいて A群の検体を規則的に混合 し、 この混合物を用いて B群の検体との間で相互作用を確認することで、 従来の 方法よりもはるかに効率的に両者の関係を確認することができることを見出し本 発明を完成した。
本発明は、 A群に属する検体 (A i ) が、 B群に属する検体と (B j ) と物質 間の相互作用に基づく対応関係にあるときに、 次の方法によりその対応関係を効 率的に見い出そうとするものである。 すなわち本発明は、 以下の方法に関する。 〔1〕 以下の工程を含む、 A群と B群の各群を構成する検体の中から検体間で、 物理的、 化学的または生物的な対応関係を有する組み合わせを決定する方 法。
( 1 ) m個 (2n— i ^ m ^Z11- 1、 mと nは、 m 3、 n≥2の自然数) の A群の検
体 Ai (3≤ i≤m), および x個 (xは自然数) の B群の検体 B j (1 ≤ j≤x) を用意し、
(2) A群の検体 A iそれぞれを g桁 (n≤g) の 2進法によって番号付けし、
(3) 2進法で表した番号の 1桁目が 1である A群の検体 Aiを混合して混合物 C 1とし、 同様にして k桁目 ( 1≤k≤g) が 1である A群の検体 Aiを 混合して混合物 Ckとし、 混合物 C 1から混合物 Cgの g種類からなる混 合物を得、
(4) g種類の混合物 C 1から Cgのそれぞれについて、 B群の検体 Bjとの検 体間の相互作用を検出し、
(5)混合物 C 1から Cgを構成する各混合物について、 B群の検体 Bjと相互 作用が検出された場合に 1を、 検出されなかった場合に 0を与えることに よって、 k桁目を 1または 0とする g桁の 2進数を決定し、
(6) で得た 2進数に対応する A群の検体 A iを照合することにより、 A群の検 体 A iと B群の検体 B iの対応関係を決定する。
〔2〕 検体間の対応関係が、 A群と B群の各群を構成する検体間における相互 作用を伴う 〔1〕 の方法。
〔3〕 A群の検体と B群の検体との、 検体間の相互作用に基づく対応関係が、
1 : 1もしくは 1 :多である 〔2〕 の方法。
〔4〕 g = nである 〔1〕 の方法。
〔5〕 A群検体に 2 n— 1までの検体固有の番号を与える 〔4〕 の方法。
〔6〕 更に付加的に、 A群の検体すベてを混合して得た混合物 C aと、 B群の 検体 B jとの相互作用を検出する工程を含む 〔1〕 から 〔5〕 のいずれか の方法。
〔7〕 1つの A群の検体に 2シリーズ以上の番号付けを行い、 各シリーズにつ いて 〔1〕 の方法を繰り返す工程を含む、 A群と B群の各群を構成する検 体の中から検体間で、 物理的、 化学的または生物的な対応関係を有する組
み合わせを決定する方法。
〔8〕 A群の検体がオリ ドであり、 B群の検体が DNAである 〔1〕 から 〔7〕 のいずれかの方法。
〔9〕 A群の検体として STS マーカーを、 B群の検体としてゲノムライブラリ 一を用い 〔8〕 の方法を実施することを含む STSマッピング方法。 本発明の原理は以下のとおりである。
( 1 ) まず m個 (2
n—
mと nは、 m≥3 n≥2の自然数) の A群 の検体 A i ( 3≤ i≤m), および x個 (xは自然数) の B群の検体 B j
( 1≤ j≤x ) を用意し、
( 2 ) A群の検体 A iそれぞれに 2進法によって番号付けする。
1 0進法に基づく番号を 2進法に変換することによって番号を付与すれば、 た とえば表 1 ( p q r P Qおよび Rは 0または 1 ) に示したような規則性 に基づいて番号付けが行われる。 各検体に固有の番号を与えるとすれば、 2 n— 1 の番号が必要であり、 それを構成する桁数は n桁である。 以下、 このとき A群の 各検体に与えられた番号を I D番号と呼ぶこともある。
表 1
続いて以下の工程 (3 ) により A群の検体を混合した混合物を作成する。 ( 3 ) 2 進法で表した番号の 1桁目が 1である A群の検体 A iを混合して混合物 C 1とし、 同様にして k桁目が 1である A群の検体 A iを混合して混合物
Ck ( 1≤k≤n) とし、 混合物 C 1から混合物 Cnの n種類からなる混 合物を得る。
このときの混合物の作成基準を表 2として示した。 表 2中、 Cn— C 1が混合 物で、 各混合物に対して A群の各検体を加える場合に 1を、 加えない場合を 0で 示した。
表 2
得られた混合物を利用し、 以下の工程 (4) - (5) を実施することによつ て A群の検体を特定することができる 2進数を決定する。
(4) n種類の混合物 C 1から Cnのそれぞれについて、 B群の検体 B jとの検 体間の相互作用を検出し、
(5)混合物 C 1から Cnを構成する各混合物 Ckについて、 B群の検体 Bjと 相互作用が検出された場合に 1を、 検出されなかった場合に 0を与えるこ とによって、 k桁目を 1または 0とする n桁の 2進数を決定する。
2進数の決定手順を表 3にまとめた。 表 3は、 B群を構成する各検体について、 混合物 Cn— C 1に対する検出結果が、 相互作用の有る場合を 1、 無い場合を 0 として示したものである。 この表に基づいて、 B群のある特定の検体に対応する 各 A群検体混合物 C nの相互作用の検出結果として n桁目の数値を得ることがで きる。
表 3
そして最終的に、 以下の工程 (6 ) により、 B群のある特定の検体に対応する A 群の検体を特定することができる。
( 6 ) ( 5 )で得た 2進数に対応する A群の検体 A iを照合することにより、 A群 の検体 A iと B群の検体 B iの対応関係を決定する。
本発明において、 A群と B群の各群を構成する検体間における、 物理的、 化学 的または生物的な対応関係とは、 両者が物理的、 化学的、 あるいは生物的な反応 により相互作用する関係を意味している。 この反応は、 特定の検体間においての み検出することができる特異的な反応であることが望ましい。 また A群の検体と B群の検体が相互作用を持つ対応関係にあることとは、 A群の検体と B群の検体 が何らかの対応関係にあり、 それが検体間の相互作用を検出することによって見 出すことが可能であることを意味する。 検体間の相互作用には、 たとえば特異的 な親和性に基づく結合反応を挙げることができる。 結合反応としては、 具体的に は核酸のハイブリダィゼーシヨン、 抗原—抗体反応、 各種のリガンドーレセプ夕 一間の反応、 あるいは酵素一基質間の反応等を示すことができる。
この他、 単に物質間の結合のみならず、 シグナルの伝達を伴った機能的な組み 合わせであることもできる。 機能的な組み合わせの例としては、 転写調節領域へ の転写制御因子の結合や、 膜受容体へのァゴニスト化合物の結合に伴って転写の 開始やシグナル伝達がトリガ一される反応等を示すことができる。 なお本発明に おける両者の対応関係は、 1 : 1に限定されない。 例えば図 1で示したような、
1 :多の対応関係であることもできる。 本発明においては、 好ましくは A群に属
する検体と B群に属する検体との対応関係が 1 :多もしくは 1 : 1に近いものが 望ましい。 しかしながら、 たとえば後に述べるような方法によれば、 多: 1の関 係にある場合であっても本発明を利用して対応関係を正確に見出すことは可能で ある。
本発明の方法は、 A群に属する検体 (A i ) と、 B群に属する検体 ( B j ) と の間の相互作用を検出することが可能であれば、 どのような組み合わせであつて も応用することができる。 ただし、 A群の検体を混合して用いる必要があること から、 A群に属する検体の混合によって B群の検体との相互作用が検出できなく なることは避けなければならない。 本発明は、 2つの群の間で対応関係を見出す 必要があるときに利用することができる。 この対応関係が物質間の相互作用に基 づいて検出することができればより好適である。具体的には、例えばゲノム分析、 ハイスループットスクリーニング、 コンビナトリアルケミストリー等の検体の数 が多いときに特に有用である。
たとえば、 A群としてオリゴヌクレオチドマ一力一(例えば STSマーカ一、 VNTR、 RFLP、 マイクロサテライ ト等のマ一力一) を、 そして B群として DNAライブラリ 一のクローン (例えば BAC、 PAC、 Pl、 YAC、 コスミ ド等のゲノムライブラリ一の クローン) を用いることができる。 また、 多数の転写調節因子やそのアナログを 用いた遺伝子へのバインディングアツセィ、 蛋白質と結合蛋白、 抗原と抗体、 酵 素と基質等にも用いられる。さらに cDNAや ESTのゲノムへのマヅピング等にも禾 ij 用できる。 中でも膨大なスクリーニングが必要とされ、 しかも本発明における望 ましい対応関係 (すなわち 1 : 1、 あるいは 1 :多) であることが期待できるゲ ノム分析への応用は、本発明の有用な利用分野である。ゲノム分析に用いる場合、 特に本発明者等は、 本発明の方法を 「デイジイタルハイブリダィゼ一シヨンスク リーニング」 と名付けた。
本発明によれば、 A群の検体の数 mが 3以上であれば、 検体のすべての組み合 わせについて相互作用を確認する場合に比べてスクリ一二ングの数を減らすこと
ができる。 例えば mが 3であればスクリーニング回数 nは 2となり、 が 7であ ればスクリーニングの回数 nは 3、 mが 1 2 3であればスクリーニング回数 nを 7とすることができる。 ここで mと nは、 2 n i ^m^ S n - 1、 mと nは、 m≥3、 n≥ 2の自然数である。つまり本発明によれば、相互作用の確認を 7回行えば、 1 2 3の検体のそれぞれについて相互作用の確認を行うときと同じ結果を得ること ができる。 A群の検体が多ければ多いほど、 本発明による効率化の程度も大きく なる。
なお B群を構成する検体が必ず A群の検体のいずれかと対応付け可能なことが 予め保証されている場合には、 理論的には、 前記 mと nの関係に例外的な関係が 生じる。このような対応関係においては、オールネガティブ(たとえば 0 0 0 0 0 0 0 0 ) を対応付けすることができる。 したがって mと nは、 2 n— i + l ^m ^ 2 n、 mと nは、 m≥3、 n 2の自然数である。
しかしながら、 A群の検体数があまりに大きいと、 対応関係の検出感度が低下 する場合がある。 感度の低下は、 A群の検体を適当な数に分割したうえで本発明 の方法を実施することにより解決することができる。 また A群の検体数の増大に ともなって、 対応関係が多: 1となる可能性が増す場合がある。 多: 1の対応関 係の増加は、 正しい対応関係の検出を妨げる恐れがある。 対応関係が多: 1であ る可能性が大きい場合とは、 例えば A群の検体に距離が非常に近接していると予 想される DNAマ一力一を用い、 これに対して B群の検体が BACクローン等の DNA ライブラリ一であるような場合が想定される。 このような場合には、 まず A群を 構成している DNAマ一力一をひとまとめにし、 A群の 1つの検体として本発明を 実施する。 ひとまとめにするとは、 具体的には異なる A群の検体に同じ I Dを与 えることを意味する。 この段階で対応関係に無いことが明らかな BACクローンを 選別し、 さらにこれらを適当な方法で二次スクリーニングするのが好ましい。 あ るいはまた、 化学物質の類縁体においては一群の類縁体を 1つの検体としてスク リーニングを行い、 さらにこれらを適当な方法で二次スクリーニングするのが好
ましい。 二次スクリーニングは、 検体間の相互関係を個々に確認することによつ て行うことができる。 たとえば B A Cクローンと STSとの相互関係を二次スクリ —ニングによって見出すには、 個々のプロ一ブを使ってハイブリダイゼーシヨン を行ったり、 あるいはその B A Cクローンを錡型として STSプライマ一による P C Rを行えば、 両者の対応関係を決定することができる。
他方 B群の検体の数 Xは、 特に限定されない。 その数が多いほど効率化される 度合いが大きい。
A群の各検体 A iに与える番号は、 たとえば 2n- l種類までの適当な番号 とす ることにより、 検体に固有の番号とすることができる。 番号は、 一般的には検体 ごとに固有の番号であることが望ましい。 しかしながら、 先に述べたように異な る検体に同一の I D番号を与えることによってひとまとめにすることも可能であ る。検体数が 2n に近いときは、 1から順に番号を振るよりも、 適当に番号が分 散する様に乱数等を利用して番号を決めるのが望ましい。 また、 各混合物 C kに 含まれる A群の検体 A iの検体数の差を小さくするのが望ましい。 たとえば A i が 6 4検体である場合、 1から順に番号をふれば 7桁目に 1を含むのは A 6 4 ( 1 0 0 0 0 0 0 ) のみである。 したがって混合物 C 1〜C 6まではそれぞれ 3 2種 類の検体を含むが C 7は 1検体 A 6 4 ( 1 0 0 0 0 0 0 ) を含むのみとなる。 こ のこと自身は何らデジタルハイブリダイゼ一シヨンスクリーニングの本質に影響 するものではない。 しかし各混合物 C nを構成する検体の数を均一化することに よって、 例えばラベリングの規格化や、 バックグランドレベルの均一化が期待で きる。 具体的には、 各混合物 C nを構成する検体の数の差を 1以下に設定するこ とが可能である。 先に述べた 6 4検体の場合も、 1例として次のような方法によ れば検体数の差を 1とすることができる。 すなわち、 1 0進法で 3 2番から 9 5 番まで (2進法では 0 1 0 0 0 0 0から 1 0 1 1 1 1 1 ) の連続した番号を与え れば良いのである。 この他の番号によっても、 6 4検体を検体数の差が 1以下の 混合物とすることは可能である。
"
本発明においては、 A群の検体 A iは番号を 2進法によって与えられ、 混合物 C kの作成に利用される。 2進法を利用することによって、 相互作用の検出結果 を各桁の数値に直接関連付けることができる。 一般に 2進法は 1と 0によって記 述される。 しかし本発明の実施にあたって 2進数を 1と 0以外の記号によって表 すことも可能であることは言うまでも無い。本発明における 1、あるいは 0とは、 進法におけるビッ卜の有無を意味しており、 数字の 1と 0の使用に限定するも のではない。
A群検体 A iからなる混合物 C k ( l≤k≤n) の作成に際し、 各混合物を構 成する A群検体 A iの量は、 特に限定されない。 たとえば A iを等量もしくは等 モルを混合すると、 B群検体との相互作用の程度が均一化され、 検出結果の解釈 を容易にする場合がある。 一方、 各 A iの間でラベリング効率に差があったり、 あるいは A群と B群との相互作用の程度に組み合わせによって差があるような場 合には、 適当に各 A iの量比を調整することによって相互作用の程度を均一化す ることができる。 たとえば本発明においては、 D N Aをラジオアイソトープラベ ルする場合に、力イネ一ション法とランダムォリゴマ一伸長法といった異なる方 法でラベリングしたプローブを混合することができる。 このようなケースでは、 各プローブから得られるシグナル強度が異なることが予想され、 等量を混合した のではシグナル強度の均一化は達成できない。 したがって、 各プローブのラベリ ング効率とシグナル強度を予備的に計測し、 その結果に基づいて混合比を調整す ることによってシグナル強度の均一化をはかることができる。
このとき、 混合物 C kには A群の検体 A iの他、 スクリーニングに悪影響を及 ぼさない薬剤や溶媒を加えることもできる。 また、 A群の検体が相互作用により スクリーニングに悪影響を及ぼす可能性があるときは、 その悪影響を軽減するた めの薬剤を加えることもできる。
本発明の正確性を増すために A群の検体をすベて含む混合物 C aを用いること もできる。 C aと B群の検体との反応により相互作用を示す結果が得られない場
合には、 両者の間に相互作用する組み合わせが存在していないか、 あるいは相互 作用の検出が不完全であることを示している。
n種類の混合物 C 1から C nと、 B群の検体 B jのそれぞれに対する相互作用 の検出は、 両者の相互作用を確認することができる任意の手段によつて実施する ことができる。 たとえばオリゴヌクレオチドと DNAであれば、 両者の間のハイブ リダイゼ一シヨンを指標として相互作用の検出が可能である。 本発明をさらに分かりやすく説明するために A群として 6つの DNAマ一カーと B群として 2 4のクローンを用いた例を以下に模式的に示す。これらの 6つの DNA マ一力一プロ一ブの各プローブに 3ビットの ID番号を与えた (表 4 )。例えば、 DNAプローブ 1を 「001」、 DNAプロ一ブ 2を 「010」 と表した。
表 4
その後、 これらの DNAプローブを、 表 4で示した組み合わせで混合し、 プロ一 ブ混合液 M l、 M 2、 M 3および MAとした。 ここで、 「1」がその存在を示 し、 「0」 はその不在を示す。 4つの DNAプロ一ブ混合液 (MA、 Ml、 M2と M3) を用意 し、 同一のクローンフィル夕一に対して各プローブ混合液を別々にハイブリダイ ゼーシヨンさせた (図 2 )。 6つの全ての DNAプローブを含んでいるプローブ混 合液 MAは 4つのクローン (A、 B、 D) を見つけたのに対し、 他のプローブ混 合液は異なる組み合わせでこれらの同じクロ一ンを見つけた。 そして、 ハイプリ ダイゼ一シヨンシグナルパターンを、 個々のクローンについて調べた。 例えば、
クローン Aは、 プロ一ブ混合液 M 1と M 2がポジティブ、 しかし、 M 3はネガテ イブであったので、 3ビットのパターンは「011」 になる。 このマトリックスパ夕 ーンは、 クローン Aが特定の DNAプローブ 3 (表 5 ) と対応すると決定した。 同 様に、 残っている 3つのクローンは、 特定の DNAプローブと対応した。
表 5
DNAプローブを用いた DNAライブラリーのスクリーニングの場合、 以下のよう にしてその信頼性を高めることができる。
( 1 ) 二重オフセットフィルター、 あるいは二つのレプリカフィル夕一を単一シ リーズのプローブ混合物に対して使用することにより、 疑似の陽性信号及び陰性 信号により生じる誤まった結果を防止することができる。これらのフィルタ一は、 いずれももとになるフィル夕一と同じ検出結果を与えるべきフィル夕一として機 能する。 したがって、 同じプローブ混合物のシリーズに対しては同じパターンの 信号を生じなければならない。 もしも、 もとのフィル夕一との間で信号の検出パ ターンが相違する場合、 いずれかの結果が誤まりであると知ることができる。
( 2 ) 各 I D番号にパリティ一ビットを追加することによって、 2 進数による I D番号を構成する 「1」の数を偶数個に固定することができる (表 6 )。 すなわち、 I D番号を構成する 「1」 の数が奇数の A群検体を集めた混合物 C oを用意し、 これに対する B群の検体の信号を記録すれば良いのである。 B群の検体とこの混 合物 C oとの間で相互作用が検出されれば、 パリティビットとしての 1が与えら れる。 一方、 I D番号を構成する 「 1」 の数がもともと偶数である A群検体と相 互作用する B群検体においては、 前記混合物 C oとの相互作用は検出されないは
ずであるから、 パリティビットは常に 0となる。 その結果、 I D番号 +パリティ ビットを構成する 「1」 の数は、 全ての B群検体で必ず偶数となる。 上記工程を 通じて得ることができる I Dを決定するための 7桁に、 パリティビットのための 1桁を加えて A群の検体との照合を行う。
表 6
I D +パリティの合計を偶数にした場合の表
■Dビット ノ リティビッド 1の数
STS1 Ι Ι ΙΙΙΙ· · 1 2
STS2 ΙΙΙ ΙΙΙ I no 1 2
STS3 0000011 0 2
STS4 0000100 1 2
STS5 0 2
STS6 0 2
STS7 111 1 4
最終的に決定した 8桁における 1の数を計数して、 信号がいずれかのビットに 関して欠落していたり、あるいは逆に超過している場合は、 「1」の数が奇数個に 変わってトラブルを表示する。 ここでは I Dビットとパリティビットを構成する 1の数を偶数に固定する場合を想定して説明したが、 奇数に固定することも可能 であることは言うまでも無い。 奇数に固定した場合には、 偶数となることでデ一 夕の誤まりが示される。 こうしてフィル夕一をもう一つ使用するだけで本発明の スクリ一ニング方法の信頼性を高めることができる。
( 3 ) STS の各 I Dに逆ビットを与えて他のスクリーニングを行うことで本発明 のスクリーニング方法の信頼性を著しく向上させることもできる (表 7 )。
表 7 八スクノ I JJ—―一ンメゲ 11 ス、ク✓ uノ——二 、ノゲノ ク Cm
STS1 0000001 1111110
STS2 0000010 1111101
ςΤς
STS4 0000100 1111011
STS5 0000101 1111010
STS7 0000111 1111000
1 舊
1 , a
c
STS80 ιοιίοιο 0100101
STS81
1 1011011 0100100
1 1
f 1 1
1
sis 126 1111110 0000001 スクリーニング結果が正確であれば、 I D (スクリーニング 1)プラス ID (ス クリーニング 2) は常に 1 1 1 1 1 1 1である。 いずれかの信号がなければ I D (スクリーニング 1) プラス I D (スクリーニング 2) は常にく 1 1 1 1 1 1 1 である。 2個以上の STSが単一のクローンとハイブリダィゼ一シヨンした場合は、 I D (スクリーニング 1) プラス I D (スクリーニング 2) は常に > 1 1 1 1 1 1 1である。 この戦略にはスクリーニングが 2シリーズ必要である。
したがってスクリーニング 1、 2を行った場合の最大の利点は、 プローブとク 口ーンの対応関係が正確になされているものを判別できる点である。 それに対し てスクリーニング 1あるいは 2の一方だけによる結果では、 正確な場合、 不正確 な場合、 および複数個の STSが単一クローンにハイプリダイズした場合を判別す ることができず、 デ一夕にそれらが混在することになる。 一方だけのスクリー二 ングのほとんどの結果が正確である場合には 2シリ一ズのスクリ一ニングは必要 無レ、。しかし一般的には、正確な結果をそうでない結果と判別できることの意義は 大きいと言える。
ところで、 このように 2シリーズのスクリーニングを行う方法によれば、 単に 正確性が増すのみならず、 多: 1対応に起因する重複したシグナルの分離が可能 である。 以下にシグナルの分離について具体的に説明する。 たとえば 1個の STS プロ一ブに対して 2つの異なったシリーズで 2進数の番号付けを行う。 これらの IDをここではそれぞれ FORWARD ID、 および REVERSE IDと称する。 FORWARD ID、 および REVERSE IDにはそれぞれ独立したシリーズの 2進数が与えられ、異なる組 み合わせで混合物が用意され、 本発明に基づいて別々にライブラリーを構成する クローンとの対応関係が決定される。 このような態様においては、 FORWARD ID と REVERSE IDのそれぞれついて、 独立して 2n— 1≤m≤2n- 1、 mと nは、 m≥3、 n 2の自然数の関係が成立する。
更に、 1つの STSプローブに対応する FORWARD ID、 および REVERSE IDを合計 したときに、 かならず全ての桁が 1となるように設定する。 つまりあるクローン に対して 1つのプローブが対応していれば、 そのクローンについて決定された FORWARD ID と REVERSE IDを合計すれば、 全ての桁で 1となるはずである。 すな わち、 8ビットの場合なら 1 1 1 1 1 1 1 1となる。 それに対して単一のクロー ンに 2つの STS プローブがハイブリダィズした場合には 、イブリダィゼーショ ンの結果から導かれる FORWARD IDと REVERSE IDの合計は 8ビッ卜の場合なら 1 1 2 2 1 2 1 2のように 1ケ所以上の 2を含む。 なおこの場合の足し算は 2進法 の表示形式に従うのではなく、 便宜的に各桁ごとに 1 + 1 = 2、 0 + 1 = 1、 1 + 0 = 1、 および 0 + 0 = 0という表示形式に従うこととする。 その方が 2進法 による表示形式よりも把握しやすいためである。 しかし、 本発明がこのような表 示形式に限定されるものではないことは言うまでも無レ、。各桁ごとに、 FORWARD ID と REVERSE IDのシグナルが両方で得られたのか、一方のみであったのか、 あるい はいずれにもシグナルが得られなかったのかを把握できればよい。 さて、 このよ うなケースでは、 以下のような考え方に基づいて STSプローブのどの 2つがハイ ブリダィズしているのかを絞り込むことが可能である。 まず 1 1 1 2 1 1 1 1の
ように 2が 1ケ所であれば 2となる桁が 1桁であるために、 STS プローブの組み 合わせも 1種類 (2個) となり一意的に 2個の STSプローブのどちらをも決定す ることができる。
また "2" となる桁が、 2、 3、 4、 5、 6、 7、 あるいは 8個と増えれば、 計算上、 それぞれ 4、 8、 16、 32、 64、 128、 そして 254種類のプロ —ブの対応が考えられ、 組み合わせとしては 2、 4、 8、 16、 32、 64、 そ して 127通りのプローブペアが夕一ゲッ卜に対応していることになる。つまり、 例えば、 "2"が 2、 3、 4、 5個であれば、 それぞれ 4、 8、 16、 32種類(組 み合わせとしてはその半分) までに可能性を絞ることができる。 1個のクローン に対応するプロ一ブが 2個までであれば、 このようにして対応関係を絞り込むこ とができる。
またスクリーニング 1、 2を行った場合、 後に示すマルチカラ一プローブでは なく、 ラジオァイソトーブラベルに基づくオートラジオグラムのような 1種類の シグナルのみで表された結果であっても、 2個のプロ一ブが 1個のクローンにハ ィブリダイズしている場合のシグナルを分離できる場合がある。 まずそれぞれの プローブによるシグナル強度の差が小さくても、 前述のように 2の数が 1個の場 合はそれぞれのプローブを特定することができる。 それ以外にも互いのシグナル 強度に明確な差が有れば、 2の個数が 2個以上であつてもそれぞれを特定するこ とができる。 たとえば FORWARD IDが 1 1 1 1 1 100で REVERSE IDが 1 1 1 1 1 1 1 1の場合、 それらの合計は 2222221 1となり 2個以上のプローブが ハイプリダイズしていることがわかる。 このシグナルに強いシグナルと弱いシグ ナルあって、 それらを識別できるものとする。 2となった桁において、 強いシグ ナルを S l、 弱いシグナルを W1と記述すると、 この結果はたとえば次のように 記述することができる。 すなわち、 FORWARD IDは (S l、 Wl、 S l、 S l、 S 1、 W 1、 0、 0 )、 REVERSE IDは ( W 1、 S 1、 W 1、 W 1、 W 1、 S 1、 1、 1 ) である。 この結果から強いシグナルを示すプローブの FORWARD ID は 101
1 1 0 0 0、 弱いシグナルを示す FORWARD ID ば 0 1 0 0 0 1 0 0となる。 3個 以上の STSプローブがハイプリダイズしている可能性も否定できないが、 まず分 離して得られた I D番号のプローブを用いて対応関係を確認することができれば、 不必要な 2次的、 あるいは 3次的なスクリーニングを省くことが可能である。 な お 8ビットからなる 2通りの I Dを利用する方法は、 1 6ビッ 卜の 1シリーズの I Dを与えることと同義である。 このように、 必要最小限のビットに対して付加 的なビットを加えていくことにより、本発明の方法の正確性の向上を達成するこ とができる。必要最小限のビットとは、 A群の検体に固有の番号を与えるために必 要なだけの番号を与える桁数 nである。 これに対して任意の桁数を加えて g桁の 番号を与えることによつて付加的なビットを供給することができる。
また、 2個のプロ一ブが 1個のクローンに対応する場合が多いことが想定され る場合には、 ビットを更に加えることによって想定される 2個の STSプローブの 数を絞り込むことができる。例えば nビットの付与で十分な場合において、余分に 2ビットを加えて n + 2ビッ卜の I Dを付与してスクリーニング 1と 2を行った 場合、単に nビットで行う場合に比べて 1 / 4〜 1 / 1 6まで組み合わせを絞り 込むことが可能である。 このようなアデイショナルビットは、 多く加えるほど絞 込みの効果は大きい。しかしそれだけ余分なミックスを用意する必要があるので、 2個のプローブが 1個のクローンに対応する頻度などを考慮して必要なビット数 を設定することが望ましい。
( 4 ) 第 2のシリーズのオリゴヌクレオチドプローブ (逆プライマーなど) で、 本発明に基づく他のスクリ一二ングを行うことにより、 疑似陽性信号の数を減少 させることができる。
( 5 ) あるプローブが長反復性配列および短反復性配列のような多重複写配列を 含む場合は、 このプロ一ブは複数のクローンとハイブリダィゼーシヨンする可能 性がある。これは適正な I D番号の決定に障害となろう。これらの反復性配列は、 既知であればコンピュータのデ一夕ベースで注意深くホモロジ一検索することで
排除されるべきである。あるいは実際のスクリーニングの前に予備実験を行って、 望ましくない STSプローブを発見して排除することを一般的には推奨する。 長反 復配列や短反復性配列のような多重複写配列に対して親和性を持つォリゴヌクレ ォチドが A群に含まれる場合、 異なる混合物の間で同じクローンに対して同一の 反応パターンが観察される。 したがって、 この独特の反応パターンを指標として、 取り除くべきオリゴヌクレオチドを知ることができる。 このような非特異的な反 応の原因となるプローブを、 本発明においては妨害バックグランドオリゴプロ一 プ(BBO: bad background oligo- probe)と呼ぶ。 これら ( 1 ) から (5 ) までの考 え方は、 単独ではなく適宜組み合わせて行うこともできる。 従って、 本発明のス クリ一ニング方法の信頼性を向上させるための多様な選択枝がある。
STS マーカーとゲノムライブラリーの間で相互作用する組み合わせを見出すに は、 ゲノムライブラリー (B群) を固定したフィル夕一や DNAチップに対して、 STS マーカーを標識したプローブの混合物 (A群) を反応させることによって実 施することができる。 フィル夕一にゲノムライブリ一を固定する方法は公知であ る。 ゲノムライプラリーの規模は、 数万〜数十万にも及ぶ大きなものとなるが、 1フィル夕一当たり数千種のクローンを固定する高密度フィルターとすれば効率 的なアツセィ系を構成することができる。 DNAを高密度に固定する技術としては、 DNA チップも有用である。 すなわちゲノムライブラリ一を各クローンごとに DNA チップ上の 1区画に固定し、 蛍光標識したプローブの混合液と反応させ、 どの区 画にハイブリダイゼーシヨンが起きているのかを判定する。 高度に集積したライ ブラリーに対して混合したプローブを反応させることから、 1つづつ反応させる 必要のあるこれまでの方法に比べて飛躍的に処理能力が高まる。
さて、 本発明による対応関係の決定方法においては、 A群の検体に対する B群 の検体が 1 : 1対応、 あるいは 1 :多対応の場合により正確な結果を得ることが できることは既に述べた。 これは放射性同位元素標識を、 オートラジオグラフィ 一で検出すると、 原則的にポジティブ ( 1 ) あるいはネガティブ (0 ) の 2種類
のデータしか得ることができないためである。 2個以上のプローブが 1個の夕一 ゲットを検出する場合、シグナルが重なるために的確な ID番号を導くことができ なくなる。 しかし A群の検体に対し、 たとえば以下に述べるような特殊な標識方 法を利用するとき等には、 多: 1対応であっても正確に対応関係を見出すことが 可能である。 同じく STSプローブとゲノムライブラリ一の関係を見出す場合を例 にこの方法について説明する。
たとえば、 STS プローブに識別可能なシグナルを生成する複数種の標識を与え るのである。 このような標識としては、 蛍光波長の違う蛍光色素や異なった色に 発色する着色標識などを示すことができる。 全てのプロ一ブに同じシグナルを持 つ標識を与えた場合には、 あるクローンに対して複数のプローブが対応している 場合 (すなわち多: 1対応) に識別は困難である。 しかし複数のプローブが識別 可能な異なったシグナルを持つ場合には、 どのプローブが混在して反応している のかを明らかにすることができる。 すなわちシグナルの分離が可能である。 たと えば、 1個のクロ一ンに対して 2種のプローブが対応した場合、 5色の標識を利 用していれば理論的には 8 0 %のケースでプローブの識別が可能となる。 本発明 において、 このようにより正確な対応関係の決定を可能とするために多種類の標 識を与えたプローブを特にマルチカラ一プローブと呼ぶ。
マルチカラ一プローブを利用することによって、 I D番号を少なくすることも 可能である。 異なる検体に同一の I D番号を付与しても、 標識の違いによって識 別が可能となるためである。この特徴を利用すれば、原理的には標識の種類の分だ け混合物の種類 (すなわち対応付けのための反応の回数) を減らすことが可能と なる。 たとえば、 5種類の標識を利用して 5つの異なるプローブに同一の I D番 号を与えれば、混合物の数は 1 / 5となる。
本発明に基づく相互作用を持つ組み合わせの決定方法を利用すれば、 ゲノム解 析以外に転写調節薬や膜受容体に対するァゴニスト化合物のスクリーニング等も 効率的に行うことができる。 以下にこれらの応用について具体的に述べる。
標的遺伝子に対応する転写調節薬のスクリ一ニングに本発明を応用することが できる。 本発明を利用すれば、 単一ではなく、 多数の標的遺伝子のそれぞれに対 応する転写調節領域について、 同時に候補化合物の活性をスクリーニングするこ とが可能である。 各遺伝子のコーディング領域をレポ一夕一遺伝子に置換し、 そ の 5'側上流に位置する転写調節領域と連結した構造を挿入した転写評価プラス ミ ドを作成する。 このとき形質転換体に候補化合物の混合物を順次接触させて転 写調節活性を検出する。 各形質転換体を複数種のプラスミ ドで形質転換すること によって、 A群の検体を混合した混合物に相当する状態を構成できる。 各候補化 合物について少数の形質転換体によるスクリーニングを行うだけで、 転写調節活 性を持つ候補化合物と、 その夕ーゲットとなる転写調節領域との対応関係を明ら かにすることができる。
本発明を利用すれば、 遺伝子機能解析の一環としての、 機能未知の膜受容体に 対するァゴニスト化合物のスクリーニングを効率的に行うこともできる。 このス クリーニングには、 細胞内シグナル伝達の最終過程の転写シグナルを利用する。 膜受容体が発生する最終転写シグナルのかなりの部分が cAMPシグナルの終末 CRE (cAMP responsive element), あるいは Caシグナルの終末の一つである APIに分 類されると考えられる。 CREあるいは APIの下流にレポ一夕一遺伝子を連結した 転写評価プラスミ ドと、 機能未知の膜受容体を発現するプラスミ ドを同時に培養 細胞に導入し形質転換する。 ァゴニスト化合物の候補化合物をこの形質転換体に 接触させてレポ一夕一活性の発現を検出すれば、 候補化合物のァゴニスト活性を 知ることができる。 このとき、 同一の細胞に複数の膜受容体遺伝子を導入して、 本発明の A群の検体を混合物とする工程を達成することができる。 各候補化合物 について少数の形質転換体によるスクリーニングを行うだけで、 ァゴニスト活性 を持つ候補化合物と、 その夕ーゲットとなる膜受容体との対応関係を明らかにす ることができる。この方法においては、機能未知の膜受容体であっても CREや API を介したシグナル伝達をトリガ一するものであれば対応関係の検出は可能である
本発明に基づいて、 モノクローナル抗体のェピトープ解析が可能である。 ェピ トープ解析のためには、 A群の検体として抗原の断片を用意する。たとえばタンパ ク質抗原であれば、 末端から数アミノ酸づっずらしたアミノ酸配列を持つオリゴ ペプチドライブラリ一を合成し、 これに I D番号を与える。 B群の検体であるモ ノクローナル抗体との対応関係を確認すれば、 ェピトープを解析することができ る。 抗原が大きな分子であれば、 数百種のオリゴペプチドとの対応を確認しなけ ればならないケースもあるが、本発明を応用すればわずか数回の検定で対応関係 を明らかにすることができる。
図面の簡単な説明
図 1は、 A群の検体と B群の検体の対応関係を模式的に示す図である。
図 2は、 6つの DNAマーカー (A群) と 2 4のクロ一ン (B群) を用いて本発 明によるスクリーニング方法を実施したときのハイブリダィゼーシヨンパターン を示す模式図である。 4つの DNAプローブ混合液 ( A、 Ml、 M2と M3) を用意し、 同一のクローンフィル夕一に対して各プロ一ブ混合液を別々にハイプリダイゼ一 シヨンを行った。 6つの全ての DNAプローブを含んでいるプローブ混合液 MAは 4つのクロ一ン (A、 B、 C、 D) を見つけたのに対し、 他のプロ一ブ混合液は異な る組み合わせでこれらの同じクロ一ンを見つけた。
発明を実施するための最良の形態
次に実施例によって本発明をさらに具体的に説明する。 ただし、 本発明はこれ らの実施例により制限されるものではない。
実施例 1
15,360の BACクローン (Genel91( 1997) p69- 79) と 126の STSマーカ一 (表 8 〜 1 0 ) を用いて本願発明のスクリーニングを行った。 STSマーカ一の個々の塩 基配列やプライマ一等については、 NCBI によって提供されている dbSTS (http:〃 www.ncbi.nlm.nih.gov/dbSTS/)お よび DDBJ Accession No.C75685- C75936で知ることができる。 この場合、 表 8〜1 0で示されるように、 7ビット
の ID番号を 126のプローブの各々に与えた。 STSマーカ一 .プローブ (FA、 F1 から F7) の 8種類の混合液を用意した。 混合液 FAは、 126の全ての STSプロ一 プを含んでおり、他の混合液は特定の組み合わせの 63の STSプローブを含んでい る。
63 (または 126) の STSマーカーオリゴヌクレオチド (フォーヮ一ドアン プリマ一) をそれぞれ O.lpmolずつ含む反応混合液 (50 / 1) に、 31.5〃Ci (ま たは 63〃Ci) のァ- 32P— ATP (5,000Ci/腿 ol、 M0018、 アマ一シャム) と 1 (または 2) ユニットの T 4ポリヌクレオチドキナーゼ (宝酒造) を加え、 3 7°Cで 30分間ィンキュベ一トした。結合しなかったァ- 32P— A TPはセフ アデ ックス G_ 50の遠心力ラムにより除いた。 約 50%の 32Pが結合した。 プレハ ィブリダイゼ一ションは、 0. lmg/mlの超音波処理(平均 200bp)により断片化し た変性サケ精巣 DNA (シグマ、 D1626) および変性二シン精子 DNA (平均 lOObp以 下) (シグマ、 D3159) を含む 5 xSSC、 5 xDenhardt's, 0.5% SDS溶液中、 55°Cで 12時間行った。プレハイブリ ダイゼ一シヨンの後にラベルしたプロ一 ブを加え、 55°Cで 72時間インキユーべ一シヨンした。 それぞれのプローブの 最終濃度は 0.005pmol/mlとした。 フィル夕一は 2 xSSC、 0.5% SDSで室温 で 10分間、 3回洗浄し、 続いて 60°Cで 30分間、 2回洗浄し、 最後に O.lx S SC、 0.1%SDSを用いて室温で 10分間洗浄した。 フィル夕一はフジィメ —ジングプレートに対し 72時間露光した。オートラジオグラムは、 BAS2000Bio Imaging Analyzer (フジフィルム) によって得た。
上記の方法よつて
32 Pラベルした混合液を、 3072の BACクローンでブロヅ卜し た 5つのハイデンシティレプリカ(HDR)フィル夕一に対してそれぞれ別々にハイ ブリダィゼ一シヨンを行った。 オートラジオグラムの結果、 ハイブリダィゼ一シ ヨン'シグナルがはっきりと観察された。 126の全てのプローブを含んでいるプ口 ーブ混合液 F Aはこの HDRフィル夕一 (5つの別々の HDRフィル夕一で計 104の クローン) 上で 30の BACクローンを検出した。 7つの他のプロ一ブ混合液は異
なる組み合わせでこれらの同じクロ一ンを検出した。 ハイブリダィゼ一シヨンシ グナルパターンは、 明細書中で開示した方法にしたがって検定した。 例えば BAC 6 6は、 プローブ混合液 F 7、 F 5、 F 4、 F 2と F 1がポジティブであり、 F 6と F 3がネガティブであった、 その結果ビットパターンは 「1011011」 (表 1 1 〜1 2参照) となった。 BAC 6 6と特異的な STSプローブ D11S1308(表 8〜 1 0参 照)は、対応すると決定した。 このようにして、残りのクローンの 7ビット数も決 定され、 4 8の特異的な STSプローブのと対応を決定した。 これらの 48の STS プローブの中で、 2のプローブ (STS7と STS23) は、 予想より多数の 23の BACク ローン (それぞれ 8つおよび 15のクローン) を検出した。 ハイプリダイゼ一シ ョンにおいて、 間違ったポジティブシグナルを防ぐためにできるだけユニークで あるように、 オリゴヌクレオチドプローブを設計したにもかかわらず多数のク口 ーンが同定された。 これは、 おそらくこれらのプローブがマルチコピー反復配列 を含むという事実によるものと推測された。 ディジイタルハイプリダイゼーショ ンスクリーニングの正確性を確認するために、 更に P C R分析をおこなった。 こ れにより、 23の BACクローンが、 除去された。 P C R分析の方法を以下に述べる c P C R分析は、 上記方法で選ばれた 4 6の STSマ一カープローブの各々のため に設計された正と逆のアンプリマ一を使って 8 1の BACクローンに対して行った c P C R分析の結果は、 D Hスクリーニングのデ一夕と共に表 1 1〜1 2に示した。 P C R分析により 7 6の BACクローンが分析可能であり、 5つのクロ一ンが分析 不可能であった。 これらの 76の BACクローンの中で、 5 9のクローンは、 3 7の 特異的な STSマーカーに対応することが確認された。 これらの結果は、 明らかに クローンと STSマ一カーとの対応関係の検出における高い成功率(59/76=78%)を 示している。

表 9
STS FA F7 F6 F5 F4 F3 F2 Fl
SGC32169 1 0 1 0 1 1 0 05 SGC35207 1 0 1 0 1 1 0 16 SGC35308 1 0 1 0 1 1 1 07 SGC35315 1 0 1 0 1 1 1 18 WI-11321 1 0 1 1 0 0 0 09 WI-11358 1 0 1 1 0 0 0 10 WI-11417 1 0 1 1 0 0 1 01 WI-11948 1 0 1 1 0 0 1 12 WI-12452 1 0 1 1 0 1 0 03 WI-13017 1 0 1 1 0 1 0 14 WI - 13322 1 0 1 1 0 1 1 05 WI-13874 1 0 1 1 0 1 1 16 WI-14954 1 0 1 1 1 0 0 07 WI-16318 1 0 1 1 1 0 0 18 WI-16888 1 0 1 1 1 0 1 09 WI-16986 1 0 1 1 1 0 1 10 WI-17090 1 0 1 1 1 1 0 01 WI- 17658 1 0 1 1 1 1 0 12 WI-17664 1 0 1 1 1 1 1 03 WI -17843 1 0 1 1 1 1 1 14 WI- 18279 1 1 0 0 0 0 0 05 WI-18470 1 1 0 0 0 0 0 16 WI- 18695 1 i 0 0 0 0 1 07 WI-6909 1 i 0 0 0 0 1 18 WI - 7384 1 i 0 0 0 1 0 09 WI - 7555 1 i 0 0 0 1 0 10 WI - 7775 1 i 0 0 0 1 1 01 WI-7805 1 1 0 0 0 1 1 12 WI- 7910 1 1 0 0 1 0 0 03 WI- 8007 1 i 0 0 1 0 0 14 WI-8865 1 i 0 0 1 0 1 05 WI-9091 1 i 0 0 1 0 1 16 WI-9170 1 i 0 0 1 1 0 07 WI- 9545 1 i 0 0 1 1 0 18 WI-9587 J j 0 0 1
{ 1 0Q
o u u 丄 1 1 1 丄 丄0 FKBP 0 0 0 0 01 WI- 8798 0 0 0 0 12 應 117 0 0 0 1 03 D20SI99 0 0 0 1 14 SGC30891 0 0 1 0 05 SGC33911 0 0 1 0 16 SGC35115 0 0 1 1 0
表 1 0
STS FA F7 F6 F5 F4 F3 F2 Fl
87 WI-9706 1 1 0 1 0 1 1 1
88 D20S171 1 1 0 1 1 0 0 0
89 D20S173 1 1 0 1 1 0 0 1
90 D11S1307 1 1 0 1 1 0 1 0
91 D11S1308 1 1 0 1 1 0 1 1
92 D11S1309 1 1 0 1 1 1 0 0
93 D11S1311 1 1 0 1 1 1 0 1
94 D11S1312 1 1 0 1 1 1 1 0
95 D11S1313 1 1 0 1 1 1 1 1
96 D11S1315 1 1 1 0 0 0 0 0
97 D11S1317 1 1 1 0 0 0 0 1
98 D11S1319 1 1 1 0 0 0 1 0
99 D11S1320 1 1 1 0 0 0 1 1
100 D11S1321 1 1 1 0 0 1 0 0
101 D11S1322 1 1 1 0 0 1 0 1
102 D11S1323 1 1 1 0 0 1 1 0
103 D11S1324 1 1 1 0 0 1 1 1
104 D11S1325 1 1 1 0 1 0 0 0
105 D11S1326 1 1 1 0 1 0 0 1
106 D11S1327 1 1 1 0 1 0 1 0
107 D11S1328 1 1 1 0 1 0 1 1
108 D11S1329 1 1 1 0 1 1 0 0
109 D11S1330 1 1 1 0 1 1 0 1
110 D11S1331 1 1 1 0 1 1 1 0
111 D11S1332 1 1 1 0 1 1 1 1
112 D11S1333 1 1 1 1 0 0 0 0
113 D11S1335 1 1 1 1 0 0 0 1
114 D11S1336 1 1 1 1 0 0 1 0
115 D11S1337 1 1 1 1 0 0 1 1
116 D11S1339 1 1 1 1 0 1 0 0
117 D11S1340 1 1 1 0 1 0 1
118 D11S1341
1 Q ΰ Γ 1 Q 1 Q -? j j j j 0 1 1 0
1 ) 1 1 1 1
120 Ε-22 0 0 0
121 Ε-68 0 0 1
122 Ε-86 0 1 0
123 Ε - 161 0 1 1
124 Ε-218 1 0 0
125 Ε - 836 1 0 1
126 Ε-877 1 1 0
d OOTOOOO
i 6S ΠΟΠΐΟ O ά T6 ΠΟΠΟΐ 6C ά m ΟΟΠΐΐΐ 8S d ΠΟΟΟΟΐ ζε i ττ ΟΠΟΐΟΟ 9C i u ΐΐΐΟΟΟΐ 9S i Οΐΐΐΐΐΐ η
― K ΠΐΠΟΟ CS 一 s ΤΟΐΟΟΟΟ
一 9 ΤΟΐΟΟΟΟ ιε
N 99 ΟΐΟΟΟΟΐ 0C
N c ποοοοο
N ΠΐΐΐΐΟ 2Ζ
N τπ ΐΐΐΐθΐΐ 11 d 9 ΠΟΟΟΟΐ
d ΐΐΐ ΠΠΟΐΐ
d 96 Πΐΐΐθΐ η d 601 ΐθΐΐθΐΐ ζζ d e9 ΐΐΐΐΐΐθ 11 d 06 ΟΐΟΠΟΐ \ι d on Οΐΐΐθΐΐ οζ d ε ΐΐΟΟΟΟΟ 6ΐ d 99 ΟΟΟΐΐΐΟ 8ΐ d ΐθΐ ΤΟΐΟΟΠ ΐ i ΐθθΐΐΐΐ 9ΐ ά ΐΟΟΟΠΟ 9ΐ d ΟΐΟΠΠ η
― 89 ΟΐΟΠΤΟ ei
― 6Z ΠΐΐΟΟΐ ι\
N 8 ΟΐΐΐΟΟΐ ΐΐ
N 22ΐ Οΐθΐΐΐΐ Οΐ d 82, ΟΐΐΐΟΟΐ 6 d οε ΟΐΐΐΐΟΟ 8 d Z ΟΐΟΐΟΐΟ L d Οΐ 010漏 9 d S6 ΐθΐΐΐθΐ 9 d 16 ΐΐθΐΐθΐ
d L\ ΐΟΟΟΐΟΟ ε d ζζι Οΐθΐΐΐΐ ζ d n ΟΟΟΐΐΟΟ ΐ aod SIS ベーロ^
l99S0/86df/XDd 82 o e/66 θΛν
表 1 2 クローン 結果 STS PCR
42 1000100 68 P
43 1010101 85 P
44 1101111 111 N
45 1111001 121 N
46 1010111 87 N
47 0011011 27 P
48 0111000 56 P
49 1110000 112 P
50 1110000 112 P
51 0101010 42 P
52 1101111 111 P
53 0110001 49 P
54 0110110 54 N
55 1011101 93 N
56 1111111 ― 一
57 0010000 16 P
58 0011011 27 P
59 1000111 71 P
60 0000110 6 P
61 1011101 93 P
62 1111110 126 P
63 0011110 30 P
64 1100100 100 P
65 1011111 95 P
66 1011011 91 P
67 1011001 89 P
68 1101011 107 P
69 0011011 27 P
70 0010110 22 P
71 0100011 35 P
72 0000011 3 P
73 1000100 68 P
74 1101101 109 P
75 1000111 71 P
76 1101111 111 P
77 1111010 122 N
78 1010111 87 N
79 0101101 45 N
80 1010111 87 N
81 1101010 106 N
P : PCR+ N:PCR- 一 - :情報なし
実施例 2
5ビットデイジイタルハイブリダィゼーシヨン法において、 ヒトゲノム反復配 列対応ォリゴヌクレオチドプローブの検出を行った。 反復配列に対して親和性を 持つオリゴヌクレオチドプローブは、 本来目的とするクローン以外のクローンを 極端に多数検出するため、 解析を煩雑にするだけでなく、 A群と B群の対応関係 に多: 1の対応関係をもたらし正しい結果の判定を妨げる可能性がある。そこで、 本発明のより望ましい態様として、 このようなォリゴヌクレオチドプローブを選 択し除去することが可能であることを以下の実施例により明らかにする。
8番染色体にマップされている 1 0 1 4個の EST( expressed sequence tag)をプ ローブとして、 8番染色体の BACクロ一ンをデイジイタルハイプリダイゼ一ショ ン法により網羅的に単離することを計画した。プロ一ブにはそれぞれの ESTを PCR で増幅するためのオリゴヌクレオチドプライマ一ペアの一方を用いた。 プライマ —の塩基配列は、 GDB などのデ一夕ベースに登録されているものから選択した。 これらの塩基配列には、 シングルコピーの配列をもとに設計されていることが理 想的であるが、 実際にはヒトゲノム反復配列に由来するオリゴヌクレオチドが含 まれている可能性がある。 これらの反復配列由来のオリゴヌクレオチドが含まれ ていれば、もとの ESTに該当しない BACクローンにもハイブリダィズしてしまう。 特にそのオリゴヌクレオチドの由来する反復配列のゲノム上での頻度が高ければ、 実際に目的とするクローンよりもはるかに多数のクローンが陽性クローンとして 選択されることになる。 このような状況は、 特にラージスケールでデイジイタル ノ、ィブリダイゼ一シヨン法を行うには大きな障害となる恐れがある。したがって、 ラージスケールの網羅的なスクリーニングを行う前段階として、 反復配列に由来 するオリゴヌクレオチドプローブを検出し、 除去するために、 スモールスケール のデイジイタルハイプリダイゼ一シヨン法を活用した。
まず 1 0 1 4個の ESTを 3 1個ずっセットにして 3 3種のプロ一ブミヅクスを 作成した。 それぞれのプローブミックスを実施例 1と同様に3 2 Pラベルして、 6
1 4 4個の BACクローン (約 0.2ゲノム相当) がプロットしてあるフィル夕一に 対してコロニーハイブリダィゼ一シヨンを行った。 0.2 ゲノム相当数のクローン に対して、 3 1個のプローブを用いてスクリーニングすれば、 理論的には平均 6 個程度のポジティブシグナルが得られるはずである。 しかし反復配列由来ォリゴ ヌクレオチドプロ一ブを含むプロ一ブミックスでは、 数 1 0〜数 1 0 0個のポジ ティブクローンが検出された。 3 3セットのプローブミックス中 5セットに、 反 復配列に由来すると考えられるオリゴヌクレオチドプローブが含まれていた。 そ こで、これらのセットを構成する 3 1個のオリゴヌクレオチドプローブについて、 5ビッ卜の ID番号を与え、ディジィタルハイプリダイゼーシヨン法を実施した。 その一部を表 1 3に示す。
表 1 3
Original No. name Ml M2 M3 M4 M5
1 447 StSG2728 0 0 0 0 1
2 450 StSG2865 0 0 0 1 0
3 476 StSG4053 0 0 0 1 1
4 492 StSG4887 0 0 1 0 0
5 505 StSG8247 0 0 1 0 1
6 521 StSG8815 0 0 1 1 0
7 526 StSG8968 0 0 1 1 1
8 584 TIGR-A004G12 0 0 0 0
9 661 TIGR-A008B17 0 0 0 1
10 664 TIGR-A008N08 0 0 1 0
11 673 TIGR-A008X11 0 0 1 1
12 675 TIGR-A008Z29 0 1 0 0
13 676 TIGR-A008Z39 0 1 0 1
14 705 WI - 11650 0 1 1 1 0
15 711 WI-11745 0 1 1 1
16 715 WI- 11819 0 0 0 0
17 717 WI-11882 0 0 0 1
18 7 1 WI-12131 0 0 1 0
19 725 WI-1243 0 0 1 1
20 727 WI - 12556 1 0 1 0 0
21 740 WI- 1310 0 1 0 1
22 759 WI-14143 0 1 1 0
23 762 WI- 14186 0 1 1 1
24 778 WI- 15041 1 0 0 0
25 786 WI - 15306 0 0 1
26 797 WI - 15914 0 1 0
27 801 WI - 16152 0 1 1
28 802 WI- 16182 1 0 0
29 810 WI-16696 1 0 1
30 816 WI- 16842 1 1 0
31 840 WI- 17906 1 1 1
表 1 3は、 反復配列に由来すると考えられるオリゴヌクレオチドプローブが含 まれていた第 1 9セットの 3 1個のプローブに割り当てた 5ビットの ID 番号を 示す。 表 1 3にしたがい、 プロ一ブミックス M卜 M5を調製した。 各プロ一ブミツ クスについて、 各クローンがブロッ卜された同一のフィル夕一に対してコロニー ハイブリダィゼーシヨンを実施した。 その結果、 M2 と M5において多数のクロ一
ンが同一パターンで検出された。 したがって、 "0100Γの ID 番号を与えられた 661 (TIGR-A008B17)が、反復配列由来ォリゴヌクレオチドプロ一ブであると判断し た。続いて、 第 19セットから 661 (TIGR- A008B17)のみを除去したプローブミック スによる反応パターンを確認した。 複数のクローンにハイブリダィゼ一シヨンし てしまう反復配列由来と判定したォリゴヌクレオチドプローブを除くことにより、 より明暸な反応ノ 夕一ンを得ることができた。
同様にして、 他のプロ一ブミックスセッ卜に含まれる反復配列由来と考えられ るオリゴヌクレオチドプロ一ブも検出した。 最終的に 1 0 1 4個の ESTから 5個 の反復配列由来ォリゴヌクレオチドプロ一ブを同定することができた。 これらの 5個の復配列由来オリゴヌクレオチドプローブを除いた 1 0 0 9個の ESTをラー ジスケールでのディジィタルハイブリダイゼ一シヨン法に用いた。
更に、 EST と同様の手法で 5ビットディジイタルハイプリダイゼーシヨン法に よって反復配列由来オリゴヌクレオチドプローブを除いた、 3 7 7個の STSプロ —ブも同じく 8番染色体の BACクロ一ン ( 1 0万クローン) のスクリーニングに 用いた。 1 3 8 6個の STSプロ一プおよび ESTプローブは、 4 9 5個、 4 9 0個、 そして 4 0 1個に分割して 3セットのミックスプロ一ブとした。
ES プローブと STSプローブを組み合わせたラージスケールでのスクリ一ニン グにより、 1 0万の BACクローンから約 4 3 0 0クローンのポジティブクローン を速やかにスクリーニングすることができた。
続いてこの約 4 3 0 0クローンをサブライブラリーィ匕し、 8ビットディジィ夕 ルハイブリダィゼーシヨンスクリーニングを実施することにより、 各プローブと BAC ライブラリーとの更に詳細な対応関係を明らかにした。 ディジイタルハイブ リダィゼ一シヨン法に用いたプローブは、 1 1 8 7種類の STSプローブまたは EST プローブである。
1 1 8 7種類の STSまたは ESTのシーケンスから設計されたオリゴヌクレオチ ドをプローブとし、 5つの混合物に分けて (2 3 6〜 2 3 8本)、先にスクリ一二
ングされた 8番染色体由来の BACクローン約 4 3 0 0クローンからなるサブライ ブラリ一に対して、 8ビットデジタルハイブリダィゼ一シヨンスクリーニングを 行った。 各プローブには FORWARD ID、 REVERSE IDを与えた。 つまり、 1つのプ ローブに対して 2通りの番号付けを行った。 各プローブの FORWARD IDと REVERSE IDの合計は全て ( 1 1 1 1 1 1 1 1 ) になるように番号を付与した。 従って各ス クリ一ニングは FORWARDに対して 8ミックス、 REVERSEに対して 8ミックス、 そ して全てのプローブを含んだ 1ミヅクスの、 合計 1 7ミックスのプローブ混合物 によって行った。 その結果、 個々のクロ一ンに関して FORWARDミックスによる結 果から導かれる ID番号と、 REVERSE ミックスによる結果から導かれる ID番号と の合計が ( 1 1 1 1 1 1 1 1 ) であれば、 その BACクローンに対して 1種類のプ ローブがハイブリダィズし、 的確に結果が得られたことがわかる。 5回のスクリ 一二ングの結果、延べ 6 7 0種類の STS (あるいは EST)に関して 1クローン以上 の BACを対応させることができた。 また約 7 0種類の STS (あるいは EST)につい てはお互いに極めて隣接する STS (あるいは EST)が存在し 1個の BACに 2種類以 上の STSプローブ (あるいは ESTプローブ) がハイブリダィズしていることが予 想された。残る約 4 5 0種類の STS (あるいは EST) のほとんどに関しては、 サブ ライブラリ一中に対応する BACクローンが存在しないと考えられた。
6 7 0種類の STS (あるいは EST) を用いたスクリーニングに要した労力は、 3 0人 X日であった。 これほど迅速に 6 7 0種類の STSに対応する BACクローンを 同定することは、 全ての組み合わせについて順次対応関係を決定していく従来の 方法では不可能である。 実施例 3
本発明の転写調節薬スクリーニングへの応用について、 ステロイ ド受容体ス一 パ一フアミリーに属する転写因子のァゴニスト化合物スクリーニングを例として、 更に具体的に説明する。
ステロイ ド受容体スーパ一フアミリーに属する転写因子として、 たとえば以下 の 1 0種類を選択する。 本発明に基づいて、 これらのレセプ夕一に対応する転写 因子とァゴニスト化合物との対応関係を明らかにする。
glucocorticoid receptor a
progesterone receptorひ
androgen receptor o;
estrogene receptor
retinoic acid receptorひ 1
retinoid X receptorひ
thyroid hormone receptorひ 1
vitamin D3 receptor
peroxisome prol iferator activated receptor γ 1
hepatocyte nuclear factor 4 -ひ 1
形質転換体とする培養細胞には、 たとえば CV-1細胞が用いられる。 10%ゥシ胎 児血清加 DMEM 培地で培養した CV- 1 細胞を、 PBS (- )で 2回洗浄した後、 Trypsine/EDTA を添加して 3 7 °Cで 5分間インキュベートする。 培地を加え細胞 を懸濁後に遠心し、ちんでんに培地を加えて 2 X 1 0 5 cel ls/2.5mLとなるように 再懸濁させる。 2.5mL/ゥエルづっ 6 wel l プレートに接種し、 C02インキュベータ ― (37°C、 5% C02) で 18時間から 24時間培養する。
こうしてシ一ドされた CV- 1細胞は転写評価プラスミ ドにより形質転換される。 転写評価プラスミ ドは、 各転写因子の下流にルシフェラ一ゼ遺伝子を連結した構 造を持つ。この例では、上記 10種の転写因子を持つプラスミ ドを表 1 4に示すよ うに混合して形質転換に用いる。 各プラスミ ドのラインを横に見ると、 F 4— F 1に示す 4桁の I D番号が示されている。 また、 F 4— F 1のカラムを縦に見る と、各混合物に含まれるプラスミ ドが含まれる( 1 )か、あるいは含まれない( 0 ) のかを知ることができる。 F Aは、 すべてのプラスミ ドを含む混合物である。 こ
の混合物を用いたときに、 プラスミ ドと転写調節因子の候補化合物の対応関係を 示すシグナルが検出されない場合には、 すべての化合物に転写調節活性を期待で きないか、 あるいはオペレーションのミスが考えられる。
表 1 4
転写因子 FA F4 F3 F2 Fl
1 glucocorticoid receptor a 1 0 0 0 1
2 progesterone receptorひ 1 0 0 1 0
3 androgen receptorひ 1 0 0 1 1
4 estrogene receptor " 1 0 1 0 0
5 retinoic acid receptor a 1 1 0 1 0 1
6 retinoid X receptorひ 1 0 1 1 0
7 thyroid hormone receptor a l 1 0 1 1 1
8 Vitamin D3 receptor 1 1 0 0 0
9 peroxisome prol iferator activated receptor γ 1 1 1 0 1 0
10 hepatocyte nuclear factor 4 -ひ 1 1 1 0 1 1
なお各プラスミ ドの使用量は 0.3〃gとし、 150 Lの Opti- MEMで希釈して用い る。 この評価プラスミ ド含有溶液に Lipofect AMINE試薬 7.0 Lを加えて室温で 15 分— 45 分ィンキュベ一卜する。 ィンキュベ一ト後のプラスミ ド溶液を更に 1.5mLの Opti-MEMで希釈し、 I mLの PBS (-)で 2回洗浄した CV- 1細胞に加える。
C02インキュベーターで 4時間培養後、 形質転換液を除いて Trypsine/EDTA を 200 L加え、 37度で 5分間放置する。 10%活性炭処理ゥシ胎児血清を加えた DMEM 培地 (フエノールレツド不含) を ImL加え、 遠心チューブに回収する。 lOOOrpm で 3分間の遠心により細胞を回収し、 細胞数が 1.6 x l04 cel ls/50〃Lとなるよう に再懸濁させて 50〃L/well となるように 96wel lのプレートに播種する。 C02ィ ンキュベー夕一で 1時間以上培養後に適当な濃度の候補化合物を 50 L/wel l添加 する。 添加後に C02インキュベーターで 40-48時間培養した後に、 以下の操作に よりルシフヱラ一ゼアツセィで転写調節活性を確認する。
96wellプレートから培養液を除去し、 100〃Lの PBS ( - )で洗浄後に、 l x Passive lysis buffer(Promega) 20〃Lを添加し、 室温で 15分間以上ィンキュベ一トして
細胞を溶解する。 得られる溶解液を試料として MLX(DYNAX Technologies )のよう なルミノメ一夕一で発光反応させ発光強度を計測する。 産業上の利用の可能性
A群の検体と B群の検体が、 相互作用する対応関係に有るときに、 その対応関 係を決定する方法が提供される。 本発明は、 2 進法を利用した規則に基づいて混 合した A群の検体を利用することによって、 スクリーニングのための反応操作を 著しく減らすことができる。 理論的には A群の検体は 7以上であれば、 スクリ一 ニングの回数は減少する。 そして A群の数は大きいほど、 その減少効果が大きく なる。
本発明に基づく対応関係の決定方法を応用可能な分野として、 STSや ESTのゲ ムライブラリ一へのマッピングを示すことができる。 これらの作業は、 A群 (す なわち STS) と B群 (ゲノムライブラリ一) との対応関係を両者のハイプリダイ ゼ一シヨンに基づいて明らかにしていく作業に他ならない。 しかも、 両者の集団 規模がたいへん大きいため、 本発明によるスクリーニング数の減少効果が期待さ れる。 ヒューマンゲノムプロジェクトをはじめとする大規模なゲノム解析プロジ ェク卜の推進に、 本発明はスクリーニングの効率化を通じて大きく貢献するもの である。