JP2008507261A

JP2008507261A - 肺癌診断のための新規のヌクレオチド配列およびアミノ酸配列、ならびにそのアッセイおよび使用方法

Info

Publication number: JP2008507261A
Application number: JP2007519922A
Authority: JP
Inventors: ポロック，サラ; レビン，ズリット; ノヴィク，アミト; ダハリ，ドゥビル; ソレク，ロテム; トポリク，アミル; サメア−グリーンワルド，シャ−リー; セラ−タヴォル，オスナット; ディベル，アレキサンダー; コジョカル，ガッド，エス．; アヤロン−ソファー，マイケル; ワラチ，シラ; アキヴァ，ピンチャス; ケレン，ナオミ; シェメシ，ロネン
Original assignee: コンピュゲンユーエスエイ，インク．
Priority date: 2004-01-27
Filing date: 2005-01-27
Publication date: 2008-03-13
Also published as: WO2006131783A3; AU2005320352A1; CA2555509A1; WO2006131783A2; AU2005320352A2; AU2005320352A8; EP1774046A2; EP1774046A4

Abstract

高感度且つ正確な新規の肺癌用マーカー。これらのマーカーは、正常な肺組織とは対照的に肺癌中で特異的に過剰発現する。患者サンプルにおける単独または組み合わせたこれらのマーカーの測定により、診断医が肺癌の診断予測と相関させることができる情報が得られる。本発明のマーカーは、単独または組み合わせて、肺癌と非癌状態とを高度に識別検出する。

Description

発明の分野
本発明は、肺癌の診断マーカーである新規のヌクレオチド配列およびタンパク質配列ならびにそのアッセイおよび使用方法に関する。

発明の背景
肺癌は、米国の男性および女性の癌死亡の主な原因であり、１９９４年に推定１７２，０００の新規の症例が報告されている。全肺癌患者の５年生存率は、診断時の病期と無関係に、１３％でしかない。これは、疾患がまだ限局している検出症例の５年生存率が４６％であることと対照的である。しかし、肺癌は、疾患の拡大前に１６％しか発見されない。肺癌は、小細胞肺癌または非小細胞肺癌に大きく分類される。非小細胞肺癌は、腺癌、気管支肺胞癌（ｂｒｏｎｃｈｏａｌｖｅｏｌａｒ−ａｌｖｅｏｌａｒ）、扁平上皮癌、および大細胞癌にさらに分類される。ほぼ７５〜８５％の肺癌が非小細胞肺癌であり、１５〜２５％が小細胞肺癌である。

疾患が進行した病期に達するまでしばしば臨床症状が認められないので、早期発見は困難である。現在、診断は、胸部Ｘ線の使用、痰に含まれる細胞型の分析、および気管支のファイバースコープ試験が用いられている。癌の型および病期によって治療計画を決定し、治療計画には、手術、放射線療法、および／または化学療法が含まれる。

原発性疾患、転移性疾患、および再発性疾患の早期発見は、肺癌を罹患した個体の予後に有意に影響を与え得る。初期段階で診断された非小細胞肺癌は、より進行した段階で診断されたものより結果が有意に良好である。同様に、小細胞肺癌の早期診断もより良好な予後の可能性を秘めている。

現行の放射線療法薬、化学療法薬、および生物毒素は強力な細胞毒素であるにもかかわらず、これらは正常な細胞と悪性細胞とを区別せず、副作用および用量規定毒性を生じる。肺癌特異的癌マーカーが依然として必要である。患者由来サンプル中の肺癌マーカーの存在を検出するために使用することができる試薬およびキットが依然として必要である。肺癌を有する個体のスクリーニング方法および診断方法、ならびに肺癌と診断された患者の治療に対する応答、疾患の進行、および疾患の再発のモニタリング方法が依然として必要である。肺癌を有する個体の肺癌型を決定するための試薬、キット、および方法が依然として必要である。肺癌細胞を特異的にターゲティングすることができる組成物が依然として必要である。肺癌細胞に特異的に結合することができる造影剤が依然として必要である。改良された肺癌細胞の画像化方法が依然として必要である。肺癌細胞に特異的に結合することができる治療薬が依然として必要である。肺癌を罹患している疑いのある個体の改良された治療方法が依然として必要である。

発明の要旨
背景技術は、単独または組み合わせて十分に高感度および／または正確な肺癌用マーカーを教示も示唆もしていない。

本発明は、高感度且つ正確な肺癌用の新規のマーカーを提供することによって背景技術のこれらの欠点を克服している。さらに、これらのマーカーは、小細胞肺癌または非小細胞肺癌などの異なる肺癌型を区別することができ、さらに腺癌、扁平上皮癌、および大細胞癌などの非小細胞肺癌型を区別することができる。これらのマーカーは、正常な肺組織と対照的に肺癌中で特異的に過剰発現する。患者（生体）サンプル中での単独または組み合わせたこれらのマーカーの測定により、診断医が予想される肺癌診断と相関し得る情報が得られる。本発明のマーカーにより、単独または組み合わせて、肺癌と非癌性状態とが高度に差分検出される。

本発明の好ましい実施形態によれば、任意選択的に本発明の好ましい実施形態と共に使用することができる適切な生体サンプルの例には、血液、血清、血漿、血球、尿、痰、唾液、糞便、髄液またはＣＳＦ、リンパ液、皮膚の外分泌物、気道、腸管、および尿生殖路、涙、ミルク、神経組織、肺組織、任意のヒト器官または組織（任意の腫瘍組織または正常組織、洗浄によって得られた任意の（例えば、気管支系または胸管系の）サンプル、およびｉｎｖｉｖｏ細胞培養構成要素のサンプルが含まれる）が含まれるが、これらに限定されない。好ましい実施形態では、生体サンプルは、肺組織および／または痰および／または血清サンプルおよび／または尿サンプルおよび／または任意の他の組織または液体サンプルを含む。サンプルを、任意選択的に、サンプルを抗体と接触させる前および／または任意の他の診断アッセイの実施前に適切な溶出剤で希釈することができる。

細胞局在化に関するテキストで与えられた情報を、以下の４つの異なるソフトウェアプログラムにしたがって確定した：膜貫通領域の予想のための（ｉ）ｔｍｈｍｍ（ＣｅｎｔｅｒｆｏｒＢｉｏｌｏｇｉｃａｌＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓ，ＴｅｃｈｎｉｃａｌＵｎｉｖｅｒｓｉｔｙｏｆＤｅｎｍａｒｋＤＴＵ，ｈｔｔｐ：／／ｗｗｗ．ｃｂｓ．ｄｔｕ．ｄｋ／ｓｅｒｖｉｃｅｓ／ＴＭＨＭＭ／ＴＭＨＭＭ２．０ｂ．ｇｕｉｄｅ．ｐｈｐ由来）または（ｉｉ）ｔｍｐｒｅｄ（ＩＳＲＥＣＢｉｏｎｆｏｒｍａｔｉｃｓｇｒｏｕｐａｎｄｔｈｅＬＩＣＲＩｎｆｏｒｍａｔｉｏｎＴｅｃｈｎｏｌｏｇｙＯｆｆｉｃｅ，ＬｕｄｗｉｇＩｎｓｔｉｔｕｔｅｆｏｒＣａｎｃｅｒＲｅｓｅａｒｃｈ，ＳｗｉｓｓＩｎｓｔｉｔｕｔｅｏｆＢｉｏｉｎｆｏｒｍａｔｉｃｓ，ｈｔｔｐ：／／ｗｗｗ．ｃｈ．ｅｍｂｎｅｔ．ｏｒｇ／ｓｏｆｔｗａｒｅ／ＴＭＰＲＥＤ＿ｆｏｒｍ．ｈｔｍｌによって維持されたＥＭＢｎｅｔ；シグナルペプチド予想のための（ｉｉｉ）ｓｉｇｎａｌｐ＿ｈｍｍまたは（ｉｖ）ｓｉｇｎａｌｐ＿ｎｎ（共に、ＣｅｎｔｅｒｆｏｒＢｉｏｌｏｇｉｃａｌＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓ，ＴｅｃｈｎｉｃａｌＵｎｉｖｅｒｓｉｔｙｏｆＤｅｎｍａｒｋＤＴＵ，ｈｔｔｐ：／／ｗｗｗ．ｃｂｓ．ｄｔｕ．ｄｋ／ｓｅｒｖｉｃｅｓ／ＳｉｇｎａｌＰ／ｂａｃｋｇｒｏｕｎｄ／ｐｒｅｄｉｃｔｉｏｎ．ｐｈｐ由来）。用語「ｓｉｇｎａｌｐ＿ｈｍｍ」および「ｓｉｇｎａｌｐ＿ｎｎ」は、プログラムＳｉｇｎａｌＰについての２つの操作モードをいい、ｈｍｍはＨｉｄｄｅｎＭａｒｋｏｖＭｏｄｅｌをいい、ｎｎは神経回路網をいう。公知のタンパク質局在化および／または遺伝子構造の手による検査ならびに各発明者による発見的方法の使用によっても局在化を決定した。ある場合には、細胞局在化予想の手による検査について、発明者らは、ＰｒｏＬｏｃ計算プラットフォーム（ＥｉｎａｔＨａｚｋａｎｉ−Ｃｏｖｏ，ＥｒｅｚＬｅｖａｎｏｎ，ＧａｌｉｔＲｏｔｍａｎ，ＤａｎＧｒａｕｒａｎｄＡｍｉｔＮｏｖｉｋ；（２００４）“Ｅｖｏｌｕｔｉｏｎｏｆｍｕｌｔｉｃｅｌｌｕｌａｒｉｔｙｉｎｍｅｔａｚｏａ：ｃｏｍｐａｒａｔｉｖｅａｎａｌｙｓｉｓｏｆｔｈｅｓｕｂｃｅｌｌｕｌａｒｌｏｃａｌｉｚａｔｉｏｎｏｆｐｒｏｔｅｉｎｓｉｎＳａｃｃｈａｒｏｍｙｃｅｓ，ＤｒｏｓｏｐｈｉｌａａｎｄＣａｅｎｏｒｈａｂｄｉｔｉｓ．” ＣｅｌｌＢｉｏｌｏｇｙＩｎｔｅｒｎａｔｉｏｎａｌ２００４；２８（３）：１７１−８．）を使用し、このプラットフォームは、種々のパラメータ（タンパク質ドメイン（例えば、タンパク質内の膜貫通領域およびその局在化の予想）、ｐＩ、タンパク質の長さ、アミノ酸組成、予め注釈をつけたタンパク質に対する相同性、一定のオルガネラにタンパク質を向かわせる配列パターン（核局在化シグナル（ＮＬＳ）、ミトコンドリア局在化シグナルなど）の認識、シグナルペプチドおよびアンカーのモデリング、ならびに単一区画に特異的なＰｆａｍ由来の固有のドメインの使用が含まれる）に基づいてタンパク質局在化を予想する。

ＳＮＰ（一塩基多型）に関するテキストから情報が得られる。略語の説明を以下に示す。「Ｔ−＞Ｃ」は、例えば、ＳＮＰによってテーブル中に与えられた位置がＴからＣに変化することを意味する。同様に、「Ｍ−＞Ｑ」は、例えば、ＳＮＰにより、対応するアミノ酸配列中のメチオニン（Ｍ）がグアニン（Ｑ）に変化したことを意味する。ヌクレオチド配列ＳＮＰの右側の文字の代わりに、スペースが存在する場合、フレームシフトが生じたことを示す。フレームシフトを、ハイフン（−）で示すこともできる。終止コドンを、右側にアスタリスク（＊）で示す。ＳＮＰの記載の一部として、ＳＮＰ自体の上記記述後に括弧内にコメントを見出すことができる。このコメントは、示したＡＮＰを使用して作製したＳｗｉｓｓＰｒｏｔエントリーに対する識別子であるＦＴＩｄを含み得る。ＦＴＩｄは固有且つ安定なフィーチャー（ｆｅａｔｕｒｅ）識別子であり、フィーチャーテーブル中の位置特異的注釈から特化したタンパク質関連データベースへのリンクを直接的に構築する。ＦＴＩｄは常に記述フィールド中のフィーチャーの最後の構成要素である：ＦＴＩｄ＝ＸＸＸ＿数（ＸＸＸは、６桁数から下線によって分離された特定のフィーチャーキーの３文字表記である）。本発明の選択されたスプライスバリアントの野生型タンパク質のアミノ酸変異の表では、第１行目のヘッダーは、「アミノ酸配列上のＳＮＰの位置」であり、アミノ酸配列上の公知の変異の位置を示す。ＳＮＰを、任意選択的に、単独または１つまたは複数の他のＳＮＰおよび／または任意の他の診断マーカーと組み合わせて、本発明の診断マーカーとして使用することができる。本発明の好ましい実施形態は、このようなＳＮＰ（以下に示した公知の（ＷＴまたは野生型）タンパク質配列上のＳＮＰならびにこのようなＳＮＰによって形成された新規の核酸配列および／またはアミノ酸配列、および／または本明細書中に記載の変異アミノ酸配列および／または核酸配列上の任意のＳＮＰが含まれるが、これらに限定されない）を含む。

公知のタンパク質との相同性に関してテキスト中に示した情報を、以下の特定の（非デフォルト）パラメータを使用したＳｍｉｔｈ−Ｗａｔｅｒｍａｎｖｅｒｓｉｏｎ５．１．２によって決定した：
−ｍｏｄｅｌ=ｓｗ．ｍｏｄｅｌ
−ＧＡＰＥＸＴ=０
−ＧＡＰＯＰ=１００．０
−ＭＡＴＲＩＸ=ｂｌｏｓｕｍ１００

ＥＳＴに基づいた癌中のクラスターの過剰発現に関する情報が得られる。このような過剰発現分析に関するｐ値の手がかりは以下である：

−ライブラリベースの統計学：細胞株中での発現レベルを含まないＰ値（Ｐ１）
−ライブラリベースの統計学：細胞株中での発現レベルを含むＰ値（Ｐ２）
−ＥＳＴクローン統計学：細胞株中での発現レベルを含まないＰ値（ＳＰ１）
−ＥＳＴクローン統計学：細胞株中での発現レベルを含まない推定過剰発現率（Ｒ３）
− ＥＳＴクローン統計学：細胞株中での発現レベルを含むＰ値（ＳＰ２）
− ＥＳＴクローン統計学：細胞株中での発現レベルを含む推定過剰発現率（Ｒ４）

ライブラリベースの統計学は、全ライブラリにわたる統計学をいい、ＥＳＴクローン統計学は、特定の組織または癌からのＥＳＴについてのみの発現をいう。

マイクロアレイに基づいた癌中のクラスターの過剰発現についての情報が得られる。マイクロアレイの基準として、特定のセグメントパラグラフでは、省略していない組織名を、発現を測定したチップ型を基準として使用した。マイクロアレイの結果は以下の２つのタイプがある：本発明によるデザインによって調製したマイクロアレイ由来のタイプ（マイクロアレイ作製手順は、本明細書中の「材料と実験手順」の項に詳述している）およびＡｆｆｙｍｅｔｒｉｘｔｅｃｈｎｏｌｏｇｙを使用したマイクロアレイ由来の型。マイクロアレイ基準として、特定のセグメントパラグラフでは、省略していない組織名を、発現を測定したチップ型を基準として使用した。本発明によるデザインにしたがって調製したマイクロアレイについて、プローブ名は、クラスター（遺伝子）名から始まり、識別番号が続く。Ａｆｆｙｍｅｔｒｉｘデータから得たオリゴヌクレオチドマイクロアレイの結果は、ＡｆｆｙｍｅｔｒｉｘＩｎｃ，ＳａｎｔａＣｌａｒａ，ＣＡ，ＵＳＡから利用可能なチップに由来した（例えば、ｗｗｗ．ａｆｆｙｍｅｔｒｉｘ．ｃｏｍ／ｐｒｏｄｕｃｔｓ／ａｒｒａｙｓ／ｓｐｅｃｉｆｉｃ／ｈｇｕ１３３．ａｆｆｘのＨｕｍａｎＧｅｎｏｍｅＵ１３３（ＨＧ−Ｕ１３３）Ｓｅｔ；ｗｗｗ．ａｆｆｙｍｅｔｒｉｘ．ｃｏｍ／ｐｒｏｄｕｃｔｓ／ａｒｒａｙｓ／ｓｐｅｃｉｆｉｃ／ｈｇｕ１３３ａｖ２．ａｆｆｘのＧｅｎｅＣｈｉｐＨｕｍａｎＧｅｎｏｍｅＵ１３３Ａ２．０Ａｒｒａｙ；およびｗｗｗ．ａｆｆｙｍｅｔｒｉｘ．ｃｏｍ／ｐｒｏｄｕｃｔｓ／ａｒｒａｙｓ／ｓｐｅｃｉｆｉｃ／ｈｇｕ１３３ｐｌｕｓ．ａｆｆｘのＨｕｍａｎＧｅｎｏｍｅＵ１３３Ｐｌｕｓ２．０Ａｒｒａｙに関するデータを参照のこと）。プローブ名は、Ａｆｆｙｍｅｔｒｉｘ命名規則のあとにくる。データは、ＮＣＢＩＧｅｎｅＥｘｐｒｅｓｓｉｏｎＯｍｎｉｂｕｓ（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｐｒｏｊｅｃｔｓ／ｇｅｏ／ａｎｄＥｄｇａｒｅｔａｌ，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，２００２，Ｖｏｌ．３０，Ｎｏ．１２０７−２１０を参照のこと）から利用可能である。ＳｅｒｉｅｓＧＳＥ１１３３データベース（２００４年３月公開）のデータセット（結果を含む）は、ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｇｅｏ／ｑｕｅｒｙ／ａｃｃ．ｃｇｉ?ａｃｃ=ＧＳＥ１１３３から利用可能である；これらの結果の参考文献は以下である：Ｓｕｅｔａｌ（ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．２００４Ａｐｒ２０；１０１（１６）：６０６２−７．Ｅｐｕｂ２００４Ａｐｒ０９）。本発明者がデザインしたプローブを以下に列挙する。

>H61775_0_11_0
CCCCAGCTTTTATAGAGCGGCCCAAGGAAGAATATTTCCAAGAAGTAGGG
>M85491_0_0_25999
GACATCTTTGCATATCATGTCAGAGCTATAACATCATTGTGGAGAAGCTC
>M85491_0_14_0
GTCATGAAAATCAACACCGAGGTGCGGAGCTTCGGACCTGTGTCCCGCAG
>Z21368_0_0_61857
AGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACTCTTGAAG
>HUMGRP5E_0_0_16630
GCTGATATGGAAGTTGGGGAATCTGAATTGCCAGAGAATCTTGGGAAGAG
>HUMGRP5E_0_2_0
TCTCATAGAAGCAAAGGAGAACAGAAACCACCAGCCACCTCAACCCAAGG
>D56406_0_5_0
TCTGACTTTTACGGACTTGGCTTGTTAGAAGGCTGAAAGATGATGGCAGG
>F05068_0_0_5744
ACGGGAGGGAAGGAAGGTGTGCGGGAGGAGTTCTCTGTCTCCACTCCCCT
>F05068_0_0_5754
CAAGGGGAACTGACCGTTGGTCCCGAAGGTCTAGAAGTGAATGGGAGCAG
>F05068_0_8_0
CTGGGCTTGGACTTCGGAGTTTTGCCATTGCCAGTGGGACGTCTGAGACT
>F05068_0_1_5751
TCTTAGCAGGTAGGTGCCGCAGACCCTGCGGGTTAAGAGGTGGGGTGGGG
>H38804_0_3_0
CGTAATTGCAGTGCATTTAGACAGGCATCTATTTGGACCTGTTTCTATCT
>HSENA78_0_1_0
TGAAGAGTGTGAGGAAAACCTATGTTTGCCGCTTAAGCTTTCAGCTCAGC
>R00299_0_8_0
CCAAGGCTCGTCTGCGCACCTTGTGTCTTGTAGGGTATGGTATGTGGGAC
>Z44808_0_8_0
AAAAGCATGAGTTTCTGACCAGCGTTCTGGACGCGCTGTCCACGGACATG
>Z44808_0_0_72347
ATGTTCTTAGGAGGCAAGCCAGGAGAAGCCGGGTCTGACTTTTCAGCTCA
>Z44808_0_0_72349
TCCTCCAGACCCAAAGCCACAACCCATCGCAAGTCAAGAACACTTTCCAG
>AA161187_0_0_433
ACCCTGGGTGGGCAAAAACGTGCTTTCCCGGACGGGGTTGAAGGGGAGAA
>AA161187_0_0_430
TGGAGACTGTTGCCCCACTCTGCAGATGCAGAAACGGAGGCTTGGCTGCT
>R66178_0_7_0
CCAGTGTGGTATCCTGGGAAACTCGGTTAAAAGGTGAGGCAGAGTACCAG
>HUMPHOSLIP_0_0_18458
AAGGAAGCAGGACCAGTGGATGTGAGGCGTGGTCGAAGAACAACAGAAAG
>HUMPHOSLIP_0_0_18487
ACAGGGGCCAGATGGTGACCCATGACCCAGCCTAAAAGGCAGCCAGAGGG
>AI076020_0_3_0
ATCAGCACTGCCACCTACACCACGGTGCCGCGCGTGGCCTTCTACGCCGG
>T23580_0_0_902
GTGAAACCCCATTGGCTTCATTGGCTCCTTGATTTAAACCACGCCCGGCT
>T23580_0_0_901
TGAGTCCGTGTTATATCATCTGGTCTCATTGATAGGCGGGATAGGGAGGG
>M79217_0_9_0
TTTGTGGAATAGCAACCCATGGTTATGGCGAGTGACCCGACGTGATCTGG
>M62096_0_0_20588
AAGGCTTAGGTGCAAAGCCATTGGATACCATACCTGAGACCACACAGCCA
>M62096_0_7_0
ACCAGAAGCAGCTGTCCAGACTCCGAGACGAAATTGAGGAGAAGCAGAAA
>M78076_0_7_0
GAGAAGATGAACCCGCTGGAACAGTATGAGCGAAAGGTGAATGCGTCTGT
>T99080_0_0_58896
AACTCACAGCAAGAGCTGTGTTCCAGTTAGCTTTGCTACCAGTTATGCAG
>T08446_0_9_0
CATTTCCACTACGAGAACGTTGACTTTGGCCACATTCAGCTCCTGCTGTC
>HUMCA1XIA_0_0_14909
GCTGCAATCTAAGTTTCGGAATACTTATACCACTCCAGAAATAATCCTCG
>HUMCA1XIA_0_18_0
TTCAGAACTGTTAACATCGCTGACGGGAAGTGGCATCGGGTAGCAATCAG
>T11628_0_9_0
ACAAGATCCCCGTGAAGTACCTGGAGTTCATCTCGGAATGCATCATCCAG
>T11628_0_0_45174
TAAACAATCAAAGAGCATGTTGGCCTGGTCCTTTGCTAGGTACTGTAGAG
>T11628_0_0_45161
TGCCTCGCCACAATGGCACCTGCCCTAAAATAGCTTCCCATGTGAGGGCT
>HUMCEA_0_0_96
CAAGAGGGGTTTGGCTGAGACTTTAGGATTGTGATTCAGCTTAGAGGGAC
>HUMCEA_0_0_15183
CCTGGTGGGAGCCCATGAGAAGCGAGTTCTCTGTGCAACGGACTTAGTAA
>HUMCEA_0_0_15182
GCTCCCTGGAGCATCAGCATCATATTCTGGGGTGGAGTCTATCTGGTTCT
>HUMCEA_0_0_15168
TCCTGCCTGTCACCTGAAGTTCTAGATCATTCCCTGGACTCCACTCTATC
>HUMCEA_0_0_15180
TTTAACACAGGATTGGGACAGGATTCAGAGGGACACTGTGGCCCTTCTAC
>R35137_0_5_0
TATGTGGAGGTGGTGAACATGGACGCTGCAGTGCAGCAGCAGATGCTGAA
>Z25299_0_3_0
AACTCTGGCACCTTGGGCTGTGGAAGGCTCTGGAAAGTCCTTCAAAGCTG
>HSSTROL3_0_0_12518
ATGAGAGTAACCTCACCCGTGCACTAGTTTACAGAGCATTCACTGCCCCA
>HSSTROL3_0_0_12517
CAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAA
>HSS100PCB_0_0_12280
CTCAAAATGAAACTCCCTCTCGCAGAGCACAATTCCAATTCGCTCTAAAA
>R20779_0_0_30670
CCGCGTTGCTTCTAGAGGCTGAATGCCTTTCAAATGGAGAAGGCTTCCAT

以下の組織の略語のリストを、ＴＡＡヒストグラムで使用した。用語「ＴＡＡ」は、「腫瘍関連抗原」を示し、テキスト中に示したＴＡＡヒストグラムは、以下の実施例１〜５に詳述するように、バイオマーカー選択エンジンによって予想される癌組織発現パターンを示す。
「ＢＯＮＥ」は「骨」であり；
「ＣＯＬ」は「結腸」であり；
「ＥＰＩ」は「上皮」であり；
「ＧＥＮ」は「全体（ｇｅｎｅｒａｌ）」であり；
「ＬＩＶＥＲ」は「肝臓」であり；
「ＬＵＮ」は「肺」であり；
「ＬＹＭＰＨ」は「リンパ節」であり；
「ＭＡＲＲＯＷ」は「骨髄」であり；
「ＯＶＡ」は「卵巣」であり；
「ＰＡＮＣＲＥＡＳ」は「膵臓」であり；
「ＰＲＯ」は「前立腺」であり；
「ＳＴＯＭＡＣＨ」は「胃」であり；
「ＴＣＥＬＬ」は「Ｔ細胞」であり；
「ＴＨＹＲＯＩＤ」は「甲状腺」であり；
「ＭＡＭ」は「乳房」であり；
「ＢＲＡＩＮ」は「脳」であり；
「ＵＴＥＲＵＳ」は「子宮」であり；
「ＳＫＩＮ」は「皮膚」であり；
「ＫＩＤＮＥＹ」は「腎臓」であり；
「ＭＵＳＣＬＥ」は「筋肉」であり；
「ＡＤＲＥＮ」は「副腎」であり；
「ＨＥＡＤ」は「頭頸部」であり；
「ＢＬＡＤＤＥＲ」は「膀胱」である。

用語「セグメント」、「ｓｅｇ」、および「ノード」は、本発明の核酸配列に関して交換可能に使用されることに留意すべきであり、これらは、下記の１つまたは複数の性質を有することが示された核酸配列の一部をいう。これらはまた、下記でより詳細に記載されるように、完全な核酸配列を構築するために使用された基礎単位である。任意選択的且つ好ましくは、これらは、本発明の実施形態であり（例えば、アンプリコン、ハイブリッド形成単位として）、そして／またはこれらに任意選択的にプライマーおよび／もしくは相補オリゴヌクレオチドが由来してもよく、そして／または任意の他の使用のためのオリゴヌクレオチドの例である。

本明細書中で使用される、句「肺癌」は、小細胞肺癌および非小細胞肺癌が含まれる肺の癌（肺腺癌、扁平上皮癌、および腺癌が含まれるが、これらに限定されない）をいう。

本発明の文脈中の用語「マーカー」は、肺癌（または上記の容態の１つ）を罹患していない被験体から採取した匹敵するサンプルと比較して、肺癌（または指示的容態（ｉｎｄｉｃａｔｉｖｅｃｏｎｄｉｔｉｏｎ）の１つ）を罹患した被験体（患者）から採取したサンプル中で異なって存在する核酸フラグメント、ペプチド、またはポリペプチドをいう。

句「異なって存在する」は、肺癌（または上記の容態の１つ）を罹患していない患者から採取した匹敵するサンプルと比較して、肺癌（または指示的容態の１つ）を罹患した患者から採取したサンプル中に存在するマーカーの量が異なることをいう。例えば、ハイブリッド形成および／またはＮＡＴベースのアッセイによって測定したところ、核酸フラグメントは、任意選択的に、一方のサンプル中の核酸フラグメント量が他方のサンプル中の核酸フラグメント量と有意に異なる場合、２サンプル間で異なって存在し得る。ポリペプチドは、一方のサンプル中のポリペプチド量が他方のサンプル中のポリペプチド量と有意に異なる場合、２サンプル間で異なって存在する。マーカーが一方のサンプルで検出可能であるが、他方のサンプルで検出不可能である場合、このようなマーカーを異なって存在すると見なすことができることに留意すべきである。

本明細書中で使用される、句「診断」は、病的状態の存在または性質の同定を意味する。診断方法は、その感度および特異性の点で異なる。診断アッセイの「感度」は、陽性反応を示す罹患個体の比率（「真の陽性」の比率）である。アッセイによって検出されない罹患個体は、「偽陰性」であえる。罹患せず、且つアッセイで陽性反応を示す被験体を、「真の陰性」と呼ぶ。診断アッセイの「特異性」は、１−偽陽性率（式中、「偽陰性」率を、陽性反応を示す罹患していない被験体の比率と定義する）である。特定の診断方法で容態を確実に診断できないとはいえ、この方法が診断を補助する明確な表示をする場合、十分である。

本明細書中で使用される、句「診断」は、疾患または症状の分類、疾患の重症度の決定、疾患の進行のモニタリング、疾患の結果および／または回復の見込みの予測をいう。用語「検出」はまた、任意選択的に、上記のいずれかを含み得る。

本発明の疾患の診断を、被験体から得た生体サンプル中の本発明のポリヌクレオチドまたはポリペプチドレベルの決定によって行うことができ、決定されたレベルは、疾患素因または疾患の有無と相関し得る。「被験体から得た生体サンプル」はまた、任意選択的に、以下でさらに詳述するように、被験体から物理的に取り出していないサンプルを含み得ることに留意すべきである。

本明細書中で使用される、用語「レベル」は、本発明のＲＮＡおよび／もしくはタンパク質の発現レベルまたはマーカーのＤＮＡコピー数をいう。

典型的には、被験体から得た生体サンプル中のマーカーレベルは、健常な個体から得た類似のサンプル中の同一の変異型のレベルと異なる（すなわち、多いか少ない）（生体サンプルの例は、本明細書中に記載されている）。

多数の周知の組織または流動物の回収方法を使用して、被験体から生体サンプルを回収し、被験体中の目的の変異型のＤＮＡ、ＲＮＡ、および／またはポリペプチドのレベルを決定することができる。

例には、細針生検、針生検、コアニードル生検（ｃｏｒｅｎｅｅｄｌｅｂｉｏｐｓｙ）、および外科生検（例えば、脳生検）、および洗浄が含まれるが、これらに限定されない。使用手順に関係なく、一旦生検／サンプルが得られると、変異型のレベルを決定し、それにより診断することができる。

同一起源の正常組織中の同一変異型のレベルの決定を、正常組織と対照的な変異型の発現および／または増幅の増加および／または発現の減少を検出するために同時に行うことが好ましい。

マーカーの「試験量」は、肺癌（または指示的容態の１つ）の診断と一致する被験体サンプル中のマーカーの量をいう。試験量は、絶対量（例えば、μｇ／ｍｌ）または相対量（例えば、シグナルの相対強度）のいずれかであり得る。

マーカーの「コントロール量」は、マーカーの試験量と比較すべき任意の量または量の範囲であり得る。例えば、マーカーのコントロール量は、肺癌（または指示的容態の１つ）患者または肺癌（または指示的容態の１つ）を罹患していないヒトのマーカーの量であり得る。コントロール量は、絶対量（例えば、μｇ／ｍｌ）または相対量（例えば、シグナルの相対強度）のいずれかであり得る。

「検出」は、検出すべき目的物の存在、非存在、または量の同定をいう。

「標識」は、顕微鏡手段、光化学的手段、生化学的手段、免疫化学的手段、または化学的手段によって検出可能な任意の部分または要素（ｉｔｅｍ）を含む。例えば、有用な標識には、^３２Ｐ、^３５Ｓ、蛍光色素、電子密度の高い試薬、酵素（例えば、一般に、ＥＬＩＳＡで使用される）、ビオチン−ストレプトアビジン、ジオキシゲニン、抗血清もしくはモノクローナル抗体を利用可能なハプテンおよびタンパク質、または標的と配列が相補的な核酸分子が含まれる。標識は、しばしば、放射性、発色性、または蛍光のシグナルなどの測定可能なシグナルを生じ、これらを使用して、サンプル中の結合標識量を定量することができる。標識を、共有結合、イオン結合、ファンデルワールス結合、または水素結合のいずれかによってプライマーまたはプローブ中に組み込むか、これらに結合させることができる（例えば、放射性ヌクレオチドまたはストレプトアビジンによって認識されるビオチン化ヌクレオチドの組み込み）。標識を、直接または間接的に検出することができる。間接的検出は、直接または間接的な第１の標識への第２の標識の結合を含み得る。例えば、標識は、ストレプトアビジンの結合パートナーであるビオチンまたは特異的にハイブリッド形成することができる相補配列の結合パートナーであるヌクレオチド配列などの結合パートナーのリガンドであり得る。結合パートナー自体を直接検出することができ、例えば、抗体自体を蛍光分子で標識することができる。結合パートナーは間接的にも検出することができ、例えば、相補ヌクレオチド配列を有する核酸は、他の標識核酸分子とのハイブリッド形成によって検出することができる分岐ＤＮＡ分子の一部であり得る（例えば、Ｐ．Ｄ．ＦａｈｒｌａｎｄｅｒａｎｄＡ．Ｋｌａｕｓｎｅｒ，Ｂｉｏ／Ｔｅｃｈｎｏｌｏｇｙ６：１１６５（１９８８）を参照のこと）。例えば、シンチレーション計数、デンシトメトリー、またはフローサイトメトリーによってシグナルを定量する。

任意選択的および好ましくは免疫アッセイと共に使用するための例示的な検出可能な標識には、磁性ビーズ、蛍光色素、放射性標識、酵素（例えば、西洋ワサビペルオキシダーゼ、アルカリホスファターゼ、およびＥＬＩＳＡで一般的に使用されている他の酵素）、および熱量測定標識（コロイド金もしくは着色ガラスなど）、またはプラスチックビーズが含まれるが、これらに限定されない。あるいは、サンプル中のマーカーを、間接的アッセイ（例えば、第２の標識抗体を使用して結合したマーカー特異的抗体を検出する）を使用し、そして／または競合アッセイまたは阻害アッセイ（例えば、マーカーの異なるエピトープに結合するモノクローナル抗体を混合物と同時にインキュベートする）で検出することができる。

「免疫アッセイ」は、抗原に特異的に結合する抗体を使用するアッセイである。免疫アッセイは、抗原を単離、ターゲティング、および／または定量するための特定の抗体の特異的結合特性の使用によって特徴づけられる。

句、抗体に「特異的に（または選択的に）結合する」または「〜と特異的に（または選択的に）免疫反応性を示す」は、タンパク質またはペプチド（または他のエピトープ）をいう場合、タンパク質または他の生物製剤（ｂｉｏｌｏｇｉｃｓ）の不均一な集団中のタンパク質の存在を決定する結合反応をいう。したがって、指定の免疫アッセイ条件下で、特定の抗体は、特定のタンパク質にバックグラウンド（非特異的シグナル）の少なくとも２倍を超えて結合し、サンプル中に存在する他のタンパク質に有意な量で実質的に結合しない。このような条件下での抗体の特異的結合は、特定のタンパク質に対するその特異性について選択された抗体が必要であり得る。例えば、ラット、マウス、またはヒトなどの特定の種由来の精液塩基性タンパク質に対して惹起したポリクローナル抗体を選択して、精液塩基性タンパク質と特異的に免疫反応するが、他のタンパク質（精液塩基性タンパク質の多型性変異型および対立遺伝子を除く）と反応しないポリクローナル抗体のみを得ることができる。他の種から精液塩基性タンパク質分子と交差反応する抗体を引くことによって、この選択を行うことができる。種々の免疫アッセイ形式を使用して、特定のタンパク質と特異的な免疫反応性を示す抗体を選択することができる。例えば、固相ＥＬＩＳＡ免疫アッセイを日常的に使用して、タンパク質と特異的免疫反応性を示す抗体を選択する（例えば、特異的免疫反応性を検出するために使用することができる免疫アッセイの形式および条件の説明については、Ｈａｒｌｏｗ＆Ｌａｎｅ，Ａｎｔｉｂｏｄｉｅｓ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（１９８８）を参照のこと）。典型的には、特異的反応または選択的反応は、バックグラウンドシグナルまたはノイズの少なくとも２倍、より典型的にはバックグラウンドの１０〜１００倍である。

本発明の好ましい実施形態によれば、好ましくは、任意の上記核酸配列および／またはアミノ酸配列は、これらの配列と少なくとも約７０％、好ましくは少なくとも約８０％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同な任意の配列をさらに含む。

他で示さない限り、全ての実験データは、本発明の変異型に関し、試験されたセグメントにしたがって命名される（記載のように発現をＲＴ−ＰＣＲによって試験した場合）。

本発明の実施形態として本明細書中に示した全ての核酸配列および／またはアミノ酸配列は、その単離形態（単離ポリヌクレオチド（全転写物が含まれる）、オリゴヌクレオチド（全セグメント、アンプリコン、およびプライマーが含まれる）、ペプチド（全てのテール、架橋、挿入、または先端（任意選択的に、本明細書中に記載の他の抗体エピトープが含まれる）、および／またはポリペプチド（全タンパク質が含まれる）が含まれる）など）に関する。オリゴヌクレオチドとポリヌクレオチドまたはペプチドとポリペプチドとを、任意選択的に、交換可能に使用することができることに留意すべきである。

本発明の好ましい実施形態によれば、配列番号１および２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０２２、１０２３、１０２４、１０２５、１０２６、および１０２７を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２８１および１２８２を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３および４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０２８、１０２９、１０３０、１０３１、１０３２、１０３３、１０３４、１０３５、１０３６、１０３７、および１０３８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２８３および１２８４を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号５、６、７、および８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０３９、１０４０、１０４１、１０４２、１０４３、１０４４、１０４５、１０４６、１０４７、１０４８、１０４９、１０５０、１０５１、１０５２、１０５３、１０５４、１０５５、１０５６、１０５７、１０５８、１０５９、１０６０、１０６１、１０６２、１０６３、１０６４、１０６５、および１０６６を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２８５、１２８６、１２８７、および１２８８を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号９、１０、１１、１２、１３、１４、および１５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０６７、１０６８、１０６９、１０７０、１０７１、１０７２、１０７３、１０７４、１０７５、１０７６、１０７７、１０７８、１０７９、１０８０、１０８１、１０８２、１０８３、１０８４、１０８５、１０８６、１０８７、１０８８、１０８９、１０９０、１０９１、１０９２、１０９３、１０９４、１０９５、１０９６、１０９７、１０９８、１０９９、および１１００を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２８９、１２９０、１２９１、１２９２、１２９３、および１２９４を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号２０および２１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１３０、１１３１、１１３２、１１３３、および１１３４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２９９および１３００を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号２２、２３、および２４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１３５、１１３６、１１３７、１１３８、１１３９、１１４０、１１４１、１１４２、１１４３、および１１４４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３０１、１３０２、および１３０３を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号２５、２６、および２７を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１４５、１１４６、１１４７、１１４８、１１４９、１１５０、１１５１、１１５２、１１５３、１１５４、１１５５、および１１５６を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３０４および１３０５を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号２８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１５７、１１５８、１１５９、１１６０、１１６１、１１６２、１１６３、１１６４、１１６５、１１６６、１１６７、１１６８、１１６９、１１７０、および１１７１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３０６を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号２９および３０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１７２、１１７３、１１７４、１１７５、１１７６、１１７７、１１７８、１１７９、１１８０、１１８１、１１８２、１１８３、１１８４、１１８５、１１８６、１１８７、１１８８、１１８９、１１９０、および１１９１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３０７および１３０８を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１９２、１１９３、１１９４、１１９５、１１９６、１１９７、および１１９８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３０９を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１９９、１２００、１２０１、１２０２、１２０３、１２０４、１２０５、１２０６、１２０７、１２０８、１２０９、１２１０、１２１１、１２１２、１２１３、１２１４、および１２１５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１０を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２１６および１２１７、１２１８、１２１９、１２２０、１２２１、１２２２、１２２３、１２２４、１２２５、１２２６、および１２２７を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１１を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２２８、１２２９、１２３０、１２３１、１２３２、および１２２３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１２を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２３４、１２３５、１２３６、１２３７、１２３８、１２３９、１２４０、１２４１、１２４２、１２４３、１２４４、１２４５、１２４６、１２４７、１２４８、１２４９、１２５０、１２５１、１２５２、１２５３、および１２５４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１３を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号３６、３７、３８、３９、および４０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２５５、１２５６、１２５７、１２５８、１２５９、１２６０、１２６１、１２６２、１２６３、１２６４、１２６５、１２６６、１２６７、１２６８、１２６９、１２７０、１２７１、１２７２、１２７３、１２７４、および１２７５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１４、１３１５、１３１６、および１３１７を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２５、１２６、１２７、１２８、１２９、および１３０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号８８７、８８８、８８９、８９０、８９１、８９２、８９３、８９４、８９５、８９６、８９７、８９８、８９９、９００、９０１、および９０２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３９４、１３９５、１３９６、１３９７、および１３９８を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１および１３２の転写物を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号９０３、９０４、９０５、９０６、９０７、９０７、９０８、および９０９を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３９９および１４００を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号９９、１００、１０１、および１０２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号７４２、７４３、７４４、７４５、７４６、７４７、７４８、７４９、７５０、７５１、７５２、７５３、７５４、７５５、７５６、７５７、７５８、７５９、７６０、７６１、７６２、７６３、７６４、７６５、７６６、７６７、７６８、７６９、７７０、７７１、７７２、７７３、７７４、７７５、７７６、７７７、７７８、７７９、７８０、７８１、７８２、７８３、７８４、７８５、７８６、７８７、および７８８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３７２、１３７３、１３７４、および１３７５を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号９１３、９１４、９１５、９１６、９１７、９１８、９１９、９２０、９２１、９２２、９２３、９２４、９２５、９２６、９２７、９２８、９２９、９３０、９３１、９３２、９３３、９３４、９３５、および９３６を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４０２を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号９１０、９１１、および９１２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４１、１４２、および１４２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号９６１、９６２、９６３、９６４、９６５、９６６、９６７、９６８、９６９、９７０、９７１、９７２、９７３、９７４、９７５、９７６、９７７、９７８、９７９、９８０、９８１、９８２、９８３、９８４、９８５、９８６、９８７、９８８、９８９、および９９０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、タンパク質名：
ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１、
ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５、
ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号５１、５２、５３、５４、５５、５６、および５７を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号５１８、５１９、５２０、５２１、５２２、５２３、５２４、５２５、５２６、５２７、５２８、５２９、５３０、５３１、５３２、５３３、５３４、５３５、５３６、５３７、５３８、５３９、５４０、５４１、５４２、５４３、５４４、５４５、５４６、５４７、５４８、５４９、５５０、５５１、５５２、５５３、５５４、５５５、５５６、５５７、５５８、５５９、５６０、５６１、５６２、５６３、５６４、５６５、５６６、５６７、５６８、５６９、および５７０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３２７、１３２８、１３２９、１３３０、１３３１、１３３２、および１３３３を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３５、１３６、１３７、１３８、１３９、および１４０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号９３７、９３８、９３９、９４０、９４１、９４２、９４３、９４４、９４５、９４６、９４７、９４８、９４９、９５０、９５１、９５２、９５３、９５４、９５５、９５６、９５７、９５８、９５９、および９６０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４０３、１４０４、１４０５、１４０６、１４０７、および１４０８を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号４１、４２、４３、４４、４５、４６、および４７を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号４８２、４８３、４８４、４９５、４８６、４８７、４８８、４８９、４９０、４９１、４９２、４９３、４９４、４９５、４９６、４９７、４９８、４９９、５００、および５０１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３１８、１３１９、１３２０、１３２１、１３２２、および１３２３を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２１、１２２、１２３、および１２４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号８７６、８７７、８７８、８７９、８８０、８８１、８８２、８８３、８８４、８８５、および８８６を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３９０、１３９１、１３９２、および１３９３を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号４８、４９、および５０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号５０２、５０３、５０４、５０５、５０６、５０７、５０８、５０９、５１０、５１１、５１２、５１３、５１４、５１５、５１６、および５１７を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３２４、１３２５、および１３２６を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４６４および１４６５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１２７６、１２７７、１２７８、１２７９、および１２８０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４１５を含む単離ポリペプチドを提供する。

転写物に対応するタンパク質名：
ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５；ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１；ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ２。

本発明の好ましい実施形態によれば、配列番号５８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号５７１、５７２、５７３、５７４、５７５、５７６、５７７、および５７８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３３４を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号７４、７５、７６、７７、７８、７９、８０、８１、および８２を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号６５９、６６０、６６１、６６２、６６３、６６４、６６５、６６６、６６７、６６８、６６９、６７０、６７１、６７２、６７３、６７４、６７５、６７６、６７７、６７８、６７９、６８０、６８１、６８２、６８３、６８４、６８５、６８６、６８７、６８８、６８９、６９０、６９１、６９２、および６９３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３５０、１３５１、１３５２、１３５３、１３５４、１３５５、１３５６、および１３５７を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号：転写物名Ｔ２３５８０＿Ｔ１０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号５７９、５８０、５８１、５８２、および５８３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３３５を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号５９、６０、６１、６２、６３、および６４を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号５８４、５８５、５８６、５８７、５８８、５８９、５９０、５９１、５９２、５９３、５９４、５９５、５９６、５９７、５９８、５９９、６００、６０１、６０２、６０３、６０４、６０５、６０６、６０７、６０８、６０９、６１０、６１１、６１２、６１３、６１４、および６１５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３３６、１３３７、１３３８、１３３９、および１３４０を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号６５、６６、６７、６８、６９、７０、７１、７２、および７３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号６１６、６１７、６１８、６１９、６２０、６２１、６２２、６２３、６２４、６２５、６２６、６２７、６２８、６２９、６３０、６３１、６３２、６３３、６３４、６３５、６３６、６３７、６３８、６３９、６４０、６４１、６４２、６４３、６４４、６４５、６４６、６４７、６４８、６４９、６５０、６５１、６５２、６５３、６５４、６５５、６５６、６５７、６５８、および６５９を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３４１、１３４２、１３４３、１３４４、１３４５、１３４６、１３４７、１３４８、および１３４９を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、および９６を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号６９５、６９６、６９７、６９８、６９９、７００、７０１、７０２、７０３、７０４、および７０５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３５８、１３５９、１３６０、１３６１、１３６２、１３６３、１３６４、１３６５、１３６６、１３６７、１３６８、および１３６９を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号９７および９８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号７０６、７０７、７０８、７０９、７１０、７１１、７１２、７１３、７１４、７１５、７１６、７１７、７１８、７１９、７２０、７２１、７２２、７２３、７２４、７２５、７２６、７２７、７２８、７２９、７３０、７３１、７３２、７３３、７３４、７３５、７３６、７３７、７３８、７３９、７４０、および７４１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３７０および１３７１を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０３、１０４、１０５、１０６、１０７、および１０８を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号７８９、７９０、７９１、７９２、７９３、７９４、７９５、７９６、７９７、７９８、７９９、８００、８０１、８０２、８０３、８０４、８０５、８０６、８０７、８０８、８０９、８１０、８１１、８１２、および８１３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３７６、１３７７、１３７８、および１３７９を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１１４、１１５、１１６、１１７、１１８、および１１９を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号８５６、８５７、８５８、８５９、８６０、８６１、８６２、８６３、８６４、８６５、８６６、８６７、８６８、８６９、８７０、８７１、８７２、８７３、８７４、および８７５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３８５、１３８６、１３８７、１３８８、および１３８９を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４４、１４５、１４６、１４７、１４８、および１４９を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号９９１、９９２、９９３、９９４、９９５、９９６、９９７、９９８、９９９、１０００、１００１、１００２、１００３、１００４、１００５、１００６、１００７、１００８、１００９、１０１０、１０１１、１０１２、１０１３、１０１４、１０１５、および１０１６を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４０９、１４１０、１４１１、１４１２、および１４１３を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１５０を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０１７、１０１８、１０１９、１０２０、および１０２１を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１４１４を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、配列番号１０９、１１０、１１１、１１２、および１１３を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号８１４、８１５、８１６、８１７、８１８、８１９、８２０、８２１、８２２、８２３、８２４、８２５、８２６、８２７、８２９、８３０、８３１、８３２、８３３、８３４、８３５、８３６、８３７、８３８、８３９、８４０、８４１、８４２、８４３、８４４、８４５、８４６、８４７、８４８、８４９、８５０、８５１、８５２、８５３、８５４、および８５５を含む単離ポリヌクレオチドを提供する。

本発明の好ましい実施形態によれば、配列番号１３８０、１３８１、１３８２、１３８３、および１３８４を含む単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ４をコードする単離キメラポリペプチドであって、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜４４５に対応し、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸１６５〜４４５にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱＧＡＱＹＷＶＹＤＧＥＫＰＶＬＧＰＡＰＬＴＥＬＧＬＶＲＦＰＶＨＡＡＬＶＷＧＰＥＫＮＫＩＹＦＦＲＧＲＤＹＷＲＦＨＰＳＴＲＲＶＤＳＰＶＰＲＲＡＴＤＷＲＧＶＰＳＥＩＤＡＡＦＱＤＡＤＧと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸４４６〜４９６に対応する配列ＡＬＧＶＲＱＬＶＧＧＧＨＳＳＲＦＳＨＬＶＶＡＧＬＰＨＡＣＨＲＫＳＧＳＳＳＱＶＬＣＰＥＰＳＡＬＬＳＶＡＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ４のテールをコードする単離ポリペプチドであって、ＨＳＳＴＲＯＬ３＿Ｐ４中の配列ＡＬＧＶＲＱＬＶＧＧＧＨＳＳＲＦＳＨＬＶＶＡＧＬＰＨＡＣＨＲＫＳＧＳＳＳＱＶＬＣＰＥＰＳＡＬＬＳＶＡＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ５をコードする単離キメラポリペプチドであって、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜３５８に対応し、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸１６５〜３５８にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸３５９〜３８２に対応する配列ＥＬＧＦＰＳＳＴＧＲＤＥＳＬＥＨＣＲＣＱＧＬＨＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ５のテールをコードする単離ポリペプチドであって、ＨＳＳＴＲＯＬ３＿Ｐ５中の配列ＥＬＧＦＰＳＳＴＧＲＤＥＳＬＥＨＣＲＣＱＧＬＨＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ７をコードする単離キメラポリペプチドであって、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜３５９に対応し、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸１６５〜３５９にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱＧと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸３６０〜３７０に対応する配列ＴＴＧＶＳＴＰＡＰＧＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ７のテールをコードする単離ポリペプチドであって、ＨＳＳＴＲＯＬ３＿Ｐ７中の配列ＴＴＧＶＳＴＰＡＰＧＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ７のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ８をコードする単離キメラポリペプチドであって、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜２８６に対応し、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸１６５〜２８６にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸２７８〜３０１に対応する配列ＶＲＰＣＬＰＶＰＬＬＬＣＷＰＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ８のテールをコードする単離ポリペプチドであって、ＨＳＳＴＲＯＬ３＿Ｐ８中の配列ＶＲＰＣＬＰＶＰＬＬＬＣＷＰＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ８のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ９をコードする単離キメラポリペプチドであって、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜９６に対応し、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸１〜９６にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫと少なくとも９０％相同な第１のアミノ酸配列と、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１１３〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸９７〜１４７にも対応するＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸１４８に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜３５９に対応し、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸１４９〜３４３にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱＧと少なくとも９０％相同な第３のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸３４４に対応する配列ＴＴＧＶＳＴＰＡＰＧＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第４のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、架橋アミノ酸、第３のアミノ酸配列、および第４のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ９の縁（ｅｄｇｅ）部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＲを含み、以下の構造：アミノ酸番号９６−ｘ〜９６のいずれかから始まり、アミノ酸番号９７＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ９の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＳＴＲＯＬ３＿Ｐ９のテールをコードする単離ポリペプチドであって、ＨＳＳＴＲＯＬ３＿Ｐ９中の配列ＴＴＧＶＳＴＰＡＰＧＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ９のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４をコードする単離キメラポリペプチドであって、ＣＡ１Ｂ＿ＨＵＭＡＮ＿Ｖ５のアミノ酸１〜１０５６に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のアミノ酸１〜１０５６にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥＹＡＰＥＤＩＩＥＹＤＹＥＹＧＥＡＥＹＫＥＡＥＳＶＴＥＧＰＴＶＴＥＥＴＩＡＱＴＥＡＮＩＶＤＤＦＱＥＹＮＹＧＴＭＥＳＹＱＴＥＡＰＲＨＶＳＧＴＮＥＰＮＰＶＥＥＩＦＴＥＥＹＬＴＧＥＤＹＤＳＱＲＫＮＳＥＤＴＬＹＥＮＫＥＩＤＧＲＤＳＤＬＬＶＤＧＤＬＧＥＹＤＦＹＥＹＫＥＹＥＤＫＰＴＳＰＰＮＥＥＦＧＰＧＶＰＡＥＴＤＩＴＥＴＳＩＮＧＨＧＡＹＧＥＫＧＱＫＧＥＰＡＶＶＥＰＧＭＬＶＥＧＰＰＧＰＡＧＰＡＧＩＭＧＰＰＧＬＱＧＰＴＧＰＰＧＤＰＧＤＲＧＰＰＧＲＰＧＬＰＧＡＤＧＬＰＧＰＰＧＴＭＬＭＬＰＦＲＹＧＧＤＧＳＫＧＰＴＩＳＡＱＥＡＱＡＱＡＩＬＱＱＡＲＩＡＬＲＧＰＰＧＰＭＧＬＴＧＲＰＧＰＶＧＧＰＧＳＳＧＡＫＧＥＳＧＤＰＧＰＱＧＰＲＧＶＱＧＰＰＧＰＴＧＫＰＧＫＲＧＲＰＧＡＤＧＧＲＧＭＰＧＥＰＧＡＫＧＤＲＧＦＤＧＬＰＧＬＰＧＤＫＧＨＲＧＥＲＧＰＱＧＰＰＧＰＰＧＤＤＧＭＲＧＥＤＧＥＩＧＰＲＧＬＰＧＥＡＧＰＲＧＬＬＧＰＲＧＴＰＧＡＰＧＱＰＧＭＡＧＶＤＧＰＰＧＰＫＧＮＭＧＰＱＧＥＰＧＰＰＧＱＱＧＮＰＧＰＱＧＬＰＧＰＱＧＰＩＧＰＰＧＥＫＧＰＱＧＫＰＧＬＡＧＬＰＧＡＤＧＰＰＧＨＰＧＫＥＧＱＳＧＥＫＧＡＬＧＰＰＧＰＱＧＰＩＧＹＰＧＰＲＧＶＫＧＡＤＧＶＲＧＬＫＧＳＫＧＥＫＧＥＤＧＦＰＧＦＫＧＤＭＧＬＫＧＤＲＧＥＶＧＱＩＧＰＲＧＥＤＧＰＥＧＰＫＧＲＡＧＰＴＧＤＰＧＰＳＧＱＡＧＥＫＧＫＬＧＶＰＧＬＰＧＹＰＧＲＱＧＰＫＧＳＴＧＦＰＧＦＰＧＡＮＧＥＫＧＡＲＧＶＡＧＫＰＧＰＲＧＱＲＧＰＴＧＰＲＧＳＲＧＡＲＧＰＴＧＫＰＧＰＫＧＴＳＧＧＤＧＰＰＧＰＰＧＥＲＧＰＱＧＰＱＧＰＶＧＦＰＧＰＫＧＰＰＧＰＰＧＫＤＧＬＰＧＨＰＧＱＲＧＥＴＧＦＱＧＫＴＧＰＰＧＰＧＧＶＶＧＰＱＧＰＴＧＥＴＧＰＩＧＥＲＧＨＰＧＰＰＧＰＰＧＥＱＧＬＰＧＡＡＧＫＥＧＡＫＧＤＰＧＰＱＧＩＳＧＫＤＧＰＡＧＬＲＧＦＰＧＥＲＧＬＰＧＡＱＧＡＰＧＬＫＧＧＥＧＰＱＧＰＰＧＰＶと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のアミノ酸１０５７〜１０８１に対応する配列ＶＳＭＭＩＩＮＳＱＴＩＭＶＶＮＹＳＳＳＦＩＴＬＭＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のテールをコードする単離ポリペプチドであって、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４中の配列ＶＳＭＭＩＩＮＳＱＴＩＭＶＶＮＹＳＳＳＦＩＴＬＭＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５をコードする単離キメラポリペプチドであって、ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸１〜７１４に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のアミノ酸１〜７１４にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥＹＡＰＥＤＩＩＥＹＤＹＥＹＧＥＡＥＹＫＥＡＥＳＶＴＥＧＰＴＶＴＥＥＴＩＡＱＴＥＡＮＩＶＤＤＦＱＥＹＮＹＧＴＭＥＳＹＱＴＥＡＰＲＨＶＳＧＴＮＥＰＮＰＶＥＥＩＦＴＥＥＹＬＴＧＥＤＹＤＳＱＲＫＮＳＥＤＴＬＹＥＮＫＥＩＤＧＲＤＳＤＬＬＶＤＧＤＬＧＥＹＤＦＹＥＹＫＥＹＥＤＫＰＴＳＰＰＮＥＥＦＧＰＧＶＰＡＥＴＤＩＴＥＴＳＩＮＧＨＧＡＹＧＥＫＧＱＫＧＥＰＡＶＶＥＰＧＭＬＶＥＧＰＰＧＰＡＧＰＡＧＩＭＧＰＰＧＬＱＧＰＴＧＰＰＧＤＰＧＤＲＧＰＰＧＲＰＧＬＰＧＡＤＧＬＰＧＰＰＧＴＭＬＭＬＰＦＲＹＧＧＤＧＳＫＧＰＴＩＳＡＱＥＡＱＡＱＡＩＬＱＱＡＲＩＡＬＲＧＰＰＧＰＭＧＬＴＧＲＰＧＰＶＧＧＰＧＳＳＧＡＫＧＥＳＧＤＰＧＰＱＧＰＲＧＶＱＧＰＰＧＰＴＧＫＰＧＫＲＧＲＰＧＡＤＧＧＲＧＭＰＧＥＰＧＡＫＧＤＲＧＦＤＧＬＰＧＬＰＧＤＫＧＨＲＧＥＲＧＰＱＧＰＰＧＰＰＧＤＤＧＭＲＧＥＤＧＥＩＧＰＲＧＬＰＧＥＡＧＰＲＧＬＬＧＰＲＧＴＰＧＡＰＧＱＰＧＭＡＧＶＤＧＰＰＧＰＫＧＮＭＧＰＱＧＥＰＧＰＰＧＱＱＧＮＰＧＰＱＧＬＰＧＰＱＧＰＩＧＰＰＧＥＫと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のアミノ酸７１５〜７２９に対応する配列ＭＣＣＮＬＳＦＧＩＬＩＰＬＱＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のテールをコードする単離ポリペプチドであって、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５中の配列ＭＣＣＮＬＳＦＧＩＬＩＰＬＱＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６をコードする単離キメラポリペプチドであって、ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸１〜６４８に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のアミノ酸１〜６４８にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥＹＡＰＥＤＩＩＥＹＤＹＥＹＧＥＡＥＹＫＥＡＥＳＶＴＥＧＰＴＶＴＥＥＴＩＡＱＴＥＡＮＩＶＤＤＦＱＥＹＮＹＧＴＭＥＳＹＱＴＥＡＰＲＨＶＳＧＴＮＥＰＮＰＶＥＥＩＦＴＥＥＹＬＴＧＥＤＹＤＳＱＲＫＮＳＥＤＴＬＹＥＮＫＥＩＤＧＲＤＳＤＬＬＶＤＧＤＬＧＥＹＤＦＹＥＹＫＥＹＥＤＫＰＴＳＰＰＮＥＥＦＧＰＧＶＰＡＥＴＤＩＴＥＴＳＩＮＧＨＧＡＹＧＥＫＧＱＫＧＥＰＡＶＶＥＰＧＭＬＶＥＧＰＰＧＰＡＧＰＡＧＩＭＧＰＰＧＬＱＧＰＴＧＰＰＧＤＰＧＤＲＧＰＰＧＲＰＧＬＰＧＡＤＧＬＰＧＰＰＧＴＭＬＭＬＰＦＲＹＧＧＤＧＳＫＧＰＴＩＳＡＱＥＡＱＡＱＡＩＬＱＱＡＲＩＡＬＲＧＰＰＧＰＭＧＬＴＧＲＰＧＰＶＧＧＰＧＳＳＧＡＫＧＥＳＧＤＰＧＰＱＧＰＲＧＶＱＧＰＰＧＰＴＧＫＰＧＫＲＧＲＰＧＡＤＧＧＲＧＭＰＧＥＰＧＡＫＧＤＲＧＦＤＧＬＰＧＬＰＧＤＫＧＨＲＧＥＲＧＰＱＧＰＰＧＰＰＧＤＤＧＭＲＧＥＤＧＥＩＧＰＲＧＬＰＧＥＡと少なくとも９０％相同な第１のアミノ酸配列と、ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸６６７〜７１４に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のアミノ酸６４９〜６９６にも対応するＧＭＡＧＶＤＧＰＰＧＰＫＧＮＭＧＰＱＧＥＰＧＰＰＧＱＱＧＮＰＧＰＱＧＬＰＧＰＱＧＰＩＧＰＰＧＥＫと少なくとも９０％相同な第２のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のアミノ酸６９７〜７３８に対応する配列ＶＳＦＳＦＳＬＦＹＫＫＶＩＫＦＡＣＤＫＲＦＶＧＲＨＤＥＲＫＶＶＫＬＳＬＰＬＹＬＩＹＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＡＧを含み、以下の構造：アミノ酸番号６４８−ｘ〜６４８のいずれかから始まり、アミノ酸番号６４９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のテールをコードする単離ポリペプチドであって、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６中の配列ＶＳＦＳＦＳＬＦＹＫＫＶＩＫＦＡＣＤＫＲＦＶＧＲＨＤＥＲＫＶＶＫＬＳＬＰＬＹＬＩＹＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７をコードする単離キメラポリペプチドであって、ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸１〜２６０に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のアミノ酸１〜２６０にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のアミノ酸２６１〜２７３に対応する配列ＶＲＳＴＲＰＥＫＶＦＶＦＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のテールをコードする単離ポリペプチドであって、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７中の配列ＶＲＳＴＲＰＥＫＶＦＶＦＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ２０７７９＿Ｐ２をコードする単離キメラポリペプチドであって、ＳＴＣ２＿ＨＵＭＡＮのアミノ酸１〜１６９に対応し、Ｒ２０７７９＿Ｐ２のアミノ酸１〜１６９にも対応するＭＣＡＥＲＬＧＱＦＭＴＬＡＬＶＬＡＴＦＤＰＡＲＧＴＤＡＴＮＰＰＥＧＰＱＤＲＳＳＱＱＫＧＲＬＳＬＱＮＴＡＥＩＱＨＣＬＶＮＡＧＤＶＧＣＧＶＦＥＣＦＥＮＮＳＣＥＩＲＧＬＨＧＩＣＭＴＦＬＨＮＡＧＫＦＤＡＱＧＫＳＦＩＫＤＡＬＫＣＫＡＨＡＬＲＨＲＦＧＣＩＳＲＫＣＰＡＩＲＥＭＶＳＱＬＱＲＥＣＹＬＫＨＤＬＣＡＡＡＱＥＮＴＲＶＩＶＥＭＩＨＦＫＤＬＬＬＨＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ２０７７９＿Ｐ２のアミノ酸１７０〜１８７に対応する配列ＣＹＫＩＥＩＴＭＰＫＲＲＫＶＫＬＲＤを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ２０７７９＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ２０７７９＿Ｐ２のテールをコードする単離ポリペプチドであって、Ｒ２０７７９＿Ｐ２中の配列ＣＹＫＩＥＩＴＭＰＫＲＲＫＶＫＬＲＤと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ２０７７９＿Ｐ２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１をコードする単離キメラポリペプチドであって、ＯＳＴＰ＿ＨＵＭＡＮのアミノ酸１〜５８に対応し、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のアミノ酸１〜５８にも対応するＭＲＩＡＶＩＣＦＣＬＬＧＩＴＣＡＩＰＶＫＱＡＤＳＧＳＳＥＥＫＱＬＹＮＫＹＰＤＡＶＡＴＷＬＮＰＤＰＳＱＫＱＮＬＬＡＰＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のアミノ酸５９〜６４に対応する配列ＶＦＬＮＦＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のテールをコードする単離ポリペプチドであって、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１中の配列ＶＦＬＮＦＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５をコードする単離キメラポリペプチドであって、ＯＳＴＰ＿ＨＵＭＡＮのアミノ酸１〜３１に対応し、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５のアミノ酸１〜３１にも対応するＭＲＩＡＶＩＣＦＣＬＬＧＩＴＣＡＩＰＶＫＱＡＤＳＧＳＳＥＥＫＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５のアミノ酸３２〜３２に対応する配列Ｈを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０をコードする単離キメラポリペプチドであって、ＯＳＴＰ＿ＨＵＭＡＮのアミノ酸１〜３１に対応し、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のアミノ酸１〜３１にも対応するＭＲＩＡＶＩＣＦＣＬＬＧＩＴＣＡＩＰＶＫＱＡＤＳＧＳＳＥＥＫＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のアミノ酸３２〜３９に対応する配列ＶＳＩＦＹＶＦＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のテールをコードする単離ポリペプチドであって、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０中の配列ＶＳＩＦＹＶＦＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０をコードする単離キメラポリペプチドであって、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜６７に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０のアミノ酸１〜６７にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥと少なくとも９０％相同な第１のアミノ酸配列と、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１６３〜４９３に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０のアミノ酸６８〜３９８にも対応するＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱＩＣＰＶＬＹＨＡＧＴＶＬＬＮＳＬＬＤＴＶＰＶＲＳＳＶＤＥＬＶＧＩＤＹＳＬＭＫＤＰＶＡＳＴＳＮＬＤＭＤＦＲＧＡＦＦＰＬＴＥＲＮＷＳＬＰＮＲＡＶＥＰＱＬＱＥＥＥＲＭＶＹＶＡＦＳＥＦＦＦＤＳＡＭＥＳＹＦＲＡＧＡＬＱＬＬＬＶＧＤＫＶＰＨＤＬＤＭＬＬＲＡＴＹＦＧＳＩＶＬＬＳＰＡＶＩＤＳＰＬＫＬＥＬＲＶＬＡＰＰＲＣＴＩＫＰＳＧＴＴＩＳＶＴＡＳＶＴＩＡＬＶＰＰＤＱＰＥＶＱＬＳＳＭＴＭＤＡＲＬＳＡＫＭＡＬＲＧＫＡＬＲＴＱＬＤＬＲＲＦＲＩＹＳＮＨＳＡＬＥＳＬＡＬＩＰＬＱＡＰＬＫＴＭＬＱＩＧＶＭＰＭＬＮＥＲＴＷＲＧＶＱＩＰＬＰＥＧＩＮＦＶＨＥＶＶＴＮＨＡＧＦＬＴＩＧＡＤＬＨＦＡＫＧＬＲＥＶＩＥＫＮＲＰＡＤＶＲＡＳＴＡＰＴＰＳＴＡＡＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＥＫを含み、以下の構造：アミノ酸番号６７−ｘ〜６７のいずれかから始まり、アミノ酸番号６８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２をコードする単離キメラポリペプチドであって、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜４２７に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のアミノ酸１〜４２７にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦＦＹＤＧＧＹＩＮＡＳＡＥＧＶＳＩＲＴＧＬＥＬＳＲＤＰＡＧＲＭＫＶＳＮＶＳＣＱＡＳＶＳＲＭＨＡＡＦＧＧＴＦＫＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱＩＣＰＶＬＹＨＡＧＴＶＬＬＮＳＬＬＤＴＶＰＶＲＳＳＶＤＥＬＶＧＩＤＹＳＬＭＫＤＰＶＡＳＴＳＮＬＤＭＤＦＲＧＡＦＦＰＬＴＥＲＮＷＳＬＰＮＲＡＶＥＰＱＬＱＥＥＥＲＭＶＹＶＡＦＳＥＦＦＦＤＳＡＭＥＳＹＦＲＡＧＡＬＱＬＬＬＶＧＤＫＶＰＨＤＬＤＭＬＬＲＡＴＹＦＧＳＩＶＬＬＳＰＡＶＩＤＳＰＬＫＬＥＬＲＶＬＡＰＰＲＣＴＩＫＰＳＧＴＴＩＳＶＴＡＳＶＴＩＡＬＶＰＰＤＱＰＥＶＱＬＳＳＭＴＭＤＡＲＬＳＡＫＭＡＬＲＧＫＡＬＲＴＱＬＤＬＲＲＦＲＩＹＳＮＨＳＡＬＥＳＬＡＬＩＰＬＱＡＰＬＫＴＭＬＱＩＧＶＭＰＭＬＮと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のアミノ酸４２８〜４３２に対応する配列ＧＫＡＧＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のテールをコードする単離ポリペプチドであって、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２中の配列ＧＫＡＧＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１をコードする単離キメラポリペプチドであって、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜６７に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のアミノ酸１〜６７にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のアミノ酸６８〜９８に対応する配列ＰＧＬＥＲＧＡＤＫＦＰＶＶＧＧＳＳＬＦＬＡＬＤＬＴＬＲＰＰＶＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のテールをコードする単離ポリペプチドであって、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１中の配列ＰＧＬＥＲＧＡＤＫＦＰＶＶＧＧＳＳＬＦＬＡＬＤＬＴＬＲＰＰＶＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３をコードする単離キメラポリペプチドであって、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のアミノ酸１〜１８３にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦＦＹＤＧＧＹＩＮＡＳＡＥＧＶＳＩＲＴＧＬＥＬＳＲＤＰＡＧＲＭＫＶＳＮＶＳＣＱＡＳＶＳＲＭＨＡＡＦＧＧＴＦＫＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のアミノ酸１８４〜２００に対応する配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のテールをコードする単離ポリペプチドであって、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３中の配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４をコードする単離キメラポリペプチドであって、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜２０５に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のアミノ酸１〜２０５にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦＦＹＤＧＧＹＩＮＡＳＡＥＧＶＳＩＲＴＧＬＥＬＳＲＤＰＡＧＲＭＫＶＳＮＶＳＣＱＡＳＶＳＲＭＨＡＡＦＧＧＴＦＫＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱＩＣＰＶＬＹＨＡＧＴＶＬＬＮＳＬＬＤＴＶＰＶと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のアミノ酸２０６〜２１７に対応する配列ＬＷＴＳＬＬＡＬＴＩＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のテールをコードする単離ポリペプチドであって、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４中の配列ＬＷＴＳＬＬＡＬＴＩＰＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５をコードする単離キメラポリペプチドであって、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜１０９に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のアミノ酸１〜１０９にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦと少なくとも９０％相同な第１のアミノ酸配列と、第２のアミノ酸配列と、Ｌを含む架橋アミノ酸Ｈと、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１６３〜１８３に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のアミノ酸１１１〜１３１にも対応するＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱと少なくとも９０％相同な第３のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のアミノ酸１３２〜１４８に対応する配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第４のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、第３のアミノ酸配列、および第４のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＦＬＫを含み、以下の構造（ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５に対応する番号付け）：アミノ酸番号１０９−ｘ〜１０９のいずれかから始まり、アミノ酸番号１１１＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のテールをコードする単離ポリペプチドであって、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５中の配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６をコードする単離キメラポリペプチドであって、ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜４１２に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のアミノ酸１〜４１２にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱＳＬＩＧＤＩＤＮＡＭＲＴＦＬＮＹＹＴＶＷＫＱＦＧＧＬＰＥＦＹＮＩＰＱＧＹＴＶＥＫＲＥＧＹＰＬＲＰＥＬＩＥＳＡＭＹＬＹＲＡＴＧＤＰＴＬＬＥＬＧＲＤＡＶＥＳＩＥＫＩＳＫＶＥＣＧＦＡＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のアミノ酸４１３〜４４９に対応する配列ＬＡＳＦＳＨＭＳＤＱＲＳＡＲＰＱＡＧＱＰＨＧＶＶＬＰＧＲＤＣＥＩＰＬＰＰＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のテールをコードする単離ポリペプチドであって、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６中の配列ＬＡＳＦＳＨＭＳＤＱＲＳＡＲＰＱＡＧＱＰＨＧＶＶＬＰＧＲＤＣＥＩＰＬＰＰＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３をコードする単離キメラポリペプチドであって、ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜３２３に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のアミノ酸１〜３２３にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のアミノ酸３２４〜３４１に対応する配列ＮＬＬＫＡＱＣＴＳＴＶＰＲＧＩＰＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のテールをコードする単離ポリペプチドであって、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３中の配列ＮＬＬＫＡＱＣＴＳＴＶＰＲＧＩＰＰＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５をコードする単離キメラポリペプチドであって、ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜２８２に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のアミノ酸１〜２８２にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のアミノ酸２８３〜２８７に対応する配列ＰＨＷＲＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のテールをコードする単離ポリペプチドであって、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５中の配列ＰＨＷＲＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９をコードする単離キメラポリペプチドであって、ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜４１２に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のアミノ酸１〜４１２にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱＳＬＩＧＤＩＤＮＡＭＲＴＦＬＮＹＹＴＶＷＫＱＦＧＧＬＰＥＦＹＮＩＰＱＧＹＴＶＥＫＲＥＧＹＰＬＲＰＥＬＩＥＳＡＭＹＬＹＲＡＴＧＤＰＴＬＬＥＬＧＲＤＡＶＥＳＩＥＫＩＳＫＶＥＣＧＦＡＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のアミノ酸４１３〜４３３に対応する配列ＫＲＳＲＳＶＡＱＡＧＶＱＷＣＤＨＤＳＰＱＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のテールをコードする単離ポリペプチドであって、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９中の配列ＫＲＳＲＳＶＡＱＡＧＶＱＷＣＤＨＤＳＰＱＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４をコードする単離キメラポリペプチドであって、ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜１２１に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４のアミノ酸１〜１２１にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲと少なくとも９０％相同な第１のアミノ酸配列と、ＣＴ３１＿ＨＵＭＡＮのアミノ酸２８２〜５７８に対応する配列ＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱＳＬＩＧＤＩＤＮＡＭＲＴＦＬＮＹＹＴＶＷＫＱＦＧＧＬＰＥＦＹＮＩＰＱＧＹＴＶＥＫＲＥＧＹＰＬＲＰＥＬＩＥＳＡＭＹＬＹＲＡＴＧＤＰＴＬＬＥＬＧＲＤＡＶＥＳＩＥＫＩＳＫＶＥＣＧＦＡＴＩＫＤＬＲＤＨＫＬＤＮＲＭＥＳＦＦＬＡＥＴＶＫＹＬＹＬＬＦＤＰＴＮＦＩＨＮＮＧＳＴＦＤＡＶＩＴＰＹＧＥＣＩＬＧＡＧＧＹＩＦＮＴＥＡＨＰＩＤＰＡＡＬＨＣＣＱＲＬＫＥＥＱＷＥＶＥＤＬＭＲＥＦＹＳＬＫＲＳＲＳＫＦＱＫＮＴＶＳＳＧＰＷＥＰＰＡＲＰＧＴＬＦＳＰＥＮＨＤＱＡＲＥＲＫＰＡＫＱＫＶＰＬＬＳＣＰＳＱＰＦＴＳＫＬＡＬＬＧＱＶＦＬＤＳＳと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＲＥを含み、以下の構造：アミノ酸番号１２１−ｘ〜１２１のいずれかから始まり、アミノ酸番号１２２＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチドであって、ＡＡＨ１６１８４のアミノ酸１〜３６に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸１〜３６にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸３７〜６０に対応する配列ＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のテールをコードする単離ポリペプチドであって、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６中の配列ＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチドであって、ＡＡＱ８８９４３のアミノ酸１〜３５に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸１〜３５にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸３６〜６０に対応する配列ＲＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のテールをコードする単離ポリペプチドであって、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６中の配列ＲＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチドであって、ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜３６に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸１〜３６にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸３７〜６０に対応する配列ＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ６をコードする単離キメラポリペプチドであって、ＡＡ１６１１８７＿Ｐ６のアミノ酸１〜４２に対応するＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸３１〜３１４に対応し、ＡＡ１６１１８７＿Ｐ６のアミノ酸４３〜３２６にも対応するＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥＡＬＰＳＰＨＴＬＱＥＶＱＶＡＩＩＮＮＳＭＣＮＨＬＦＬＫＹＳＦＲＫＤＩＦＧＤＭＶＣＡＧＮＡＱＧＧＫＤＡＣＦＧＤＳＧＧＰＬＡＣＮＫＮＧＬＷＹＱＩＧＶＶＳＷＧＶＧＣＧＲＰＮＲＰＧＶＹＴＮＩＳＨＨＦＥＷＩＱＫＬＭＡＱＳＧＭＳＱＰＤＰＳＷＰＬＬＦＦＰＬＬＷＡＬＰＬＬＧＰＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ６の先端をコードする単離ポリペプチドであって、ＡＡ１６１１８７＿Ｐ６の配列ＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ６の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１３をコードする単離キメラポリペプチドであって、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＡＡ１６１１８７＿Ｐ１３のアミノ酸１〜１８３にも対応するＭＧＡＲＧＡＬＬＬＡＬＬＬＡＲＡＧＬＲＫＰＥＳＱＥＡＡＰＬＳＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１３のアミノ酸１８４〜２１３に対応する配列ＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１３のテールをコードする単離ポリペプチドであって、ＡＡ１６１１８７＿Ｐ１３中の配列ＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１４をコードする単離キメラポリペプチドであって、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＡＡ１６１１８７＿Ｐ１４のアミノ酸１〜１８３にも対応するＭＧＡＲＧＡＬＬＬＡＬＬＬＡＲＡＧＬＲＫＰＥＳＱＥＡＡＰＬＳＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１４のアミノ酸１８４〜３０７に対応する配列ＧＣＣＬＳＰＳＨＹＲＰＨＳＴＡＩＳＰＨＰＰＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧＬＣＷＱＣＰＲＲＥＧＣＬＬＲＥＣＰＣＨＨＳＱＰＲＫＡＳＣＶＰＶＰＹＬＴＬＭＰＴＰＧＧＧＤＣＣＰＴＬＱＭＱＫＲＲＬＧＣＣＱＧＥＥＥＤＶＨＰＶＹＰＡＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１４のテールをコードする単離ポリペプチドであって、ＡＡ１６１１８７＿Ｐ１４中の配列ＧＣＣＬＳＰＳＨＹＲＰＨＳＴＡＩＳＰＨＰＰＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧＬＣＷＱＣＰＲＲＥＧＣＬＬＲＥＣＰＣＨＨＳＱＰＲＫＡＳＣＶＰＶＰＹＬＴＬＭＰＴＰＧＧＧＤＣＣＰＴＬＱＭＱＫＲＲＬＧＣＣＱＧＥＥＥＤＶＨＰＶＹＰＡＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１８をコードする単離キメラポリペプチドであって、ＡＡ１６１１８７＿Ｐ１８のアミノ酸１〜４２に対応する配列ＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸３１〜８６に対応し、ＡＡ１６１１８７＿Ｐ１８のアミノ酸４３〜９８にも対応するＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴと少なくとも９０％相同な第２のアミノ酸配列と、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸８９〜２３５に対応し、ＡＡ１６１１８７＿Ｐ１８のアミノ酸９９〜２４５にも対応するＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥＡＬＰＳＰＨＴＬＱＥＶＱＶＡＩＩＮＮＳＭＣＮＨＬＦＬＫＹＳＦＲＫＤＩＦＧＤＭＶＣＡＧＮＡＱＧＧＫＤＡＣＦと少なくとも９０％相同な第３のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１８のアミノ酸２４６〜２６５に対応する配列ＶＳＶＰＡＴＴＰＳＰＧＫＨＰＶＳＬＣＬＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第４のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、第３のアミノ酸配列、および第４のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１８の先端をコードする単離ポリペプチドであって、ＡＡ１６１１８７＿Ｐ１８の配列ＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１８の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１８の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＴＤを含み、以下の構造：アミノ酸番号９８−ｘ〜９９のいずれかから始まり、アミノ酸番号９９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１８の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１８のテールをコードする単離ポリペプチドであって、ＡＡ１６１１８７＿Ｐ１８中の配列ＶＳＶＰＡＴＴＰＳＰＧＫＨＰＶＳＬＣＬＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１８のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１９をコードする単離キメラポリペプチドであって、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＡＡ１６１１８７＿Ｐ１９のアミノ酸１〜１８３にも対応するＭＧＡＲＧＡＬＬＬＡＬＬＬＡＲＡＧＬＲＫＰＥＳＱＥＡＡＰＬＳＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１９のアミノ酸１８４〜１８８に対応する配列ＤＫＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＡＡ１６１１８７＿Ｐ１９のテールをコードする単離ポリペプチドであって、ＡＡ１６１１８７＿Ｐ１９中の配列ＤＫＲＴＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１９のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２をコードする単離キメラポリペプチドであって、ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜１３１に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のアミノ酸１〜１３１にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰＴＲＲＫＰＧＫＣＰＶＴＹＧＱＣＬＭＬＮＰＰＮＦＣＥＭＤＧＱＣＫＲＤＬＫＣＣＭＧＭＣＧＫＳＣＶＳＰＶＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のアミノ酸１３２〜１３９に対応する配列ＧＫＱＧＭＲＡＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のテールをコードする単離ポリペプチドであって、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２中の配列ＧＫＱＧＭＲＡＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３をコードする単離キメラポリペプチドであって、ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜１３１に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のアミノ酸１〜１３１にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰＴＲＲＫＰＧＫＣＰＶＴＹＧＱＣＬＭＬＮＰＰＮＦＣＥＭＤＧＱＣＫＲＤＬＫＣＣＭＧＭＣＧＫＳＣＶＳＰＶＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のアミノ酸１３２〜１５６に対応する配列ＧＥＫＲＨＨＫＱＬＲＤＱＥＶＤＰＬＥＭＲＲＨＳＡＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のテールをコードする単離ポリペプチドであって、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３中の配列ＧＥＫＲＨＨＫＱＬＲＤＱＥＶＤＰＬＥＭＲＲＨＳＡＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７をコードする単離キメラポリペプチドであって、ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜８１に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のアミノ酸１〜８１にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のアミノ酸８２〜８９に対応する配列ＲＧＳＬＧＳＡＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のテールをコードする単離ポリペプチドであって、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７中の配列ＲＧＳＬＧＳＡＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０をコードする単離キメラポリペプチドであって、ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜８２に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０のアミノ酸１〜８２にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰＴと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ６６１７８＿Ｐ３をコードする単離キメラポリペプチドであって、ＰＶＲ１＿ＨＵＭＡＮのアミノ酸１〜３３４に対応し、Ｒ６６１７８＿Ｐ３のアミノ酸１〜３３４にも対応するＭＡＲＭＧＬＡＧＡＡＧＲＷＷＧＬＡＬＧＬＴＡＦＦＬＰＧＶＨＳＱＶＶＱＶＮＤＳＭＹＧＦＩＧＴＤＶＶＬＨＣＳＦＡＮＰＬＰＳＶＫＩＴＱＶＴＷＱＫＳＴＮＧＳＫＱＮＶＡＩＹＮＰＳＭＧＶＳＶＬＡＰＹＲＥＲＶＥＦＬＲＰＳＦＴＤＧＴＩＲＬＳＲＬＥＬＥＤＥＧＶＹＩＣＥＦＡＴＦＰＴＧＮＲＥＳＱＬＮＬＴＶＭＡＫＰＴＮＷＩＥＧＴＱＡＶＬＲＡＫＫＧＱＤＤＫＶＬＶＡＴＣＴＳＡＮＧＫＰＰＳＶＶＳＷＥＴＲＬＫＧＥＡＥＹＱＥＩＲＮＰＮＧＴＶＴＶＩＳＲＹＲＬＶＰＳＲＥＡＨＱＱＳＬＡＣＩＶＮＹＨＭＤＲＦＫＥＳＬＴＬＮＶＱＹＥＰＥＶＴＩＥＧＦＤＧＮＷＹＬＱＲＭＤＶＫＬＴＣＫＡＤＡＮＰＰＡＴＥＹＨＷＴＴＬＮＧＳＬＰＫＧＶＥＡＱＮＲＴＬＦＦＫＧＰＩＮＹＳＬＡＧＴＹＩＣＥＡＴＮＰＩＧＴＲＳＧＱＶＥＶＮＩＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ６６１７８＿Ｐ３のアミノ酸３３５〜３５４に対応する配列ＧＥＧＨＳＬＰＩＳＰＧＶＬＱＴＱＮＣＧＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ６６１７８＿Ｐ３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ６６１７８＿Ｐ３のテールをコードする単離ポリペプチドであって、Ｒ６６１７８＿Ｐ３中の配列ＧＥＧＨＳＬＰＩＳＰＧＶＬＱＴＱＮＣＧＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ６６１７８＿Ｐ３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ６６１７８＿Ｐ４をコードする単離キメラポリペプチドであって、ＰＶＲ１＿ＨＵＭＡＮのアミノ酸１〜３３４に対応し、Ｒ６６１７８＿Ｐ４のアミノ酸１〜３３４にも対応するＭＡＲＭＧＬＡＧＡＡＧＲＷＷＧＬＡＬＧＬＴＡＦＦＬＰＧＶＨＳＱＶＶＱＶＮＤＳＭＹＧＦＩＧＴＤＶＶＬＨＣＳＦＡＮＰＬＰＳＶＫＩＴＱＶＴＷＱＫＳＴＮＧＳＫＱＮＶＡＩＹＮＰＳＭＧＶＳＶＬＡＰＹＲＥＲＶＥＦＬＲＰＳＦＴＤＧＴＩＲＬＳＲＬＥＬＥＤＥＧＶＹＩＣＥＦＡＴＦＰＴＧＮＲＥＳＱＬＮＬＴＶＭＡＫＰＴＮＷＩＥＧＴＱＡＶＬＲＡＫＫＧＱＤＤＫＶＬＶＡＴＣＴＳＡＮＧＫＰＰＳＶＶＳＷＥＴＲＬＫＧＥＡＥＹＱＥＩＲＮＰＮＧＴＶＴＶＩＳＲＹＲＬＶＰＳＲＥＡＨＱＱＳＬＡＣＩＶＮＹＨＭＤＲＦＫＥＳＬＴＬＮＶＱＹＥＰＥＶＴＩＥＧＦＤＧＮＷＹＬＱＲＭＤＶＫＬＴＣＫＡＤＡＮＰＰＡＴＥＹＨＷＴＴＬＮＧＳＬＰＫＧＶＥＡＱＮＲＴＬＦＦＫＧＰＩＮＹＳＬＡＧＴＹＩＣＥＡＴＮＰＩＧＴＲＳＧＱＶＥＶＮＩＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ６６１７８＿Ｐ４のアミノ酸３３５〜３５２に対応する配列ＡＦＣＱＬＩＹＰＧＫＧＲＴＲＡＲＭＦを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ６６１７８＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ６６１７８＿Ｐ４のテールをコードする単離ポリペプチドであって、Ｒ６６１７８＿Ｐ４中の配列ＡＦＣＱＬＩＹＰＧＫＧＲＴＲＡＲＭＦと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ６６１７８＿Ｐ４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ６６１７８＿Ｐ８をコードする単離キメラポリペプチドであって、ＰＶＲ１＿ＨＵＭＡＮのアミノ酸１〜３３０に対応し、Ｒ６６１７８＿Ｐ８のアミノ酸１〜３３０にも対応するＭＡＲＭＧＬＡＧＡＡＧＲＷＷＧＬＡＬＧＬＴＡＦＦＬＰＧＶＨＳＱＶＶＱＶＮＤＳＭＹＧＦＩＧＴＤＶＶＬＨＣＳＦＡＮＰＬＰＳＶＫＩＴＱＶＴＷＱＫＳＴＮＧＳＫＱＮＶＡＩＹＮＰＳＭＧＶＳＶＬＡＰＹＲＥＲＶＥＦＬＲＰＳＦＴＤＧＴＩＲＬＳＲＬＥＬＥＤＥＧＶＹＩＣＥＦＡＴＦＰＴＧＮＲＥＳＱＬＮＬＴＶＭＡＫＰＴＮＷＩＥＧＴＱＡＶＬＲＡＫＫＧＱＤＤＫＶＬＶＡＴＣＴＳＡＮＧＫＰＰＳＶＶＳＷＥＴＲＬＫＧＥＡＥＹＱＥＩＲＮＰＮＧＴＶＴＶＩＳＲＹＲＬＶＰＳＲＥＡＨＱＱＳＬＡＣＩＶＮＹＨＭＤＲＦＫＥＳＬＴＬＮＶＱＹＥＰＥＶＴＩＥＧＦＤＧＮＷＹＬＱＲＭＤＶＫＬＴＣＫＡＤＡＮＰＰＡＴＥＹＨＷＴＴＬＮＧＳＬＰＫＧＶＥＡＱＮＲＴＬＦＦＫＧＰＩＮＹＳＬＡＧＴＹＩＣＥＡＴＮＰＩＧＴＲＳＧＱＶＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ６６１７８＿Ｐ８のアミノ酸３３１〜３６３に対応する配列ＮＳＰＴＰＲＬＬＰＮＭＧＧＡＰＧＲＣＰＲＰＳＬＧＡＷＲＧＡＳＣＷＣを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ６６１７８＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ６６１７８＿Ｐ８のテールをコードする単離ポリペプチドであって、Ｒ６６１７８＿Ｐ８中の配列ＮＳＰＴＰＲＬＬＰＮＭＧＧＡＰＧＲＣＰＲＰＳＬＧＡＷＲＧＡＳＣＷＣと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ６６１７８＿Ｐ８のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＭＧＢＡ＿ＨＵＭＡＮのアミノ酸１〜７８に対応し、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜７８にも対応するＭＫＬＬＭＶＬＭＬＡＡＬＳＱＨＣＹＡＧＳＧＣＰＬＬＥＮＶＩＳＫＴＩＮＰＱＶＳＫＴＥＹＫＥＬＬＱＥＦＩＤＤＮＡＴＴＮＡＩＤＥＬＫＥＣＦＬＮＱＴＤＥＴＬＳＮＶＥと少なくとも９０％相同な第１のアミノ酸配列と、ＭＧＢＡ＿ＨＵＭＡＮのアミノ酸８２〜９３に対応し、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５のアミノ酸７９〜９０にも対応するＱＬＩＹＤＳＳＬＣＤＬＦと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＥＱを含み、以下の構造：アミノ酸番号７８−ｘ〜７８のいずれかから始まり、アミノ酸番号７９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５１７に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３のアミノ酸１〜５１７にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３のアミノ酸５１８〜５１９に対応する配列ＧＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５２６に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜５２６にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のアミノ酸５２７〜５４１に対応する配列ＥＣＬＴＶＮＰＳＬＱＩＰＬＮＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチドであって、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４中の配列ＥＣＬＴＶＮＰＳＬＱＩＰＬＮＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５２６に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸１〜５２６にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸５２７〜５４４に対応する配列ＥＣＶＣＳＫＧＦＰＦＰＬＩＧＤＳＥＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のテールをコードする単離ポリペプチドであって、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２中の配列ＥＣＶＣＳＫＧＦＰＦＰＬＩＧＤＳＥＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５７０に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のアミノ酸１〜５７０にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧＳＴＥＱＤＡＡＳＰＥＫＥＫＭＮＰＬＥＱＹＥＲＫＶＮＡＳＶＰＲＧＦＰＦＨＳＳＥＩＱＲＤＥＬと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のアミノ酸５７１〜６１９に対応する配列ＶＲＧＧＴＡＧＹＬＧＥＥＴＲＧＱＲＰＧＣＤＳＱＳＨＴＧＰＳＫＫＰＳＡＰＳＰＬＰＡＧＴＳＷＤＲＧＶＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチドであって、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４中の配列ＶＲＧＧＴＡＧＹＬＧＥＥＴＲＧＱＲＰＧＣＤＳＱＳＨＴＧＰＳＫＫＰＳＡＰＳＰＬＰＡＧＴＳＷＤＲＧＶＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜３５２に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１のアミノ酸１〜３５２にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸４０６〜６５０に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１のアミノ酸３５３〜５９７にも対応するＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧＳＴＥＱＤＡＡＳＰＥＫＥＫＭＮＰＬＥＱＹＥＲＫＶＮＡＳＶＰＲＧＦＰＦＨＳＳＥＩＱＲＤＥＬＡＰＡＧＴＧＶＳＲＥＡＶＳＧＬＬＩＭＧＡＧＧＧＳＬＩＶＬＳＭＬＬＬＲＲＫＫＰＹＧＡＩＳＨＧＶＶＥＶＤＰＭＬＴＬＥＥＱＱＬＲＥＬＱＲＨＧＹＥＮＰＴＹＲＦＬＥＥＲＰと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＥＡを含み、以下の構造：アミノ酸番号３５２−ｘ〜３５２のいずれかから始まり、アミノ酸番号３５３＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜４８１に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のアミノ酸１〜４８１にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のアミノ酸４８２〜４９８に対応する配列ＲＥＣＬＬＰＷＬＰＬＱＩＳＥＧＲＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のテールをコードする単離ポリペプチドであって、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４中の配列ＲＥＣＬＬＰＷＬＰＬＱＩＳＥＧＲＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜４４９に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜４４９にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のアミノ酸４５０〜５８８に対応する配列ＬＴＳＦＱＬＰＮＡＰＬＦＬＲＲＰＲＬＲＬＦＳＣＰＬＤＰＬＳＶＳＷＴＰＳＹＰＬＮＴＡＳＬＰＬＰＳＬＳＡＱＬＰＤＰＥＴＷＴＬＴＣＣＶＦＤＰＣＦＬＡＬＧＦＬＬＰＰＰＳＩＬＣＳＶＰＷＩＦＴＡＦＰＲＩＶＦＦＦＦＦＦＬＲＱＶＬＡＬＳＰＲＱＥＳＳＶＲＳＷＬＩＡＴＳＴＳＷＶＱＡＩＬＬＰＱＰＬＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチドであって、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２中の配列ＬＴＳＦＱＬＰＮＡＰＬＦＬＲＲＰＲＬＲＬＦＳＣＰＬＤＰＬＳＶＳＷＴＰＳＹＰＬＮＴＡＳＬＰＬＰＳＬＳＡＱＬＰＤＰＥＴＷＴＬＴＣＣＶＦＤＰＣＦＬＡＬＧＦＬＬＰＰＰＳＩＬＣＳＶＰＷＩＦＴＡＦＰＲＩＶＦＦＦＦＦＦＬＲＱＶＬＡＬＳＰＲＱＥＳＳＶＲＳＷＬＩＡＴＳＴＳＷＶＱＡＩＬＬＰＱＰＬＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５をコードする単離キメラポリペプチドであって、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜４４８に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のアミノ酸１〜４４８にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のアミノ酸４４９〜５０５に対応する配列ＰＱＮＰＮＳＱＰＲＡＡＧＳＬＥＶＩＩＳＨＰＦＶＲＲＬＥＩＬＩＳＰＦＱＦＱＮＳＩＰＫＮＳＱＩＶＰＡＡＳＰＲＧＴＳＳＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のテールをコードする単離ポリペプチドであって、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５中の配列ＰＱＮＰＮＳＱＰＲＡＡＧＳＬＥＶＩＩＳＨＰＦＶＲＲＬＥＩＬＩＳＰＦＱＦＱＮＳＩＰＫＮＳＱＩＶＰＡＡＳＰＲＧＴＳＳＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１をコードする単離キメラポリペプチドであって、ＢＡＡ２５４４５のアミノ酸１３〜９３１に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１のアミノ酸１〜９１９にも対応するＭＴＧＹＴＭＬＲＮＧＧＡＧＮＧＧＱＴＣＭＬＲＷＳＮＲＩＲＬＴＷＬＳＦＴＬＦＶＩＬＶＦＦＰＬＩＡＨＹＹＬＴＴＬＤＥＡＤＥＡＧＫＲＩＦＧＰＲＶＧＮＥＬＣＥＶＫＨＶＬＤＬＣＲＩＲＥＳＶＳＥＥＬＬＱＬＥＡＫＲＱＥＬＮＳＥＩＡＫＬＮＬＫＩＥＡＣＫＫＳＩＥＮＡＫＱＤＬＬＱＬＫＮＶＩＳＱＴＥＨＳＹＫＥＬＭＡＱＮＱＰＫＬＳＬＰＩＲＬＬＰＥＫＤＤＡＧＬＰＰＰＫＡＴＲＧＣＲＬＨＮＣＦＤＹＳＲＣＰＬＴＳＧＦＰＶＹＶＹＤＳＤＱＦＶＦＧＳＹＬＤＰＬＶＫＱＡＦＱＡＴＡＲＡＮＶＹＶＴＥＮＡＤＩＡＣＬＹＶＩＬＶＧＥＭＱＥＰＶＶＬＲＰＡＥＬＥＫＱＬＹＳＬＰＨＷＲＴＤＧＨＮＨＶＩＩＮＬＳＲＫＳＤＴＱＮＬＬＹＮＶＳＴＧＲＡＭＶＡＱＳＴＦＹＴＶＱＹＲＰＧＦＤＬＶＶＳＰＬＶＨＡＭＳＥＰＮＦＭＥＩＰＰＱＶＰＶＫＲＫＹＬＦＴＦＱＧＥＫＩＥＳＬＲＳＳＬＱＥＡＲＳＦＥＥＥＭＥＧＤＰＰＡＤＹＤＤＲＩＩＡＴＬＫＡＶＱＤＳＫＬＤＱＶＬＶＥＦＴＣＫＮＱＰＫＰＳＬＰＴＥＷＡＬＣＧＥＲＥＤＲＬＥＬＬＫＬＳＴＦＡＬＩＩＴＰＧＤＰＲＬＶＩＳＳＧＣＡＴＲＬＦＥＡＬＥＶＧＡＶＰＶＶＬＧＥＱＶＱＬＰＹＱＤＭＬＱＷＮＥＡＡＬＶＶＰＫＰＲＶＴＥＶＨＦＬＬＲＳＬＳＤＳＤＬＬＡＭＲＲＱＧＲＦＬＷＥＴＹＦＳＴＡＤＳＩＦＮＴＶＬＡＭＩＲＴＲＩＱＩＰＡＡＰＩＲＥＥＡＡＡＥＩＰＨＲＳＧＫＡＡＧＴＤＰＮＭＡＤＮＧＤＬＤＬＧＰＶＥＴＥＰＰＹＡＳＰＲＹＬＲＮＦＴＬＴＶＴＤＦＹＲＳＷＮＣＡＰＧＰＦＨＬＦＰＨＴＰＦＤＰＶＬＰＳＥＡＫＦＬＧＳＧＴＧＦＲＰＩＧＧＧＡＧＧＳＧＫＥＦＱＡＡＬＧＧＮＶＰＲＥＱＦＴＶＶＭＬＴＹＥＲＥＥＶＬＭＮＳＬＥＲＬＮＧＬＰＹＬＮＫＶＶＶＶＷＮＳＰＫＬＰＳＥＤＬＬＷＰＤＩＧＶＰＩＭＶＶＲＴＥＫＮＳＬＮＮＲＦＬＰＷＮＥＩＥＴＥＡＩＬＳＩＤＤＤＡＨＬＲＨＤＥＩＭＦＧＦＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫＹＹＡＹＬＹＳＹＶＭＰＱＡＩＲＤＭＶＤＥＹＩＮＣＥＤＩＡＭＮＦＬＶＳＨＩＴＲＫＰＰＩＫＶＴＳＲＷＴＦＲＣＰＧＣＰＱＡＬＳＨＤＤＳＨＦＨＥＲＨＫＣＩＮＦＦＶＫＶＹＧＹＭＰＬＬＹＴＱＦＲＶＤＳＶＬＦＫＴＲＬＰＨＤＫＴＫＣＦＫＦＩと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドであって、ＥＸＬ３＿ＨＵＭＡＮのアミノ酸１〜８０７に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜８０７にも対応するＭＴＧＹＴＭＬＲＮＧＧＡＧＮＧＧＱＴＣＭＬＲＷＳＮＲＩＲＬＴＷＬＳＦＴＬＦＶＩＬＶＦＦＰＬＩＡＨＹＹＬＴＴＬＤＥＡＤＥＡＧＫＲＩＦＧＰＲＶＧＮＥＬＣＥＶＫＨＶＬＤＬＣＲＩＲＥＳＶＳＥＥＬＬＱＬＥＡＫＲＱＥＬＮＳＥＩＡＫＬＮＬＫＩＥＡＣＫＫＳＩＥＮＡＫＱＤＬＬＱＬＫＮＶＩＳＱＴＥＨＳＹＫＥＬＭＡＱＮＱＰＫＬＳＬＰＩＲＬＬＰＥＫＤＤＡＧＬＰＰＰＫＡＴＲＧＣＲＬＨＮＣＦＤＹＳＲＣＰＬＴＳＧＦＰＶＹＶＹＤＳＤＱＦＶＦＧＳＹＬＤＰＬＶＫＱＡＦＱＡＴＡＲＡＮＶＹＶＴＥＮＡＤＩＡＣＬＹＶＩＬＶＧＥＭＱＥＰＶＶＬＲＰＡＥＬＥＫＱＬＹＳＬＰＨＷＲＴＤＧＨＮＨＶＩＩＮＬＳＲＫＳＤＴＱＮＬＬＹＮＶＳＴＧＲＡＭＶＡＱＳＴＦＹＴＶＱＹＲＰＧＦＤＬＶＶＳＰＬＶＨＡＭＳＥＰＮＦＭＥＩＰＰＱＶＰＶＫＲＫＹＬＦＴＦＱＧＥＫＩＥＳＬＲＳＳＬＱＥＡＲＳＦＥＥＥＭＥＧＤＰＰＡＤＹＤＤＲＩＩＡＴＬＫＡＶＱＤＳＫＬＤＱＶＬＶＥＦＴＣＫＮＱＰＫＰＳＬＰＴＥＷＡＬＣＧＥＲＥＤＲＬＥＬＬＫＬＳＴＦＡＬＩＩＴＰＧＤＰＲＬＶＩＳＳＧＣＡＴＲＬＦＥＡＬＥＶＧＡＶＰＶＶＬＧＥＱＶＱＬＰＹＱＤＭＬＱＷＮＥＡＡＬＶＶＰＫＰＲＶＴＥＶＨＦＬＬＲＳＬＳＤＳＤＬＬＡＭＲＲＱＧＲＦＬＷＥＴＹＦＳＴＡＤＳＩＦＮＴＶＬＡＭＩＲＴＲＩＱＩＰＡＡＰＩＲＥＥＡＡＡＥＩＰＨＲＳＧＫＡＡＧＴＤＰＮＭＡＤＮＧＤＬＤＬＧＰＶＥＴＥＰＰＹＡＳＰＲＹＬＲＮＦＴＬＴＶＴＤＦＹＲＳＷＮＣＡＰＧＰＦＨＬＦＰＨＴＰＦＤＰＶＬＰＳＥＡＫＦＬＧＳＧＴＧＦＲＰＩＧＧＧＡＧＧＳＧＫＥＦＱＡＡＬＧＧＮＶＰＲＥＱＦＴＶＶＭＬＴＹＥＲＥＥＶＬＭＮＳＬＥＲＬＮＧＬＰＹＬＮＫＶＶＶＶＷＮＳＰＫＬＰＳＥＤＬＬＷＰＤＩＧＶＰＩＭＶＶＲＴＥＫＮＳＬＮＮＲＦＬＰＷＮＥＩＥＴＥＡＩＬＳＩＤＤＤＡＨＬＲＨＤＥＩＭＦＧＦＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫと少なくとも９０％相同な第１のアミノ酸配列と、ＥＸＬ３＿ＨＵＭＡＮのアミノ酸８２０〜９１９に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２のアミノ酸８０８〜９０７にも対応するＡＩＲＤＭＶＤＥＹＩＮＣＥＤＩＡＭＮＦＬＶＳＨＩＴＲＫＰＰＩＫＶＴＳＲＷＴＦＲＣＰＧＣＰＱＡＬＳＨＤＤＳＨＦＨＥＲＨＫＣＩＮＦＦＶＫＶＹＧＹＭＰＬＬＹＴＱＦＲＶＤＳＶＬＦＫＴＲＬＰＨＤＫＴＫＣＦＫＦＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＡを含み、以下の構造：アミノ酸番号８０７−ｘ〜８０７のいずれかから始まり、アミノ酸番号８０８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドであって、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜５１に対応する配列ＰＥＬＲＱＰＡＲＬＧＬＰＥＣＷＤＹＲＨＥＰＲＣＰＡＱＭＧＳＨＦＩＶＱＡＧＬＫＬＬＡＳＳＫＰＰＫＣＷＤＹを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＥＸＬ３＿ＨＵＭＡＮのアミノ酸７５９〜９１９に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４のアミノ酸５２〜２１２にも対応するＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫＹＹＡＹＬＹＳＹＶＭＰＱＡＩＲＤＭＶＤＥＹＩＮＣＥＤＩＡＭＮＦＬＶＳＨＩＴＲＫＰＰＩＫＶＴＳＲＷＴＦＲＣＰＧＣＰＱＡＬＳＨＤＤＳＨＦＨＥＲＨＫＣＩＮＦＦＶＫＶＹＧＹＭＰＬＬＹＴＱＦＲＶＤＳＶＬＦＫＴＲＬＰＨＤＫＴＫＣＦＫＦＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４の先端をコードする単離ポリペプチドであって、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４の配列ＰＥＬＲＱＰＡＲＬＧＬＰＥＣＷＤＹＲＨＥＰＲＣＰＡＱＭＧＳＨＦＩＶＱＡＧＬＫＬＬＡＳＳＫＰＰＫＣＷＤＹと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドであって、ＥＸＬ３＿ＨＵＭＡＮのアミノ酸１〜８０７に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜８０７にも対応するＭＴＧＹＴＭＬＲＮＧＧＡＧＮＧＧＱＴＣＭＬＲＷＳＮＲＩＲＬＴＷＬＳＦＴＬＦＶＩＬＶＦＦＰＬＩＡＨＹＹＬＴＴＬＤＥＡＤＥＡＧＫＲＩＦＧＰＲＶＧＮＥＬＣＥＶＫＨＶＬＤＬＣＲＩＲＥＳＶＳＥＥＬＬＱＬＥＡＫＲＱＥＬＮＳＥＩＡＫＬＮＬＫＩＥＡＣＫＫＳＩＥＮＡＫＱＤＬＬＱＬＫＮＶＩＳＱＴＥＨＳＹＫＥＬＭＡＱＮＱＰＫＬＳＬＰＩＲＬＬＰＥＫＤＤＡＧＬＰＰＰＫＡＴＲＧＣＲＬＨＮＣＦＤＹＳＲＣＰＬＴＳＧＦＰＶＹＶＹＤＳＤＱＦＶＦＧＳＹＬＤＰＬＶＫＱＡＦＱＡＴＡＲＡＮＶＹＶＴＥＮＡＤＩＡＣＬＹＶＩＬＶＧＥＭＱＥＰＶＶＬＲＰＡＥＬＥＫＱＬＹＳＬＰＨＷＲＴＤＧＨＮＨＶＩＩＮＬＳＲＫＳＤＴＱＮＬＬＹＮＶＳＴＧＲＡＭＶＡＱＳＴＦＹＴＶＱＹＲＰＧＦＤＬＶＶＳＰＬＶＨＡＭＳＥＰＮＦＭＥＩＰＰＱＶＰＶＫＲＫＹＬＦＴＦＱＧＥＫＩＥＳＬＲＳＳＬＱＥＡＲＳＦＥＥＥＭＥＧＤＰＰＡＤＹＤＤＲＩＩＡＴＬＫＡＶＱＤＳＫＬＤＱＶＬＶＥＦＴＣＫＮＱＰＫＰＳＬＰＴＥＷＡＬＣＧＥＲＥＤＲＬＥＬＬＫＬＳＴＦＡＬＩＩＴＰＧＤＰＲＬＶＩＳＳＧＣＡＴＲＬＦＥＡＬＥＶＧＡＶＰＶＶＬＧＥＱＶＱＬＰＹＱＤＭＬＱＷＮＥＡＡＬＶＶＰＫＰＲＶＴＥＶＨＦＬＬＲＳＬＳＤＳＤＬＬＡＭＲＲＱＧＲＦＬＷＥＴＹＦＳＴＡＤＳＩＦＮＴＶＬＡＭＩＲＴＲＩＱＩＰＡＡＰＩＲＥＥＡＡＡＥＩＰＨＲＳＧＫＡＡＧＴＤＰＮＭＡＤＮＧＤＬＤＬＧＰＶＥＴＥＰＰＹＡＳＰＲＹＬＲＮＦＴＬＴＶＴＤＦＹＲＳＷＮＣＡＰＧＰＦＨＬＦＰＨＴＰＦＤＰＶＬＰＳＥＡＫＦＬＧＳＧＴＧＦＲＰＩＧＧＧＡＧＧＳＧＫＥＦＱＡＡＬＧＧＮＶＰＲＥＱＦＴＶＶＭＬＴＹＥＲＥＥＶＬＭＮＳＬＥＲＬＮＧＬＰＹＬＮＫＶＶＶＶＷＮＳＰＫＬＰＳＥＤＬＬＷＰＤＩＧＶＰＩＭＶＶＲＴＥＫＮＳＬＮＮＲＦＬＰＷＮＥＩＥＴＥＡＩＬＳＩＤＤＤＡＨＬＲＨＤＥＩＭＦＧＦＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のアミノ酸８０８〜８１２に対応する配列ＶＲＫＳＷを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のテールをコードする単離ポリペプチドであって、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８中の配列ＶＲＫＳＷと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜６に対応する配列ＭＡＴＹＩＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸２３９〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４のアミノ酸７〜７２５にも対応するＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲＤＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４の先端をコードする単離ポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４の配列ＭＡＴＹＩＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸２８４〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜６７４にも対応するＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲＤＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３をコードする単離キメラポリペプチドであって、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸３６５〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３のアミノ酸１〜５９３にも対応するＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲＤＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜１９に対応する配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸７３８〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７のアミノ酸２０〜２３９にも対応するＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７の先端をコードする単離ポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７の配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドであって、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜７３６に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜７３６にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８のアミノ酸７３７〜７３７に対応する配列Ｅを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９をコードする単離キメラポリペプチドであって、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜４５４に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のアミノ酸１〜４５４にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のアミノ酸４５５〜５１４に対応する配列ＶＫＮＡＩＹＦＦＦＨＫＶＬＬＬＬＦＶＶＤＶＣＳＲＮＬＩＧＩＥＡＦＨＮＹＲＩＭＷＫＦＬＧＲＣＰＦＴＡＳＹＫＬＩＩＴＥＦＲＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のテールをコードする単離ポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９中の配列ＶＫＮＡＩＹＦＦＦＨＫＶＬＬＬＬＦＶＶＤＶＣＳＲＮＬＩＧＩＥＡＦＨＮＹＲＩＭＷＫＦＬＧＲＣＰＦＴＡＳＹＫＬＩＩＴＥＦＲＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜１９に対応する配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳを有するポリペプチドとと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸７３８〜８１５に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のアミノ酸２０〜９７にも対応するＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫと少なくとも９０％相同な第２のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９８〜１２５に対応する配列ＶＳＳＬＣＬＮＧＴＥＫＫＩＫＤＧＲＥＥＳＦＳＶＥＩＳＬＡを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０の配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０中の配列ＶＳＳＬＣＬＮＧＴＥＫＫＩＫＤＧＲＥＥＳＦＳＶＥＩＳＬＡと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチドであって、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜３７２に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１〜３７２にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のアミノ酸３７３〜３８５に対応する配列ＤＦＬＡＡＨＶＦＧＫＬＬＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のテールをコードする単離ポリペプチドであって、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１中の配列ＤＦＬＡＡＨＶＦＧＫＬＬＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２をコードする単離キメラポリペプチドであって、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜３２３に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸１〜３２３にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸３２４〜３２４に対応する配列Ｖを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５をコードする単離キメラポリペプチドであって、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５のアミノ酸１〜３０に対応する配列ＭＰＡＳＡＲＬＡＧＡＧＬＬＬＡＦＬＲＡＬＧＣＡＧＲＡＰＧＬＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜９９に対応し、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５のアミノ酸３１〜１２９にも対応するＭＡＥＧＮＴＬＩＳＶＤＹＥＩＦＧＫＶＱＧＶＦＦＲＫＨＴＱＡＥＧＫＫＬＧＬＶＧＷＶＱＮＴＤＲＧＴＶＱＧＱＬＱＧＰＩＳＫＶＲＨＭＱＥＷＬＥＴＲＧＳＰＫＳＨＩＤＫＡＮＦＮＮＥＫＶＩＬＫＬＤＹＳＤＦＱＩＶＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５の先端をコードする単離ポリペプチドであって、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５の配列ＭＰＡＳＡＲＬＡＧＡＧＬＬＬＡＦＬＲＡＬＧＣＡＧＲＡＰＧＬＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８をコードする単離キメラポリペプチドであって、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８のアミノ酸１〜１に対応する配列Ｍを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸２８〜９９に対応し、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８のアミノ酸２〜７３にも対応するＱＡＥＧＫＫＬＧＬＶＧＷＶＱＮＴＤＲＧＴＶＱＧＱＬＱＧＰＩＳＫＶＲＨＭＱＥＷＬＥＴＲＧＳＰＫＳＨＩＤＫＡＮＦＮＮＥＫＶＩＬＫＬＤＹＳＤＦＱＩＶＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドであって、ＳＮＸＱ＿ＨＵＭＡＮのアミノ酸１〜１８５に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜１８５にも対応するＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１８６〜１３０５に対応する配列ＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のテールをコードする単離ポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８中の配列ＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜４４３に対応する配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ９ＮＴ２３のアミノ酸１〜６７４に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸４４４〜１１１７にも対応するＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧと少なくとも９０％相同な第２のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１１１８に対応する架橋アミノ酸Ｐと、Ｑ９ＮＴ２３のアミノ酸６７６〜８６２に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１１１９〜１３０５にも対応するＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、架橋アミノ酸、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜１０１０に対応する配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ９６ＣＰ３のアミノ酸１〜２９５に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１０１１〜１３０５にも対応するＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜１５４に対応する配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＡＣ８６９０２のアミノ酸１〜８６１に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１５５〜１０１５にも対応するＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡと少なくとも９０％相同な第２のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１０１６〜１０４３に対応する配列ＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列と、ＢＡＣ８６９０２のアミノ酸８６２〜９８９に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１０４４〜１１７１にも対応するＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳと少なくとも９０％相同な第４のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１１７２〜１３０５に対応する配列ＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第５のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、第３のアミノ酸配列、第４のアミノ酸配列、および第５のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の縁部分をコードする単離ポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８に対応するＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳをコードする配列と少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なアミノ酸配列を含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の縁部分をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のテールをコードする単離ポリペプチドであって、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８中の配列ＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドであって、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜５５に対応する配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ８ＷＶＨ６のアミノ酸１〜９９に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２のアミノ酸５６〜１５４にも対応するＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫＡＬＥＬＦＲＫＤＭＡＳＮＹＫＥＬＧＦＱＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２の先端をコードする単離ポリペプチドであって、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２の配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＭＹＧ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸５６〜１５４に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜９９にも対応するＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫＡＬＥＬＦＲＫＤＭＡＳＮＹＫＥＬＧＦＱＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、ＭＹＧ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜１３４に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜１３４にも対応するＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１３５〜１３５に対応する配列Ｇを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜５５に対応する配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ８ＷＶＨ６のアミノ酸１〜９９に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０のアミノ酸５６〜１５４にも対応するＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫＡＬＥＬＦＲＫＤＭＡＳＮＹＫＥＬＧＦＱＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチドであって、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０の配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９をコードする単離キメラポリペプチドであって、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜２７４に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のアミノ酸１〜２７４にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のアミノ酸２７５〜３８５に対応する配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＡＹＥＡＧＧＧＳＲＡＭＡＲＰＳＳＰＤＧＰＰＰＰＰＨＬＴＷＰＣＡＧＡＧＳＡＡＡＭＷＲＷを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のテールをコードする単離ポリペプチドであって、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９中の配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＡＹＥＡＧＧＧＳＲＡＭＡＲＰＳＳＰＤＧＰＰＰＰＰＨＬＴＷＰＣＡＧＡＧＳＡＡＡＭＷＲＷと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドであって、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜３２０に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜３２０にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶＹＱＤＮＶＹＡＡＧＳＱＦＨＳＦＫＫＶＬＭＥＭＧＰＰＹＡＧＱＱＥＬＡＳＦＨＳＴＳＫＧＹＭＧＥＣと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のアミノ酸３２１〜３４６に対応する配列ＶＲＴＲＲＶＧＡＲＧＰＷＰＧＰＰＲＰＭＧＨＰＬＬＲＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のテールをコードする単離ポリペプチドであって、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８中の配列ＶＲＴＲＲＶＧＡＲＧＰＷＰＧＰＰＲＰＭＧＨＰＬＬＲＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチドであって、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜２２９に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１〜２２９にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲと少なくとも９０％相同な第１のアミノ酸配列と、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸４５５〜４９６に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１のアミノ酸２３０〜２７１にも対応するＳＧＦＧＱＲＥＧＴＹＨＦＲＭＴＩＬＰＰＬＥＫＬＲＬＬＬＥＫＬＳＲＦＨＡＫＦＴＬＥＹＳと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＲＳを含み、以下の構造：アミノ酸番号２２９−ｘ〜２２９のいずれかから始まり、アミノ酸番号２３０＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドであって、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜２７４に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜２７４にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のアミノ酸２７５〜３９９に対応する配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＶＰＲＲＬＣＧＧＧＥＨＧＲＣＳＡＡＡＤＡＥＡＤＥＣＡＡＶＰＡＧＡＲＴＧＰＡＧＰＧＧＱＰＡＲＡＨＲＰＬＬＣＡＶＰＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチドであって、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２中の配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＶＰＲＲＬＣＧＧＧＥＨＧＲＣＳＡＡＡＤＡＥＡＤＥＣＡＡＶＰＡＧＡＲＴＧＰＡＧＰＧＧＱＰＡＲＡＨＲＰＬＬＣＡＶＰＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドであって、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜４９４に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜４９４にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶＹＱＤＮＶＹＡＡＧＳＱＦＨＳＦＫＫＶＬＭＥＭＧＰＰＹＡＧＱＱＥＬＡＳＦＨＳＴＳＫＧＹＭＧＥＣＧＦＲＧＧＹＶＥＶＶＮＭＤＡＡＶＱＱＱＭＬＫＬＭＳＶＲＬＣＰＰＶＰＧＱＡＬＬＤＬＶＶＳＰＰＡＰＴＤＰＳＦＡＱＦＱＡＥＫＱＡＶＬＡＥＬＡＡＫＡＫＬＴＥＱＶＦＮＥＡＰＧＩＳＣＮＰＶＱＧＡＭＹＳＦＰＲＶＱＬＰＰＲＡＶＥＲＡＱＥＬＧＬＡＰＤＭＦＦＣＬＲＬＬＥＥＴＧＩＣＶＶＰＧＳＧＦＧＱＲＥＧＴＹＨＦＲＭＴＩＬＰＰＬＥＫＬＲＬＬＬＥＫＬＳＲＦＨＡＫＦＴＬＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のアミノ酸４９５〜５５５に対応する配列ＳＰＧＲＬＷＳＰＬＹＬＬＬＭＰＧＧＶＧＷＧＧＣＷＡＰＡＳＬＱＶＰＮＫＡＶＷＱＳＤＳＫＫＥＡＬＡＡＡＷＰＡＰＴＣＬＰＦＬＱＡを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチドであって、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４中の配列ＳＰＧＲＬＷＳＰＬＹＬＬＬＭＰＧＧＶＧＷＧＧＣＷＡＰＡＳＬＱＶＰＮＫＡＶＷＱＳＤＳＫＫＥＡＬＡＡＡＷＰＡＰＴＣＬＰＦＬＱＡと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜１１０に対応する配列ＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ８ＩＸＭ０のアミノ酸１〜１１２に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１１１〜１２２にも対応するＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６の先端をコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６の配列ＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドであって、Ｑ９６ＡＣ２のアミノ酸１〜８３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜８３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸８４〜２２２に対応する配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のテールをコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６中の配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドであって、Ｑ８Ｎ２Ｇ４のアミノ酸１〜８３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜８３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸８４〜２２２に対応する配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドであって、ＢＡＣ８５５１８のアミノ酸２４〜１０６に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜８３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸８４〜２２２に対応する配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、Ｑ９６ＡＣ２のアミノ酸１〜６４に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜６４にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７中の配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、Ｑ８Ｎ２Ｇ４のアミノ酸１〜６４に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜６４にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜５に対応する配列ＭＷＶＬＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＡＣ８５２７３のアミノ酸２２〜８０に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６〜６４にも対応するＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７の先端をコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７の配列ＭＷＶＬＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、ＢＡＣ８５５１８のアミノ酸２４〜８７に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜６４にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３をコードする単離キメラポリペプチドであって、Ｑ９６ＡＣ２のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のアミノ酸６４〜８４に対応する配列ＤＴＫＲＴＮＴＬＬＦＥＭＲＨＦＡＫＱＬＴＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のテールをコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３中の配列ＤＴＫＲＴＮＴＬＬＦＥＭＲＨＦＡＫＱＬＴＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、Ｑ９６ＡＣ２のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０中の配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、Ｑ８Ｎ２Ｇ４のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜５に対応する配列ＭＷＶＬＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＡＣ８５２７３のアミノ酸２２〜７９に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６〜６３にも対応するＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチドであって、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０の配列ＭＷＶＬＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、ＢＡＣ８５５１８のアミノ酸２４〜８６に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、ＮＯＶ＿ＨＵＭＡＮのアミノ酸１〜４１に対応し、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜４１にも対応するＭＱＳＶＱＳＴＳＦＣＬＲＫＱＣＬＣＬＴＦＬＬＬＨＬＬＧＱＶＡＡＴＱＲＣＰＰＱＣＰＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸４２に対応する架橋アミノ酸Ｑと、ＮＯＶ＿ＨＵＭＡＮのアミノ酸４３〜１０３に対応し、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸４３〜１０３にも対応するＣＰＡＴＰＰＴＣＡＰＧＶＲＡＶＬＤＧＣＳＣＣＬＶＣＡＲＱＲＧＥＳＣＳＤＬＥＰＣＤＥＳＳＧＬＹＣＤＲＳＡＤＰＳＮＱＴＧＩＣＴと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸１０４〜１１１に対応する配列ＧＮＰＡＰＳＡＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチドであって、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７中の配列ＧＮＰＡＰＳＡＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドであって、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜２３４に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜２３４にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＴＱＤＡＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＴＡＳＹＫＣＥＴＱＮＰＶＳＡＲＲＳＤＳＶＩＬＮＶＬと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のアミノ酸２３５〜３１５に対応する配列ＣＥＹＩＣＳＳＬＡＱＡＡＳＰＮＰＱＧＱＲＱＤＦＳＶＰＬＲＦＫＹＴＤＰＱＰＷＴＳＲＬＳＶＴＦＣＰＲＫＴＷＡＤＱＶＬＴＫＮＲＲＧＧＡＡＳＶＬＧＧＳＧＳＴＰＹＤＧＲＮＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチドであって、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４中の配列ＣＥＹＩＣＳＳＬＡＱＡＡＳＰＮＰＱＧＱＲＱＤＦＳＶＰＬＲＦＫＹＴＤＰＱＰＷＴＳＲＬＳＶＴＦＣＰＲＫＴＷＡＤＱＶＬＴＫＮＲＲＧＧＡＡＳＶＬＧＧＳＧＳＴＰＹＤＧＲＮＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜６７５に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜６７５にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＴＱＤＡＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＴＡＳＹＫＣＥＴＱＮＰＶＳＡＲＲＳＤＳＶＩＬＮＶＬＹＧＰＤＡＰＴＩＳＰＬＮＴＳＹＲＳＧＥＮＬＮＬＳＣＨＡＡＳＮＰＰＡＱＹＳＷＦＶＮＧＴＦＱＱＳＴＱＥＬＦＩＰＮＩＴＶＮＮＳＧＳＹＴＣＱＡＨＮＳＤＴＧＬＮＲＴＴＶＴＴＩＴＶＹＡＥＰＰＫＰＦＩＴＳＮＮＳＮＰＶＥＤＥＤＡＶＡＬＴＣＥＰＥＩＱＮＴＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＤＮＲＴＬＴＬＬＳＶＴＲＮＤＶＧＰＹＥＣＧＩＱＮＥＬＳＶＤＨＳＤＰＶＩＬＮＶＬＹＧＰＤＤＰＴＩＳＰＳＹＴＹＹＲＰＧＶＮＬＳＬＳＣＨＡＡＳＮＰＰＡＱＹＳＷＬＩＤＧＮＩＱＱＨＴＱＥＬＦＩＳＮＩＴＥＫＮＳＧＬＹＴＣＱＡＮＮＳＡＳＧＨＳＲＴＴＶＫＴＩＴＶＳＡＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＡＱＮＴＴＹＬＷＷＶＮＧＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＡＲＡＹＶＣＧＩＱＮＳＶＳＡＮＲＳＤＰＶＴＬＤＶＬＹＧＰＤＴＰＩＩＳＰＰＤＳＳＹＬＳＧＡＮＬＮＬＳＣＨＳＡＳＮＰＳＰＱＹＳＷＲＩＮＧＩＰＱＱＨＴＱＶＬＦＩＡＫＩＴＰＮＮＮＧＴＹＡＣＦＶＳＮＬＡＴＧＲＮＮＳＩＶＫＳＩＴＶＳと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のアミノ酸６７６〜７１９に対応する配列ＧＫＷＬＰＧＡＳＡＳＹＳＧＶＥＳＩＷＦＳＰＫＳＱＥＤＩＦＦＰＳＬＣＳＭＧＴＲＫＳＱＩＬＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチドであって、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５中の配列ＧＫＷＬＰＧＡＳＡＳＹＳＧＶＥＳＩＷＦＳＰＫＳＱＥＤＩＦＦＰＳＬＣＳＭＧＴＲＫＳＱＩＬＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９をコードする単離キメラポリペプチドであって、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜２３２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９のアミノ酸１〜２３２にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＴＱＤＡＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＴＡＳＹＫＣＥＴＱＮＰＶＳＡＲＲＳＤＳＶＩＬＮと少なくとも９０％相同な第１のアミノ酸配列と、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸５８９〜７０２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９のアミノ酸２３３〜３４６にも対応するＶＬＹＧＰＤＴＰＩＩＳＰＰＤＳＳＹＬＳＧＡＮＬＮＬＳＣＨＳＡＳＮＰＳＰＱＹＳＷＲＩＮＧＩＰＱＱＨＴＱＶＬＦＩＡＫＩＴＰＮＮＮＧＴＹＡＣＦＶＳＮＬＡＴＧＲＮＮＳＩＶＫＳＩＴＶＳＡＳＧＴＳＰＧＬＳＡＧＡＴＶＧＩＭＩＧＶＬＶＧＶＡＬＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＮＶを含み、以下の構造：アミノ酸番号２３２−ｘ〜２３２のいずれかから始まり、アミノ酸番号２３３＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０をコードする単離キメラポリペプチドであって、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜１４２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０のアミノ酸１〜１４２にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰと少なくとも９０％相同な第１のアミノ酸配列と、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸４９９〜７０２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０のアミノ酸１４３〜３４６にも対応するＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＡＱＮＴＴＹＬＷＷＶＮＧＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＡＲＡＹＶＣＧＩＱＮＳＶＳＡＮＲＳＤＰＶＴＬＤＶＬＹＧＰＤＴＰＩＩＳＰＰＤＳＳＹＬＳＧＡＮＬＮＬＳＣＨＳＡＳＮＰＳＰＱＹＳＷＲＩＮＧＩＰＱＱＨＴＱＶＬＦＩＡＫＩＴＰＮＮＮＧＴＹＡＣＦＶＳＮＬＡＴＧＲＮＮＳＩＶＫＳＩＴＶＳＡＳＧＴＳＰＧＬＳＡＧＡＴＶＧＩＭＩＧＶＬＶＧＶＡＬＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＰＥを含み、以下の構造：アミノ酸番号１４２−ｘ〜１４２のいずれかから始まり、アミノ酸番号１４３＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜４４１に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜４４１にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴＤＤＡＡＡＰＡＬＥＴＱＰＱＧＤＥＥＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨＴＰＲＧＨＡＥＳＴＳＮＲＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のアミノ酸４４２〜４６４に対応する配列ＤＡＭＶＶＳＳＲＰＫＡＴＴＨＲＫＳＲＴＬＳＲＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチドであって、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５中の配列ＤＡＭＶＶＳＳＲＰＫＡＴＴＨＲＫＳＲＴＬＳＲＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドであって、ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜４２８に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜４２８にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴＤＤＡＡＡＰＡＬＥＴＱＰＱＧＤＥＥＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のアミノ酸４２９〜４３４に対応する配列ＲＳＫＲＮＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のテールをコードする単離ポリペプチドであって、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６中の配列ＲＳＫＲＮＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜４４１に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜４４１にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴＤＤＡＡＡＰＡＬＥＴＱＰＱＧＤＥＥＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨＴＰＲＧＨＡＥＳＴＳＮＲＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のアミノ酸４４２〜４５４に対応する配列ＬＬＷＬＲＧＫＶＳＦＹＣＦを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチドであって、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７中の配列ＬＬＷＬＲＧＫＶＳＦＹＣＦと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチドであって、ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜１７０に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１〜１７０にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴと少なくとも９０％相同な第１のアミノ酸配列と、ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１８８〜４４６に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１７１〜４２９にも対応するＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨＴＰＲＧＨＡＥＳＴＳＮＲＱＰＲＫＱＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＴＤを含み、以下の構造：アミノ酸番号１７０−ｘ〜１７０のいずれかから始まり、アミノ酸番号１７１＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ６１７７５＿Ｐ１６をコードする単離キメラポリペプチドであって、Ｑ９Ｐ２Ｊ２のアミノ酸１１〜９３に対応し、Ｈ６１７７５＿Ｐ１６のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ６１７７５＿Ｐ１６のアミノ酸８４〜１５２に対応する配列ＤＣＧＦＰＡＦＲＥＬＫＲＡＥＴＶＳＰＶＦＦＴＲＲＣＩＷＥＤＬＫＳＴＧＦＳＰＡＧＧＧＲＰＰＧＧＧＰＲＴＱＥＤＳＧＬＰＣＷＲＳＳＣＳＶＴＬＱＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ６１７７５＿Ｐ１６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ６１７７５＿Ｐ１６のテールをコードする単離ポリペプチドであって、Ｈ６１７７５＿Ｐ１６中の配列ＤＣＧＦＰＡＦＲＥＬＫＲＡＥＴＶＳＰＶＦＦＴＲＲＣＩＷＥＤＬＫＳＴＧＦＳＰＡＧＧＧＲＰＰＧＧＧＰＲＴＱＥＤＳＧＬＰＣＷＲＳＳＣＳＶＴＬＱＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ６１７７５＿Ｐ１６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ６１７７５＿Ｐ１６をコードする単離キメラポリペプチドであって、ＡＡＱ８８４９５のアミノ酸１〜８３に対応し、Ｈ６１７７５＿Ｐ１６のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ６１７７５＿Ｐ１６のアミノ酸８４〜１５２に対応する配列ＤＣＧＦＰＡＦＲＥＬＫＲＡＥＴＶＳＰＶＦＦＴＲＲＣＩＷＥＤＬＫＳＴＧＦＳＰＡＧＧＧＲＰＰＧＧＧＰＲＴＱＥＤＳＧＬＰＣＷＲＳＳＣＳＶＴＬＱＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ６１７７５＿Ｐ１６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ６１７７５＿Ｐ１７をコードする単離キメラポリペプチドであって、Ｑ９Ｐ２Ｊ２のアミノ酸１１〜９３に対応し、Ｈ６１７７５＿Ｐ１７のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｈ６１７７５＿Ｐ１７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ６１７７５＿Ｐ１７をコードする単離キメラポリペプチドであって、ＡＡＱ８８４９５のアミノ酸１〜８３に対応し、Ｈ６１７７５＿Ｐ１７のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｈ６１７７５＿Ｐ１７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３をコードする単離キメラポリペプチドであって、ＥＰＢ２＿ＨＵＭＡＮのアミノ酸１〜４７６に対応し、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３のアミノ酸１〜４７６にも対応するＭＡＬＲＲＬＧＡＡＬＬＬＬＰＬＬＡＡＶＥＥＴＬＭＤＳＴＴＡＴＡＥＬＧＷＭＶＨＰＰＳＧＷＥＥＶＳＧＹＤＥＮＭＮＴＩＲＴＹＱＶＣＮＶＦＥＳＳＱＮＮＷＬＲＴＫＦＩＲＲＲＧＡＨＲＩＨＶＥＭＫＦＳＶＲＤＣＳＳＩＰＳＶＰＧＳＣＫＥＴＦＮＬＹＹＹＥＡＤＦＤＳＡＴＫＴＦＰＮＷＭＥＮＰＷＶＫＶＤＴＩＡＡＤＥＳＦＳＱＶＤＬＧＧＲＶＭＫＩＮＴＥＶＲＳＦＧＰＶＳＲＳＧＦＹＬＡＦＱＤＹＧＧＣＭＳＬＩＡＶＲＶＦＹＲＫＣＰＲＩＩＱＮＧＡＩＦＱＥＴＬＳＧＡＥＳＴＳＬＶＡＡＲＧＳＣＩＡＮＡＥＥＶＤＶＰＩＫＬＹＣＮＧＤＧＥＷＬＶＰＩＧＲＣＭＣＫＡＧＦＥＡＶＥＮＧＴＶＣＲＧＣＰＳＧＴＦＫＡＮＱＧＤＥＡＣＴＨＣＰＩＮＳＲＴＴＳＥＧＡＴＮＣＶＣＲＮＧＹＹＲＡＤＬＤＰＬＤＭＰＣＴＴＩＰＳＡＰＱＡＶＩＳＳＶＮＥＴＳＬＭＬＥＷＴＰＰＲＤＳＧＧＲＥＤＬＶＹＮＩＩＣＫＳＣＧＳＧＲＧＡＣＴＲＣＧＤＮＶＱＹＡＰＲＱＬＧＬＴＥＰＲＩＹＩＳＤＬＬＡＨＴＱＹＴＦＥＩＱＡＶＮＧＶＴＤＱＳＰＦＳＰＱＦＡＳＶＮＩＴＴＮＱＡＡＰＳＡＶＳＩＭＨＱＶＳＲＴＶＤＳＩＴＬＳＷＳＱＰＤＱＰＮＧＶＩＬＤＹＥＬＱＹＹＥＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３のアミノ酸４７７〜４９６に対応する配列ＶＰＩＧＷＶＬＳＰＳＰＴＳＬＲＡＰＬＰＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３のテールをコードする単離ポリペプチドであって、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３中の配列ＶＰＩＧＷＶＬＳＰＳＰＴＳＬＲＡＰＬＰＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチドであって、ＥＰＢ２＿ＨＵＭＡＮのアミノ酸１〜２７０に対応し、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のアミノ酸１〜２７０にも対応するＭＡＬＲＲＬＧＡＡＬＬＬＬＰＬＬＡＡＶＥＥＴＬＭＤＳＴＴＡＴＡＥＬＧＷＭＶＨＰＰＳＧＷＥＥＶＳＧＹＤＥＮＭＮＴＩＲＴＹＱＶＣＮＶＦＥＳＳＱＮＮＷＬＲＴＫＦＩＲＲＲＧＡＨＲＩＨＶＥＭＫＦＳＶＲＤＣＳＳＩＰＳＶＰＧＳＣＫＥＴＦＮＬＹＹＹＥＡＤＦＤＳＡＴＫＴＦＰＮＷＭＥＮＰＷＶＫＶＤＴＩＡＡＤＥＳＦＳＱＶＤＬＧＧＲＶＭＫＩＮＴＥＶＲＳＦＧＰＶＳＲＳＧＦＹＬＡＦＱＤＹＧＧＣＭＳＬＩＡＶＲＶＦＹＲＫＣＰＲＩＩＱＮＧＡＩＦＱＥＴＬＳＧＡＥＳＴＳＬＶＡＡＲＧＳＣＩＡＮＡＥＥＶＤＶＰＩＫＬＹＣＮＧＤＧＥＷＬＶＰＩＧＲＣＭＣＫＡＧＦＥＡＶＥＮＧＴＶＣＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のアミノ酸２７１〜３０１に対応する配列ＥＲＱＤＬＴＭＬＳＲＬＶＬＮＳＷＰＱＭＩＬＰＰＱＰＰＫＶＬＥＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチドであって、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４中の配列ＥＲＱＤＬＴＭＬＳＲＬＶＬＮＳＷＰＱＭＩＬＰＰＱＰＰＫＶＬＥＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ６をコードする単離キメラポリペプチドであって、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜２７６に対応し、Ｔ３９９７１＿Ｐ６のアミノ酸１〜２７６にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ３９９７１＿Ｐ６のアミノ酸２７７〜２８３に対応する配列ＴＱＧＶＶＧＤを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ６のテールをコードする単離ポリペプチドであって、Ｔ３９９７１＿Ｐ６中の配列ＴＱＧＶＶＧＤと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ３９９７１＿Ｐ６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ９をコードする単離キメラポリペプチドであって、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜３２５に対応し、Ｔ３９９７１＿Ｐ９のアミノ酸１〜３２５にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧＫＱＹＷＥＹＱＦＱＨＱＰＳＱＥＥＣＥＧＳＳＬＳＡＶＦＥＨＦＡＭＭＱＲＤＳＷＥＤＩＦＥＬＬＦＷＧＲＴと少なくとも９０％相同な第１のアミノ酸配列と、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸３５７〜４７８に対応し、Ｔ３９９７１＿Ｐ９のアミノ酸３２６〜４４７にも対応するＳＧＭＡＰＲＰＳＬＡＫＫＱＲＦＲＨＲＮＲＫＧＹＲＳＱＲＧＨＳＲＧＲＮＱＮＳＲＲＰＳＲＡＴＷＬＳＬＦＳＳＥＥＳＮＬＧＡＮＮＹＤＤＹＲＭＤＷＬＶＰＡＴＣＥＰＩＱＳＶＦＦＦＳＧＤＫＹＹＲＶＮＬＲＴＲＲＶＤＴＶＤＰＰＹＰＲＳＩＡＱＹＷＬＧＣＰＡＰＧＨＬと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ９の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＴＳを含み、以下の構造：アミノ酸番号３２５−ｘ〜３２５のいずれかから始まり、アミノ酸番号３２６＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｔ３９９７１＿Ｐ９の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ１１をコードする単離キメラポリペプチドであって、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜３２６に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸１〜３２６にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧＫＱＹＷＥＹＱＦＱＨＱＰＳＱＥＥＣＥＧＳＳＬＳＡＶＦＥＨＦＡＭＭＱＲＤＳＷＥＤＩＦＥＬＬＦＷＧＲＴＳと少なくとも９０％相同な第１のアミノ酸配列と、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸４４２〜４７８に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸３２７〜３６３にも対応するＤＫＹＹＲＶＮＬＲＴＲＲＶＤＴＶＤＰＰＹＰＲＳＩＡＱＹＷＬＧＣＰＡＰＧＨＬと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ１１の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＳＤを含み、以下の構造：アミノ酸番号３２６−ｘ〜３２６のいずれかから始まり、アミノ酸番号３２７＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｔ３９９７１＿Ｐ１１の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ１１をコードする単離キメラポリペプチドであって、Ｑ９ＢＳＨ７のアミノ酸１〜３２６に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸１〜３２６にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧＫＱＹＷＥＹＱＦＱＨＱＰＳＱＥＥＣＥＧＳＳＬＳＡＶＦＥＨＦＡＭＭＱＲＤＳＷＥＤＩＦＥＬＬＦＷＧＲＴＳと少なくとも９０％相同な第１のアミノ酸配列と、Ｑ９ＢＳＨ７のアミノ酸４４２〜４７８に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸３２７〜３６３にも対応するＤＫＹＹＲＶＮＬＲＴＲＲＶＤＴＶＤＰＰＹＰＲＳＩＡＱＹＷＬＧＣＰＡＰＧＨＬと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１１をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ１２をコードする単離キメラポリペプチドであって、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜２２３に対応し、Ｔ３９９７１＿Ｐ１２のアミノ酸１〜２２３にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ３９９７１＿Ｐ１２のアミノ酸２２４〜２３８に対応する配列ＶＰＧＡＶＧＱＧＲＫＨＬＧＲＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ１２のテールをコードする単離ポリペプチドであって、Ｔ３９９７１＿Ｐ１２中の配列ＶＰＧＡＶＧＱＧＲＫＨＬＧＲＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ３９９７１＿Ｐ１２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｔ３９９７１＿Ｐ１２をコードする単離キメラポリペプチドであって、Ｑ９ＢＳＨ７のアミノ酸１〜２２３に対応し、Ｔ３９９７１＿Ｐ１２のアミノ酸１〜２２３にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ３９９７１＿Ｐ１２のアミノ酸２２４〜２３８に対応する配列ＶＰＧＡＶＧＱＧＲＫＨＬＧＲＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドであって、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜７６１に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜７６１にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のアミノ酸７６２〜７９０に対応する配列ＰＨＫＹＳＡＨＧＲＴＲＨＦＥＳＡＴＲＴＴＮＧＡＱＫＬＳＲＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチドであって、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２中の配列ＰＨＫＹＳＡＨＧＲＴＲＨＦＥＳＡＴＲＴＴＮＧＡＱＫＬＳＲＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、Ｑ７Ｚ２Ｗ２のアミノ酸１〜５７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜５７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬと少なくとも９０％相同な第１のアミノ酸配列と、Ａを含む第２の架橋アミノ酸配列と、Ｑ７Ｚ２Ｗ２のアミノ酸１３９〜８７１に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸５９〜７９１にも対応するＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥＬＲＳＣＱＧＹＫＱＣＮＰＲＰＫＮＬＤＶＧＮＫＤＧＧＳＹＤＬＨＲＧＱＬＷＤＧＷＥＧと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離ポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＬＡＦを含み、以下の構造（Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５に対応する番号付け）：アミノ酸番号５７−ｘ〜５７のいずれかから始まり、アミノ酸番号５９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、の縁部分をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜７５１に対応する配列ＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＡＨ１２９９７のアミノ酸１〜４０に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸７５２〜７９１にも対応するＬＲＳＣＱＧＹＫＱＣＮＰＲＰＫＮＬＤＶＧＮＫＤＧＧＳＹＤＬＨＲＧＱＬＷＤＧＷＥＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の先端をコードする単離ポリペプチドであって、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の配列ＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜５７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜５７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬと少なくとも９０％相同な第１のアミノ酸配列と、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１３８〜８７１に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸５８〜７９１にも対応するＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥＬＲＳＣＱＧＹＫＱＣＮＰＲＰＫＮＬＤＶＧＮＫＤＧＧＳＹＤＬＨＲＧＱＬＷＤＧＷＥＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＬＡを含み、以下の構造：アミノ酸番号５７−ｘ〜５７のいずれかから始まり、アミノ酸番号５８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５をコードする単離キメラポリペプチドであって、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜４１６に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５のアミノ酸１〜４１６にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６をコードする単離キメラポリペプチドであって、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜３９７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のアミノ酸１〜３９７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のアミノ酸３９８〜４１０に対応する配列ＣＶＩＶＰＰＬＳＱＰＱＩＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のテールをコードする単離ポリペプチドであって、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６中の配列ＣＶＩＶＰＰＬＳＱＰＱＩＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２をコードする単離キメラポリペプチドであって、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜１８８に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のアミノ酸１〜１８８にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のアミノ酸１８９〜２１０に対応する配列ＡＲＹＤＧＤＱＰＲＣＡＰＲＰＲＧＬＳＰＴＶＦを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のテールをコードする単離ポリペプチドであって、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２中の配列ＡＲＹＤＧＤＱＰＲＣＡＰＲＰＲＧＬＳＰＴＶＦと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３をコードする単離キメラポリペプチドであって、Ｑ７Ｚ２Ｗ２のアミノ酸１〜１３７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１〜１３７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１３８〜１４５に対応する配列ＧＬＬＨＲＬＮＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のテールをコードする単離ポリペプチドであって、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３中の配列ＧＬＬＨＲＬＮＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３をコードする単離キメラポリペプチドであって、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜１３７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１〜１３７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１３８〜１４５に対応する配列ＧＬＬＨＲＬＮＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＧＲＰ５Ｅ＿Ｐ４をコードする単離キメラポリペプチドであって、ＧＲＰ＿ＨＵＭＡＮのアミノ酸１〜１２７に対応し、ＨＵＭＧＲＰ５Ｅ＿Ｐ４のアミノ酸１〜１２７にも対応するＭＲＧＳＥＬＰＬＶＬＬＡＬＶＬＣＬＡＰＲＧＲＡＶＰＬＰＡＧＧＧＴＶＬＴＫＭＹＰＲＧＮＨＷＡＶＧＨＬＭＧＫＫＳＴＧＥＳＳＳＶＳＥＲＧＳＬＫＱＱＬＲＥＹＩＲＷＥＥＡＡＲＮＬＬＧＬＩＥＡＫＥＮＲＮＨＱＰＰＱＰＫＡＬＧＮＱＱＰＳＷＤＳＥＤＳＳＮＦＫＤＶＧＳＫＧＫと少なくとも９０％相同な第１のアミノ酸配列と、ＧＲＰ＿ＨＵＭＡＮのアミノ酸１３５〜１４８に対応し、ＨＵＭＧＲＰ５Ｅ＿Ｐ４のアミノ酸１２８〜１４１にも対応するＧＳＱＲＥＧＲＮＰＱＬＮＱＱと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＧＲＰ５Ｅ＿Ｐ４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＧＲＰ５Ｅ＿Ｐ４の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＧを含み、以下の構造：アミノ酸番号１２７−ｘ〜１２７のいずれかから始まり、アミノ酸番号１２８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＧＲＰ５Ｅ＿Ｐ４の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＧＲＰ５Ｅ＿Ｐ５をコードする単離キメラポリペプチドであって、ＧＲＰ＿ＨＵＭＡＮのアミノ酸１〜１２７に対応し、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のアミノ酸１〜１２７にも対応するＭＲＧＳＥＬＰＬＶＬＬＡＬＶＬＣＬＡＰＲＧＲＡＶＰＬＰＡＧＧＧＴＶＬＴＫＭＹＰＲＧＮＨＷＡＶＧＨＬＭＧＫＫＳＴＧＥＳＳＳＶＳＥＲＧＳＬＫＱＱＬＲＥＹＩＲＷＥＥＡＡＲＮＬＬＧＬＩＥＡＫＥＮＲＮＨＱＰＰＱＰＫＡＬＧＮＱＱＰＳＷＤＳＥＤＳＳＮＦＫＤＶＧＳＫＧＫと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のアミノ酸１２８〜１４２に対応する配列ＤＳＬＬＱＶＬＮＶＫＥＧＴＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＧＲＰ５Ｅ＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のテールをコードする単離ポリペプチドであって、ＨＵＭＧＲＰ５Ｅ＿Ｐ５中の配列ＤＳＬＬＱＶＬＮＶＫＥＧＴＰＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドであって、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１〜１２０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜１２０にも対応するＭＭＡＧＭＫＩＱＬＶＣＭＬＬＬＡＦＳＳＷＳＬＣＳＤＳＥＥＥＭＫＡＬＥＡＤＦＬＴＮＭＨＴＳＫＩＳＫＡＨＶＰＳＷＫＭＴＬＬＮＶＣＳＬＶＮＮＬＮＳＰＡＥＥＴＧＥＶＨＥＥＥＬＶＡＲＲＫＬＰＴＡＬＤＧＦＳＬＥＡＭＬＴＩＹＱＬＨＫＩＣＨＳＲＡＦＱＨＷＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１２１〜１５１に対応する配列ＡＲＷＬＴＰＶＩＰＡＬＷＥＡＥＴＧＧＳＲＧＱＥＭＥＴＩＰＡＮＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列と、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１２１〜１７０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１５２〜２０１にも対応するＬＩＱＥＤＩＬＤＴＧＮＤＫＮＧＫＥＥＶＩＫＲＫＩＰＹＩＬＫＲＱＬＹＥＮＫＰＲＲＰＹＩＬＫＲＤＳＹＹＹと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２の縁部分をコードする単離ポリペプチドであって、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２に対応するＡＲＷＬＴＰＶＩＰＡＬＷＥＡＥＴＧＧＳＲＧＱＥＭＥＴＩＰＡＮＴをコードする配列と少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なアミノ酸配列を含む、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２の縁部分をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１〜２３に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜２３にも対応するＭＭＡＧＭＫＩＱＬＶＣＭＬＬＬＡＦＳＳＷＳＬＣと少なくとも９０％相同な第１のアミノ酸配列と、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸２６〜１７０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５のアミノ酸２４〜１６８にも対応するＳＥＥＥＭＫＡＬＥＡＤＦＬＴＮＭＨＴＳＫＩＳＫＡＨＶＰＳＷＫＭＴＬＬＮＶＣＳＬＶＮＮＬＮＳＰＡＥＥＴＧＥＶＨＥＥＥＬＶＡＲＲＫＬＰＴＡＬＤＧＦＳＬＥＡＭＬＴＩＹＱＬＨＫＩＣＨＳＲＡＦＱＨＷＥＬＩＱＥＤＩＬＤＴＧＮＤＫＮＧＫＥＥＶＩＫＲＫＩＰＹＩＬＫＲＱＬＹＥＮＫＰＲＲＰＹＩＬＫＲＤＳＹＹＹと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＣＳを含み、以下の構造：アミノ酸番号２３−ｘ〜２４のいずれかから始まり、アミノ酸番号＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドであって、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１〜４５に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜４５にも対応するＭＭＡＧＭＫＩＱＬＶＣＭＬＬＬＡＦＳＳＷＳＬＣＳＤＳＥＥＥＭＫＡＬＥＡＤＦＬＴＮＭＨＴＳＫと少なくとも９０％相同な第１のアミノ酸配列と、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１２１〜１７０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６のアミノ酸４６〜９５にも対応するＬＩＱＥＤＩＬＤＴＧＮＤＫＮＧＫＥＥＶＩＫＲＫＩＰＹＩＬＫＲＱＬＹＥＮＫＰＲＲＰＹＩＬＫＲＤＳＹＹＹと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６の縁部分をコードする単離キメラポリペプチドであって、長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＬを含み、以下の構造：アミノ酸番号４５−ｘ〜４６のいずれかから始まり、アミノ酸番号４６＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６の縁部分をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドであって、ＡＤＭＬ＿ＨＵＭＡＮのアミノ酸１〜３３に対応し、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜３３にも対応するＭＫＬＶＳＶＡＬＭＹＬＧＳＬＡＦＬＧＡＤＴＡＲＬＤＶＡＳＥＦＲＫＫと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドであって、ＡＤＭＬ＿ＨＵＭＡＮのアミノ酸１〜８２に対応し、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜８２にも対応するＭＫＬＶＳＶＡＬＭＹＬＧＳＬＡＦＬＧＡＤＴＡＲＬＤＶＡＳＥＦＲＫＫＷＮＫＷＡＬＳＲＧＫＲＥＬＲＭＳＳＳＹＰＴＧＬＡＤＶＫＡＧＰＡＱＴＬＩＲＰＱＤＭＫＧＡＳＲＳＰＥＤと少なくとも９０％相同な第１のアミノ酸配列と、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８のアミノ酸８３〜８３に対応する配列Ｒを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ１４６２４＿Ｐ１５をコードする単離キメラポリペプチドであって、Ｑ９ＨＡＰ５のアミノ酸１〜１６７に対応し、Ｈ１４６２４＿Ｐ１５のアミノ酸１〜１６７にも対応するＭＬＱＧＰＧＳＬＬＬＬＦＬＡＳＨＣＣＬＧＳＡＲＧＬＦＬＦＧＱＰＤＦＳＹＫＲＳＮＣＫＰＩＰＡＮＬＱＬＣＨＧＩＥＹＱＮＭＲＬＰＮＬＬＧＨＥＴＭＫＥＶＬＥＱＡＧＡＷＩＰＬＶＭＫＱＣＨＰＤＴＫＫＦＬＣＳＬＦＡＰＶＣＬＤＤＬＤＥＴＩＱＰＣＨＳＬＣＶＱＶＫＤＲＣＡＰＶＭＳＡＦＧＦＰＷＰＤＭＬＥＣＤＲＦＰＱＤＮＤＬＣＩＰＬＡＳＳＤＨＬＬＰＡＴＥＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ１４６２４＿Ｐ１５のアミノ酸１６８〜１８０に対応する配列ＧＫＰＳＬＬＬＰＨＳＬＬＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ１４６２４＿Ｐ１５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ１４６２４＿Ｐ１５のテールをコードする単離ポリペプチドであって、Ｈ１４６２４＿Ｐ１５中の配列ＧＫＰＳＬＬＬＰＨＳＬＬＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ１４６２４＿Ｐ１５のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドであって、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜５７に対応する配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＵＢ３＿ＨＵＭＡＮのアミノ酸１〜３２４に対応し、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５のアミノ酸５８〜３８１にも対応するＭＴＧＳＮＥＦＫＬＮＱＰＰＥＤＧＩＳＳＶＫＦＳＰＮＴＳＱＦＬＬＶＳＳＷＤＴＳＶＲＬＹＤＶＰＡＮＳＭＲＬＫＹＱＨＴＧＡＶＬＤＣＡＦＹＤＰＴＨＡＷＳＧＧＬＤＨＱＬＫＭＨＤＬＮＴＤＱＥＮＬＶＧＴＨＤＡＰＩＲＣＶＥＹＣＰＥＶＮＶＭＶＴＧＳＷＤＱＴＶＫＬＷＤＰＲＴＰＣＮＡＧＴＦＳＱＰＥＫＶＹＴＬＳＶＳＧＤＲＬＩＶＧＴＡＧＲＲＶＬＶＷＤＬＲＮＭＧＹＶＱＱＲＲＥＳＳＬＫＹＱＴＲＣＩＲＡＦＰＮＫＱＧＹＶＬＳＳＩＥＧＲＶＡＶＥＹＬＤＰＳＰＥＶＱＫＫＫＹＡＦＫＣＨＲＬＫＥＮＮＩＥＱＩＹＰＶＮＡＩＳＦＨＮＩＨＮＴＦＡＴＧＧＳＤＧＦＶＮＩＷＤＰＦＮＫＫＲＬＣＱＦＨＲＹＰＴＳＩＡＳＬＡＦＳＮＤＧＴＴＬＡＩＡＳＳＹＭＹＥＭＤＤＴＥＨＰＥＤＧＩＦＩＲＱＶＴＤＡＥＴＫＰＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５の先端をコードする単離ポリペプチドであって、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５の配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７をコードする単離キメラポリペプチドであって、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７のアミノ酸１〜５７に対応する配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＵＢ３＿ＨＵＭＡＮのアミノ酸１〜３２８に対応し、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７のアミノ酸５８〜３８５にも対応するＭＴＧＳＮＥＦＫＬＮＱＰＰＥＤＧＩＳＳＶＫＦＳＰＮＴＳＱＦＬＬＶＳＳＷＤＴＳＶＲＬＹＤＶＰＡＮＳＭＲＬＫＹＱＨＴＧＡＶＬＤＣＡＦＹＤＰＴＨＡＷＳＧＧＬＤＨＱＬＫＭＨＤＬＮＴＤＱＥＮＬＶＧＴＨＤＡＰＩＲＣＶＥＹＣＰＥＶＮＶＭＶＴＧＳＷＤＱＴＶＫＬＷＤＰＲＴＰＣＮＡＧＴＦＳＱＰＥＫＶＹＴＬＳＶＳＧＤＲＬＩＶＧＴＡＧＲＲＶＬＶＷＤＬＲＮＭＧＹＶＱＱＲＲＥＳＳＬＫＹＱＴＲＣＩＲＡＦＰＮＫＱＧＹＶＬＳＳＩＥＧＲＶＡＶＥＹＬＤＰＳＰＥＶＱＫＫＫＹＡＦＫＣＨＲＬＫＥＮＮＩＥＱＩＹＰＶＮＡＩＳＦＨＮＩＨＮＴＦＡＴＧＧＳＤＧＦＶＮＩＷＤＰＦＮＫＫＲＬＣＱＦＨＲＹＰＴＳＩＡＳＬＡＦＳＮＤＧＴＴＬＡＩＡＳＳＹＭＹＥＭＤＤＴＥＨＰＥＤＧＩＦＩＲＱＶＴＤＡＥＴＫＰＫＳＰＣＴと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７の先端をコードする単離ポリペプチドであって、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７の配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＳＥＮＡ７８＿Ｐ２をコードする単離キメラポリペプチドであって、ＳＺ０５＿ＨＵＭＡＮのアミノ酸１〜８１に対応し、ＨＳＥＮＡ７８＿Ｐ２のアミノ酸１〜８１にも対応するＭＳＬＬＳＳＲＡＡＲＶＰＧＰＳＳＳＬＣＡＬＬＶＬＬＬＬＬＴＱＰＧＰＩＡＳＡＧＰＡＡＡＶＬＲＥＬＲＣＶＣＬＱＴＴＱＧＶＨＰＫＭＩＳＮＬＱＶＦＡＩＧＰＱＣＳＫＶＥＶＶと少なくとも９０％相同な第１のアミノ酸配列を含む、ＨＳＥＮＡ７８＿Ｐ２をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチドであって、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸１〜２９に対応する配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＤＣＯＲ＿ＨＵＭＡＮのアミノ酸１５１〜４６１に対応し、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸３０〜３４０にも対応するＬＶＬＲＩＡＴＤＤＳＫＡＶＣＲＬＳＶＫＦＧＡＴＬＲＴＳＲＬＬＬＥＲＡＫＥＬＮＩＤＶＶＧＶＳＦＨＶＧＳＧＣＴＤＰＥＴＦＶＱＡＩＳＤＡＲＣＶＦＤＭＧＡＥＶＧＦＳＭＹＬＬＤＩＧＧＧＦＰＧＳＥＤＶＫＬＫＦＥＥＩＴＧＶＩＮＰＡＬＤＫＹＦＰＳＤＳＧＶＲＩＩＡＥＰＧＲＹＹＶＡＳＡＦＴＬＡＶＮＩＩＡＫＫＩＶＬＫＥＱＴＧＳＤＤＥＤＥＳＳＥＱＴＦＭＹＹＶＮＤＧＶＹＧＳＦＮＣＩＬＹＤＨＡＨＶＫＰＬＬＱＫＲＰＫＰＤＥＫＹＹＳＳＳＩＷＧＰＴＣＤＧＬＤＲＩＶＥＲＣＤＬＰＥＭＨＶＧＤＷＭＬＦＥＮＭＧＡＹＴＶＡＡＡＳＴＦＮＧＦＱＲＰＴＩＹＹＶＭＳＧＰＡＷＱＬＭＱＱＦＱＮＰＤＦＰＰＥＶＥＥＱＤＡＳＴＬＰＶＳＣＡＷＥＳＧＭＫＲＨＲＡＡＣＡＳＡＳＩＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＤＣＡ＿Ｐ９の先端をコードする単離ポリペプチドであって、ＨＵＭＯＤＣＡ＿Ｐ９の配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＯＤＣＡ＿Ｐ９の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチドであって、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸１〜２９に対応する配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＡＡ５９９６８のアミノ酸４０〜３５０に対応し、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸３０〜３４０にも対応するＬＶＬＲＩＡＴＤＤＳＫＡＶＣＲＬＳＶＫＦＧＡＴＬＲＴＳＲＬＬＬＥＲＡＫＥＬＮＩＤＶＶＧＶＳＦＨＶＧＳＧＣＴＤＰＥＴＦＶＱＡＩＳＤＡＲＣＶＦＤＭＧＡＥＶＧＦＳＭＹＬＬＤＩＧＧＧＦＰＧＳＥＤＶＫＬＫＦＥＥＩＴＧＶＩＮＰＡＬＤＫＹＦＰＳＤＳＧＶＲＩＩＡＥＰＧＲＹＹＶＡＳＡＦＴＬＡＶＮＩＩＡＫＫＩＶＬＫＥＱＴＧＳＤＤＥＤＥＳＳＥＱＴＦＭＹＹＶＮＤＧＶＹＧＳＦＮＣＩＬＹＤＨＡＨＶＫＰＬＬＱＫＲＰＫＰＤＥＫＹＹＳＳＳＩＷＧＰＴＣＤＧＬＤＲＩＶＥＲＣＤＬＰＥＭＨＶＧＤＷＭＬＦＥＮＭＧＡＹＴＶＡＡＡＳＴＦＮＧＦＱＲＰＴＩＹＹＶＭＳＧＰＡＷＱＬＭＱＱＦＱＮＰＤＦＰＰＥＶＥＥＱＤＡＳＴＬＰＶＳＣＡＷＥＳＧＭＫＲＨＲＡＡＣＡＳＡＳＩＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチドであって、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸１〜２９に対応する配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＡＨ１４５６２のアミノ酸８６〜３９６に対応し、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸３０〜３４０にも対応するＬＶＬＲＩＡＴＤＤＳＫＡＶＣＲＬＳＶＫＦＧＡＴＬＲＴＳＲＬＬＬＥＲＡＫＥＬＮＩＤＶＶＧＶＳＦＨＶＧＳＧＣＴＤＰＥＴＦＶＱＡＩＳＤＡＲＣＶＦＤＭＧＡＥＶＧＦＳＭＹＬＬＤＩＧＧＧＦＰＧＳＥＤＶＫＬＫＦＥＥＩＴＧＶＩＮＰＡＬＤＫＹＦＰＳＤＳＧＶＲＩＩＡＥＰＧＲＹＹＶＡＳＡＦＴＬＡＶＮＩＩＡＫＫＩＶＬＫＥＱＴＧＳＤＤＥＤＥＳＳＥＱＴＦＭＹＹＶＮＤＧＶＹＧＳＦＮＣＩＬＹＤＨＡＨＶＫＰＬＬＱＫＲＰＫＰＤＥＫＹＹＳＳＳＩＷＧＰＴＣＤＧＬＤＲＩＶＥＲＣＤＬＰＥＭＨＶＧＤＷＭＬＦＥＮＭＧＡＹＴＶＡＡＡＳＴＦＮＧＦＱＲＰＴＩＹＹＶＭＳＧＰＡＷＱＬＭＱＱＦＱＮＰＤＦＰＰＥＶＥＥＱＤＡＳＴＬＰＶＳＣＡＷＥＳＧＭＫＲＨＲＡＡＣＡＳＡＳＩＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ００２９９＿Ｐ３をコードする単離キメラポリペプチドであって、Ｒ００２９９＿Ｐ３のアミノ酸１〜４４に対応する配列ＭＡＥＫＡＬＬＣＰＳＳＡＧＬＧＴＷＰＷＶＬＮＳＡＷＰＶＬＰＬＡＶＤＱＧＶＤＷＲＰＲＧＰＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ９ＮＷＴ９のアミノ酸７４〜１９１に対応し、Ｒ００２９９＿Ｐ３のアミノ酸４５〜１６２にも対応するＳＳＤＱＩＥＱＬＨＲＲＦＫＱＬＳＧＤＱＰＴＩＲＫＥＮＦＮＮＶＰＤＬＥＬＮＰＩＲＳＫＩＶＲＡＦＦＤＮＲＮＬＲＫＧＰＳＧＬＡＤＥＩＮＦＥＤＦＬＴＩＭＳＹＦＲＰＩＤＴＴＭＤＥＥＱＶＥＬＳＲＫＥＫＬＲＦＬＦＨＭＹＤＳＤＳＤＧＲＩＴＬＥＥＹＲＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ００２９９＿Ｐ３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ００２９９＿Ｐ３の先端をコードする単離ポリペプチドであって、Ｒ００２９９＿Ｐ３の配列ＭＡＥＫＡＬＬＣＰＳＳＡＧＬＧＴＷＰＷＶＬＮＳＡＷＰＶＬＰＬＡＶＤＱＧＶＤＷＲＰＲＧＰＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ００２９９＿Ｐ３の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ００２９９＿Ｐ３のテールをコードする単離ポリペプチドであって、Ｒ００２９９＿Ｐ３中の配列ＶＥＥＬＬＳＧＮＰＨＩＥＫＥＳＡＲＳＩＡＤＧＡＭＭＥＡＡＳＶＣＭＧＱＭＥＰＤＱＶＹＥＧＩＴＦＥＤＦＬＫＩＷＱＧＩＤＩＥＴＫＭＨＶＲＦＬＮＭＥＴＭＡＬＣＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ００２９９＿Ｐ３のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｒ００２９９＿Ｐ３をコードする単離キメラポリペプチドであって、Ｒ００２９９＿Ｐ３のアミノ酸１〜４４に対応する配列ＭＡＥＫＡＬＬＣＰＳＳＡＧＬＧＴＷＰＷＶＬＮＳＡＷＰＶＬＰＬＡＶＤＱＧＶＤＷＲＰＲＧＰＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＴＥＳＣ＿ＨＵＭＡＮのアミノ酸２１〜２１４に対応し、Ｒ００２９９＿Ｐ３のアミノ酸４５〜２３８にも対応するＳＳＤＱＩＥＱＬＨＲＲＦＫＱＬＳＧＤＱＰＴＩＲＫＥＮＦＮＮＶＰＤＬＥＬＮＰＩＲＳＫＩＶＲＡＦＦＤＮＲＮＬＲＫＧＰＳＧＬＡＤＥＩＮＦＥＤＦＬＴＩＭＳＹＦＲＰＩＤＴＴＭＤＥＥＱＶＥＬＳＲＫＥＫＬＲＦＬＦＨＭＹＤＳＤＳＤＧＲＩＴＬＥＥＹＲＮＶＶＥＥＬＬＳＧＮＰＨＩＥＫＥＳＡＲＳＩＡＤＧＡＭＭＥＡＡＳＶＣＭＧＱＭＥＰＤＱＶＹＥＧＩＴＦＥＤＦＬＫＩＷＱＧＩＤＩＥＴＫＭＨＶＲＦＬＮＭＥＴＭＡＬＣＨと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ００２９９＿Ｐ３をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチドであって、Ｑ８ＩＸＤ７のアミノ酸１〜６６に対応し、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のアミノ酸１〜６６にも対応するＭＲＩＬＱＬＩＬＬＡＬＡＴＧＬＶＧＧＥＴＲＩＩＫＧＦＥＣＫＰＨＳＱＰＷＱＡＡＬＦＥＫＴＲＬＬＣＧＡＴＬＩＡＰＲＷＬＬＴＡＡＨＣＬＫＰと少なくとも９０％相同な第１のアミノ酸配列と、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のアミノ酸６７〜８０に対応する配列ＴＰＡＳＨＬＡＭＲＱＨＨＨＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチドであって、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４中の配列ＴＰＡＳＨＬＡＭＲＱＨＨＨＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、ＳＺ１４＿ＨＵＭＡＮのアミノ酸１〜９５に対応し、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜９５にも対応するＭＲＬＬＡＡＡＬＬＬＬＬＬＡＬＹＴＡＲＶＤＧＳＫＣＫＣＳＲＫＧＰＫＩＲＹＳＤＶＫＫＬＥＭＫＰＫＹＰＨＣＥＥＫＭＶＩＩＴＴＫＳＶＳＲＹＲＧＱＥＨＣＬＨＰＫＬＱＳＴＫＲＦＩＫＷＹＮＡＷＮＥＫＲＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９６〜１２３に対応する配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチドであって、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０中の配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、Ｑ９ＮＳ２１のアミノ酸１３〜１０７に対応し、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜９５にも対応するＭＲＬＬＡＡＡＬＬＬＬＬＬＡＬＹＴＡＲＶＤＧＳＫＣＫＣＳＲＫＧＰＫＩＲＹＳＤＶＫＫＬＥＭＫＰＫＹＰＨＣＥＥＫＭＶＩＩＴＴＫＳＶＳＲＹＲＧＱＥＨＣＬＨＰＫＬＱＳＴＫＲＦＩＫＷＹＮＡＷＮＥＫＲＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９６〜１２３に対応する配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドであって、ＡＡＱ８９２６５のアミノ酸１３〜１０７に対応し、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜９５にも対応するＭＲＬＬＡＡＡＬＬＬＬＬＬＡＬＹＴＡＲＶＤＧＳＫＣＫＣＳＲＫＧＰＫＩＲＹＳＤＶＫＫＬＥＭＫＰＫＹＰＨＣＥＥＫＭＶＩＩＴＴＫＳＶＳＲＹＲＧＱＥＨＣＬＨＰＫＬＱＳＴＫＲＦＩＫＷＹＮＡＷＮＥＫＲＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９６〜１２３に対応する配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、アミノ酸配列のエピトープに特異的に結合することができる抗体を提供する。

任意選択的に、アミノ酸配列は、架橋、縁部分、テール、先端、または挿入に対応する。

任意選択的に、抗体は、前記エピトープを有するスプライスバリアントと対応する公知のタンパク質とを区別することができる。

本発明の好ましい実施形態によれば、前記請求項のいずれか１項に記載のスプライスバリアントの過剰発現を検出する肺癌検出用キットを提供する。

任意選択的に、キットは、ＮＡＴベースのテクノロジーを含む。

任意選択的に、キットは、前記請求項のいずれか１項に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも１つのプライマー対をさらに含む。

任意選択的に、前記キットが、前記請求項のいずれか１項に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも１つのオリゴヌクレオチドをさらに含む。

任意選択的に、キットは、前記請求項のいずれか１項に記載の抗体を含む。

任意選択的に、キットは、ＥＬＩＳＡまたはウェスタンブロットの実施のための少なくとも１つの試薬をさらに含む。

本発明の好ましい実施形態によれば、前記請求項のいずれか１項に記載のスプライスバリアントの過剰発現を検出する工程を含む、肺癌の検出方法。

任意選択的に、過剰発現の検出を、ＮＡＴベースのテクノロジーを使用して実施する。

任意選択的に、過剰発現の検出を、免疫アッセイを使用して実施する。

任意選択的に、免疫アッセイは、前記請求項のいずれか１項に記載の抗体を含む。

本発明の好ましい実施形態によれば、上記の核酸配列もしくはそのフラグメントのいずれかまたは上記のアミノ酸配列もしくはそのフラグメントを含む、肺癌を検出することができるバイオマーカーを提供する。

本発明の好ましい実施形態によれば、前記請求項のいずれか１項に記載のバイオマーカーまたは方法もしくはアッセイで肺癌細胞を検出する工程を含む、肺癌のスクリーニング方法を提供する。

本発明の好ましい実施形態によれば、前記請求項のいずれか１項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程を含む、肺癌の診断方法を提供する。

本発明の好ましい実施形態によれば、前記請求項のいずれか１項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程を含む、疾患の進行および／または治療有効性および／または肺癌の再発をモニタリングする方法を提供する。

本発明の好ましい実施形態によれば、前記請求項のいずれか１項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程と、前記検出によって治療を選択する工程とを含む、肺癌治療の選択方法を提供する。

他で定義しない限り、本明細書中で使用した全ての技術用語および科学用語は、本発明に属する当業者によって一般に理解されている意味を有する。以下の参考文献により、当業者は、本発明で使用した多数の用語の一般的定義が得られる：Ｓｉｎｇｌｅｔｏｎｅｔａｌ．，ＤｉｃｔｉｏｎａｒｙｏｆＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ（２ｎｄｅｄ．１９９４）；ＴｈｅＣａｍｂｒｉｄｇｅＤｉｃｔｉｏｎａｒｙｏｆＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ（Ｗａｌｋｅｒｅｄ．，１９８８）；ＴｈｅＧｌｏｓｓａｒｙｏｆＧｅｎｅｔｉｃｓ，５ｔｈＥｄ．，Ｒ．Ｒｉｅｇｅｒｅｔａｌ．（ｅｄｓ．），ＳｐｒｉｎｇｅｒＶｅｒｌａｇ（１９９１）；およびＨａｌｅ＆Ｍａｒｈａｍ，ＴｈｅＨａｒｐｅｒＣｏｌｌｉｎｓＤｉｃｔｉｏｎａｒｙｏｆＢｉｏｌｏｇｙ（１９９１）。これらは全て、本明細書中に完全に記載されているかのように本明細書中で参考として援用される。本明細書中で使用される場合、以下の用語は、他で明記しない限り、これらに帰する意味を有する。

好ましい実施形態の説明
本発明は、高感度且つ正確な新規の肺癌マーカーである。さらに、少なくとも一定のこれらのマーカーは、単独または組み合わせて、小細胞癌、大細胞癌、扁平上皮癌、および腺癌などの種々の肺癌型を区別することができる。これらのマーカーは、正常な肺組織と対照的に、肺癌で特異的に差分発現し、好ましくは過剰発現する。患者サンプル中の単独または組み合わせたこれらのマーカーの測定により、診断医が有望な肺癌診断と相関させることができる情報が得られる。本発明のマーカーにより、単独または組み合わせて、肺癌と非癌状態とが高度に差分検出される。本発明のマーカーを、単独または組み合わせて、肺癌の予後、予想、スクリーニング、早期検診、治療の選択、治療のモニタリングに使用することができる。例えば、任意選択的および好ましくは、これらのマーカーを、肺癌の病期分類および／または疾患進行のモニタリングに使用することができる。さらに、本発明のマーカーを、単独または組み合わせて、肺以外の解剖学的位置で見出される転移源の検出に使用することができる。また、１つまたは複数のマーカーを、任意選択的に、１つまたは複数の他の癌マーカー（本明細書中に記載のもの以外）と組み合わせて使用することができる。本発明の任意選択的な実施形態によれば、このような組み合わせを使用して、小細胞癌、大細胞癌、扁平上皮癌、および腺癌などの種々の肺癌型を区別することができる。さらに、本発明のマーカーを、単独または組み合わせて、消失による他の腫瘍型の検出（例えば、肺癌の５％を占めるカルチノイド腫瘍の検出）に使用することができる。

本発明のマーカーを、単独または組み合わせて、肺癌の予後、予想、スクリーニング、早期検診、病期分類、治療の選択、治療のモニタリングに使用することができる。例えば、任意選択的および好ましくは、これらのマーカーを、肺癌の病期分類および／または疾患進行のモニタリングに使用することができる。さらに、本発明のマーカーを、単独または組み合わせて、肺以外の解剖学的位置で見出される転移源の検出に使用することができる。また、１つまたは複数のマーカーを、任意選択的に、１つまたは複数の他の癌マーカー（本明細書中に記載のもの以外）と組み合わせて使用することができる。

本発明の方法を使用して明らかとなり、且つ本明細書中に記載の生体分子配列（アミノ酸配列および／または核酸配列）を、疾患の治療または予防のための組織もしくは病理学的マーカーとしておよび／または薬物もしくは薬物標的として有効に利用することができる。

これらのマーカーは、肺癌条件下で血流に特異的に放出され、そして／または、そうでなければ、肺癌組織もしくは細胞中でさらにより高いレベルで発現するか、特異的に発現する。患者サンプル中の単独または組み合わせたこれらのマーカーの測定により、診断医が有望な肺癌診断と相関させることができる情報が得られる。

したがって、本発明はまた、肺癌および／または指示的容態の診断アッセイ、ならびに、任意選択的および好ましくは、被験体（患者）から採取したサンプル、より好ましくはいくつかの血液サンプル型における肺癌および／または指示的容態の検出のためのこのようなマーカーの使用方法に関する。

別の実施形態では、本発明は、架橋、テール、先端、および／もしくは挿入、ならびに／またはこのようなペプチドのアナログ、ホモログ、および誘導体に関する。このような架橋、テール、先端、および／または挿入を、実施例により詳細に記載する。

本明細書中で使用される、「テール」は、本発明のスプライスバリアントに固有のアミノ酸配列の末端のペプチド配列をいう。したがって、任意選択的に、このようなテールを有するスプライスバリアントは、典型的には、スプライスバリアントの少なくとも第１の部分が対応する公知のタンパク質の一部と高度に相同し（しばしば、１００％同一）、変異型の少なくとも第２の部分はテールを含むという点で、キメラと見なすことができる。

本明細書中で使用される、「先端」は、本発明のスプライスバリアントに固有のアミノ酸配列の最初のペプチド配列をいう。したがって、このような先端を有するスプライスバリアントは、任意選択的に、スプライスバリアントの少なくとも第１の部分が先端を含み、少なくとも第２の部分が、典型的には、対応する公知のタンパク質の一部と高度に相同する（しばしば、１００％同一）という点でキメラと見なすことができる。

本明細書中で使用される、「縁部分」は、野生型または公知のタンパク質中で連結されなかった本発明のスプライスバリアントの２つの部分の間の接続（ｃｏｎｎｅｃｔｉｏｎ）をいう。縁は、任意選択的に、変異型の上記の「公知のタンパク質」部分とテールとの間の連結によって起こる可能性があり、そして／または、例えば、野生型配列の内部部分がもはや存在しない場合に起こる可能性があり、その結果、公知のタンパク質中で過去には隣接していなかった配列の２つの部分がスプライスバリアント中で隣接する。「架橋」は、任意選択的に、上記の縁部分であり得るが、先端と変異型の「公知のタンパク質」部分との間の連結部、テールと変異型の「公知のタンパク質」部分との間の連結部、または挿入と変異型の「公知のタンパク質」との間の連結部も含まれ得る。

任意選択的および好ましくは、テール、先端、または固有の挿入と変異型の「公知のタンパク質」部分との間の架橋は、少なくとも約１０アミノ酸、より好ましくは少なくとも約２０アミノ酸、もっと好ましくは少なくとも約３０アミノ酸、さらにより好ましくは少なくとも約４０アミノ酸を含み、その中の少なくとも１つのアミノ酸がテール／先端／挿入に由来し、少なくとも１つのアミノ酸が変異型の「公知のタンパク質」部分に由来する。また、任意選択的に、架橋は、約１０〜約４０個の任意の数（例えば、１０、１１、１２、１３、．．．３７、３８、３９、４０アミノ酸長またはその間の任意の数）のアミノ酸を含み得る。

架橋を、いずれかの方向で配列の長さを超えて伸長することができないことに留意すべきであり、架橋の記載毎に、架橋の長さが配列自体を超えて伸長しないような様式で読み取られると仮定すべきである。

さらに、以下の一定の文脈においてスライディングウィンドウに関して架橋を記載する。例えば、架橋の一定の記載は以下を特徴とする：２つの縁の間の架橋（公知のタンパク質の一部は変異型中に存在しない）を、任意選択的に以下のように記載することができる：ＣＯＮＴＩＧ−ＮＡＭＥ＿Ｐ１（タンパク質名を示す）の架橋部分（長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＸＸ（架橋の中心の２アミノ酸、縁の各末端に由来する）を含み、以下の構造（ＣＯＮＴＩＧ−ＮＡＭＥ＿Ｐ１の配列による番号づけ）：アミノ酸番号４９−ｘ〜４９（例えば）のいずれかから始まり、アミノ酸番号５０＋（（ｎ−２）−ｘ）（例えば）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む。この例では、ｎが１０〜５０アミノ酸長の間の任意のアミノ酸数である架橋を含むと読み取るべきである。さらに、架橋ポリペプチドは配列を超えて伸長することができず、したがって、４９−ｘ（例えば）は少なくとも１であり、５０＋（（ｎ−２）−ｘ）（例えば）は全アミノ酸長を超えないように読み取るべきである。

別の実施形態では、本発明は、本発明のスプライスバリアントおよびそのペプチドフラグメントを特異的に認識する抗体を提供する。好ましくは、このような抗体は、本発明のスプライスバリアントを差分的に認識するが、対応する公知のタンパク質（このような公知のタンパク質を、以下の実施例中でそのスプライスバリアントに関して考察する）を認識しない。

別の実施形態では、本発明は、本発明のスプライスバリアントをコードし、本明細書中に列挙した配列のいずれか１つに記載のヌクレオチド配列またはこれに相補的な配列を有する単離核酸分子を提供する。別の実施形態では、本発明は、本明細書中に列挙した配列のいずれか１つに記載のヌクレオチド配列またはこれに相補的な配列を有する単離核酸分子を提供する。別の実施形態では、本発明は、本発明の核酸分子と特異的にハイブリッド形成することができる少なくとも約１２ヌクレオチドのオリゴヌクレオチドを提供する。別の実施形態では、本発明は、本発明の単離核酸を含む、ベクター、細胞、リポソーム、および組成物を提供する。

別の実施形態では、本発明は、抗体が生体サンプル中のスプライスバリアントと特異的に相互作用するが、公知の対応するタンパク質（公知のタンパク質を、以下の実施例中でそのスプライスバリアントに関して考察する）を認識しない条件下で生体サンプルを本発明のスプライスバリアントを特異的に認識する抗体と接触させる工程と、前記相互作用を検出する工程と、相互作用の存在が生体サンプル中のスプライスバリアントの存在と相関することとを含む、生体サンプル中の本発明のスプライスバリアントの検出方法を提供する。

別の実施形態では、本発明は、単離核酸分子または少なくともほぼ最短の長さのオリゴヌクレオチドフラグメントを生体サンプルの核酸材料とハイブリッド形成させる工程と、ハイブリッド形成複合体を検出する工程と、ハイブリッド形成複合体の存在が生体サンプル中のスプライスバリアントの核酸配列の存在と相関することとを含む、生体サンプル中のスプライスバリアントの核酸配列の検出方法を提供する。

本発明によれば、本明細書中に記載のスプライスバリアントは、肺癌診断のための限定されないマーカーの例である。本発明の各スプライスバリアントマーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、進行の判断、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。

本発明の任意選択的であるが好ましい実施形態によれば、本発明の任意のマーカーを、任意選択的に、単独または組み合わせて使用することができる。このような組み合わせは、任意選択的に、本明細書中に記載の複数のマーカー（任意選択的に、マーカーの任意の小組み合わせ（ｓｕｂｃｏｍｂｉｎａｔｉｏｎ）および／または少なくとも１つの他のマーカー（例えば、公知のマーカー）を特色とする組み合わせが含まれる）を含み得る。さらに、このような組み合わせを、任意選択的および好ましくは、本明細書中に記載の任意のマーカーと本明細書中に記載の任意の他のマーカー、および／または任意の他の公知のマーカー、および／または任意の他のマーカーとの間の定量的または半定量的測定の比の決定に関して上記のように使用することができる。本明細書中に記載の任意のマーカー（またはその組み合わせ）と公知のマーカーとの間のこのような比に関して、より好ましくは、公知のマーカーは、各クラスターまたは遺伝子に関して以下により詳細に記載の「公知のタンパク質」を含む。

本発明の他の好ましい実施形態によれば、スプライスバリアントタンパク質もしくはそのフラグメントまたはスプライスバリアントの核酸配列もしくはそのフラグメントを、肺癌検出用のバイオマーカーと特徴づけることができ、それにより、バイオマーカーは、任意選択的に、上記の任意のバイオマーカーを含み得る。

本発明のさらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、本明細書中に記載のスプライスバリアントタンパク質に対応する核酸配列によってコードされる任意のアミノ酸配列またはそのフラグメントを含む。このようなアミノ酸配列またはそのフラグメントに関する任意のオリゴペプチドまたはペプチドを、任意選択的に（さらにまたはあるいは）、バイオマーカー（テール、先端、挿入、縁、または架橋として表現されるこれらのタンパク質の固有のアミノ酸配列が含まれるが、これらに限定されない）として使用することもできる。本発明はまた、任意選択的に、このようなオリゴヌクレオチドまたはタンパク質を認識し、そして／またはこれらによって誘発することができる抗体を含む。

本発明はまた、任意選択的および好ましくは、任意選択的に、任意の適用のための上記の本発明のスプライスバリアントに対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。

方法またはアッセイの非限定的な例を、以下に記載する。

本発明はまた、このような診断方法またはアッセイに基づいたキットに関する。

核酸配列およびオリゴヌクレオチド
本発明の種々の実施形態は、上記の核酸配列、その配列フラグメント、これとハイブリッド形成可能な配列、これと相同な配列、異なるコドン使用頻度を有する類似のポリペプチドをコードする配列、無作為またはターゲティングされた様式で天然に存在するか人為的に誘導された１つまたは複数のヌクレオチドの欠失、挿入、または置換などの変異によって特徴づけられる変化した配列を含む。

本発明は、本明細書中に記載の核酸配列、そのフラグメント、これとハイブリッド形成可能な配列、これと相同な配列（例えば、下記の核酸配列と少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも９５％、または１００％同一）、異なるコドン使用頻度を有する類似のポリペプチドをコードする配列、無作為またはターゲティングされた様式で天然に存在するか人為的に誘導された１つまたは複数のヌクレオチドの欠失、挿入、または置換などの変異によって特徴づけられる変化した配列を含む。本発明はまた、本発明のポリペプチドに固有の配列領域を含む相同な核酸配列（すなわち、本発明のポリヌクレオチド配列の一部を形成する）を含む。

本発明のポリヌクレオチド配列が依然に同定されていないポリペプチドをコードする場合、本発明はまた、上記の単離ポリヌクレオチドおよびその各核酸フラグメントによってコードされる新規のポリペプチドまたはその一部を含む。

「核酸フラグメント」、「オリゴヌクレオチド」、または「ポリヌクレオチド」は、核酸のポリマーをいうために本明細書中で交換可能に使用される。本発明のポリヌクレオチド配列は、ＲＮＡ配列、相補ポリヌクレオチド配列（ｃＤＮＡ）、ゲノムポリヌクレオチド配列、および／または複合ポリヌクレオチド配列（例えば、上記の組み合わせ）の形態で単離および提供される一本鎖または二本鎖の核酸配列をいう。

本明細書中で使用される、句「相補ポリヌクレオチド配列」は、逆転写酵素または任意の他のＲＮＡ依存性ＤＮＡポリメラーゼを使用した伝令ＲＮＡの逆転写由来の配列をいう。このような配列を、その後、ＤＮＡ依存性ＤＮＡポリメラーゼを使用して、ｉｎｖｉｖｏまたはｉｎｖｉｔｒｏで増幅させることができる。

本明細書中で使用される、句「ゲノムポリヌクレオチド配列」は、染色体に由来し（単離され）、それにより、染色体の隣接部分を示す配列をいう。

本明細書中で使用される、句「複合ポリヌクレオチド配列」は、ゲノム配列およびｃＤＮＡ配列から構成される配列をいう。複合配列は、本発明のポリペプチドをコードするために必要ないくつかのエクソン配列およびこれらの間を介在するいくつかのイントロン配列を含み得る。イントロン配列は任意の供給源（他の遺伝子が含まれる）に由来することができ、典型的には、保存スプライシングシグナル配列が含まれる。このようなイントロン配列には、シス作用発現調節エレメントがさらに含まれ得る。

本発明の好ましい実施形態は、オリゴヌクレオチドプローブを含む。

本発明によって利用することができるオリゴヌクレオチドプローブの例は、本発明の任意の変異型の固有の配列領域に相補的な配列（本発明の架橋、テール、先端、および／もしくは挿入のアミノ酸配列をコードするヌクレオチド配列、ならびに／または本明細書中に記載の任意のヌクレオチド配列の等価な部分（本明細書中に記載のノード、セグメント、またはアンプリコンのヌクレオチド配列が含まれるが、これらに限定されない）が含まれるが、これらに限定されない）を含む一本鎖ポリヌクレオチドである。

あるいは、本発明のオリゴヌクレオチドプローブを、上記核酸配列のいずれかに含まれる核酸配列、特に、上記の部分（本発明の架橋、テール、先端、および／もしくは挿入のアミノ酸配列をコードするヌクレオチド配列、ならびに／または本明細書中に記載の任意のヌクレオチド配列の等価な部分（本明細書中に記載のノード、セグメント、またはアンプリコンのヌクレオチド配列が含まれるが、これらに限定されない）が含まれるが、これらに限定されない）とハイブリッド形成するようにデザインすることができる。

本発明の技術によってデザインしたオリゴヌクレオチドを、酵素合成または固相合成などの当該分野で公知の任意のオリゴヌクレオチド合成方法にしたがって生成することができる。固相合成実施のための装置および試薬は、例えば、ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓから市販されている。任意の他のこのような合成手段も使用することができ、実際のオリゴヌクレオチド合成は、十分に当業者の能力の範囲内であり、例えば、固相化学（例えば、シアノエチルホスホラミダイトおよびその後の脱保護、脱塩、および例えば自動化トリチル−ｏｎ（ｔｒｉｔｙｌ−ｏｎ）法またはＨＰＬＣによる精製）を使用した“ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡｌａｂｏｒａｔｏｒｙＭａｎｕａｌ" Ｓａｍｂｒｏｏｋｅｔａｌ．，（１９８９）；"ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ" ＶｏｌｕｍｅｓＩ−ＩＩＩＡｕｓｕｂｅｌ，Ｒ．Ｍ．，ｅｄ．（１９９４）；Ａｕｓｕｂｅｌｅｔａｌ．，"ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ"，ＪｏｈｎＷｉｌｅｙａｎｄＳｏｎｓ，Ｂａｌｔｉｍｏｒｅ，Ｍａｒｙｌａｎｄ（１９８９）；Ｐｅｒｂａｌ，"ＡＰｒａｃｔｉｃａｌＧｕｉｄｅｔｏＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ"，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ（１９８８）ａｎｄ "ＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＳｙｎｔｈｅｓｉｓ" Ｇａｉｔ，Ｍ．Ｊ．，ｅｄ．（１９８４）に詳述の確立された方法によって実施することができる。

本発明のこの態様にしたがって使用されるオリゴヌクレオチドは、約１０〜約２００塩基、好ましくは約１５〜約１５０塩基、より好ましくは約２０〜約１００塩基、最も好ましくは約２０〜約５０塩基の範囲から選択される長さを有するものである。好ましくは、本発明のオリゴヌクレオチドは、少なくとも１７塩基、少なくとも１８塩基、少なくとも１９塩基、少なくとも２０塩基、少なくとも２２塩基、少なくとも２５塩基、少なくとも３０塩基、または少なくとも４０塩基が本発明のバイオマーカーと特異的にハイブリッド形成可能であることを特徴とする。

本発明のオリゴヌクレオチドは、３’→５’リン酸ジエステル結合で結合したプリンおよびピリミジン塩基からなる複素環式ヌクレオシドを含み得る。

好ましくは、使用されるオリゴヌクレオチドは、以下に広範に記載されるように、１つまたは複数の骨格、ヌクレオシド間結合、または塩基で修飾されたものである。

本発明のこの態様に有用な好ましいオリゴヌクレオチドの特定の例には、修飾骨格または非天然ヌクレオシド間結合を含むオリゴヌクレオチドが含まれる。修飾骨格を有するオリゴヌクレオチドには、米国特許第４，４６９，８６３号；同第４，４７６，３０１号；同第５，０２３，２４３号；同第５，１７７，１９６号；同第５，１８８，８９７号；同第５，２６４，４２３号；同第５，２７６，０１９号；同第５，２７８，３０２号；同第５，２８６，７１７号；同第５，３２１，１３１号；同第５，３９９，６７６号；同第５，４０５，９３９号；同第５，４５３，４９６号；同第５，４５５，２３３号；同第５，４６６，６７７号；同第５，４７６，９２５号；同第５，５１９，１２６号；同第５，５３６，８２１号；同第５，５４１，３０６号；同第５，５５０，１１１号；同第５，５６３，２５３号；同第５，５７１，７９９号；同第５，５８７，３６１号；および同第５，６２５，０５０号に開示のように、骨格中にリン原子を保持するものが含まれる。

好ましい修飾オリゴヌクレオチド骨格には、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アルミアルキルホスホトリエステル、メチルおよび他のアルキルホスホネート（３’−アルキレンホスホネートおよびキラルホスホネートが含まれる）、ホスフィネート、ホスホラミデート（３’−アミノホスホラミデートおよびアミノアルキルホスホラミデートが含まれる）、チオノホスホラミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、ならびに通常の３’−５’結合を有するボラノホスフェート、これらの２’−５’結合アナログ、およびヌクレオシド単位の隣接対が３’−５’と５’−３’または２’−５’と５’−２’とで結合している極性が逆のものが含まれる。種々の塩、混合塩、および遊離酸形態も使用することができる。

あるいは、リン原子を含まない修飾オリゴヌクレオチド骨格は、短鎖アルキルもしくはシクロアルキルヌクレオシド間結合、混合ヘテロ原子およびアルキルもしくはシクロアルキルヌクレオシド間結合、または１つまたは複数の短鎖ヘテロ原子もしくは複素環式ヌクレオシド間結合によって形成された骨格を有する。これらには、モルホリノ結合（その一部がヌクレオシドの糖部分から形成されている）；シロキサン骨格、スルフィド、スルホキシド、およびスルホン骨格；ホルムアセチルおよびチオホルムアセチル骨格；メチレンホルムアセチルおよびチオホルムアセチル骨格；アルケン含有骨格；スルファメート骨格；メチレンイミノおよびメチレンヒドラジノ骨格；スルホネートおよびスルホンアミド骨格；アミド骨格を有する骨格、ならびに混合されたＮ、Ｏ、Ｓ、およびＣＨ_２成分を有する骨格が含まれ、これらは、米国特許第５，０３４，５０６号；同第５，１６６，３１５号；同第５，１８５，４４４号；同第５，２１４，１３４号；同第５，２１６，１４１号；同第５，２３５，０３３号；同第５，２６４，５６２号；同第５，２６４，５６４号；同第５，４０５，９３８号；同第５，４３４，２５７号；同第５，４６６，６７７号；同第５，４７０，９６７号；同第５，４８９，６７７号；同第５，５４１，３０７号；同第５，５６１，２２５号；同第５，５９６，０８６号；同第５，６０２，２４０号；同第５，６１０，２８９号；同第５，６０２，２４０号；同第５，６０８，０４６号；同第５，６１０，２８９号；同第５，６１８，７０４号；同第５，６２３，０７０号；同第５，６６３，３１２号；同第５，６３３，３６０号；同第５，６７７，４３７号；および同第５，６７７，４３９号に開示されている。

本発明で使用することができる他のオリゴヌクレオチドは、糖とヌクレオシド間結合の両方が修飾されたもの（すなわち、ヌクレオチド単位の骨格が新規の基で置換されている）である。塩基単位は、適切なポリヌクレオチド標的との相補性のために維持されている。このようなオリゴヌクレオチド模倣物の例には、ペプチド核酸（ＰＮＡ）が含まれる。ＰＮＡ化合物の調製を教示した米国特許には、米国特許第５，５３９，０８２号；同第５，７１４，３３１号および同第５，７１９，２６２号（それぞれ本明細書中で参考として援用される）が含まれるが、これらに限定されない。本発明で使用することができる他の骨格修飾は、米国特許第６，３０３，３７４号に開示されている。

本発明のオリゴヌクレオチドはまた、塩基の修飾または置換を含み得る。本明細書中で使用される、「非修飾」または「天然の」塩基には、プリン塩基であるアデニン（Ａ）およびグアニン（Ｇ）ならびにピリミジン塩基であるチミン（Ｔ）、シトシン（Ｃ）、およびウラシル（Ｕ）が含まれる。修飾塩基には、５−メチルシトシン（５−ｍｅ−Ｃ）、５−ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、２−アミノアデニン、アデニンおよびグアニンの６−メチルおよび他のアルキル誘導体、アデニンおよびグアニンの２−プロピルおよび他のアルキル誘導体、２−チオウラシル、２−チオチミン、および２−チオシトシン、５−ハロウラシルおよびシトシン、５−プロピニルウラシルおよびシトシン、６−アゾウラシル、シトシン、およびチミン、５−ウラシル（シュードウラシル）、４−チオウラシル、８−ハロ、８−アミノ、８−チオール、８−チオアルキル、８−ヒドロキシ、および他の８置換アデニンおよびグアニン、５−ハロ（特に５−ブロモ）、５−トリフルオロメチル、および他の５置換ウラシルおよびシトシン、７−メチルグアニンおよび７−メチルアデニン、８−アザグアニンおよび８−アザアデニン、７−デアザグアニンおよび７−デアザアデニン、ならびに３−デアザグアニンおよび３−デアザアデニンなどの他の合成塩基および天然の塩基が含まれるが、これらに限定されない。本発明のオリゴマー化合物の結合親和性の増加に特に有用なさらなる塩基には、５置換ピリミジン、６−アザピリミジン、およびＮ−２、Ｎ−６、およびＯ−６置換プリン（２−アミノプロピルアデニン、５−プロピニルウラシル、および５−プロピニルシトシンが含まれる）が含まれる。５−メチルシトシン置換により、核酸二重鎖の安定性が０．６〜１．２℃増加することが示されており、この置換は、さらにより詳細には、２’−Ｏ−メトキシエチル糖修飾と組み合わせた場合、現在好ましい塩基置換である。

本発明のオリゴヌクレオチドの別の修飾は、オリゴヌクレオチドの活性、細胞分布、または細胞取り込みを増大させるオリゴヌクレオチドへの１つまたは複数の部分または抱合体（ｃｏｎｊｕｇａｔｅ）の化学結合を含む。このような部分には、米国特許第６，３０３，３７４号に開示のように、コレステロール部分などの脂質部分、コール酸、チオエーテル（例えば、ヘキシル−Ｓ−トリチルチオール）、チオコレステロール、脂肪族鎖（例えば、ドデカンジオールまたはウンデシル残基）、リン脂質（例えば、ジヘキサデシル−ｒａｃ−グリセロールまたはトリエチルアンモニウム１，２−ジ−Ｏ−ヘキサデシル−ｒａｃ−グリセロ−３−Ｈ−ホスホネート）、ポリアミンもしくはポリエチレングリコール鎖、またはアダマンタン酢酸、パルミチル部分、またはオクタデシルアミンもしくはヘキシルアミノ−カルボニル−オキシコレステロール部分が含まれるが、これらに限定されない。

所与のオリゴヌクレオチド分子の全ての位置が均一に修飾される必要はなく、実際、１つを超える上記修飾を１つの化合物またはオリゴヌクレオチド内の１つのヌクレオチドにさえも組み込むことができる。

本発明のオリゴヌクレオチドが診断薬としてのより有効な使用および／または生物学的利用能、治療有効性の増加および細胞傷害性の減少のためにさらに修飾することができると認識される。

本発明のポリヌクレオチドの細胞発現を可能にするために、上記核酸配列の１つの少なくともコード領域を含み、少なくとも１つのシス作用調節エレメントをさらに含む本発明の核酸構築物を使用することができる。本明細書中で使用される、句「シス作用調節エレメント」は、トランス作用調節因子に結合してその下流に存在するコード配列の転写を調節するポリヌクレオチド配列、好ましくはプロモーターをいう。

任意の適切なプロモーター配列を、本発明の核酸構築物によって使用することができる。

好ましくは、本発明の核酸構築物によって使用されるプロモーターは、形質転換された特異的細胞集団中で活性である。細胞型特異的および／または組織特異的プロモーターの例には、肝臓特異的であるアルブミンプロモーター、リンパ特異的プロモーター（Ｃａｌａｍｅｅｔａｌ．，（１９８８）Ａｄｖ．Ｉｍｍｕｎｏｌ．４３：２３５−２７５）、特に、Ｔ細胞受容体（Ｗｉｎｏｔｏｅｔａｌ．，（１９８９）ＥＭＢＯＪ．８：７２９−７３３））および免疫グロブリン（Ｂａｎｅｒｊｉｅｔａｌ．（１９８３）Ｃｅｌｌ３３７２９−７４０）のプロモーター、神経フィラメントプロモーターなどのニューロン特異的プロモーター（Ｂｙｒｎｅｅｔａｌ．（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：５４７３−５４７７）、膵臓特異的プロモーター（Ｅｄｌｕｎｃｈｅｔａｌ．（１９８５）Ｓｃｉｅｎｃｅ２３０：９１２−９１６）または乳腺特異的プロモーター（乳清プロモーター（Ｕ．Ｓ．Ｐａｔ．Ｎｏ．４，８７３，３１６ａｎｄＥｕｒｏｐｅａｎＡｐｐｌｉｃａｔｉｏｎＰｕｂｌｉｃａｔｉｏｎＮｏ．２６４，１６６）など）などのプロモーターが含まれる。本発明の核酸構築物は、プロモーター配列に隣接するか遠位に存在し、構築物由来の転写の上方制御で機能し得るエンハンサーをさらに含み得る。

本発明の核酸構築物は、好ましくは、適切な選択マーカーおよび／または複製起点をさらに含む。好ましくは、使用される核酸構築物は、大腸菌においてその両方（構築物が適切な選択マーカーおよび複製起点を含む）が増殖し、最適な細胞における増殖または遺伝子および組織における組み込みに適合し得るシャトルベクターである。本発明の構築物は、例えば、プラスミド、バクミド、ファージミド、コスミド、ファージ、ウイルス、または人工染色体であり得る。

適切な構築物の例には、ｐｃＤＮＡ３、ｐｃＤＮＡ３．１（+／−）、ｐＧＬ３，ＰｚｅｏＳＶ２（+／−）、ｐＤｉｓｐｌａｙ、ｐＥＦ／ｍｙｃ／ｃｙｔｏ、ｐＣＭＶ／ｍｙｃ／ｃｙｔｏ（それぞれＩｎｖｉｔｒｏｇｅｎＣｏ．（ｗｗｗ．ｉｎｖｉｔｒｏｇｅｎ．ｃｏｍ）から市販されている）が含まれるが、これらに限定されない。レトロウイルスベクターおよびパッケージング系の例は、Ｃｌｏｎｔｅｃｈ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．から市販されており、Ｒｅｔｒｏ−ＸベクターであるｐＬＮＣＸおよびｐＬＸＳＮが含まれ、これらは、複数のクローニング部位にクローニング可能であり、導入遺伝子がＣＭＶプロモーターから転写される。導入遺伝子が５’ＬＴＲプロモーターから転写されるｐＢａｂｅなどのＭｏ−ＭｕＬＶ由来のベクターも含まれる。

現在好ましいｉｎｖｉｖｏ核酸導入技術には、アデノウイルス、レンチウイルス、単純ヘルペスＩ型ウイルス、またはアデノ随伴ウイルス（ＡＡＶ）、および脂質ベースの系などのウイルス構築物または非ウイルス構築物でのトランスフェクションが含まれる。遺伝子の脂質媒介性導入に有用な脂質は、例えば、ＤＯＴＭＡ、ＤＯＰＥ、およびＤＣ−Ｃｈｏｌ（Ｔｏｎｋｉｎｓｏｎｅｔａｌ．，ＣａｎｃｅｒＩｎｖｅｓｔｉｇａｔｉｏｎ，１４（１）：５４−６５（１９９６））である。遺伝子治療で用いる最も好ましい構築物は、ウイルス、最も好ましくはアデノウイルス、ＡＡＶ、レンチウイルス、またはレトロウイルスである。レトロウイルス構築物などのウイルス構築物は、少なくとも１つの転写プロモーター／エンハンサー若しくは遺伝子座限定（ｄｅｆｉｎｉｎｇ）エレメント、または選択的スプライシング、核ＲＮＡ輸送、もしくはメッセンジャーの翻訳後修飾などの他の手段によって遺伝子発現を調節する他のエレメントを含む。このようなベクター構築物はまた、ウイルス構築物中に既に存在しない限り、使用されるウイルスに適切なパッケージングシグナル、長末端反復（ＬＴＲ）もしくはその一部、ならびにプラス鎖およびマイナス鎖のプライマー結合部位を含む。さらに、このような構築物は、典型的には、配置される宿主細胞からのペプチドの分泌のためのシグナルペプチドを含む。好ましくは、この目的のためのシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異型のシグナル配列である。任意選択的に、構築物はまた、ポリアデニル化を指示するシグナルならびに１つまたは複数の制限部位および転写終結配列を含み得る。例として、このような構築物は、典型的には、５’ＬＴＲ、ｔＲＮＡ結合部位、パッケージングシグナル、二本鎖ＤＮＡ合成起点、および３’ＬＴＲ、またはその一部を含む。カチオン性脂質、ポリリジン、およびデンドリマーなどの非ウイルス性の他のベクターを使用することができる。

ハイブリッド形成アッセイ
生体サンプル中の目的の核酸の検出を、任意選択的に、オリゴヌクレオチドプローブを使用したハイブリッド形成ベースのアッセイによって行うことができる（本発明のプローブの非限定的な例は前述した）。

伝統的なハイブリッド形成アッセイには、ＰＣＲ、ＲＴ−ＰＣＲ、実時間ＰＣＲ、ＲＮアーゼ保護、ｉｎｓｉｔｕハイブリッド形成、プライマー伸長、サザンブロット（ＤＮＡ検出）、ドットブロットまたはスロットブロット（ＤＮＡ、ＲＮＡ）、およびノーザンブロット（ＲＮＡ検出）（ＮＡＴ型アッセイを、以下により詳細に記載する）が含まれる。最近、ＰＮＡが記載されている（Ｎｉｅｌｓｅｎｅｔａｌ．１９９９，ＣｕｒｒｅｎｔＯｐｉｎ．Ｂｉｏｔｅｃｈｎｏｌ．１０：７１−７５）。他の検出方法には、ディップスティック機構上にプローブを含むキットなどが含まれる。

生体サンプル中の目的の変異型（すなわち、ＤＮＡまたはＲＮＡ）を検出可能なハイブリッド形成ベースのアッセイは、１０、１５、２０、または３０〜１００ヌクレオチド長、好ましくは１０〜５０ヌクレオチド長、より好ましくは４０〜５０ヌクレオチド長であり得るオリゴヌクレオチドの使用に依存する。

したがって、本発明の単離ポリヌクレオチド（オリゴヌクレオチド）は、好ましくは、中程度からストリンジェントなハイブリッド形成条件下で本明細書中に記載の核酸配列のいずれかとハイブリッド形成可能である。

中程度からストリンジェントなハイブリッド形成条件は、１０％硫酸デキストラン、１ＭＮａＣｌ、１％ＳＤＳ、および５×１０６ｃｐｍの^３２Ｐ標識プローブ（６５℃）などを含むハイブリッド形成溶液、０．２×ＳＳＣおよび０．１％ＳＤＳの最終洗浄溶液、ならびに６５℃での最終洗浄によって特徴づけられるのに対し、中程度のハイブリッド形成を、１０％硫酸デキストラン、１ＭＮａＣｌ、１％ＳＤＳ、および５×１０^６ｃｐｍの^３２Ｐ標識プローブ（６５℃）を含むハイブリッド形成溶液、１×ＳＳＣおよび０．１％ＳＤＳの最終洗浄溶液、ならびに５０℃での最終洗浄を使用して行う。

より一般に、短い核酸（２００ｂｐ長未満（例えば、１７〜４０ｂｐ長））のハイブリッド形成を、所望のストリンジェンシーにしたがって修正することができる以下の例示的ハイブリッド形成プロトコールを使用して行うことができる：（ｉ）６×ＳＳＣおよび１％ＳＤＳまたは３ＭＴＭＡＣＩ、０．０１Ｍリン酸ナトリウム（ｐＨ６．８）、１ｍＭＥＤＴＡ（ｐＨ７．６）、０．５％ＳＤＳ、１００μｇ／ｍｌ変性サケ精子ＤＮＡ、および０．１%無脂肪粉乳のハイブリッド形成溶液、Ｔｍよりも１〜１．５℃低いハイブリッド形成温度、Ｔｍよりも１〜１．５℃低い３ＭＴＭＡＣＩ、０．０１Ｍリン酸ナトリウム（ｐＨ６．８）、１ｍＭＥＤＴＡ（ｐＨ７．６）、０．５％ＳＤＳの最終洗浄溶液、（ｉｉ）６×ＳＳＣおよび０．１％ＳＤＳまたは３ＭＴＭＡＣＩ、０．０１Ｍリン酸ナトリウム（ｐＨ６．８）、１ｍＭＥＤＴＡ（ｐＨ７．６）、０．５％ＳＤＳ、１００μｇ／ｍｌ変性サケ精子ＤＮＡ、および０．１％無脂肪粉乳のハイブリッド形成溶液、Ｔｍよりも２〜２．５℃低いハイブリッド形成温度、Ｔｍよりも１〜１．５℃低いハイブリッド形成温度での３ＭＴＭＡＣＩ、０．０１Ｍリン酸ナトリウム（ｐＨ６．８）、１ｍＭＥＤＴＡ（ｐＨ７．６）、０．５％ＳＤＳの最終洗浄溶液、６×ＳＳＣの最終洗浄溶液、ならびに２２℃での最終洗浄、（ｉｉｉ）６×ＳＳＣおよび１％ＳＤＳまたは３ＭＴＭＡＣＩ、０．０１Ｍリン酸ナトリウム（ｐＨ６．８）、１ｍＭＥＤＴＡ（ｐＨ７．６）、０．５％ＳＤＳ、１００μｇ／ｍｌ変性サケ精子ＤＮＡ、および０．１%無脂肪粉乳のハイブリッド溶液、ハイブリッド形成温度。

ハイブリッド二重鎖を、多数の方法によって検出することができる。典型的には、ハイブリッド二重鎖を非ハイブリッド形成核酸から分離し、二重鎖に結合した標識を検出する。このような標識は、当該分野で標準的に使用されている放射性、蛍光、生物、または酵素のタグまたは標識をいう。標識を、生体サンプル由来のオリゴヌクレオチドプローブまたは核酸のいずれかに抱合することができる。

多数の周知の方法によってプローブを標識することができる。放射性標識の非限定的な例には、３Ｈ、１４Ｃ、３２Ｐ、および３５Ｓが含まれる。検出可能なマーカーの非限定的な例には、リガンド、フルオロフォア、化学発光物質、酵素、および抗体が含まれる。本発明の方法の感度を上げることができるプローブと共に使用する他の検出可能なマーカーには、ビオチンおよび放射性ヌクレオチドが含まれる。特定の標識の選択によりプローブに結合する様式が決定されることが当業者に明らかとなる。

例えば、ビオチン化ｄＮＴＰもしくはｒＮＴＰの組み込みまたはいくつかの類似の手段（例えば、ＲＮＡへのビオチンのソラレン誘導体の光架橋）およびその後の標識ストレプトアビジン（例えば、フィコエリトリン抱合ストレプトアビジン）または等価物の付加によって本発明のオリゴヌクレオチドを合成後に標識することができる。あるいは、蛍光標識オリゴヌクレオチドプローブを使用する場合、フルオレセイン、リサミン、フィコエリトリン、ローダミン（ＰｅｒｋｉｎＥｌｍｅｒＣｅｔｕｓ）、Ｃｙ２、Ｃｙ３、Ｃｙ３．５、Ｃｙ５、Ｃｙ５．５、Ｃｙ７、およびＦｌｕｏｒＸ（Ａｍｅｒｓｈａｍ）など（例えば、Ｋｒｉｃｋａｅｔａｌ．（１９９２），ＡｃａｄｅｍｉｃＰｒｅｓｓＳａｎＤｉｅｇｏ，Ｃａｌｉｆ）を、オリゴヌクレオチドに結合させることができる。

当業者は、洗浄工程を使用して、過剰な標的ＤＮＡまたはプローブおよび非結合抱合体を洗い流すことを認識している。さらに、標準的な不均一アッセイ形式は、オリゴヌクレオチドプライマーおよびプローブ上に存在する標識を使用したハイブリッドの検出に適切である。

種々のコントロールを有用に使用してハイブリッド形成アッセイの精度を改良することができることが認識される。例えば、サンプルを無関係のプローブとハイブリッド形成し、ハイブリッド形成前にＲＮアーゼＡで処理して偽ハイブリッド形成を評価することができる。

本発明は特定の核酸配列の検出のための標識の使用に特に依存しないが、このような標識は、検出感度を高めるので有利であり得る。さらに、標識により自動化が可能である。プローブを、多数の周知の方法によって標識することができる。

一般に知られるように、放射性ヌクレオチドを、いくつかの方法によって本発明のプローブに組み込むことができる。放射性標識の非限定的な例には、^３Ｈ、^１４Ｃ、^３２Ｐ、および^３５Ｓが含まれる。

当業者は、洗浄工程を使用して過剰な標的ＤＮＡまたはプローブおよび非結合抱合体を洗い流すことができることを認識する。さらに、標準的な不均一アッセイ形式は、オリゴヌクレオチドプライマーおよびプローブ上に存在する標識を使用したハイブリッドの検出に適切である。

種々のコントロールを有用に使用してハイブリッド形成アッセイの精度を改良することができることが認識される。

本発明のプローブを、天然に存在する糖−リン酸骨格ならびに修飾骨格（ホスホロチオエート、ジチオネート、アルキルホスホネート、およびａ−ヌクレオチドなどが含まれる）と共に使用することができる。本発明のプローブを、リボ核酸（ＲＮＡ）またはデオキシリボ核酸（ＤＮＡ）（好ましくはＤＮＡ）から構築することができる。

ＮＡＴアッセイ
生体サンプル中の目的の核酸を、任意選択的に、例えば、ＰＣＲ（例えば、実時間ＰＣＲ等のそのバリエーション）などの核酸増幅テクノロジーを含むＮＡＴベースのアッセイによって検出することもできる。

本明細書中で使用される、「プライマー」は、標的配列とアニーリング（ハイブリッド形成）し、それにより適切な条件下でのＤＮＡ合成の出発点としての機能を果たすことができる二本鎖領域を作製することができるオリゴヌクレオチドと定義する。

選択された配列、標的配列、または核酸配列を、多数の適切な方法によって増幅することができる。一般に、Ｋｗｏｈｅｔａｌ．，１９９０，Ａｍ．Ｂｉｏｔｅｃｈｎｏｌ．Ｌａｂ．８：１４を参照のこと。多数の増幅技術が記載されており、当業者の特定のニーズに合わせるように容易に適合させることができる。増幅技術の非限定的な例には、ポリメラーゼ連鎖反応（ＰＣＲ）、リガーゼ連鎖反応（ＬＣＲ）、鎖置換増幅（ＳＤＡ）、転写ベースの増幅、ｑ３レプリカーゼ系、およびＮＡＳＢＡが含まれる（Ｋｗｏｈｅｔａｌ．，１９８９，Ｐｒｏｃ．ＮａｔＩ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６，１１７３−１１７７；Ｌｉｚａｒｄｉｅｔａｌ．，１９８８，ＢｉｏＴｅｃｈｎｏｌｏｇｙ６：１１９７−１２０２；Ｍａｌｅｋｅｔａｌ．，１９９４，ＭｅｔｈｏｄｓＭｏｌ．Ｂｉｏｌ．，２８：２５３−２６０；およびＳａｍｂｒｏｏｋｅｔａｌ．，１９８９，ｓｕｐｒａ）。

用語「増幅対」（または「プライマー対」）は、本明細書中で、多数の増幅プロセス型の１つ（好ましくはポリメラーゼ連鎖反応）による選択された核酸配列の増幅で共に使用されるように選択される本発明のオリゴヌクレオチド（オリゴ）対をいう。他の増幅プロセス型には、以下でより詳細に説明されるように、リガーゼ連鎖反応、鎖置換増幅、または核酸配列ベースの増幅が含まれる。当該分野で一般に知られるように、選択された条件下で相補配列に結合するようにオリゴをデザインする。

１つの特定の実施形態では、患者由来の核酸サンプルの増幅を、最も豊富な差分発現する核酸の増幅を好む条件下で増幅する。１つの好ましい実施形態では、最も豊富なｍＲＮＡの増幅を好む条件下で患者由来のｍＲＮＡサンプルに対してＲＴ−ＰＣＲを行う。別の好ましい実施形態では、差分発現する核酸の増幅を同時に行う。このような方法を、差分発現する核酸配列の代わりに差分発現するタンパク質の検出に適合することができることが当業者に理解される。

本発明を実施するための核酸（すなわち、ＤＮＡまたはＲＮＡ）を、周知の方法によって得ることができる。

本発明のオリゴヌクレオチドプライマーは、使用される特定のアッセイ形式、特定のニーズ、およびターゲティングされるゲノムに依存して任意の適切な長さであり得る。任意選択的に、オリゴヌクレオチドプライマーは、少なくとも１２ヌクレオチド長、好ましくは１５分子と２４分子との間であり、これらを、選択した核酸増幅システムに特に適切になるように適合することができる。当該分野で一般に知られるように、オリゴヌクレオチドプライマーを、そのターゲティングされる配列へのそのハイブリッド形成の融点を考慮することによってデザインすることができる（Ｓａｍｂｒｏｏｋｅｔａｌ．，１９８９，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ −ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，２ｎｄＥｄｉｔｉｏｎ，ＣＳＨＬａｂｏｒａｔｏｒｉｅｓ；Ａｕｓｕｂｅｌｅｔａｌ．，１９８９，ｉｎＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＪｏｈｎＷｉｌｅｙ＆ＳｏｎｓＩｎｃ．，Ｎ．Ｙ．）。

アンチセンスオリゴヌクレオチドを使用して、目的のスプライスイソ型の発現を定量することができることが認識される。このような検出を、プレｍＲＮＡレベルで行う。本質的に、目的のスプライス部位からの転写を定量する能力は、スプライス部位の近づき易さに影響をうけ得る。オリゴヌクレオチドは、スプライシング因子とスプライス部位配列を競合し得る。したがって、アンチセンスオリゴヌクレオチド活性の低さは、スプライシング活性を示す。

ポリメラーゼ連鎖反応および他の核酸増幅反応は、当該分野で周知である（これらの反応の種々の非限定的な例を、以下により詳細に記載する）。本発明の態様のオリゴヌクレオチド対を、好ましくは、適合する融点（Ｔｍ）（例えば、７℃未満、好ましくは５℃未満、より好ましくは４℃未満、最も好ましくは３℃未満、理想的には３℃と０℃の間で異なる融点）を有するように選択する。

ポリメラーゼ連鎖反応（ＰＣＲ）：ＭｕｌｌｉｓａｎｄＭｕｌｌｉｓｅｔａｌ．に付与された米国特許第４，６８３，１９５号および同第４，６８３，２０２号に記載のように、ポリメラーゼ連鎖反応（ＰＣＲ）は、クローニングおよび精製を行うことなくゲノムＤＮＡの混合物中の標的配列のセグメントの濃度を増加させる方法である。このテクノロジーにより、低標的配列濃度の問題に対する１つのアプローチが得られる。ＰＣＲを使用して、標的濃度を容易に検出可能なレベルに直接増加させることができる。この標的配列の増幅プロセスは、二本鎖標的配列の各鎖と所望の標的配列を含むＤＮＡ混合物とが相補的である１モル過剰の２つのオリゴヌクレオチドプライマーの移入を含む。混合物を変性させ、その後ハイブリッド形成させる。ハイブリッド形成後、プライマーをポリメラーゼで伸長して、相補鎖を形成する。変性工程、ハイブリッド形成（アニーリング）工程、およびポリメラーゼ伸長（延長）工程を必要に応じて繰り返し、比較的高濃度の所望の標的配列のセグメントを得ることができる。

所望の標的配列のセグメントの長さは、相互に関連するプライマーの相対的位置によって決定されるので、この長さは調節可能なパラメーターである。所望の標的配列のセグメントが混合物中で支配的な配列（濃度に関して）になるので、これらを、「ＰＣＲ増幅された」と考えられる。

リガーゼ連鎖反応（ＬＣＲまたはＬＡＲ）：リガーゼ連鎖反応（ＬＣＲ；時折、「リガーゼ増幅反応」（ＬＡＲ）という）は、十分に認識されている別の核酸増幅方法に発展している。ＬＣＲでは、４つのオリゴヌクレオチド、標的ＤＮＡの１つの鎖と固有にハイブリッド形成する２つの隣接オリゴヌクレオチド、および反対の鎖とハイブリッド形成する隣接オリゴヌクレオチドの相補組を混合し、混合物にＤＮＡリガーゼを添加する。連結点で完全に相補的である場合、リガーゼはハイブリッド形成した各分子対と共有結合する。重要には、ＬＣＲでは、ギャップやミスマッチが無く標的サンプル中の配列と塩基対を形成する場合のみ、２つのプローブが互いにライゲーションする。変性サイクルの繰り返しおよびライゲーションにより、ＤＮＡの短いセグメントが増幅する。ＬＣＲはまたは、１塩基の変化の検出を強化するためにＰＣＲと組み合わせて使用されている（例えば、Ｓｅｇｅｖ，ＰＣＴ公開番号Ｗ０９００１０６９Ａ１（１９９０）を参照のこと）。しかし、このアッセイで使用される４つのオリゴヌクレオチドが対合して２つの短いライゲーション可能なフラグメントを形成することができるので、標的と独立したバックグラウンドシグナルが生成される可能性がある。変異体スクリーニングのためのＬＣＲの使用は、特定の核酸の位置の試験に制限される。

自己保持合成反応（Ｓｅｌｆ−Ｓｕｓｔａｉｎｅｄ−Ｓｙｎｔｈｅｔｉｃ−Ｒｅａｃｔｉｏｎ）（３ＳＲ／ＮＡＳＢＡ）：自己保持配列複製反応（３ＳＲ）は、一定温度でＲＮＡ配列を指数関数的に増幅させることができる転写ベースのｉｎｖｉｔｒｏ増幅システムである。次いで、増幅したＲＮＡを、変異検出のために使用することができる。この方法では、オリゴヌクレオチドプライマーを使用して、目的の配列の５’末端にファージＲＮＡポリメラーゼプロモーターを付加する。第２のプライマー、逆転写酵素、ＲＮアーゼＨ、ＲＮＡポリメラーゼ、およびリボ−およびデオキシリボヌクレオチド三リン酸を含む酵素と基質のカクテルでは、標的配列は転写、ｃＤＮＡ合成、および第２の鎖合成のラウンドが反復されて目的の領域が増幅される。変異を検出するための３ＳＲの使用は、速度的にＤＮＡの小セグメント（例えば、２００〜３００塩基対）のスクリーニングに制限される。

Ｑ−ベータ（Ｑβ）レプリカーゼ：この方法では、目的の配列を認識するプローブを、Ｑβレプリカーゼのための複製可能なＲＮＡテンプレートに結合させる。配列特異的ライゲーション工程の使用によって、非ハイブリッド形成プローブの複製に起因する偽陽性についての事前に同定された主な問題に取り組んだ。しかし、利用可能な熱安定性ＤＮＡリガーゼはこのＲＮＡ基質に有効でないので、ライゲーションを、Ｔ４ＤＮＡリガーゼによって低温（３７℃）で行わなければならない。これにより、ＬＣＲにおけるような特異性の達成手段としての高温の使用が回避され、ライゲーション事象を使用して、連結部位での変異を検出することができるが、他の場所は検出できない。

首尾の良い診断方法は、非常に特異的でなければならない。容易な核酸ハイブリッド形成の特異性の調節方法は、反応温度の調節による。３ＳＲ／ＮＡＳＢＡおよびＱβは全て大量のシグナルを生成することができる一方で、それぞれに関与する１つまたは複数の酵素を高温で（すなわち、５５℃超）使用することができない。したがって、プローブの非特異的ハイブリッド形成を回避するために反応温度を上げることができない。低温でより容易にプローブを融解するためにプローブを短くする場合、複雑なゲノム中で１つを超える完全な適合が得られる可能性が増加する。これらの理由のために、ＰＣＲおよびＬＣＲは、現在、検出テクノロジーの研究分野の中心となっている。

ＰＣＲおよびＬＣＲにおける増幅手順の基本は、１サイクルの産物がその後の全サイクルで使用可能なテンプレートとなり、それにより、各サイクル毎に集団が倍増するという事実である。任意のこのような倍増システムの最終収率を、以下のように表現することができる：（１＋Ｘ）^ｎ＝ｙ（式中、「Ｘ」は平均効率（各サイクルでのコピー率）であり、「ｎ」はサイクル数であり、「ｙ」は全効率または反応収率である）。各標的ＤＮＡコピーを各ポリメラーゼ連鎖反応サイクルにおけるテンプレートとして使用する場合、平均効率は１００％である。ＰＣＲを２０サイクル行う場合、収率は２^２０（すなわち、出発物質の１，０４８，５７６倍のコピー）である。反応条件によって平均効率が８５％に減少する場合、２０サイクルの収率は１．８５^２０（すなわち、出発物質の２２０，５１３倍のコピー）にしかならない。言い換えれば、８５％の効率でのＰＣＲの実施では、１００％の効率での反応実施と比較して最終生成物は２１％しか得られない。平均効率が５０％に減少した反応では、可能な生成物は１％未満である。

実際には、日常的なポリメラーゼ連鎖反応で理論上の最大収率を達成するのは稀であり、ＰＣＲは、通常、より低い収率を補うために２０サイクルを超えて実施する。平均効率５０％では、理論上での２０サイクルで１００万倍の増幅を達成するために、３４サイクルを要し、より低い効率では、必要なサイクル数は非常に多くなる。さらに、意図する標的よりも高い平均効率で増幅する任意のバックグラウンド産物が主要な産物になる。

また、多数の可変因子（ｖａｒｉａｂｌｅ）（標的ＤＮＡの長さおよび二次構造、プライマーの長さおよびデザイン、プライマーおよびｄＮＴＰの濃度、ならびに緩衝液の組成などが含まれる）がＰＣＲの平均効率に影響を与え得る。外因性ＤＮＡ（例えば、実験室の表面に溢れたＤＮＡ）との反応の汚染または相互汚染も主な検討材料である。それぞれの異なるプライマー対および標的配列のための反応条件を慎重に至適化しなければならず、経験豊富な研究者でさえもこのプロセスに数日を要し得る。このプロセスの困難さ（多数の技術的配慮および他の要因が含まれる）が、臨床目的でのＰＣＲの使用における重大な欠点である。実際、ＰＣＲは、依然として有意な様式で臨床市場に進出していない。ＬＣＲも各標的配列について異なるオリゴヌクレオチド配列を使用するために至適化しなければならないので、ＬＣＲでも同様の懸念が生じる。さらに、両方法には、正確な温度サイクリングを可能にするために高価な装置が必要である。

対立遺伝子の変化の研究などにおける核酸検出テクノロジーの多くの適用は、複雑なバックグラウンド中の特定の配列の検出だけでなく、少数または１つのヌクレオチドが異なる配列の区別も含む。ＰＣＲによる対立遺伝子特異的変異型の１つの検出方法は、テンプレート鎖とプライマーの３’末端との間にミスマッチが存在する場合にＴａｑポリメラーゼがＤＮＡ鎖を合成することが困難であるという事実に基づく。対立遺伝子特異的変異型を、たった１つの可能性のある対立遺伝子と完全に適合するプライマーの使用によって検出することができ、他の対立遺伝子とのミスマッチはプライマーの伸長を回避するように作用し、それにより、この配列の増幅が回避される。この方法は、ミスマッチの塩基組成がミスマッチを超える伸長を回避する能力に影響を与え、一定のミスマッチが伸長を回避しないか最小の影響しか与えないという点で、実質的に制限される。

ＬＣＲでのライゲーションを回避する効果がより高い類似の３’ミスマッチストラテジーを使用する。任意のミスマッチは、熱安定性リガーゼの作用を有効に遮断するが、ＬＣＲは依然として標的独立性バックグラウンドライゲーション産物が増幅を開始するという欠点を有する。さらに、各位置でヌクレオチドを同定するためのＰＣＲとその後のＬＣＲとの組み合わせも、臨床検査室での取扱いが困難であることが明らかである。

本発明の種々の好ましい実施形態の直接検出方法は、例えば、サイクリングプローブ反応（ＣＰＲ）または分岐（ｂｒａｎｃｈｅｄ）ＤＮＡ分析であり得る。

利用可能な核酸の検出量が十分である場合、より多数の標的のコピーを作製する代わりに（例えば、ＰＣＲおよびＬＣＲなどの場合）、この配列が直接検出されるという利点がある。より顕著には、シグナルを指数関数的に増幅しない方法は、定量分析により適切である。１つのオリゴヌクレオチドへの複数の色素の結合によってシグナルが増強された場合でさえも、最終シグナル強度と標的量とは直接相関する。このようなシステムは、反応産物自体がさらなる反応を促進せず、それにより、産物による実験室表面の汚染が懸念されるほど多くはないというさらなる利点を有する。最近考案された技術は、放射能使用を排除しようと努め、そして／または自動化できる形式での感度が改良されている。２つの例は、「サイクリングプローブ反応」（ＣＰＲ）および「分岐ＤＮＡ」（ｂＤＮＡ）である。

サイクリングプローブ反応（ＣＰＲ）：サイクリングプローブ反応（ＣＰＲ）は、中央部分がＲＮＡから作製されており、２つの末端がＤＮＡで作製されている長いキメラオリゴヌクレオチドを使用する。標的ＤＮＡへのプローブのハイブリッド形成および熱安定性ＲＮアーゼＨへの曝露により、ＲＮＡ部分が消化される。これによって二重鎖の残存ＤＮＡ部分が不安定になり、標的ＤＮＡからプローブの残りが放出し、別のプローブ分子がプロセスを繰り返す。切断プローブ分子形態のシグナルは、直線的速度で蓄積する。反復プロセスはシグナルを増加させる一方で、オリゴヌクレオチドのＲＮＡ部分は、サンプル調製を通して保持され得るＲＮアーゼに対して脆弱である。

分岐ＤＮＡ：分岐ＤＮＡ（ｂＤＮＡ）は、各オリゴヌクレオチドが３５〜４０のラベル（例えば、アルカリホスファターゼ酵素）を保有できる分岐構造のオリゴヌクレオチドを含む。これによりハイブリッド形成由来のシグナルが増強される一方で、非特異的結合のシグナルも同様に増加する。

本発明の種々の好ましい実施形態の少なくとも１つの配列の変化を、例えば、制限フラグメント長多型（ＲＦＬＰ分析）、対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）分析、変性／温度勾配ゲル電気泳動（ＤＧＧＥ／ＴＧＧＥ）、一本鎖高次構造多型（ＳＳＣＰ）分析、またはジデオキシフィンガープリンティング（ｄｄＦ）によって検出することができる。

特定の核酸配列および配列の変化を検出可能な試験の需要は、臨床診断で急速に増大しつつある。ヒトおよび病原性生物由来の遺伝子についての核酸配列データが蓄積されているので、今までのところ、特定の配列内の変異のための迅速且つ費用効果が高く、使いやすい試験への需要が急速に増大している。

核酸セグメントを変異についてスキャンする方法は一握りしか考案されていない。各試験サンプル（例えば、細菌単離物）の全遺伝子配列を決定することが１つの選択肢である。約６００ヌクレオチド未満の配列では、増幅材料（例えば、ＰＣＲ反応産物）を使用してこれを行うことができる。これにより、目的のセグメントのクローニングに伴う時間および費用が回避される。しかし、専用の装置および高度に訓練された者が必要であり、この方法は非常に骨が折れ、且つ費用が高いので、臨床目的で実践的且つ有効ではない。

配列決定に関連する困難さを考慮して、核酸の所与のセグメントを、いくつかの他のレベルで特徴づけることができる。最も低い分解能では、電気泳動によって、サンプルゲル上での公知の標準の泳動との比較によって分子サイズを決定することができる。電気泳動前の制限酵素の組み合わせでの切断によって、より詳細な分子の実態（ｐｉｃｔｕｒｅ）を得て、順序付けられたマップを構築することができる。フラグメント内の特定の配列の存在を、標識プローブのハイブリッド形成によって検出することができるか、正確なヌクレオチド配列を、部分的化学的分解または鎖終結（ｃｈａｉｎ−ｔｅｒｍｉｎａｔｉｎｇ）ヌクレオチドアナログの存在下でのプライマー伸長によって決定することができる。

制限フラグメント長多型（ＲＦＬＰ）：類似配列間の１塩基の相違の検出には、しばしば、最も高い分解能での分析が必要である。問題のヌクレオチドの位置が予め知られている場合については、直接配列決定することなく１塩基の変化を試験する方法がいくつか開発されている。例えば、目的の変異が制限認識配列の範囲内で起こる場合、診断ツールとして消化パターンの変化を使用することができる（例えば、制限フラグメント長多型（ＲＦＬＰ）分析）。

１つの点変異はまた、ＲＦＬＰの作製または破壊によって検出されている。ミスマッチでの切断によって生成されたＲＮＡフラグメントの存在およびサイズによって、変異を検出し、局在化する。一般に、「ミスマッチ化学的切断」（ＭＣＣ）と命名されている１塩基置換を検出するための別のストラテジーを使用する場合、ＤＮＡヘテロ二重鎖中の１つのヌクレオチドミスマッチを、いくつかの化学物質によっても認識および切断する。しかし、この方法には、四酸化オスミウムおよびピペリジンが必要であり、これら２つは非常に有毒な化合物であり、臨床検査室での使用は適切ではない。

ＲＦＬＰ分析は感度が低く、大量のサンプルが必要である。ＲＦＬＰ分析を、点変異の検出に使用する場合、その性質により、公知の制限エンドヌクレアーゼの制限配列内に含まれる１塩基変化のみの検出に制限される。さらに、大部分の利用可能な酵素は４〜６塩基対の配列を認識し、多数の大量ＤＮＡ操作には頻繁に切断され過ぎる。したがって、小断片の場合のみに適用可能であるが、ほとんどの変異はこのような部位の範囲内にない。

８塩基対を特異的に認識する一握りのレアカット（ｒａｒｅ−ｃｕｔｔｉｎｇ）制限酵素が単離されており、これらは遺伝子マッピングに広く使用されているが、これらの酵素は数が少なく、Ｇ＋Ｃリッチ配列の認識に制限され、高度にクラスター化される傾向のある部位を切断する。最近、１２個を超える塩基対に特異性を示すグループＩイントロンによってコードされるエンドヌクレアーゼが発見されたが、これらは少数である。

対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）：認識配列が変化しない場合、プライマー伸長またはライゲーション事象が適合またはミスマッチの指標として使用する（ｂｕｓｅｄ）ことができるように、変異ヌクレオチド付近とハイブリッド形成するための対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）をデザインすることができる。放射性標識対立遺伝子特異的オリゴヌクレオチド（ＡＳＯ）を使用したハイブリッド形成も特定の点変異の検出に適用されている。この方法は、１つのヌクレオチドが異なる短いＤＮＡフラグメントの融点の相違に基づく。ストリンジェントなハイブリッド形成および洗浄条件二より、変異と野生型対立遺伝子とを区別することができる。ＰＣＲ産物に適用したＡＳＯアプローチも、多くの研究者によって、ｒａｓ遺伝子およびｇｓｐ／ｇｉｐ癌遺伝子の点変異を検出および特徴づけるために広く使用されている。複数の位置に種々のヌクレオチドの変化が存在するので、ＡＳＯ法は、全ての可能な癌遺伝子変異を対象とするために多数のオリゴヌクレオチドを使用する必要がある。

上記の技術のいずれか（すなわち、ＲＦＬＰおよびＡＳＯ）の使用には、試験前に変異が疑われる正確な位置を知らなければならない。言い換えると、これらの技術は、目的の遺伝子または配列内の変異の存在を検出する必要がある場合、適用不可能である。

変性／温度勾配ゲル電気泳動（ＤＧＧＥ／ＴＧＧＥ）：２つの他の方法は、小さな配列の変化に応じた電気泳動移動度の変化の検出に依存する。これらの方法のうち、「変性／温度勾配ゲル電気泳動」（ＤＧＧＥ）は、勾配ゲルで電気泳動によって分離した場合に僅かに異なる配列が異なる局所融解パターンを示すという所見に基づく。この様式では、その電気泳動移動度が変化に対応することによって１つのヌクレオチドにおけるホモ二重鎖とヘテロ二重鎖の融解特性の相違が変異の存在を検出することができるので、変異型を区別することができる。分析すべきフラグメント（通常、ＰＣＲ産物）を、Ｇ−Ｃ塩基対の長いストレッチ（３０〜８０）の一方の端に「クランプし」、鎖を完全に解離することなく目的の配列を完全に変性させる。ＤＮＡフラグメントへのＧＣ「クランプ」の結合により、変異フラグメントが増加し、ＤＧＧＥによって認識することができる。１つのプライマーへのＧＣクランプの結合は、確実に増幅配列の解離温度を低くするために重要である。温度勾配を使用して技術が改良されており、この方法をＲＮＡ：ＲＮＡ二重鎖に適用することもできる。

変性条件を試験すべき各ＤＮＡ型に至適化しなければならないことにより、ＤＧＧＥの利用が制限される。さらに、この方法には、ゲルを調製し、電気泳動時に必要な高温を維持するための専用の装置が必要である。試験すべき各配列の１つのオリゴヌクレオチドにクランプされたテールの合成に関連する費用も主な検討材料である。さらに、ＤＧＧＥには、長い泳動時間が必要である。ＤＧＧＥの長い泳動時間を、一定変性剤ゲル電気泳動（ｃｏｎｓｔａｎｔｄｅｎａｔｕｒａｎｔｇｅｌｅｌｅｃｔｒｏｐｈｏｒｅｓｉｓ（ＣＤＧＥ）と呼ばれるＤＧＧＥの改良型によって短くした。ＣＤＧＥには、変異検出の有効性を高めるために異なる変性条件下でゲルを泳動するが必要である。

温度勾配ゲル電気泳動（ＴＧＧＥ）と呼ばれるＤＧＧＥに類似の技術は、化学変性勾配よりもむしろ温度勾配を使用する。ＴＧＧＥには、電場に対して垂直に配向した温度勾配を生じることができる専用装置を使用することが必要である。ＴＧＧＥは、比較的小さなＤＮＡフラグメントの変異を検出することができ、それにより、大きな遺伝子セグメントのスキャニングにはゲルの泳動前に複数のＰＣＲ産物を使用する必要がある。

一本鎖高次構造多型（ＳＳＣＰ）：「一本鎖高次構造多型」（ＳＳＣＰ）と呼ばれる別の一般的な方法は、Ｈａｙａｓｈｉ，Ｓｅｋｙａａｎｄｃｏｌｌｅａｇｕｅｓによって開発され、この方法は、単一の核酸鎖が未変性条件下で特徴的な高次構造を取ることができ、これらの高次構造が電気泳動移動度に影響を与えるという所見に基づく。相補鎖は、十分に異なる構造を有すると予想され、一方の鎖を他方の鎖から分離することができる。フラグメント内の配列の変化も高次構造を変化させ、それにより、移動度が変化し、これを配列の変動についてのアッセイとして使用可能である。

ＳＳＣＰプロセスは、両鎖を標識したＤＮＡセグメント（例えば、ＰＣＲ産物）の変性、および分子内相互作用が起こり得るが、泳動を妨げないようなその後の未変性ポリアクリルアミドゲルでのゆっくりとした電気泳動による分離を含む。この技術は、ゲルの組成および温度の変動に対する感度が非常に高い。外見上類似の条件下での異なる研究所で得られたデータの比較が比較的困難であるであることにより、この方法は非常に制限される。

ジデオキシフィンガープリンティング（ｄｄＦ）：ジデオキシフィンガープリンティング（ｄｄＦ）は、変異の存在について遺伝子をスキャニングするために開発された別の技術である。ｄｄＦ技術は、サンガージデオキシ配列決定とＳＳＣＰとの構成要素を組み合わせている。１つのジデオキシターミネーターを使用してジデオキシ配列決定反応を行い、その後、反応産物を、未変性ポリアクリルアミドゲルで電気泳動して、ＳＳＣＰ分析と同様に終結セグメントの移動度の変化を検出する。ｄｄＦは感度の増大に関してはＳＳＣＰよりも改良されているが、ｄｄＦには、高価なジデオキシヌクレオチドの使用が必要であり、この技術は、ＳＳＣＰに適切なサイズ（すなわち、変異の最適な検出のための２００〜３００塩基のフラグメント）のフラグメントの分析にさらに制限される。

上記制限に加えて、これら全ての方法は、分析することができる核酸フラグメントのサイズに制限される。直接配列決定アプローチには、６００塩基対を超える配列がクローニングに必要であり、その結果、全フラグメントを対象とするための検出サブクローニングまたはプライマーウォーキングのいずれかのために時間および費用を要する。ＳＳＣＰおよびＤＧＧＥは、さらにより厳密にサイズの制限を受ける。配列の変化によって感度が減少するので、これらの方法は、より大きなフラグメントに適切でないと見なされる。ＳＳＣＰは、伝えられるところによれば、２００塩基対フラグメントの９０％の１塩基置換を検出することができるにもかかわらず、４００塩基対フラグメントでは検出は５０％未満に低下する。同様に、フラグメントの長さが５００塩基対に達する場合、ＤＧＧＥの感度は低下する。直接配列決定とＳＳＣＰとを組み合わせたｄｄＦ技術も、スクリーニングできるＤＮＡが比較的小さいサイズに制限される。

本発明の現在好ましい実施形態に因れば、腫瘍細胞または癌患者由来の細胞における本明細書中に記載の核酸配列のいずれかを検索する工程を、以下の適切な技術によって行う：核酸配列決定、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、自律的合成反応、Ｑβ−レプリカーゼ、サイクリングプローブ反応、分岐ＤＮＡ、制限フラグメント長多型分析、ミスマッチの化学的切断、ヘテロ二重鎖分析、対立遺伝子特異的オリゴヌクレオチド、変性勾配ゲル電気泳動、一定変性剤ゲル電気泳動、温度勾配ゲル電気泳動、およびジデオキシフィンガープリンティングが含まれるが、これらに限定されない。

チップまたは他のこのようなデバイスを使用して任意選択的に検出することもできる。分析すべき候補領域を含む核酸サンプルを、単離し、増幅し、レポーター基で標識することが好ましい。このレポーター基は、フィコエリトリンなどの蛍光基であり得る。次いで、標識核酸を、フルイディクスステーション（ｆｌｕｉｄｉｃｓｓｔａｔｉｏｎ）を使用してチップ上に固定したプローブとインキュベートし、シリコンおよびガラス基板中のフルイディクスデバイス、特にミクロキャピラリーデバイスの構築が記載されている。

一旦反応が完了すると、チップをスキャナに挿入し、ハイブリッド形成パターンを検出する。既に核酸に組み込まれており、この時点でチップに付着したプローブに結合しているレポーター基から放出されたシグナルとしてハイブリッド形成データを収集する。チップ上に固定された各プローブの配列および位置を承知しているので、所与のプローブとハイブリッド形成している核酸の同一性を決定することができる。

自動化装置といと共に使用する場合、上記検出方法を使用して、疾患および／または病的状態について複数のサンプルを迅速且つ容易にスクリーニングすることができると認識される。

アミノ酸配列決定およびペプチド
用語「ポリペプチド」、「ペプチド」、および「タンパク質」を、アミノ酸残基のポリマーをいうために本明細書中で交換可能に使用する。この用語は、１つまたは複数のアミノ酸残基が対応する天然に存在するアミノ酸のアナログまたは模倣物および天然に存在するアミノ酸ポリマーであるアミノ酸に適用する。ポリペプチドを、例えば、炭水化物残基の付加によって修飾して糖タンパク質を形成することができる。用語「ポリペプチド」、「ペプチド」、および「タンパク質」には、非糖タンパク質だけでなく、糖タンパク質が含まれる。

ポリペプチド産物を、標準的な固相技術などの使用によって生化学的に合成することができる。このような方法には、排他的固相合成、部分的固相合成方法、フラグメント縮重、古典的液体合成が含まれるが、これらに限定されない。これらの方法を、ペプチドが比較的短い場合（すなわち、１０ｋＤａ）、および／または組換え技術によって産生することができず（すなわち、核酸配列によってコードされない）、それにより異なる化学的性質を含む場合に使用することが好ましい。

固相ポリペプチド合成手順は当該分野で周知であり、ＪｏｈｎＭｏｒｒｏｗＳｔｅｗａｒｔａｎｄＪａｎｉｓＤｉｌｌａｈａＹｏｕｎｇ，ＳｏｌｉｄＰｈａｓｅＰｅｐｔｉｄｅＳｙｎｔｈｅｓｅｓ（２ｎｄＥｄ．，ＰｉｅｒｃｅＣｈｅｍｉｃａｌＣｏｍｐａｎｙ，１９８４）にさらに記載されている。

合成ポリペプチドを、任意選択的に分取高速液体クロマトグラフィ（ＣｒｅｉｇｈｔｏｎＴ．（１９８３）Ｐｒｏｔｅｉｎｓ，ｓｔｒｕｃｔｕｒｅｓａｎｄｍｏｌｅｃｕｌａｒｐｒｉｎｃｉｐｌｅｓ．ＷＨＦｒｅｅｍａｎａｎｄＣｏ．Ｎ．Ｙ．）によって精製し、その後、その組成をアミノ酸配列決定によって確認することができる。

大量のポリペプチドを所望する場合、ポリペプチドを、Ｂｉｔｔｅｒｅｔａｌ．，（１９８７）ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌ．１５３：５１６−５４４，Ｓｔｕｄｉｅｒｅｔａｌ．（１９９０）ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌ．１８５：６０−８９，Ｂｒｉｓｓｏｎｅｔａｌ．（１９８４）Ｎａｔｕｒｅ３１０：５１１−５１４，Ｔａｋａｍａｔｓｕｅｔａｌ．（１９８７）ＥＭＢＯＪ．６：３０７−３１１，Ｃｏｒｕｚｚｉｅｔａｌ．（１９８４）ＥＭＢＯＪ．３：１６７１−１６８０ａｎｄＢｒｏｇｌｉｅｔａｌ．，（１９８４）Ｓｃｉｅｎｃｅ２２４：８３８−８４３，Ｇｕｒｌｅｙｅｔａｌ．（１９８６）Ｍｏｌ．Ｃｅｌｌ．Ｂｉｏｌ．６：５５９−５６５ａｎｄＷｅｉｓｓｂａｃｈ＆Ｗｅｉｓｓｂａｃｈ，１９８８，ＭｅｔｈｏｄｓｆｏｒＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮＹ，ＳｅｃｔｉｏｎＶＩＩＩ，ｐｐ４２１−４６３等に記載の組換え技術を使用して生成することができる。

本発明はまた、本発明のポリヌクレオチド配列によってコードされるポリペプチドおよび本明細書中に記載のアミノ酸配列によるポリペプチドを含む。本発明はまた、これらのポリペプチドのホモログを含み、このようなホモログは、下記アミノ酸配列と少なくとも５０％、少なくとも５５％、少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも９５％、またはさらに１００％相同あり得るが、これらは、任意選択的および好ましくは以下を含むデフォルトパラメーターを使用したＮａｔｉｏｎａｌＣｅｎｔｅｒｏｆＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）のＢｌａｓｔＰソフトウェアを使用して決定することができる：フィルタリングはオン（このオプションは、Ｓｅｇ（タンパク質）プログラムを使用してクエリーから反復配列または複雑さの低い配列をフィルタリングする）、タンパク質についてのスコアリング行列はＢＬＯＳＵＭ６２であり、ワードサイズは３であり、Ｅ値は１０であり、ギャップコストは１１，１（初期化および伸長）であり、表示するアラインメント数は５０である。任意選択的に、核酸配列の同一性／相同性を、ＮａｔｉｏｎａｌＣｅｎｔｅｒｏｆＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎ（ＮＣＢＩ）のＢｌａｓｔＮソフトウェアの使用によって決定することができ、このソフトウェアは、好ましくはＤＵＳＴフィルタープログラムを使用し、好ましくは、Ｅ値が１０、複雑さの低い配列をフィルタリングし、ワードサイズが１１である。最終的に、本発明はまた、上記ポリペプチドのフラグメントおよび変異（無作為またはターゲティングされた様式での天然に存在するか人為的に誘導された１つまたは複数のアミノ酸の欠失、挿入、または置換など）を有するポリペプチドを含む。

本発明によって同定されるペプチドが、分解産物、合成ペプチドもしくは組換えペプチドおよびペプチド模倣物、典型的には、例えば、ペプチドをより安定にする一方で、ペプチドの体内または細胞への透過をより可能にする修飾を有し得る合成ペプチドならびにペプチドアナログであるペプトイドおよびセミペプトイドであり得ると認識される。このような修飾には、Ｎ末端修飾、Ｃま単修飾、ペプチド結合修飾（ＣＨ２−ＮＨ、ＣＨ２−Ｓ、ＣＨ２−Ｓ=Ｏ、Ｏ=Ｃ−ＮＨ、ＣＨ２−Ｏ、ＣＨ２−ＣＨ２、Ｓ=Ｃ−ＮＨ、ＣＨ=ＣＨ、またはＣＦ=ＣＨが含まれるが、これらに限定されない）、骨格修飾、および残基修飾が含まれるが、これらに限定されない。ペプチド模倣化合物の調製方法は当該分野で周知であり、明記されている。これに関するさらなる詳細を、以下に記載する。

ペプチド内のペプチド結合（−ＣＯ−ＮＨ−）を、例えば、Ｎ−メチル化結合（−Ｎ（ＣＨ３）−ＣＯ−）、エステル結合（−Ｃ（Ｒ）Ｈ−Ｃ−Ｏ−Ｏ−Ｃ（Ｒ）−Ｎ−）、ケトメチレン結合（−ＣＯ−ＣＨ２−）、α−アザ結合（−ＮＨ−Ｎ（Ｒ）−ＣＯ−）（式中、Ｒは任意のアルキル（例えば、メチル）である）、カルバ（ｃａｒｂａ）結合（−ＣＨ２−ＮＨ−）、ヒドロキシエチレン結合（−ＣＨ（ＯＨ）−ＣＨ２−）、チオアミド結合（−ＣＳ−ＮＨ−）、オレフィン二重結合（−ＣＨ=ＣＨ−）、レトロアミド結合（−ＮＨ−ＣＯ−）、ペプチド誘導体（−Ｎ（Ｒ）−ＣＨ２−ＣＯ−）（式中、Ｒは、炭素原子状に天然に存在する「通常の」側鎖である）に置換することができる。

これらの修飾は、ペプチド鎖に沿った結合のいずれか、さらにはいくつか（２〜３）が同時に生じ得る。

天然の芳香族アミノ酸（Ｔｒｐ、Ｔｙｒ、およびＰｈｅ）を、フェニルグリシン、ＴＩＣ、ナフチレルアニン（ｎａｐｈｔｈｙｌｅｌａｎｉｎｅ）、Ｐｈｅの環メチル化誘導体、Ｐｈｅのハロゲン化誘導体、またはｏ−メチル−Ｔｙｒなどの非天然酸に置換することができる。

上記に加えて、本発明のペプチドには、１つまたは複数の修飾アミノ酸または１つまたは複数の非アミノ酸単量体（例えば、脂肪酸、複合糖質など）も含まれ得る。

明細書および以下の特許請求の範囲で使用される、用語「アミノ酸」は、２０種の天然に存在するアミノ酸（これらのアミノ酸は、しばしば、ｉｎｖｉｖｏで翻訳後に修飾されている（例えば、ヒドロキシプロリン、ホスホセリン、およびホスホトレオニンが含まれる））および通常でない（ｕｎｕｓｕａｌ）アミノ酸（２−アミノアジピン酸、ヒドロキシリジン、イソデスモシン、ノルバリン、ノルロイシン、およびオルニチンが含まれるが、これらに限定されない）が含まれると理解される。さらに、用語「アミノ酸」には、Ｄ型およびＬ型のアミノ酸が含まれる。

本発明のペプチドを可溶化形態のペプチドが必要とされる診断で使用することが好ましいので、本発明のペプチドには、好ましくは、１つまたは複数の非天然または天然の極性アミノ酸（その水酸基含有側鎖によってペプチドの可溶性を増加させることができるセリンおよびトレオニンが含まれるが、これらに限定されない）が含まれる。

本発明のペプチドを線状形態で使用することが好ましいが、環状化がペプチド特性を重大に妨害しない場合、ペプチドの環状化形態も使用することができると認識される。

本発明のペプチドを、標準的な固相技術などの使用によって生化学的に合成することができる。これらの方法には、当該分野で周知の排他的固相合成、部分的固相合成方法、フラグメント縮重、古典的液体合成が含まれる。これらの方法を、ペプチドが比較的短い場合（すなわち、１０ｋＤａ）、および／または組換え技術によって産生することができず（すなわち、核酸配列によってコードされない）、それにより異なる化学的性質を含む場合に使用することが好ましい。

合成ペプチドを、分取高速液体クロマトグラフィによって精製し、その組成をアミノ酸配列決定によって確認することができる。

大量の本発明のペプチドを所望する場合、本発明のペプチドを、Ｂｉｔｔｅｒｅｔａｌ．，（１９８７）ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌ．１５３：５１６−５４４，Ｓｔｕｄｉｅｒｅｔａｌ．（１９９０）ＭｅｔｈｏｄｓｉｎＥｎｚｙｍｏｌ．１８５：６０−８９，Ｂｒｉｓｓｏｎｅｔａｌ．（１９８４）Ｎａｔｕｒｅ３１０：５１１−５１４，Ｔａｋａｍａｔｓｕｅｔａｌ．（１９８７）ＥＭＢＯＪ．６：３０７−３１１，Ｃｏｒｕｚｚｉｅｔａｌ．（１９８４）ＥＭＢＯＪ．３：１６７１−１６８０ａｎｄＢｒｏｇｌｉｅｔａｌ．，（１９８４）Ｓｃｉｅｎｃｅ２２４：８３８−８４３，Ｇｕｒｌｅｙｅｔａｌ．（１９８６）Ｍｏｌ．Ｃｅｌｌ．Ｂｉｏｌ．６：５５９−５６５ａｎｄＷｅｉｓｓｂａｃｈ＆Ｗｅｉｓｓｂａｃｈ，１９８８，ＭｅｔｈｏｄｓｆｏｒＰｌａｎｔＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＮＹ，ＳｅｃｔｉｏｎＶＩＩＩ，ｐｐ４２１−４６３などおよび上記にも記載の組換え技術を使用して生成することができる。

抗体
「抗体」は、好ましくは、免疫グロブリン遺伝子によって実質的にコードされるポリペプチドまたはエピトープ（例えば、抗原）に特異的に結合して認識するそのフラグメントをいう。認識される免疫グロブリン遺伝子には、κおよびλ軽鎖定常領域遺伝子、α、γ、δ、ε、およびμ重鎖定常領域遺伝子、ならびに無数の免疫グロブリン可変領域遺伝子が含まれる。抗体は、例えば、インタクトな免疫グロブリンまたは種々のペプチダーゼでの消化によって産生される多数の十分に特徴づけられたフラグメントとして存在する。これには、例えば、Ｆａｂ’およびＦ（ａｂ）’_２フラグメントが含まれる。本明細書中で使用される、用語「抗体」には、全抗体の修飾によって産生されるか、組換えＤＮＡ法を使用してｄｅｎｏｖｏで合成される抗体フラグメントも含まれる。抗体には、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、ヒト化抗体、または単鎖抗体も含まれる。抗体の「Ｆｃ」部分は、１つまたは複数の重鎖定常領域（ＣＨ１、ＣＨ２、およびＣＨ３）を含むが、重鎖可変領域は含まれない免疫グロブリン重鎖の一部をいう。

マクロファージに結合することができる抗体の機能的フラグメント（Ｆａｂ、Ｆ（ａｂ’）２、およびＦｖなど）を以下に記載する：（１）Ｆａｂ：抗体分子の１価の抗原結合フラグメントを含み、インタクトな軽鎖および１つの重鎖の一部を得るための酵素パパインでの全抗体の消化によって産生することができるフラグメント、（２）Ｆａｂ’：インタクトな軽鎖および重鎖の一部を得るための全抗体のペプシンでの処理およびその後の還元によって得ることができる抗体分子のフラグメントであって、１つの抗体分子あたり２つのＦａｂ’フラグメントが得られる、（３）（Ｆａｂ’）２：酵素ペプシンで全抗体を処理し、その後還元しないで得ることができる抗体のフラグメントであって、（Ｆａｂ’）２は２つのジスルフィド結合によって互いに保持された２つのＦａｂ’フラグメントの二量体である、（４）Ｆｖ：２つの鎖として発現される軽鎖の可変領域および重鎖の可変領域を含む遺伝し操作されたフラグメントとして定義される、（５）単鎖抗体（「ＳＣＡ」）：遺伝子が融合された単鎖分子として適切なポリペプチドリンカーによって連結された軽鎖の可変領域および重鎖の可変領域を含む遺伝子操作された分子。

ポリクローナル抗体およびモノクローナル抗体ならびにそのフラグメントの産生方法は当該分野で周知である（例えば、ＨａｒｌｏｗａｎｄＬａｎｅ，Ａｎｔｉｂｏｄｉｅｓ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ，ＮｅｗＹｏｒｋ，１９８８（本明細書中で参考として援用される）を参照のこと）。

本発明の抗体フラグメントを、抗体のタンパク質分解性加水分解または大腸菌もしくは哺乳動物細胞（例えば、チャイニーズハムスター卵巣細胞培養または他のタンパク質発現系）中でのフラグメントをコードするＤＮＡの発現によって調製することができる。抗体フラグメントを、従来の方法による全抗体のペプシンまたはパパイン消化によって得ることができる。例えば、抗体フラグメントを、ペプシンで抗体を酵素切断し、それにより、Ｆ（ａｂ’）２と示される５Ｓフラグメントを得ることによって産生することができる。このフラグメントを、チオール還元剤を使用してさらに切断し、任意選択的にジスルフィド結合の切断に起因するスルフヒドリル基を保護して、１価の３．５ＳＦａｂ’フラグメントを生成することができる。あるいは、ペプシンを使用した酵素切断により、２つの１価のＦａｂ’フラグメントおよびＦｃフラグメントが直接生成される。これらの方法は、例えば、Ｇｏｌｄｅｎｂｅｒｇに付与された米国特許第４，０３６，９４５号および同第４，３３１，６４７号ならびにこれらに含まれる引例（これらの特許は、その全体が本明細書中で参考として援用される）に記載されている。Ｐｏｒｔｅｒ，Ｒ．Ｒ．［Ｂｉｏｃｈｅｍ．Ｊ．７３：１１９−１２６（１９５９）］も参照のこと。フラグメントがインタクトな抗体によって認識される抗原に結合する限り、１価の軽鎖−重鎖フラグメントを形成するための重鎖の分離、フラグメントのさなる切断、またはさらなる酵素的、化学的、または遺伝子技術などの他の抗体の切断方法も使用することができる。

Ｆｖフラグメントは、ＶＨ鎖およびＶＬ鎖の会合を含む。Ｉｎｂａｒｅｔａｌ．［Ｐｒｏｃ．Ｎａｔ’ｌＡｃａｄ．Ｓｃｉ．ＵＳＡ６９：２６５９−６２（１９７２０］に記載のように、この会合は、非極性であり得る。あるいは、可変鎖を、分子間ジスルフィド結合またはグルタルアルデヒドなどの化学物質による架橋によって結合することができる。好ましくは、Ｆｖフラグメントは、ペプチドリンカーによって連結したＶＨ鎖およびＶＬ鎖を含む。これらの単鎖抗原結合タンパク質（ｓＦｖ）を、オリゴヌクレオチドによって連結されたＶＨおよびＶＬドメインをコードするＤＮＡ配列を含む構造遺伝子の構築によって調製する。構造遺伝子を、発現ベクターに挿入し、その後、大腸菌などの宿主細胞に移入する。組換え宿主細胞は、２つのＶドメインを架橋するリンカーペプチドを有する１つのポリペプチド鎖を合成する。ｓＦｖの生成方法は、例えば、ＷｈｉｔｌｏｗａｎｄＦｉｌｐｕｌａ，Ｍｅｔｈｏｄｓ２：９７−１０５（１９９１）；Ｂｉｒｄｅｔａｌ．，Ｓｃｉｅｎｃｅ２４２：４２３−４２６（１９８８）；Ｐａｃｋｅｔａｌ．，Ｂｉｏ／Ｔｅｃｈｎｏｌｏｇｙ１１：１２７１−７７（１９９３）；および米国特許第４，９４６，７７８号（その全体が本明細書中で参考として援用される）に記載されている。

抗体フラグメントの別の形態は、１つの相補性決定領域（ＣＤＲ）をコードするペプチドである。ＣＤＲペプチド（「最小認識単位」）を、目的の抗体のＣＤＲをコードする遺伝子の構築によって得ることができる。このような遺伝子を、例えば、ポリメラーゼ連鎖反応を使用して抗体産生細胞のＲＮＡから可変領域を合成することによって調製する（例えば、ＬａｒｒｉｃｋａｎｄＦｒｙ［Ｍｅｔｈｏｄｓ，２：１０６−１０（１９９１）］を参照のこと）。

非ヒト（例えば、マウス）抗体のヒト化形態は、非ヒト免疫グロブリン由来の最小配列を含む免疫グロブリンのキメラ分子、免疫グロブリン鎖、またはそのフラグメント（Ｆｖ、Ｆａｂ、Ｆａｂ’、Ｆ（ａｂ’）、または抗体の他の抗原結合サブシーケンスなど）である。ヒト化抗体には、レシピエントの相補性決定領域（ＣＤＲ）由来の残基が所望の特異性、親和性、および能力を有するマウス、ラット、またはウサギ等の非ヒト種のＣＤＲ由来の残基（ドナー抗体）に置換されたヒト免疫グロブリン（レシピエント抗体）が含まれる。いくつかの例では、ヒト免疫グロブリンのＦｖフレームワーク残基を、対応する非ヒト残基に置換する。ヒト化抗体はまた、レシピエント抗体や移入されたＣＤＲまたはフレームワーク配列で認められない残基を含み得る。一般に、ヒト化抗体は、少なくとも１つ、典型的には２つの可変ドメインの実質的に全てを含み、全てまたは実質的に全てのＣＤＲ領域は非ヒト免疫グロブリンのＣＤＲに対応し、全てまたは実質的に全てのＦＲ領域はヒト免疫グロブリンコンセンサス配列のＦＲ領域である。ヒト化抗体はまた、任意選択的に、免疫グロブリンの定常領域（Ｆｃ）の少なくとも一部、典型的には、ヒト免疫グロブリンの定常領域を含む（Ｊｏｎｅｓｅｔａｌ．，Ｎａｔｕｒｅ，３２１：５２２−５２５（１９８６）；Ｒｉｅｃｈｍａｎｎｅｔａｌ．，Ｎａｔｕｒｅ，３３２：３２３−３２９（１９８８）；およびＰｒｅｓｔａ，Ｃｕｒｒ．Ｏｐ．Ｓｔｒｕｃｔ．Ｂｉｏｌ．，２：５９３−５９６（１９９２））。

非ヒト抗体のヒト化方法は、当該分野で周知である。一般に、ヒト化抗体は、非ヒトである供給源由来の抗体に移入された１つまたは複数のアミノ酸残基を有する。これらの非ヒトアミノ酸残基を、しばしば、移入残基（ｉｍｐｏｒｔｒｅｓｉｄｕｅ）といい、典型的には、移入可変ドメインから採取される。ヒト化を、本質的に、Ｗｉｎｔｅｒａｎｄｃｏ−ｗｏｒｋｅｒｓ［Ｊｏｎｅｓｅｔａｌ．，Ｎａｔｕｒｅ，３２１：５２２−５２５（１９８６）；Ｒｉｅｃｈｍａｎｎｅｔａｌ．，Ｎａｔｕｒｅ３３２：３２３−３２７（１９８８）；Ｖｅｒｈｏｅｙｅｎｅｔａｌ．，Ｓｃｉｅｎｃｅ，２３９：１５３４−１５３６（１９８８）］の方法にしたがって、げっ歯類ＣＤＲまたはＣＤＲ配列へのヒト抗体の対応する配列の置換によって行うことができる。したがって、このようなヒト化抗体は、実質的にインタクト未満のヒト可変ドメインが非ヒト種由来の対応する配列に置換されているキメラ抗体（米国特許第４，１８６，５６７号）である。実際には、ヒト化抗体は、典型的には、いくつかのＣＤＲ残基およびおそらくいくつかのＦＲ残基がげっ歯類抗体中の類似の部位由来の残基に置換されたヒト抗体である。

ヒト抗体を、当該分野で公知の種々の技術（ファージディスプレイライブラリー（ＨｏｏｇｅｎｂｏｏｍａｎｄＷｉｎｔｅｒ，Ｊ．Ｍｏｌ．Ｂｉｏｌ．，２２７：３８１（１９９１）；Ｍａｒｋｓｅｔａｌ．，Ｊ．Ｍｏｌ．Ｂｉｏｌ．，２２２：５８１（１９９１））が含まれる）を使用して産生することもできる。Ｃｏｌｅｅｔａｌ．ａｎｄＢｏｅｒｎｅｒｅｔａｌ．の技術もヒトモノクローナル抗体の調製に利用可能である（Ｃｏｌｅｅｔａｌ．，ＭｏｎｏｃｌｏｎａｌＡｎｔｉｂｏｄｉｅｓａｎｄＣａｎｃｅｒＴｈｅｒａｐｙ，ＡｌａｎＲ．Ｌｉｓｓ，ｐ．７７（１９８５）ａｎｄＢｏｅｒｎｅｒｅｔａｌ．，Ｊ．Ｉｍｍｕｎｏｌ．，１４７（１）：８６−９５（１９９１））。同様に、ヒト抗体を、トランスジェニック動物（例えば、内因性免疫グロブリン遺伝子が部分的または完全に不活化されているマウス）へのヒト免疫グロブリン遺伝子座の移入によって作製することができる。攻撃誘発の際、ヒト抗体の産生が認められ、これは、あらゆる点でヒトで認められる性質（遺伝子の再編成、アセンブリ、および抗体レパートリーが含まれる）に酷似している。このアプローチは、例えば、米国特許第５，５４５，８０７号；同第５，５４５，８０６号；同第５，５６９，８２５号；同第５，６２５，１２６号；同第５，６３３，４２５号；同第５，６６１，０１６号、および以下の科学刊行物に記載されている：Ｍａｒｋｓｅｔａｌ．，Ｂｉｏ／Ｔｅｃｈｎｏｌｏｇｙ１０，：７７９−７８３（１９９２）；Ｌｏｎｂｅｒｇｅｔａｌ．，Ｎａｔｕｒｅ３６８：８５６−８５９（１９９４）；Ｍｏｒｒｉｓｏｎ，Ｎａｔｕｒｅ３６８８１２−１３（１９９４）；Ｆｉｓｈｗｉｌｄｅｔａｌ．，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ１４，８４５−５１（１９９６）；Ｎｅｕｂｅｒｇｅｒ，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ１４：８２６（１９９６）；ａｎｄＬｏｎｂｅｒｇａｎｄＨｕｓｚａｒ，Ｉｎｔｅｒｎ．Ｒｅｖ．Ｉｍｍｕｎｏｌ．１３，６５−９３（１９９５）。

好ましくは、本発明のこの態様の抗体は、本発明のポリペプチド変異型の少なくとも１つのエピトープに特異的に結合する。本明細書中で使用される、用語「エピトープ」は、抗体のパラトープが結合する抗原上の任意の抗原決定基をいう。

エピトープ決定基は、通常、アミノ酸または炭水化物の側鎖等の分子の化学的に活性な表面群からなり、通常、特異的な三次元構造特性および特異的な電荷の特徴を有する。

任意選択的に、下記のように、１つまたは複数の翻訳後修飾（グリコシル化および／またはリン酸化が含まれるが、これらに限定されない）の変化によって固有のエピトープを変異型中に作製することができる。このような変化により、例えば、特定の部位でのグリコシル化の除去によって新規のエピトープを作製することもできる。

本発明のエピトープはまた、任意選択的に、線状ポリペプチド自体における固有の配列部分に連続的であるが、依然として組み合わせてエピトープを形成することができる、変異型の少なくとも１つの他の部分と組み合わせた本発明の変異型の固有の配列部分の一部または全部を含み得る。１つまたは複数の固有の配列部分は、任意選択的に、１つまたは複数の変異型の他の不連続部分（公知のタンパク質の一部と高い相同性を有し得る部分が含まれる）と組み合わせてエピトープを形成することができる。

免疫アッセイ
本発明の別の実施形態では、免疫アッセイを使用して、サンプル中のマーカーを定性的または定量的に検出および分析することができる。この方法は、マーカーに特異的に結合する抗体を準備する工程と、サンプルを抗体に接触させる工程と、サンプル中のマーカーに結合した抗体の複合体の存在を検出する工程を含む。

マーカーに特異的に結合する抗体を調製するために、精製したタンパク質マーカーを使用することができる。タンパク質マーカーに特異的に結合する抗体を、当該分野で公知の任意の適切な方法を使用して調製することができる。

抗体を準備した後、マーカーを、十分に認識された多数の免疫学的結合アッセイを使用して検出および／または定量することができる。有用なアッセイには、例えば、酵素免疫アッセイ（ＥＩＡ）（酵素結合免疫吸着アッセイ（ＥＬＩＳＡ）など）、放射免疫アッセイ（ＲＩＡ）、ウェスタンブロットアッセイ、またはスロットブロットアッセイが含まれる（例えば、米国特許第４，３６６，２４１号；同第４，３７６，１１０号；同第４，５１７，２８８号；および同第４，８３７，１６８号を参照のこと）。一般に、被験体から得たサンプルを、マーカーに特異的に結合する抗体と接触させることができる。

任意選択的に、抗体を、抗体とサンプルとの接触前に固体支持体に固定して、複合体の線状およびその後の単離を容易にすることができる。固体支持体の例には、例えば、マイクロタイタープレート、スティック、ビーズ、またはマイクロビーズの形態のガラスまたはプラスチックが含まれるが、これらに限定されない。抗体を、固体支持体に付着させることもできる。

サンプルの抗体とのインキュベーション後、混合物を洗浄し、形成された抗体−マーカー複合体を、検出することができる。洗浄混合物と検出試薬とのインキュベーションによってこれを行うことができる。あるいは、サンプル中のマーカーを、例えば、第２の標識抗体を使用して結合したマーカー−特異的抗体を検出する直接アッセイ、および／または、例えば、マーカーの異なるエピトープに結合するモノクローナル抗体を混合物と同時にインキュベートする競合アッセイまたは阻害アッセイを使用して検出することができる。

アッセイを通して、試薬の各組合わせ後にインキュベーションおよび／または洗浄工程が必要であり得る。インキュベーション工程は、約５秒間から数時間まで、好ましくは約５分から約２４時間まで変化し得る。しかし、インキュベーション時間は、アッセイの形式、マーカー、溶液の体積、および濃度などに依存する。通常、アッセイを、周囲温度で行うが、１０℃〜４０℃などの範囲で行うことができる。

免疫アッセイを使用して、被験体由来のサンプル中のマーカー試験量を決定することができる。第１に、サンプル中の試験量のマーカーを、上記の免疫アッセイ方法を使用して検出することができる。マーカーがサンプル中に存在する場合、サンプル中にマーカーが存在する場合、マーカーは、上記の適切なインキュベーション条件下でマーカーと特異的に結合する抗体との抗体−マーカー複合体を形成する。任意選択的に、抗体−マーカー複合体量を、標準との比較によって決定することができる。上記のように、測定単位をコントロール量および／またはシグナルと比較することができる限り、マーカーの試験量を、絶対単位中で測定する必要はない。

本発明のポリペプチドと特異的に相互作用するが、例えば、野生型タンパク質または他のイソ型と相互作用しない抗体を使用することが好ましい。このような抗体は、例えば、本発明のポリペプチド変異型の固有の配列部分（下により詳細に記載されている架橋、先端、テール、および挿入が含まれるが、これらに限定されない）に指向する。本発明の抗体の好ましい実施形態を、「抗体」の項により詳細に記載している。

放射免疫アッセイ（ＲＩＡ）：あるバージョンでは、この方法は、所望の基質の沈降、以下に詳述する方法では、アガロースビーズなどの沈殿可能なキャリア上に固定した特異的抗体および放射性標識抗体結合タンパク質（例えば、Ｉ^１２５で標識したプロテインＡ）を含む。沈降ペレット数は、基質量に比例する。

ＲＩＡの別のバージョンでは、標識基質および非標識抗体結合タンパク質を使用する。未知量の基質を含むサンプルを、種々の量で添加する。標識基質の沈降数の減少は、添加したサンプル中の基質の量に比例する。

酵素結合免疫吸着アッセイ（ＥＬＩＳＡ）：この方法は、タンパク質基質を含むサンプル（例えば、固定した細胞またはタンパク質溶液）のマイクロタイタープレートのウェルなどの表面への固定を含む。酵素にカップリングした基質特異的抗体を適用し、基質に結合させる。次いで、抗体の存在を検出し、抗体に結合した酵素を使用した比色反応によって定量する。この方法で一般に使用される酵素には、西洋ワサビペルオキシダーゼおよびアルカリホスファターゼが含まれる。十分に較正されており、且つ直線の反応範囲内の場合、サンプル中の基質の存在量は、発色量に比例する。一般に基質標準を使用して、量的精度を改良する。

ウェスタンブロット：この方法は、アクリルアミドゲルによる他のタンパク質からの基質の分離およびその後の膜（例えば、ナイロンまたはＰＶＤＦ）への基質の移動を含む。次いで、基質の存在を、基質に特異的な抗体によって検出し、その後、抗体結合試薬によって結合する。抗体結合試薬は、例えば、プロテインＡまたは他の抗体であり得る。抗体結合試薬を、上記のように、放射性標識するか、酵素に結合させることができる。オートラジオグラフィ、比色試薬、または化学発光によって検出することができる。この方法によって基質を定量し、電気泳動の際のアクリルアミドゲルにおける移動距離を示す膜の相対的位置によってその同一性を決定可能である。

免疫組織化学的分析：この方法は、基質特異的抗体による固定細胞におけるｉｎｓｉｔｕでの基質の検出を含む。基質特異的抗体を、酵素に結合するかフルオロフォアに結合することができる。顕微鏡および主観的評価によって検出する。酵素結合抗体を使用する場合、比色反応が必要であり得る。

蛍光標示式細胞分取（ＦＡＣＳ）：この方法は、基質特異的抗体による細胞におけるｉｎｓｉｔｕでの基質の検出を含む。基質特異的抗体を、光ビーム（ｌｉｇｈｔｂｅａｍ）からの通過時の各細胞から放出された光の波長を読み取る細胞分取装置によって検出する。この方法は、２つまたはそれ以上の抗体を同時に使用することができる。

ラジオイメージング法
これらの方法には、陽電子放出型断層撮影（ＰＥＴ）、単光子放出型コンピュータ断層撮影（ＳＰＥＣＴ）が含まれるが、これらに限定されない。これらの両技術は、非浸襲性であり、これらを使用して、広範な種々の組織事象および／または機能を検出および／または測定することができる（例えば、癌細胞の検出など）。ＰＥＴと異なり、ＳＰＥＣＴを、任意選択的に、２つの標識と同時に使用することができる。ＳＰＥＣＴも同様に、例えば、費用および使用することができる標識の型に関していくつかの他の利点を有する。例えば、米国特許第６，６９６，６８６号は、乳癌検出のためのＳＰＥＣＴの使用を記載しており、この特許は、本明細書中で完全に記載されているかのように本明細書中で参考として援用される。

ディスプレイライブラリー
本発明のさらに別の態様によれば、それぞれが本発明のポリペプチド配列由来の少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１０〜１５個、少なくとも１２〜１７個、少なくとも１５〜２０個、少なくとも１５〜３０個、または少なくとも２０〜５０個の連続したアミノ酸を表示する複数のディスプレイ送達体（ファージ、ウイルス、または細菌など）を含むディスプレイライブラリーを提供する。

このようなディスプレイライブラリーの構築方法は、当該分野で周知である。このような方法は、例えば、ＹｏｕｎｇＡＣ，ｅｔａｌ．，"Ｔｈｅｔｈｒｅｅ−ｄｉｍｅｎｓｉｏｎａｌｓｔｒｕｃｔｕｒｅｓｏｆａｐｏｌｙｓａｃｃｈａｒｉｄｅｂｉｎｄｉｎｇａｎｔｉｂｏｄｙｔｏＣｒｙｐｔｏｃｏｃｃｕｓｎｅｏｆｏｒｍａｎｓａｎｄｉｔｓｃｏｍｐｌｅｘｗｉｔｈａｐｅｐｔｉｄｅｆｒｏｍａｐｈａｇｅｄｉｓｐｌａｙｌｉｂｒａｒｙ：ｉｍｐｌｉｃａｔｉｏｎｓｆｏｒｔｈｅｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｐｅｐｔｉｄｅｍｉｍｏｔｏｐｅｓ" ＪＭｏｌＢｉｏｌ１９９７Ｄｅｃ１２；２７４（４）：６２２−３４；ＧｉｅｂｅｌＬＢｅｔａｌ． "Ｓｃｒｅｅｎｉｎｇｏｆｃｙｃｌｉｃｐｅｐｔｉｄｅｐｈａｇｅｌｉｂｒａｒｉｅｓｉｄｅｎｔｉｆｉｅｓｌｉｇａｎｄｓｔｈａｔｂｉｎｄｓｔｒｅｐｔａｖｉｄｉｎｗｉｔｈｈｉｇｈａｆｆｉｎｉｔｉｅｓ" Ｂｉｏｃｈｅｍｉｓｔｒｙ１９９５Ｎｏｖ２８；３４（４７）：１５４３０−５；ＤａｖｉｅｓＥＬｅｔａｌ．，"Ｓｅｌｅｃｔｉｏｎｏｆｓｐｅｃｉｆｉｃｐｈａｇｅ−ｄｉｓｐｌａｙａｎｔｉｂｏｄｉｅｓｕｓｉｎｇｌｉｂｒａｒｉｅｓｄｅｒｉｖｅｄｆｒｏｍｃｈｉｃｋｅｎｉｍｍｕｎｏｇｌｏｂｕｌｉｎｇｅｎｅｓ" ＪＩｍｍｕｎｏｌＭｅｔｈｏｄｓ１９９５Ｏｃｔ１２；１８６（１）：１２５−３５；ＪｏｎｅｓＣＲＴａｌ．"Ｃｕｒｒｅｎｔｔｒｅｎｄｓｉｎｍｏｌｅｃｕｌａｒｒｅｃｏｇｎｉｔｉｏｎａｎｄｂｉｏｓｅｐａｒａｔｉｏｎ" ＪＣｈｒｏｍａｔｏｇｒＡ１９９５Ｊｕｌ１４；７０７（１）：３−２２；ＤｅｎｇＳＪｅｔａｌ．"Ｂａｓｉｓｆｏｒｓｅｌｅｃｔｉｏｎｏｆｉｍｐｒｏｖｅｄｃａｒｂｏｈｙｄｒａｔｅ−ｂｉｎｄｉｎｇｓｉｎｇｌｅ−ｃｈａｉｎａｎｔｉｂｏｄｉｅｓｆｒｏｍｓｙｎｔｈｅｔｉｃｇｅｎｅｌｉｂｒａｒｉｅｓ" ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１９９５Ｍａｙ２３；９２（１１）：４９９２−６；ａｎｄＤｅｎｇＳＪｅｔａｌ．"Ｓｅｌｅｃｔｉｏｎｏｆａｎｔｉｂｏｄｙｓｉｎｇｌｅ−ｃｈａｉｎｖａｒｉａｂｌｅｆｒａｇｍｅｎｔｓｗｉｔｈｉｍｐｒｏｖｅｄｃａｒｂｏｈｙｄｒａｔｅｂｉｎｄｉｎｇｂｙｐｈａｇｅｄｉｓｐｌａｙ" ＪＢｉｏｌＣｈｅｍ１９９４Ａｐｒ１；２６９（１３）：９５３３−８（本明細書中で参考として援用される）に記載されている。

以下の項は、候補マーカーの例（第１項）およびこれらのマーカーの例についての実験データ（第２項）に関する。

候補マーカーの例の項
この項は、本発明の配列の例（その例示的選択方法が含まれる）に関する。

本発明の生体分子を明らかにするために取り掛かった方法の説明
ヒトＥＳＴおよびｃＤＮＡを、ＧｅｎＢａｎｋバージョン１３６（２００３年６月１５日のｆｔｐ．ｎｃｂｉ．ｎｉｈ．ｇｏｖ／ｇｅｎｂａｎｋ／ｒｅｌｅａｓｅ．ｎｏｔｅｓ／ｇｂ１３６．ｒｅｌｅａｓｅ．ｎｏｔｅｓ）；２００３年４月のＮＣＢＩゲノムアセンブリ；２００３年６月のＲｅｆＳｅｑ配列；Ｇｅｎｂａｎｋバージョン１３９（２００３年１２月）；ＮＣＢＩのヒトゲノム（Ｂｕｉｌｄ３４）（２００３年１０月から）；および２００３年１２月からのＲｅｆＳｅｑ配列；およびＩｎｃｙｔｅＣｏｒｐｏｒａｔｉｏｎのＬｉｆｅＳｅｑライブラリー（ＥＳＴのみ；Ｗｉｌｍｉｎｇｔｏｎ，ＤＥ，ＵＳＡ）から得た。ＧｅｎＢａｎｋ配列に関して、ＥＳＴ（ＧＢＥＳＴ）の項由来のヒトＥＳＴ配列および霊長類（ＧＢＰＲＩ）の項由来のヒトｍＲＮＡ配列を使用し、ヒトヌクレオチドＲｅｆＳｅｑｍＲＮＡ配列も使用した（例えば、ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／Ｇｅｎｂａｎｋ／ＧｅｎｂａｎｋＯｖｅｒｖｉｅｗ．ｈｔｍｌおよびＥＳＴの項の参考文献（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｄｂＥＳＴ／を参照のこと）；ｄｂＥＳＴ（ＧｅｎＢａｎｋ中のＥＳＴデータベース）の一般的な参考文献（Ｂｏｇｕｓｋｉｅｔａｌ，ＮａｔＧｅｎｅｔ．１９９３Ａｕｇ；４（４）：３３２−３に見出すことができる）（その全てが本明細書中に完全に記載されているかのように本明細書中で参考として援用される）を参照のこと）。

新規のスプライス変異型を、Ｓｏｒｅｋ，Ｒ．，Ａｓｔ，Ｇ．＆Ｇｒａｕｒ，Ｄ．Ａｌｕ−ｃｏｎｔａｉｎｉｎｇｅｘｏｎｓａｒｅａｌｔｅｒｎａｔｉｖｅｌｙｓｐｌｉｃｅｄ．ＧｅｎｏｍｅＲｅｓ１２，１０６０−７（２００２）；米国特許第６，６２５，５４５号；２００４年５月２７日にＵＳ２００４０１０１８７６として公開された米国特許出願番号１０／４２６，００２号（その全てが本明細書中に完全に記載されているかのように本明細書中で参考として援用される）に記載のＬＥＡＤＳクラスター化およびアセンブリシステムを使用して予想した。簡単に述べれば、ソフトウェアは、反復、ベクター、および免疫グロブリンから発現配列を取り除く。次いで、ソフトウェアは、発現配列を、選択的スプライシングを考慮したゲノムおよび遺伝子または部分的遺伝子を示す「クラスター」への発現配列と重複するクラスターとアラインメントする。

これらを、ＧｅｎｅＣａｒｔａ（Ｃｏｍｐｕｇｅｎ，Ｔｅｌ−Ａｖｉｖ，Ｉｓｒａｅｌ）プラットフォームを使用して注釈づけした。ＧｅｎｅＣａｒｔａプラットフォームは、豊富な注釈づけプール、（特に、スプライシングした配列の）配列情報、染色体情報、アラインメント、およびさらなる情報（ＳＮＰ、遺伝子オントロジーターム、発現プロフィール、機能分析、詳細なドメイン構造、既知および推定タンパク質および詳細な相同性レポートなど）を含む。

候補選択方法に関して簡単に説明する。しかし、この説明を記述のみを目的として説明し、本発明を制限することを決して意図しないことに留意すべきである。発現配列のデータベースの使用による腫瘍組織中で過剰発現する遺伝子および／またはそのスプライスバリアントを見出すようにデザインされた計算プロセスによって潜在的マーカーを同定した。手作業の分類プロセスにしたがって決定したＥＳＴライブラリー中の情報に関連する種々のパラメータを使用して、癌組織中で過剰発現する遺伝子および／またはそのスプライスバリアントの位置づけを補助した。選択方法の詳細な説明を、以下の実施例１に示す。癌マーカー選択エンジンおよび以下のウェットバリデーション（ｗｅｔｖａｌｉｄａｔｉｏｎ）段階の概要のまとめを図１に示す。

実施例１：差分発現した遺伝子産物の同定−アルゴリズム
差分発現した遺伝子産物と構成性に発現した遺伝子（すなわち、ハウスキーピング遺伝子）とを区別するために、頻度分析に基づくアルゴリズムを設定した。癌で過剰発現した転写物の同定のための特定のアルゴリズムを、以下に記載する。

乾式分析（Ｄｒｙａｎａｌｙｓｉｓ）
ライブラリー注釈づけ−ＥＳＴライブラリーを以下にしたがって手作業で分類する。
・組織の起源
・生体供給源−ＥＳＴライブラリーの構築のために頻繁に使用される生体供給源の例には、癌細胞株、正常組織、癌組織、胎児組織、および他（正常細胞株、正常細胞株のプール、癌細胞株、およびその組み合わせなど）が含まれる。これらの組織／細胞株に関する以下に使用した略語の特定の説明を上に示す。
・ライブラリー構築のプロトコール−種々の方法がライブラリー構築分野で公知であり、標準化ライブラリー構築、非標準化ライブラリー構築、サブトラクションライブラリー、ＯＲＥＳＴＥＳなどが含まれる。時折、ライブラリー構築のプロトコールを示さないと認識される。

以下の規則に従う。

同一の生体サンプル由来のＥＳＴライブラリーを、１つのライブラリーと見なす。

上記平均レベルで汚染されている（例えば、ＤＮＡ汚染など）ＥＳＴライブラリーを排除した。このような汚染の存在を、以下のように決定した。各ライブラリーについて、他のスプライシング配列内に完全に含まれない非スプライシングＥＳＴを計数した。（他の配列と比較した）このような配列の比率は、分析した全ライブラリーの平均よりも標準偏差が少なくとも４高い場合、ライブラリーを汚染としてタグ化し、以下の分析でのさらなる考慮から排除した（さらなる詳細については、Ｓｏｒｅｋ，Ｒ．＆Ｓａｆｅｒ，Ｈ．Ｍ．ＡｎｏｖｅｌａｌｇｏｒｉｔｈｍｆｏｒｃｏｍｐｕｔａｔｉｏｎａｌｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｃｏｎｔａｍｉｎａｔｅｄＥＳＴｌｉｂｒａｒｉｅｓ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３１，１０６７−７４（２００３）も参照のこと）。

少なくとも５つの配列（目的の組織由来の少なくとも２つの配列が含まれる）を有するクラスター（遺伝子）を分析した。上記のように、スプライスバリアントを、ＬＥＡＤＳソフトウェアパッケージの使用によって同定した。

実施例２：癌中で過剰発現する遺伝子の同定
２つの異なるスコアリングアルゴリズムを開発した。

ライブラリースコア−多数の癌ライブラリーによって支持される候補配列は、特異的且つ有効な診断マーカーとして機能する可能性がより高い。

基本アルゴリズム−各クラスターのために、クラスターに対する癌ライブラリーおよび正常ライブラリーの寄与配列を計数した。フィッシャーの正確確率検定を使用して、癌ライブラリーおよび正常なライブラリーの総数と比較して癌ライブラリーがクラスター中で有意に過剰発現するかどうかをチェックした。

ライブラリーの計数：クラスターに関与しない限り、小ライブラリー（例えば、１０００配列未満）を、考慮から排除した。この理由のために、ライブラリーの総数を、各クラスターについて実際に調整している。

クローン番号スコア−一般に、ＥＳＴ数は、正常なライブラリーと比較して癌ライブラリーではるかに多く、これは、実際の過剰発現を示し得る。

アルゴリズム−
クローン計数：ＥＳＴクローンの計数のために、プロトコールが実際の発現レベルをどの程度反映しているという本発明者らの信念に基づいて、各ライブラリープロトコールクラスに以下の重みを付けた。
（ｉ）非正規化：１
（ｉｉ）正規化：０．２
（ｉｉｉ）他の全てのクラス：０．１

クローン数スコア−癌ライブラリー由来の重みをつけたＥＳＴクローンの総数を、正常ライブラリー由来のＥＳＴクローンと比較した。１つのライブラリーが多数のスコアに寄与することを回避するために、所与のクラスターの最も多くのライブラリーに与えるライブラリーの寄与を２クローンに制限した。

スコアを、

（式中、ｃ−クラスター中の「癌」クローンの重み付けした数、
Ｃ−全「癌」ライブラリー中のクローンの重み付けした数、
ｎ−クラスター中の「正常」クローンの重み付けした数、
Ｎ−全「正常」ライブラリー中のクローンの重み付けした数
）として計算した。

クローン数スコアの有意性−フィッシャーの正確確率検定を使用して、癌ライブラリーおよび正常なライブラリー由来のＥＳＴクローンの総数と比較して癌ライブラリー由来のＥＳＴクローンがクラスター中で有意に過剰発現するかどうかをチェックした。

以下の２つの検索アプローチを使用して、一般的な癌特異的候補または腫瘍特異的候補のいずれかを見出した。
・癌細胞株由来のライブラリーと同様に、腫瘍組織由来のライブラリー／配列を計数する（「正常」細胞株は無視した）。
・腫瘍組織由来のライブラリー／配列のみを計数する。

実施例３：組織特異的遺伝子の同定
組織特異的クラスターの検出のために、組織ライブラリー／配列を、クラスター中のライブラリー／配列の総数と比較した。上記と類似の統計ツールを使用して、組織特異的遺伝子を同定した。組織の略語は癌組織と同一であるが、見出し「正常組織」と共に示す。

アルゴリズム−各試験組織Ｔおよび各試験クラスターについて、以下を試験した。

１．各クラスターは、組織Ｔ由来の少なくとも２つのライブラリーを含む。クラスター中の組織Ｔ由来の少なくとも３つのクローン（上記のように重み付けした）、および
２．組織Ｔ由来のクローンは、試験クラスターに関与する全クローンの少なくとも４０％である。

数が統計的に有意であることをチェックするために、フィッシャーの正確確率検定のＰ値を、ライブラリーおよび重み付けしたクローンの両方について計算した。

実施例４：癌中で過剰発現しないクラスターの癌中で過剰発現したスプライスバリアントの同定
固有の領域を含む癌特異的スプライスバリアントを同定した。

スプライスバリアント中の固有の配列領域の同定
領域を、各スプライスバリアント中で共に常に出現するか出現しない隣接エクソン群と定義する。

「セグメント」（時折、「ｓｅｇ」または「ノード」という）は、公知のスプライシング内部（ｉｎｓｉｄｅ）を含まない最も短い隣接転写領域と定義する。

信頼できるＥＳＴのみを、領域およびセグメントの分析のために考慮した。以下の場合、ＥＳＴを、信頼できないと定義した。
（ｉ）非スプライシング、
（ｉｉ）ＲＮＡによって対象とされないこと、
（ｉｉｉ）スプライシングＥＳＴによって対象とされないこと、および
（ｉｖ）長ポリＡストレッチの近位のゲノムの末端部分または長ポリＴストレッチの近位の開始部分（ｓｔａｒｔ）とのアラインメント。

さらなるスコアリングのために信頼できる領域を選択した。以下の場合、固有の配列領域を、信頼できると見なした。
（ｉ）ゲノムとのアラインメント、および
（ｉｉ）２ＥＳＴ超に支持される領域。

アルゴリズム
各固有の配列領域により、転写物組を以下の２つの群に分ける。
（ｉ）この領域を含む転写物（ＴＡ群）
（ｉｉ）この領域を含まない転写物（ＴＢ群）

各クラスターのＥＳＴクローン組を、以下の３つの群に分ける。
（ｉ）群ＴＡの転写物（に由来する）を支持するもの（Ｓ１）。
（ｉｉ）群ＴＢの転写物を支持するもの（Ｓ２）。
（ｉｉｉ）両群由来の転写物を支持するもの（Ｓ３）。

上記のライブラリーおよびクローン数のスコアを、Ｓ１群に与えた。

フィッシャーの正確確率検定のＰ値を使用して、Ｓ２と比較してＳ１が癌ＥＳＴクローンによって有意に富化するかどうか、およびクラスターバックグラウンド（Ｓ１＋Ｓ２＋Ｓ３）と比較して、Ｓ１が癌ＥＳＴクローンによって有意に富化するかどうかをチェックした。

したがって、固有の配列領域の同定および転写物群の分割を図２に示す。これらの各固有の配列領域は、「ノード」とも呼ばれるセグメントに対応する。

領域１：全転写物に共通であり、それにより、変異型が検出されたと見なさない；領域２：転写物１に特異的；領域３：転写物２および３に特異的、領域４：転写物３に特異的、領域５：転写物１および２に特異的、領域６：転写物１に特異的。

実施例５：癌中で加除発現した遺伝子の癌特異的スプライスバリアントの同定
以下の遺伝子のＥＳＴ支持（ｍＲＮＡなし）領域の検索：
（ｉ）公知の癌マーカー
（ｉｉ）公開されたマイクロアレイ実験において癌中で過剰発現することが示された遺伝子。

信頼できるＥＳＴ支持領域を、最低でも以下の１つによって支持されると定義した。
（ｉ）３つのスプライシングＥＳＴ、
（ｉｉ）２ライブラリー由来の２つのスプライシングＥＳＴ、
（ｉｉｉ）２ライブラリー由来の１０個の非スプライシングＥＳＴ、または
（ｉｖ）３つのライブラリー。

実際のマーカーの例
以下の例は、特定の実際のマーカーの例に関する。

実験例の項
この項は、これらの配列ならびに例示的な制限されない方法、アッセイ、およびその使用の例を含む実験を記載する実施例に関する。全実験で実施した研究の基礎として使用したので、材料と実験手順を最初に説明する。

本発明のマーカーを、種々の癌性および非癌性組織サンプルでのその発現に関して試験した。パネル中で使用したサンプルを、以下の表２に記載する。正常組織パネル中で使用したサンプルを、以下の表３に記載する。次いで、試験を、以下の「材料と実験手順」の項に記載のように行った。

材料と実験手順
ＲＮＡの調製−ＲＮＡをＣｌｏｎｔｅｃｈ（ＦｒａｎｋｌｉｎＬａｋｅｓ，ＮＪＵＳＡ０７４１７，ｗｗｗ．ｃｌｏｎｔｅｃｈ．ｃｏｍ）、ＢｉｏＣｈａｉｎＩｎｓｔ．Ｉｎｃ．（Ｈａｙｗａｒｄ，ＣＡ９４５４５ＵＳＡｗｗｗ．ｂｉｏｃｈａｉｎ．ｃｏｍ）、ＡＢＳ（Ｗｉｌｍｉｎｇｔｏｎ，ＤＥ１９８０１，ＵＳＡ，ｈｔｔｐ：／／ｗｗｗ．ａｂｓｂｉｏｒｅａｇｅｎｔｓ．ｃｏｍ）、またはＡｍｂｉｏｎ（Ａｕｓｔｉｎ，ＴＸ７８７４４ＵＳＡ，ｈｔｔｐ：／／ｗｗｗ．ａｍｂｉｏｎ．ｃｏｍ）から得た。あるいは、ＲＮＡを、製造者の説明書にしたがって、ＴＲＩ試薬（ＭｏｌｅｃｕｌａｒＲｅｓｅａｒｃｈＣｅｎｔｅｒ）を使用して、組織サンプルから生成した。組織およびＲＮＡサンプルを、患者または死亡後に得た。総ＲＮＡサンプルを、ＤＮアーゼＩ（Ａｍｂｉｏｎ）で処理し、ＲＮｅａｓｙカラム（Ｑｉａｇｅｎ）を使用して精製した。

ＲＴ−ＰＣＲ−精製ＲＮＡ（１μｇ）を、総体積が１５．６μｌで１５０ｎｇのＲａｎｄｏｍＨｅｘａｍｅｒプライマー（Ｉｎｖｉｔｒｏｇｅｎ）および５００μＭｄＮＴＰと混合した。混合物を、６５℃で５分間インキュベートし、氷上で急速冷却した。その後、５μｌの５×ＳｕｐｅｒｓｃｒｉｔｐＩＩ第１鎖緩衝液（Ｉｎｖｉｔｒｏｇｅｎ）、２．４μｌの０．１ＭＤＴＴ、および４０単位のＲＮａｓｉｎ（Ｐｒｏｍｅｇａ）を添加し、混合物を、２５℃で１０分間インキュベートし、その後、４２℃で２分間さらにインキュベートした。次いで、１μｌ（２００単位）のＳｕｐｅｒｓｃｒｉｔｐＩＩ（Ｉｎｖｉｔｒｏｇｅｎ）を添加し、反応物（最終体積は２５μｌ）を、４２℃で５０分間インキュベートし、その後、７０℃で１５分間インキュベートした。得られたｃＤＮＡを、ＴＥ緩衝液（１０ｍＭＴｒｉｓ（ｐＨ＝８）、１ｍＭＥＤＴＡ（ｐＨ＝８））で２０倍希釈した。

実時間ＲＴ−ＰＣＲ分析−上記のように調製したｃＤＮＡ（５μｌ）を、特異的プライマーおよびＵＮＧ酵素（Ｅｕｒｏｇｅｎｔｅｃｈ、ＡＢＩ、またはＲｏｃｈｅ）を使用したＳＹＢＲＧｒｅｅｎＩアッセイ（ＰＥＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）を使用して実時間ＰＣＲ反応におけるテンプレートとして使用した。以下のように増幅を行なった：５０℃で２分間、９５℃で１０分間、その後、９５℃で１５秒間を４０サイクル、その後、６０℃で１分間。ＰＥＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓＳＤＳ７０００の使用によって検出を行った。反応物が蛍光の閾値レベル（Ｃｔ）を達成したサイクルを記録し、これを使用して、ＲＴ反応中の相対転写量を計算した。相対量を、式：Ｑ＝効率^＾−Ｃｔを使用して計算した。ＰＣＲ反応効率を、いくつかの逆転写（ＲＴ）反応の連続希釈物の使用によって作成した検量線から計算した。ＲＴ反応の固有の相違を最小にするために、得られた相対量を、いくつかのハウスキーピング（ＨＳＫＰ）遺伝子の相対量の相乗平均に正規化した。定量的実時間ＰＣＲ分析の概要のまとめを、図３に示す。示されるように、ｘ軸は、サイクル数を示す。Ｃ_Ｔ＝閾値サイクル点（増幅曲線が実験で設定した蛍光閾値を交差するサイクルである）。この点は、ＰＣＲ産物のシグナルがバックグラウンドレベル（受動的色素ＲＯＸ）を超えるが、以前として幾何／対数期にある計算したサイクル数である。（示されるように、一旦蛍光レベルが測定閾値を交差すると、幾何学的増大期となり、その間の測定は最も正確であり、その後、直線期（ｌｉｎｅａｒｐｈａｓｅ）およびプラトー期となる；定量的測定のために、後者の２つの期からは正確に測定されない）。ｙ軸は、正規化レポーター蛍光を示す。この分析型は相対的定量を行うことに留意すべきである。

試験パネル中の全実施例中で測定されたハウスキーピング遺伝子の配列は以下であった：
ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９）
ユビキチン順方向プライマー（配列番号３２６）：ＡＴＴＴＧＧＧＴＣＧＣＧＧＴＴＣＴＴＧ
ユビキチン逆方向プライマー（配列番号３２７）：ＴＧＣＣＴＴＧＡＣＡＴＴＣＴＣＧＡＴＧＧＴ
ユビキチン−アンプリコン（配列番号３２８）
ＡＴＴＴＧＧＧＴＣＧＣＧＧＴＴＣＴＴＧＴＴＴＧＴＧＧＡＴＣＧＣＴＧＴＧＡＴＣＧＴＣＡＣＴＴＧＡＣＡＡＴＧＣＡＧＡＴＣＴＴＣＧＴＧＡＡＧＡＣＴＣＴＧＡＣＴＧＧＴＡＡＧＡＣＣＡＴＣＡＣＣＣＴＣＧＡＧＧＴＴＧＡＧＣＣＣＡＧＴＧＡＣＡＣＣＡＴＣＧＡＧＡＡＴＧＴＣＡＡＧＧＣＡ

ＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８）
ＳＤＨＡ順方向プライマー（配列番号３２９）：ＴＧＧＧＡＡＣＡＡＧＡＧＧＧＣＡＴＣＴＧ
ＳＤＨＡ逆方向プライマー（配列番号３３０）：ＣＣＡＣＣＡＣＴＧＣＡＴＣＡＡＡＴＴＣＡＴＧ
ＳＤＨＡ−アンプリコン（配列番号３３１）：ＴＧＧＧＡＡＣＡＡＧＡＧＧＧＣＡＴＣＴＧＣＴＡＡＡＧＴＴＴＣＡＧＡＴＴＣＣＡＴＴＴＣＴＧＣＴＣＡＧＴＡＴＣＣＡＧＴＡＧＴＧＧＡＴＣＡＴＧＡＡＴＴＴＧＡＴＧＣＡＧＴＧＧＴＧＧ

ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３），
ＰＢＧＤ順方向プライマー（配列番号３３２）：ＴＧＡＧＡＧＴＧＡＴＴＣＧＣＧＴＧＧＧ
ＰＢＧＤ逆方向プライマー（配列番号３３３）：ＣＣＡＧＧＧＴＡＣＧＡＧＧＣＴＴＴＣＡＡＴ
ＰＢＧＤ−アンプリコン（配列番号３３４）：ＴＧＡＧＡＧＴＧＡＴＴＣＧＣＧＴＧＧＧＴＡＣＣＣＧＣＡＡＧＡＧＣＣＡＧＣＴＴＧＣＴＣＧＣＡＴＡＣＡＧＡＣＧＧＡＣＡＧＴＧＴＧＧＴＧＧＣＡＡＣＡＴＴＧＡＡＡＧＣＣＴＣＧＴＡＣＣＣＴＧＧ

ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４），
ＨＰＲＴ１順方向プライマー（配列番号１２９５）：ＴＧＡＣＡＣＴＧＧＣＡＡＡＡＣＡＡＴＧＣＡ
ＨＰＲＴ１逆方向プライマー（配列番号１２９６）：ＧＧＴＣＣＴＴＴＴＣＡＣＣＡＧＣＡＡＧＣＴ
ＨＰＲＴ１−アンプリコン（配列番号１２９７）：ＴＧＡＣＡＣＴＧＧＣＡＡＡＡＣＡＡＴＧＣＡＧＡＣＴＴＴＧＣＴＴＴＣＣＴＴＧＧＴＣＡＧＧＣＡＧＴＡＴＡＡＴＣＣＡＡＡＧＡＴＧＧＴＣＡＡＧＧＴＣＧＣＡＡＧＣＴＴＧＣＴＧＧＴＧＡＡＡＡＧＧＡＣＣ

正常組織サンプルにおける全実施例中で測定されたハウスキーピング遺伝子の配列は以下であった：

ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１），
ＲＰＬ１９順方向プライマー（配列番号１２９８）：ＴＧＧＣＡＡＧＡＡＧＡＡＧＧＴＣＴＧＧＴＴＡＧ
ＲＰＬ１９逆方向プライマー（配列番号１４２０）：ＴＧＡＴＣＡＧＣＣＣＡＴＣＴＴＴＧＡＴＧＡＧ
ＲＰＬ１９ –アンプリコン（配列番号１６３０）：ＴＧＧＣＡＡＧＡＡＧＡＡＧＧＴＣＴＧＧＴＴＡＧＡＣＣＣＣＡＡＴＧＡＧＡＣＣＡＡＴＧＡＡＡＴＣＧＣＣＡＡＴＧＣＣＡＡＣＴＣＣＣＧＴＣＡＧＣＡＧＡＴＣＣＧＧＡＡＧＣＴＣＡＴＣＡＡＡＧＡＴＧＧＧＣＴＧＡＴＣＡ
ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４），
ＴＡＴＡボックス順方向プライマー（配列番号１６３１）：ＣＧＧＴＴＴＧＣＴＧＣＧＧＴＡＡＴＣＡＴ
ＴＡＴＡボックス逆方向プライマー（配列番号１６３２）：ＴＴＴＣＴＴＧＣＴＧＣＣＡＧＴＣＴＧＧＡＣ
ＴＡＴＡボックス–アンプリコン（配列番号１６３３）：ＣＧＧＴＴＴＧＣＴＧＣＧＧＴＡＡＴＣＡＴＧＡＧＧＡＴＡＡＧＡＧＡＧＣＣＡＣＧＡＡＣＣＡＣＧＧＣＡＣＴＧＡＴＴＴＴＣＡＧＴＴＣＴＧＧＧＡＡＡＡＴＧＧＴＧＴＧＣＡＣＡＧＧＡＧＣＣＡＡＧＡＧＴＧＡＡＧＡＡＣＡＧＴＣＣＡＧＡＣＴＧＧＣＡＧＣＡＡＧＡＡＡ
ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９）
ユビキチン順方向プライマー（配列番号３２６）：ＡＴＴＴＧＧＧＴＣＧＣＧＧＴＴＣＴＴＧ
ユビキチン逆方向プライマー（配列番号３２７）：ＴＧＣＣＴＴＧＡＣＡＴＴＣＴＣＧＡＴＧＧＴ
ユビキチン−アンプリコン（配列番号３２８）
ＡＴＴＴＧＧＧＴＣＧＣＧＧＴＴＣＴＴＧＴＴＴＧＴＧＧＡＴＣＧＣＴＧＴＧＡＴＣＧＴＣＡＣＴＴＧＡＣＡＡＴＧＣＡＧＡＴＣＴＴＣＧＴＧＡＡＧＡＣＴＣＴＧＡＣＴＧＧＴＡＡＧＡＣＣＡＴＣＡＣＣＣＴＣＧＡＧＧＴＴＧＡＧＣＣＣＡＧＴＧＡＣＡＣＣＡＴＣＧＡＧＡＡＴＧＴＣＡＡＧＧＣＡ
ＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８）
ＳＤＨＡ順方向プライマー（配列番号３２９）：ＴＧＧＧＡＡＣＡＡＧＡＧＧＧＣＡＴＣＴＧ
ＳＤＨＡ逆方向プライマー（配列番号３３０）：ＣＣＡＣＣＡＣＴＧＣＡＴＣＡＡＡＴＴＣＡＴＧ
ＳＤＨＡ−アンプリコン（配列番号３３１）：ＴＧＧＧＡＡＣＡＡＧＡＧＧＧＣＡＴＣＴＧＣＴＡＡＡＧＴＴＴＣＡＧＡＴＴＣＣＡＴＴＴＣＴＧＣＴＣＡＧＴＡＴＣＣＡＧＴＡＧＴＧＧＡＴＣＡＴＧＡＡＴＴＴＧＡＴＧＣＡＧＴＧＧＴＧＧ

オリゴヌクレオチドベースのマイクロアレイ実験プロトコール
マイクロアレイの構築
マイクロアレイ（チップ）を、ＢｉｏＲｏｂｏｔｉｃｓＬｉｍｉｔｅｄ（Ｃａｍｂｒｉｄｇｅ，ＵＫ）のＭｉｃｒｏＧｒｉｄＩＩＭＧＩＩ６００ロボットを使用したピン沈着（ｄｅｐｏｓｉｔｉｏｎ）によってプリントした。Ａ．Ｓｈｏｓｈａｎｅｔａｌ，“Ｏｐｔｉｃａｌｔｅｃｈｎｏｌｏｇｉｅｓａｎｄｉｎｆｏｒｍａｔｉｃｓ”，ＰｒｏｃｅｅｄｉｎｇｓｏｆＳＰＩＥ．Ｖｏｌ４２６６，ｐｐ．８６−９５（２００１）に記載のように、５０量体のオリゴヌクレオチド標的配列を、ＣｏｍｐｕｇｅｎＬｔｄ（Ｔｅｌ−Ａｖｉｖ，ＩＬ）によってデザインした。デザインしたオリゴヌクレオチドを合成し、Ｓｉｇｍａ−Ｇｅｎｏｓｙｓシステム（ＴｈｅＷｏｏｄｌａｎｄｓ，ＴＸ，ＵＳ）を使用した脱塩によって精製し、全てのオリゴヌクレオチドを、５’末端でＣ６アミノ修飾リンカーに連結するか、ＣｏｄｅＬｉｎｋスライド（Ｃａｔ #２５−６７００−０１ＡｍｅｒｓｈａｍＢｉｏｓｃｉｅｎｃｅ，Ｐｉｓｃａｔａｗａｙ，ＮＪ，ＵＳ）に直接付着させる。標的配列を形成する５０量体のオリゴヌクレオチドを、最初に、Ｕｌｔｒａ−ｐｕｒｅＤＤＷ（Ｃａｔ # ０１−８６６−１ＡＫｉｂｂｕｔｚＢｅｉｔ−Ｈａｅｍｅｋ，Ｉｓｒａｅｌ）中に５０μＭの濃度まで懸濁した。スライドへのプリント前に、オリゴヌクレオチドを、３００ｍＭリン酸ナトリウム（ｐＨ８．５）に最終濃度１５０ｍＭまで再懸濁し、相対湿度３５〜４０％、２１℃でプリントした。

各スライドは、３２個のサブアレイ中に全部で９７９２個のフィーチャーを含んでいた。４２２４個のフィーチャーは、２つずつプリントされた本発明の目的の配列および負のコントロールであった。さらなる２８８このフィーチャー（３つずつプリントした９６個の標的配列）は、ＨｕｍａｎＥｖａｌｕａｔｉｏｎＬｉｂｒａｒｙ２，ＣｏｍｐｕｇｅｎＬｔｄ，Ｉｓｒａｅｌのハウスキーピング遺伝子を含んでいた。別の３８４個のフィーチャーは、ＡｒｒａｙＣｏｎｔｒｏｌｐｒｏｄｕｃｔ（Ａｒｒａｙｃｏｎｔｒｏｌ− ｓｅｎｓｅｏｌｉｇｏｓｐｏｔｓ，ＡｍｂｉｏｎＩｎｃ．Ａｕｓｔｉｎ，ＴＸ．Ｃａｔ#１７８１，Ｌｏｔ #１１２Ｋ０６）で市販されている大腸菌遺伝子のオリゴである大腸菌スパイク１〜６である。

プリントしたスライドのカップリング後プロセシング
ガラス（ＣｏｄｅＬｉｎｋ）スライドへのオリゴヌクレオチドのスポッティング後、スライドを、密封ＮａＣｌ湿室（相対湿度７０〜７５％）中で２４時間インキュベートした。

スライドを、残存反応基のブロッキングのために、スライドの５０℃のブロッキング溶液（０．１ＭＴｒｉｓ、５０ｍＭエタノールアミン、０．１％ＳＤＳを含む１０ｍｌ／スライドの緩衝液）中で１５分間のインキュベーションによって処理した。次いで、スライドを、Ｕｌｔｒａ−ｐｕｒｅＤＤＷ（２回蒸留水）で２回リンスした。次いで、スライドを、５０℃の洗浄液（１０ｍｌ／スライド、４×ＳＳＣ、０．１％ＳＤＳ）で３０分間震盪器上で洗浄した。次いで、スライドを、Ｕｌｔｒａ−ｐｕｒｅＤＤＷで２回リンスし、８００ｒｐｍで３分間の遠心分離によって乾燥させた。

次に、ハイブリッド形成プロトコールの自動操作を補助するために、スライドを、ＶｅｎｔａｎａＤｉｓｃｏｖｅｒｙハイブリッド形成ステーションバーコード接着剤で処理した。プリントしたスライドを、Ｂｉｏ−Ｏｐｔｉｃａ（Ｍｉｌａｎ，Ｉｔａｌｙ）血液（ｈｅｍａｔｏｌｏｇｙ）染色デバイスにロードし、５０ｍｌの３−アミノプロピルトリエトキシシラン（ＳｉｇｍａＡ３６４８ｌｏｔ #１２２Ｋ５８９）中で１０分間インキュベートした。過剰な液体を乾燥させ、スライドを、２０ｍｍ／Ｈｇの暗所減圧デシケーター（Ｐｅｌｃｏ２２５１，ＴｅｄＰｅｌｌａ，Ｉｎｃ．ＲｅｄｄｉｎｇＣＡ）中で３時間インキュベートした。

マイクロアレイ実験を行うために、ＶｅｎｔａｎａＤｉｓｃｏｖｅｒｙＨｙｂＳｔａｔｉｏｎ™でのミニ溶離カラムを使用するＧｅｎｉｓｐｈｅｒｅ９００−ＲＰ（ランダムプライマー）を使用した以下のプロトコールに従った。簡単に述べれば、デバイス自体が提供する説明書および情報に関して記載のようにプロトコールを行った。プロトコールは、ｃＤＮＡ合成および標識を含んでいた。ｃＤＮＡ濃度を、ＯｌｉＧｒｅｅｎｓｓＤＮＡ定量試薬およびキットとともに使用するＴＢＳ−３８０（ＴｕｒｎｅｒＢｉｏｓｙｓｔｅｍｓ．Ｓｕｎｎｙｖａｌｅ，ＣＡ．）ＰｉｃｏＦｌｏｕｒを使用して測定した。

提供されたプロトコール（ＤｉｓｃｏｖｅｒｙＨｙｂｒｉｄｉｚａｔｉｏｎＳｔａｔｉｏｎＴｕｓｃｏｎＡＺ）に従って、Ｖｅｎｔａｎａハイブリッド形成デバイスを使用してハイブリッド形成を行った。

次いで、スライドを、ＡｘｏｎＩｎｓｔｒｕｍｅｎｔｓＩｎｃのＧｅｎｅＰｉｘ４０００Ｂデュアルレーザースキャナを使用してスキャンし、ＧｅｎｅＰｉｘＰｒｏ５．０ソフトウェアによって分析した。

オリゴヌクレオチドベースのマイクロアレイ作製および実験の流れの概要のまとめを、図４および５に示す。

簡単に述べれば、図４に示すように、１５μＭのＤＮＡオリゴヌクレオチドを、Ａｍｅｒｓｈａｍ’ＣｏｄｅＬｉｎｋ’ガラススライド上に沈着（プリント）し、十分に輪郭を示す「スポット」を作製した。これらのスライドを、調査疎水性ポリマー化学物質（ｃｈｅｍｉｓｔｒｙ）で被覆し、Ｃ６−アミン修飾を介してＤＮＡオリゴヌクレオチドの５’末端に共有結合する活性な３次元表面を作製する。この結合により、全長ＤＮＡオリゴヌクレオチドをｃＤＮＡとのハイブリッド形成に利用可能であり、より低いバックグラウンド、高感度、および再現性も得られることを確実にする。

図５は、マイクロアレイ実験の実施方法を示す。左側および右側のステージを、任意選択的に、ステージ４（ハイブリッド形成）まで任意の順序（並行を含む）で行うことができることに留意すべきである。簡単に述べれば、左側では、標的オリゴヌクレオチドを顕微鏡用のガラススライド（任意選択的に他の材料を使用することができる）上にスポッティングしてスポッティングスライドを形成する（ステージ１）。右側では、コントロールサンプルＲＮＡおよび癌サンプルＲＮＡを、それぞれＣｙ３およびＣｙ５標識して（ステージ２）、標識プローブを形成する。コントロールおよび癌サンプルは、対応する組織に由来する（例えば、正常な前立腺組織および癌性前立腺組織）ことに留意すべきである。さらに、ＲＮＡが採取された組織を、以下の「チップ」（マイクロアレイ）からのオリゴヌクレオチドの過剰発現に関する特定のクラスターについてのデータの特定の例に示す（例えば、癌性前立腺組織および正常組織を上記のように試験したチップについては「前立腺」）。ステージ３では、プローブを混合する。ステージ４では、ハイブリッド形成を行って、プロセシングしたスライドを形成する。ステージ５では、スライドを洗浄し、スキャンして画像ファイルを作成し、その後、ステージ６でデータを分析した。

以下のクラスターが、肺癌で過剰発現することが見出された。
W60282_PEA_1
F05068_PEA_1
H38804_PEA_1
HSENA78
T39971
(R00299)
H14624
Z41644_PEA_1
Z25299_PEA_2
HSSTROL3
HUMTREFAC_PEA_2
HSS100PCB
HSU33147_PEA_1
HUMCA1XIA
H61775
HUMGRP5E
HUMODCA
AA161187
R66178
D56406_PEA_1
M85491_PEA_1
Z21368_PEA_1
HUMCA1XIA
R20779
R38144_PEA_2
Z44808_PEA_1
HUMOSTRO_PEA_1_PEA_1
R11723_PEA_3
AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1
R16276_PEA_1

以下のクラスターが、肺小細胞癌で過剰発現することが見出された。

H61775
HUMGRP5E
M85491_PEA_1
Z44808_PEA_1
AA161187
R66178
HUMPHOSLIP_PEA_2

AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1

以下のクラスターが、肺腺癌で過剰発現することが見出された。
R00299
M85491_PEA_1
Z21368_PEA_1
HUMCA1XIA
AA161187
R66178
T11628_PEA_1

以下のクラスターが、肺扁平上皮細胞で過剰発現することが見出された。
HUMODCA
R00299
D56406_PEA_1
Z44808_PEA_1
Z21368_PEA_1
HUMCA1XIA
AA161187
R66178
HUMCEA_PEA_1
R35137_PEA_1_PEA_1_PEA_1

クラスターＨ６１７７５についての説明
クラスターＨ６１７７５は、目的の２つの転写物および６つのセグメントを特徴とし、その名称を、それぞれ表４および５に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表６に示す。

クラスターＨ６１７７５を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図６のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図６および表７中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：脳悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。

上記のように、コンティグＨ６１７７５は、上記の表３に示した２つの転写物を特徴とする。本発明の各変異タンパク質の説明を、ここに示す。

本発明の変異タンパク質Ｈ６１７７５＿Ｐ１６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ６１７７５＿Ｔ２１によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｈ６１７７５＿Ｐ１６とＱ９Ｐ２Ｊ２（配列番号１６９４）との比較の報告
１．Ｑ９Ｐ２Ｊ２のアミノ酸１１〜９３に対応し、Ｈ６１７７５＿Ｐ１６のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ６１７７５＿Ｐ１６のアミノ酸８４〜１５２に対応する配列ＤＣＧＦＰＡＦＲＥＬＫＲＡＥＴＶＳＰＶＦＦＴＲＲＣＩＷＥＤＬＫＳＴＧＦＳＰＡＧＧＧＲＰＰＧＧＧＰＲＴＱＥＤＳＧＬＰＣＷＲＳＳＣＳＶＴＬＱＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ６１７７５＿Ｐ１６をコードする単離キメラポリペプチド。

２．Ｈ６１７７５＿Ｐ１６中の配列ＤＣＧＦＰＡＦＲＥＬＫＲＡＥＴＶＳＰＶＦＦＴＲＲＣＩＷＥＤＬＫＳＴＧＦＳＰＡＧＧＧＲＰＰＧＧＧＰＲＴＱＥＤＳＧＬＰＣＷＲＳＳＣＳＶＴＬＱＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ６１７７５＿Ｐ１６のテールをコードする単離ポリペプチド。

Ｈ６１７７５＿Ｐ１６とＡＡＱ８８４９５（配列番号１６９５）との比較の報告
１．ＡＡＱ８８４９５のアミノ酸１〜８３に対応し、Ｈ６１７７５＿Ｐ１６のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ６１７７５＿Ｐ１６のアミノ酸８４〜１５２に対応する配列ＤＣＧＦＰＡＦＲＥＬＫＲＡＥＴＶＳＰＶＦＦＴＲＲＣＩＷＥＤＬＫＳＴＧＦＳＰＡＧＧＧＲＰＰＧＧＧＰＲＴＱＥＤＳＧＬＰＣＷＲＳＳＣＳＶＴＬＱＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ６１７７５＿Ｐ１６をコードする単離キメラポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｈ６１７７５＿Ｐ１６はまた、表９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ６１７７５＿Ｐ１６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｈ６１７７５＿Ｐ１６は、以下の転写物によってコードされる：Ｈ６１７７５＿Ｔ２１（配列は出願書類の最後に示す）。転写物Ｈ６１７７５＿Ｔ２１のコード部分を太字で示し、このコード部分は２６１位から開始され、７１６位で終結する。転写物はまた、表１０に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ６１７７５＿Ｐ１６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｈ６１７７５＿Ｐ１７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ６１７７５＿Ｔ２２によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｈ６１７７５＿Ｐ１７とＱ９Ｐ２Ｊ２との比較の報告
１．Ｑ９Ｐ２Ｊ２のアミノ酸１１〜９３に対応し、Ｈ６１７７５＿Ｐ１７のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｈ６１７７５＿Ｐ１７をコードする単離キメラポリペプチド。

Ｈ６１７７５＿Ｐ１７とＡＡＱ８８４９５との比較の報告
１．ＡＡＱ８８４９５のアミノ酸１〜８３に対応し、Ｈ６１７７５＿Ｐ１７のアミノ酸１〜８３にも対応するＭＶＷＣＬＧＬＡＶＬＳＬＶＩＳＱＧＡＤＧＲＧＫＰＥＶＶＳＶＶＧＲＡＧＥＳＶＶＬＧＣＤＬＬＰＰＡＧＲＰＰＬＨＶＩＥＷＬＲＦＧＦＬＬＰＩＦＩＱＦＧＬＹＳＰＲＩＤＰＤＹＶＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｈ６１７７５＿Ｐ１７をコードする単離キメラポリペプチド。

変異タンパク質Ｈ６１７７５＿Ｐ１７はまた、表１１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ６１７７５＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｈ６１７７５＿Ｐ１７は、以下の転写物によってコードされる：Ｈ６１７７５＿Ｔ２２（配列は出願書類の最後に示す）。転写物Ｈ６１７７５＿Ｔ２２のコード部分を太字で示し、このコード部分は２６１位から開始され、５０９位で終結する。転写物はまた、表１２に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ６１７７５＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨ６１７７５は、上の表４に列挙した６つのセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨ６１７７５＿ｎｏｄｅ＿２は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ６１７７５＿Ｔ２１およびＨ６１７７５＿Ｔ２２。以下の表１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ６１７７５＿ｎｏｄｅ＿４は、２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ６１７７５＿Ｔ２１およびＨ６１７７５＿Ｔ２２。以下の表１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ６１７７５＿ｎｏｄｅ＿６は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ６１７７５＿Ｔ２２。以下の表１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ６１７７５＿ｎｏｄｅ＿８は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ６１７７５＿Ｔ２１。以下の表１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約１２０ｂｐ長までであり、それにより、個別の説明に含まれる。

本発明のセグメントクラスターＨ６１７７５＿ｎｏｄｅ＿０は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ６１７７５＿Ｔ２１およびＨ６１７７５＿Ｔ２２。以下の表１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ６１７７５＿ｎｏｄｅ＿５を、以下の転写物中に見出すことができる：Ｈ６１７７５＿Ｔ２２。以下の表１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、この遺伝子のマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表１９に示す）。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/Psw0RJLCti/aLAXQjXh07:Q9P2J2

Sequence documentation:

Alignment of: H61775_P16 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
11 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 60
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93

Sequence name: /tmp/Psw0RJLCti/aLAXQjXh07:AAQ88495

Sequence documentation:

Alignment of: H61775_P16 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83

Sequence name: /tmp/naab8yR3GC/pSM4l2IL5o:Q9P2J2

Sequence documentation:

Alignment of: H61775_P17 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
11 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 60
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93

Sequence name: /tmp/naab8yR3GC/pSM4l2IL5o:AAQ88495

Sequence documentation:

Alignment of: H61775_P17 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83

正常および癌性肺組織における配列名Ｈ６１７７５ｓｅｇ８中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー９のＨ６１７７５転写物の発現
ｓｅｇ８、Ｈ６１７７５ｓｅｇ８アンプリコン（配列番号１６３６）、およびＨ６１７７５ｓｅｇ８Ｆ２（配列番号１６３４）、およびＨ６１７７５ｓｅｇ８Ｒ２（配列番号１６３５）プライマーによって検出可能な免疫グロブリンスーパーファミリーメンバー９の転写物を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子–ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン（配列番号３３４）、プライマーの配列番号３３２および３３３）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン– ＨＰＲＴ１−アンプリコン（配列番号１２９７）、プライマーの配列番号１２９５および１２９６）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン– ユビキチン−アンプリコン（配列番号３２８）、プライマーの配列番号３２６および３２７）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン– ＳＤＨＡ−アンプリコン（配列番号３３１）、プライマーの配列番号３２９および３３０）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図７は、正常サンプルと比較した癌性肺サンプルにおける上記免疫グロブリンスーパーファミリーメンバー９の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも５倍の過剰発現を示すサンプルの数および比率を、下に示す。

図７から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー９転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち１１個、１６個の扁平上皮細胞癌サンプルのうち１２個、４個の大細胞癌サンプルのうち１個、８個の小細胞癌サンプルのうち８個で少なくとも５倍の過剰発現が見出された。

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー９転写物の発現レベルの相違についてのＰ値を、Ｔ検定によって６．５Ｅ−０２と決定された。腺癌では、最小値は、扁平上皮細胞癌で７．６２Ｅ−０３であり、小細胞癌で１．５Ｅ−０３であった。

５倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、Ｐ値は、腺癌で９．６２Ｅ−０４、扁平上皮細胞癌で５．９Ｅ−０４であり、１０倍過剰発現の閾値は、小細胞癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は７．１４Ｅ−０５であった。上記値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｈ６１７７５ｓｅｇ８Ｆ２順方向プライマーおよびＨ６１７７５ｓｅｇ８Ｒ２逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｈ６１７７５ｓｅｇ８。

Ｈ６１７７５ｓｅｇ８Ｆ２（配列番号１６３４）
ＧＡＡＧＧＣＴＣＴＴＧＴＣＡＣＴＴＡＣＴＡＧＣＣＡＴ
Ｈ６１７７５ｓｅｇ８Ｒ２（配列番号１６３５）
ＴＧＴＣＡＣＣＡＴＡＴＴＴＡＡＴＣＣＴＣＣＣＡＡ
Ｈ６１７７５ｓｅｇ８（配列番号１６３６）
ＧＡＡＧＧＣＴＣＴＴＧＴＣＡＣＴＴＡＣＴＡＧＣＣＡＴＧＴＧＡＴＴＴＴＧＧＡＡＡＧＡＡＡＣＴＴＡＡＣＡＴＴＡＡＴＴＣＣＴＴＣＡＧＣＴＡＣＡＡＴＧＧＡＡＴＴＣＴＴＧＧＧＡＧＧＡＴＴＡＡＡＴＡＴＧＧＴＧＡＣＡ

異なる正常組織における配列名Ｈ６１７７５ｓｅｇ８中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー９のＨ６１７７５転写物の発現
Ｈ６１７７５ｓｅｇ８アンプリコン（配列番号１６３６）、Ｈ６１７７５ｓｅｇ８Ｆ２（配列番号１６３４）、およびＨ６１７７５ｓｅｇ８Ｒ２（配列番号１６３５）によって検出可能な免疫グロブリンスーパーファミリーメンバー９の転写物を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン（配列番号１６３０））、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン（配列番号１６３３））、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９；アンプリコン–ユビキチン−アンプリコン（配列番号３２８））、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８；アンプリコン–ＳＤＨＡ−アンプリコン（配列番号３３１））を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、卵巣サンプル（サンプル番号１８〜２０、表４、「正常パネル中の組織サンプル」）の量の中央値で割って、卵巣サンプルに対する各サンプルの相対発現値を得た。

結果を図８に示し、これは、異なる正常組織における配列名Ｈ６１７７５ｓｅｇ８中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー９のＨ６１７７５転写物の発現を示す。

クラスターＭ８５４９１の説明
クラスターＭ８５４９１は、目的の２つの転写物および１１個のセグメントを特徴とし、その名称を、それぞれ表２０および２１に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表２２に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質ＥｐｈｒｉｎＢ型受容体２（前駆体）（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＥＰＢ２＿ＨＵＭＡＮ、同義語ＥＣ２．７．１．１１２、チロシン−タンパク質キナーゼ受容体ＥＰＨ−３、ＤＲＴ、受容体タンパク質−チロシンキナーゼＨＥＫ５、ＥＲＫとしても公知である）（配列番号１４１７）の変異型である。

タンパク質ＥｐｈｒｉｎＢ型受容体２（前駆体）は、以下の機能を有することが公知であるか、そのように見なされている：ｅｐｈｒｉｎ−Ｂファミリーメンバーの受容体。タンパク質ＥｐｈｒｉｎＢ型受容体２（前駆体）の配列を、「タンパク質ＥｐｈｒｉｎＢ型受容体２（前駆体）アミノ酸配列」（配列番号１４１７）として出願書類の最後に示す。この配列の公知の多型を、表２３に示す。

局在化したタンパク質ＥｐｈｒｉｎＢ型受容体２（前駆体）は、Ｉ型膜タンパク質と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるタンパク質アミノ酸リン酸化、膜貫通受容体タンパク質チロシンキナーゼシグナル伝達経路、ニューロン新生、分子機能に関連する注釈付けであるタンパク質チロシンキナーゼ、受容体、膜貫通エフリン受容体、ＡＴＰ結合、トランスフェラーゼ、および細胞成分に関連する注釈付けである内在性膜タンパク質。

ＧＯ割り当ては、１つまたは複数のｈｔｔｐ：／／ｗｗｗ．ｅｘｐａｓｙ．ｃｈ／ｓｐｒｏｔ／から利用可能なＳｗｉｓｓＰｒｏｔ／ＴｒｅｍＢｌＰｒｏｔｅｉｎｋｎｏｗｌｅｄｇｅｂａｓｅまたはｈｔｔｐ：／／ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｐｒｏｊｅｃｔｓ／ＬｏｃｕｓＬｉｎｋ／から利用可能なＬｏｃｕｓｌｉｎｋに依存する。

クラスターＭ８５４９１を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図９のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図９および表２４中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。

上記のように、クラスターＭ８５４９１は、上の表２０に列挙した２つの転写物を特徴とする。これらの転写物は、タンパク質ＥｐｈｒｉｎＢ型受容体２（前駆体）の変異型であるタンパク質をコードする。本発明の各変異型の説明をここに記載する。

本発明の変異タンパク質Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６によってコードされる。公知のタンパク質（ＥｐｈｒｉｎＢ型受容体２（前駆体））に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３とＥＰＢ２＿ＨＵＭＡＮとの間の比較の報告
１．ＥＰＢ２＿ＨＵＭＡＮのアミノ酸１〜４７６に対応し、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３のアミノ酸１〜４７６にも対応するＭＡＬＲＲＬＧＡＡＬＬＬＬＰＬＬＡＡＶＥＥＴＬＭＤＳＴＴＡＴＡＥＬＧＷＭＶＨＰＰＳＧＷＥＥＶＳＧＹＤＥＮＭＮＴＩＲＴＹＱＶＣＮＶＦＥＳＳＱＮＮＷＬＲＴＫＦＩＲＲＲＧＡＨＲＩＨＶＥＭＫＦＳＶＲＤＣＳＳＩＰＳＶＰＧＳＣＫＥＴＦＮＬＹＹＹＥＡＤＦＤＳＡＴＫＴＦＰＮＷＭＥＮＰＷＶＫＶＤＴＩＡＡＤＥＳＦＳＱＶＤＬＧＧＲＶＭＫＩＮＴＥＶＲＳＦＧＰＶＳＲＳＧＦＹＬＡＦＱＤＹＧＧＣＭＳＬＩＡＶＲＶＦＹＲＫＣＰＲＩＩＱＮＧＡＩＦＱＥＴＬＳＧＡＥＳＴＳＬＶＡＡＲＧＳＣＩＡＮＡＥＥＶＤＶＰＩＫＬＹＣＮＧＤＧＥＷＬＶＰＩＧＲＣＭＣＫＡＧＦＥＡＶＥＮＧＴＶＣＲＧＣＰＳＧＴＦＫＡＮＱＧＤＥＡＣＴＨＣＰＩＮＳＲＴＴＳＥＧＡＴＮＣＶＣＲＮＧＹＹＲＡＤＬＤＰＬＤＭＰＣＴＴＩＰＳＡＰＱＡＶＩＳＳＶＮＥＴＳＬＭＬＥＷＴＰＰＲＤＳＧＧＲＥＤＬＶＹＮＩＩＣＫＳＣＧＳＧＲＧＡＣＴＲＣＧＤＮＶＱＹＡＰＲＱＬＧＬＴＥＰＲＩＹＩＳＤＬＬＡＨＴＱＹＴＦＥＩＱＡＶＮＧＶＴＤＱＳＰＦＳＰＱＦＡＳＶＮＩＴＴＮＱＡＡＰＳＡＶＳＩＭＨＱＶＳＲＴＶＤＳＩＴＬＳＷＳＱＰＤＱＰＮＧＶＩＬＤＹＥＬＱＹＹＥＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３のアミノ酸４７７〜４９６に対応する配列ＶＰＩＧＷＶＬＳＰＳＰＴＳＬＲＡＰＬＰＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３をコードする単離キメラポリペプチド。

２．Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３中の配列ＶＰＩＧＷＶＬＳＰＳＰＴＳＬＲＡＰＬＰＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３は、以下の転写物によってコードされる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６（配列は出願書類の最後に示す）。転写物Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６のコード部分を太字で示し、このコード部分は１４３位から開始され、１６３０位で終結する。転写物はまた、表２６に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ２０によってコードされる。公知のタンパク質（ＥｐｈｒｉｎＢ型受容体２（前駆体））に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４とＥＰＢ２＿ＨＵＭＡＮとの間の比較の報告
１．ＥＰＢ２＿ＨＵＭＡＮのアミノ酸１〜２７０に対応し、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のアミノ酸１〜２７０にも対応するＭＡＬＲＲＬＧＡＡＬＬＬＬＰＬＬＡＡＶＥＥＴＬＭＤＳＴＴＡＴＡＥＬＧＷＭＶＨＰＰＳＧＷＥＥＶＳＧＹＤＥＮＭＮＴＩＲＴＹＱＶＣＮＶＦＥＳＳＱＮＮＷＬＲＴＫＦＩＲＲＲＧＡＨＲＩＨＶＥＭＫＦＳＶＲＤＣＳＳＩＰＳＶＰＧＳＣＫＥＴＦＮＬＹＹＹＥＡＤＦＤＳＡＴＫＴＦＰＮＷＭＥＮＰＷＶＫＶＤＴＩＡＡＤＥＳＦＳＱＶＤＬＧＧＲＶＭＫＩＮＴＥＶＲＳＦＧＰＶＳＲＳＧＦＹＬＡＦＱＤＹＧＧＣＭＳＬＩＡＶＲＶＦＹＲＫＣＰＲＩＩＱＮＧＡＩＦＱＥＴＬＳＧＡＥＳＴＳＬＶＡＡＲＧＳＣＩＡＮＡＥＥＶＤＶＰＩＫＬＹＣＮＧＤＧＥＷＬＶＰＩＧＲＣＭＣＫＡＧＦＥＡＶＥＮＧＴＶＣＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のアミノ酸２７１〜３０１に対応する配列ＥＲＱＤＬＴＭＬＳＲＬＶＬＮＳＷＰＱＭＩＬＰＰＱＰＰＫＶＬＥＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチド。

２．Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４中の配列ＥＲＱＤＬＴＭＬＳＲＬＶＬＮＳＷＰＱＭＩＬＰＰＱＰＰＫＶＬＥＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４は、以下の転写物によってコードされる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ２０（配列は出願書類の最後に示す）。転写物Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ２０のコード部分を太字で示し、このコード部分は１４３位から開始され、１０４５位で終結する。転写物はまた、表２７に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ８５４９１＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＭ８５４９１は、上の表２１に列挙した１１個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６およびＭ８５４９１＿ＰＥＡ＿１＿Ｔ２０。以下の表２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ２０。以下の表２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、１８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６。以下の表３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、１８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６。以下の表３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６。以下の表３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６およびＭ８５４９１＿ＰＥＡ＿１＿Ｔ２０。以下の表３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表３４に示す）。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６およびＭ８５４９１＿ＰＥＡ＿１＿Ｔ２０。以下の表３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６およびＭ８５４９１＿ＰＥＡ＿１＿Ｔ２０。以下の表３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６。以下の表３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６。以下の表３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ８５４９１＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ８５４９１＿ＰＥＡ＿１＿Ｔ１６およびＭ８５４９１＿ＰＥＡ＿１＿Ｔ２０。以下の表３９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/qfmsU9VtxS/DylcLC9j8v:EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P13 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 4726.00 Escore: 0
Matching length: 476 Total length: 476
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. . . . .
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
. . . . .
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
. . . . .
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
. . . . .
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
. .
451 SITLSWSQPDQPNGVILDYELQYYEK 476
||||||||||||||||||||||||||
451 SITLSWSQPDQPNGVILDYELQYYEK 476

Sequence name: /tmp/rmnzuDbot6/GiHbjeU8iR:EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P14 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 2673.00 Escore: 0
Matching length: 270 Total length: 270
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. .
251 IGRCMCKAGFEAVENGTVCR 270
||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCR 270

正常および癌性肺組織における配列名Ｍ８５４９１ｓｅｇ２４中に示すアンプリコンによって検出可能なエフリンＢ型受容体２前駆体（ＥＣ２．７．１．１１２）（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）Ｍ８５４９転写物の発現
ｓｅｇ２４、Ｍ８５４９１ｓｅｇ２４アンプリコン（配列番号１６３９）、Ｍ８５４９１ｓｅｇ２４Ｆ（配列番号１６３７）、およびＭ８５４９１ｓｅｇ２４Ｒ（配列番号１６３８）プライマーによって検出可能なエフリンＢ型受容体２前駆体（ＥＣ２．７．１．１１２）（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

以下の図１０は、正常サンプルと比較した癌性肺サンプルにおける上記のエフリンＢ型受容体２前駆体（ＥＣ２．７．１．１１２）（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。試験した全サンプル数のうちの少なくとも３倍の過剰発現を示すサンプルの数および比率を下に示す。

図１０から明らかなように、上記アンプリコン癌サンプルによって検出可能なエフリンＢ型受容体２前駆体（ＥＣ２．７．１．１１２）（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち９個および８個の小細胞癌サンプルのうち４個で少なくとも３倍の過剰発現が見出された。

下記のように、これらの結果の有意性を検証するために、統計分析に適用した。

３倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、腺癌で７．４２Ｅ−０３、小細胞癌で５．６９Ｅ−０２であった。上記値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｍ８５４９１ｓｅｇ２４Ｆ順方向プライマーおよびＭ８５４９１ｓｅｇ２４Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｍ８５４９１ｓｅｇ２４。

Ｍ８５４９１ｓｅｇ２４Ｆ（配列番号１６３７）−ＧＧＣＧＴＣＴＴＴＣＴＣＣＣＴＣＴＧＡＡＣ
Ｍ８５４９１ｓｅｇ２４Ｒ（配列番号１６３８）−ＧＴＣＣＣＡＴＴＣＴＧＧＧＴＧＣＴＧＴＧ
Ｍ８５４９１ｓｅｇ２４（配列番号１６３９）–ＧＧＣＧＴＣＴＴＴＣＴＣＣＣＴＣＴＧＡＡＣＣＴＣＡＧＴＴＴＣＣＡＣＣＴＧＴＧＴＣＧＡＧＴＧＴＧＧＧＴＧＡＧＡＣＣＣＣＴＣＧＣＧＧＧＧＡＧＣＴＡＴＧＣＡＧＧＴＴＡＣＧＧＡＧＡＡＡＡＧＧＣＡＧＣＡＣＡＧＣＡＣＣＣＡＧＡＡＴＧＧＧＡＣ

異なる正常組織における配列名Ｍ８５４９１ｓｅｇ２４中に示すアンプリコンによって検出可能なエフリンＢ型受容体２前駆体（ＥＣ２．７．１．１１２）（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）Ｍ８５４９転写物の発現
Ｍ８５４９１ｓｅｇ２４アンプリコン（配列番号１６３９）、Ｍ８５４９１ｓｅｇ２４Ｆ（配列番号１６３７）、およびＭ８５４９１ｓｅｇ２４Ｒ（配列番号１６３８）によって検出可能なエフリンＢ型受容体２前駆体転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン，配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン，配列番号１６３３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８；アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、肺サンプル（上記のサンプル番号１５〜１７、表２、「正常パネル中の組織サンプル」）の量の中央値で割って、肺サンプルに対する各サンプルの相対発現値を得た。

図１１に示す結果は、異なる正常組織における配列名Ｍ８５４９１ｓｅｇ２４中に示された、アンプリコンによって検出可能なエフリンＢ型受容体２前駆体（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）Ｍ８５４９１転写物の発現を示す。

クラスターＴ３９９７１の説明
クラスターＴ３９９７１は、目的の４つの転写物および２８個のセグメントを特徴とし、その名称を、それぞれ表４０および４１に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表４２に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるビトロネクチン前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＶＴＮＣ＿ＨＵＭＡＮ、同義語血清核酸因子；Ｓ−タンパク質；Ｖ７５としても公知である）（配列番号１４１８）の変異型である。

タンパク質ビトロネクチン前駆体は、以下の機能を有することが公知であるか、そのように見なされている：ビトロネクチンは、血清および組織で見出される細胞接着および核酸因子である。ビトロネクチンは、グリコサミノグリカンおよびプロテオグリカンと相互作用する。インテグリンファミリーの一定のメンバーによって認識されて、細胞−基質接着分子としての機能を果たす。末端細胞溶解性補体経路の膜障害効果のインヒビター。タンパク質ビトロネクチン前駆体の配列を、「ビトロネクチン前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表４に示す。

タンパク質ビトロネクチン前駆体の局在化は、細胞外と考えられる。

以前に公知のタンパク質はまた、以下の適応症および／または潜在的治療用途を有する：癌、黒色腫。ヒトにおける臨床／治療用途（例えば、抗体または小分子の標的として、および／または直接的な治療として）が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である：αβ３インテグリンアンタゴニスト、アポトーシスアゴニスト。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する（抗癌薬）ために使用するか使用することができる薬物データベースまたは公的なデータベース（例えば、上記）に情報が存在するので、クラスターをこの分野に割り当てた。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである免疫応答、細胞接着、分子機能に関連する注釈付けであるタンパク質結合、ヘパリン結合、および細胞成分に関連する注釈付けである細胞外空間。

クラスターＴ３９９７１を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図１２のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図１２および表４４中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：肝臓癌、肺悪性腫瘍、および膵臓癌。

上記のように、クラスターＴ３９９７１は、上の表４０に列挙した４つの転写物を特徴とする。これらの転写物は、ビトロネクチン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｔ３９９７１＿Ｐ６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ３９９７１＿Ｔ５によってコードされる。公知のタンパク質（ビトロネクチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ３９９７１＿Ｐ６とＶＴＮＣ＿ＨＵＭＡＮとの間の比較の報告
１．ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜２７６に対応し、Ｔ３９９７１＿Ｐ６のアミノ酸１〜２７６にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ３９９７１＿Ｐ６のアミノ酸２７７〜２８３に対応する配列ＴＱＧＶＶＧＤを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ６をコードする単離キメラポリペプチド。

２．Ｔ３９９７１＿Ｐ６中の配列ＴＱＧＶＶＧＤと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ３９９７１＿Ｐ６のテールをコードする単離ポリペプチド。

変異タンパク質Ｔ３９９７１＿Ｐ６はまた、表４６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ３９９７１＿Ｐ６は、以下の転写物によってコードされる：Ｔ３９９７１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｔ３９９７１＿Ｔ５のコード部分を太字で示し、このコード部分は７５６位から開始され、１６０４位で終結する。転写物はまた、表４７に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ３９９７１＿Ｐ９は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ３９９７１＿Ｔ１０によってコードされる。公知のタンパク質（ビトロネクチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ３９９７１＿Ｐ９とＶＴＮＣ＿ＨＵＭＡＮとの間の比較の報告
１．ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜３２５に対応し、Ｔ３９９７１＿Ｐ９のアミノ酸１〜３２５にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧＫＱＹＷＥＹＱＦＱＨＱＰＳＱＥＥＣＥＧＳＳＬＳＡＶＦＥＨＦＡＭＭＱＲＤＳＷＥＤＩＦＥＬＬＦＷＧＲＴと少なくとも９０％相同な第１のアミノ酸配列と、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸３５７〜４７８に対応し、Ｔ３９９７１＿Ｐ９のアミノ酸３２６〜４４７にも対応するＳＧＭＡＰＲＰＳＬＡＫＫＱＲＦＲＨＲＮＲＫＧＹＲＳＱＲＧＨＳＲＧＲＮＱＮＳＲＲＰＳＲＡＴＷＬＳＬＦＳＳＥＥＳＮＬＧＡＮＮＹＤＤＹＲＭＤＷＬＶＰＡＴＣＥＰＩＱＳＶＦＦＦＳＧＤＫＹＹＲＶＮＬＲＴＲＲＶＤＴＶＤＰＰＹＰＲＳＩＡＱＹＷＬＧＣＰＡＰＧＨＬと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ９をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＴＳを含み、以下の構造：アミノ酸番号３２５−ｘ〜３２５のいずれかから始まり、アミノ酸番号３２６＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｔ３９９７１＿Ｐ９の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｔ３９９７１＿Ｐ９はまた、表４８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ３９９７１＿Ｐ９は、以下の転写物によってコードされる：Ｔ３９９７１＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｔ３９９７１＿Ｔ１０のコード部分を太字で示し、このコード部分は７５６位から開始され、２０９６位で終結する。転写物はまた、表４９に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ３９９７１＿Ｐ１１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ３９９７１＿Ｔ１２によってコードされる。公知のタンパク質（ビトロネクチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ３９９７１＿Ｐ１１とＶＴＮＣ＿ＨＵＭＡＮとの間の比較の報告
１．ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜３２６に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸１〜３２６にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧＫＱＹＷＥＹＱＦＱＨＱＰＳＱＥＥＣＥＧＳＳＬＳＡＶＦＥＨＦＡＭＭＱＲＤＳＷＥＤＩＦＥＬＬＦＷＧＲＴＳと少なくとも９０％相同な第１のアミノ酸配列と、ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸４４２〜４７８に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸３２７〜３６３にも対応するＤＫＹＹＲＶＮＬＲＴＲＲＶＤＴＶＤＰＰＹＰＲＳＩＡＱＹＷＬＧＣＰＡＰＧＨＬと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１１をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＳＤを含み、以下の構造：アミノ酸番号３２６−ｘ〜３２６のいずれかから始まり、アミノ酸番号３２７＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｔ３９９７１＿Ｐ１１の縁部分をコードする単離キメラポリペプチド。

Ｔ３９９７１＿Ｐ１１とＱ９ＢＳＨ７（配列番号１６９６）との間の比較の報告
１．Ｑ９ＢＳＨ７のアミノ酸１〜３２６に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸１〜３２６にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫＧＳＱＹＷＲＦＥＤＧＶＬＤＰＤＹＰＲＮＩＳＤＧＦＤＧＩＰＤＮＶＤＡＡＬＡＬＰＡＨＳＹＳＧＲＥＲＶＹＦＦＫＧＫＱＹＷＥＹＱＦＱＨＱＰＳＱＥＥＣＥＧＳＳＬＳＡＶＦＥＨＦＡＭＭＱＲＤＳＷＥＤＩＦＥＬＬＦＷＧＲＴＳと少なくとも９０％相同な第１のアミノ酸配列と、Ｑ９ＢＳＨ７のアミノ酸４４２〜４７８に対応し、Ｔ３９９７１＿Ｐ１１のアミノ酸３２７〜３６３にも対応するＤＫＹＹＲＶＮＬＲＴＲＲＶＤＴＶＤＰＰＹＰＲＳＩＡＱＹＷＬＧＣＰＡＰＧＨＬと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１１をコードする単離キメラポリペプチド。

変異タンパク質Ｔ３９９７１＿Ｐ１１はまた、表５０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ３９９７１＿Ｐ１１は、以下の転写物によってコードされる：Ｔ３９９７１＿Ｔ１２（配列は出願書類の最後に示す）。転写物Ｔ３９９７１＿Ｔ１２のコード部分を太字で示し、このコード部分は７５６位から開始され、１８４４位で終結する。転写物はまた、表５１に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ３９９７１＿Ｐ１２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ３９９７１＿Ｔ１６によってコードされる。公知のタンパク質（ビトロネクチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ３９９７１＿Ｐ１２とＶＴＮＣ＿ＨＵＭＡＮとの間の比較の報告
１．ＶＴＮＣ＿ＨＵＭＡＮのアミノ酸１〜２２３に対応し、Ｔ３９９７１＿Ｐ１２のアミノ酸１〜２２３にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ３９９７１＿Ｐ１２のアミノ酸２２４〜２３８に対応する配列ＶＰＧＡＶＧＱＧＲＫＨＬＧＲＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１２をコードする単離キメラポリペプチド。

２．Ｔ３９９７１＿Ｐ１２中の配列ＶＰＧＡＶＧＱＧＲＫＨＬＧＲＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ３９９７１＿Ｐ１２のテールをコードする単離ポリペプチド。

Ｔ３９９７１＿Ｐ１２とＱ９ＢＳＨ７との間の比較の報告
１．Ｑ９ＢＳＨ７のアミノ酸１〜２２３に対応し、Ｔ３９９７１＿Ｐ１２のアミノ酸１〜２２３にも対応するＭＡＰＬＲＰＬＬＩＬＡＬＬＡＷＶＡＬＡＤＱＥＳＣＫＧＲＣＴＥＧＦＮＶＤＫＫＣＱＣＤＥＬＣＳＹＹＱＳＣＣＴＤＹＴＡＥＣＫＰＱＶＴＲＧＤＶＦＴＭＰＥＤＥＹＴＶＹＤＤＧＥＥＫＮＮＡＴＶＨＥＱＶＧＧＰＳＬＴＳＤＬＱＡＱＳＫＧＮＰＥＱＴＰＶＬＫＰＥＥＥＡＰＡＰＥＶＧＡＳＫＰＥＧＩＤＳＲＰＥＴＬＨＰＧＲＰＱＰＰＡＥＥＥＬＣＳＧＫＰＦＤＡＦＴＤＬＫＮＧＳＬＦＡＦＲＧＱＹＣＹＥＬＤＥＫＡＶＲＰＧＹＰＫＬＩＲＤＶＷＧＩＥＧＰＩＤＡＡＦＴＲＩＮＣＱＧＫＴＹＬＦＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ３９９７１＿Ｐ１２のアミノ酸２２４〜２３８に対応する配列ＶＰＧＡＶＧＱＧＲＫＨＬＧＲＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｔ３９９７１＿Ｐ１２をコードする単離キメラポリペプチド。

変異タンパク質Ｔ３９９７１＿Ｐ１２はまた、表５２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ３９９７１＿Ｐ１２は、以下の転写物によってコードされる：Ｔ３９９７１＿Ｔ１６（配列は出願書類の最後に示す）。転写物Ｔ３９９７１＿Ｔ１６のコード部分を太字で示し、このコード部分は７５６位から開始され、１４６９位で終結する。転写物はまた、表５３に列挙した以下のＳＮＰを有する（ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ３９９７１＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＴ３９９７１は、上の表４１に列挙した２８個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿０は、７６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１８は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１６。以下の表５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２１は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、およびＴ３９９７１＿Ｔ５。以下の表５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２２は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ５。以下の表５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２３は、１０１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、およびＴ３９９７１＿Ｔ５。以下の表５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３１は、９４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０およびＴ３９９７１＿Ｔ５。以下の表５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３３は、７７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、およびＴ３９９７１＿Ｔ５。以下の表６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿７は、８７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１０は、７７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１１は、７９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１２を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１５は、７９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１６を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿１７は、８６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２６は、８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ５。以下の表６９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２７は、９０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ５。以下の表７０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２８を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０およびＴ３９９７１＿Ｔ５。以下の表７１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿２９は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０およびＴ３９９７１＿Ｔ５。以下の表７２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３は、７８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表７３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３０を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０およびＴ３９９７１＿Ｔ５。以下の表７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３４を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、およびＴ３９９７１＿Ｔ５。以下の表７５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３５を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、およびＴ３９９７１＿Ｔ５。以下の表７６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿３６は、５１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、およびＴ３９９７１＿Ｔ５。以下の表７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿４を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿５は、８０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿８を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ３９９７１＿ｎｏｄｅ＿９を、以下の転写物中に見出すことができる：Ｔ３９９７１＿Ｔ１０、Ｔ３９９７１＿Ｔ１２、Ｔ３９９７１＿Ｔ１６、およびＴ３９９７１＿Ｔ５。以下の表８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/xkraCL2OcZ/43L7YcPH7x:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P6 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2774.00 Escore: 0
Matching length: 278 Total length: 278
Matching Percent Similarity: 99.64 Matching Percent Identity: 99.64
Total Percent Similarity: 99.64 Total Percent Identity: 99.64
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. .
251 PDNVDAALALPAHSYSGRERVYFFKGTQ 278
|||||||||||||||||||||||||| |
251 PDNVDAALALPAHSYSGRERVYFFKGKQ 278

Sequence name: /tmp/X4DeeuSlB4/yMubSR5FPs:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P9 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 4430.00 Escore: 0
Matching length: 447 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 93.51 Total Percent Identity: 93.51
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRT......................... 325
|||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 ......SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 369
||||||||||||||||||||||||||||||||||||||||||||
351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
370 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 419
||||||||||||||||||||||||||||||||||||||||||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
420 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 447
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478

Sequence name: /tmp/jvp1VtnxNy/wxNSeFVZZw:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P11 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478

Sequence name: /tmp/jvp1VtnxNy/wxNSeFVZZw:Q9BSH7

Sequence documentation:

Alignment of: T39971_P11 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAM 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478

Sequence name: /tmp/fgebv7ir4i/48bTBMziJ0:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P12 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223

Sequence name: /tmp/fgebv7ir4i/48bTBMziJ0:Q9BSH7

Sequence documentation:

Alignment of: T39971_P12 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223

クラスターＺ２１３６８の説明
クラスターＺ２１３６８は、目的の７つの転写物および３４個のセグメントを特徴とし、その名称を、それぞれ表８２および８３に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表８４に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である細胞外スルファターゼＳｕｌｆ−１前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＳＵＬ１＿ＨＵＭＡＮ、同義語はＥＣ３．１．６−、ＨＳｕｌｆ−１としても公知である）（配列番号１４１９）の変異型である。

タンパク質細胞外スルファターゼＳｕｌｆ−１前駆体は、以下の機能を有することが公知であるか、そのように見なされている：アリールスルファターゼ活性および高度に特異的なエンドグルコサミン−６−スルファターゼ活性を示す。これは、インタクトなヘパリンの特定の小区域内のグルコサミンのＣ−６位から硫酸塩を除去することができる。ＨＳＰＧ（ヘパラン硫酸プロテオグリカン）硫酸化を減少させ、ヘパリン依存性成長因子によるシグナル伝達を阻害し、増殖を減少させ、外因性刺激に対する応答のアポトーシスを容易にする。細胞外スルファターゼＳｕｌｆ−１前駆体の配列を、「細胞外スルファターゼＳｕｌｆ−１前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表８５に示す。

タンパク質細胞外スルファターゼＳｕｌｆ−１前駆体の局在化は、小胞体およびゴルジ層板と考えられる。細胞表面上にも局在化している（類似性による）。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるアポトーシス、代謝、ヘパラン硫酸プロテオグリカン代謝、分子機能に関連する注釈付けであるアリールスルファターゼ、ヒドロラーゼ、および細胞成分に関連する注釈付けである細胞外空間、小胞体、ゴルジ層板。

クラスターＺ２１３６８を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図１３のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図１３および表８６中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。

上記のように、クラスターＺ２１３６８は、上の表１に列挙した７つの転写物を特徴とする。これらの転写物は、タンパク質細胞外スルファターゼＳｕｌｆ−１前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５によってコードされる。公知のタンパク質（細胞外スルファターゼＳｕｌｆ−１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２とＳＵＬ１＿ＨＵＭＡＮとの比較の報告
１．ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜７６１に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜７６１にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のアミノ酸７６２〜７９０に対応する配列ＰＨＫＹＳＡＨＧＲＴＲＨＦＥＳＡＴＲＴＴＮＧＡＱＫＬＳＲＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２中の配列ＰＨＫＹＳＡＨＧＲＴＲＨＦＥＳＡＴＲＴＴＮＧＡＱＫＬＳＲＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５のコード部分を太字で示し、このコード部分は５２９位から開始され、２８９８位で終結する。

本発明の変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ９によってコードされる。公知のタンパク質（細胞外スルファターゼＳｕｌｆ−１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５とＱ７Ｚ２Ｗ２（配列番号１６９７）との比較の報告
１．Ｑ７Ｚ２Ｗ２のアミノ酸１〜５７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜５７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬと少なくとも９０％相同な第１のアミノ酸配列と、Ａを含む第２の架橋アミノ酸配列と、Ｑ７Ｚ２Ｗ２のアミノ酸１３９〜８７１に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸５９〜７９１にも対応するＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥＬＲＳＣＱＧＹＫＱＣＮＰＲＰＫＮＬＤＶＧＮＫＤＧＧＳＹＤＬＨＲＧＱＬＷＤＧＷＥＧと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＬＡＦを含み、以下の構造（Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５に対応する番号付け）：アミノ酸番号５７−ｘ〜５７のいずれかから始まり、アミノ酸番号５９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離ポリペプチド。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５とＡＡＨ１２９９７（配列番号１６９８）との比較の報告
１．Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜７５１に対応する配列ＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＡＨ１２９９７のアミノ酸１〜４０に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸７５２〜７９１にも対応するＬＲＳＣＱＧＹＫＱＣＮＰＲＰＫＮＬＤＶＧＮＫＤＧＧＳＹＤＬＨＲＧＱＬＷＤＧＷＥＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の配列ＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５の先端をコードする単離ポリペプチド。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５とＳＵＬ１＿ＨＵＭＡＮとの比較の報告
１．ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜５７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜５７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬと少なくとも９０％相同な第１のアミノ酸配列と、ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１３８〜８７１に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５のアミノ酸５８〜７９１にも対応するＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧＫＦＬＲＫＫＥＥＳＳＫＮＩＱＱＳＮＨＬＰＫＹＥＲＶＫＥＬＣＱＱＡＲＹＱＴＡＣＥＱＰＧＱＫＷＱＣＩＥＤＴＳＧＫＬＲＩＨＫＣＫＧＰＳＤＬＬＴＶＲＱＳＴＲＮＬＹＡＲＧＦＨＤＫＤＫＥＣＳＣＲＥＳＧＹＲＡＳＲＳＱＲＫＳＱＲＱＦＬＲＮＱＧＴＰＫＹＫＰＲＦＶＨＴＲＱＴＲＳＬＳＶＥＦＥＧＥＩＹＤＩＮＬＥＥＥＥＥＬＱＶＬＱＰＲＮＩＡＫＲＨＤＥＧＨＫＧＰＲＤＬＱＡＳＳＧＧＮＲＧＲＭＬＡＤＳＳＮＡＶＧＰＰＴＴＶＲＶＴＨＫＣＦＩＬＰＮＤＳＩＨＣＥＲＥＬＹＱＳＡＲＡＷＫＤＨＫＡＹＩＤＫＥＩＥＡＬＱＤＫＩＫＮＬＲＥＶＲＧＨＬＫＲＲＫＰＥＥＣＳＣＳＫＱＳＹＹＮＫＥＫＧＶＫＫＱＥＫＬＫＳＨＬＨＰＦＫＥＡＡＱＥＶＤＳＫＬＱＬＦＫＥＮＮＲＲＲＫＫＥＲＫＥＫＲＲＱＲＫＧＥＥＣＳＬＰＧＬＴＣＦＴＨＤＮＮＨＷＱＴＡＰＦＷＮＬＧＳＦＣＡＣＴＳＳＮＮＮＴＹＷＣＬＲＴＶＮＥＴＨＮＦＬＦＣＥＦＡＴＧＦＬＥＹＦＤＭＮＴＤＰＹＱＬＴＮＴＶＨＴＶＥＲＧＩＬＮＱＬＨＶＱＬＭＥＬＲＳＣＱＧＹＫＱＣＮＰＲＰＫＮＬＤＶＧＮＫＤＧＧＳＹＤＬＨＲＧＱＬＷＤＧＷＥＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＬＡを含み、以下の構造：アミノ酸番号５７−ｘ〜５７のいずれかから始まり、アミノ酸番号５８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ９（配列は出願書類の最後に示す）。転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ９のコード部分を太字で示し、このコード部分は５５６位から開始され、２９２８位で終結する。

本発明の変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３によってコードされる。公知のタンパク質（細胞外スルファターゼＳｕｌｆ−１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５とＳＵＬ１＿ＨＵＭＡＮとの比較の報告
１．ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜４１６に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５のアミノ酸１〜４１６にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲＦＲＴＮＫＫＡＫＩＷＲＤＴＦＬＶＥＲＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５をコードする単離キメラポリペプチド。

変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１５は、以下の転写物によってコードされる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３（配列は出願書類の最後に示す）。転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３のコード部分を太字で示し、このコード部分は６９１位から開始され、１９３８位で終結する。

本発明の変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４によってコードされる。公知のタンパク質（細胞外スルファターゼＳｕｌｆ−１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６とＳＵＬ１＿ＨＵＭＡＮとの比較の報告
１．ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜３９７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のアミノ酸１〜３９７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫＤＹＦＴＤＬＩＴＮＥＳＩＮＹＦＫＭＳＫＲＭＹＰＨＲＰＶＭＭＶＩＳＨＡＡＰＨＧＰＥＤＳＡＰＱＦＳＫＬＹＰＮＡＳＱＨＩＴＰＳＹＮＹＡＰＮＭＤＫＨＷＩＭＱＹＴＧＰＭＬＰＩＨＭＥＦＴＮＩＬＱＲＫＲＬＱＴＬＭＳＶＤＤＳＶＥＲＬＹＮＭＬＶＥＴＧＥＬＥＮＴＹＩＩＹＴＡＤＨＧＹＨＩＧＱＦＧＬＶＫＧＫＳＭＰＹＤＦＤＩＲＶＰＦＦＩＲＧＰＳＶＥＰＧＳＩＶＰＱＩＶＬＮＩＤＬＡＰＴＩＬＤＩＡＧＬＤＴＰＰＤＶＤＧＫＳＶＬＫＬＬＤＰＥＫＰＧＮＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のアミノ酸３９８〜４１０に対応する配列ＣＶＩＶＰＰＬＳＱＰＱＩＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６をコードする単離キメラポリペプチド。

２．Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６中の配列ＣＶＩＶＰＰＬＳＱＰＱＩＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ１６は、以下の転写物によってコードされる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４（配列は出願書類の最後に示す）。転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４のコード部分を太字で示し、このコード部分は６９１位から開始され、１９２０位で終結する。

本発明の変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０によってコードされる。公知のタンパク質（細胞外スルファターゼＳｕｌｆ−１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２とＳＵＬ１＿ＨＵＭＡＮとの比較の報告
１．ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜１８８に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のアミノ酸１〜１８８にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴＡＦＦＧＫＹＬＮＥＹＮＧＳＹＩＰＰＧＷＲＥＷＬＧＬＩＫＮＳＲＦＹＮＹＴＶＣＲＮＧＩＫＥＫＨＧＦＤＹＡＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のアミノ酸１８９〜２１０に対応する配列ＡＲＹＤＧＤＱＰＲＣＡＰＲＰＲＧＬＳＰＴＶＦを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２をコードする単離キメラポリペプチド。

２．Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２中の配列ＡＲＹＤＧＤＱＰＲＣＡＰＲＰＲＧＬＳＰＴＶＦと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２２は、以下の転写物によってコードされる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０のコード部分を太字で示し、このコード部分は６９１位から開始され、１３２０位で終結する。

本発明の変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１によってコードされる。公知のタンパク質（細胞外スルファターゼＳｕｌｆ−１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３とＱ７Ｚ２Ｗ２との比較の報告
１．Ｑ７Ｚ２Ｗ２のアミノ酸１〜１３７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１〜１３７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１３８〜１４５に対応する配列ＧＬＬＨＲＬＮＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３をコードする単離キメラポリペプチド。

２．Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３中の配列ＧＬＬＨＲＬＮＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のテールをコードする単離ポリペプチド。

Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３とＳＵＬ１＿ＨＵＭＡＮとの比較の報告
１．ＳＵＬ１＿ＨＵＭＡＮのアミノ酸１〜１３７に対応し、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１〜１３７にも対応するＭＫＹＳＣＣＡＬＶＬＡＶＬＧＴＥＬＬＧＳＬＣＳＴＶＲＳＰＲＦＲＧＲＩＱＱＥＲＫＮＩＲＰＮＩＩＬＶＬＴＤＤＱＤＶＥＬＧＳＬＱＶＭＮＫＴＲＫＩＭＥＨＧＧＡＴＦＩＮＡＦＶＴＴＰＭＣＣＰＳＲＳＳＭＬＴＧＫＹＶＨＮＨＮＶＹＴＮＮＥＮＣＳＳＰＳＷＱＡＭＨＥＰＲＴＦＡＶＹＬＮＮＴＧＹＲＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３のアミノ酸１３８〜１４５に対応する配列ＧＬＬＨＲＬＮＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３をコードする単離キメラポリペプチド。

変異タンパク質Ｚ２１３６８＿ＰＥＡ＿１＿Ｐ２３は、以下の転写物によってコードされる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１のコード部分を太字で示し、このコード部分は６９１位から開始され、１１２５位で終結する。

上記のように、クラスターＺ２１３６８は、上の表２に列挙した３４個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ６。以下の表９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ６。以下の表９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、３７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３３は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、４４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３７は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４。以下の表９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３９は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ２４。以下の表９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ２４。以下の表９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４１は、４９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４３は、５２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４５は、６４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿５３は、６０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿５６は、５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿５８は、７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿６６は、１４２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿６７は、１８１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿６９は、１５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１６を、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１７は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、４０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３８は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４７は、６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４９は、５７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿５１は、４６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿６１は、６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿６８は、８７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２１３６８＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１０、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ１１、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２３、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ２４、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ５、Ｚ２１３６８＿ＰＥＡ＿１＿Ｔ６、およびＺ２１３６８＿ＰＥＡ＿１＿Ｔ９。以下の表１２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

このクラスターの少なくとも一部の過剰発現を、オリゴヌクレオチドおよび１つまたは複数のチップによって決定した。結果は以下であった。オリゴヌクレオチドＺ２１３６８＿０＿０＿６１８５７をＴＡＡチップ上に供し、肺癌（全体）、肺腺癌、および扁平上皮細胞癌で過剰発現することが見出された。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/5ER3vIMKE2/9L0Y7lDlTQ:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P2 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7664.00 Escore: 0
Matching length: 761 Total length: 761
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
.
751 NNHWQTAPFWN 761
|||||||||||
751 NNHWQTAPFWN 761

Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 7869.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 99.87 Matching Percent Identity: 99.87
Total Percent Similarity: 90.70 Total Percent Identity: 90.70
Gaps: 1

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELA.......................................... 58
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
59 ......................................FFGKYLNEYNGS 70
||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTVFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871

Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:AAH12997

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x AAH12997 ..

Alignment segment 1/1:

Quality: 420.00 Escore: 0
Matching length: 40 Total length: 40
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . .
752 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||||||||||||||||||||||
1 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 40

Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7878.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 90.82 Total Percent Identity: 90.82
Gaps: 1

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVEL........................................... 57
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
58 .....................................AFFGKYLNEYNGS 70
|||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871

Sequence name: /tmp/AVAZGWHuF0/RzHFOnHIsT:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P15 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 4174.00 Escore: 0
Matching length: 416 Total length: 416
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
.
401 NKKAKIWRDTFLVERG 416
||||||||||||||||
401 NKKAKIWRDTFLVERG 416

Sequence name: /tmp/JhwgRdKqmt/kqSmjxkWWk:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P16 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 3985.00 Escore: 0
Matching length: 397 Total length: 397
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397
|||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397

Sequence name: /tmp/GPlnIw3BOg/zXFdxqG4ow:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P22 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1897.00 Escore: 0
Matching length: 188 Total length: 188
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188

Sequence name: /tmp/oji5Fs74fB/8xeB9KrGjp:Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137

Sequence name: /tmp/oji5Fs74fB/8xeB9KrGjp:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137

正常および癌性肺組織における配列名Ｚ２１３６８ｊｕｎｃ１７−２１中に示すアンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現
ｊｕｎｃ１７−２１セグメント、Ｚ２１３６８ｊｕｎｃ１７−２１アンプリコン（配列番号１６４２）、およびＺ２１３６８ｊｕｎｃ１７−２１Ｆ（配列番号１６４０）、Ｚ２１３６８ｊｕｎｃ１７−２１Ｒ（配列番号１６４１）プライマーによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」、上記）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図１４は、正常サンプルと比較した癌性肺サンプルにおける上記ＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。図１４から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち１０個、１６個の扁平上皮細胞癌サンプルのうち１６個、４個の大細胞癌サンプルのうち０個、８個の小細胞癌サンプルのうち０個で少なくとも５倍の過剰発現が見出された。

５倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、腺癌で３．５６Ｅ−０４、扁平上皮細胞癌で９．６６Ｅ−０３であった。上記値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｚ２１３６８ｊｕｎｃ１７−２１Ｆ順方向プライマーおよびＺ２１３６８ｊｕｎｃ１７−２１Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｚ２１３６８ｊｕｎｃ１７−２１。

順方向プライマー（配列番号１６４０）：ＧＧＡＣＧＧＡＴＡＣＡＧＣＡＧＧＡＡＣＧ
逆方向アンプリコン（配列番号１６４１）：ＴＡＴＴＴＴＣＣＡＡＡＡＡＡＧＧＣＣＡＧＣＴＣ
アンプリコン（配列番号１６４２）：ＧＧＡＣＧＧＡＴＡＣＡＧＣＡＧＧＡＡＣＧＡＡＡＡＡＡＣＡＴＣＣＧＡＣＣＣＡＡＣＡＴＴＡＴＴＣＴＴＧＴＧＣＴＴＡＣＣＧＡＴＧＡＴＣＡＡＧＡＴＧＴＧＧＡＧＣＴＧＧＣＣＴＴＴＴＴＴＧＧＡＡＡＡＴＡ

異なる正常組織における配列名Ｚ２１３６８ｊｕｎｃ１７−２１中に示すアンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現
Ｚ２１３６８ｊｕｎｃ１７−２１アンプリコン（配列番号１６４２）、Ｚ２１３６８ｊｕｎｃ１７−２１Ｆ（配列番号１６４０）、およびＺ２１３６８ｊｕｎｃ１７−２１Ｒ（配列番号１６４１）によって検出可能なＳＵＬ１＿ＨＵＭＡＮ細胞外スルファターゼＳｕｌｆ−１転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８；アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、乳房サンプル（上記のサンプル番号３３〜３５、表３、「正常パネル中の組織サンプル」）の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。

結果を図１５に示し、これは、異なる正常組織における配列名Ｚ２１３６８ｊｕｎｃ１７−２１中に示されたアンプリコンによって検出可能な細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現を示す。

正常および癌性肺組織における配列名Ｚ２１３６８ｓｅｇ３９中に示すアンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現
ｓｅｇ３９、Ｚ２１３６８ｓｅｇ３９アンプリコン（配列番号１６４５）、ならびにプライマーＺ２１３６８ｓｅｇ３９Ｆ（配列番号１６４３）およびＺ２１３６８ｓｅｇ３９Ｒ（配列番号１６４４）によって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図１６は、正常サンプルと比較した癌性肺サンプルにおける上記ＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。図１６から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち８個、１６個の扁平上皮細胞癌サンプルのうち５個、および４個の大細胞癌サンプルのうち１個で少なくとも５倍の過剰発現が見出された。

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の発現レベルの相違についてのＰ値を、Ｔ検定によって、腺癌で２．１７Ｅ−０４、扁平上皮細胞癌で９．９４Ｅ−０３、大細胞癌で２．１７Ｅ−０１と決定された。

５倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、Ｐ値は、フィッシャーの正確確率検定によってチェックしたところ、腺癌で１．７４Ｅ−０２、扁平上皮細胞癌で１．５８Ｅ−０１であり、大細胞癌で４．３３Ｅ−０１であった。上記値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｚ２１３６８ｓｅｇ３９Ｆ順方向プライマーおよびＺ２１３６８ｓｅｇ３９Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｚ２１３６８ｓｅｇ３９。

プライマー：
順方向プライマーＺ２１３６８ｓｅｇ３９Ｆ（配列番号１６４３）：ＧＴＴＧＣＡＴＴＴＣＴＣＡＧＴＧＣＴＧＧＴＴＴ
逆方向プライマーＺ２１３６８ｓｅｇ３９Ｒ（配列番号１６４４）：ＡＧＧＧＴＧＣＣＧＧＧＴＧＡＧＧ
アンプリコンＺ２１３６８ｓｅｇ３９（配列番号１６４５）：ＧＴＴＧＣＡＴＴＴＣＴＣＡＧＴＧＣＴＧＧＴＴＴＣＴＡＡＴＣＡＧＡＣＣＡＧＴＧＧＡＴＴＧＡＧＴＴＴＣＴＣＴＡＣＣＡＴＣＣＴＣＣＣＣＡＣＧＴＴＣＴＴＣＴＣＴＡＡＧＣＴＧＣＣＴＣＣＡＡＧＣＣＴＣＡＣＣＣＧＧＣＡＣＣＣＴ

異なる正常組織における配列名Ｚ２１３６８ｓｅｇ３９中に示すアンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現
Ｚ２１３６８ｓｅｇ３９アンプリコン（配列番号１６４５）、Ｚ２１３６８ｓｅｇ３９Ｆ（配列番号１６４３）、Ｚ２１３６８ｓｅｇ３９Ｒ（配列番号１６４４）によって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−［ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン，配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン，配列番号１６３３）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、乳房サンプル（上記のサンプル番号３３〜３５、表３）の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。

順方向プライマーＺ２１３６８ｓｅｇ３９Ｆ（配列番号１６４３）：ＧＴＴＧＣＡＴＴＴＣＴＣＡＧＴＧＣＴＧＧＴＴＴ
逆方向プライマーＺ２１３６８ｓｅｇ３９Ｒ（配列番号１６４４）：ＡＧＧＧＴＧＣＣＧＧＧＴＧＡＧＧ
アンプリコンＺ２１３６８ｓｅｇ３９（配列番号１６４５）：ＧＴＴＧＣＡＴＴＴＣＴＣＡＧＴＧＣＴＧＧＴＴＴＣＴＡＡＴＣＡＧＡＣＣＡＧＴＧＧＡＴＴＧＡＧＴＴＴＣＴＣＴＡＣＣＡＴＣＣＴＣＣＣＣＡＣＧＴＴＣＴＴＣＴＣＴＡＡＧＣＴＧＣＣＴＣＣＡＡＧＣＣＴＣＡＣＣＣＧＧＣＡＣＣＣＴ

結果を図１７に示し、これは、異なる正常組織における配列名Ｚ２１３６８ｓｅｇ３９中に示すアンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現を示す。

ＰＢＧＤ−アンプリコン（配列番号３３４）、ＨＰＲＴ１−アンプリコン（配列番号１２９７）、ユビキチン−アンプリコン（配列番号３２８）、ＳＤＨＡ−アンプリコン（配列番号３３１）、ＰＢＧＤ−アンプリコン（配列番号３３４）、ＨＰＲＴ１−アンプリコン（配列番号１２９７）、ユビキチン−アンプリコン（配列番号３２８）、ＳＤＨＡ−アンプリコン（配列番号３３１）、ＲＰＬ１９アンプリコン（配列番号１６３０）、ＴＡＴＡアンプリコン（配列番号１６３３）、ユビキチン−アンプリコン（配列番号３２８）、ＳＤＨＡ−アンプリコン（配列番号３３１）

クラスターＨＵＭＧＲＰ５Ｅの説明
クラスターＨＵＭＧＲＰ５Ｅは、目的の２つの転写物および５個のセグメントを特徴とし、その名称を、それぞれ表１６０および１６１に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１６２に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるガストリン放出ペプチド前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＧＲＰ＿ＨＵＭＡＮ、同義語はＧＲＰ、ＧＲＰ−１０）（配列番号１４２１）の変異型である。

ガストリン放出ペプチドは、以下の機能を有することが公知であるか、そのように見なされている：ガストリン放出および他の消化管ホルモンを刺激する。タンパク質ガストリン放出ペプチド前駆体の配列を、「ガストリン放出ペプチド前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１６３に示す。

タンパク質ガストリン放出ペプチドの局在化は、分泌と考えられる。

以前に公知のタンパク質はまた、以下の適応症および／または潜在的治療用途を有する：ＩＩ型糖尿病。ヒトにおける臨床／治療用途（例えば、抗体または小分子の標的として、および／または直接的な治療として）が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である：ボンベシンアンタゴニスト、インスリノトロピンアゴニスト。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する（食欲抑制剤／肥満抑制薬、ホルモンの放出、抗癌、呼吸器、抗糖尿病薬）ために使用するか使用することができる薬物データベースまたは公的なデータベース（例えば、上記）に情報が存在するので、クラスターをこの分野に割り当てた。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるシグナル伝達、神経ペプチドシグナル伝達、分子機能に関連する注釈付けである成長因子、および細胞成分に関連する注釈付けである分泌。

上記のように、クラスターＨＵＭＧＲＰ５Ｅは、上の表１６０に列挙した２つの転写物を特徴とする。これらの転写物は、タンパク質ガストリン放出ペプチド前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＧＲＰ５Ｅ＿Ｔ４によってコードされる。公知のタンパク質（ガストリン放出ペプチド前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＧＲＰ５Ｅ＿Ｐ４とＧＲＰ＿ＨＵＭＡＮとの比較の報告
１．ＧＲＰ＿ＨＵＭＡＮのアミノ酸１〜１２７に対応し、ＨＵＭＧＲＰ５Ｅ＿Ｐ４のアミノ酸１〜１２７にも対応するＭＲＧＳＥＬＰＬＶＬＬＡＬＶＬＣＬＡＰＲＧＲＡＶＰＬＰＡＧＧＧＴＶＬＴＫＭＹＰＲＧＮＨＷＡＶＧＨＬＭＧＫＫＳＴＧＥＳＳＳＶＳＥＲＧＳＬＫＱＱＬＲＥＹＩＲＷＥＥＡＡＲＮＬＬＧＬＩＥＡＫＥＮＲＮＨＱＰＰＱＰＫＡＬＧＮＱＱＰＳＷＤＳＥＤＳＳＮＦＫＤＶＧＳＫＧＫと少なくとも９０％相同な第１のアミノ酸配列と、ＧＲＰ＿ＨＵＭＡＮのアミノ酸１３５〜１４８に対応し、ＨＵＭＧＲＰ５Ｅ＿Ｐ４のアミノ酸１２８〜１４１にも対応するＧＳＱＲＥＧＲＮＰＱＬＮＱＱと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＧＲＰ５Ｅ＿Ｐ４をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＧを含み、以下の構造：アミノ酸番号１２７−ｘ〜１２７のいずれかから始まり、アミノ酸番号１２８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＧＲＰ５Ｅ＿Ｐ４の縁部分をコードする単離キメラポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ４はまた、表１６４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ４は、以下の転写物によってコードされる：ＨＵＭＧＲＰ５Ｅ＿Ｔ４（配列は出願書類の最後に示す）。転写物ＨＵＭＧＲＰ５Ｅ＿Ｔ４のコード部分を太字で示し、このコード部分は６２２位から開始され、１０４４位で終結する。転写物はまた、表１６５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＧＲＰ５Ｅ＿Ｔ５によってコードされる。公知のタンパク質（ガストリン放出ペプチド前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＧＲＰ５Ｅ＿Ｐ５とＧＲＰ＿ＨＵＭＡＮとの比較の報告
１．ＧＲＰ＿ＨＵＭＡＮのアミノ酸１〜１２７に対応し、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のアミノ酸１〜１２７にも対応するＭＲＧＳＥＬＰＬＶＬＬＡＬＶＬＣＬＡＰＲＧＲＡＶＰＬＰＡＧＧＧＴＶＬＴＫＭＹＰＲＧＮＨＷＡＶＧＨＬＭＧＫＫＳＴＧＥＳＳＳＶＳＥＲＧＳＬＫＱＱＬＲＥＹＩＲＷＥＥＡＡＲＮＬＬＧＬＩＥＡＫＥＮＲＮＨＱＰＰＱＰＫＡＬＧＮＱＱＰＳＷＤＳＥＤＳＳＮＦＫＤＶＧＳＫＧＫと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のアミノ酸１２８〜１４２に対応する配列ＤＳＬＬＱＶＬＮＶＫＥＧＴＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＧＲＰ５Ｅ＿Ｐ５をコードする単離キメラポリペプチド。

２．ＨＵＭＧＲＰ５Ｅ＿Ｐ５中の配列ＤＳＬＬＱＶＬＮＶＫＥＧＴＰＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＧＲＰ５Ｅ＿Ｐ５のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ５はまた、表１６６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ５は、以下の転写物によってコードされる：ＨＵＭＧＲＰ５Ｅ＿Ｔ５（配列は出願書類の最後に示す）。転写物ＨＵＭＧＲＰ５Ｅ＿Ｔ５のコード部分を太字で示し、このコード部分は６２２位から開始され、１０４７位で終結する。転写物はまた、表１６７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＧＲＰ５Ｅ＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＧＲＰ５Ｅは、上の表１６１に列挙した５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＧＲＰ５Ｅ＿ｎｏｄｅ＿０は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＧＲＰ５Ｅ＿Ｔ４およびＨＵＭＧＲＰ５Ｅ＿Ｔ５。以下の表１６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＧＲＰ５Ｅ＿ｎｏｄｅ＿２は、２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＧＲＰ５Ｅ＿Ｔ４およびＨＵＭＧＲＰ５Ｅ＿Ｔ５。以下の表１６９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＧＲＰ５Ｅ＿ｎｏｄｅ＿８は、２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＧＲＰ５Ｅ＿Ｔ４およびＨＵＭＧＲＰ５Ｅ＿Ｔ５。以下の表１７０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＧＲＰ５Ｅ＿ｎｏｄｅ＿３を、以下の転写物中に見出すことができる：ＨＵＭＧＲＰ５Ｅ＿Ｔ４およびＨＵＭＧＲＰ５Ｅ＿Ｔ５。以下の表１７１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＧＲＰ５Ｅ＿ｎｏｄｅ＿７を、以下の転写物中に見出すことができる：ＨＵＭＧＲＰ５Ｅ＿Ｔ５。以下の表１７２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、この遺伝子のマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表１７３に示す）。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/412zs2mwyT/B0wjOUAX0d:GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P4 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1291.00 Escore: 0
Matching length: 141 Total length: 148
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 95.27 Total Percent Identity: 95.27
Gaps: 1

Alignment:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. . . .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK.......GSQREGRNPQLNQQ 141
||||||||||||||||||||||||||| ||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGKVGRLSAPGSQREGRNPQLNQQ 148

Sequence name: /tmp/1me9ldnvfv/KbP5io8PtU:GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P5 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1248.00 Escore: 0
Matching length: 127 Total length: 127
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127
|||||||||||||||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127

正常および癌性肺組織における配列名ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７中に示すアンプリコンによって検出可能なＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド（ＨＵＭＧＲＰ５Ｅ）転写物の発現
ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７アンプリコン（配列番号１６４８）、ならびにＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｆ（配列番号１６４６）およびＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｒ（配列番号１６４７）プライマーによって検出可能なＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験サンプル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図１６は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記ＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド転写物の過剰発現を示すヒストグラムである。図１９から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験サンプル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち２個および８個の小細胞癌サンプルのうち７個で少なくとも１０倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｆ順方向プライマーおよびＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７。

ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｆ（配列番号１６４６）
ＡＣＣＡＧＣＣＡＣＣＴＣＡＡＣＣＣＡ
ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｒ（配列番号１６４７）
ＣＴＧＧＡＧＣＡＧＡＧＡＧＴＣＴＴＴＧＣＣＴ
ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７（配列番号１６４８）
ＡＣＣＡＧＣＣＡＣＣＴＣＡＡＣＣＣＡＡＧＧＣＣＣＴＧＧＧＣＡＡＴＣＡＧＣＡＧＣＣＴＴＣＧＴＧＧＧＡＴＴＣＡＧＡＧＧＡＴＡＧＣＡＧＣＡＡＣＴＴＣＡＡＡＧＡＴＧＴＡＧＧＴＴＣＡＡＡＡＧＧＣＡＡＡＧＡＣＴＣＴＣＴＧＣＴＣＣＡＧ

異なる正常組織における配列名ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７中に示すアンプリコンによって検出可能なＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド（ＨＵＭＧＲＰ５Ｅ）転写物の発現
ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７アンプリコン（配列番号１６４８）、ならびにＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｆ（配列番号１６４６）およびＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｒ（配列番号１６４７）によって検出可能なＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン，配列番号１６３３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、乳房サンプル（上記のサンプル番号３３〜３５、表３、「正常パネルにおける組織サンプル」）の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。

結果を図２０に示し、これは、異なる正常組織における配列名ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７中に示すアンプリコンによって検出可能なＧＲＰ＿ＨＵＭＡＮ−ガストリン放出ペプチド（ＨＵＭＧＲＰ５Ｅ）転写物の発現転写物の発現を示す。

クラスターＤ５６４０６の説明
クラスターＤ５６４０６は、目的の３つの転写物および１０個のセグメントを特徴とし、その名称を、それぞれ表１７４および１７５に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１７６に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるニューロテンシン／ニューロメジンＮ前駆体（以下を含む：大ニューロメジンＮ（ＬａｒｇｅｎｅｕｒｏｍｅｄｉｎＮ）（ＮｍＮ−１２５）、ニューロメジンＮ（ＮｍＮ）（ＮＮ）、ニューロテンシン（ＮＴ）、テールペプチド）（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＮＥＵＴ＿ＨＵＭＡＮ）（配列番号１４２２）の変異型である。

タンパク質ニューロテンシン／ニューロメジンＮ前駆体は、以下の機能を有することが公知であるか、そのように見なされている：ニューロテンシンは脂肪代謝の調節において内分泌または傍分泌の役割を果たし得る。これにより、平滑筋の収縮が起こる。タンパク質ニューロテンシン／ニューロメジンＮ前駆体の配列を、「ニューロテンシン／ニューロメジンＮ前駆体（以下を含む：大ニューロメジンＮ（ＮｍＮ−１２５）、ニューロメジンＮ（ＮｍＮ）（ＮＮ）、ニューロテンシン（ＮＴ）、テールペプチド）アミノ酸配列」として出願書類の最後に示す。タンパク質ニューロテンシン／ニューロメジンＮ前駆体の局在化は、分泌と考えられる（分泌小胞内へのパッケージング）。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるシグナル伝達、分子機能に関連する注釈付けである神経ペプチドホルモン、および細胞成分に関連する注釈付けである可溶性画分。

上記のように、クラスターＤ５６４０６は、上の表１７４に列挙した３つの転写物を特徴とする。これらの転写物は、ニューロテンシン／ニューロメジンＮ前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３によってコードされる。公知のタンパク質（ニューロテンシン／ニューロメジンＮ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２とＮＥＵＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１〜１２０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜１２０にも対応するＭＭＡＧＭＫＩＱＬＶＣＭＬＬＬＡＦＳＳＷＳＬＣＳＤＳＥＥＥＭＫＡＬＥＡＤＦＬＴＮＭＨＴＳＫＩＳＫＡＨＶＰＳＷＫＭＴＬＬＮＶＣＳＬＶＮＮＬＮＳＰＡＥＥＴＧＥＶＨＥＥＥＬＶＡＲＲＫＬＰＴＡＬＤＧＦＳＬＥＡＭＬＴＩＹＱＬＨＫＩＣＨＳＲＡＦＱＨＷＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１２１〜１５１に対応する配列ＡＲＷＬＴＰＶＩＰＡＬＷＥＡＥＴＧＧＳＲＧＱＥＭＥＴＩＰＡＮＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列と、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１２１〜１７０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１５２〜２０１にも対応するＬＩＱＥＤＩＬＤＴＧＮＤＫＮＧＫＥＥＶＩＫＲＫＩＰＹＩＬＫＲＱＬＹＥＮＫＰＲＲＰＹＩＬＫＲＤＳＹＹＹと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２に対応するＡＲＷＬＴＰＶＩＰＡＬＷＥＡＥＴＧＧＳＲＧＱＥＭＥＴＩＰＡＮＴをコードする配列と少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なアミノ酸配列を含む、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２の縁部分をコードする単離ポリペプチド。

変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２はまた、表１７７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３（配列は出願書類の最後に示す）。転写物Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３のコード部分を太字で示し、このコード部分は１０６位から開始され、７０８位で終結する。転写物はまた、表１７８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ６によってコードされる。公知のタンパク質（ニューロテンシン／ニューロメジンＮ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５とＮＥＵＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１〜２３に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜２３にも対応するＭＭＡＧＭＫＩＱＬＶＣＭＬＬＬＡＦＳＳＷＳＬＣと少なくとも９０％相同な第１のアミノ酸配列と、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸２６〜１７０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５のアミノ酸２４〜１６８にも対応するＳＥＥＥＭＫＡＬＥＡＤＦＬＴＮＭＨＴＳＫＩＳＫＡＨＶＰＳＷＫＭＴＬＬＮＶＣＳＬＶＮＮＬＮＳＰＡＥＥＴＧＥＶＨＥＥＥＬＶＡＲＲＫＬＰＴＡＬＤＧＦＳＬＥＡＭＬＴＩＹＱＬＨＫＩＣＨＳＲＡＦＱＨＷＥＬＩＱＥＤＩＬＤＴＧＮＤＫＮＧＫＥＥＶＩＫＲＫＩＰＹＩＬＫＲＱＬＹＥＮＫＰＲＲＰＹＩＬＫＲＤＳＹＹＹと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＣＳを含み、以下の構造：アミノ酸番号２３−ｘ〜２３のいずれかから始まり、アミノ酸番号２４＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５はまた、表１７９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ６のコード部分を太字で示し、このコード部分は１０６位から開始され、６０９位で終結する。転写物はまた、表１８０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ７によってコードされる。公知のタンパク質（ニューロテンシン／ニューロメジンＮ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６とＮＥＵＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１〜４５に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜４５にも対応するＭＭＡＧＭＫＩＱＬＶＣＭＬＬＬＡＦＳＳＷＳＬＣＳＤＳＥＥＥＭＫＡＬＥＡＤＦＬＴＮＭＨＴＳＫと少なくとも９０％相同な第１のアミノ酸配列と、ＮＥＵＴ＿ＨＵＭＡＮのアミノ酸１２１〜１７０に対応し、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６のアミノ酸４６〜９５にも対応するＬＩＱＥＤＩＬＤＴＧＮＤＫＮＧＫＥＥＶＩＫＲＫＩＰＹＩＬＫＲＱＬＹＥＮＫＰＲＲＰＹＩＬＫＲＤＳＹＹＹと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＬを含み、以下の構造：アミノ酸番号４５−ｘ〜４５のいずれかから始まり、アミノ酸番号４６＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６はまた、表１８１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６は、以下の転写物によってコードされる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ７（配列は出願書類の最後に示す）。転写物Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ７のコード部分を太字で示し、このコード部分は１０６位から開始され、３９０位で終結する。転写物はまた、表１８２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｄ５６４０６＿ＰＥＡ＿１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＤ５６４０６は、上の表２に列挙した１０個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、４８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３、Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ６、およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ７。以下の表１８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表１８４に示す）。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、４３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３、Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ６、およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ７。以下の表１８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３。以下の表１８６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿２を、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ７。以下の表１８７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、４６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３、Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ６、およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ７。以下の表１８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、４８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ６。以下の表１８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ６。以下の表１９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、３２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ６。以下の表１９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿８を、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ６。以下の表１９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＤ５６４０６＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｄ５６４０６＿ＰＥＡ＿１＿Ｔ３およびＤ５６４０６＿ＰＥＡ＿１＿Ｔ６。以下の表１９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/jU49325aMA/8F0XuN7La5:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P2 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1591.00 Escore: 0
Matching length: 170 Total length: 201
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 84.58 Total Percent Identity: 84.58
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
101 MLTIYQLHKICHSRAFQHWEARWLTPVIPALWEAETGGSRGQEMETIPAN 150
||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWE.............................. 120
. . . . .
151 TLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 200
|||||||||||||||||||||||||||||||||||||||||||||||||
121 .LIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 169

201 Y 201
|
170 Y 170

Sequence name: /tmp/wWui8Kd4y9/zbf3ihRwnR:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P5 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1572.00 Escore: 0
Matching length: 168 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.82 Total Percent Identity: 98.82
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLC..SEEEMKALEADFLTNMHTSKISKAH 48
||||||||||||||||||||||| |||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
49 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 98
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
99 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 148
||||||||||||||||||||||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 150
. .
149 QLYENKPRRPYILKRDSYYY 168
||||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170

Sequence name: /tmp/f5d07fF5D7/E4N5xjUIAN:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P6 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 95 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 55.88 Total Percent Identity: 55.88
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSK..... 45
|||||||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
45 .................................................. 45

51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
46 ....................LIQEDILDTGNDKNGKEEVIKRKIPYILKR 75
||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 150
. .
76 QLYENKPRRPYILKRDSYYY 95
||||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170

クラスターＦ０５０６８の説明
クラスターＦ０５０６８は、目的の３つの転写物および１２個のセグメントを特徴とし、その名称を、それぞれ表１９４および１９５に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１９６に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるＡＤＭ前駆体（以下を含む：アドレノメデュリン（ＡＭ）、プロアドレノメデュリンＮ−２０末端ペプチド（ＰｒｏＡＭ−Ｎ２０）（ＰｒｏＡＭＮ−末端２０ペプチド）（ＰＡＭＰ））（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＡＤＭＬ＿ＨＵＭＡＮ）（配列番号１４２３）の変異型である。

タンパク質ＡＤＭ前駆体は、以下の機能を有することが公知であるか、そのように見なされている：ＡＭおよびＰＡＭＰは、強力な降圧薬および血管拡張薬である。多数の作用が報告されており、流動物および電解質のホメオスタシスの生理学的調節について最も言及されている。腎臓では、ＡＭは、利尿薬およびナトリウム利尿薬であり、ＡＭおよびＰＡＭＰは共に直接的副腎作用によってアルドステロン分泌を阻害する。下垂体では、両ペプチドは、生理学的に関連する用量で、基本的ＡＣＴＨ分泌を阻害する。両ペプチドは、脳内および下垂体内で血漿体積の減少を促進するように作用するようである（血管内でのその血圧低下作用を補足する作用）。タンパク質ＡＤＭ前駆体の配列を、「ＡＤＭ前駆体（以下を含む：アドレノメデュリン（ＡＭ）、プロアドレノメデュリンＮ−２０末端ペプチド（ＰｒｏＡＭ−Ｎ２０）（ＰｒｏＡＭＮ−末端２０ペプチド）（ＰＡＭＰ）アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１９７に示す。

タンパク質ＡＤＭ前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるｃＡＭＰ生合成、プロゲステロン生合成、シグナル伝達、細胞−細胞シグナル伝達、妊娠、排泄、循環、創傷応答、分子機能に関連する注釈付けであるリガンド、ホルモン、および細胞成分に関連する注釈付けである鎖妨害空間、可溶性画分。

クラスターＦ０５０６８を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２１のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２１および表１９８中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：子宮悪性腫瘍。

上記のように、クラスターＦ０５０６８は、上の表１９４に列挙した３つの転写物を特徴とする。これらの転写物は、ＡＤＭ前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６によってコードされる。公知のタンパク質（ＡＤＭ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７とＡＤＭＬ＿ＨＵＭＡＮとの間の比較の報告
１．ＡＤＭＬ＿ＨＵＭＡＮのアミノ酸１〜３３に対応し、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜３３にも対応するＭＫＬＶＳＶＡＬＭＹＬＧＳＬＡＦＬＧＡＤＴＡＲＬＤＶＡＳＥＦＲＫＫと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７はまた、表２００に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７は、以下の転写物によってコードされる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６（配列は出願書類の最後に示す）。

転写物Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３のコード部分を太字で示し、このコード部分は２６７位から開始され、３６５位で終結する。転写物はまた、表２０１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

転写物Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ６のコード部分を太字で示し、このコード部分は２６７位から開始され、３６５位で終結する。転写物はまた、表２０２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４によってコードされる。公知のタンパク質（ＡＤＭ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８とＡＤＭＬ＿ＨＵＭＡＮとの間の比較の報告
１．ＡＤＭＬ＿ＨＵＭＡＮのアミノ酸１〜８２に対応し、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜８２にも対応するＭＫＬＶＳＶＡＬＭＹＬＧＳＬＡＦＬＧＡＤＴＡＲＬＤＶＡＳＥＦＲＫＫＷＮＫＷＡＬＳＲＧＫＲＥＬＲＭＳＳＳＹＰＴＧＬＡＤＶＫＡＧＰＡＱＴＬＩＲＰＱＤＭＫＧＡＳＲＳＰＥＤと少なくとも９０％相同な第１のアミノ酸配列と、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８のアミノ酸８３〜８３に対応する配列Ｒを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチド。

変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８はまた、表２０３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８は、以下の転写物によってコードされる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４（配列は出願書類の最後に示す）。転写物Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４のコード部分を太字で示し、このコード部分は２６７位から開始され、５１５位で終結する。転写物はまた、表２０４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｆ０５０６８＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＦ０５０６８は、上の表２に列挙した１２個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、１４３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、１２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、１２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、１８１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、１１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、１４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、１２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、１１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、１０９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＦ０５０６８＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、１１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ３、Ｆ０５０６８＿ＰＥＡ＿１＿Ｔ４、およびＦ０５０６８＿ＰＥＡ＿１＿Ｔ６。以下の表２１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/kEsi3RWsCN/1svdhjfiNV:ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P7 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 304.00 Escore: 0
Matching length: 33 Total length: 33
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33
|||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33

Sequence name: /tmp/tcrlWIx4kg/aghbr8Eh8n:ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P8 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 791.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
. . .
51 SYPTGLADVKAGPAQTLIRPQDMKGASRSPED 82
||||||||||||||||||||||||||||||||
51 SYPTGLADVKAGPAQTLIRPQDMKGASRSPED 82

クラスターＨ１４６２４の説明
クラスターＨ１４６２４は、目的の１つの転写物および１５個のセグメントを特徴とし、その名称を、それぞれ表２１７および２１８に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表２１９に示す。

クラスターＨ１４６２４を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２２のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２２および表２２０中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：結腸直腸癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性脳腫瘍、および膵臓癌。

上記のように、コンティグＨ１４６２４は、上の表２１７に列挙した１つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｈ１４６２４＿Ｐ１５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ１４６２４＿Ｔ２０によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｈ１４６２４＿Ｐ１５とＱ９ＨＡＰ５（配列番号１７０１）との間の比較の報告
１．Ｑ９ＨＡＰ５のアミノ酸１〜１６７に対応し、Ｈ１４６２４＿Ｐ１５のアミノ酸１〜１６７にも対応するＭＬＱＧＰＧＳＬＬＬＬＦＬＡＳＨＣＣＬＧＳＡＲＧＬＦＬＦＧＱＰＤＦＳＹＫＲＳＮＣＫＰＩＰＡＮＬＱＬＣＨＧＩＥＹＱＮＭＲＬＰＮＬＬＧＨＥＴＭＫＥＶＬＥＱＡＧＡＷＩＰＬＶＭＫＱＣＨＰＤＴＫＫＦＬＣＳＬＦＡＰＶＣＬＤＤＬＤＥＴＩＱＰＣＨＳＬＣＶＱＶＫＤＲＣＡＰＶＭＳＡＦＧＦＰＷＰＤＭＬＥＣＤＲＦＰＱＤＮＤＬＣＩＰＬＡＳＳＤＨＬＬＰＡＴＥＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ１４６２４＿Ｐ１５のアミノ酸１６８〜１８０に対応する配列ＧＫＰＳＬＬＬＰＨＳＬＬＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ１４６２４＿Ｐ１５をコードする単離キメラポリペプチド。

２．Ｈ１４６２４＿Ｐ１５中の配列ＧＫＰＳＬＬＬＰＨＳＬＬＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ１４６２４＿Ｐ１５のテールをコードする単離ポリペプチド。

変異タンパク質Ｈ１４６２４＿Ｐ１５はまた、表２２２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ１４６２４＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｈ１４６２４＿Ｐ１５は、以下の転写物によってコードされる：Ｈ１４６２４＿Ｔ２０（配列は出願書類の最後に示す）。転写物Ｈ１４６２４＿Ｔ２０のコード部分を太字で示し、このコード部分は８５７位から開始され、１３９６位で終結する。転写物はまた、表２２３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ１４６２４＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨ１４６２４は、上の表２に列挙した１５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿０は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１６は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿３は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１０を、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１１は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１２を、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１３は、１２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１４は、１１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿１５は、１２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿４は、６５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿５を、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿６を、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿７を、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿８は、８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ１４６２４＿ｎｏｄｅ＿９は、８７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ１４６２４＿Ｔ２０。以下の表２３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/Upb1SbFkrj/N4PrGQAB2V:Q9HAP5

Sequence documentation:

Alignment of: H14624_P15 x Q9HAP5 ..

Alignment segment 1/1:

Quality: 1702.00 Escore: 0
Matching length: 167 Total length: 167
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
. . . . .
51 HGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 HGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
. . . . .
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDND 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDND 150
.
151 LCIPLASSDHLLPATEE 167
|||||||||||||||||
151 LCIPLASSDHLLPATEE 167

クラスターＨ３８８０４説明
クラスターＨ３８８０４は、目的の２つの転写物および２０個のセグメントを特徴とし、その名称を、それぞれ表２３９および２４０に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表２４１に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である有糸分裂チェックポイントタンパク質ＢＵＢ３（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＢＵＢ３＿ＨＵＭＡＮ）（配列番号１４２４）の変異型である。

タンパク質有糸分裂チェックポイントタンパク質ＢＵＢ３は、以下の機能を有することが公知であるか、そのように見なされている：ＢＵＢ１の動原体局在化に必要である。タンパク質有糸分裂チェックポイントタンパク質ＢＵＢ３の配列を、「有糸分裂チェックポイントタンパク質ＢＵＢ３アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表２４２に示す。

タンパク質有糸分裂チェックポイントタンパク質ＢＵＢ３の局在化は、核と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである有糸分裂、有糸分裂チェックポイント、有糸分裂紡錘体チェックポイント、細胞増殖、および細胞成分に関連する注釈付けである核。

クラスターＨ３８８０４を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２３のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２３および表２４３中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：移行上皮癌、脳悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および胃癌。

上記のように、クラスターＨ３８８０４は、上の表２３９に列挙した２つの転写物を特徴とする。これらの転写物は、タンパク質有糸分裂チェックポイントタンパク質ＢＵＢ３の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ８によってコードされる。公知のタンパク質（有糸分裂チェックポイントタンパク質ＢＵＢ３）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５とＢＵＢ３＿ＨＵＭＡＮとの間の比較の報告
１．Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜５７に対応する配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＵＢ３＿ＨＵＭＡＮのアミノ酸１〜３２４に対応し、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５のアミノ酸５８〜３８１にも対応するＭＴＧＳＮＥＦＫＬＮＱＰＰＥＤＧＩＳＳＶＫＦＳＰＮＴＳＱＦＬＬＶＳＳＷＤＴＳＶＲＬＹＤＶＰＡＮＳＭＲＬＫＹＱＨＴＧＡＶＬＤＣＡＦＹＤＰＴＨＡＷＳＧＧＬＤＨＱＬＫＭＨＤＬＮＴＤＱＥＮＬＶＧＴＨＤＡＰＩＲＣＶＥＹＣＰＥＶＮＶＭＶＴＧＳＷＤＱＴＶＫＬＷＤＰＲＴＰＣＮＡＧＴＦＳＱＰＥＫＶＹＴＬＳＶＳＧＤＲＬＩＶＧＴＡＧＲＲＶＬＶＷＤＬＲＮＭＧＹＶＱＱＲＲＥＳＳＬＫＹＱＴＲＣＩＲＡＦＰＮＫＱＧＹＶＬＳＳＩＥＧＲＶＡＶＥＹＬＤＰＳＰＥＶＱＫＫＫＹＡＦＫＣＨＲＬＫＥＮＮＩＥＱＩＹＰＶＮＡＩＳＦＨＮＩＨＮＴＦＡＴＧＧＳＤＧＦＶＮＩＷＤＰＦＮＫＫＲＬＣＱＦＨＲＹＰＴＳＩＡＳＬＡＦＳＮＤＧＴＴＬＡＩＡＳＳＹＭＹＥＭＤＤＴＥＨＰＥＤＧＩＦＩＲＱＶＴＤＡＥＴＫＰＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５の配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５の先端をコードする単離ポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、２つのうちの１つのシグナルペプチド推定プログラム（ＨＭＭ：Ｓｉｇｎａｌｐｅｐｔｉｄｅ，ＮＮ：ＮＯ）によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。

変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５はまた、表２４５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ８（配列は出願書類の最後に示す）。転写物Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ８のコード部分を太字で示し、このコード部分は４７５位から開始され、１６１７位で終結する。転写物はまた、表２４６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４によってコードされる。公知のタンパク質（有糸分裂チェックポイントタンパク質ＢＵＢ３）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７とＢＵＢ３＿ＨＵＭＡＮとの間の比較の報告
１．Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７のアミノ酸１〜５７に対応する配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＵＢ３＿ＨＵＭＡＮのアミノ酸１〜３２８に対応し、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７のアミノ酸５８〜３８５にも対応するＭＴＧＳＮＥＦＫＬＮＱＰＰＥＤＧＩＳＳＶＫＦＳＰＮＴＳＱＦＬＬＶＳＳＷＤＴＳＶＲＬＹＤＶＰＡＮＳＭＲＬＫＹＱＨＴＧＡＶＬＤＣＡＦＹＤＰＴＨＡＷＳＧＧＬＤＨＱＬＫＭＨＤＬＮＴＤＱＥＮＬＶＧＴＨＤＡＰＩＲＣＶＥＹＣＰＥＶＮＶＭＶＴＧＳＷＤＱＴＶＫＬＷＤＰＲＴＰＣＮＡＧＴＦＳＱＰＥＫＶＹＴＬＳＶＳＧＤＲＬＩＶＧＴＡＧＲＲＶＬＶＷＤＬＲＮＭＧＹＶＱＱＲＲＥＳＳＬＫＹＱＴＲＣＩＲＡＦＰＮＫＱＧＹＶＬＳＳＩＥＧＲＶＡＶＥＹＬＤＰＳＰＥＶＱＫＫＫＹＡＦＫＣＨＲＬＫＥＮＮＩＥＱＩＹＰＶＮＡＩＳＦＨＮＩＨＮＴＦＡＴＧＧＳＤＧＦＶＮＩＷＤＰＦＮＫＫＲＬＣＱＦＨＲＹＰＴＳＩＡＳＬＡＦＳＮＤＧＴＴＬＡＩＡＳＳＹＭＹＥＭＤＤＴＥＨＰＥＤＧＩＦＩＲＱＶＴＤＡＥＴＫＰＫＳＰＣＴと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７をコードする単離キメラポリペプチド。

２．Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７の配列ＭＧＲＶＲＴＬＡＧＥＣＳＡＱＡＱＡＱＳＬＬＡＶＶＬＳＡＰＰＳＧＧＴＰＳＡＲＬＳＶＲＳＰＳＰＲＤＰＷＧＬＷＡＰＶＬＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７の先端をコードする単離ポリペプチド。

変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７はまた、表２４７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７は、以下の転写物によってコードされる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４（配列は出願書類の最後に示す）。転写物Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４のコード部分を太字で示し、このコード部分は４７５位から開始され、１６２９位で終結する。転写物はまた、表２４８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ３８８０４＿ＰＥＡ＿１＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨ３８８０４は、上の表２に列挙した２０個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、１２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、２１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、１９８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、１８０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２８は、３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、２５９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、１６９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、１７９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、１８１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、１８７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿１４は、１７９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、１５６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２０は、１６２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２３を、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、１６２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、１７２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ３８８０４＿ＰＥＡ＿１＿ｎｏｄｅ＿５を、以下の転写物中に見出すことができる：Ｈ３８８０４＿ＰＥＡ＿１＿Ｔ２４およびＨ３８８０４＿ＰＥＡ＿１＿Ｔ８。以下の表２６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/RR4oV8zYLg/QlORqeqpIp:BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P5 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3244.00 Escore: 0
Matching length: 324 Total length: 324
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
58 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
. . . . .
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 100
. . . . .
158 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
. . . . .
208 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
. . . . .
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 307
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 250
. . . . .
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
. .
358 MDDTEHPEDGIFIRQVTDAETKPK 381
||||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPK 324

Sequence name: /tmp/Db0dQEpSuo/Lr8HPXaeBg:BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P17 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3288.00 Escore: 0
Matching length: 328 Total length: 328
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
58 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
. . . . .
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 100
. . . . .
158 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
. . . . .
208 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
. . . . .
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 307
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 250
. . . . .
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
. .
358 MDDTEHPEDGIFIRQVTDAETKPKSPCT 385
||||||||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPKSPCT 328

クラスターＨＳＥＮＡ７８の説明
クラスターＨＳＥＮＡ７８は、目的の１つの転写物および７個のセグメントを特徴とし、その名称を、それぞれ表２６９および２７０に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表２７１に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である小誘導性サイトカイン（Ｓｍａｌｌｉｎｄｕｃｉｂｌｅｃｙｔｏｋｉｎｅ）Ｂ５前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＳＺ０５＿ＨＵＭＡＮ、同義語ＣＸＣＬ５、上皮由来好中球活性化タンパク質７８、好中球活性化ペプチドＥＮＡ−７８としても公知である）（配列番号１４２５）の変異型である。

タンパク質小誘導性サイトカインＢ５前駆体は、以下の機能を有することが公知であるか、そのように見なされている：好中球活性化に関与する。タンパク質小誘導性サイトカインＢ５前駆体の配列を、「小誘導性サイトカインＢ５前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質小誘導性サイトカインＢ５前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである走化性、シグナル伝達、細胞−細胞シグナル伝達、細胞増殖のポジティブコントロール、分子機能に関連する注釈付けであるケモカイン。

クラスターＨＳＥＮＡ７８を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２４のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２４および表２７２中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍および肺悪性腫瘍。

上記のように、クラスターＨＳＥＮＡ７８は、上の表２６９に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質小誘導性サイトカインＢ５前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＳＥＮＡ７８＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＥＮＡ７８＿Ｔ５によってコードされる。公知のタンパク質（小誘導性サイトカインＢ５前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＥＮＡ７８＿Ｐ２とＳＺ０５＿ＨＵＭＡＮとの間の比較の報告
１．ＳＺ０５＿ＨＵＭＡＮのアミノ酸１〜８１に対応し、ＨＳＥＮＡ７８＿Ｐ２のアミノ酸１〜８１にも対応するＭＳＬＬＳＳＲＡＡＲＶＰＧＰＳＳＳＬＣＡＬＬＶＬＬＬＬＬＴＱＰＧＰＩＡＳＡＧＰＡＡＡＶＬＲＥＬＲＣＶＣＬＱＴＴＱＧＶＨＰＫＭＩＳＮＬＱＶＦＡＩＧＰＱＣＳＫＶＥＶＶと少なくとも９０％相同な第１のアミノ酸配列を含む、ＨＳＥＮＡ７８＿Ｐ２をコードする単離キメラポリペプチド。

変異タンパク質ＨＳＥＮＡ７８＿Ｐ２はまた、表２７４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＥＮＡ７８＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＳＥＮＡ７８＿Ｐ２は、以下の転写物によってコードされる：ＨＳＥＮＡ７８＿Ｔ５（配列は出願書類の最後に示す）。転写物ＨＳＥＮＡ７８＿Ｔ５のコード部分を太字で示し、このコード部分は１４９位から開始され、３９１位で終結する。転写物はまた、表２７５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＥＮＡ７８＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＳＥＮＡ７８は、上の表２７０に列挙した７個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿０は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２７６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿２は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿６は、６８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿９は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿３は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿４は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＥＮＡ７８＿ｎｏｄｅ＿８を、以下の転写物中に見出すことができる：ＨＳＥＮＡ７８＿Ｔ５。以下の表２８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/5kiQY6MxWx/pLnTrxsCqk:SZ05_HUMAN

Sequence documentation:

Alignment of: HSENA78_P2 x SZ05_HUMAN ..

Alignment segment 1/1:

Quality: 767.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
. . .
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
|||||||||||||||||||||||||||||||
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81

クラスターＨＵＭＯＤＣＡの説明
クラスターＨＵＭＯＤＣＡは、目的の１つの転写物および１７個のセグメントを特徴とし、その名称を、それぞれ表２８３および２８４に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表２８５に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるオルニチンデカルボキシラーゼ（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＤＣＯＲ＿ＨＵＭＡＮ、同義語はＥＣ４．１．１．１７、ＯＤＣとしても公知である）（配列番号１４２６）の変異型である。

タンパク質オルニチンデカルボキシラーゼは、以下の機能を有することが公知であるか、そのように見なされている：ポリアミン生合成、第１（律速）段階。タンパク質オルニチンデカルボキシラーゼの配列を、「オルニチンデカルボキシラーゼアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表２８６に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるポリアミン生合成および分子機能に関連する注釈付けであるオルニチンデカルボキシラーゼ、リアーゼ。

クラスターＨＵＭＯＤＣＡを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２５のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２５および表２８７中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：脳悪性腫瘍、結腸直腸癌、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物。

上記のように、クラスターＨＵＭＯＤＣＡは、上の表２８３に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質オルニチンデカルボキシラーゼの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＯＤＣＡ＿Ｐ９は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＯＤＣＡ＿Ｔ１７によってコードされる。公知のタンパク質（オルニチンデカルボキシラーゼ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＯＤＣＡ＿Ｐ９とＤＣＯＲ＿ＨＵＭＡＮとの間の比較の報告
１．ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸１〜２９に対応する配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＤＣＯＲ＿ＨＵＭＡＮのアミノ酸１５１〜４６１に対応し、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸３０〜３４０にも対応するＬＶＬＲＩＡＴＤＤＳＫＡＶＣＲＬＳＶＫＦＧＡＴＬＲＴＳＲＬＬＬＥＲＡＫＥＬＮＩＤＶＶＧＶＳＦＨＶＧＳＧＣＴＤＰＥＴＦＶＱＡＩＳＤＡＲＣＶＦＤＭＧＡＥＶＧＦＳＭＹＬＬＤＩＧＧＧＦＰＧＳＥＤＶＫＬＫＦＥＥＩＴＧＶＩＮＰＡＬＤＫＹＦＰＳＤＳＧＶＲＩＩＡＥＰＧＲＹＹＶＡＳＡＦＴＬＡＶＮＩＩＡＫＫＩＶＬＫＥＱＴＧＳＤＤＥＤＥＳＳＥＱＴＦＭＹＹＶＮＤＧＶＹＧＳＦＮＣＩＬＹＤＨＡＨＶＫＰＬＬＱＫＲＰＫＰＤＥＫＹＹＳＳＳＩＷＧＰＴＣＤＧＬＤＲＩＶＥＲＣＤＬＰＥＭＨＶＧＤＷＭＬＦＥＮＭＧＡＹＴＶＡＡＡＳＴＦＮＧＦＱＲＰＴＩＹＹＶＭＳＧＰＡＷＱＬＭＱＱＦＱＮＰＤＦＰＰＥＶＥＥＱＤＡＳＴＬＰＶＳＣＡＷＥＳＧＭＫＲＨＲＡＡＣＡＳＡＳＩＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチド。

２．ＨＵＭＯＤＣＡ＿Ｐ９の配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＯＤＣＡ＿Ｐ９の先端をコードする単離ポリペプチド。

ＨＵＭＯＤＣＡ＿Ｐ９とＡＡＡ５９９６８（配列番号１７０２）との間の比較の報告
１．ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸１〜２９に対応する配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＡＡ５９９６８のアミノ酸４０〜３５０に対応し、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸３０〜３４０にも対応するＬＶＬＲＩＡＴＤＤＳＫＡＶＣＲＬＳＶＫＦＧＡＴＬＲＴＳＲＬＬＬＥＲＡＫＥＬＮＩＤＶＶＧＶＳＦＨＶＧＳＧＣＴＤＰＥＴＦＶＱＡＩＳＤＡＲＣＶＦＤＭＧＡＥＶＧＦＳＭＹＬＬＤＩＧＧＧＦＰＧＳＥＤＶＫＬＫＦＥＥＩＴＧＶＩＮＰＡＬＤＫＹＦＰＳＤＳＧＶＲＩＩＡＥＰＧＲＹＹＶＡＳＡＦＴＬＡＶＮＩＩＡＫＫＩＶＬＫＥＱＴＧＳＤＤＥＤＥＳＳＥＱＴＦＭＹＹＶＮＤＧＶＹＧＳＦＮＣＩＬＹＤＨＡＨＶＫＰＬＬＱＫＲＰＫＰＤＥＫＹＹＳＳＳＩＷＧＰＴＣＤＧＬＤＲＩＶＥＲＣＤＬＰＥＭＨＶＧＤＷＭＬＦＥＮＭＧＡＹＴＶＡＡＡＳＴＦＮＧＦＱＲＰＴＩＹＹＶＭＳＧＰＡＷＱＬＭＱＱＦＱＮＰＤＦＰＰＥＶＥＥＱＤＡＳＴＬＰＶＳＣＡＷＥＳＧＭＫＲＨＲＡＡＣＡＳＡＳＩＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチド。

ＨＵＭＯＤＣＡ＿Ｐ９とＡＡＨ１４５６２（配列番号１７０３）との間の比較の報告
１．ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸１〜２９に対応する配列ＭＫＳＬＴＡＴＳＳＭＫＶＬＬＰＲＴＦＷＴＲＫＬＭＫＦＬＬＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＡＨ１４５６２のアミノ酸８６〜３９６に対応し、ＨＵＭＯＤＣＡ＿Ｐ９のアミノ酸３０〜３４０にも対応するＬＶＬＲＩＡＴＤＤＳＫＡＶＣＲＬＳＶＫＦＧＡＴＬＲＴＳＲＬＬＬＥＲＡＫＥＬＮＩＤＶＶＧＶＳＦＨＶＧＳＧＣＴＤＰＥＴＦＶＱＡＩＳＤＡＲＣＶＦＤＭＧＡＥＶＧＦＳＭＹＬＬＤＩＧＧＧＦＰＧＳＥＤＶＫＬＫＦＥＥＩＴＧＶＩＮＰＡＬＤＫＹＦＰＳＤＳＧＶＲＩＩＡＥＰＧＲＹＹＶＡＳＡＦＴＬＡＶＮＩＩＡＫＫＩＶＬＫＥＱＴＧＳＤＤＥＤＥＳＳＥＱＴＦＭＹＹＶＮＤＧＶＹＧＳＦＮＣＩＬＹＤＨＡＨＶＫＰＬＬＱＫＲＰＫＰＤＥＫＹＹＳＳＳＩＷＧＰＴＣＤＧＬＤＲＩＶＥＲＣＤＬＰＥＭＨＶＧＤＷＭＬＦＥＮＭＧＡＹＴＶＡＡＡＳＴＦＮＧＦＱＲＰＴＩＹＹＶＭＳＧＰＡＷＱＬＭＱＱＦＱＮＰＤＦＰＰＥＶＥＥＱＤＡＳＴＬＰＶＳＣＡＷＥＳＧＭＫＲＨＲＡＡＣＡＳＡＳＩＮＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、ＨＵＭＯＤＣＡ＿Ｐ９をコードする単離キメラポリペプチド。

変異タンパク質ＨＵＭＯＤＣＡ＿Ｐ９はまた、表２８９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＤＣＡ＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＵＭＯＤＣＡ＿Ｐ９は、以下の転写物によってコードされる：ＨＵＭＯＤＣＡ＿Ｔ１７（配列は出願書類の最後に示す）。転写物ＨＵＭＯＤＣＡ＿Ｔ１７のコード部分を太字で示し、このコード部分は５２８位から開始され、１５４７位で終結する。転写物はまた、表２９０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＤＣＡ＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＯＤＣＡは、上の表２８４に列挙した１７個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿１は、７６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿２５は、１９０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３２は、２４９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３６は、３４８
個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３９は、２９７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿４１は、２３０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿０は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿１０は、１０７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿１２は、１３２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表２９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿１３は、１２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿２は、８１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿２７は、１８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３は、８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３０は、１９６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３４は、２５９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿３８は、２７２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＤＣＡ＿ｎｏｄｅ＿４０は、２３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＤＣＡ＿Ｔ１７。以下の表３０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:DCOR_HUMAN

Sequence documentation:

Alignment of: HUMODCA_P9 x DCOR_HUMAN ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 200
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 250
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
251 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 300
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 350
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
351 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 400
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
401 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 450
.
330 RAACASASINV 340
|||||||||||
451 RAACASASINV 461

Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:AAA59968

Sequence documentation:

Alignment of: HUMODCA_P9 x AAA59968 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
40 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 89
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
90 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 139
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
140 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 189
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
190 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 239
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
240 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 289
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
290 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 339
.
330 RAACASASINV 340
|||||||||||
340 RAACASASINV 350

Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:AAH14562

Sequence documentation:

Alignment of: HUMODCA_P9 x AAH14562 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
86 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 135
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
136 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 185
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
186 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 235
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
236 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 285
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
286 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 335
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
336 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 385
.
330 RAACASASINV 340
|||||||||||
386 RAACASASINV 396

クラスターＲ００２９９の説明
クラスターＲ００２９９は、目的の１つの転写物および１２個のセグメントを特徴とし、その名称を、それぞれ表３０８および３０９に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表３１０に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるテスカルシン（Ｔｅｓｃａｌｃｉｎ）（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＴＥＳＣ＿ＨＵＭＡＮ、同義語ＴＳＣとしても公知である）（配列番号１４２７）の変異型である。

タンパク質テスカルシンは、以下の機能を有することが公知であるか、そのように見なされている：カルシウムに結合する。タンパク質テスカルシンの配列を、「テスカルシンアミノ酸配列」として出願書類の最後に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：分子機能に関連する注釈付けであるカルシウム結合。

クラスターＲ００２９９を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２６のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２６および表３１１中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：肺悪性腫瘍。

上記のように、クラスターＲ００２９９は、上の表３０８に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質テスカルシンの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ００２９９＿Ｐ３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ００２９９＿Ｔ２によってコードされる。公知のタンパク質（テスカルシン）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ００２９９＿Ｐ３とＱ９ＮＷＴ９（配列番号１７０４）との間の比較の報告
１．Ｒ００２９９＿Ｐ３のアミノ酸１〜４４に対応する配列ＭＡＥＫＡＬＬＣＰＳＳＡＧＬＧＴＷＰＷＶＬＮＳＡＷＰＶＬＰＬＡＶＤＱＧＶＤＷＲＰＲＧＰＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ９ＮＷＴ９のアミノ酸７４〜１９１に対応し、Ｒ００２９９＿Ｐ３のアミノ酸４５〜１６２にも対応するＳＳＤＱＩＥＱＬＨＲＲＦＫＱＬＳＧＤＱＰＴＩＲＫＥＮＦＮＮＶＰＤＬＥＬＮＰＩＲＳＫＩＶＲＡＦＦＤＮＲＮＬＲＫＧＰＳＧＬＡＤＥＩＮＦＥＤＦＬＴＩＭＳＹＦＲＰＩＤＴＴＭＤＥＥＱＶＥＬＳＲＫＥＫＬＲＦＬＦＨＭＹＤＳＤＳＤＧＲＩＴＬＥＥＹＲＮＶと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ００２９９＿Ｐ３のアミノ酸１６３〜２３８に対応する配列ＶＥＥＬＬＳＧＮＰＨＩＥＫＥＳＡＲＳＩＡＤＧＡＭＭＥＡＡＳＶＣＭＧＱＭＥＰＤＱＶＹＥＧＩＴＦＥＤＦＬＫＩＷＱＧＩＤＩＥＴＫＭＨＶＲＦＬＮＭＥＴＭＡＬＣＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ００２９９＿Ｐ３をコードする単離キメラポリペプチド。

２．Ｒ００２９９＿Ｐ３の配列ＭＡＥＫＡＬＬＣＰＳＳＡＧＬＧＴＷＰＷＶＬＮＳＡＷＰＶＬＰＬＡＶＤＱＧＶＤＷＲＰＲＧＰＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ００２９９＿Ｐ３の先端をコードする単離ポリペプチド。

３．Ｒ００２９９＿Ｐ３中の配列ＶＥＥＬＬＳＧＮＰＨＩＥＫＥＳＡＲＳＩＡＤＧＡＭＭＥＡＡＳＶＣＭＧＱＭＥＰＤＱＶＹＥＧＩＴＦＥＤＦＬＫＩＷＱＧＩＤＩＥＴＫＭＨＶＲＦＬＮＭＥＴＭＡＬＣＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ００２９９＿Ｐ３のテールをコードする単離ポリペプチド。

Ｒ００２９９＿Ｐ３とＴＥＳＣ＿ＨＵＭＡＮとの間の比較の報告
１．Ｒ００２９９＿Ｐ３のアミノ酸１〜４４に対応する配列ＭＡＥＫＡＬＬＣＰＳＳＡＧＬＧＴＷＰＷＶＬＮＳＡＷＰＶＬＰＬＡＶＤＱＧＶＤＷＲＰＲＧＰＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＴＥＳＣ＿ＨＵＭＡＮのアミノ酸２１〜２１４に対応し、Ｒ００２９９＿Ｐ３のアミノ酸４５〜２３８にも対応するＳＳＤＱＩＥＱＬＨＲＲＦＫＱＬＳＧＤＱＰＴＩＲＫＥＮＦＮＮＶＰＤＬＥＬＮＰＩＲＳＫＩＶＲＡＦＦＤＮＲＮＬＲＫＧＰＳＧＬＡＤＥＩＮＦＥＤＦＬＴＩＭＳＹＦＲＰＩＤＴＴＭＤＥＥＱＶＥＬＳＲＫＥＫＬＲＦＬＦＨＭＹＤＳＤＳＤＧＲＩＴＬＥＥＹＲＮＶＶＥＥＬＬＳＧＮＰＨＩＥＫＥＳＡＲＳＩＡＤＧＡＭＭＥＡＡＳＶＣＭＧＱＭＥＰＤＱＶＹＥＧＩＴＦＥＤＦＬＫＩＷＱＧＩＤＩＥＴＫＭＨＶＲＦＬＮＭＥＴＭＡＬＣＨと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ００２９９＿Ｐ３をコードする単離キメラポリペプチド。

変異タンパク質Ｒ００２９９＿Ｐ３はまた、表３１３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ００２９９＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｒ００２９９＿Ｐ３は、以下の転写物によってコードされる：Ｒ００２９９＿Ｔ２（配列は出願書類の最後に示す）。転写物Ｒ００２９９＿Ｔ２のコード部分を太字で示し、このコード部分は１４２位から開始され、８５５位で終結する。転写物はまた、表３１４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ００２９９＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ００２９９は、上の表３０９に列挙した１２個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿２は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿３０は、７５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿１０は、４６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿１４は、６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿１５を、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿２０は、６６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿２３は、７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿２５は、６２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿２８を、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿３１は、４８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿５は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ００２９９＿ｎｏｄｅ＿９を、以下の転写物中に見出すことができる：Ｒ００２９９＿Ｔ２。以下の表３２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、この遺伝子のマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表３２７に示す）。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/OleVDhrKQ0/EjblgLomjM:Q9NWT9

Sequence documentation:

Alignment of: R00299_P3 x Q9NWT9 ..

Alignment segment 1/1:

Quality: 1162.00 Escore: 0
Matching length: 118 Total length: 118
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||||||||||||
74 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 123
. . . . .
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 144
||||||||||||||||||||||||||||||||||||||||||||||||||
124 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 173
.
145 MYDSDSDGRITLEEYRNV 162
||||||||||||||||||
174 MYDSDSDGRITLEEYRNV 191

Sequence name: /tmp/OleVDhrKQ0/EjblgLomjM:TESC_HUMAN

Sequence documentation:

Alignment of: R00299_P3 x TESC_HUMAN ..

Alignment segment 1/1:

Quality: 1920.00 Escore: 0
Matching length: 194 Total length: 194
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||||||||||||
21 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 70
. . . . .
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 144
||||||||||||||||||||||||||||||||||||||||||||||||||
71 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 120
. . . . .
145 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 194
||||||||||||||||||||||||||||||||||||||||||||||||||
121 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 170
. . . .
195 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 238
||||||||||||||||||||||||||||||||||||||||||||
171 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 214

クラスターＷ６０２８２の説明
クラスターＷ６０２８２は、目的の１つの転写物および６個のセグメントを特徴とし、その名称を、それぞれ表３２８および３２９に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表３３０に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるカリクレイン１１前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＫＬＫＢ＿ＨＵＭＡＮ、同義語ＥＣ３．４．２１．−、ヒッポスタシン（Ｈｉｐｐｏｓｔａｓｉｎ）、チロシン様プロテアーゼとしても公知である）（配列番号１４２８）の変異型である。

タンパク質カリクレイン１１前駆体は、以下の機能を有することが公知であるか、そのように見なされている：多機能プロテアーゼの可能性がある。Ｐｈｅ−Ａｒｇ−４−メチルクマリル−７−アミド（カリクレイン基質）を有効に切断し、カリクレインおよび
トリプシンの他の基質を弱く切断する。タンパク質カリクレイン１１前駆体の配列を、「カリクレイン１１前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質カリクレイン１１前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるタンパク質分解およびペプチド分解、分子機能に関連する注釈付けであるキモトリプシン、トリプシン、セリン型ペプチダーゼ、ヒドロラーゼ。

上記のように、クラスターＷ６０２８２は、上の表１に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質カリクレイン１１前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１によってコードされる。公知のタンパク質（カリクレイン１１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４とＱ８ＩＸＤ７（配列番号１７０５）との間の比較の報告
１．Ｑ８ＩＸＤ７のアミノ酸１〜６６に対応し、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のアミノ酸１〜６６にも対応するＭＲＩＬＱＬＩＬＬＡＬＡＴＧＬＶＧＧＥＴＲＩＩＫＧＦＥＣＫＰＨＳＱＰＷＱＡＡＬＦＥＫＴＲＬＬＣＧＡＴＬＩＡＰＲＷＬＬＴＡＡＨＣＬＫＰと少なくとも９０％相同な第１のアミノ酸配列と、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のアミノ酸６７〜８０に対応する配列ＴＰＡＳＨＬＡＭＲＱＨＨＨＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチド。

２．Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４中の配列ＴＰＡＳＨＬＡＭＲＱＨＨＨＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチド。

変異タンパク質Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４はまた、表３３１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４は、以下の転写物によってコードされる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１のコード部分を太字で示し、このコード部分は７０５位から開始され、９４４位で終結する。転写物はまた、表３３２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｗ６０２８２＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＷ６０２８２は、上の表３２９に列挙した６個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＷ６０２８２＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１。以下の表３３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＷ６０２８２＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、４９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１。以下の表３３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＷ６０２８２＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１。以下の表３３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＷ６０２８２＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１。以下の表３３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＷ６０２８２＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、４８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１。以下の表３３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＷ６０２８２＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｗ６０２８２＿ＰＥＡ＿１＿Ｔ１１。以下の表３３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/rL7Wdc5hYg/eLOAfKIgqD:KLKB_HUMAN

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x KLKB_HUMAN ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 72 Total length: 72
Matching Percent Similarity: 94.44 Matching Percent Identity: 94.44
Total Percent Similarity: 94.44 Total Percent Identity: 94.44
Gaps: 0

Alignment:
. . . . .
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
. .
51 LIAPRWLLTAAHCLKPTPASHL 72
|||||||||||||||| ||
51 LIAPRWLLTAAHCLKPRYIVHL 72

Sequence name: /tmp/rL7Wdc5hYg/eLOAfKIgqD:Q8IXD7

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x Q8IXD7 ..

Alignment segment 1/1:

Quality: 642.00 Escore: 0
Matching length: 66 Total length: 66
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
.
51 LIAPRWLLTAAHCLKP 66
||||||||||||||||
51 LIAPRWLLTAAHCLKP 66

クラスターＺ４１６４４の説明
クラスターＷ６０２８２は、目的の１つの転写物および２１個のセグメントを特徴とし、その名称を、それぞれ表３３９および３４０に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表３４１に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である小誘導性サイトカインＢ１４前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＳＺ１４＿ＨＵＭＡＮ、同義語ＣＸＣＬ１４、ケモカインＢＲＡＫとしても公知である）（配列番号１４２９）の変異型である。

タンパク質小誘導性サイトカインＢ１４前駆体の配列を、「小誘導性サイトカインＢ１４前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質小誘導性サイトカインＢ１４前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである走化性、シグナル伝達、細胞−細胞シグナル伝達、分子機能に関連する注釈付けであるケモカイン。

クラスターＺ４１６４４を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２７のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２７および表３４２中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：肺悪性腫瘍。

上記のように、クラスターＺ４１６４４は、上の表３３９に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質小誘導性サイトカインＢ１４前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物４１６４４＿ＰＥＡ＿１＿Ｔ５によってコードされる。公知のタンパク質（小誘導性サイトカインＢ１４前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０とＳＺ１４＿ＨＵＭＡＮとの間の比較の報告
１．ＳＺ１４＿ＨＵＭＡＮのアミノ酸１〜９５に対応し、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜９５にも対応するＭＲＬＬＡＡＡＬＬＬＬＬＬＡＬＹＴＡＲＶＤＧＳＫＣＫＣＳＲＫＧＰＫＩＲＹＳＤＶＫＫＬＥＭＫＰＫＹＰＨＣＥＥＫＭＶＩＩＴＴＫＳＶＳＲＹＲＧＱＥＨＣＬＨＰＫＬＱＳＴＫＲＦＩＫＷＹＮＡＷＮＥＫＲＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９６〜１２３に対応する配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

２．Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０中の配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチド。

Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０とＱ９ＮＳ２１（配列番号１７０６）との間の比較の報告
１．Ｑ９ＮＳ２１のアミノ酸１３〜１０７に対応し、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜９５にも対応するＭＲＬＬＡＡＡＬＬＬＬＬＬＡＬＹＴＡＲＶＤＧＳＫＣＫＣＳＲＫＧＰＫＩＲＹＳＤＶＫＫＬＥＭＫＰＫＹＰＨＣＥＥＫＭＶＩＩＴＴＫＳＶＳＲＹＲＧＱＥＨＣＬＨＰＫＬＱＳＴＫＲＦＩＫＷＹＮＡＷＮＥＫＲＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９６〜１２３に対応する配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

２．Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０中の配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチド

Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０とＡＡＱ８９２６５（配列番号７８１）との間の比較の報告
１．ＡＡＱ８９２６５のアミノ酸１３〜１０７に対応し、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜９５にも対応するＭＲＬＬＡＡＡＬＬＬＬＬＬＡＬＹＴＡＲＶＤＧＳＫＣＫＣＳＲＫＧＰＫＩＲＹＳＤＶＫＫＬＥＭＫＰＫＹＰＨＣＥＥＫＭＶＩＩＴＴＫＳＶＳＲＹＲＧＱＥＨＣＬＨＰＫＬＱＳＴＫＲＦＩＫＷＹＮＡＷＮＥＫＲＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９６〜１２３に対応する配列ＹＡＰＰＬＬＴＦＬＰＴＲＰＳＣＧＳＱＤＧＫＧＰＰＨＱＶＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

変異タンパク質Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０はまた、表３４４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０は、以下の転写物によってコードされる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５のコード部分を太字で示し、このコード部分は７４４位から開始され、１１１２位で終結する。転写物はまた、表３４５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４１６４４＿ＰＥＡ＿１＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＺ４１６４４は、上の表３４０に列挙した２１個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、５３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２０は、２６０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、１８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１は、５３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、１３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１３を、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、１５２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１７を、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、１１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、５８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２１を、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、１６４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、１６９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、１３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、７５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、１０１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４１６４４＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、１３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４１６４４＿ＰＥＡ＿１＿Ｔ５。以下の表３６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:SZ14_HUMAN

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x SZ14_HUMAN ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95

Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:Q9NS21

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x Q9NS21 ..

Alignment segment 1/1:

Quality: 957.00 Escore: 0
Matching length: 96 Total length: 96
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.96
Total Percent Similarity: 100.00 Total Percent Identity: 98.96
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRY 96
|||||||||||||||||||||||||||||||||||||||||||||:
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRF 108

Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:AAQ89265

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x AAQ89265 ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 107

クラスターＺ４４８０８の説明
クラスターＺ４４８０８は、目的の５つの転写物および２１個のセグメントを特徴とし、その名称を、それぞれ表３６７および３６８に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表３６９に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＳＭＯ２＿ＨＵＭＡＮ）、同義語分泌性モジュラーカルシウム結合タンパク質２、ＳＭＯＣ−２、平滑筋関連タンパク質２、ＳＭＡＰ−２、ＭＳＴＰ１１７としても公知である）（配列番号１４３０）の変異型である。

タンパク質ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体は、以下の機能を有することが公知であるか、そのように見なされている：カルシウム結合。タンパク質ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体の配列を、「ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表３７０に示す。

タンパク質ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体の局在化は、分泌と考えられる。

クラスターＺ４４８０８を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図２８のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図２８および表３７１中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：結腸直腸癌、肺癌、および膵臓癌。

上記のように、クラスターＺ４４８０８は、上の表３６７に列挙した５つの転写物を特徴とする。これらの転写物は、タンパク質ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４によってコードされる。公知のタンパク質（ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５とＳＭＯ２＿ＨＵＭＡＮとの間の比較の報告
１．ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜４４１に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜４４１にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴＤＤＡＡＡＰＡＬＥＴＱＰＱＧＤＥＥＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨＴＰＲＧＨＡＥＳＴＳＮＲＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のアミノ酸４４２〜４６４に対応する配列ＤＡＭＶＶＳＳＲＰＫＡＴＴＨＲＫＳＲＴＬＳＲＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５中の配列ＤＡＭＶＶＳＳＲＰＫＡＴＴＨＲＫＳＲＴＬＳＲＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４（配列は出願書類の最後に示す）。転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４のコード部分を太字で示し、このコード部分は５８６位から開始され、１９７７位で終結する。転写物はまた、表３７３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５によってコードされる。公知のタンパク質（ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６とＳＭＯ２＿ＨＵＭＡＮとの間の比較の報告
１．ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜４２８に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜４２８にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴＤＤＡＡＡＰＡＬＥＴＱＰＱＧＤＥＥＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のアミノ酸４２９〜４３４に対応する配列ＲＳＫＲＮＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチド。

２．Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６中の配列ＲＳＫＲＮＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６はまた、表３７４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６は、以下の転写物によってコードされる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５のコード部分を太字で示し、このコード部分は５８６位から開始され、１８８７位で終結する。転写物はまた、表３７５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ９によってコードされる。公知のタンパク質（ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７とＳＭＯ２＿ＨＵＭＡＮとの間の比較の報告
１．ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜４４１に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜４４１にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴＤＤＡＡＡＰＡＬＥＴＱＰＱＧＤＥＥＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨＴＰＲＧＨＡＥＳＴＳＮＲＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のアミノ酸４４２〜４５４に対応する配列ＬＬＷＬＲＧＫＶＳＦＹＣＦを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

２．Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７中の配列ＬＬＷＬＲＧＫＶＳＦＹＣＦと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７はまた、表３７６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７は、以下の転写物によってコードされる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ９（配列は出願書類の最後に示す）。転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ９のコード部分を太字で示し、このコード部分は５８６位から開始され、１９４７位で終結する。転写物はまた、表３７７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１によってコードされる。この転写物の同定を、以下の引用文献に記載の非ＥＳＴベースの選択的スプライシングの同定方法を使用して行った：ＳｏｒｅｋＲｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．（２００４）１４：１６１７−２３。公知のタンパク質（ＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１とＳＭＯ２＿ＨＵＭＡＮとの間の比較の報告
１．ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１〜１７０に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１〜１７０にも対応するＭＬＬＰＱＬＣＷＬＰＬＬＡＧＬＬＰＰＶＰＡＱＫＦＳＡＬＴＦＬＲＶＤＱＤＫＤＫＤＣＳＬＤＣＡＧＳＰＱＫＰＬＣＡＳＤＧＲＴＦＬＳＲＣＥＦＱＲＡＫＣＫＤＰＱＬＥＩＡＹＲＧＮＣＫＤＶＳＲＣＶＡＥＲＫＹＴＱＥＱＡＲＫＥＦＱＱＶＦＩＰＥＣＮＤＤＧＴＹＳＱＶＱＣＨＳＹＴＧＹＣＷＣＶＴＰＮＧＲＰＩＳＧＴＡＶＡＨＫＴＰＲＣＰＧＳＶＮＥＫＬＰＱＲＥＧＴＧＫＴと少なくとも９０％相同な第１のアミノ酸配列と、ＳＭＯ２＿ＨＵＭＡＮのアミノ酸１８８〜４４６に対応し、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１７１〜４２９にも対応するＤＩＡＳＲＹＰＴＬＷＴＥＱＶＫＳＲＱＮＫＴＮＫＮＳＶＳＳＣＤＱＥＨＱＳＡＬＥＥＡＫＱＰＫＮＤＮＶＶＩＰＥＣＡＨＧＧＬＹＫＰＶＱＣＨＰＳＴＧＹＣＷＣＶＬＶＤＴＧＲＰＩＰＧＴＳＴＲＹＥＱＰＫＣＤＮＴＡＲＡＨＰＡＫＡＲＤＬＹＫＧＲＱＬＱＧＣＰＧＡＫＫＨＥＦＬＴＳＶＬＤＡＬＳＴＤＭＶＨＡＡＳＤＰＳＳＳＳＧＲＬＳＥＰＤＰＳＨＴＬＥＥＲＶＶＨＷＹＦＫＬＬＤＫＮＳＳＧＤＩＧＫＫＥＩＫＰＦＫＲＦＬＲＫＫＳＫＰＫＫＣＶＫＫＦＶＥＹＣＤＶＮＮＤＫＳＩＳＶＱＥＬＭＧＣＬＧＶＡＫＥＤＧＫＡＤＴＫＫＲＨＴＰＲＧＨＡＥＳＴＳＮＲＱＰＲＫＱＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＴＤを含み、以下の構造：アミノ酸番号１７０−ｘ〜１７０のいずれかから始まり、アミノ酸番号１７１＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１はまた、表３７８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１は、以下の転写物によってコードされる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１のコード部分を太字で示し、このコード部分は５８６位から開始され、１８７２位で終結する。転写物はまた、表３７９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ４４８０８＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＺ４４８０８は、上の表３６８に列挙した２１個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、５２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３２は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ８。以下の表３８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３３は、１３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ５。以下の表３８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、１１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ５。以下の表３８６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３７は、１２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ５。以下の表３８７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿４１は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表３９３に示す）。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５。以下の表３９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表３９５に示す）。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、４４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、７０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ５。以下の表３９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３５を、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ５。以下の表３９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿３９は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表３９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表４００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、３０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表４０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ４４８０８＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ１１、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ４、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ５、Ｚ４４８０８＿ＰＥＡ＿１＿Ｔ８、およびＺ４４８０８＿ＰＥＡ＿１＿Ｔ９。以下の表４０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/vUqLu6eAVZ/K3JDuPvaLo:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P5 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
|||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441

Sequence name: /tmp/QSUNfTsJ5y/kLOw5Vb6SD:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P6 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4310.00 Escore: 0
Matching length: 428 Total length: 428
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. .
401 DKSISVQELMGCLGVAKEDGKADTKKRH 428
||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRH 428

Sequence name: /tmp/MZVdR4PVdM/5uN8RwViJ1:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P7 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
|||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441

Sequence name: /tmp/3fGVxqLloe/J5mQduAd0F:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P11 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4228.00 Escore: 0
Matching length: 429 Total length: 446
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.19 Total Percent Identity: 96.19
Gaps: 1

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKT.................DIASRYPTLWTEQ 183
|||||||||||||||||||| |||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
184 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 233
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
234 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 283
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
284 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 333
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
334 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 383
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
384 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG 429
||||||||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG 446

正常および癌性肺組織における配列名Ｚ４４８０８ｊｕｎｃ８−１１中に示すアンプリコンによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体Ｚ４４８０８転写物の発現
ｊｕｎｃ８−１１、Ｚ４４８０８ｊｕｎｃ８−１１アンプリコン（配列番号１６５１）、ならびにＺ４４８０８ｊｕｎｃ８−１１Ｆ（配列番号１６４９）およびＺ４４８０８ｊｕｎｃ８−１１Ｒ（配列番号１６５０）プライマーによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体（分泌性モジュラーカルシウム結合タンパク質２）（ＳＭＯＣ−２）（平滑筋関連タンパク質２）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図２９は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記ＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体転写物の過剰発現を示すヒストグラムである。

図２９から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち２個および８個の小細胞癌サンプルのうち３個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｚ４４８０８ｊｕｎｃ８−１１Ｆ順方向プライマーおよびＺ４４８０８ｊｕｎｃ８−１１Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｚ４４８０８ｊｕｎｃ８−１１。

順方向プライマー（配列番号１６４９）：ＧＡＡＧＧＣＡＣＡＧＧＡＡＡＡＡＣＡＧＡＴＡＴＴＧ
逆方向プライマー（配列番号１６５０）：ＴＧＧＴＧＣＴＣＴＴＧＧＴＣＡＣＡＧＧＡＴ
アンプリコン（配列番号１６５１）：ＧＡＡＧＧＣＡＣＡＧＧＡＡＡＡＡＣＡＧＡＴＡＴＴＧＣＡＴＣＡＣＧＴＴＡＣＣＣＴＡＣＣＣＴＴＴＧＧＡＣＴＧＡＡＣＡＧＧＴＴＡＡＡＡＧＴＣＧＧＣＡＧＡＡＣＡＡＡＡＣＣＡＡＴＡＡＧＡＡＴＴＣＡＧＴＧＴＣＡＴＣＣＴＧＴＧＡＣＣＡＡＧＡＧＣＡＣＣＡ

異なる正常組織に配列名Ｚ４４８０８ｊｕｎｃ８−１１中に示すアンプリコンによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体（分泌性モジュラーカルシウム結合タンパク質２）（ＳＭＯＣ−２）（平滑筋関連タンパク質２）Ｚ４４８０８転写物の発現
Ｚ４４８０８ｊｕｎｃ８−１１アンプリコン（配列番号１６５１）ならびにプライマーＺ４４８０８ｊｕｎｃ８−１１Ｆ（配列番号１６４９）およびＺ４４８０８ｊｕｎｃ８−１１Ｒ（配列番号１６５０）によって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体（分泌性モジュラーカルシウム結合タンパク質２）（ＳＭＯＣ−２）（平滑筋関連タンパク質２）Ｚ４４８０８転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン，配列番号１６３３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、卵巣サンプル（サンプル番号１８〜２０、表３）の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。

プライマー：
順方向プライマー（配列番号１６４９）：ＧＡＡＧＧＣＡＣＡＧＧＡＡＡＡＡＣＡＧＡＴＡＴＴＧ
逆方向プライマー（配列番号１６５０）：ＴＧＧＴＧＣＴＣＴＴＧＧＴＣＡＣＡＧＧＡＴ
アンプリコン（配列番号１６５１）：ＧＡＡＧＧＣＡＣＡＧＧＡＡＡＡＡＣＡＧＡＴＡＴＴＧＣＡＴＣＡＣＧＴＴＡＣＣＣＴＡＣＣＣＴＴＴＧＧＡＣＴＧＡＡＣＡＧＧＴＴＡＡＡＡＧＴＣＧＧＣＡＧＡＡＣＡＡＡＡＣＣＡＡＴＡＡＧＡＡＴＴＣＡＧＴＧＴＣＡＴＣＣＴＧＴＧＡＣＣＡＡＧＡＧＣＡＣＣＡ

結果を図１８に示し、これは、異なる正常組織に配列名Ｚ４４８０８ｊｕｎｃ８−１１中に示すアンプリコンによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２前駆体（分泌性モジュラーカルシウム結合タンパク質２）（ＳＭＯＣ−２）（平滑筋関連タンパク質２）Ｚ４４８０８の発現を示す。

クラスターＡＡ１６１１８７の説明
クラスターＡＡ１６１１８７は、目的の７つの転写物および２０個のセグメントを特徴とし、その名称を、それぞれ表４０３および４０４に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表４０５に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるテスチシン（Ｔｅｓｔｉｓｉｎ）前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＴＥＳＴ＿ＨＵＭＡＮ）、同義語ＥＣ３．４．２１．−、好酸球セリンプロテアーゼ１、ＥＳＰ−１、ＵＮＱ２６６／ＰＲＯ３０３としても公知である）（配列番号１４３１）の変異型である。

タンパク質テスチシン前駆体は、以下の機能を有することが公知であるか、そのように見なされている：精巣生殖細胞成熟に関連するタンパク質分解事象を調節することができる。タンパク質テスチシン前駆体の配列を、「テスチシン前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質テスチシン前駆体の局在化は、ＧＰＩ−アンカーによって膜に結合していると考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：分子機能に関連する注釈付けであるセリン型ペプチダーゼおよび細胞成分に関連する注釈付けである膜画分、細胞質、原形質膜。

クラスターＡＡ１６１１８７を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図３０のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３０および表４０６中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：悪性脳腫瘍、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物。

上記のように、クラスターＡＡ１６１１８７は、上の表４０３に列挙した７つの転写物を特徴とする。これらの転写物は、タンパク質テスチシン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＡＡ１６１１８７＿Ｐ１は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＡ１６１１８７＿Ｔ０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。

変異タンパク質ＡＡ１６１１８７＿Ｐ１はまた、表４０８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＡＡ１６１１８７＿Ｐ１は、以下の転写物によってコードされる：ＡＡ１６１１８７＿Ｔ０（配列は出願書類の最後に示す）。転写物ＡＡ１６１１８７＿Ｔ０のコード部分を太字で示し、このコード部分は１０７位から開始され、１０４８位で終結する。転写物はまた、表４０９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＡＡ１６１１８７＿Ｐ６は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＡ１６１１８７＿Ｔ７によってコードされる。公知のタンパク質（テスチシン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＡＡ１６１１８７＿Ｐ６とＴＥＳＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＡＡ１６１１８７＿Ｐ６のアミノ酸１〜４２に対応するＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸３１〜３１４に対応し、ＡＡ１６１１８７＿Ｐ６のアミノ酸４３〜３２６にも対応するＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥＡＬＰＳＰＨＴＬＱＥＶＱＶＡＩＩＮＮＳＭＣＮＨＬＦＬＫＹＳＦＲＫＤＩＦＧＤＭＶＣＡＧＮＡＱＧＧＫＤＡＣＦＧＤＳＧＧＰＬＡＣＮＫＮＧＬＷＹＱＩＧＶＶＳＷＧＶＧＣＧＲＰＮＲＰＧＶＹＴＮＩＳＨＨＦＥＷＩＱＫＬＭＡＱＳＧＭＳＱＰＤＰＳＷＰＬＬＦＦＰＬＬＷＡＬＰＬＬＧＰＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ６をコードする単離キメラポリペプチド。

２．ＡＡ１６１１８７＿Ｐ６の配列ＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ６の先端をコードする単離ポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質ＡＡ１６１１８７＿Ｐ６はまた、表４１０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質テスチシン前駆体と比較した変異タンパク質ＡＡ１６１１８７＿Ｐ６のグリコシル化部位を表４１１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＡＡ１６１１８７＿Ｐ６は、以下の転写物によってコードされる：ＡＡ１６１１８７＿Ｔ７（配列は出願書類の最後に示す）。転写物ＡＡ１６１１８７＿Ｔ７のコード部分を太字で示し、このコード部分は１位から開始され、９７９位で終結する。転写物はまた、表４１２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＡＡ１６１１８７＿Ｐ１３は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＡ１６１１８７＿Ｔ１５によってコードされる。公知のタンパク質（テスチシン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＡＡ１６１１８７＿Ｐ１３とＴＥＳＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＡＡ１６１１８７＿Ｐ１３のアミノ酸１〜１８３にも対応するＭＧＡＲＧＡＬＬＬＡＬＬＬＡＲＡＧＬＲＫＰＥＳＱＥＡＡＰＬＳＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１３のアミノ酸１８４〜２１３に対応する配列ＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１３をコードする単離キメラポリペプチド。

２．ＡＡ１６１１８７＿Ｐ１３中の配列ＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１３のテールをコードする単離ポリペプチド。

変異タンパク質ＡＡ１６１１８７＿Ｐ１３はまた、表４１３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質テスチシン前駆体と比較した変異タンパク質ＡＡ１６１１８７＿Ｐ１３のグリコシル化部位を表４１４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＡＡ１６１１８７＿Ｐ１３は、以下の転写物によってコードされる：ＡＡ１６１１８７＿Ｔ１５（配列は出願書類の最後に示す）。転写物ＡＡ１６１１８７＿Ｔ１５のコード部分を太字で示し、このコード部分は１０７位から開始され、７４５位で終結する。転写物はまた、表４１５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＡＡ１６１１８７＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＡ１６１１８７＿Ｔ１６によってコードされる。公知のタンパク質（テスチシン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＡＡ１６１１８７＿Ｐ１４とＴＥＳＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＡＡ１６１１８７＿Ｐ１４のアミノ酸１〜１８３にも対応するＭＧＡＲＧＡＬＬＬＡＬＬＬＡＲＡＧＬＲＫＰＥＳＱＥＡＡＰＬＳＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１４のアミノ酸１８４〜３０７に対応する配列ＧＣＣＬＳＰＳＨＹＲＰＨＳＴＡＩＳＰＨＰＰＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧＬＣＷＱＣＰＲＲＥＧＣＬＬＲＥＣＰＣＨＨＳＱＰＲＫＡＳＣＶＰＶＰＹＬＴＬＭＰＴＰＧＧＧＤＣＣＰＴＬＱＭＱＫＲＲＬＧＣＣＱＧＥＥＥＤＶＨＰＶＹＰＡＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１４をコードする単離キメラポリペプチド。

２．ＡＡ１６１１８７＿Ｐ１４中の配列ＧＣＣＬＳＰＳＨＹＲＰＨＳＴＡＩＳＰＨＰＰＧＳＳＧＲＨＨＫＱＬＹＶＱＰＰＬＰＱＶＱＦＰＱＧＨＬＷＲＨＧＬＣＷＱＣＰＲＲＥＧＣＬＬＲＥＣＰＣＨＨＳＱＰＲＫＡＳＣＶＰＶＰＹＬＴＬＭＰＴＰＧＧＧＤＣＣＰＴＬＱＭＱＫＲＲＬＧＣＣＱＧＥＥＥＤＶＨＰＶＹＰＡＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１４のテールをコードする単離ポリペプチド。

変異タンパク質ＡＡ１６１１８７＿Ｐ１４はまた、表４１６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質テスチシン前駆体と比較した変異タンパク質ＡＡ１６１１８７＿Ｐ１４のグリコシル化部位を表４１７に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＡＡ１６１１８７＿Ｐ１４は、以下の転写物によってコードされる：ＡＡ１６１１８７＿Ｔ１６（配列は出願書類の最後に示す）。転写物ＡＡ１６１１８７＿Ｔ１６のコード部分を太字で示し、このコード部分は１０７位から開始され、１０２７位で終結する。転写物はまた、表４１８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＡＡ１６１１８７＿Ｐ１８は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＡ１６１１８７＿Ｔ２０によってコードされる。公知のタンパク質（テスチシン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＡＡ１６１１８７＿Ｐ１８とＴＥＳＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＡＡ１６１１８７＿Ｐ１８のアミノ酸１〜４２に対応する配列ＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸３１〜８６に対応し、ＡＡ１６１１８７＿Ｐ１８のアミノ酸４３〜９８にも対応するＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴと少なくとも９０％相同な第２のアミノ酸配列と、ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸８９〜２３５に対応し、ＡＡ１６１１８７＿Ｐ１８のアミノ酸９９〜２４５にも対応するＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥＡＬＰＳＰＨＴＬＱＥＶＱＶＡＩＩＮＮＳＭＣＮＨＬＦＬＫＹＳＦＲＫＤＩＦＧＤＭＶＣＡＧＮＡＱＧＧＫＤＡＣＦと少なくとも９０％相同な第３のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１８のアミノ酸２４６〜２６５に対応する配列ＶＳＶＰＡＴＴＰＳＰＧＫＨＰＶＳＬＣＬＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第４のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、第３のアミノ酸配列、および第４のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１８をコードする単離キメラポリペプチド。

２．ＡＡ１６１１８７＿Ｐ１８の配列ＨＴＲＥＧＴＬＧＧＱＫＲＡＦＰＤＧＶＥＧＥＫＧＲＧＲＡＷＧＡＡＳＲＧＳＡＶＰＬＴＩＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１８の先端をコードする単離ポリペプチド。

３．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＴＤを含み、以下の構造：アミノ酸番号９８−ｘ〜９８のいずれかから始まり、アミノ酸番号９９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１８の縁部分をコードする単離キメラポリペプチド。

ＡＡ１６１１８７＿Ｐ１８中の配列ＶＳＶＰＡＴＴＰＳＰＧＫＨＰＶＳＬＣＬＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１８のテールをコードする単離ポリペプチド。

変異タンパク質ＡＡ１６１１８７＿Ｐ１８はまた、表４１９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質テスチシン前駆体と比較した変異タンパク質ＡＡ１６１１８７＿Ｐ１８のグリコシル化部位を表４２０に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＡＡ１６１１８７＿Ｐ１８は、以下の転写物によってコードされる：ＡＡ１６１１８７＿Ｔ２０（配列は出願書類の最後に示す）。転写物ＡＡ１６１１８７＿Ｔ２０のコード部分を太字で示し、このコード部分は１位から開始され、７９６位で終結する。転写物はまた、表４２１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＡＡ１６１１８７＿Ｐ１９は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＡ１６１１８７＿Ｔ２１によってコードされる。公知のタンパク質（テスチシン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＡＡ１６１１８７＿Ｐ１９とＴＥＳＴ＿ＨＵＭＡＮとの間の比較の報告
１．ＴＥＳＴ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＡＡ１６１１８７＿Ｐ１９のアミノ酸１〜１８３にも対応するＭＧＡＲＧＡＬＬＬＡＬＬＬＡＲＡＧＬＲＫＰＥＳＱＥＡＡＰＬＳＧＰＣＧＲＲＶＩＴＳＲＩＶＧＧＥＤＡＥＬＧＲＷＰＷＱＧＳＬＲＬＷＤＳＨＶＣＧＶＳＬＬＳＨＲＷＡＬＴＡＡＨＣＦＥＴＹＳＤＬＳＤＰＳＧＷＭＶＱＦＧＱＬＴＳＭＰＳＦＷＳＬＱＡＹＹＴＲＹＦＶＳＮＩＹＬＳＰＲＹＬＧＮＳＰＹＤＩＡＬＶＫＬＳＡＰＶＴＹＴＫＨＩＱＰＩＣＬＱＡＳＴＦＥＦＥＮＲＴＤＣＷＶＴＧＷＧＹＩＫＥＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＡ１６１１８７＿Ｐ１９のアミノ酸１８４〜１８８に対応する配列ＤＫＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＡＡ１６１１８７＿Ｐ１９をコードする単離キメラポリペプチド。

２．ＡＡ１６１１８７＿Ｐ１９中の配列ＤＫＲＴＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＡＡ１６１１８７＿Ｐ１９のテールをコードする単離ポリペプチド。

変異タンパク質ＡＡ１６１１８７＿Ｐ１９はまた、表４２２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質テスチシン前駆体と比較した変異タンパク質ＡＡ１６１１８７＿Ｐ１９のグリコシル化部位を表４２３に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＡＡ１６１１８７＿Ｐ１９は、以下の転写物によってコードされる：ＡＡ１６１１８７＿Ｔ２１（配列は出願書類の最後に示す）。転写物ＡＡ１６１１８７＿Ｔ２１のコード部分を太字で示し、このコード部分は１０７位から開始され、６７０位で終結する。転写物はまた、表４２４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＡ１６１１８７＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＡＡ１６１１８７は、上の表４０４に列挙した２０個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿０は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿６は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ７およびＡＡ１６１１８７＿Ｔ２０。以下の表４２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿１４は、３５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２０、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿１６は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ２２。以下の表４２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２５は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ１６およびＡＡ１６１１８７＿Ｔ２０。以下の表４２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表４３０に示す）。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２６は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、およびＡＡ１６１１８７＿Ｔ２０。以下の表４３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２８は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ２１。以下の表４３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿４は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿７を、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ７およびＡＡ１６１１８７＿Ｔ２０。以下の表４３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿８は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２０、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿９は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２０、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿１０は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２０、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿１２を、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿１３は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、ＡＡ１６１１８７＿Ｔ２０、ＡＡ１６１１８７＿Ｔ２１、およびＡＡ１６１１８７＿Ｔ２２。以下の表４３９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿１９は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ１６。以下の表４４０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２０は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１６、およびＡＡ１６１１８７＿Ｔ２０。以下の表４４１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２１は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、およびＡＡ１６１１８７＿Ｔ２０。以下の表４４２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２２は、３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１５、ＡＡ１６１１８７＿Ｔ１６、およびＡＡ１６１１８７＿Ｔ２０。以下の表４４３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２３は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ０、ＡＡ１６１１８７＿Ｔ７、ＡＡ１６１１８７＿Ｔ１６、およびＡＡ１６１１８７＿Ｔ２０。以下の表４４４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＡ１６１１８７＿ｎｏｄｅ＿２４は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＡ１６１１８７＿Ｔ１６およびＡＡ１６１１８７＿Ｔ２０。以下の表４４５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P6 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 2894.00 Escore: 0
Matching length: 284 Total length: 284
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
43 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
. . . . .
93 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 142
||||||||||||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
. . . . .
143 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 192
||||||||||||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
. . . . .
193 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 242
||||||||||||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 230
. . . . .
243 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 292
||||||||||||||||||||||||||||||||||||||||||||||||||
231 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 280
. . .
293 IQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV 326
||||||||||||||||||||||||||||||||||
281 IQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV 314

Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P13 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183

Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P14 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183

Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P18 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1957.00 Escore: 0
Matching length: 203 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 99.02 Total Percent Identity: 99.02
Gaps: 1

Alignment:
. . . . .
43 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
. . . . .
93 AHCFET..DLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 140
|||||| ||||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
. . . . .
141 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 190
||||||||||||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
. . . . .
191 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 240
||||||||||||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 230

241 KDACF 245
|||||
231 KDACF 235

Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P19 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183

正常および癌性肺組織における配列名ＡＡ１６１１８７ｓｅｇ２５中に示すアンプリコンによって検出可能なホモ・サピエンスプロテアーゼ、セリン、２１（テスチシン）（ＰＲＳＳ２１）ＡＡ１６１１８７転写物の発現
ｓｅｇ２５、ＡＡ１６１１８７ｓｅｇ２５アンプリコン（配列番号１６５４）、ならびにプライマーＡＡ１６１１８７ｓｅｇ１７Ｆ２（配列番号１６５２）およびＡＡ１６１１８７ｓｅｇ１７Ｒ２（配列番号１６５３）によって検出可能なホモ・サピエンスプロテアーゼ、セリン、２１（テスチシン）（ＰＲＳＳ２１）ＡＡ１６１１８７転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６４は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記ホモ・サピエンスプロテアーゼ、セリン、２１（テスチシン）（ＰＲＳＳ２１）転写物の過剰発現を示すヒストグラムである。

図６４から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスプロテアーゼ、セリン、２１（テスチシン）（ＰＲＳＳ２１）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち１個および１６個の扁平上皮細胞癌サンプルのうち３個、４個の大細胞癌サンプルのうち１個で少なくとも６倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：ＡＡ１６１１８７ｓｅｇ１７Ｆ２順方向プライマーおよびＡＡ１６１１８７ｓｅｇ１７Ｒ２逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＡＡ１６１１８７ｓｅｇ２５。

プライマー：
順方向プライマーＡＡ１６１１８７ｓｅｇ１７Ｆ２（配列番号１６５２）：ＣＣＣＴＧＴＧＣＣＴＴＡＴＴＴＧＡＣＣＣＴ
逆方向プライマーＡＡ１６１１８７ｓｅｇ１７Ｒ２（配列番号１６５３）：ＧＣＴＧＧＧＴＡＧＡＣＴＧＧＧＴＧＣＡ
アンプリコンＡＡ１６１１８７ｓｅｇ２５（配列番号１６５４）：ＣＣＴＧＴＧＣＣＴＴＡＴＴＴＧＡＣＣＣＴＣＡＴＧＣＣＡＡＣＣＣＣＧＧＧＡＧＧＴＧＧＡＧＡＣＴＧＴＴＧＣＣＣＣＡＣＴＣＴＧＣＡＧＡＴＧＣＡＧＡＡＡＣＧＧＡＧＧＣＴＴＧＧＣＴＧＣＴＧＣＣＡＧＧＧＧＧＡＧＧＡ

クラスターＲ６６１７８の説明
クラスターＲ６６１７８は、目的の３つの転写物および１６個のセグメントを特徴とし、その名称を、それぞれ表４４６および４４７に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表４４８に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるポリオウイルス受容体関連タンパク質１前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＰＶＲ１＿ＨＵＭＡＮ）、同義語ヘルペスウイルス侵入メディエーターＣ、ＨｖｅＣ、ネクチン１、ヘルペスウイルスＩｇ様受容体、ＨＩｇＲ、ＣＤ１１１抗原としても公知である）（配列番号１４３２）の変異型である。

タンパク質ポリオウイルス受容体関連タンパク質１前駆体は、以下の機能を有することが公知であるか、そのように見なされている：おそらく細胞接着に関与する、細胞へのαヘルペスウイルス（ＨＳＶ−１、ＨＳＶ−２、および仮性狂犬病ウイルス）侵入の受容体。タンパク質ポリオウイルス受容体関連タンパク質１前駆体の配列を、「ポリオウイルス受容体関連タンパク質１前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質ポリオウイルス受容体関連タンパク質１前駆体の局在化は、Ｉ型膜タンパク質（イソ型αおよびδ）、分泌（イソ型γ）と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである免疫応答、細胞−細胞接着、分子機能に関連する注釈付けである細胞接着受容体、タンパク質結合、共同受容体、細胞成分に関連する注釈付けである接着結合、内在性膜タンパク質。

上記のように、クラスターＲ６６１７８は、上の表１に列挙した３つの転写物を特徴とする。これらの転写物は、タンパク質ポリオウイルス受容体関連タンパク質１前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ６６１７８＿Ｐ３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ６６１７８＿Ｔ２によってコードされる。公知のタンパク質（ポリオウイルス受容体関連タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ６６１７８＿Ｐ３とＰＶＲ１＿ＨＵＭＡＮとの間の比較の報告
１．ＰＶＲ１＿ＨＵＭＡＮのアミノ酸１〜３３４に対応し、Ｒ６６１７８＿Ｐ３のアミノ酸１〜３３４にも対応するＭＡＲＭＧＬＡＧＡＡＧＲＷＷＧＬＡＬＧＬＴＡＦＦＬＰＧＶＨＳＱＶＶＱＶＮＤＳＭＹＧＦＩＧＴＤＶＶＬＨＣＳＦＡＮＰＬＰＳＶＫＩＴＱＶＴＷＱＫＳＴＮＧＳＫＱＮＶＡＩＹＮＰＳＭＧＶＳＶＬＡＰＹＲＥＲＶＥＦＬＲＰＳＦＴＤＧＴＩＲＬＳＲＬＥＬＥＤＥＧＶＹＩＣＥＦＡＴＦＰＴＧＮＲＥＳＱＬＮＬＴＶＭＡＫＰＴＮＷＩＥＧＴＱＡＶＬＲＡＫＫＧＱＤＤＫＶＬＶＡＴＣＴＳＡＮＧＫＰＰＳＶＶＳＷＥＴＲＬＫＧＥＡＥＹＱＥＩＲＮＰＮＧＴＶＴＶＩＳＲＹＲＬＶＰＳＲＥＡＨＱＱＳＬＡＣＩＶＮＹＨＭＤＲＦＫＥＳＬＴＬＮＶＱＹＥＰＥＶＴＩＥＧＦＤＧＮＷＹＬＱＲＭＤＶＫＬＴＣＫＡＤＡＮＰＰＡＴＥＹＨＷＴＴＬＮＧＳＬＰＫＧＶＥＡＱＮＲＴＬＦＦＫＧＰＩＮＹＳＬＡＧＴＹＩＣＥＡＴＮＰＩＧＴＲＳＧＱＶＥＶＮＩＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ６６１７８＿Ｐ３のアミノ酸３３５〜３５４に対応する配列ＧＥＧＨＳＬＰＩＳＰＧＶＬＱＴＱＮＣＧＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ６６１７８＿Ｐ３をコードする単離キメラポリペプチド。

２．Ｒ６６１７８＿Ｐ３中の配列ＧＥＧＨＳＬＰＩＳＰＧＶＬＱＴＱＮＣＧＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ６６１７８＿Ｐ３のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ６６１７８＿Ｐ３はまた、表４４９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ６６１７８＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質ポリオウイルス受容体関連タンパク質１前駆体と比較した変異タンパク質Ｒ６６１７８＿Ｐ３のグリコシル化部位を表４５０に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｒ６６１７８＿Ｐ３は、以下の転写物によってコードされる：Ｒ６６１７８＿Ｔ２（配列は出願書類の最後に示す）。転写物Ｒ６６１７８＿Ｔ２のコード部分を太字で示し、このコード部分は６３４位から開始され、１６９５位で終結する。転写物はまた、表４５１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ６６１７８＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ６６１７８＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ６６１７８＿Ｔ３によってコードされる。公知のタンパク質（ポリオウイルス受容体関連タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ６６１７８＿Ｐ４とＰＶＲ１＿ＨＵＭＡＮとの間の比較の報告
１．ＰＶＲ１＿ＨＵＭＡＮのアミノ酸１〜３３４に対応し、Ｒ６６１７８＿Ｐ４のアミノ酸１〜３３４にも対応するＭＡＲＭＧＬＡＧＡＡＧＲＷＷＧＬＡＬＧＬＴＡＦＦＬＰＧＶＨＳＱＶＶＱＶＮＤＳＭＹＧＦＩＧＴＤＶＶＬＨＣＳＦＡＮＰＬＰＳＶＫＩＴＱＶＴＷＱＫＳＴＮＧＳＫＱＮＶＡＩＹＮＰＳＭＧＶＳＶＬＡＰＹＲＥＲＶＥＦＬＲＰＳＦＴＤＧＴＩＲＬＳＲＬＥＬＥＤＥＧＶＹＩＣＥＦＡＴＦＰＴＧＮＲＥＳＱＬＮＬＴＶＭＡＫＰＴＮＷＩＥＧＴＱＡＶＬＲＡＫＫＧＱＤＤＫＶＬＶＡＴＣＴＳＡＮＧＫＰＰＳＶＶＳＷＥＴＲＬＫＧＥＡＥＹＱＥＩＲＮＰＮＧＴＶＴＶＩＳＲＹＲＬＶＰＳＲＥＡＨＱＱＳＬＡＣＩＶＮＹＨＭＤＲＦＫＥＳＬＴＬＮＶＱＹＥＰＥＶＴＩＥＧＦＤＧＮＷＹＬＱＲＭＤＶＫＬＴＣＫＡＤＡＮＰＰＡＴＥＹＨＷＴＴＬＮＧＳＬＰＫＧＶＥＡＱＮＲＴＬＦＦＫＧＰＩＮＹＳＬＡＧＴＹＩＣＥＡＴＮＰＩＧＴＲＳＧＱＶＥＶＮＩＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ６６１７８＿Ｐ４のアミノ酸３３５〜３５２に対応する配列ＡＦＣＱＬＩＹＰＧＫＧＲＴＲＡＲＭＦを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ６６１７８＿Ｐ４をコードする単離キメラポリペプチド。

２．Ｒ６６１７８＿Ｐ４中の配列ＡＦＣＱＬＩＹＰＧＫＧＲＴＲＡＲＭＦと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ６６１７８＿Ｐ４のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ６６１７８＿Ｐ４はまた、表４５２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ６６１７８＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質ポリオウイルス受容体関連タンパク質１前駆体と比較した変異タンパク質Ｒ６６１７８＿Ｐ４のグリコシル化部位を表４５３に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｒ６６１７８＿Ｐ４は、以下の転写物によってコードされる：Ｒ６６１７８＿Ｔ３（配列は出願書類の最後に示す）。転写物Ｒ６６１７８＿Ｔ３のコード部分を太字で示し、このコード部分は６３４位から開始され、１６８９位で終結する。転写物はまた、表４５４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ６６１７８＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ６６１７８＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ６６１７８＿Ｔ７によってコードされる。公知のタンパク質（ポリオウイルス受容体関連タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ６６１７８＿Ｐ８とＰＶＲ１＿ＨＵＭＡＮとの間の比較の報告
１．ＰＶＲ１＿ＨＵＭＡＮのアミノ酸１〜３３０に対応し、Ｒ６６１７８＿Ｐ８のアミノ酸１〜３３０にも対応するＭＡＲＭＧＬＡＧＡＡＧＲＷＷＧＬＡＬＧＬＴＡＦＦＬＰＧＶＨＳＱＶＶＱＶＮＤＳＭＹＧＦＩＧＴＤＶＶＬＨＣＳＦＡＮＰＬＰＳＶＫＩＴＱＶＴＷＱＫＳＴＮＧＳＫＱＮＶＡＩＹＮＰＳＭＧＶＳＶＬＡＰＹＲＥＲＶＥＦＬＲＰＳＦＴＤＧＴＩＲＬＳＲＬＥＬＥＤＥＧＶＹＩＣＥＦＡＴＦＰＴＧＮＲＥＳＱＬＮＬＴＶＭＡＫＰＴＮＷＩＥＧＴＱＡＶＬＲＡＫＫＧＱＤＤＫＶＬＶＡＴＣＴＳＡＮＧＫＰＰＳＶＶＳＷＥＴＲＬＫＧＥＡＥＹＱＥＩＲＮＰＮＧＴＶＴＶＩＳＲＹＲＬＶＰＳＲＥＡＨＱＱＳＬＡＣＩＶＮＹＨＭＤＲＦＫＥＳＬＴＬＮＶＱＹＥＰＥＶＴＩＥＧＦＤＧＮＷＹＬＱＲＭＤＶＫＬＴＣＫＡＤＡＮＰＰＡＴＥＹＨＷＴＴＬＮＧＳＬＰＫＧＶＥＡＱＮＲＴＬＦＦＫＧＰＩＮＹＳＬＡＧＴＹＩＣＥＡＴＮＰＩＧＴＲＳＧＱＶＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ６６１７８＿Ｐ８のアミノ酸３３１〜３６３に対応する配列ＮＳＰＴＰＲＬＬＰＮＭＧＧＡＰＧＲＣＰＲＰＳＬＧＡＷＲＧＡＳＣＷＣを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ６６１７８＿Ｐ８をコードする単離キメラポリペプチド。

２．Ｒ６６１７８＿Ｐ８中の配列ＮＳＰＴＰＲＬＬＰＮＭＧＧＡＰＧＲＣＰＲＰＳＬＧＡＷＲＧＡＳＣＷＣと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ６６１７８＿Ｐ８のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ６６１７８＿Ｐ８はまた、表４５５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ６６１７８＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質ポリオウイルス受容体関連タンパク質１前駆体と比較した変異タンパク質Ｒ６６１７８＿Ｐ８のグリコシル化部位を表４５６に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｒ６６１７８＿Ｐ８は、以下の転写物によってコードされる：Ｒ６６１７８＿Ｔ７（配列は出願書類の最後に示す）。転写物Ｒ６６１７８＿Ｔ７のコード部分を太字で示し、このコード部分は６３４位から開始され、１７２２位で終結する。転写物はまた、表４５７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ６６１７８＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ６６１７８は、上の表２に列挙した１６個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿０は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿６は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿８は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表４６１に示す）。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿１５は、４０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿２４は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２。以下の表４６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿２６は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ７。以下の表４６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿２７は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ７。以下の表４６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿４は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿５を、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿９は、４４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿１１は、４４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２、Ｒ６６１７８＿Ｔ３、およびＲ６６１７８＿Ｔ７。以下の表４６９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿１６を、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ２およびＲ６６１７８＿Ｔ３。以下の表４７０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿１８は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ３。以下の表４７１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿１９を、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ３。以下の表４７２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿２０は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ３。以下の表４７３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ６６１７８＿ｎｏｄｅ＿２１は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ６６１７８＿Ｔ３。以下の表４７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P3 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3286.00 Escore: 0
Matching length: 334 Total length: 334
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNIT 334
||||||||||||||||||||||||||||||||||
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNIT 334

Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P4 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 336 Total length: 336
Matching Percent Similarity: 99.70 Matching Percent Identity: 99.70
Total Percent Similarity: 99.70 Total Percent Identity: 99.70
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNITAF 336
|||||||||||||||||||||||||||||||||| |
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNITEF 336

Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P8 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3250.00 Escore: 0
Matching length: 330 Total length: 330
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVE 330
||||||||||||||||||||||||||||||
301 FFKGPINYSLAGTYICEATNPIGTRSGQVE 330

クラスターＨＵＭＰＨＯＳＬＩＰの説明
クラスターＨＵＭＰＨＯＳＬＩＰは、目的の７つの転写物および５３個のセグメントを特徴とし、その名称を、それぞれ表４７５および４７６に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表４７７に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるリン脂質輸送タンパク質前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＰＬＴＰ＿ＨＵＭＡＮ、同義語脂質輸送タンパク質ＩＩとしても公知である）（配列番号１４３３）の変異型である。

タンパク質リン脂質輸送タンパク質前駆体は、以下の機能を有することが公知であるか、そのように見なされている：ＨＤＬをより大きい粒子およびより小さい粒子に変換する。細胞外リン脂質輸送およびＨＤＬ粒子の調整で重要な役割を果たし得る。タンパク質リン脂質輸送タンパク質前駆体の配列を、「リン脂質輸送タンパク質前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表４７８に示す。

タンパク質リン脂質輸送タンパク質前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである脂質代謝、脂質輸送、分子機能に関連する注釈付けである脂質結合、細胞成分に関連する注釈付けである細胞外。

このクラスターについて、少なくとも１つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも１つの転写物／セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、肺癌に関して、このセグメントに達するが、以下の他のセグメント／転写物は達しないことが見出された（表４７９に示す）。

上記のように、クラスターＨＵＭＰＨＯＳＬＩＰは、上の表１に列挙した７つの転写物を特徴とする。これらの転写物は、タンパク質リン脂質輸送タンパク質前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７によってコードされる。公知のタンパク質（リン脂質輸送タンパク質前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０とＰＬＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜６７に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０のアミノ酸１〜６７にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥと少なくとも９０％相同な第１のアミノ酸配列と、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１６３〜４９３に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０のアミノ酸６８〜３９８にも対応するＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱＩＣＰＶＬＹＨＡＧＴＶＬＬＮＳＬＬＤＴＶＰＶＲＳＳＶＤＥＬＶＧＩＤＹＳＬＭＫＤＰＶＡＳＴＳＮＬＤＭＤＦＲＧＡＦＦＰＬＴＥＲＮＷＳＬＰＮＲＡＶＥＰＱＬＱＥＥＥＲＭＶＹＶＡＦＳＥＦＦＦＤＳＡＭＥＳＹＦＲＡＧＡＬＱＬＬＬＶＧＤＫＶＰＨＤＬＤＭＬＬＲＡＴＹＦＧＳＩＶＬＬＳＰＡＶＩＤＳＰＬＫＬＥＬＲＶＬＡＰＰＲＣＴＩＫＰＳＧＴＴＩＳＶＴＡＳＶＴＩＡＬＶＰＰＤＱＰＥＶＱＬＳＳＭＴＭＤＡＲＬＳＡＫＭＡＬＲＧＫＡＬＲＴＱＬＤＬＲＲＦＲＩＹＳＮＨＳＡＬＥＳＬＡＬＩＰＬＱＡＰＬＫＴＭＬＱＩＧＶＭＰＭＬＮＥＲＴＷＲＧＶＱＩＰＬＰＥＧＩＮＦＶＨＥＶＶＴＮＨＡＧＦＬＴＩＧＡＤＬＨＦＡＫＧＬＲＥＶＩＥＫＮＲＰＡＤＶＲＡＳＴＡＰＴＰＳＴＡＡＶと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＥＫを含み、以下の構造：アミノ酸番号６７−ｘ〜６７のいずれかから始まり、アミノ酸番号６８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０の縁部分をコードする単離キメラポリペプチド。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０はまた、表４８０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０のグリコシル化部位を表４８１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７のコード部分を太字で示し、このコード部分は２７６位から開始され、１４６９位で終結する。転写物はまた、表４８２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９によってコードされる。公知のタンパク質（リン脂質輸送タンパク質前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２とＰＬＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜４２７に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のアミノ酸１〜４２７にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦＦＹＤＧＧＹＩＮＡＳＡＥＧＶＳＩＲＴＧＬＥＬＳＲＤＰＡＧＲＭＫＶＳＮＶＳＣＱＡＳＶＳＲＭＨＡＡＦＧＧＴＦＫＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱＩＣＰＶＬＹＨＡＧＴＶＬＬＮＳＬＬＤＴＶＰＶＲＳＳＶＤＥＬＶＧＩＤＹＳＬＭＫＤＰＶＡＳＴＳＮＬＤＭＤＦＲＧＡＦＦＰＬＴＥＲＮＷＳＬＰＮＲＡＶＥＰＱＬＱＥＥＥＲＭＶＹＶＡＦＳＥＦＦＦＤＳＡＭＥＳＹＦＲＡＧＡＬＱＬＬＬＶＧＤＫＶＰＨＤＬＤＭＬＬＲＡＴＹＦＧＳＩＶＬＬＳＰＡＶＩＤＳＰＬＫＬＥＬＲＶＬＡＰＰＲＣＴＩＫＰＳＧＴＴＩＳＶＴＡＳＶＴＩＡＬＶＰＰＤＱＰＥＶＱＬＳＳＭＴＭＤＡＲＬＳＡＫＭＡＬＲＧＫＡＬＲＴＱＬＤＬＲＲＦＲＩＹＳＮＨＳＡＬＥＳＬＡＬＩＰＬＱＡＰＬＫＴＭＬＱＩＧＶＭＰＭＬＮと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のアミノ酸４２８〜４３２に対応する配列ＧＫＡＧＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２をコードする単離キメラポリペプチド。

２．ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２中の配列ＧＫＡＧＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２はまた、表４８３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２のグリコシル化部位を表４８４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９のコード部分を太字で示し、このコード部分は２７６位から開始され、１５７１位で終結する。転写物はまた、表４８５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３０は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３０はまた、表４８６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３０は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６のコード部分を太字で示し、このコード部分は２７６位から開始され、４３１位で終結する。転写物はまた、表４８７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７によってコードされる。公知のタンパク質（リン脂質輸送タンパク質前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１とＰＬＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜６７に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のアミノ酸１〜６７にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のアミノ酸６８〜９８に対応する配列ＰＧＬＥＲＧＡＤＫＦＰＶＶＧＧＳＳＬＦＬＡＬＤＬＴＬＲＰＰＶＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１をコードする単離キメラポリペプチド。

２．ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１中の配列ＰＧＬＥＲＧＡＤＫＦＰＶＶＧＧＳＳＬＦＬＡＬＤＬＴＬＲＰＰＶＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１はまた、表４８８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１のグリコシル化部位を表４８９に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７のコード部分を太字で示し、このコード部分は２７６位から開始され、５６９位で終結する。転写物はまた、表４９０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４によってコードされる。公知のタンパク質（リン脂質輸送タンパク質前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３とＰＬＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜１８３に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のアミノ酸１〜１８３にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦＦＹＤＧＧＹＩＮＡＳＡＥＧＶＳＩＲＴＧＬＥＬＳＲＤＰＡＧＲＭＫＶＳＮＶＳＣＱＡＳＶＳＲＭＨＡＡＦＧＧＴＦＫＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のアミノ酸１８４〜２００に対応する配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３をコードする単離キメラポリペプチド。

２．ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３中の配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３はまた、表４９１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３のグリコシル化部位を表４９２に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４のコード部分を太字で示し、このコード部分は２７６位から開始され、８７５位で終結する。転写物はまた、表４９３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６によってコードされる。公知のタンパク質（リン脂質輸送タンパク質前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４とＰＬＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜２０５に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のアミノ酸１〜２０５にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦＦＹＤＧＧＹＩＮＡＳＡＥＧＶＳＩＲＴＧＬＥＬＳＲＤＰＡＧＲＭＫＶＳＮＶＳＣＱＡＳＶＳＲＭＨＡＡＦＧＧＴＦＫＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱＩＣＰＶＬＹＨＡＧＴＶＬＬＮＳＬＬＤＴＶＰＶと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のアミノ酸２０６〜２１７に対応する配列ＬＷＴＳＬＬＡＬＴＩＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４をコードする単離キメラポリペプチド。

２．ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４中の配列ＬＷＴＳＬＬＡＬＴＩＰＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４はまた、表４９４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４のグリコシル化部位を表４９５に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６のコード部分を太字で示し、このコード部分は２７６位から開始され、９２６位で終結する。転写物はまた、表４９６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８によってコードされる。公知のタンパク質（リン脂質輸送タンパク質前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５とＰＬＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１〜１０９に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のアミノ酸１〜１０９にも対応するＭＡＬＦＧＡＬＦＬＡＬＬＡＧＡＨＡＥＦＰＧＣＫＩＲＶＴＳＫＡＬＥＬＶＫＱＥＧＬＲＦＬＥＱＥＬＥＴＩＴＩＰＤＬＲＧＫＥＧＨＦＹＹＮＩＳＥＶＫＶＴＥＬＱＬＴＳＳＥＬＤＦＱＰＱＱＥＬＭＬＱＩＴＮＡＳＬＧＬＲＦＲＲＱＬＬＹＷＦと少なくとも９０％相同な第１のアミノ酸配列と、Ｌを含むアミノ酸配列を架橋する第２のアミノ酸配列と、ＰＬＴＰ＿ＨＵＭＡＮのアミノ酸１６３〜１８３に対応し、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のアミノ酸１１１〜１３１にも対応するＫＶＹＤＦＬＳＴＦＩＴＳＧＭＲＦＬＬＮＱＱと少なくとも９０％相同な第３のアミノ酸配列と、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のアミノ酸１３２〜１４８に対応する配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第４のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、第３のアミノ酸配列、および第４のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＦＬＫを含み、以下の構造（ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５に対応する番号付け）：アミノ酸番号１０９−ｘ〜１０９のいずれかから始まり、アミノ酸番号１１１＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５の縁部分をコードする単離キメラポリペプチド。

３．ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５中の配列ＶＷＡＡＴＧＲＲＶＡＲＶＧＭＬＳＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５はまた、表４９７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５のグリコシル化部位を表４９８に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５は、以下の転写物によってコードされる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８（配列は出願書類の最後に示す）。転写物ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８のコード部分を太字で示し、このコード部分は２７６位から開始され、７１９位で終結する。転写物はまた、表４９９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｐ３５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＰＨＯＳＬＩＰは、上の表２に列挙した５３個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿０は、１５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿１９は、１８６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３４は、１９１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６８は、１３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿７０は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿７５は、１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿２は、１５９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ７を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿０８、１７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿９は、１６８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿１４は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７。以下の表５１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿１５を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿１６は、１７９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿１７を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿２３は、１６８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿２４を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿２５は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８。以下の表５１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿２６は、１６３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿２を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３０は、１８１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３３は、１７３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３６は、１６３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３７を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿３９は、１６６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４０は、１９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４１は、１８６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４２を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４４は、１８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４５は、１９７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿４７は、２２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５１を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５２は、２３５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５３は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５４は、２３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５５は、２３２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５８を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿５９は、２３０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６０を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５３９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６１を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６２を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６３を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６４を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６５を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６６は、１８０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６７を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿６９を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿７１を、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿７２は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿７３は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿ｎｏｄｅ＿７４は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１４、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１６、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１７、ＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１８、およびＨＵＭＰＨＯＳＬＩＰ＿ＰＥＡ＿２＿Ｔ１９。以下の表５５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P10 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 3716.00 Escore: 0
Matching length: 398 Total length: 493
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 80.73 Total Percent Identity: 80.73
Gaps: 1

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISE................................. 67
|||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
67 .................................................. 67

101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
68 ............KVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 105
||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
. . . . .
106 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 155
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
. . . . .
156 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 205
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
. . . . .
206 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 255
||||||||||||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
. . . . .
256 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 305
||||||||||||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
. . . . .
306 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 355
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 450
. . . .
356 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 398
|||||||||||||||||||||||||||||||||||||||||||
451 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 493

Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P12 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 4101.00 Escore: 0
Matching length: 427 Total length: 427
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
. . . . .
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
. . . . .
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
. . . . .
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
. . . . .
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
. .
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427
|||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427

Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P31 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 639.00 Escore: 0
Matching length: 67 Total length: 67
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
.
51 IPDLRGKEGHFYYNISE 67
|||||||||||||||||
51 IPDLRGKEGHFYYNISE 67

Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P33 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1767.00 Escore: 0
Matching length: 184 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.46
Total Percent Similarity: 100.00 Total Percent Identity: 99.46
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQV 184
|||||||||||||||||||||||||||||||||:
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQI 184

Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P34 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1971.00 Escore: 0
Matching length: 205 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200

201 DTVPV 205
|||||
201 DTVPV 205

Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P35 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1158.00 Escore: 0
Matching length: 132 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.48
Total Percent Similarity: 71.74 Total Percent Identity: 70.65
Gaps: 1

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFL........................................ 110
|||||||||:
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . .
111 ............KVYDFLSTFITSGMRFLLNQQV 132
|||||||||||||||||||||:
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQI 184

クラスターＡＩ０７６０２０の説明
クラスターＡＩ０７６０２０は、目的の１つの転写物および８個のセグメントを特徴とし、その名称を、それぞれ表５５２および５５３に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表５５４に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるＣ１ｑ関連因子前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子Ｃ１ＲＦ＿ＨＵＭＡＮ）（配列番号１４３４）の変異型である。

タンパク質Ｃ１ｑ関連因子前駆体の配列を、「Ｃ１ｑ関連因子前駆体アミノ酸配列」として出願書類の最後に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである運動器官の挙動。

クラスターＡＩ０７６０２０を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図３１のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３１および表５５５中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。

上記のように、クラスターＡＩ０７６０２０は、上の表１に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質Ｃ１ｑ関連因子前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＡＩ０７６０２０＿Ｐ１は、出願書類の最後に示すアミノ酸配列を有し、転写物ＡＩ０７６０２０＿Ｔ０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質ＡＩ０７６０２０＿Ｐ１はまた、表５５７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＩ０７６０２０＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＡＩ０７６０２０＿Ｐ１は、以下の転写物によってコードされる：ＡＩ０７６０２０＿Ｔ０（配列は出願書類の最後に示す）。転写物ＡＩ０７６０２０＿Ｔ０のコード部分を太字で示し、このコード部分は２６１位から開始され、１０３４位で終結する。転写物はまた、表５５８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＡＩ０７６０２０＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＡＩ０７６０２０は、上の表２に列挙した８個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿０は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表５６０に示す）。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿３は、３０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿８は、３５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿１は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿４は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿５は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿６は、３２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＡＩ０７６０２０＿ｎｏｄｅ＿７は、３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＡＩ０７６０２０＿Ｔ０。以下の表５６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

クラスターＴ２３５８０の説明
クラスターＴ２３５８０は、目的の１つの転写物および５個のセグメントを特徴とし、その名称を、それぞれ表５６８および５６９に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表５７０に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれており、以前のＳｗｉｓｓＰｒｏｔアクセッション識別子がＮＰ２５＿ＨＵＭＡＮでもある公知のタンパク質である神経タンパク質ＮＰ２５（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＴＡＧ３＿ＨＵＭＡＮ、同義語神経タンパク質２２、ＮＰ２２、トランスゲリン−３（Ｔｒａｎｓｇｅｌｉｎ−３）としても公知である）（配列番号１４３３）の変異型である。

タンパク質神経タンパク質ＮＰ２５の配列を、「神経タンパク質ＮＰ２５アミノ酸配列」として出願書類の最後に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである中枢神経系発達。

このクラスターについて、少なくとも１つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも１つの転写物／セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、肺癌に関して、このクラスターに達するが、以下の他のセグメント／転写物は達しないことが見出された（表５７１に示す）。

上記のように、クラスターＴ２３５８０は、上の表１に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質神経タンパク質ＮＰ２５の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｔ２３５８０＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ２３５８０＿Ｔ１０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、２つのうちの１つのシグナルペプチド推定プログラム（ＨＭＭ：Ｓｉｇｎａｌｐｅｐｔｉｄｅ，ＮＮ：ＮＯ）によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。

変異タンパク質Ｔ２３５８０＿Ｐ５はまた、表５７２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ２３５８０＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ２３５８０＿Ｐ５は、以下の転写物によってコードされる：Ｔ２３５８０＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｔ２３５８０＿Ｔ１０のコード部分を太字で示し、このコード部分は１０６６位から開始され、１４８５位で終結する。転写物はまた、表５７３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ２３５８０＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＴ２３５８０は、上の表２に列挙した５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＴ２３５８０＿ｎｏｄｅ＿１７は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ２３５８０＿Ｔ１０。以下の表５７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ２３５８０＿ｎｏｄｅ＿１８は、１０２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ２３５８０＿Ｔ１０。以下の表５７５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ２３５８０＿ｎｏｄｅ＿２１は、７９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ２３５８０＿Ｔ１０。以下の表５７６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ２３５８０＿ｎｏｄｅ＿１９を、以下の転写物中に見出すことができる：Ｔ２３５８０＿Ｔ１０。以下の表５７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ２３５８０＿ｎｏｄｅ＿２０を、以下の転写物中に見出すことができる：Ｔ２３５８０＿Ｔ１０。以下の表５７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

クラスターＭ７９２１７の説明
クラスターＭ７９２１７は、目的の６つの転写物および３２個のセグメントを特徴とし、その名称を、それぞれ表５７９および５８０に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表５８１に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるエクソストシン（Ｅｘｏｓｔｏｓｉｎ）様３（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＥＸＬ３＿ＨＵＭＡＮ）、同義語ＥＣ２．４．１．２２３、グルクロニル−ガラクトシル−プロテオグリカン４−α−Ｎ−アセチルグルコサミニルトランスフェラーゼ、推定腫瘍抑制タンパク質ＥＸＴＬ３、多エクソストシン様タンパク質３、遺伝性多外骨腫症遺伝子イソログ（ｉｓｏｌｏｇ）、ＥＸＴ関連タンパク質１としても公知である）（配列番号１４３６）の変異型である。

タンパク質エクソストシン様３は、以下の機能を有することが公知であるか、そのように見なされている：グリコシルトランスフェラーゼの可能性がある（類似性による）。タンパク質エクソストシン様３の配列を、「エクソストシン様３アミノ酸配列」として出願書類の最後に示す。タンパク質エクソストシン様３の局在化は、ＩＩ型膜タンパク質と考えられる。小胞体。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである細胞の成長および／または維持、分子機能に関連する注釈付けであるトランスフェラーゼ、トランスフェリングリコシル基、および細胞成分に関連する注釈付けである小胞体、内在性膜タンパク質。

上記のように、クラスターＭ７９２１７は、上の表１に列挙した６つの転写物を特徴とする。これらの転写物は、タンパク質エクソストシン様３の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１によってコードされる。公知のタンパク質（エクソストシン様３）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１とＢＡＡ２５４４５（配列番号１４３７）との間の比較の報告
１．ＢＡＡ２５４４５のアミノ酸１３〜９３１に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１のアミノ酸１〜９１９にも対応するＭＴＧＹＴＭＬＲＮＧＧＡＧＮＧＧＱＴＣＭＬＲＷＳＮＲＩＲＬＴＷＬＳＦＴＬＦＶＩＬＶＦＦＰＬＩＡＨＹＹＬＴＴＬＤＥＡＤＥＡＧＫＲＩＦＧＰＲＶＧＮＥＬＣＥＶＫＨＶＬＤＬＣＲＩＲＥＳＶＳＥＥＬＬＱＬＥＡＫＲＱＥＬＮＳＥＩＡＫＬＮＬＫＩＥＡＣＫＫＳＩＥＮＡＫＱＤＬＬＱＬＫＮＶＩＳＱＴＥＨＳＹＫＥＬＭＡＱＮＱＰＫＬＳＬＰＩＲＬＬＰＥＫＤＤＡＧＬＰＰＰＫＡＴＲＧＣＲＬＨＮＣＦＤＹＳＲＣＰＬＴＳＧＦＰＶＹＶＹＤＳＤＱＦＶＦＧＳＹＬＤＰＬＶＫＱＡＦＱＡＴＡＲＡＮＶＹＶＴＥＮＡＤＩＡＣＬＹＶＩＬＶＧＥＭＱＥＰＶＶＬＲＰＡＥＬＥＫＱＬＹＳＬＰＨＷＲＴＤＧＨＮＨＶＩＩＮＬＳＲＫＳＤＴＱＮＬＬＹＮＶＳＴＧＲＡＭＶＡＱＳＴＦＹＴＶＱＹＲＰＧＦＤＬＶＶＳＰＬＶＨＡＭＳＥＰＮＦＭＥＩＰＰＱＶＰＶＫＲＫＹＬＦＴＦＱＧＥＫＩＥＳＬＲＳＳＬＱＥＡＲＳＦＥＥＥＭＥＧＤＰＰＡＤＹＤＤＲＩＩＡＴＬＫＡＶＱＤＳＫＬＤＱＶＬＶＥＦＴＣＫＮＱＰＫＰＳＬＰＴＥＷＡＬＣＧＥＲＥＤＲＬＥＬＬＫＬＳＴＦＡＬＩＩＴＰＧＤＰＲＬＶＩＳＳＧＣＡＴＲＬＦＥＡＬＥＶＧＡＶＰＶＶＬＧＥＱＶＱＬＰＹＱＤＭＬＱＷＮＥＡＡＬＶＶＰＫＰＲＶＴＥＶＨＦＬＬＲＳＬＳＤＳＤＬＬＡＭＲＲＱＧＲＦＬＷＥＴＹＦＳＴＡＤＳＩＦＮＴＶＬＡＭＩＲＴＲＩＱＩＰＡＡＰＩＲＥＥＡＡＡＥＩＰＨＲＳＧＫＡＡＧＴＤＰＮＭＡＤＮＧＤＬＤＬＧＰＶＥＴＥＰＰＹＡＳＰＲＹＬＲＮＦＴＬＴＶＴＤＦＹＲＳＷＮＣＡＰＧＰＦＨＬＦＰＨＴＰＦＤＰＶＬＰＳＥＡＫＦＬＧＳＧＴＧＦＲＰＩＧＧＧＡＧＧＳＧＫＥＦＱＡＡＬＧＧＮＶＰＲＥＱＦＴＶＶＭＬＴＹＥＲＥＥＶＬＭＮＳＬＥＲＬＮＧＬＰＹＬＮＫＶＶＶＶＷＮＳＰＫＬＰＳＥＤＬＬＷＰＤＩＧＶＰＩＭＶＶＲＴＥＫＮＳＬＮＮＲＦＬＰＷＮＥＩＥＴＥＡＩＬＳＩＤＤＤＡＨＬＲＨＤＥＩＭＦＧＦＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫＹＹＡＹＬＹＳＹＶＭＰＱＡＩＲＤＭＶＤＥＹＩＮＣＥＤＩＡＭＮＦＬＶＳＨＩＴＲＫＰＰＩＫＶＴＳＲＷＴＦＲＣＰＧＣＰＱＡＬＳＨＤＤＳＨＦＨＥＲＨＫＣＩＮＦＦＶＫＶＹＧＹＭＰＬＬＹＴＱＦＲＶＤＳＶＬＦＫＴＲＬＰＨＤＫＴＫＣＦＫＦＩと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１をコードする単離キメラポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、Ｓｉｇｎａｌｐ＿ｈｍｍソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１は、以下の転写物によってコードされる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１（配列は出願書類の最後に示す）。転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１のコード部分を太字で示し、このコード部分は１０７４位から開始され、３８３０位で終結する。転写物はまた、表５８２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８によってコードされる。公知のタンパク質（エクソストシン様３）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２とＥＸＬ３＿ＨＵＭＡＮとの間の比較の報告
１．ＥＸＬ３＿ＨＵＭＡＮのアミノ酸１〜８０７に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜８０７にも対応するＭＴＧＹＴＭＬＲＮＧＧＡＧＮＧＧＱＴＣＭＬＲＷＳＮＲＩＲＬＴＷＬＳＦＴＬＦＶＩＬＶＦＦＰＬＩＡＨＹＹＬＴＴＬＤＥＡＤＥＡＧＫＲＩＦＧＰＲＶＧＮＥＬＣＥＶＫＨＶＬＤＬＣＲＩＲＥＳＶＳＥＥＬＬＱＬＥＡＫＲＱＥＬＮＳＥＩＡＫＬＮＬＫＩＥＡＣＫＫＳＩＥＮＡＫＱＤＬＬＱＬＫＮＶＩＳＱＴＥＨＳＹＫＥＬＭＡＱＮＱＰＫＬＳＬＰＩＲＬＬＰＥＫＤＤＡＧＬＰＰＰＫＡＴＲＧＣＲＬＨＮＣＦＤＹＳＲＣＰＬＴＳＧＦＰＶＹＶＹＤＳＤＱＦＶＦＧＳＹＬＤＰＬＶＫＱＡＦＱＡＴＡＲＡＮＶＹＶＴＥＮＡＤＩＡＣＬＹＶＩＬＶＧＥＭＱＥＰＶＶＬＲＰＡＥＬＥＫＱＬＹＳＬＰＨＷＲＴＤＧＨＮＨＶＩＩＮＬＳＲＫＳＤＴＱＮＬＬＹＮＶＳＴＧＲＡＭＶＡＱＳＴＦＹＴＶＱＹＲＰＧＦＤＬＶＶＳＰＬＶＨＡＭＳＥＰＮＦＭＥＩＰＰＱＶＰＶＫＲＫＹＬＦＴＦＱＧＥＫＩＥＳＬＲＳＳＬＱＥＡＲＳＦＥＥＥＭＥＧＤＰＰＡＤＹＤＤＲＩＩＡＴＬＫＡＶＱＤＳＫＬＤＱＶＬＶＥＦＴＣＫＮＱＰＫＰＳＬＰＴＥＷＡＬＣＧＥＲＥＤＲＬＥＬＬＫＬＳＴＦＡＬＩＩＴＰＧＤＰＲＬＶＩＳＳＧＣＡＴＲＬＦＥＡＬＥＶＧＡＶＰＶＶＬＧＥＱＶＱＬＰＹＱＤＭＬＱＷＮＥＡＡＬＶＶＰＫＰＲＶＴＥＶＨＦＬＬＲＳＬＳＤＳＤＬＬＡＭＲＲＱＧＲＦＬＷＥＴＹＦＳＴＡＤＳＩＦＮＴＶＬＡＭＩＲＴＲＩＱＩＰＡＡＰＩＲＥＥＡＡＡＥＩＰＨＲＳＧＫＡＡＧＴＤＰＮＭＡＤＮＧＤＬＤＬＧＰＶＥＴＥＰＰＹＡＳＰＲＹＬＲＮＦＴＬＴＶＴＤＦＹＲＳＷＮＣＡＰＧＰＦＨＬＦＰＨＴＰＦＤＰＶＬＰＳＥＡＫＦＬＧＳＧＴＧＦＲＰＩＧＧＧＡＧＧＳＧＫＥＦＱＡＡＬＧＧＮＶＰＲＥＱＦＴＶＶＭＬＴＹＥＲＥＥＶＬＭＮＳＬＥＲＬＮＧＬＰＹＬＮＫＶＶＶＶＷＮＳＰＫＬＰＳＥＤＬＬＷＰＤＩＧＶＰＩＭＶＶＲＴＥＫＮＳＬＮＮＲＦＬＰＷＮＥＩＥＴＥＡＩＬＳＩＤＤＤＡＨＬＲＨＤＥＩＭＦＧＦＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫと少なくとも９０％相同な第１のアミノ酸配列と、ＥＸＬ３＿ＨＵＭＡＮのアミノ酸８２０〜９１９に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２のアミノ酸８０８〜９０７にも対応するＡＩＲＤＭＶＤＥＹＩＮＣＥＤＩＡＭＮＦＬＶＳＨＩＴＲＫＰＰＩＫＶＴＳＲＷＴＦＲＣＰＧＣＰＱＡＬＳＨＤＤＳＨＦＨＥＲＨＫＣＩＮＦＦＶＫＶＹＧＹＭＰＬＬＹＴＱＦＲＶＤＳＶＬＦＫＴＲＬＰＨＤＫＴＫＣＦＫＦＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＡを含み、以下の構造：アミノ酸番号８０７−ｘ〜８０７のいずれかから始まり、アミノ酸番号８０８＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２はまた、表５８３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質エクソストシン様３と比較した変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２のグリコシル化部位を表５８４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８（配列は出願書類の最後に示す）。転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８のコード部分を太字で示し、このコード部分は７４８位から開始され、３４６８位で終結する。転写物はまた、表５８５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０によってコードされる。公知のタンパク質（エクソストシン様３）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４とＥＸＬ３＿ＨＵＭＡＮとの間の比較の報告
１．Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜５１に対応する配列ＰＥＬＲＱＰＡＲＬＧＬＰＥＣＷＤＹＲＨＥＰＲＣＰＡＱＭＧＳＨＦＩＶＱＡＧＬＫＬＬＡＳＳＫＰＰＫＣＷＤＹを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＥＸＬ３＿ＨＵＭＡＮのアミノ酸７５９〜９１９に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４のアミノ酸５２〜２１２にも対応するＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫＹＹＡＹＬＹＳＹＶＭＰＱＡＩＲＤＭＶＤＥＹＩＮＣＥＤＩＡＭＮＦＬＶＳＨＩＴＲＫＰＰＩＫＶＴＳＲＷＴＦＲＣＰＧＣＰＱＡＬＳＨＤＤＳＨＦＨＥＲＨＫＣＩＮＦＦＶＫＶＹＧＹＭＰＬＬＹＴＱＦＲＶＤＳＶＬＦＫＴＲＬＰＨＤＫＴＫＣＦＫＦＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチド。

２．Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４の配列ＰＥＬＲＱＰＡＲＬＧＬＰＥＣＷＤＹＲＨＥＰＲＣＰＡＱＭＧＳＨＦＩＶＱＡＧＬＫＬＬＡＳＳＫＰＰＫＣＷＤＹと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４の先端をコードする単離ポリペプチド。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４はまた、表５８６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質エクソストシン様３と比較した変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４のグリコシル化部位を表５８７に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４は、以下の転写物によってコードされる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０のコード部分を太字で示し、このコード部分は１位から開始され、６３７位で終結する。転写物はまた、表５８８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５によってコードされる。公知のタンパク質（エクソストシン様３）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８とＥＸＬ３＿ＨＵＭＡＮとの間の比較の報告
１．ＥＸＬ３＿ＨＵＭＡＮのアミノ酸１〜８０７に対応し、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜８０７にも対応するＭＴＧＹＴＭＬＲＮＧＧＡＧＮＧＧＱＴＣＭＬＲＷＳＮＲＩＲＬＴＷＬＳＦＴＬＦＶＩＬＶＦＦＰＬＩＡＨＹＹＬＴＴＬＤＥＡＤＥＡＧＫＲＩＦＧＰＲＶＧＮＥＬＣＥＶＫＨＶＬＤＬＣＲＩＲＥＳＶＳＥＥＬＬＱＬＥＡＫＲＱＥＬＮＳＥＩＡＫＬＮＬＫＩＥＡＣＫＫＳＩＥＮＡＫＱＤＬＬＱＬＫＮＶＩＳＱＴＥＨＳＹＫＥＬＭＡＱＮＱＰＫＬＳＬＰＩＲＬＬＰＥＫＤＤＡＧＬＰＰＰＫＡＴＲＧＣＲＬＨＮＣＦＤＹＳＲＣＰＬＴＳＧＦＰＶＹＶＹＤＳＤＱＦＶＦＧＳＹＬＤＰＬＶＫＱＡＦＱＡＴＡＲＡＮＶＹＶＴＥＮＡＤＩＡＣＬＹＶＩＬＶＧＥＭＱＥＰＶＶＬＲＰＡＥＬＥＫＱＬＹＳＬＰＨＷＲＴＤＧＨＮＨＶＩＩＮＬＳＲＫＳＤＴＱＮＬＬＹＮＶＳＴＧＲＡＭＶＡＱＳＴＦＹＴＶＱＹＲＰＧＦＤＬＶＶＳＰＬＶＨＡＭＳＥＰＮＦＭＥＩＰＰＱＶＰＶＫＲＫＹＬＦＴＦＱＧＥＫＩＥＳＬＲＳＳＬＱＥＡＲＳＦＥＥＥＭＥＧＤＰＰＡＤＹＤＤＲＩＩＡＴＬＫＡＶＱＤＳＫＬＤＱＶＬＶＥＦＴＣＫＮＱＰＫＰＳＬＰＴＥＷＡＬＣＧＥＲＥＤＲＬＥＬＬＫＬＳＴＦＡＬＩＩＴＰＧＤＰＲＬＶＩＳＳＧＣＡＴＲＬＦＥＡＬＥＶＧＡＶＰＶＶＬＧＥＱＶＱＬＰＹＱＤＭＬＱＷＮＥＡＡＬＶＶＰＫＰＲＶＴＥＶＨＦＬＬＲＳＬＳＤＳＤＬＬＡＭＲＲＱＧＲＦＬＷＥＴＹＦＳＴＡＤＳＩＦＮＴＶＬＡＭＩＲＴＲＩＱＩＰＡＡＰＩＲＥＥＡＡＡＥＩＰＨＲＳＧＫＡＡＧＴＤＰＮＭＡＤＮＧＤＬＤＬＧＰＶＥＴＥＰＰＹＡＳＰＲＹＬＲＮＦＴＬＴＶＴＤＦＹＲＳＷＮＣＡＰＧＰＦＨＬＦＰＨＴＰＦＤＰＶＬＰＳＥＡＫＦＬＧＳＧＴＧＦＲＰＩＧＧＧＡＧＧＳＧＫＥＦＱＡＡＬＧＧＮＶＰＲＥＱＦＴＶＶＭＬＴＹＥＲＥＥＶＬＭＮＳＬＥＲＬＮＧＬＰＹＬＮＫＶＶＶＶＷＮＳＰＫＬＰＳＥＤＬＬＷＰＤＩＧＶＰＩＭＶＶＲＴＥＫＮＳＬＮＮＲＦＬＰＷＮＥＩＥＴＥＡＩＬＳＩＤＤＤＡＨＬＲＨＤＥＩＭＦＧＦＲＶＷＲＥＡＲＤＲＩＶＧＦＰＧＲＹＨＡＷＤＩＰＨＱＳＷＬＹＮＳＮＹＳＣＥＬＳＭＶＬＴＧＡＡＦＦＨＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のアミノ酸８０８〜８１２に対応する配列ＶＲＫＳＷを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチド。

２．Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８中の配列ＶＲＫＳＷと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８はまた、表５８９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質エクソストシン様３と比較した変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８のグリコシル化部位を表５９０に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８は、以下の転写物によってコードされる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５（配列は出願書類の最後に示す）。転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５のコード部分を太字で示し、このコード部分は７４８位から開始され、３１８３位で終結する。転写物はまた、表５９１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１８によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、２つのうちの１つのシグナルペプチド推定プログラム（ＨＭＭ：Ｓｉｇｎａｌｐｅｐｔｉｄｅ，ＮＮ：ＮＯ）によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１１はまた、表５９２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１１は、以下の転写物によってコードされる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１８（配列は出願書類の最後に示す）。転写物Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１８のコード部分を太字で示し、このコード部分は１３５４位から開始され、１６７４位で終結する。転写物はまた、表５９３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７９２１７＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＭ７９２１７は、上の表２に列挙した３２個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３。以下の表５９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表５９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１。以下の表５９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表５９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）表５９８に示す。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、４２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表５９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、３５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表６００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１４は、６５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表６０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、５１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表６０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表６０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表６０４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３３は、７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、５１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３５は、５３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３７は、５８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３８は、６２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿４１は、１７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表６１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿４４は、８９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表６１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３。以下の表６１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１５、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表６１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１２を、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１５。以下の表６１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、４０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、４６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、４７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３２は、４０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、４２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿３９は、５７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿４０は、５９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１０。以下の表６２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿４２は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表６２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７９２１７＿ＰＥＡ＿１＿ｎｏｄｅ＿４３は、９０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ３、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ８、Ｍ７９２１７＿ＰＥＡ＿１＿Ｔ１０、およびＭ７９２１７＿ＰＥＡ＿１＿Ｔ１８。以下の表６２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: BAA25445

Sequence documentation:

Alignment of: M79217_PEA_1_P1 x BAA25445 ..

Alignment segment 1/1:

Quality: 9101.00 Escore: 0
Matching length: 919 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 62
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
63 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 112
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
113 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 162
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
163 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 212
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
213 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 262
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
263 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 312
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
313 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 362
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
363 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 412
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
413 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 462
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
463 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 512
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
513 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 562
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
563 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 612
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
613 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 662
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
663 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 712
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
713 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 762
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
763 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 812
. . . . .
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 850
||||||||||||||||||||||||||||||||||||||||||||||||||
813 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 862
. . . . .
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
||||||||||||||||||||||||||||||||||||||||||||||||||
863 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 912
.
901 SVLFKTRLPHDKTKCFKFI 919
|||||||||||||||||||
913 SVLFKTRLPHDKTKCFKFI 931

Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P2 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 8873.00 Escore: 0
Matching length: 907 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.69 Total Percent Identity: 98.69
Gaps: 1

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
. . . . .
801 GAAFFHK............AIRDMVDEYINCEDIAMNFLVSHITRKPPIK 838
||||||| |||||||||||||||||||||||||||||||
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 850
. . . . .
839 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 888
||||||||||||||||||||||||||||||||||||||||||||||||||
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
.
889 SVLFKTRLPHDKTKCFKFI 907
|||||||||||||||||||
901 SVLFKTRLPHDKTKCFKFI 919

Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P4 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 1668.00 Escore: 0
Matching length: 162 Total length: 162
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.38
Total Percent Similarity: 100.00 Total Percent Identity: 99.38
Gaps: 0

Alignment:
. . . . .
51 YRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 100
:|||||||||||||||||||||||||||||||||||||||||||||||||
758 FRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 807
. . . . .
101 YYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTF 150
||||||||||||||||||||||||||||||||||||||||||||||||||
808 YYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTF 857
. . . . .
151 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
858 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 907
.
201 LPHDKTKCFKFI 212
||||||||||||
908 LPHDKTKCFKFI 919

Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P8 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 7947.00 Escore: 0
Matching length: 807 Total length: 807
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800

801 GAAFFHK 807
|||||||
801 GAAFFHK 807

クラスターＭ６２０９６の説明
クラスターＭ６２０９６は、目的の９つの転写物および４２個のセグメントを特徴とし、その名称を、それぞれ表６２７および６２８に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表６２９に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるキネシン重鎖イソ型５Ｃ（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＫＦ５Ｃ＿ＨＵＭＡＮ）、同義語キネシン重鎖ニューロン特異的２としても公知である）（配列番号１４３８）の変異型である。

タンパク質キネシン重鎖イソ型５Ｃは、以下の機能を有することが公知であるか、そのように見なされている：キネシンは、オルガネラ輸送で役割を果たし得る微小間結合移動（ｆｏｒｃｅｐｒｏｄｕｃｉｎｇ）タンパク質である。タンパク質キネシン重鎖イソ型５Ｃの配列を、「キネシン重鎖イソ型５Ｃアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表６３０に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるオルガネラの組織化、および生合成、分子機能に関連する注釈付けである微小管モーター、ＡＴＰ結合、および細胞成分に関連する注釈付けであるキネシン。

上記のように、クラスターＭ６２０９６は、上の表１に列挙した９つの転写物を特徴とする。これらの転写物は、タンパク質キネシン重鎖イソ型５Ｃの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜６に対応する配列ＭＡＴＹＩＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸２３９〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４のアミノ酸７〜７２５にも対応するＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲＤＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチド。

２．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４の配列ＭＡＴＹＩＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４の先端をコードする単離ポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６のコード部分を太字で示し、このコード部分は１０８位から開始され、２２８２位で終結する。転写物はまた、表６３１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸２８４〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜６７４にも対応するＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲＤＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７のコード部分を太字で示し、このコード部分は２８３位から開始され、２３０４位で終結する。転写物はまた、表６３２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸３６５〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３のアミノ酸１〜５９３にも対応するＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲＤＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３をコードする単離キメラポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９のコード部分を太字で示し、このコード部分は５６５位から開始され、２３４３位で終結する。転写物はまた、表６３３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜１９に対応する配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸７３８〜９５７に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７のアミノ酸２０〜２３９にも対応するＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫＳＶＥＬＤＮＤＤＧＧＧＳＡＡＱＫＱＫＩＳＦＬＥＮＮＬＥＱＬＴＫＶＨＫＱＬＶＲＤＮＡＤＬＲＣＥＬＰＫＬＥＫＲＬＲＡＴＡＥＲＶＫＡＬＥＳＡＬＫＥＡＫＥＮＡＭＲＤＲＫＲＹＱＱＥＶＤＲＩＫＥＡＶＲＡＫＮＭＡＲＲＡＨＳＡＱＩＡＫＰＩＲＰＧＨＹＰＡＳＳＰＴＡＶＨＡＩＲＧＧＧＧＳＳＳＮＳＴＨＹＱＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

２．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７の配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７の先端をコードする単離ポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、２つのうちの１つのシグナルペプチド推定プログラム（ＨＭＭ：Ｎｏｎ−ｓｅｃｒｅｔｏｒｙｐｒｏｔｅｉｎ，ＮＮ：ＹＥＳ）によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１のコード部分を太字で示し、このコード部分は６３３位から開始され、１３４９位で終結する。転写物はまた、表６３４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜７３６に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜７３６にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥＬＬＡＳＴＲＲＤＹＥＫＩＱＥＥＬＴＲＬＱＩＥＮＥＡＡＫＤＥＶＫＥＶＬＱＡＬＥＥＬＡＶＮＹＤＱＫＳＱＥＶＥＤＫＴＲＡＮＥＱＬＴＤＥＬＡＱＫＴＴＴＬＴＴＴＱＲＥＬＳＱＬＱＥＬＳＮＨＱＫＫＲＡＴＥＩＬＮＬＬＬＫＤＬＧＥＩＧＧＩＩＧＴＮＤＶＫＴＬＡＤＶＮＧＶＩＥＥＥＦＴＭＡＲＬＹＩＳＫＭＫＳＥＶＫＳＬＶＮＲＳＫＱＬＥＳＡＱＭＤＳＮＲＫＭＮＡＳＥＲＥＬＡＡＣＱＬＬＩＳＱＨＥＡＫＩＫＳＬＴＤＹＭＱＮＭＥＱＫＲＲＱＬＥＥＳＱＤＳＬＳＥＥＬＡＫＬＲＡＱＥＫＭＨＥＶＳＦＱＤＫＥＫＥＨＬＴＲＬＱＤＡＥＥＭＫＫＡＬＥＱＱＭＥＳＨＲＥＡＨＱＫＱＬＳＲＬＲＤＥＩＥＥＫＱＫＩＩＤＥＩＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８のアミノ酸７３７〜７３７に対応する配列Ｅを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８はまた、表６３５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３のコード部分を太字で示し、このコード部分は３９６位から開始され、２６０６位で終結する。転写物はまた、表６３６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１４によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜４５４に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のアミノ酸１〜４５４にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮＧＥＡＶＰＥＤＥＱＩＳＡＫＤＱＫＮＬＥＰＣＤＮＴＰＩＩＤＮＩＡＰＶＶＡＧＩＳＴＥＥＫＥＫＹＤＥＥＩＳＳＬＹＲＱＬＤＤＫＤＤＥＩＮＱＱＳＱＬＡＥＫＬＫＱＱＭＬＤＱＤＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のアミノ酸４５５〜５１４に対応する配列ＶＫＮＡＩＹＦＦＦＨＫＶＬＬＬＬＦＶＶＤＶＣＳＲＮＬＩＧＩＥＡＦＨＮＹＲＩＭＷＫＦＬＧＲＣＰＦＴＡＳＹＫＬＩＩＴＥＦＲＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９をコードする単離キメラポリペプチド。

２．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９中の配列ＶＫＮＡＩＹＦＦＦＨＫＶＬＬＬＬＦＶＶＤＶＣＳＲＮＬＩＧＩＥＡＦＨＮＹＲＩＭＷＫＦＬＧＲＣＰＦＴＡＳＹＫＬＩＩＴＥＦＲＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９はまた、表６３７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１４（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１４のコード部分を太字で示し、このコード部分は３９６位から開始され、１９３７位で終結する。転写物はまた、表６３８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１５によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜１９に対応する配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳを有するポリペプチドとと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸７３８〜８１５に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のアミノ酸２０〜９７にも対応するＬＮＱＫＬＱＬＥＱＥＫＬＳＳＤＹＮＫＬＫＩＥＤＱＥＲＥＭＫＬＥＫＬＬＬＬＮＤＫＲＥＱＡＲＥＤＬＫＧＬＥＥＴＶＳＲＥＬＱＴＬＨＮＬＲＫＬＦＶＱＤＬＴＴＲＶＫＫと少なくとも９０％相同な第２のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のアミノ酸９８〜１２５に対応する配列ＶＳＳＬＣＬＮＧＴＥＫＫＩＫＤＧＲＥＥＳＦＳＶＥＩＳＬＡを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

２．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０の配列ＭＴＱＮＦＲＬＭＷＮＩＬＬＦＰＬＮＦＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチド。

３．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０中の配列ＶＳＳＬＣＬＮＧＴＥＫＫＩＫＤＧＲＥＥＳＦＳＶＥＩＳＬＡと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１０は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１５（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１５のコード部分を太字で示し、このコード部分は６３３位から開始され、１００７位で終結する。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜３７２に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１〜３７２にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲＡＫＴＩＫＮＴＶＳＶＮＬＥＬＴＡＥＥＷＫＫＫＹＥＫＥＫＥＫＮＫＴＬＫＮＶＩＱＨＬＥＭＥＬＮＲＷＲＮと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のアミノ酸３７３〜３８５に対応する配列ＤＦＬＡＡＨＶＦＧＫＬＬＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチド。

２．Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１中の配列ＤＦＬＡＡＨＶＦＧＫＬＬＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１はまた、表６３９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４のコード部分を太字で示し、このコード部分は３９６位から開始され、１５５０位で終結する。転写物はまた、表６４０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５によってコードされる。公知のタンパク質（キネシン重鎖イソ型５Ｃ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２とＫＦ５Ｃ＿ＨＵＭＡＮとの間の比較の報告
１．ＫＦ５Ｃ＿ＨＵＭＡＮのアミノ酸１〜３２３に対応し、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸１〜３２３にも対応するＭＡＤＰＡＥＣＳＩＫＶＭＣＲＦＲＰＬＮＥＡＥＩＬＲＧＤＫＦＩＰＫＦＫＧＤＥＴＶＶＩＧＱＧＫＰＹＶＦＤＲＶＬＰＰＮＴＴＱＥＱＶＹＮＡＣＡＫＱＩＶＫＤＶＬＥＧＹＮＧＴＩＦＡＹＧＱＴＳＳＧＫＴＨＴＭＥＧＫＬＨＤＰＱＬＭＧＩＩＰＲＩＡＨＤＩＦＤＨＩＹＳＭＤＥＮＬＥＦＨＩＫＶＳＹＦＥＩＹＬＤＫＩＲＤＬＬＤＶＳＫＴＮＬＡＶＨＥＤＫＮＲＶＰＹＶＫＧＣＴＥＲＦＶＳＳＰＥＥＶＭＤＶＩＤＥＧＫＡＮＲＨＶＡＶＴＮＭＮＥＨＳＳＲＳＨＳＩＦＬＩＮＩＫＱＥＮＶＥＴＥＫＫＬＳＧＫＬＹＬＶＤＬＡＧＳＥＫＶＳＫＴＧＡＥＧＡＶＬＤＥＡＫＮＩＮＫＳＬＳＡＬＧＮＶＩＳＡＬＡＥＧＴＫＴＨＶＰＹＲＤＳＫＭＴＲＩＬＱＤＳＬＧＧＮＣＲＴＴＩＶＩＣＣＳＰＳＶＦＮＥＡＥＴＫＳＴＬＭＦＧＱＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸３２４〜３２４に対応する配列Ｖを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２をコードする単離キメラポリペプチド。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２はまた、表６４１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２は、以下の転写物によってコードされる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５のコード部分を太字で示し、このコード部分は３７８位から開始され、１３４９位で終結する。転写物はまた、表６４２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ６２０９６＿ＰＥＡ＿１＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＭ６２０９６は、上の表２に列挙した４２個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６４３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６４４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６４５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿１７は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７。以下の表６４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ９。以下の表６４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿２7は、３5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４。以下の表６５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿３８は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿４０は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿４８は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿５０は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１５。以下の表６５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿５６は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１５。以下の表６５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６０は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６５は、５１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６９は、８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿７１は、１７８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿１を、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、１８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６６９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６７０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ９。以下の表６７１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿３３は、２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１３、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１４。以下の表６７２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿４２は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６７３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿４４は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿４７は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１３。以下の表６７５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表６７６に示す）。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿５１は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１５。以下の表６７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿５３は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１５。以下の表６７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿５５は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ１１、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１５。以下の表６７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿５８は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６２は、１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６６は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６７を、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿６８を、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ６２０９６＿ＰＥＡ＿１＿ｎｏｄｅ＿７０は、５５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ４、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ５、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ６、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ７、Ｍ６２０９６＿ＰＥＡ＿１＿Ｔ９、およびＭ６２０９６＿ＰＥＡ＿１＿Ｔ１１。以下の表６８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P4 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6936.00 Escore: 0
Matching length: 719 Total length: 719
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
7 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRIL 56
||||||||||||||||||||||||||||||||||||||||||||||||||
239 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRIL 288
. . . . .
57 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 106
||||||||||||||||||||||||||||||||||||||||||||||||||
289 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 338
. . . . .
107 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 156
||||||||||||||||||||||||||||||||||||||||||||||||||
339 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 388
. . . . .
157 NLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 206
||||||||||||||||||||||||||||||||||||||||||||||||||
389 NLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 438
. . . . .
207 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 256
||||||||||||||||||||||||||||||||||||||||||||||||||
439 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 488
. . . . .
257 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 306
||||||||||||||||||||||||||||||||||||||||||||||||||
489 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 538
. . . . .
307 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 356
||||||||||||||||||||||||||||||||||||||||||||||||||
539 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 588
. . . . .
357 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 406
||||||||||||||||||||||||||||||||||||||||||||||||||
589 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 638
. . . . .
407 KIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKE 456
||||||||||||||||||||||||||||||||||||||||||||||||||
639 KIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKE 688
. . . . .
457 HLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDL 506
||||||||||||||||||||||||||||||||||||||||||||||||||
689 HLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDL 738
. . . . .
507 NQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLE 556
||||||||||||||||||||||||||||||||||||||||||||||||||
739 NQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLE 788
. . . . .
557 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 606
||||||||||||||||||||||||||||||||||||||||||||||||||
789 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 838
. . . . .
607 NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKE 656
||||||||||||||||||||||||||||||||||||||||||||||||||
839 NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKE 888
. . . . .
657 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTA 706
||||||||||||||||||||||||||||||||||||||||||||||||||
889 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTA 938
.
707 VHAIRGGGGSSSNSTHYQK 725
|||||||||||||||||||
939 VHAIRGGGGSSSNSTHYQK 957

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P5 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6520.00 Escore: 0
Matching length: 674 Total length: 674
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
284 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSV 333
. . . . .
51 NLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQIS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
334 NLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQIS 383
. . . . .
101 AKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDD 150
||||||||||||||||||||||||||||||||||||||||||||||||||
384 AKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDD 433
. . . . .
151 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
434 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 483
. . . . .
201 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 250
||||||||||||||||||||||||||||||||||||||||||||||||||
484 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 533
. . . . .
251 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
534 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 583
. . . . .
301 FTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
584 FTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLI 633
. . . . .
351 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
634 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 683
. . . . .
401 DKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 450
||||||||||||||||||||||||||||||||||||||||||||||||||
684 DKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 733
. . . . .
451 EIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQARED 500
||||||||||||||||||||||||||||||||||||||||||||||||||
734 EIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQARED 783
. . . . .
501 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 550
||||||||||||||||||||||||||||||||||||||||||||||||||
784 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 833
. . . . .
551 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESAL 600
||||||||||||||||||||||||||||||||||||||||||||||||||
834 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESAL 883
. . . . .
601 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
884 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPA 933
. .
651 SSPTAVHAIRGGGGSSSNSTHYQK 674
||||||||||||||||||||||||
934 SSPTAVHAIRGGGGSSSNSTHYQK 957

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P3 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 5726.00 Escore: 0
Matching length: 593 Total length: 593
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
365 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEK 414
. . . . .
51 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 100
||||||||||||||||||||||||||||||||||||||||||||||||||
415 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 464
. . . . .
101 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
465 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 514
. . . . .
151 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
515 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 564
. . . . .
201 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
565 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 614
. . . . .
251 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
615 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 664
. . . . .
301 SEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAH 350
||||||||||||||||||||||||||||||||||||||||||||||||||
665 SEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAH 714
. . . . .
351 QKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQERE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
715 QKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQERE 764
. . . . .
401 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 450
||||||||||||||||||||||||||||||||||||||||||||||||||
765 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 814
. . . . .
451 KSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
815 KSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPK 864
. . . . .
501 LEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
865 LEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 914
. . . .
551 RRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK 593
|||||||||||||||||||||||||||||||||||||||||||
915 RRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK 957

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P7 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 2117.00 Escore: 0
Matching length: 220 Total length: 220
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
20 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 787
. . . . .
70 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 119
||||||||||||||||||||||||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 837
. . . . .
120 ENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAK 169
||||||||||||||||||||||||||||||||||||||||||||||||||
838 ENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAK 887
. . . . .
170 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPT 219
||||||||||||||||||||||||||||||||||||||||||||||||||
888 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPT 937
. .
220 AVHAIRGGGGSSSNSTHYQK 239
||||||||||||||||||||
938 AVHAIRGGGGSSSNSTHYQK 957

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P8 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 7146.00 Escore: 0
Matching length: 737 Total length: 737
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.86
Total Percent Similarity: 100.00 Total Percent Identity: 99.86
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. . . . .
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
. . . . .
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
. . . . .
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
. . . . .
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
. . . . .
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
. . . . .
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
. . . . .
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
. . .
701 KALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRE 737
||||||||||||||||||||||||||||||||||||:
701 KALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRD 737

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P9 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 4434.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. . . . .
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
. . . . .
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450

451 DQDE 454
||||
451 DQDE 454

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P10 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 747.00 Escore: 0
Matching length: 78 Total length: 78
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
20 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 787
. .
70 EETVSRELQTLHNLRKLFVQDLTTRVKK 97
||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKK 815

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P11 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3634.00 Escore: 0
Matching length: 372 Total length: 372
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. .
351 EKNKTLKNVIQHLEMELNRWRN 372
||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRN 372

Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P12 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3145.00 Escore: 0
Matching length: 323 Total length: 323
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. .
301 VICCSPSVFNEAETKSTLMFGQR 323
|||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQR 323

正常および癌性肺組織における配列名Ｍ６２０６９ｓｅｇ１９中に示すアンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）Ｍ６２０６９転写物の発現
ｓｅｇ１９、Ｍ６２０６９ｓｅｇ１９アンプリコン（配列番号１６５７）、ならびにＭ６２０６９ｓｅｇ１９Ｆ（配列番号１６５５）およびＭ６２０６９ｓｅｇ１９Ｒ（配列番号１６５６）プライマーによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６５は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。

図６５から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち２個および８個の小細胞癌サンプルのうち８個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｍ６２０６９ｓｅｇ１９Ｆ順方向プライマーおよびＭ６２０６９ｓｅｇ１９Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｍ６２０６９ｓｅｇ１９。

順方向プライマー−Ｍ６２０６９ｓｅｇ１９Ｆ（配列番号１６５５）：ＧＣＴＧＡＴＴＧＴＣＣＣＣＡＴＧＡＡＧＧ
逆方向プライマー−Ｍ６２０６９ｓｅｇ１９（配列番号１６５６）：ＴＧＧＣＡＴＡＣＧＧＧＡＡＣＴＣＡＧＴＧ
アンプリコン（配列番号１６５７）：ＧＣＴＧＡＴＴＧＴＣＣＣＣＡＴＧＡＡＧＧＣＣＡＧＣＣＴＴＧＡＡＧＣＴＴＧＧＴＣＡＧＴＣＴＣＣＣＴＡＡＣＴＧＴＡＴＧＡＴＴＧＡＴＣＣＣＣＡＣＴＴＡＴＴＧＣＡＣＴＡＣＡＴＣＡＣＴＧＡＧＴＴＣＣＣＧＴＡＴＧＣ

正常および癌性肺組織における配列名Ｍ６２０６９ｓｅｇ２９中に示すアンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）Ｍ６２０６９転写物の発現
ｓｅｇ２９、Ｍ６２０６９ｓｅｇ２９アンプリコン（配列番号１６６０）、ならびにＭ６２０６９ｓｅｇ２９Ｆ（配列番号１６５８）およびＭ６２０６９ｓｅｇ２９Ｒ（配列番号１６５９）プライマーによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６６は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。

図６６から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち２個および８個の小細胞癌サンプルのうち７個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｍ６２０６９ｓｅｇ２９Ｆ順方向プライマーおよびＭ６２０６９ｓｅｇ２９Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｍ６２０６９ｓｅｇ２９。

順方向プライマー−Ｍ６２０６９ｓｅｇ２９Ｆ：ＡＴＴＧＡＡＴＡＡＴＴＣＡＧＣＡＣＣＴＧＡＧＧＣ
逆方向プライマー−Ｍ６２０６９ｓｅｇ２９Ｒ：ＴＴＣＡＴＡＴＧＧＣＴＡＣＴＣＣＣＣＡＣＣＴ
アンプリコン：ＡＴＴＧＡＡＴＡＡＴＴＣＡＧＣＡＣＣＴＧＡＧＧＣＴＧＧＴＧＧＡＴＧＡＴＴＣＴＴＴＧＣＡＡＴＴＴＧＧＣＡＧＧＡＡＴＧＧＧＡＧＡＧＴＣＧＧＧＡＧＣＡＧＴＡＧＴＴＧＧＣＡＡＧＧＴＧＧＧＧＡＧＴＡＧＣＣＡＴＡＴＧＡＡ

クラスターＭ７８０７６の説明
クラスターＭ７８０７６は、目的の９つの転写物および３５個のセグメントを特徴とし、その名称を、それぞれ表６８６および６８７に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表６８８に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアミロイド様タンパク質１前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＡＰＰ１＿ＨＵＭＡＮ、同義語ＡＰＬＰ、ＡＰＬＰ−１としても公知である）（配列番号１４３９）の変異型である。

タンパク質アミロイド様タンパク質１前駆体は、以下の機能を有することが公知であるか、そのように見なされている：シナプス後機能で役割を果たし得る。Ｃ末端γセクレターゼプロセシングフラグメント（ＡＬＩＤ１）は、ＡＰＢＢ１（Ｆｅ６５）結合によって転写活性化を活性化する（類似性による）。Ｃ末端結合を介してＪＩＰシグナル変換に関連する。細胞Ｇタンパク質シグナル伝達経路と相互作用し得る。ヘパリンおよびＩ型コラーゲンなどの細胞外基質成分への結合によって神経突起伸長を調節することができる。γ−ＣＴＦペプチドＣ３０は、神経アポトーシスの強力なエンハンサーである（類似性による）。タンパク質アミロイド様タンパク質１前駆体の配列を、「アミロイド様タンパク質１前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表６８９に示す。

タンパク質アミロイド様タンパク質１前駆体の局在化は、Ｉ型膜タンパク質と考えられる。ゴルジ複合体でのＣ末端プロセシング。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるエンドサイトーシス、アポトーシス、細胞接着、ニューロン新生、細胞死、分子機能に関連する注釈付けであるタンパク質結合、ヘパリン結合、および細胞成分に関連する注釈付けである基底膜、被覆小窩、内在性膜タンパク質。

上記のように、クラスターＭ７８０７６は、上の表１に列挙した９つの転写物を特徴とする。これらの転写物は、タンパク質アミロイド様タンパク質１前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５１７に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３のアミノ酸１〜５１７にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３のアミノ酸５１８〜５１９に対応する配列ＧＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３をコードする単離キメラポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３はまた、表６９０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３のグリコシル化部位を表６９１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２のコード部分を太字で示し、このコード部分は１４２位から開始され、１６９８位で終結する。転写物はまた、表６９２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５２６に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜５２６にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のアミノ酸５２７〜５４１に対応する配列ＥＣＬＴＶＮＰＳＬＱＩＰＬＮＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチド。

２．Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４中の配列ＥＣＬＴＶＮＰＳＬＱＩＰＬＮＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４はまた、表６９３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４のグリコシル化部位を表６９４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３のコード部分を太字で示し、このコード部分は１４２位から開始され、１７６４位で終結する。転写物はまた、表６９５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５２６に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸１〜５２６にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のアミノ酸５２７〜５４４に対応する配列ＥＣＶＣＳＫＧＦＰＦＰＬＩＧＤＳＥＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２をコードする単離キメラポリペプチド。

２．Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２中の配列ＥＣＶＣＳＫＧＦＰＦＰＬＩＧＤＳＥＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２はまた、表６９６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２のグリコシル化部位を表６９７に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３のコード部分を太字で示し、このコード部分は１４２位から開始され、１７７３位で終結する。転写物はまた、表６９８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜５７０に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のアミノ酸１〜５７０にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧＳＴＥＱＤＡＡＳＰＥＫＥＫＭＮＰＬＥＱＹＥＲＫＶＮＡＳＶＰＲＧＦＰＦＨＳＳＥＩＱＲＤＥＬと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のアミノ酸５７１〜６１９に対応する配列ＶＲＧＧＴＡＧＹＬＧＥＥＴＲＧＱＲＰＧＣＤＳＱＳＨＴＧＰＳＫＫＰＳＡＰＳＰＬＰＡＧＴＳＷＤＲＧＶＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４をコードする単離キメラポリペプチド。

２．Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４中の配列ＶＲＧＧＴＡＧＹＬＧＥＥＴＲＧＱＲＰＧＣＤＳＱＳＨＴＧＰＳＫＫＰＳＡＰＳＰＬＰＡＧＴＳＷＤＲＧＶＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４はまた、表６９９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４のグリコシル化部位を表７００に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５のコード部分を太字で示し、このコード部分は１４２位から開始され、１９９８位で終結する。転写物はまた、表７０１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜３５２に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１のアミノ酸１〜３５２にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥと少なくとも９０％相同な第１のアミノ酸配列と、ＡＰＰ１＿ＨＵＭＡＮのアミノ酸４０６〜６５０に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１のアミノ酸３５３〜５９７にも対応するＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩＱＥＬＬＨＳＥＨＬＧＰＳＥＬＥＡＰＡＰＧＧＳＳＥＤＫＧＧＬＱＰＰＤＳＫＤＤＴＰＭＴＬＰＫＧＳＴＥＱＤＡＡＳＰＥＫＥＫＭＮＰＬＥＱＹＥＲＫＶＮＡＳＶＰＲＧＦＰＦＨＳＳＥＩＱＲＤＥＬＡＰＡＧＴＧＶＳＲＥＡＶＳＧＬＬＩＭＧＡＧＧＧＳＬＩＶＬＳＭＬＬＬＲＲＫＫＰＹＧＡＩＳＨＧＶＶＥＶＤＰＭＬＴＬＥＥＱＱＬＲＥＬＱＲＨＧＹＥＮＰＴＹＲＦＬＥＥＲＰと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＥＡを含み、以下の構造：アミノ酸番号３５２−ｘ〜３５２のいずれかから始まり、アミノ酸番号３５３＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１の縁部分をコードする単離キメラポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意され、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１はまた、表７０２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１のグリコシル化部位を表７０３に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３のコード部分を太字で示し、このコード部分は１４２位から開始され、１９３２位で終結する。転写物はまた、表７０４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜４８１に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のアミノ酸１〜４８１にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶＨＴＨＬＱＶＩＥＥＲＶＮＱＳＬＧＬＬＤＱＮＰＨＬＡＱＥＬＲＰＱＩと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のアミノ酸４８２〜４９８に対応する配列ＲＥＣＬＬＰＷＬＰＬＱＩＳＥＧＲＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４をコードする単離キメラポリペプチド。

２．Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４中の配列ＲＥＣＬＬＰＷＬＰＬＱＩＳＥＧＲＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４はまた、表７０５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４のグリコシル化部位を表７０６に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６のコード部分を太字で示し、このコード部分は１４２位から開始され、１６３５位で終結する。転写物はまた、表７０７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜４４９に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜４４９にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱＶと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のアミノ酸４５０〜５８８に対応する配列ＬＴＳＦＱＬＰＮＡＰＬＦＬＲＲＰＲＬＲＬＦＳＣＰＬＤＰＬＳＶＳＷＴＰＳＹＰＬＮＴＡＳＬＰＬＰＳＬＳＡＱＬＰＤＰＥＴＷＴＬＴＣＣＶＦＤＰＣＦＬＡＬＧＦＬＬＰＰＰＳＩＬＣＳＶＰＷＩＦＴＡＦＰＲＩＶＦＦＦＦＦＦＬＲＱＶＬＡＬＳＰＲＱＥＳＳＶＲＳＷＬＩＡＴＳＴＳＷＶＱＡＩＬＬＰＱＰＬＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２中の配列ＬＴＳＦＱＬＰＮＡＰＬＦＬＲＲＰＲＬＲＬＦＳＣＰＬＤＰＬＳＶＳＷＴＰＳＹＰＬＮＴＡＳＬＰＬＰＳＬＳＡＱＬＰＤＰＥＴＷＴＬＴＣＣＶＦＤＰＣＦＬＡＬＧＦＬＬＰＰＰＳＩＬＣＳＶＰＷＩＦＴＡＦＰＲＩＶＦＦＦＦＦＦＬＲＱＶＬＡＬＳＰＲＱＥＳＳＶＲＳＷＬＩＡＴＳＴＳＷＶＱＡＩＬＬＰＱＰＬＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２はまた、表７０８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２のグリコシル化部位を表７０９に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７のコード部分を太字で示し、このコード部分は１４２位から開始され、１９０５位で終結する。転写物はまた、表７１０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２８によってコードされる。公知のタンパク質（アミロイド様タンパク質１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５とＡＰＰ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＰＰ１＿ＨＵＭＡＮのアミノ酸１〜４４８に対応し、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のアミノ酸１〜４４８にも対応するＭＧＰＡＳＰＡＡＲＧＬＳＲＲＰＧＱＰＰＬＰＬＬＬＰＬＬＬＬＬＬＲＡＱＰＡＩＧＳＬＡＧＧＳＰＧＡＡＥＡＰＧＳＡＱＶＡＧＬＣＧＲＬＴＬＨＲＤＬＲＴＧＲＷＥＰＤＰＱＲＳＲＲＣＬＲＤＰＱＲＶＬＥＹＣＲＱＭＹＰＥＬＱＩＡＲＶＥＱＡＴＱＡＩＰＭＥＲＷＣＧＧＳＲＳＧＳＣＡＨＰＨＨＱＶＶＰＦＲＣＬＰＧＥＦＶＳＥＡＬＬＶＰＥＧＣＲＦＬＨＱＥＲＭＤＱＣＥＳＳＴＲＲＨＱＥＡＱＥＡＣＳＳＱＧＬＩＬＨＧＳＧＭＬＬＰＣＧＳＤＲＦＲＧＶＥＹＶＣＣＰＰＰＧＴＰＤＰＳＧＴＡＶＧＤＰＳＴＲＳＷＰＰＧＳＲＶＥＧＡＥＤＥＥＥＥＥＳＦＰＱＰＶＤＤＹＦＶＥＰＰＱＡＥＥＥＥＥＴＶＰＰＰＳＳＨＴＬＡＶＶＧＫＶＴＰＴＰＲＰＴＤＧＶＤＩＹＦＧＭＰＧＥＩＳＥＨＥＧＦＬＲＡＫＭＤＬＥＥＲＲＭＲＱＩＮＥＶＭＲＥＷＡＭＡＤＮＱＳＫＮＬＰＫＡＤＲＱＡＬＮＥＨＦＱＳＩＬＱＴＬＥＥＱＶＳＧＥＲＱＲＬＶＥＴＨＡＴＲＶＩＡＬＩＮＤＱＲＲＡＡＬＥＧＦＬＡＡＬＱＡＤＰＰＱＡＥＲＶＬＬＡＬＲＲＹＬＲＡＥＱＫＥＱＲＨＴＬＲＨＹＱＨＶＡＡＶＤＰＥＫＡＱＱＭＲＦＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のアミノ酸４４９〜５０５に対応する配列ＰＱＮＰＮＳＱＰＲＡＡＧＳＬＥＶＩＩＳＨＰＦＶＲＲＬＥＩＬＩＳＰＦＱＦＱＮＳＩＰＫＮＳＱＩＶＰＡＡＳＰＲＧＴＳＳＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５をコードする単離キメラポリペプチド。

２．Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５中の配列ＰＱＮＰＮＳＱＰＲＡＡＧＳＬＥＶＩＩＳＨＰＦＶＲＲＬＥＩＬＩＳＰＦＱＦＱＮＳＩＰＫＮＳＱＩＶＰＡＡＳＰＲＧＴＳＳＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のテールをコードする単離ポリペプチド。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５はまた、表７１１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質アミロイド様タンパク質１前駆体と比較した変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５のグリコシル化部位を表７１２に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５は、以下の転写物によってコードされる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２８（配列は出願書類の最後に示す）。転写物Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２８のコード部分を太字で示し、このコード部分は１４２位から開始され、１６５６位で終結する。転写物はまた、表７１３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｍ７８０７６＿ＰＥＡ＿１＿Ｐ２５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＭ７８０７６は、上の表２に列挙した３５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、４７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、７０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、７４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、９５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２０は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、１０５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７。以下の表７２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３２は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２７。以下の表７２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３５は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ５。以下の表７２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３７は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ５。以下の表７２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４６は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５。以下の表７２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４７は、１５５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿５４は、１３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿１は、４７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、５２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、５９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、６４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、９２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿２７を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２７。以下の表７３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、９０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２７。以下の表７３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、８９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２６、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２７。以下の表７３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、１０３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿３６を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７３９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４１を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ５。以下の表７４０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４２を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４３は、１１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表７４３に示す）。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４５は、１３２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表７４５に示す）。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４９は、１２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿５０は、１２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿５１は、１２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿５２を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２３。以下の表７４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＭ７８０７６＿ＰＥＡ＿１＿ｎｏｄｅ＿５３を、以下の転写物中に見出すことができる：Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１３、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ１５、Ｍ７８０７６＿ＰＥＡ＿１＿Ｔ２３、およびＭ７８０７６＿ＰＥＡ＿１＿Ｔ２８。以下の表７５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P3 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5132.00 Escore: 0
Matching length: 517 Total length: 517
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
.
501 GGSSEDKGGLQPPDSKD 517
|||||||||||||||||
501 GGSSEDKGGLQPPDSKD 517

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P4 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P12 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P14 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5672.00 Escore: 0
Matching length: 575 Total length: 575
Matching Percent Similarity: 99.48 Matching Percent Identity: 99.48
Total Percent Similarity: 99.48 Total Percent Identity: 99.48
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. .
551 NASVPRGFPFHSSEIQRDELVRGGT 575
|||||||||||||||||||| ||
551 NASVPRGFPFHSSEIQRDELAPAGT 575

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P21 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5822.00 Escore: 0
Matching length: 597 Total length: 650
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 91.85 Total Percent Identity: 91.85
Gaps: 1

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NE................................................ 352
||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
353 .....AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 397
|||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
398 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 447
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
448 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 497
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. . . . .
498 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 547
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 600
. . . . .
548 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 597
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 650

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P24 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4791.00 Escore: 0
Matching length: 485 Total length: 485
Matching Percent Similarity: 99.79 Matching Percent Identity: 99.59
Total Percent Similarity: 99.79 Total Percent Identity: 99.59
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIRECL 485
|||||||||||||||||||||||||||||||:| |
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELL 485

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P2 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4474.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 99.56 Matching Percent Identity: 99.34
Total Percent Similarity: 99.56 Total Percent Identity: 99.34
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVL 450
|||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450

451 TSFQ 454
| :|
451 THLQ 454

Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P25 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4455.00 Escore: 0
Matching length: 448 Total length: 448
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448
||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448

クラスターＴ９９０８０の説明
クラスターＴ９９０８０は、目的の１４個の転写物および１１個のセグメントを特徴とし、その名称を、それぞれ表７５１および７５２に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表７５３に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアシルホスファターゼ器官共通型イソ酵素（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＡＣＹＯ＿ＨＵＭＡＮ、同義語ＥＣ３．６．１．７、アシルホスファターゼホスホヒドロラーゼ、アシルホスファターゼ赤血球イソ酵素としても公知である）（配列番号１４４０）の変異型である。

タンパク質アシルホスファターゼ器官共通型イソ酵素の配列を、「アシルホスファターゼ器官共通型イソ酵素アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表７５４に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるリン酸塩代謝、分子機能に関連する注釈付けであるアシルホスファターゼ。

上記のように、クラスターＴ９９０８０は、上の表１に列挙した１４個の転写物を特徴とする。これらの転写物は、タンパク質アシルホスファターゼ器官共通型イソ酵素の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１はまた、表７５５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０のコード部分を太字で示し、このコード部分は２２６位から開始され、４１１位で終結する。転写物はまた、表７５６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ２は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２のコード部分を太字で示し、このコード部分は１位から開始され、１９２位で終結する。転写物はまた、表７５７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ６によってコードされる。公知のタンパク質（アシルホスファターゼ器官共通型イソ酵素）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５とＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１（配列番号１４４１）との間の比較の報告
１．Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５のアミノ酸１〜３０に対応する配列ＭＰＡＳＡＲＬＡＧＡＧＬＬＬＡＦＬＲＡＬＧＣＡＧＲＡＰＧＬＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜９９に対応し、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５のアミノ酸３１〜１２９にも対応するＭＡＥＧＮＴＬＩＳＶＤＹＥＩＦＧＫＶＱＧＶＦＦＲＫＨＴＱＡＥＧＫＫＬＧＬＶＧＷＶＱＮＴＤＲＧＴＶＱＧＱＬＱＧＰＩＳＫＶＲＨＭＱＥＷＬＥＴＲＧＳＰＫＳＨＩＤＫＡＮＦＮＮＥＫＶＩＬＫＬＤＹＳＤＦＱＩＶＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５をコードする単離キメラポリペプチド。

２．Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５の配列ＭＰＡＳＡＲＬＡＧＡＧＬＬＬＡＦＬＲＡＬＧＣＡＧＲＡＰＧＬＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５の先端をコードする単離ポリペプチド。

公知のタンパク質配列（ＡＣＹＯ＿ＨＵＭＡＮ）は、出願書類の最後に示す配列より１つまたは複数の変化があり、このアミノ酸配列をＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５はまた、表７５９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ６のコード部分を太字で示し、このコード部分は２２６位から開始され、６１２位で終結する。転写物はまた、表７６０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ９によってコードされる。公知のタンパク質（アシルホスファターゼ器官共通型イソ酵素）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８とＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１との間の比較の報告
１．Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８のアミノ酸１〜１に対応する配列Ｍを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＡＣＹＯ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸２８〜９９に対応し、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８のアミノ酸２〜７３にも対応するＱＡＥＧＫＫＬＧＬＶＧＷＶＱＮＴＤＲＧＴＶＱＧＱＬＱＧＰＩＳＫＶＲＨＭＱＥＷＬＥＴＲＧＳＰＫＳＨＩＤＫＡＮＦＮＮＥＫＶＩＬＫＬＤＹＳＤＦＱＩＶＫと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８をコードする単離キメラポリペプチド。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ９（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ９のコード部分を太字で示し、このコード部分は１６２位から開始され、３８０位で終結する。転写物はまた、表７６２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ９は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ１０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ９は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１０のコード部分を太字で示し、このコード部分は１位から開始され、２６１位で終結する。転写物はまた、表７６３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ１１によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１０は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１１のコード部分を太字で示し、このコード部分は１位から開始され、２４０位で終結する。転写物はまた、表７６４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ１４によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１２は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１４（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１４のコード部分を太字で示し、このコード部分は１位から開始され、２８２位で終結する。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ１７によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１３は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１７（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１７のコード部分を太字で示し、このコード部分は１位から開始され、２０７位で終結する。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ１８によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１４はまた、表７６５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１４は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１８（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１８のコード部分を太字で示し、このコード部分は２２６位から開始され、４８０位で終結する。転写物はまた、表７６６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ１９によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１５はまた、表７６７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１５は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１９（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１９のコード部分を太字で示し、このコード部分は２２６位から開始され、４５９位で終結する。転写物はまた、表７６８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ２０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１６はまた、表７６９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１６は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２０（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２０のコード部分を太字で示し、このコード部分は２２６位から開始され、５０１位で終結する。転写物はまた、表７７０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ９９０８０＿ＰＥＡ＿１＿Ｔ２１によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１７はまた、表７７１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１７は、以下の転写物によってコードされる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２１（配列は出願書類の最後に示す）。転写物Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２１のコード部分を太字で示し、このコード部分は２２６位から開始され、４２６位で終結する。転写物はまた、表７７２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ９９０８０＿ＰＥＡ＿４＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＴ９９０８０は、上の表２に列挙した１１個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿１は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ６、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１３、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１８、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１９、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２０、およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ２１。以下の表７７３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿６は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１７およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ２１。以下の表７７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿１１は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１４およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ２０。以下の表７７５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿１９は、５９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２、およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ４。以下の表７７６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿２０は、９８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ４、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ６、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ９、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１１、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１３、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１８、およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ１９。以下の表７７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿３は、４０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ９、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１１、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１４、およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ１７。以下の表７７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿５は、５７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ６、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１１、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１４、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１７、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１８、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１９、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ２０、およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ２１。以下の表７７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿８は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ９、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１０、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１４、Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１８、およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ２０。以下の表７８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表７８１に示す）。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿１３は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ４。以下の表７８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿１５は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ１１およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ１９。以下の表７８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ９９０８０＿ＰＥＡ＿４＿ｎｏｄｅ＿１８は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ９９０８０＿ＰＥＡ＿４＿Ｔ０およびＴ９９０８０＿ＰＥＡ＿４＿Ｔ２。以下の表７８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: ACYO_HUMAN_V1

Sequence documentation:

Alignment of: T99080_PEA_4_P5 x ACYO_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 973.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

31 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 80

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 50

. . . .

81 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVK 129

|||||||||||||||||||||||||||||||||||||||||||||||||

51 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVK 99

Sequence name: ACYO_HUMAN_V1

Sequence documentation:

Alignment of: T99080_PEA_4_P8 x ACYO_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 711.00 Escore: 0

Matching length: 72 Total length: 72

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

2 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 51

||||||||||||||||||||||||||||||||||||||||||||||||||

28 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 77

. .

52 KANFNNEKVILKLDYSDFQIVK 73

||||||||||||||||||||||

78 KANFNNEKVILKLDYSDFQIVK 99

クラスターＴ０８４４６の説明
クラスターＴ０８４４６は、目的の２つの転写物および３６個のセグメントを特徴とし、その名称を、それぞれ表７８５および７８６に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表７８７に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるソーティングネキシン２６（Ｓｏｒｔｉｎｇｎｅｘｉｎ２６）（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＳＮＸＱ＿ＨＵＭＡＮ）（配列番号１４４２）の変異型である。

タンパク質ソーティングネキシン２６は、以下の機能を有することが公知であるか、そのように見なされている：いくつかの細胞内輸送段階に関与し得る（類似性による）。タンパク質ソーティングネキシン２６の配列を、「ソーティングネキシン２６アミノ酸配列」として出願書類の最後に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである細胞内タンパク質輸送、分子機能に関連する注釈付けであるタンパク質輸送体。

上記のように、クラスターＴ０８４４６は、上の表１に列挙した２個の転写物を特徴とする。これらの転写物は、タンパク質ソーティングネキシン２６の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２によってコードされる。公知のタンパク質（ソーティングネキシン２６）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８とＳＮＸＱ＿ＨＵＭＡＮとの間の比較の報告
１．ＳＮＸＱ＿ＨＵＭＡＮのアミノ酸１〜１８５に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜１８５にも対応するＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１８６〜１３０５に対応する配列ＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチド。

２．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８中の配列ＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のテールをコードする単離ポリペプチド。

Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８とＱ９ＮＴ２３（配列番号１４４３）との間の比較の報告
１．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜４４３に対応する配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ９ＮＴ２３のアミノ酸１〜６７４に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸４４４〜１１１７にも対応するＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧと少なくとも９０％相同な第２のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１１１８に対応する架橋アミノ酸Ｐと、Ｑ９ＮＴ２３のアミノ酸６７６〜８６２に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１１１９〜１３０５にも対応するＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、架橋アミノ酸、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチド。

２．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチド。

Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８とＱ９６ＣＰ３（配列番号１４４４）との間の比較の報告
１．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜１０１０に対応する配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ９６ＣＰ３のアミノ酸１〜２９５に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１０１１〜１３０５にも対応するＬＲＧＰＡＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチド。

２．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチド。

Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８とＢＡＣ８６９０２（配列番号１４４５）との間の比較の報告
１．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１〜１５４に対応する配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＡＣ８６９０２のアミノ酸１〜８６１に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１５５〜１０１５にも対応するＭＬＶＰＬＬＬＱＹＬＥＴＬＳＧＬＶＤＳＮＬＮＣＧＰＶＬＴＷＭＥＬＤＮＨＧＲＲＬＬＬＳＥＥＡＳＬＮＩＰＡＶＡＡＡＨＶＩＫＲＹＴＡＱＡＰＤＥＬＳＦＥＶＧＤＩＶＳＶＩＤＭＰＰＴＥＤＲＳＷＷＲＧＫＲＧＦＱＶＧＦＦＰＳＥＣＶＥＬＦＴＥＲＰＧＰＧＬＫＡＤＡＤＧＰＰＣＧＩＰＡＰＱＧＩＳＳＬＴＳＡＶＰＲＰＲＧＫＬＡＧＬＬＲＴＦＭＲＳＲＰＳＲＱＲＬＲＱＲＧＩＬＲＱＲＶＦＧＣＤＬＧＥＨＬＳＮＳＧＱＤＶＰＱＶＬＲＣＣＳＥＦＩＥＡＨＧＶＶＤＧＩＹＲＬＳＧＶＳＳＮＩＱＲＬＲＨＥＦＤＳＥＲＩＰＥＬＳＧＰＡＦＬＱＤＩＨＳＶＳＳＬＣＫＬＹＦＲＥＬＰＮＰＬＬＴＹＱＬＹＧＫＦＳＥＡＭＳＶＰＧＥＥＥＲＬＶＲＶＨＤＶＩＱＱＬＰＰＰＨＹＲＴＬＥＹＬＬＲＨＬＡＲＭＡＲＨＳＡＮＴＳＭＨＡＲＮＬＡＩＶＷＡＰＮＬＬＲＳＭＥＬＥＳＶＧＭＧＧＡＡＡＦＲＥＶＲＶＱＳＶＶＶＥＦＬＬＴＨＶＤＶＬＦＳＤＴＦＴＳＡＧＬＤＰＡＧＲＣＬＬＰＲＰＫＳＬＡＧＳＣＰＳＴＲＬＬＴＬＥＥＡＱＡＲＴＱＧＲＬＧＴＰＴＥＰＴＴＰＫＡＰＡＳＰＡＥＲＲＫＧＥＲＧＥＫＱＲＫＰＧＧＳＳＷＫＴＦＦＡＬＧＲＧＰＳＶＰＲＫＫＰＬＰＷＬＧＧＴＲＡＰＰＱＰＳＧＳＲＰＤＴＶＴＬＲＳＡＫＳＥＥＳＬＳＳＱＡＳＧＡＧＬＱＲＬＨＲＬＲＲＰＨＳＳＳＤＡＦＰＶＧＰＡＰＡＧＳＣＥＳＬＳＳＳＳＳＳＥＳＳＳＳＥＳＳＳＳＳＳＥＳＳＡＡＧＬＧＡＬＳＧＳＰＳＨＲＴＳＡＷＬＤＤＧＤＥＬＤＦＳＰＰＲＣＬＥＧＬＲＧＬＤＦＤＰＬＴＦＲＣＳＳＰＴＰＧＤＰＡＰＰＡＳＰＡＰＰＡＰＡＳＡＦＰＰＲＶＴＰＱＡＩＳＰＲＧＰＴＳＰＡＳＰＡＡＬＤＩＳＥＰＬＡＶＳＶＰＰＡＶＬＥＬＬＧＡＧＧＡＰＡＳＡＴＰＴＰＡＬＳＰＧＲＳＬＲＰＨＬＩＰＬＬＬＲＧＡＥＡＰＬＴＤＡＣＱＱＥＭＣＳＫＬＲＧＡＱＧＰＬＧＰＤＭＥＳＰＬＰＰＰＰＬＳＬＬＲＰＧＧＡＰＰＰＰＰＫＮＰＡＲＬＭＡＬＡＬＡＥＲＡＱＱＶＡＥＱＱＳＱＱＥＣＧＧＴＰＰＡＳＱＳＰＦＨＲＳＬＳＬＥＶＧＧＥＰＬＧＴＳＧＳＧＰＰＰＮＳＬＡＨＰＧＡＷＶＰＧＰＰＰＹＬＰＲＱＱＳＤＧＳＬＬＲＳＱＲＰＭＧＴＳＲＲＧＬＲＧＰＡと少なくとも９０％相同な第２のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１０１６〜１０４３に対応する配列ＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列と、ＢＡＣ８６９０２のアミノ酸８６２〜９８９に対応し、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１０４４〜１１７１にも対応するＱＶＰＴＰＧＦＦＳＰＡＰＲＥＣＬＰＰＦＬＧＶＰＫＰＧＬＹＰＬＧＰＰＳＦＱＰＳＳＰＡＰＶＷＲＳＳＬＧＰＰＡＰＬＤＲＧＥＮＬＹＹＥＩＧＡＳＥＧＳＰＹＳＧＰＴＲＳＷＳＰＦＲＳＭＰＰＤＲＬＮＡＳＹＧＭＬＧＱＳＰＰＬＨＲＳＰＤＦＬＬＳＹＰＰＡＰＳＣＦＰＰＤＨＬＧＹＳと少なくとも９０％相同な第４のアミノ酸配列と、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のアミノ酸１１７２〜１３０５に対応する配列ＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第５のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、第３のアミノ酸配列、第４のアミノ酸配列、および第５のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８をコードする単離キメラポリペプチド。

２．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の配列ＭＬＳＬＳＬＣＳＨＬＷＧＰＬＩＬＳＡＬＱＡＲＳＴＤＳＬＤＧＰＧＥＧＳＶＱＰＬＰＴＡＧＧＰＳＶＫＧＫＰＧＫＲＬＳＡＰＲＧＰＦＰＲＬＡＤＣＡＨＦＨＹＥＮＶＤＦＧＨＩＱＬＬＬＳＰＤＲＥＧＰＳＬＳＧＥＮＥＬＶＦＧＶＱＶＴＣＱＧＲＳＷＰＶＬＲＳＹＤＤＦＲＳＬＤＡＨＬＨＲＣＩＦＤＲＲＦＳＣＬＰＥＬＰＰＰＰＥＧＡＲＡＡＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の先端をコードする単離ポリペプチド。

３．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８に対応するＱＶＳＡＱＬＲＡＧＧＧＧＲＤＡＰＥＡＡＡＱＳＰＣＳＶＰＳをコードする配列と少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なアミノ酸配列を含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８の縁部分をコードする単離ポリペプチド。

４．Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８中の配列ＡＰＱＨＰＡＲＲＰＴＰＰＥＰＬＹＶＮＬＡＬＧＰＲＧＰＳＰＡＳＳＳＳＳＳＰＰＡＨＰＲＳＲＳＤＰＧＰＰＶＰＲＬＰＱＫＱＲＡＰＷＧＰＲＴＰＨＲＶＰＧＰＷＧＰＰＥＰＬＬＬＹＲＡＡＰＰＡＹＧＲＧＧＥＬＨＲＧＳＬＹＲＮＧＧＱＲＧＥＧＡＧＰＰＰＰＹＰＴＰＳＷＳＬＨＳＥＧＱＴＲＳＹＣと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８のテールをコードする単離ポリペプチド。

変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８はまた、表７８８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８は、以下の転写物によってコードされる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２（配列は出願書類の最後に示す）。転写物Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２のコード部分を太字で示し、このコード部分は２２８位から開始され、４１４２位で終結する。転写物はまた、表７８９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１９は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２２によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１９はまた、表７９０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１９は、以下の転写物によってコードされる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２２（配列は出願書類の最後に示す）。転写物Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２２のコード部分を太字で示し、このコード部分は２２８位から開始され、９６５位で終結する。転写物はまた、表７９１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ０８４４６＿ＰＥＡ＿１＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＴ０８４４６は、上の表２に列挙した３６個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２およびＴ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表７９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２およびＴ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表７９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表７９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿１７は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表７９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表７９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿３８は、２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表７９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿４３は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表７９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５１は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表７９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５２は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表７９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５５は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５７は、３７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５９は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６２は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６３は、６４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８０４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２およびＴ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表８０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、１７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２およびＴ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表８０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表８０７に示す）。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２およびＴ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表８０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表８０９に示す）。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２およびＴ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表８１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２２。以下の表８１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿３２は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿４５は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿４６は、１８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿４８は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５４を、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿５８は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６０は、２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６１は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６４を、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６５は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ０８４４６＿ＰＥＡ＿１＿ｎｏｄｅ＿６６は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ０８４４６＿ＰＥＡ＿１＿Ｔ２。以下の表８２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: SNXQ_HUMAN

Sequence documentation:

Alignment of: T08446_PEA_1_P18 x SNXQ_HUMAN ..

Alignment segment 1/1:

Quality: 1835.00 Escore: 0

Matching length: 185 Total length: 185

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKP 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKP 50

. . . . .

51 GKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELV 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 GKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELV 100

. . . . .

101 FGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGA 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 FGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGA 150

. . .

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185

|||||||||||||||||||||||||||||||||||

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185

Sequence name: Q9NT23

Sequence documentation:

Alignment of: T08446_PEA_1_P18 x Q9NT23 ..

Alignment segment 1/1:

Quality: 8548.00 Escore: 0

Matching length: 862 Total length: 862

Matching Percent Similarity: 99.88 Matching Percent Identity: 99.88

Total Percent Similarity: 99.88 Total Percent Identity: 99.88

Gaps: 0

Alignment:

. . . . .

444 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRS 493

||||||||||||||||||||||||||||||||||||||||||||||||||

1 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRS 50

. . . . .

494 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 543

||||||||||||||||||||||||||||||||||||||||||||||||||

51 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 100

. . . . .

544 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERR 593

||||||||||||||||||||||||||||||||||||||||||||||||||

101 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERR 150

. . . . .

594 KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSR 643

||||||||||||||||||||||||||||||||||||||||||||||||||

151 KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSR 200

. . . . .

644 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 693

||||||||||||||||||||||||||||||||||||||||||||||||||

201 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 250

. . . . .

694 ESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELD 743

||||||||||||||||||||||||||||||||||||||||||||||||||

251 ESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELD 300

. . . . .

744 FSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVT 793

||||||||||||||||||||||||||||||||||||||||||||||||||

301 FSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVT 350

. . . . .

794 PQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPA 843

||||||||||||||||||||||||||||||||||||||||||||||||||

351 PQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPA 400

. . . . .

844 LSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPL 893

||||||||||||||||||||||||||||||||||||||||||||||||||

401 LSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPL 450

. . . . .

894 PPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPP 943

||||||||||||||||||||||||||||||||||||||||||||||||||

451 PPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPP 500

. . . . .

944 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 993

||||||||||||||||||||||||||||||||||||||||||||||||||

501 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 550

. . . . .

994 DGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 1043

||||||||||||||||||||||||||||||||||||||||||||||||||

551 DGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 600

. . . . .

1044 QVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGP 1093

||||||||||||||||||||||||||||||||||||||||||||||||||

601 QVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGP 650

. . . . .

1094 PAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQS 1143

|||||||||||||||||||||||| |||||||||||||||||||||||||

651 PAPLDRGENLYYEIGASEGSPYSGLTRSWSPFRSMPPDRLNASYGMLGQS 700

. . . . .

1144 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 1193

||||||||||||||||||||||||||||||||||||||||||||||||||

701 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 750

. . . . .

1194 PRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGP 1243

||||||||||||||||||||||||||||||||||||||||||||||||||

751 PRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGP 800

. . . . .

1244 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 1293

||||||||||||||||||||||||||||||||||||||||||||||||||

801 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 850

.

1294 SLHSEGQTRSYC 1305

||||||||||||

851 SLHSEGQTRSYC 862

Sequence name: Q96CP3

Sequence documentation:

Alignment of: T08446_PEA_1_P18 x Q96CP3 ..

Alignment segment 1/1:

Quality: 3019.00 Escore: 0

Matching length: 295 Total length: 295

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1011 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLP 1060

||||||||||||||||||||||||||||||||||||||||||||||||||

1 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLP 50

. . . . .

1061 PFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGAS 1110

||||||||||||||||||||||||||||||||||||||||||||||||||

51 PFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGAS 100

. . . . .

1111 EGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAP 1160

||||||||||||||||||||||||||||||||||||||||||||||||||

101 EGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAP 150

. . . . .

1161 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAH 1210

||||||||||||||||||||||||||||||||||||||||||||||||||

151 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAH 200

. . . . .

1211 PRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAY 1260

||||||||||||||||||||||||||||||||||||||||||||||||||

201 PRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAY 250

. . . .

1261 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC 1305

|||||||||||||||||||||||||||||||||||||||||||||

251 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC 295

Sequence name: BAC86902

Sequence documentation:

Alignment of: T08446_PEA_1_P18 x BAC86902 ..

Alignment segment 1/1:

Quality: 9651.00 Escore: 0

Matching length: 991 Total length: 1019

Matching Percent Similarity: 99.90 Matching Percent Identity: 99.90

Total Percent Similarity: 97.15 Total Percent Identity: 97.15

Gaps: 1

Alignment:

. . . . .

155 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 204

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 50

. . . . .

205 AVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVG 254

||||||||||||||||||||||||||||||||||||||||||||||||||

51 AVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVG 100

. . . . .

255 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 304

||||||||||||||||||||||||||||||||||||||||||||||||||

101 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 150

. . . . .

305 GLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCS 354

||||||||||||||||||||||||||||||||||||||||||||||||||

151 GLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCS 200

. . . . .

355 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 404

||||||||||||||||||||||||||||||||||||||||||||||||||

201 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 250

. . . . .

405 SLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPH 454

||||||||||||||||||||||||||||||||||||||||||||||||||

251 SLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPH 300

. . . . .

455 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGA 504

||||||||||||||||||||||||||||||||||||||||||||||||||

301 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGA 350

. . . . .

505 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 554

||||||||||||||||||||||||||||||||||||||||||||||||||

351 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 400

. . . . .

555 CPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKP 604

||||||||||||||||||||||||||||||||||||||||||||||||||

401 CPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKP 450

. . . . .

605 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKS 654

||||||||||||||||||||||||||||||||||||||||||||||||||

451 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKS 500

. . . . .

655 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSES 704

||||||||||||||||||||||||||||||||||||||||||||||||||

501 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSES 550

. . . . .

705 SSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLR 754

||||||||||||||||||||||||||||||||||||||||||||||||||

551 SSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLR 600

. . . . .

755 GLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 804

||||||||||||||||||||||||||||||||||||||||||||||||||

601 GLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 650

. . . . .

805 PASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 854

||||||||||||||||||||||||||||||||||||||||||||||||||

651 PASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 700

. . . . .

855 IPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPG 904

||||||||||||||||||||||||||||||||||||||||||||||||||

701 IPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPG 750

. . . . .

905 GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLS 954

||||||||||||||||||||||||||||||||||||||||||||||||||

751 GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLS 800

. . . . .

955 LEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPM 1004

||||||||||||||||||||||||||||||||||||||||||||||||||

801 LEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPM 850

. . . . .

1005 GTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPA 1054

||||||||||| |||||||||||

851 GTSRRGLRGPA............................QVPTPGFFSPA 872

. . . . .

1055 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLY 1104

||||||||||||||||||||||||||||||||||||||||||||||||||

873 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLY 922

. . . . .

1105 YEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLL 1154

||||||||||||||||||||||||||||||||||||||||||||||||||

923 YEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLL 972

.

1155 SYPPAPSCFPPDHLGYSAP 1173

||||||||||||||||| |

973 SYPPAPSCFPPDHLGYSPP 991

クラスターＨＵＭＣＡ１ＸＩＡの説明
クラスターＨＵＭＣＡ１ＸＩＡは、目的の４つの転写物および４６個のセグメントを特徴とし、その名称を、それぞれ表８２８および８２９に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表８３０に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるコラーゲンα１（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＣＡ１Ｂ＿ＨＵＭＡＮ）（配列番号１４４６）の変異型である。

タンパク質コラーゲンα１は、以下の機能を有することが公知であるか、そのように見なされている：コラーゲンＩＩ型原線維の外側（ｌａｔｅｒａｌ）成長の調節による原線維発生で重要な役割を果たし得る。タンパク質コラーゲンα１の配列を、「コラーゲンα１アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表８３１に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである軟骨の凝集（ｃａｒｔｉｌａｇｅｃｏｎｄｅｎｓａｔｉｏｎ）、視覚、聴覚、細胞−細胞接着、細胞外基質の組織化および生合成、分子機能に関連する注釈付けである細胞外基質構造タンパク質、細胞外基質構造タンパク質、接着、ならびに細胞成分に関連する注釈付けである細胞外基質、コラーゲン、コラーゲンＸＩ型。

クラスターＨＵＭＣＡ１ＸＩＡを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図３２のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３２および表８３２中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：悪性骨腫瘍、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および肺悪性腫瘍。

上記のように、クラスターＨＵＭＣＡ１ＸＩＡは、上の表１に列挙した４つの転写物を特徴とする。これらの転写物は、タンパク質コラーゲンα１の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６によってコードされる。公知のタンパク質（コラーゲンα１）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４とＣＡ１Ｂ＿ＨＵＭＡＮ＿Ｖ５（配列番号１４４７）との間の比較の報告
１．ＣＡ１Ｂ＿ＨＵＭＡＮ＿Ｖ５のアミノ酸１〜１０５６に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のアミノ酸１〜１０５６にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥＹＡＰＥＤＩＩＥＹＤＹＥＹＧＥＡＥＹＫＥＡＥＳＶＴＥＧＰＴＶＴＥＥＴＩＡＱＴＥＡＮＩＶＤＤＦＱＥＹＮＹＧＴＭＥＳＹＱＴＥＡＰＲＨＶＳＧＴＮＥＰＮＰＶＥＥＩＦＴＥＥＹＬＴＧＥＤＹＤＳＱＲＫＮＳＥＤＴＬＹＥＮＫＥＩＤＧＲＤＳＤＬＬＶＤＧＤＬＧＥＹＤＦＹＥＹＫＥＹＥＤＫＰＴＳＰＰＮＥＥＦＧＰＧＶＰＡＥＴＤＩＴＥＴＳＩＮＧＨＧＡＹＧＥＫＧＱＫＧＥＰＡＶＶＥＰＧＭＬＶＥＧＰＰＧＰＡＧＰＡＧＩＭＧＰＰＧＬＱＧＰＴＧＰＰＧＤＰＧＤＲＧＰＰＧＲＰＧＬＰＧＡＤＧＬＰＧＰＰＧＴＭＬＭＬＰＦＲＹＧＧＤＧＳＫＧＰＴＩＳＡＱＥＡＱＡＱＡＩＬＱＱＡＲＩＡＬＲＧＰＰＧＰＭＧＬＴＧＲＰＧＰＶＧＧＰＧＳＳＧＡＫＧＥＳＧＤＰＧＰＱＧＰＲＧＶＱＧＰＰＧＰＴＧＫＰＧＫＲＧＲＰＧＡＤＧＧＲＧＭＰＧＥＰＧＡＫＧＤＲＧＦＤＧＬＰＧＬＰＧＤＫＧＨＲＧＥＲＧＰＱＧＰＰＧＰＰＧＤＤＧＭＲＧＥＤＧＥＩＧＰＲＧＬＰＧＥＡＧＰＲＧＬＬＧＰＲＧＴＰＧＡＰＧＱＰＧＭＡＧＶＤＧＰＰＧＰＫＧＮＭＧＰＱＧＥＰＧＰＰＧＱＱＧＮＰＧＰＱＧＬＰＧＰＱＧＰＩＧＰＰＧＥＫＧＰＱＧＫＰＧＬＡＧＬＰＧＡＤＧＰＰＧＨＰＧＫＥＧＱＳＧＥＫＧＡＬＧＰＰＧＰＱＧＰＩＧＹＰＧＰＲＧＶＫＧＡＤＧＶＲＧＬＫＧＳＫＧＥＫＧＥＤＧＦＰＧＦＫＧＤＭＧＬＫＧＤＲＧＥＶＧＱＩＧＰＲＧＥＤＧＰＥＧＰＫＧＲＡＧＰＴＧＤＰＧＰＳＧＱＡＧＥＫＧＫＬＧＶＰＧＬＰＧＹＰＧＲＱＧＰＫＧＳＴＧＦＰＧＦＰＧＡＮＧＥＫＧＡＲＧＶＡＧＫＰＧＰＲＧＱＲＧＰＴＧＰＲＧＳＲＧＡＲＧＰＴＧＫＰＧＰＫＧＴＳＧＧＤＧＰＰＧＰＰＧＥＲＧＰＱＧＰＱＧＰＶＧＦＰＧＰＫＧＰＰＧＰＰＧＫＤＧＬＰＧＨＰＧＱＲＧＥＴＧＦＱＧＫＴＧＰＰＧＰＧＧＶＶＧＰＱＧＰＴＧＥＴＧＰＩＧＥＲＧＨＰＧＰＰＧＰＰＧＥＱＧＬＰＧＡＡＧＫＥＧＡＫＧＤＰＧＰＱＧＩＳＧＫＤＧＰＡＧＬＲＧＦＰＧＥＲＧＬＰＧＡＱＧＡＰＧＬＫＧＧＥＧＰＱＧＰＰＧＰＶと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のアミノ酸１０５７〜１０８１に対応する配列ＶＳＭＭＩＩＮＳＱＴＩＭＶＶＮＹＳＳＳＦＩＴＬＭＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４をコードする単離キメラポリペプチド。

２．本発明の好ましい実施形態によれば、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のテールをコードする単離ポリペプチドであって、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４中の配列ＶＳＭＭＩＩＮＳＱＴＩＭＶＶＮＹＳＳＳＦＩＴＬＭＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４のテールをコードする単離ポリペプチドを提供する。

公知のタンパク質配列（ＣＡ１Ｂ＿ＨＵＭＡＮ）は、出願書類の最後に示す配列より１つまたは複数の変化があり、このアミノ酸配列をＣＡ１Ｂ＿ＨＵＭＡＮ＿Ｖ５と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４はまた、表８３５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４は、以下の転写物によってコードされる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６（配列は出願書類の最後に示す）。転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６のコード部分を太字で示し、このコード部分は３１９位から開始され、３５６１位で終結する。転写物はまた、表８３６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７によってコードされる。公知のタンパク質（コラーゲンα１）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５とＣＡ１Ｂ＿ＨＵＭＡＮとの間の比較の報告
１．ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸１〜７１４に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のアミノ酸１〜７１４にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥＹＡＰＥＤＩＩＥＹＤＹＥＹＧＥＡＥＹＫＥＡＥＳＶＴＥＧＰＴＶＴＥＥＴＩＡＱＴＥＡＮＩＶＤＤＦＱＥＹＮＹＧＴＭＥＳＹＱＴＥＡＰＲＨＶＳＧＴＮＥＰＮＰＶＥＥＩＦＴＥＥＹＬＴＧＥＤＹＤＳＱＲＫＮＳＥＤＴＬＹＥＮＫＥＩＤＧＲＤＳＤＬＬＶＤＧＤＬＧＥＹＤＦＹＥＹＫＥＹＥＤＫＰＴＳＰＰＮＥＥＦＧＰＧＶＰＡＥＴＤＩＴＥＴＳＩＮＧＨＧＡＹＧＥＫＧＱＫＧＥＰＡＶＶＥＰＧＭＬＶＥＧＰＰＧＰＡＧＰＡＧＩＭＧＰＰＧＬＱＧＰＴＧＰＰＧＤＰＧＤＲＧＰＰＧＲＰＧＬＰＧＡＤＧＬＰＧＰＰＧＴＭＬＭＬＰＦＲＹＧＧＤＧＳＫＧＰＴＩＳＡＱＥＡＱＡＱＡＩＬＱＱＡＲＩＡＬＲＧＰＰＧＰＭＧＬＴＧＲＰＧＰＶＧＧＰＧＳＳＧＡＫＧＥＳＧＤＰＧＰＱＧＰＲＧＶＱＧＰＰＧＰＴＧＫＰＧＫＲＧＲＰＧＡＤＧＧＲＧＭＰＧＥＰＧＡＫＧＤＲＧＦＤＧＬＰＧＬＰＧＤＫＧＨＲＧＥＲＧＰＱＧＰＰＧＰＰＧＤＤＧＭＲＧＥＤＧＥＩＧＰＲＧＬＰＧＥＡＧＰＲＧＬＬＧＰＲＧＴＰＧＡＰＧＱＰＧＭＡＧＶＤＧＰＰＧＰＫＧＮＭＧＰＱＧＥＰＧＰＰＧＱＱＧＮＰＧＰＱＧＬＰＧＰＱＧＰＩＧＰＰＧＥＫと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のアミノ酸７１５〜７２９に対応する配列ＭＣＣＮＬＳＦＧＩＬＩＰＬＱＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５をコードする単離キメラポリペプチド。

２．ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５中の配列ＭＣＣＮＬＳＦＧＩＬＩＰＬＱＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５はまた、表８３７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質コラーゲンα１と比較した変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５のグリコシル化部位を表８３８に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５は、以下の転写物によってコードされる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７（配列は出願書類の最後に示す）。転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７のコード部分を太字で示し、このコード部分は３１９位から開始され、２５０５位で終結する。転写物はまた、表８３９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９によってコードされる。公知のタンパク質（コラーゲンα１）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６とＣＡ１Ｂ＿ＨＵＭＡＮとの間の比較の報告
１．ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸１〜６４８に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のアミノ酸１〜６４８にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥＹＡＰＥＤＩＩＥＹＤＹＥＹＧＥＡＥＹＫＥＡＥＳＶＴＥＧＰＴＶＴＥＥＴＩＡＱＴＥＡＮＩＶＤＤＦＱＥＹＮＹＧＴＭＥＳＹＱＴＥＡＰＲＨＶＳＧＴＮＥＰＮＰＶＥＥＩＦＴＥＥＹＬＴＧＥＤＹＤＳＱＲＫＮＳＥＤＴＬＹＥＮＫＥＩＤＧＲＤＳＤＬＬＶＤＧＤＬＧＥＹＤＦＹＥＹＫＥＹＥＤＫＰＴＳＰＰＮＥＥＦＧＰＧＶＰＡＥＴＤＩＴＥＴＳＩＮＧＨＧＡＹＧＥＫＧＱＫＧＥＰＡＶＶＥＰＧＭＬＶＥＧＰＰＧＰＡＧＰＡＧＩＭＧＰＰＧＬＱＧＰＴＧＰＰＧＤＰＧＤＲＧＰＰＧＲＰＧＬＰＧＡＤＧＬＰＧＰＰＧＴＭＬＭＬＰＦＲＹＧＧＤＧＳＫＧＰＴＩＳＡＱＥＡＱＡＱＡＩＬＱＱＡＲＩＡＬＲＧＰＰＧＰＭＧＬＴＧＲＰＧＰＶＧＧＰＧＳＳＧＡＫＧＥＳＧＤＰＧＰＱＧＰＲＧＶＱＧＰＰＧＰＴＧＫＰＧＫＲＧＲＰＧＡＤＧＧＲＧＭＰＧＥＰＧＡＫＧＤＲＧＦＤＧＬＰＧＬＰＧＤＫＧＨＲＧＥＲＧＰＱＧＰＰＧＰＰＧＤＤＧＭＲＧＥＤＧＥＩＧＰＲＧＬＰＧＥＡと少なくとも９０％相同な第１のアミノ酸配列と、ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸６６７〜７１４に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のアミノ酸６４９〜６９６にも対応するＧＭＡＧＶＤＧＰＰＧＰＫＧＮＭＧＰＱＧＥＰＧＰＰＧＱＱＧＮＰＧＰＱＧＬＰＧＰＱＧＰＩＧＰＰＧＥＫと少なくとも９０％相同な第２のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のアミノ酸６９７〜７３９に対応する配列ＶＳＦＳＦＳＬＦＹＫＫＶＩＫＦＡＣＤＫＲＦＶＧＲＨＤＥＲＫＶＶＫＬＳＬＰＬＹＬＩＹＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＡＧを含み、以下の構造：アミノ酸番号６４８−ｘ〜６４８のいずれかから始まり、アミノ酸番号６４９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６の縁部分をコードする単離キメラポリペプチド。

３．ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６中の配列ＶＳＦＳＦＳＬＦＹＫＫＶＩＫＦＡＣＤＫＲＦＶＧＲＨＤＥＲＫＶＶＫＬＳＬＰＬＹＬＩＹＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６はまた、表８４０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質コラーゲンα１と比較した変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６のグリコシル化部位を表８４１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６は、以下の転写物によってコードされる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９（配列は出願書類の最後に示す）。転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９のコード部分を太字で示し、このコード部分は３１９位から開始され、２５３２位で終結する。転写物はまた、表８４２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ２０によってコードされる。公知のタンパク質（コラーゲンα１）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７とＣＡ１Ｂ＿ＨＵＭＡＮとの間の比較の報告
１．ＣＡ１Ｂ＿ＨＵＭＡＮのアミノ酸１〜２６０に対応し、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のアミノ酸１〜２６０にも対応するＭＥＰＷＳＳＲＷＫＴＫＲＷＬＷＤＦＴＶＴＴＬＡＬＴＦＬＦＱＡＲＥＶＲＧＡＡＰＶＤＶＬＫＡＬＤＦＨＮＳＰＥＧＩＳＫＴＴＧＦＣＴＮＲＫＮＳＫＧＳＤＴＡＹＲＶＳＫＱＡＱＬＳＡＰＴＫＱＬＦＰＧＧＴＦＰＥＤＦＳＩＬＦＴＶＫＰＫＫＧＩＱＳＦＬＬＳＩＹＮＥＨＧＩＱＱＩＧＶＥＶＧＲＳＰＶＦＬＦＥＤＨＴＧＫＰＡＰＥＤＹＰＬＦＲＴＶＮＩＡＤＧＫＷＨＲＶＡＩＳＶＥＫＫＴＶＴＭＩＶＤＣＫＫＫＴＴＫＰＬＤＲＳＥＲＡＩＶＤＴＮＧＩＴＶＦＧＴＲＩＬＤＥＥＶＦＥＧＤＩＱＱＦＬＩＴＧＤＰＫＡＡＹＤＹＣＥＨＹＳＰＤＣＤＳＳＡＰＫＡＡＱＡＱＥＰＱＩＤＥと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のアミノ酸２６１〜２７３に対応する配列ＶＲＳＴＲＰＥＫＶＦＶＦＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７をコードする単離キメラポリペプチド。

２．ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７中の配列ＶＲＳＴＲＰＥＫＶＦＶＦＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７はまた、表８４３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質コラーゲンα１と比較した変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７のグリコシル化部位を表８４４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７は、以下の転写物によってコードされる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ２０（配列は出願書類の最後に示す）。転写物ＨＵＭＣＡ１ＸＩＡ＿Ｔ２０のコード部分を太字で示し、このコード部分は３１９位から開始され、１１３７位で終結する。転写物はまた、表８４５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＡ１ＸＩＡ＿Ｐ１７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＣＡ１ＸＩＡは、上の表２に列挙した４６個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿０は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ２０。以下の表８４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿２は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ２０。以下の表８４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿４は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ２０。以下の表８４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表８４９に示す）。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿６は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ２０。以下の表８５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表８５１に示す）。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿８は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ２０。以下の表８５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿９は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ２０。以下の表８５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿１８は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿５４は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿５５は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿９２は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿１１は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿１５は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿１９は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿２１は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿２３は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿２５は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿２７は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿２９は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿３１は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿３３は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿３５は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿３７は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８６９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿３９は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８７０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿４１は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８７１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿４３は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８７２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿４５は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１７。以下の表８７３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿４７は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿４９は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８７５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿５１は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６、ＨＵＭＣＡ１ＸＩＡ＿Ｔ１７、およびＨＵＭＣＡ１ＸＩＡ＿Ｔ１９。以下の表８７６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿５７は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿５９は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿６２は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿６４は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿６６は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿６８は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿７０は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿７２は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿７４は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿７６は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿７８は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿８１は、８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿８３は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿８５は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿８７は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿８９は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＡ１ＸＩＡ＿ｎｏｄｅ＿９１は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＡ１ＸＩＡ＿Ｔ１６。以下の表８９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CA1B_HUMAN_V5

Sequence documentation:

Alignment of: HUMCA1XIA_P14 x CA1B_HUMAN_V5 ..

Alignment segment 1/1:

Quality: 10456.00 Escore: 0
Matching length: 1058 Total length: 1058
Matching Percent Similarity: 99.91 Matching Percent Identity: 99.91
Total Percent Similarity: 99.91 Total Percent Identity: 99.91
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
. . . . .
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
. . . . .
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
. . . . .
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
. . . . .
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
. . . . .
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
. . . . .
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
. . . . .
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050

1051 GPPGPVVS 1058
|||||| |
1051 GPPGPVGS 1058

Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P15 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 7073.00 Escore: 0
Matching length: 714 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
701 LPGPQGPIGPPGEK 714
||||||||||||||
701 LPGPQGPIGPPGEK 714

Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P16 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 6795.00 Escore: 0
Matching length: 696 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 97.48 Total Percent Identity: 97.48
Gaps: 1

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEA.. 648
||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
649 ................GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 682
||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
683 LPGPQGPIGPPGEK 696
||||||||||||||
701 LPGPQGPIGPPGEK 714

Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P17 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 2561.00 Escore: 0
Matching length: 260 Total length: 260
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
.
251 AQAQEPQIDE 260
||||||||||
251 AQAQEPQIDE 260

正常および癌性肺組織における配列名ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５中に示すアンプリコンによって検出可能なホモ・サピエンスコラーゲンＸＩ型α１（ＣＯＬ１１Ａ１）ＨＵＭＣＡ１ＸＩＡ転写物の発現
ｓｅｇ５５、ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５アンプリコン（配列番号１６６３）ならびにプライマーＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５Ｆ（配列番号１６６１）およびＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５Ｒ（配列番号１６６２）によって検出可能なホモ・サピエンスコラーゲンＸＩ型α１（ＣＯＬ１１Ａ１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６７は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスコラーゲンＸＩ型α１（ＣＯＬ１１Ａ１）転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。

図６７から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスコラーゲンＸＩ型α１（ＣＯＬ１１Ａ１）転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２）よりも有意に高かった。明白には、１５個の腺癌サンプルのうち１１個、１６個の扁平上皮細胞癌サンプルのうち１１個、および４個の大細胞癌サンプルのうち２個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５Ｆ順方向プライマーおよびＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５。

順方向プライマー−ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５Ｆ（配列番号１６６１）：ＴＴＣＴＣＡＴＡＧＴＡＴＴＣＣＡＴＴＧＡＴＴＧＧＧＴＡ
逆方向プライマー−ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５Ｒ（配列番号１６６２）：ＣＡＣＣＧＧＴＡＴＧＧＡＧＡＡＴＡＧＣＧＡ
アンプリコン（配列番号１６６３）：ＴＴＣＴＣＡＴＡＧＴＡＴＴＣＣＡＴＴＧＡＴＴＧＧＧＴＡＴＡＣＣＡＧＧＴＴＣＴＧＴＴＴＡＣＴＴＴＴＡＣＴＴＧＧＣＡＧＴＴＧＡＴＡＧＡＡＴＡＧＧＴＧＴＡＧＴＴＴＡＴＡＣＴＴＴＴＴＣＧＣＴＡＴＴＣＴＣＣＡＴＡＣＣＧＧＴＧ

クラスターＴ１１６２８の説明
クラスターＴ１１６２８は、目的の６つの転写物および２５個のセグメントを特徴とし、その名称を、それぞれ表８９４および８９５に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表８９６に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるミオグロビン（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＭＹＧ＿ＨＵＭＡＮ）（配列番号１４４８）の変異型である。

タンパク質ミオグロビンは、以下の機能を有することが公知であるか、そのように見なされている：酸素の逆供給としての機能を果たし、筋肉内の酸素の移動を促進する。タンパク質ミオグロビンの配列を、「ミオグロビンアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表８９７に示す。

上記のように、クラスターＴ１１６２８は、上の表１に列挙した６つの転写物を特徴とする。これらの転写物は、タンパク質ミオグロビンの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３によってコードされる。公知のタンパク質（ミオグロビン）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２とＱ８ＷＶＨ６（配列番号１４５０）との間の比較の報告
１．Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜５５に対応する配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ８ＷＶＨ６のアミノ酸１〜９９に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２のアミノ酸５６〜１５４にも対応するＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫＡＬＥＬＦＲＫＤＭＡＳＮＹＫＥＬＧＦＱＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２の配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２の先端をコードする単離ポリペプチド。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２はまた、表８９８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３（配列は出願書類の最後に示す）。転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３のコード部分を太字で示し、このコード部分は２２０位から開始され、６８１位で終結する。転写物はまた、表８９９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９によってコードされる。公知のタンパク質（ミオグロビン）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５とＭＹＧ＿ＨＵＭＡＮ＿Ｖ１（配列番号１４４９）との間の比較の報告
１．ＭＹＧ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸５６〜１５４に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜９９にも対応するＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫＡＬＥＬＦＲＫＤＭＡＳＮＹＫＥＬＧＦＱＧと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

公知のタンパク質配列（ＭＹＧ＿ＨＵＭＡＮ）は、出願書類の最後に示す配列より１つまたは複数の変化があり、このアミノ酸配列をＭＹＧ＿ＨＵＭＡＮ＿Ｖ１と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５はまた、表９０１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９（配列は出願書類の最後に示す）。転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９のコード部分を太字で示し、このコード部分は２１１位から開始され、５０７位で終結する。転写物はまた、表９０２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ１１によってコードされる。公知のタンパク質（ミオグロビン）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７とＭＹＧ＿ＨＵＭＡＮ＿Ｖ１との間の比較の報告
１．ＭＹＧ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜１３４に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜１３４にも対応するＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７のアミノ酸１３５〜１３５に対応する配列Ｇを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７はまた、表９０４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７は、以下の転写物によってコードされる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ１１のコード部分を太字で示し、このコード部分は３１９位から開始され、７２３位で終結する。転写物はまた、表９０５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４によってコードされる。公知のタンパク質（ミオグロビン）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０とＱ８ＷＶＨ６（配列番号１４５０）との間の比較の報告
１．Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜５５に対応する配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ８ＷＶＨ６のアミノ酸１〜９９に対応し、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０のアミノ酸５６〜１５４にも対応するＭＫＡＳＥＤＬＫＫＨＧＡＴＶＬＴＡＬＧＧＩＬＫＫＫＧＨＨＥＡＥＩＫＰＬＡＱＳＨＡＴＫＨＫＩＰＶＫＹＬＥＦＩＳＥＣＩＩＱＶＬＱＳＫＨＰＧＤＦＧＡＤＡＱＧＡＭＮＫＡＬＥＬＦＲＫＤＭＡＳＮＹＫＥＬＧＦＱＧと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

２．Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０の配列ＭＧＬＳＤＧＥＷＱＬＶＬＮＶＷＧＫＶＥＡＤＩＰＧＨＧＱＥＶＬＩＲＬＦＫＧＨＰＥＴＬＥＫＦＤＫＦＫＨＬＫＳＥＤＥと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチド。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０はまた、表９０６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０は、以下の転写物によってコードされる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４（配列は出願書類の最後に示す）。転写物Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４のコード部分を太字で示し、このコード部分は２０５位から開始され、６６６位で終結する。転写物はまた、表９０７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｔ１１６２８＿ＰＥＡ＿１＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＴ１１６２８は、上の表２に列挙した２５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３。以下の表９０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５。以下の表９０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９。以下の表９１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、１２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表９１３に示す）。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、１３７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３７は、９９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４。以下の表９１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４。以下の表９１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、１６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ７。以下の表９１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１３を、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７。以下の表９１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１４は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７。以下の表９２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１７は、５５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、９８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿１９を、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、１１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

表924 - 転写物上のセグメントの位置

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、１１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９２５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表９２６に示す）。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿２８は、１１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ９。以下の表９２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、１１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ９。以下の表９２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３０を、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３２を、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３３を、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、１２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３５は、１２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＴ１１６２８＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、１２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ３、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ４、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ５、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ７、Ｔ１１６２８＿ＰＥＡ＿１＿Ｔ９、およびＴ１１６２８＿ＰＥＡ＿１＿Ｔ１１。以下の表９３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: Q8WVH6

Sequence documentation:

Alignment of: T11628_PEA_1_P2 x Q8WVH6 ..

Alignment segment 1/1:

Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

. . . .

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

|||||||||||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

Sequence name: MYG_HUMAN_V1

Sequence documentation:

Alignment of: T11628_PEA_1_P5 x MYG_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

||||||||||||||||||||||||||||||||||||||||||||||||||

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

. . . .

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

|||||||||||||||||||||||||||||||||||||||||||||||||

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

Sequence name: MYG_HUMAN_V1

Sequence documentation:

Alignment of: T11628_PEA_1_P7 x MYG_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 1315.00 Escore: 0

Matching length: 134 Total length: 134

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50

. . . . .

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

. . .

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134

||||||||||||||||||||||||||||||||||

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134

Sequence name: Q8WVH6

Sequence documentation:

Alignment of: T11628_PEA_1_P10 x Q8WVH6 ..

Alignment segment 1/1:

Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

. . . .

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

|||||||||||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

クラスターＨＵＭＣＥＡの説明
クラスターＨＵＭＣＥＡは、目的の５つの転写物および４２個のセグメントを特徴とし、その名称を、それぞれ表９３５および９３６に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表９３７に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である癌胎児性抗原関連細胞接着分子５前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＣＥＡ５＿ＨＵＭＡＮ、同義語癌胎児性抗原、ＣＥＡ、胎便抗原１００、ＣＤ６６ｅ抗原としても公知である）（配列番号１４５１）の変異型である。

タンパク質癌胎児性抗原関連細胞接着分子５前駆体の配列を、「癌胎児性抗原関連細胞接着分子５前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表９３８に示す。

タンパク質癌胎児性抗原関連細胞接着分子５前駆体局在化は、ＧＰＩ−アンカーによって膜に結合すると考えられる。

以前に公知のタンパク質はまた、以下の適応症および／または潜在的治療用途を有する：癌。ヒトにおける臨床／治療用途（例えば、抗体または小分子の標的として、および／または直接的な治療として）が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である：免疫賦活剤。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する（造影剤、抗癌薬、免疫賦形剤、免疫複合体、モノクローナル抗体（マウス）、アンチセンス療法、抗体）ために使用するか使用することができる薬物データベースまたは公的なデータベース（例えば、上記）に情報が存在するので、クラスターをこの分野に割り当てた。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：細胞成分に関連する注釈付けである内在性原形質膜タンパク質、膜。

クラスターＨＵＭＣＥＡを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図３３のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３３および表９３９中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。

このクラスターについて、少なくとも１つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも１つの転写物／セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、（肺癌に関して）このクラスターに達するが、以下の他のセグメント／転写物は達しないことが見出された（表９４１に示す）。

上記のように、クラスターＨＵＭＣＥＡは、上の表１に列挙した５つの転写物を特徴とする。これらの転写物は、タンパク質癌胎児性抗原関連細胞接着分子５前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８によってコードされる。公知のタンパク質（癌胎児性抗原関連細胞接着分子５前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４とＣＥＡ５＿ＨＵＭＡＮとの間の比較の報告
１．ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜２３４に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜２３４にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＴＱＤＡＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＴＡＳＹＫＣＥＴＱＮＰＶＳＡＲＲＳＤＳＶＩＬＮＶＬと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のアミノ酸２３５〜３１５に対応する配列ＣＥＹＩＣＳＳＬＡＱＡＡＳＰＮＰＱＧＱＲＱＤＦＳＶＰＬＲＦＫＹＴＤＰＱＰＷＴＳＲＬＳＶＴＦＣＰＲＫＴＷＡＤＱＶＬＴＫＮＲＲＧＧＡＡＳＶＬＧＧＳＧＳＴＰＹＤＧＲＮＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチド。

２．ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４中の配列ＣＥＹＩＣＳＳＬＡＱＡＡＳＰＮＰＱＧＱＲＱＤＦＳＶＰＬＲＦＫＹＴＤＰＱＰＷＴＳＲＬＳＶＴＦＣＰＲＫＴＷＡＤＱＶＬＴＫＮＲＲＧＧＡＡＳＶＬＧＧＳＧＳＴＰＹＤＧＲＮＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４はまた、表９４２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質癌胎児性抗原関連細胞接着分子５前駆体と比較した変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４のグリコシル化部位を表９４３に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４は、以下の転写物によってコードされる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８（配列は出願書類の最後に示す）。転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８のコード部分を太字で示し、このコード部分は１１５位から開始され、１０５９位で終結する。転写物はまた、表９４４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９によってコードされる。公知のタンパク質（癌胎児性抗原関連細胞接着分子５前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５とＣＥＡ５＿ＨＵＭＡＮとの間の比較の報告
１．ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜６７５に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜６７５にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＴＱＤＡＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＴＡＳＹＫＣＥＴＱＮＰＶＳＡＲＲＳＤＳＶＩＬＮＶＬＹＧＰＤＡＰＴＩＳＰＬＮＴＳＹＲＳＧＥＮＬＮＬＳＣＨＡＡＳＮＰＰＡＱＹＳＷＦＶＮＧＴＦＱＱＳＴＱＥＬＦＩＰＮＩＴＶＮＮＳＧＳＹＴＣＱＡＨＮＳＤＴＧＬＮＲＴＴＶＴＴＩＴＶＹＡＥＰＰＫＰＦＩＴＳＮＮＳＮＰＶＥＤＥＤＡＶＡＬＴＣＥＰＥＩＱＮＴＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＤＮＲＴＬＴＬＬＳＶＴＲＮＤＶＧＰＹＥＣＧＩＱＮＥＬＳＶＤＨＳＤＰＶＩＬＮＶＬＹＧＰＤＤＰＴＩＳＰＳＹＴＹＹＲＰＧＶＮＬＳＬＳＣＨＡＡＳＮＰＰＡＱＹＳＷＬＩＤＧＮＩＱＱＨＴＱＥＬＦＩＳＮＩＴＥＫＮＳＧＬＹＴＣＱＡＮＮＳＡＳＧＨＳＲＴＴＶＫＴＩＴＶＳＡＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＡＱＮＴＴＹＬＷＷＶＮＧＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＡＲＡＹＶＣＧＩＱＮＳＶＳＡＮＲＳＤＰＶＴＬＤＶＬＹＧＰＤＴＰＩＩＳＰＰＤＳＳＹＬＳＧＡＮＬＮＬＳＣＨＳＡＳＮＰＳＰＱＹＳＷＲＩＮＧＩＰＱＱＨＴＱＶＬＦＩＡＫＩＴＰＮＮＮＧＴＹＡＣＦＶＳＮＬＡＴＧＲＮＮＳＩＶＫＳＩＴＶＳと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のアミノ酸６７６〜７１９に対応する配列ＧＫＷＬＰＧＡＳＡＳＹＳＧＶＥＳＩＷＦＳＰＫＳＱＥＤＩＦＦＰＳＬＣＳＭＧＴＲＫＳＱＩＬＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５中の配列ＧＫＷＬＰＧＡＳＡＳＹＳＧＶＥＳＩＷＦＳＰＫＳＱＥＤＩＦＦＰＳＬＣＳＭＧＴＲＫＳＱＩＬＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５はまた、表９４５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質癌胎児性抗原関連細胞接着分子５前駆体と比較した変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５のグリコシル化部位を表９４６に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９（配列は出願書類の最後に示す）。転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９のコード部分を太字で示し、このコード部分は１１５位から開始され、２２７１位で終結する。転写物はまた、表９４７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１４はまた、表９４８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１４は、以下の転写物によってコードされる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０（配列は出願書類の最後に示す）。転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０のコード部分を太字で示し、このコード部分は１１５位から開始され、１８２１位で終結する。転写物はまた、表９４９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５によってコードされる。公知のタンパク質（癌胎児性抗原関連細胞接着分子５前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９とＣＥＡ５＿ＨＵＭＡＮとの間の比較の報告
１．ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜２３２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９のアミノ酸１〜２３２にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＴＱＤＡＴＹＬＷＷＶＮＮＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＴＡＳＹＫＣＥＴＱＮＰＶＳＡＲＲＳＤＳＶＩＬＮと少なくとも９０％相同な第１のアミノ酸配列と、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸５８９〜７０２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９のアミノ酸２３３〜３４６にも対応するＶＬＹＧＰＤＴＰＩＩＳＰＰＤＳＳＹＬＳＧＡＮＬＮＬＳＣＨＳＡＳＮＰＳＰＱＹＳＷＲＩＮＧＩＰＱＱＨＴＱＶＬＦＩＡＫＩＴＰＮＮＮＧＴＹＡＣＦＶＳＮＬＡＴＧＲＮＮＳＩＶＫＳＩＴＶＳＡＳＧＴＳＰＧＬＳＡＧＡＴＶＧＩＭＩＧＶＬＶＧＶＡＬＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＮＶを含み、以下の構造：アミノ酸番号２３２−ｘ〜２３２のいずれかから始まり、アミノ酸番号２３３＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９の縁部分をコードする単離キメラポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、公知のタンパク質局在化および／または遺伝子構造の手作業による調査によって、膜と考えられる。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９はまた、表９５０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質癌胎児性抗原関連細胞接着分子５前駆体と比較した変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９のグリコシル化部位を表９５１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９は、以下の転写物によってコードされる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５（配列は出願書類の最後に示す）。転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５のコード部分を太字で示し、このコード部分は１１５位から開始され、１１５２位で終結する。転写物はまた、表９５２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６によってコードされる。公知のタンパク質（癌胎児性抗原関連細胞接着分子５前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０とＣＥＡ５＿ＨＵＭＡＮとの間の比較の報告
１．ＣＥＡ５＿ＨＵＭＡＮのアミノ酸１〜１４２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０のアミノ酸１〜１４２にも対応するＭＥＳＰＳＡＰＰＨＲＷＣＩＰＷＱＲＬＬＬＴＡＳＬＬＴＦＷＮＰＰＴＴＡＫＬＴＩＥＳＴＰＦＮＶＡＥＧＫＥＶＬＬＬＶＨＮＬＰＱＨＬＦＧＹＳＷＹＫＧＥＲＶＤＧＮＲＱＩＩＧＹＶＩＧＴＱＱＡＴＰＧＰＡＹＳＧＲＥＩＩＹＰＮＡＳＬＬＩＱＮＩＩＱＮＤＴＧＦＹＴＬＨＶＩＫＳＤＬＶＮＥＥＡＴＧＱＦＲＶＹＰと少なくとも９０％相同な第１のアミノ酸配列と、ＣＥＡ５＿ＨＵＭＡＮのアミノ酸４９９〜７０２に対応し、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０のアミノ酸１４３〜３４６にも対応するＥＬＰＫＰＳＩＳＳＮＮＳＫＰＶＥＤＫＤＡＶＡＦＴＣＥＰＥＡＱＮＴＴＹＬＷＷＶＮＧＱＳＬＰＶＳＰＲＬＱＬＳＮＧＮＲＴＬＴＬＦＮＶＴＲＮＤＡＲＡＹＶＣＧＩＱＮＳＶＳＡＮＲＳＤＰＶＴＬＤＶＬＹＧＰＤＴＰＩＩＳＰＰＤＳＳＹＬＳＧＡＮＬＮＬＳＣＨＳＡＳＮＰＳＰＱＹＳＷＲＩＮＧＩＰＱＱＨＴＱＶＬＦＩＡＫＩＴＰＮＮＮＧＴＹＡＣＦＶＳＮＬＡＴＧＲＮＮＳＩＶＫＳＩＴＶＳＡＳＧＴＳＰＧＬＳＡＧＡＴＶＧＩＭＩＧＶＬＶＧＶＡＬＩと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＰＥを含み、以下の構造：アミノ酸番号１４２−ｘ〜１４２のいずれかから始まり、アミノ酸番号１４３＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０の縁部分をコードする単離キメラポリペプチド。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０はまた、表９５３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質癌胎児性抗原関連細胞接着分子５前駆体と比較した変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０のグリコシル化部位を表９５４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０は、以下の転写物によってコードされる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６（配列は出願書類の最後に示す）。転写物ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６のコード部分を太字で示し、このコード部分は１１５位から開始され、１１５２位で終結する。転写物はまた、表９５５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｐ２０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＣＥＡは、上の表２に列挙した４２個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、５６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、８３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８。以下の表９５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表９５９に示す）。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、８３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、８７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、９４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿４４は、１１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿４６は、１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９。以下の表９６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６３は、６８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６５は、５４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６７は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、７３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５。以下の表９６９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５。以下の表９７０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５。以下の表９７１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５。以下の表９７２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１５を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１６を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１７を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１８を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、６９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２０を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２１を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、７７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、７２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２４を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２７を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿２９を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２０。以下の表９８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３３を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９８６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、８０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９８７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿３５は、７５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿４５は、９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ９。以下の表９８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿５０は、６４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿５１は、８８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿５６は、７５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿５７は、８２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿５８は、６３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６０は、５５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６１を、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６２は、６０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＣＥＡ＿ＰＥＡ＿１＿ｎｏｄｅ＿６４は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ８、ＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２５、およびＨＵＭＣＥＡ＿ＰＥＡ＿１＿Ｔ２６。以下の表９９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P4 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 2320.00 Escore: 0
Matching length: 234 Total length: 234
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVL 234
||||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVL 234

Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P5 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 6692.00 Escore: 0
Matching length: 675 Total length: 675
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. .
651 GTYACFVSNLATGRNNSIVKSITVS 675
|||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVS 675

Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P19 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3298.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILN.................. 232
||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
232 .................................................. 232

251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
232 .................................................. 232

301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
232 .................................................. 232

351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
232 .................................................. 232

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
232 .................................................. 232

451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
232 .................................................. 232

501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
233 ......................................VLYGPDTPIISP 244
||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
245 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 294
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. . . . .
295 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702

Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P20 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYP........ 142
||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
142 .................................................. 142

151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
142 .................................................. 142

201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
142 .................................................. 142

251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
142 .................................................. 142

301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
142 .................................................. 142

351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
142 .................................................. 142

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
143 ................................................EL 144
||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
145 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 194
||||||||||||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
195 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 244
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
245 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 294
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. . . . .
295 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702

クラスターＲ３５１３７の説明
クラスターＲ３５１３７は、目的の６つの転写物および２０個のセグメントを特徴とし、その名称を、それぞれ表９９９および１０００に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１００１に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアラニンアミノトランスフェラーゼ（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＡＬＡＴ＿ＨＵＭＡＮ、同義語ＥＣ２．６．１．２、グルタミン酸−−ピルビン酸トランスアミナーゼ、ＧＰＴ、グルタミン酸−−アラニントランスアミナーゼとしても公知である）（配列番号１４５２）の変異型である。

タンパク質アラニンアミノトランスフェラーゼは、以下の機能を有することが公知であるか、そのように見なされている：細胞窒素代謝および骨格筋から輸送された前駆体から開始される肝臓糖新生にも関与する。タンパク質アラニンアミノトランスフェラーゼの配列を、「アラニンアミノトランスフェラーゼアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１００２に示す。

タンパク質アラニンアミノトランスフェラーゼの局在化は、原形質と考えられる。

クラスターＲ３５１３７を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図３４のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３４および表１００３中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：肝細胞癌。

上記のように、クラスターＲ３５１３７は、上の表１に列挙した６つの転写物を特徴とする。これらの転写物は、タンパク質アラニンアミノトランスフェラーゼの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０によってコードされる。公知のタンパク質（アラニンアミノトランスフェラーゼ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９とＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１（配列番号１４５３）との間の比較の報告
１．ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜２７４に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のアミノ酸１〜２７４にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のアミノ酸２７５〜３８５に対応する配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＡＹＥＡＧＧＧＳＲＡＭＡＲＰＳＳＰＤＧＰＰＰＰＰＨＬＴＷＰＣＡＧＡＧＳＡＡＡＭＷＲＷを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９をコードする単離キメラポリペプチド。

２．Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９中の配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＡＹＥＡＧＧＧＳＲＡＭＡＲＰＳＳＰＤＧＰＰＰＰＰＨＬＴＷＰＣＡＧＡＧＳＡＡＡＭＷＲＷと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９のテールをコードする単離ポリペプチド。

公知のタンパク質配列（ＡＬＡＴ＿ＨＵＭＡＮ）は、出願書類の最後に示す配列より１つまたは複数の変化があり、このアミノ酸配列をＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。

変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９は、以下の転写物によってコードされる：、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０のコード部分を太字で示し、このコード部分は２７１位から開始され、１４２５位で終結する。転写物はまた、表１００６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１によってコードされる。公知のタンパク質（アラニンアミノトランスフェラーゼ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８とＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１との間の比較の報告
１．ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜３２０に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のアミノ酸１〜３２０にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶＹＱＤＮＶＹＡＡＧＳＱＦＨＳＦＫＫＶＬＭＥＭＧＰＰＹＡＧＱＱＥＬＡＳＦＨＳＴＳＫＧＹＭＧＥＣと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のアミノ酸３２１〜３４６に対応する配列ＶＲＴＲＲＶＧＡＲＧＰＷＰＧＰＰＲＰＭＧＨＰＬＬＲＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８をコードする単離キメラポリペプチド。

２．Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８中の配列ＶＲＴＲＲＶＧＡＲＧＰＷＰＧＰＰＲＰＭＧＨＰＬＬＲＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８はまた、表１００８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８は、以下の転写物によってコードされる：、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１（配列は出願書類の最後に示す）。転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１のコード部分を太字で示し、このコード部分は２７１位から開始され、１３０８位で終結する。転写物はまた、表１００９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４によってコードされる。公知のタンパク質（アラニンアミノトランスフェラーゼ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１とＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１との間の比較の報告
１．ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜２２９に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１のアミノ酸１〜２２９にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲと少なくとも９０％相同な第１のアミノ酸配列と、ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸４５５〜４９６に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１のアミノ酸２３０〜２７１にも対応するＳＧＦＧＱＲＥＧＴＹＨＦＲＭＴＩＬＰＰＬＥＫＬＲＬＬＬＥＫＬＳＲＦＨＡＫＦＴＬＥＹＳと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＲＳを含み、以下の構造：アミノ酸番号２２９−ｘ〜２２９のいずれかから始まり、アミノ酸番号２３０＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１はまた、表１０１１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１は、以下の転写物によってコードされる：、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４（配列は出願書類の最後に示す）。転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４のコード部分を太字で示し、このコード部分は２７１位から開始され、１０８３位で終結する。転写物はまた、表１０１２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ１１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３によってコードされる。公知のタンパク質（アラニンアミノトランスフェラーゼ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２とＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１との間の比較の報告
１．ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜２７４に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のアミノ酸１〜２７４にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のアミノ酸２７５〜３９９に対応する配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＶＰＲＲＬＣＧＧＧＥＨＧＲＣＳＡＡＡＤＡＥＡＤＥＣＡＡＶＰＡＧＡＲＴＧＰＡＧＰＧＧＱＰＡＲＡＨＲＰＬＬＣＡＶＰＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２中の配列ＲＧＡＧＥＲＥＡＧＱＱＳＡＰＶＴＰＣＡＬＰＧＶＰＧＱＲＶＲＲＧＦＡＶＰＬＩＱＥＧＡＨＧＤＧＡＡＬＲＲＡＡＧＡＣＬＬＰＬＨＬＱＧＬＨＧＲＶＲＶＰＲＲＬＣＧＧＧＥＨＧＲＣＳＡＡＡＤＡＥＡＤＥＣＡＡＶＰＡＧＡＲＴＧＰＡＧＰＧＧＱＰＡＲＡＨＲＰＬＬＣＡＶＰＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２はまた、表１０１４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３（配列は出願書類の最後に示す）。転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３のコード部分を太字で示し、このコード部分は２７１位から開始され、１４６７位で終結する。転写物はまた、表１０１５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５によってコードされる。公知のタンパク質（アラニンアミノトランスフェラーゼ）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４とＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１との間の比較の報告
１．ＡＬＡＴ＿ＨＵＭＡＮ＿Ｖ１のアミノ酸１〜４９４に対応し、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜４９４にも対応するＭＡＳＳＴＧＤＲＳＱＡＶＲＨＧＬＲＡＫＶＬＴＬＤＧＭＮＰＲＶＲＲＶＥＹＡＶＲＧＰＩＶＱＲＡＬＥＬＥＱＥＬＲＱＧＶＫＫＰＦＴＥＶＩＲＡＮＩＧＤＡＱＡＭＧＱＲＰＩＴＦＬＲＱＶＬＡＬＣＶＮＰＤＬＬＳＳＰＮＦＰＤＤＡＫＫＲＡＥＲＩＬＱＡＣＧＧＨＳＬＧＡＹＳＶＳＳＧＩＱＬＩＲＥＤＶＡＲＹＩＥＲＲＤＧＧＩＰＡＤＰＮＮＶＦＬＳＴＧＡＳＤＡＩＶＴＶＬＫＬＬＶＡＧＥＧＨＴＲＴＧＶＬＩＰＩＰＱＹＰＬＹＳＡＴＬＡＥＬＧＡＶＱＶＤＹＹＬＤＥＥＲＡＷＡＬＤＶＡＥＬＨＲＡＬＧＱＡＲＤＨＣＲＰＲＡＬＣＶＩＮＰＧＮＰＴＧＱＶＱＴＲＥＣＩＥＡＶＩＲＦＡＦＥＥＲＬＦＬＬＡＤＥＶＹＱＤＮＶＹＡＡＧＳＱＦＨＳＦＫＫＶＬＭＥＭＧＰＰＹＡＧＱＱＥＬＡＳＦＨＳＴＳＫＧＹＭＧＥＣＧＦＲＧＧＹＶＥＶＶＮＭＤＡＡＶＱＱＱＭＬＫＬＭＳＶＲＬＣＰＰＶＰＧＱＡＬＬＤＬＶＶＳＰＰＡＰＴＤＰＳＦＡＱＦＱＡＥＫＱＡＶＬＡＥＬＡＡＫＡＫＬＴＥＱＶＦＮＥＡＰＧＩＳＣＮＰＶＱＧＡＭＹＳＦＰＲＶＱＬＰＰＲＡＶＥＲＡＱＥＬＧＬＡＰＤＭＦＦＣＬＲＬＬＥＥＴＧＩＣＶＶＰＧＳＧＦＧＱＲＥＧＴＹＨＦＲＭＴＩＬＰＰＬＥＫＬＲＬＬＬＥＫＬＳＲＦＨＡＫＦＴＬＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のアミノ酸４９５〜５５５に対応する配列ＳＰＧＲＬＷＳＰＬＹＬＬＬＭＰＧＧＶＧＷＧＧＣＷＡＰＡＳＬＱＶＰＮＫＡＶＷＱＳＤＳＫＫＥＡＬＡＡＡＷＰＡＰＴＣＬＰＦＬＱＡを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチド。

２．Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４中の配列ＳＰＧＲＬＷＳＰＬＹＬＬＬＭＰＧＧＶＧＷＧＧＣＷＡＰＡＳＬＱＶＰＮＫＡＶＷＱＳＤＳＫＫＥＡＬＡＡＡＷＰＡＰＴＣＬＰＦＬＱＡと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４はまた、表１０１７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４は、以下の転写物によってコードされる：、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５のコード部分を太字で示し、このコード部分は２７１位から開始され、１９３５位で終結する。転写物はまた、表１０１８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ３５１３７は、上の表２に列挙した２０個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、１９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿９は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、３０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０２３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（肺癌に関して）（表１０２５に示す）。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２０は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０２６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０２７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、２０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０２８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０２９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１４は、２３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１７は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２。以下の表１０３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、３０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ５、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１０、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１１、Ｒ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１２、およびＲ３５１３７＿ＰＥＡ＿１＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１０３９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: ALAT_HUMAN_V1

Sequence documentation:

Alignment of: R35137_PEA_1_PEA_1_PEA_1_P9 x ALAT_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. .

251 TRECIEAVIRFAFEERLFLLADEV 274

||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEV 274

Sequence name: ALAT_HUMAN_V1

Sequence documentation:

Alignment of: R35137_PEA_1_PEA_1_PEA_1_P8 x ALAT_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 3088.00 Escore: 0

Matching length: 320 Total length: 320

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. .

301 AGQQELASFHSTSKGYMGEC 320

||||||||||||||||||||

301 AGQQELASFHSTSKGYMGEC 320

Sequence name: ALAT_HUMAN_V1

Sequence documentation:

Alignment of: R35137_PEA_1_PEA_1_PEA_1_P11 x ALAT_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 2487.00 Escore: 0

Matching length: 271 Total length: 496

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 54.64 Total Percent Identity: 54.64

Gaps: 1

Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQAR..................... 229

|||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

229 .................................................. 229

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. . . . .

229 .................................................. 229

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

. . . . .

229 .................................................. 229

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

. . . . .

229 .................................................. 229

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

. . . .

230 ....SGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYS 271

||||||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYS 496

Sequence name: ALAT_HUMAN_V1

Sequence documentation:

Alignment of: R35137_PEA_1_PEA_1_PEA_1_P2 x ALAT_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. .

251 TRECIEAVIRFAFEERLFLLADEV 274

||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEV 274

Sequence name: ALAT_HUMAN_V1

Sequence documentation:

Alignment of: R35137_PEA_1_PEA_1_PEA_1_P4 x ALAT_HUMAN_V1 ..

Alignment segment 1/1:

Quality: 4785.00 Escore: 0

Matching length: 494 Total length: 494

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0

Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. . . . .

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

||||||||||||||||||||||||||||||||||||||||||||||||||

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

. . . . .

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

||||||||||||||||||||||||||||||||||||||||||||||||||

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

. . . . .

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

||||||||||||||||||||||||||||||||||||||||||||||||||

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

. . . .

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE 494

||||||||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE 494

クラスターＺ２５２９９の説明
クラスターＺ２５２９９は、目的の５つの転写物および１１個のセグメントを特徴とし、その名称を、それぞれ表１０４０および１０４１に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１０４２に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である抗ロイコプロテイナーゼ（ａｎｔｉｌｅｕｋｏｐｒｏｔｅｉｎａｓｅ）１前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＡＬＫ１＿ＨＵＭＡＮ、同義語ＡＬＰ、ＨＵＳＩ−１、精子プロテイナーゼインヒビター、分泌性白血球プロテイナーゼインヒビター、ＢＬＰＩ、粘液プロテイナーゼインヒビター、ＭＰＩ、ＷＡＰ４ジスルフィドコアドメインタンパク質４、プロテイナーゼインヒビターＷＡＰ４としても公知である）（配列番号１４５４）の変異型である。

タンパク質抗ロイコプロテイナーゼ１前駆体は、以下の機能を有することが公知であるか、そのように見なされている：トリプシン、キモトリプシン、エラスターゼ、およびカテプシンＧに対して強い親和性を有する酸安定性プロテイナーゼインヒビター。口腔およびおそらく他の粘膜組織に対するエラスターゼ媒介性損傷を防止し得る。タンパク質抗ロイコプロテイナーゼ１前駆体の配列を、「抗ロイコプロテイナーゼ１前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質抗ロイコプロテイナーゼ１前駆体の局在化は、分泌と考えられる。

ヒトにおける臨床／治療用途（例えば、抗体または小分子の標的として、および／または直接的な治療として）が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である：エラスターゼインヒビター、トリプターゼインヒビター。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する（抗炎症薬、抗喘息薬）ために使用するか使用することができる薬物データベースまたは公的なデータベース（例えば、上記）に情報が存在するので、クラスターをこの分野に割り当てた。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：分子機能に関連する注釈付けであるプロテアーゼインヒビター、セリンプロテアーゼインヒビター。

クラスターＺ２５２９９を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図３５のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３５および表１０４３中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および卵巣癌において過剰発現。

上記のように、クラスターＺ２５２９９は、上の表１に列挙した５つの転写物を特徴とする。これらの転写物は、タンパク質抗ロイコプロテイナーゼ１前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１によってコードされる。公知のタンパク質（抗ロイコプロテイナーゼ１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２とＡＬＫ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜１３１に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のアミノ酸１〜１３１にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰＴＲＲＫＰＧＫＣＰＶＴＹＧＱＣＬＭＬＮＰＰＮＦＣＥＭＤＧＱＣＫＲＤＬＫＣＣＭＧＭＣＧＫＳＣＶＳＰＶＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のアミノ酸１３２〜１３９に対応する配列ＧＫＱＧＭＲＡＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２中の配列ＧＫＱＧＭＲＡＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２はまた、表１０４５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２は、以下の転写物によってコードされる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１（配列は出願書類の最後に示す）。転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１のコード部分を太字で示し、このコード部分は１２４位から開始され、５４０位で終結する。転写物はまた、表１０４６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２によってコードされる。公知のタンパク質（抗ロイコプロテイナーゼ１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３とＡＬＫ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜１３１に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のアミノ酸１〜１３１にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰＴＲＲＫＰＧＫＣＰＶＴＹＧＱＣＬＭＬＮＰＰＮＦＣＥＭＤＧＱＣＫＲＤＬＫＣＣＭＧＭＣＧＫＳＣＶＳＰＶＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のアミノ酸１３２〜１５６に対応する配列ＧＥＫＲＨＨＫＱＬＲＤＱＥＶＤＰＬＥＭＲＲＨＳＡＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３をコードする単離キメラポリペプチド。

２．Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３中の配列ＧＥＫＲＨＨＫＱＬＲＤＱＥＶＤＰＬＥＭＲＲＨＳＡＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３はまた、表１０４７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３は、以下の転写物によってコードされる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２（配列は出願書類の最後に示す）。転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２のコード部分を太字で示し、このコード部分は１２４位から開始され、５９１位で終結する。転写物はまた、表１０４８に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６によってコードされる。公知のタンパク質（抗ロイコプロテイナーゼ１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７とＡＬＫ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜８１に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のアミノ酸１〜８１にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰと少なくとも９０％相同な第１のアミノ酸配列と、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のアミノ酸８２〜８９に対応する配列ＲＧＳＬＧＳＡＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７をコードする単離キメラポリペプチド。

２．Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７中の配列ＲＧＳＬＧＳＡＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７のテールをコードする単離ポリペプチド。

変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７はまた、表１０４９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７は、以下の転写物によってコードされる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６のコード部分を太字で示し、このコード部分は１２４位から開始され、３９０位で終結する。転写物はまた、表１０５０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ９によってコードされる。公知のタンパク質（抗ロイコプロテイナーゼ１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０とＡＬＫ１＿ＨＵＭＡＮとの間の比較の報告
１．ＡＬＫ１＿ＨＵＭＡＮのアミノ酸１〜８２に対応し、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０のアミノ酸１〜８２にも対応するＭＫＳＳＧＬＦＰＦＬＶＬＬＡＬＧＴＬＡＰＷＡＶＥＧＳＧＫＳＦＫＡＧＶＣＰＰＫＫＳＡＱＣＬＲＹＫＫＰＥＣＱＳＤＷＱＣＰＧＫＫＲＣＣＰＤＴＣＧＩＫＣＬＤＰＶＤＴＰＮＰＴと少なくとも９０％相同な第１のアミノ酸配列を含む、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０をコードする単離キメラポリペプチド。

変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０はまた、表１０５１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０は、以下の転写物によってコードされる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ９（配列は出願書類の最後に示す）。転写物Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ９のコード部分を太字で示し、このコード部分は１２４位から開始され、３６９位で終結する。転写物はまた、表１０５２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｚ２５２９９＿ＰＥＡ＿２＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＺ２５２９９は、上の表２に列挙した１１個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿２０は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１。以下の表１０５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿２１は、１６２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ９。以下の表１０５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿２３は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２。以下の表１０５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿２４は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ３。以下の表１０５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿８は、２１８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ３、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ９。以下の表１０５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿１２は、２２８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ３、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ９。以下の表１０５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿１３は、２４６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ３、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ９。以下の表１０５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿１４を、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ３、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ６、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ９。以下の表１０６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿１７を、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ３。以下の表１０６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿１８は、２２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ３、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ６。以下の表１０６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＺ２５２９９＿ＰＥＡ＿２＿ｎｏｄｅ＿１９は、１９７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ１、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ２、Ｚ２５２９９＿ＰＥＡ＿２＿Ｔ３、およびＺ２５２９９＿ＰＥＡ＿２＿Ｔ６。以下の表１０６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/oXgeQ4MeyL/K6Vqb1MQu2:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P2 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . . . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
. . .
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131
|||||||||||||||||||||||||||||||
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131

Sequence name: /tmp/rbf314VLIm/yR43i4SbP4:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P3 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . . . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
. . .
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131
|||||||||||||||||||||||||||||||
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131

Sequence name: /tmp/KCtSXACZXe/rK4T6LKeRX:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P7 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNP 81
|||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNP 81

Sequence name: /tmp/LcBlcAxB6c/NSI9pqfxoU:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P10 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPT 82
||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPT 82

正常および癌性肺組織における配列名Ｚ２５２９９ｊｕｎｃ１３−１４−２１中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビターＺ２５２９９転写物の発現
ｊｕｎｃ１３−１４−２１、Ｚ２５２９９ｊｕｎｃ１３−１４−２１アンプリコン（配列番号１６６６）ならびにＺ２５２９９ｊｕｎｃ１３−１４−２１Ｆ（配列番号１６６４）およびＺ２５２９９ｊｕｎｃ１３−１４−２１Ｒ（配列番号１６６５）プライマーによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの差分発現の倍率を得た。

図３６は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の下方制御を示すヒストグラムである。

図３６から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に低かった。

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現レベルの相違についてのＰ値を、Ｔ検定によって、１．９８Ｅ−０４と決定した。この値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｚ２５２９９ｊｕｎｃ１３−１４−２１Ｆ順方向プライマーおよびＺ２５２９９ｊｕｎｃ１３−１４−２１Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｚ２５２９９ｊｕｎｃ１３−１４−２１。

順方向プライマー（配列番号１６６４）：ＡＣＣＣＣＡＡＡＣＣＣＡＡＣＴＴＧＡＴＴＣ
逆方向プライマー（配列番号１６６５）：ＴＣＡＧＴＧＧＴＧＧＡＧＣＣＡＡＧＴＣＴＣ
アンプリコン（配列番号１６６６）：ＡＣＣＣＣＡＡＡＣＣＣＡＡＣＴＴＧＡＴＴＣＣＴＧＣＣＡＴＡＴＧＧＡＧＧＡＧＧＣＴＣＴＧＧＡＧＴＣＣＴＧＣＴＣＴＧＴＧＴＧＧＴＣＣＡＧＧＴＣＣＴＴＴＣＣＡＣＣＣＴＧＡＧＡＣＴＴＧＧＣＴＣＣＡＣＣＡＣＴＧＡ

正常および癌性肺組織における配列名Ｚ２５２９９ｓｅｇ２０中に示すアンプリコンによって検出可能なＺ２５２９９転写物
ｓｅｇ２０、Ｚ２５２９９ｓｅｇ２０アンプリコン（配列番号１６６９）ならびにＺ２５２９９ｓｅｇ２０Ｆ（配列番号１６６７）およびＺ２５２９９ｓｅｇ２０Ｒ（配列番号１６６８）プライマーによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割った。次いで、この比の逆数を計算して、正常なＰＭサンプルの中央値に対する各サンプルの下方制御の倍率を得た。

図３７は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の下方制御を示すヒストグラムである。総試験サンプル数のうちの少なくとも５倍の下方制御を示すサンプルの数および比率を、下に示す。

図３７から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に低かった。明白には、１５個の腺癌サンプルのうちの６個、１６個の扁平上皮細胞癌サンプルのうちの９個、４個の大細胞癌サンプルのうちの３個、８個の小細胞癌サンプルのうちの８個で少なくとも５倍の下方制御が見出された。

肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現レベルの相違についてのＰ値を、Ｔ検定によって、腺癌では９．４３Ｅ−０２、扁平上皮細胞癌では５．６２Ｅ−０２であり、大細胞癌では３．３８Ｅ−０１であり、小細胞癌で３．７８Ｅ−０２と決定された。

５倍下方制御の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、腺癌で３．７３Ｅ−０２、扁平上皮細胞癌で１．１０Ｅ−０２、大細胞癌で２．６４Ｅ−０２、小細胞癌で７．１４Ｅ−０５であった。上記値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｚ２５２９９ｓｅｇ２０Ｆ順方向プライマーおよびＺ２５２９９ｓｅｇ２０Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｚ２５２９９ｓｅｇ２０。

順方向プライマー（配列番号１６６７）：ＣＴＣＣＴＧＡＡＣＣＣＴＡＣＴＣＣＡＡＧＣＡ
逆方向プライマー（配列番号１６６８）：ＣＡＧＧＣＧＡＴＣＣＴＡＴＧＧＡＡＡＴＣＣ
アンプリコン（配列番号１６６９）：ＣＴＣＣＴＧＡＡＣＣＣＴＡＣＴＣＣＡＡＧＣＡＣＡＧＣＣＴＣＴＧＴＣＴＧＡＣＴＣＣＣＴＴＧＴＣＣＴＴＣＡＡＧＡＧＡＡＣＴＧＴＴＣＴＣＣＡＧＧＴＣＴＣＡＧＧＧＣＣＡＧＧＡＴＴＴＣＣＡＴＡＧＧＡＴＣＧＣＣＴＧ

正常および癌性肺組織における配列名Ｚ２５２９９ｓｅｇ２３中に示すアンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター（抗ロイコプロテイナーゼ）（ＳＬＰＩ）Ｚ２５２９９転写物の発現
ｓｅｇ２３、Ｚ２５２９９ｓｅｇ２３アンプリコン（配列番号１６７２）ならびにプライマーＺ２５２９９ｓｅｇ２３Ｆ（配列番号１６７０）およびＺ２５２９９ｓｅｇ２３Ｒ（配列番号１６７１）によって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター（抗ロイコプロテイナーゼ）（ＳＬＰＩ）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割った。次いで、この比の逆数を計算して、正常なＰＭサンプルの中央値に対する各サンプルの下方制御の倍率を得た。

図６８は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンス分泌性白血球プロテアーゼインヒビター（抗ロイコプロテイナーゼ）（ＳＬＰＩ）転写物の下方制御を示すヒストグラムである。

図６８から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター（抗ロイコプロテイナーゼ）（ＳＬＰＩ）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２）よりも有意に低かった。明白には、１５個の腺癌サンプルのうちの７個、１６個の扁平上皮細胞癌サンプルのうちの９個、４個の大細胞癌サンプルのうちの３個、８個の小細胞癌サンプルのうちの８個で少なくとも１０倍の下方制御が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｚ２５２９９ｓｅｇ２３Ｆ順方向プライマーおよびＺ２５２９９ｓｅｇ２３Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｚ２５２９９ｓｅｇ２３。

プライマー：
順方向プライマーＺ２５２９９ｓｅｇ２３Ｆ（配列番号１６７０）：ＣＡＡＧＣＡＡＴＴＧＡＧＧＧＡＣＣＡＧＧ
逆方向プライマーＺ２５２９９ｓｅｇ２３Ｒ（配列番号１６７１）：ＣＡＡＡＡＡＡＣＡＴＴＧＴＴＡＡＴＧＡＧＡＧＡＧＡＴＧＡＣ
アンプリコンＺ２５２９９ｓｅｇ２３Ｆ（配列番号１６７２）：ＣＡＡＧＣＡＡＴＴＧＡＧＧＧＡＣＣＡＧＧＡＡＧＴＧＧＡＴＣＣＴＣＴＡＧＡＧＡＴＧＡＧＧＡＧＧＣＡＴＴＣＴＧＣＴＧＧＡＴＧＡＣＴＴＴＴＡＡＡＡＡＴＧＴＴＴＴＣＴＣＣＡＧＡＧＴＣＡＴＣＴＣＴＣＴＣＡＴＴＡＡＣＡＡＴＧＴＴＴＴＴＴＧ

異なる正常組織における配列名Ｚ２５２９９ｓｅｇ２０中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の発現
Ｚ２５２９９ｓｅｇ２０アンプリコン（配列番号１６６９）ならびにプライマーＺ２５２９９ｓｅｇ２３Ｆ（配列番号１６６７）およびＺ２５２９９ｓｅｇ２０Ｒ（配列番号１６６８）によって検出可能な分泌性白血球プロテアーゼインヒビター転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、卵巣サンプル（サンプル番号１８〜２０、表３）の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。

プライマー：
順方向プライマー（配列番号１６６７）：ＣＴＣＣＴＧＡＡＣＣＣＴＡＣＴＣＣＡＡＧＣＡ
逆方向プライマー（配列番号１６６８）：ＣＡＧＧＣＧＡＴＣＣＴＡＴＧＧＡＡＡＴＣＣ
アンプリコン（配列番号１６６９）：ＣＴＣＣＴＧＡＡＣＣＣＴＡＣＴＣＣＡＡＧＣＡＣＡＧＣＣＴＣＴＧＴＣＴＧＡＣＴＣＣＣＴＴＧＴＣＣＴＴＣＡＡＧＡＧＡＡＣＴＧＴＴＣＴＣＣＡＧＧＴＣＴＣＡＧＧＧＣＣＡＧＧＡＴＴＴＣＣＡＴＡＧＧＡＴＣＧＣＣＴＧ

結果を図６９に示し、これは、異なる正常組織における配列名Ｚ２５２９９ｓｅｇ２０中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の発現を示す。

異なる正常組織における配列名Ｚ２５２９９ｓｅｇ２３中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターＺ２５２９９転写物の発現
Ｚ２５２９９ｓｅｇ２３アンプリコン（配列番号１６７２）ならびにプライマーＺ２５２９９ｓｅｇ２３Ｆ（配列番号１６７０）およびＺ２５２９９ｓｅｇ２３Ｒ（配列番号１６７１）によって検出可能な分泌性白血球プロテアーゼインヒビター転写物の発現を、実時間ＰＣＲによって測定した。並行して４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン、配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、卵巣サンプル（サンプル番号１８〜２０、表３）の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。

結果を図７０に示し、これは、異なる正常組織における配列名Ｚ２５２９９ｓｅｇ２３中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の発現を示す。

クラスターＨＳＳＴＲＯＬ３の説明
クラスターＨＳＳＴＲＯＬ３は、目的の６つの転写物および１６個のセグメントを特徴とし、その名称を、それぞれ表１０６４および１０６５に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１０６６に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるストロメリシン−３前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＭＭ１１＿ＨＵＭＡＮ、同義語ＥＣ３．４．２４．−、マトリクス金属プロテイナーゼ−１１、ＭＭＰ−１１、ＳＴ３、ＳＬ−３としても公知である）（配列番号１４５５）の変異型である。

タンパク質ストロメリシン−３前駆体は、以下の機能を有することが公知であるか、そのように見なされている：上皮悪性腫瘍の進行において重要な役割を果たし得る。タンパク質ストロメリシン−３前駆体の配列を、「ストロメリシン−３前駆体アミノ酸配列」として出願書類の最後に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けであるタンパク質分解およびペプチド分解、発生過程、形態形成、分子機能に関連する注釈付けであるストロメリシン３、カルシウム結合、亜鉛結合、ヒドロラーゼ、ならびに細胞成分に関連する注釈付けである細胞外基質。

クラスターＨＳＳＴＲＯＬ３を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図３８のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図３８および表１０６７中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：移行上皮癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。

上記のように、クラスターＨＳＳＴＲＯＬ３は、上の表１に列挙した６つの転写物を特徴とする。これらの転写物は、タンパク質ストロメリシン−３前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＳＴＲＯＬ３＿Ｔ５によってコードされる。公知のタンパク質（ストロメリシン−３前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＳＴＲＯＬ３＿Ｐ４とＭＭ１１＿ＨＵＭＡＮとの間の比較の報告
１．ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜４４５に対応し、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸１６５〜４４５にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱＧＡＱＹＷＶＹＤＧＥＫＰＶＬＧＰＡＰＬＴＥＬＧＬＶＲＦＰＶＨＡＡＬＶＷＧＰＥＫＮＫＩＹＦＦＲＧＲＤＹＷＲＦＨＰＳＴＲＲＶＤＳＰＶＰＲＲＡＴＤＷＲＧＶＰＳＥＩＤＡＡＦＱＤＡＤＧと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ４のアミノ酸４４６〜４９６に対応する配列ＡＬＧＶＲＱＬＶＧＧＧＨＳＳＲＦＳＨＬＶＶＡＧＬＰＨＡＣＨＲＫＳＧＳＳＳＱＶＬＣＰＥＰＳＡＬＬＳＶＡＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ４をコードする単離キメラポリペプチド。

２．ＨＳＳＴＲＯＬ３＿Ｐ４中の配列ＡＬＧＶＲＱＬＶＧＧＧＨＳＳＲＦＳＨＬＶＶＡＧＬＰＨＡＣＨＲＫＳＧＳＳＳＱＶＬＣＰＥＰＳＡＬＬＳＶＡＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ４のテールをコードする単離ポリペプチド。

変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ４はまた、表１０６９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＳＳＴＲＯＬ３＿Ｐ４は、以下の転写物によってコードされる：ＨＳＳＴＲＯＬ３＿Ｔ５（配列は出願書類の最後に示す）。転写物ＨＳＳＴＲＯＬ３＿Ｔ５のコード部分を太字で示し、このコード部分は２４位から開始され、１５１１位で終結する。転写物はまた、表１０７０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＳＴＲＯＬ３＿Ｔ８およびＨＳＳＴＲＯＬ３＿Ｔ９によってコードされる。公知のタンパク質（ストロメリシン−３前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＳＴＲＯＬ３＿Ｐ５とＭＭ１１＿ＨＵＭＡＮとの間の比較の報告
１．ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜３５８に対応し、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸１６５〜３５８にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ５のアミノ酸３５９〜３８２に対応する配列ＥＬＧＦＰＳＳＴＧＲＤＥＳＬＥＨＣＲＣＱＧＬＨＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ５をコードする単離キメラポリペプチド。

２．ＨＳＳＴＲＯＬ３＿Ｐ５中の配列ＥＬＧＦＰＳＳＴＧＲＤＥＳＬＥＨＣＲＣＱＧＬＨＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ５のテールをコードする単離ポリペプチド。

変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ５はまた、表１０７１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＳＳＴＲＯＬ３＿Ｐ５は、以下の転写物によってコードされる：ＨＳＳＴＲＯＬ３＿Ｔ８およびＨＳＳＴＲＯＬ３＿Ｔ９（配列は出願書類の最後に示す）。

転写物ＨＳＳＴＲＯＬ３＿Ｔ８のコード部分を太字で示し、このコード部分は２４位から開始され、１５６９位で終結する。転写物はまた、表１０７２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

転写物ＨＳＳＴＲＯＬ３＿Ｔ９のコード部分を太字で示し、このコード部分は２４位から開始され、１１６９位で終結する。転写物はまた、表１０７３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＳＴＲＯＬ３＿Ｔ１０によってコードされる。公知のタンパク質（ストロメリシン−３前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＳＴＲＯＬ３＿Ｐ７とＭＭ１１＿ＨＵＭＡＮとの間の比較の報告
１．ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜３５９に対応し、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸１６５〜３５９にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱＧと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ７のアミノ酸３６０〜３７０に対応する配列ＴＴＧＶＳＴＰＡＰＧＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ７をコードする単離キメラポリペプチド。

２．ＨＳＳＴＲＯＬ３＿Ｐ７中の配列ＴＴＧＶＳＴＰＡＰＧＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ７のテールをコードする単離ポリペプチド。

変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ７はまた、表１０７４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＳＳＴＲＯＬ３＿Ｐ７は、以下の転写物によってコードされる：ＨＳＳＴＲＯＬ３＿Ｔ１０（配列は出願書類の最後に示す）。転写物ＨＳＳＴＲＯＬ３＿Ｔ１０のコード部分を太字で示し、このコード部分は２４位から開始され、１１３３位で終結する。転写物はまた、表１０７５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＳＴＲＯＬ３＿Ｔ１１によってコードされる。公知のタンパク質（ストロメリシン−３前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＳＴＲＯＬ３＿Ｐ８とＭＭ１１＿ＨＵＭＡＮとの間の比較の報告
１．ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸１〜１６３にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫＲＦＶＬＳＧＧＲＷＥＫＴＤＬＴＹＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第１のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸１６４に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜２８６に対応し、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸１６５〜２８６にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ８のアミノ酸２７８〜３０１に対応する配列ＶＲＰＣＬＰＶＰＬＬＬＣＷＰＬを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ８をコードする単離キメラポリペプチド。

２．ＨＳＳＴＲＯＬ３＿Ｐ８中の配列ＶＲＰＣＬＰＶＰＬＬＬＣＷＰＬと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ８のテールをコードする単離ポリペプチド。

変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ８はまた、表１０７６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＳＳＴＲＯＬ３＿Ｐ８は、以下の転写物によってコードされる：ＨＳＳＴＲＯＬ３＿Ｔ１１（配列は出願書類の最後に示す）。転写物ＨＳＳＴＲＯＬ３＿Ｔ１１のコード部分を太字で示し、このコード部分は２４位から開始され、９２６位で終結する。転写物はまた、表１０７７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ９は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＳＴＲＯＬ３＿Ｔ１２によってコードされる。公知のタンパク質（ストロメリシン−３前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＳＴＲＯＬ３＿Ｐ９とＭＭ１１＿ＨＵＭＡＮとの間の比較の報告
１．ＭＭ１１＿ＨＵＭＡＮのアミノ酸１〜９６に対応し、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸１〜９６にも対応するＭＡＰＡＡＷＬＲＳＡＡＡＲＡＬＬＰＰＭＬＬＬＬＬＱＰＰＰＬＬＡＲＡＬＰＰＤＶＨＨＬＨＡＥＲＲＧＰＱＰＷＨＡＡＬＰＳＳＰＡＰＡＰＡＴＱＥＡＰＲＰＡＳＳＬＲＰＰＲＣＧＶＰＤＰＳＤＧＬＳＡＲＮＲＱＫと少なくとも９０％相同な第１のアミノ酸配列と、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１１３〜１６３に対応し、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸９７〜１４７にも対応するＲＩＬＲＦＰＷＱＬＶＱＥＱＶＲＱＴＭＡＥＡＬＫＶＷＳＤＶＴＰＬＴＦＴＥＶＨＥＧＲＡＤＩＭＩＤＦＡＲＹＷと少なくとも９０％相同な第２のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸１４８に対応する架橋アミノ酸Ｈと、ＭＭ１１＿ＨＵＭＡＮのアミノ酸１６５〜３５９に対応し、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸１４９〜３４３にも対応するＧＤＤＬＰＦＤＧＰＧＧＩＬＡＨＡＦＦＰＫＴＨＲＥＧＤＶＨＦＤＹＤＥＴＷＴＩＧＤＤＱＧＴＤＬＬＱＶＡＡＨＥＦＧＨＶＬＧＬＱＨＴＴＡＡＫＡＬＭＳＡＦＹＴＦＲＹＰＬＳＬＳＰＤＤＣＲＧＶＱＨＬＹＧＱＰＷＰＴＶＴＳＲＴＰＡＬＧＰＱＡＧＩＤＴＮＥＩＡＰＬＥＰＤＡＰＰＤＡＣＥＡＳＦＤＡＶＳＴＩＲＧＥＬＦＦＦＫＡＧＦＶＷＲＬＲＧＧＱＬＱＰＧＹＰＡＬＡＳＲＨＷＱＧＬＰＳＰＶＤＡＡＦＥＤＡＱＧＨＩＷＦＦＱＧと少なくとも９０％相同な第３のアミノ酸配列と、ＨＳＳＴＲＯＬ３＿Ｐ９のアミノ酸３４４〜３５４に対応する配列ＴＴＧＶＳＴＰＡＰＧＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第４のアミノ酸配列とを含み、前記第１のアミノ酸配列、第２のアミノ酸配列、架橋アミノ酸、第３のアミノ酸配列、および第４のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＳＴＲＯＬ３＿Ｐ９をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＫＲを含み、以下の構造：アミノ酸番号９６−ｘ〜９６のいずれかから始まり、アミノ酸番号９７＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ９の縁部分をコードする単離キメラポリペプチド。

３．ＨＳＳＴＲＯＬ３＿Ｐ９中の配列ＴＴＧＶＳＴＰＡＰＧＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＳＳＴＲＯＬ３＿Ｐ９のテールをコードする単離ポリペプチド。

変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ９はまた、表１０７８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＳＳＴＲＯＬ３＿Ｐ９は、以下の転写物によってコードされる：ＨＳＳＴＲＯＬ３＿Ｔ１２（配列は出願書類の最後に示す）。転写物ＨＳＳＴＲＯＬ３＿Ｔ１２のコード部分を太字で示し、このコード部分は２４位から開始され、１０８５位で終結する。転写物はまた、表１０７９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳＴＲＯＬ３＿Ｐ９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＳＳＴＲＯＬ３は、上の表２に列挙した１６個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿６は、１４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１０は、２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１３は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１５は、４７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１９は、６３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２１は、６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２４は、７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ８およびＨＳＳＴＲＯＬ３＿Ｔ９。以下の表１０８６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２５は、１３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ８。以下の表１０８７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２６は、５５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、およびＨＳＳＴＲＯＬ３＿Ｔ１１。以下の表１０８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２８は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ９、およびＨＳＳＴＲＯＬ３＿Ｔ１０。以下の表１０８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２９は、１０９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１１は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、およびＨＳＳＴＲＯＬ３＿Ｔ１１。以下の表１０９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１７は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿１８を、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２０は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ１１。以下の表１０９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳＴＲＯＬ３＿ｎｏｄｅ＿２７は、５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳＴＲＯＬ３＿Ｔ５、ＨＳＳＴＲＯＬ３＿Ｔ８、ＨＳＳＴＲＯＬ３＿Ｔ９、ＨＳＳＴＲＯＬ３＿Ｔ１０、ＨＳＳＴＲＯＬ３＿Ｔ１１、およびＨＳＳＴＲＯＬ３＿Ｔ１２。以下の表１０９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P4 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 4444.00 Escore: 0
Matching length: 445 Total length: 445
Matching Percent Similarity: 99.78 Matching Percent Identity: 99.78
Total Percent Similarity: 99.78 Total Percent Identity: 99.78
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
. . . . .
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
. . . .
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445
|||||||||||||||||||||||||||||||||||||||||||||
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445

Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P5 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3566.00 Escore: 0
Matching length: 358 Total length: 358
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQ 358
||||||||
351 QGHIWFFQ 358

Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P7 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3575.00 Escore: 0
Matching length: 359 Total length: 359
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQG 359
|||||||||
351 QGHIWFFQG 359

Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P8 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 2838.00 Escore: 0
Matching length: 286 Total length: 286
Matching Percent Similarity: 99.65 Matching Percent Identity: 99.65
Total Percent Similarity: 99.65 Total Percent Identity: 99.65
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286

Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P9 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3316.00 Escore: 0
Matching length: 343 Total length: 359
Matching Percent Similarity: 99.71 Matching Percent Identity: 99.71
Total Percent Similarity: 95.26 Total Percent Identity: 95.26
Gaps: 1

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQK.... 96
||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
97 ............RILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 134
||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
135 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 184
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
185 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 234
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
235 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 284
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
285 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 334
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

335 QGHIWFFQG 343
|||||||||
351 QGHIWFFQG 359

正常および癌性肺組織における配列名ＨＳＳＴＲＯＬ３ｓｅｇ２４中に示すアンプリコンによって検出可能なストロメリシン−３前駆体ＨＳＳＴＲＯＬ３転写物の発現
ｓｅｇ２４、ＨＳＳＴＲＯＬ３ｓｅｇ２４アンプリコン（配列番号１６７５）、ならびにＨＳＳＴＲＯＬ３ｓｅｇ２４Ｆ（配列番号１６７３）およびＨＳＳＴＲＯＬ３ｓｅｇ２４Ｒ（配列番号１６７４）プライマーによって検出可能なストロメリシン−３前駆体（ＥＣ３．４．２４．−）（マトリクス金属プロテイナーゼ−１１）（ＭＭＰ−１１）（ＳＴ３）（ＳＬ−３）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図３９は、正常サンプルと比較した癌性肺サンプルにおける上記ストロメリシン−３前駆体転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。

図３９から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なストロメリシン−３前駆体転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの１３個、１６個の扁平上皮細胞癌サンプルのうちの８個、４個の大細胞癌サンプルのうちの３個、８個の小細胞癌サンプルのうちの７個で少なくとも５倍の過剰発現が見出された。

５倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、腺癌で４．０４Ｅ−０４、扁平上皮細胞癌で９．８９Ｅ−０２、大細胞癌で６．０４Ｅ−０２、小細胞癌で３．１４Ｅ−０３であった。上記値は、結果が統計的に有意であることを示す。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：ＨＳＳＴＲＯＬ３ｓｅｇ２４Ｆ順方向プライマーおよびＨＳＳＴＲＯＬ３ｓｅｇ２４Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＨＳＳＴＲＯＬ３ｓｅｇ２４。

順方向プライマー（配列番号１６７３）：ＡＴＴＴＣＣＡＴＣＣＴＣＡＡＣＴＧＧＣＡＧＡ
逆方向プライマー（配列番号１６７４）：ＴＧＣＣＣＴＧＧＡＡＣＣＣＡＣＧ
アンプリコン（配列番号１６７５）：ＡＴＴＴＣＣＡＴＣＣＴＣＡＡＣＴＧＧＣＡＧＡＧＡＴＧＡＧＡＧＣＣＴＧＧＡＧＣＡＴＴＧＣＡＧＡＴＧＣＣＡＧＧＧＡＣＴＴＣＡＣＡＡＡＴＧＡＡＧＧＣＡＣＡＧＣＡＴＧＧＧＡＡＡＣＣＴＧＣＧＴＧＧＧＴＴＣＣＡＧＧＧＣＡ

異なる正常組織における配列名ＨＳＳＴＲＯＬ３ｓｅｇ２４中に示すアンプリコンによって検出可能なストロメリシン−３前駆体ＨＳＳＴＲＯＬ３転写物の発現
ＨＳＳＴＲＯＬ３ｓｅｇ２４アンプリコン（配列番号１６７５）ならびにＨＳＳＴＲＯＬ３ｓｅｇ２４Ｆ（配列番号１６７３）およびＨＳＳＴＲＯＬ３ｓｅｇ２４Ｒ（配列番号１６７４）によって検出可能なストロメリシン−３前駆体転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）、ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、肺サンプル（上記のサンプル番号１５〜１７、表２、「正常パネル中の組織サンプル」）の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。

結果を図４０に示し、これは、異なる正常組織における配列名ＨＳＳＴＲＯＬ３ｓｅｇ２４中に示すアンプリコンによって検出可能なストロメリシン−３ＨＳＳＴＲＯＬ３転写物の発現を示す。

正常および癌性肺組織における配列名ＨＳＳＴＲＯＬ３ｓｅｇ２０−２１中に示すアンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−１１（ストロメリシン３）（ＭＭＰ１１）ＨＳＳＴＲＯＬ３転写物の発現
ｓｅｇ２０−２１、ＨＳＳＴＲＯＬ３ｓｅｇ２０−２１アンプリコン（配列番号１６７８）ならびにプライマーＨＳＳＴＲＯＬ３ｓｅｇ２０−２１Ｆ（配列番号１６７６）およびＨＳＳＴＲＯＬ３ｓｅｇ２０−２１Ｒ（配列番号１６７７）によって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−１１（ストロメリシン３）（ＭＭＰ１１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図７１は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスマトリクス金属プロテイナーゼ１１（ストロメリシン３）（ＭＭＰ１１）転写物の過剰発現を示すヒストグラムである。

図７１から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ１１（ストロメリシン３）（ＭＭＰ１１）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの１１個、１６個の扁平上皮細胞癌サンプルのうち６個、４個の大細胞癌サンプルのうちの１個、８個の小細胞癌サンプルのうちの６個で少なくとも６倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：ＨＳＳＴＲＯＬ３ｓｅｇ２０−２１Ｆ順方向プライマーおよびＨＳＳＴＲＯＬ３ｓｅｇ２０−２１Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＨＳＳＴＲＯＬ３ｓｅｇ２０−２１。

プライマー：
順方向プライマーＨＳＳＴＲＯＬ３ｓｅｇ２０−２１Ｆ（配列番号１６７６）：ＴＣＴＧＣＴＧＧＣＣＡＣＴＧＴＧＡＣＴＧ
逆方向プライマーＨＳＳＴＲＯＬ３ｓｅｇ２０−２１Ｒ（配列番号１６７７）：ＧＡＡＧＡＡＡＡＡＧＡＧＣＴＣＧＣＣＴＣＧ
アンプリコンＨＳＳＴＲＯＬ３ｓｅｇ２０−２１（配列番号１６７８）：ＴＣＴＧＣＴＧＧＣＣＡＣＴＧＴＧＡＣＴＧＣＡＧＣＡＴＡＴＧＣＣＣＴＣＡＧＣＡＴＧＴＧＴＣＣＣＴＣＴＣＴＣＣＣＡＣＣＣＣＡＧＣＣＡＧＡＣＧＣＣＣＣＧＣＣＡＧＡＴＧＣＣＴＧＴＧＡＧＧＣＣＴＣＣＴＴＴＧＡＣＧＣＧＧＴＣＴＣＣＡＣＣＡＴＣＣＧＡＧＧＣＧＡＧＣＴＣＴＴＴＴＴＣＴＴＣ

正常および癌性肺組織における配列名ＨＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７中に示すアンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−１１（ストロメリシン３）（ＭＭＰ１１）ＨＳＳＴＲＯＬ３転写物の発現
ｊｕｎｃ２１−２７、ＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７アンプリコン（配列番号１６８１）ならびにプライマーＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７Ｆ（配列番号１６７９）およびＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７Ｒ（配列番号１６８０）によって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−１１（ストロメリシン３）（ＭＭＰ１１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図７２は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスマトリクス金属プロテイナーゼ１１（ストロメリシン３）（ＭＭＰ１１）転写物の過剰発現を示すヒストグラムである。

図７２から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ１１（ストロメリシン３）（ＭＭＰ１１）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの１５個、１６個の扁平上皮細胞癌サンプルのうち１３個、４個の大細胞癌サンプルのうちの３個、８個の小細胞癌サンプルのうちの５個で少なくとも１０倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：ＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７Ｆ順方向プライマーおよびＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７。

プライマー：
順方向プライマーＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７Ｆ（配列番号１６７９）：ＡＣＡＴＴＴＧＧＴＴＣＴＴＣＣＡＡＧＧＧＡＣＴＡＣ
逆方向プライマーＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７Ｒ（配列番号１６８０）：ＴＣＧＡＴＣＴＣＡＧＡＧＧＧＣＡＣＣＣ
アンプリコンＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７（配列番号１６８１）：ＡＣＡＴＴＴＧＧＴＴＣＴＴＣＣＡＡＧＧＧＡＣＴＡＣＴＧＧＣＧＴＴＴＣＣＡＣＣＣＣＡＧＣＡＣＣＣＧＧＣＧＴＧＴＡＧＡＣＡＧＴＣＣＣＧＴＧＣＣＣＣＧＣＡＧＧＧＣＣＡＣＴＧＡＣＴＧＧＡＧＡＧＧＧＧＴＧＣＣＣＴＣＴＧＡＧＡＴＣＧＡ

クラスターＨＵＭＴＲＥＦＡＣの説明
クラスターＨＵＭＴＲＥＦＡＣは、目的の２つの転写物および７個のセグメントを特徴とし、その名称を、それぞれ表１０９６および１０９７に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１０９８に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるトレフォイル因子３（Ｔｒｅｆｏｉｌｆａｃｔｏｒ３）前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＴＦＦ３＿ＨＵＭＡＮ、同義語腸トレフォイル因子、ｈＰ１．Ｂとしても公知である）（配列番号１４５６）の変異型である。

タンパク質トレフォイル因子３前駆体は、以下の機能を有することが公知であるか、そのように見なされている：細胞移動の促進で役割を果たし得る（細胞遊走促進因子）。タンパク質トレフォイル因子３前駆体の配列を、「トレフォイル因子３前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１０９９に示す。

タンパク質トレフォイル因子３前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである防御応答、消化、および細胞成分に関連する注釈付けである細胞外。

クラスターＨＵＭＴＲＥＦＡＣを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図４１のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４１および表１１００中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：異なる組織由来の悪性腫瘍の混合物、悪性乳癌、膵臓癌、および前立腺癌。

上記のように、クラスターＨＵＭＴＲＥＦＡＣは、上の表１に列挙した２つの転写物を特徴とする。これらの転写物は、タンパク質トレフォイル因子３前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ７はまた、表１１０２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ７は、以下の転写物によってコードされる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５（配列は出願書類の最後に示す）。転写物ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５のコード部分を太字で示し、このコード部分は２７８位から開始され、６８８位で終結する。転写物はまた、表１１０３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４によってコードされる。公知のタンパク質（トレフォイル因子３前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８とＴＦＦ３＿ＨＵＭＡＮとの間の比較の報告
１．ＴＦＦ３＿ＨＵＭＡＮのアミノ酸１〜２７に対応し、ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８のアミノ酸１〜２７にも対応するＭＡＡＲＡＬＣＭＬＧＬＶＬＡＬＬＳＳＳＳＡＥＥＹＶＧＬと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８のアミノ酸２８〜４１に対応する配列ＷＫＶＨＬＰＫＧＥＧＦＳＳＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８をコードする単離キメラポリペプチド。

２．ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８中の配列ＷＫＶＨＬＰＫＧＥＧＦＳＳＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８はまた、表１１０４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８は、以下の転写物によってコードされる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４（配列は出願書類の最後に示す）。転写物ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４のコード部分を太字で示し、このコード部分は２７８位から開始され、４００位で終結する。転写物はまた、表１１０５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｐ８配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＴＲＥＦＡＣは、上の表２に列挙した７個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿０は、１８８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４およびＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５。以下の表１１０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿９は、１５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４およびＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５。以下の表１１０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿２は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４。以下の表１１０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿３は、１０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４およびＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５。以下の表１１０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿４は、１９７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４およびＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５。以下の表１１１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿５は、１８７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４およびＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５。以下の表１１１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿ｎｏｄｅ＿８を、以下の転写物中に見出すことができる：ＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ４およびＨＵＭＴＲＥＦＡＣ＿ＰＥＡ＿２＿Ｔ５。以下の表１１１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: TFF3_HUMAN

Sequence documentation:

Alignment of: HUMTREFAC_PEA_2_P8 x TFF3_HUMAN ..

Alignment segment 1/1:

Quality: 246.00 Escore: 0
Matching length: 27 Total length: 27
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. .
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
|||||||||||||||||||||||||||
1 MAARALCMLGLVLALLSSSSAEEYVGL 27

クラスターＨＳＳ１００ＰＣＢの説明
クラスターＨＳＳ１００ＰＣＢは、目的の１つの転写物および３個のセグメントを特徴とし、その名称を、それぞれ表１１１３および１１１４に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１１１５に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれ、２つのカルシウムイオンに結合する公知のタンパク質であるＳ−１００Ｐタンパク質（ＳｗｉｓｓＰｒｏｔアクセッション識別子Ｓ１０Ｐ＿ＨＵＭＡＮ）（配列番号１４５７）の変異型である。

タンパク質Ｓ−１００Ｐタンパク質の配列を、「Ｓ−１００Ｐタンパク質アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１１１６に示す。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：分子機能に関連する注釈付けであるカルシウム結合、タンパク質結合。

クラスターＨＳＳ１００ＰＣＢを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図４２のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４２および表１１１７中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：異なる組織由来の悪性腫瘍の混合物。

上記のように、クラスターＨＳＳ１００ＰＣＢは、上の表１に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質Ｓ−１００Ｐタンパク質の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＳＳ１００ＰＣＢ＿Ｐ３は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＳ１００ＰＣＢ＿Ｔ１によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質ＨＳＳ１００ＰＣＢ＿Ｐ３はまた、表１１１９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳ１００ＰＣＢ＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、ＨＳＳ１００ＰＣＢ＿Ｐ３は、以下の転写物によってコードされる：ＨＳＳ１００ＰＣＢ＿Ｔ１（配列は出願書類の最後に示す）。転写物ＨＳＳ１００ＰＣＢ＿Ｔ１のコード部分を太字で示し、このコード部分は１０５７位から開始され、１５３３位で終結する。転写物はまた、表１１２０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＳ１００ＰＣＢ＿Ｐ３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＳＳ１００ＰＣＢは、上の表２に列挙した３個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＳＳ１００ＰＣＢ＿ｎｏｄｅ＿３は、１６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳ１００ＰＣＢ＿Ｔ１。以下の表１１２１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳ１００ＰＣＢ＿ｎｏｄｅ＿４は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳ１００ＰＣＢ＿Ｔ１。以下の表１１２２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＳ１００ＰＣＢ＿ｎｏｄｅ＿５は、１４１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＳ１００ＰＣＢ＿Ｔ１。以下の表１１２４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

クラスターＨＳＵ３３１４７の説明
クラスターＨＳＵ３３１４７は、目的の２つの転写物および５個のセグメントを特徴とし、その名称を、それぞれ表１１２５および１１２６に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１１２７に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるマンマグロビンＡ前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＭＧＢＡ＿ＨＵＭＡＮ、同義語マンマグロビン１、セクレトグロビンファミリー２Ａメンバー２としても公知である）（配列番号１４１６）の変異型である。

タンパク質マンマグロビンＡ前駆体の配列を、「マンマグロビンＡ前駆体アミノ酸配列」として出願書類の最後に示す。

ヒトにおける臨床／治療用途（例えば、抗体または小分子の標的として、および／または直接的な治療として）が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である：免疫賦活剤。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する（抗癌薬）ために使用するか使用することができる薬物データベースまたは公的なデータベース（例えば、上記）に情報が存在するので、クラスターをこの分野に割り当てた。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：分子機能に関連する注釈付けであるステロイド結合。

クラスターＨＳＵ３３１４７を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図４３のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４３および表１１２８中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：異なる組織由来の悪性腫瘍の混合物。

上記のように、クラスターＨＳＵ３３１４７は、上の表１に列挙した２つの転写物を特徴とする。これらの転写物は、タンパク質マンマグロビンＡ前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１によってコードされる。公知のタンパク質（マンマグロビンＡ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５とＭＧＢＡ＿ＨＵＭＡＮとの間の比較の報告
１．ＭＧＢＡ＿ＨＵＭＡＮのアミノ酸１〜７８に対応し、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜７８にも対応するＭＫＬＬＭＶＬＭＬＡＡＬＳＱＨＣＹＡＧＳＧＣＰＬＬＥＮＶＩＳＫＴＩＮＰＱＶＳＫＴＥＹＫＥＬＬＱＥＦＩＤＤＮＡＴＴＮＡＩＤＥＬＫＥＣＦＬＮＱＴＤＥＴＬＳＮＶＥと少なくとも９０％相同な第１のアミノ酸配列と、ＭＧＢＡ＿ＨＵＭＡＮのアミノ酸８２〜９３に対応し、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５のアミノ酸７９〜９０にも対応するＱＬＩＹＤＳＳＬＣＤＬＦと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＥＱを含み、以下の構造：アミノ酸番号７８−ｘ〜７８のいずれかから始まり、アミノ酸番号７９＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５の縁部分をコードする単離キメラポリペプチド。

公知のタンパク質マンマグロビンＡ前駆体と比較した変異タンパク質ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５のグリコシル化部位を表１１３０に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１（配列は出願書類の最後に示す）。転写物ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１のコード部分を太字で示し、このコード部分は７２位から開始され、３４１位で終結する。転写物はまた、表１１３１に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＳＵ３３１４７は、上の表２に列挙した５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＳＵ３３１４７＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１およびＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ２。以下の表１１３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＵ３３１４７＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、４４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１およびＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ２。以下の表１１３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＵ３３１４７＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ２。以下の表１１３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＵ３３１４７＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、３５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ１。以下の表１１３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＳＵ３３１４７＿ＰＥＡ＿１＿ｎｏｄｅ＿３を、以下の転写物中に見出すことができる：ＨＳＵ３３１４７＿ＰＥＡ＿１＿Ｔ２。以下の表１１３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: MGBA_HUMAN

Sequence documentation:

Alignment of: HSU33147_PEA_1_P5 x MGBA_HUMAN ..

Alignment segment 1/1:

Quality: 776.00 Escore: 0
Matching length: 90 Total length: 93
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.77 Total Percent Identity: 96.77
Gaps: 1

Alignment:
. . . . .
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
. . . .
51 DDNATTNAIDELKECFLNQTDETLSNVE...QLIYDSSLCDLF 90
|||||||||||||||||||||||||||| ||||||||||||
51 DDNATTNAIDELKECFLNQTDETLSNVEVFMQLIYDSSLCDLF 93

クラスターＲ２０７７９の説明
クラスターＲ２０７７９は、目的の１つの転写物および２４個のセグメントを特徴とし、その名称を、それぞれ表１１３７および１１３８に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１１３９に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるスタニオカルシン２前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＳＴＣ２＿ＨＵＭＡＮ、同義語ＳＴＣ−２、スタニオカルシン関連タンパク質、ＣＴＣＲＰ、ＳＴＣ関連タンパク質としても公知である）（配列番号１４５８）の変異型である。

タンパク質スタニオカルシン２前駆体は、以下の機能を有することが公知であるか、そのように見なされている：カルシウムおよびリン酸塩のホメオスタシスに対する抗低カルシウム作用を有する。タンパク質スタニオカルシン２前駆体の配列を、「スタニオカルシン２前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質スタニオカルシン２前駆体の局在化は、分泌と考えられる（可能性）。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである細胞表面受容体結合シグナル伝達、細胞−細胞シグナル伝達、栄養応答経路、分子機能に関連する注釈付けであるホルモン、細胞成分に関連する注釈付けである細胞外。

クラスターＲ２０７７９を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図４４のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４４および表１１４０中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および悪性肺腫瘍。

上記のように、クラスターＲ２０７７９は、上の表１に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質スタニオカルシン２前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ２０７７９＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ２０７７９＿Ｔ７によってコードされる。公知のタンパク質（スタニオカルシン２前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ２０７７９＿Ｐ２とＳＴＣ２＿ＨＵＭＡＮとの間の比較の報告
１．ＳＴＣ２＿ＨＵＭＡＮのアミノ酸１〜１６９に対応し、Ｒ２０７７９＿Ｐ２のアミノ酸１〜１６９にも対応するＭＣＡＥＲＬＧＱＦＭＴＬＡＬＶＬＡＴＦＤＰＡＲＧＴＤＡＴＮＰＰＥＧＰＱＤＲＳＳＱＱＫＧＲＬＳＬＱＮＴＡＥＩＱＨＣＬＶＮＡＧＤＶＧＣＧＶＦＥＣＦＥＮＮＳＣＥＩＲＧＬＨＧＩＣＭＴＦＬＨＮＡＧＫＦＤＡＱＧＫＳＦＩＫＤＡＬＫＣＫＡＨＡＬＲＨＲＦＧＣＩＳＲＫＣＰＡＩＲＥＭＶＳＱＬＱＲＥＣＹＬＫＨＤＬＣＡＡＡＱＥＮＴＲＶＩＶＥＭＩＨＦＫＤＬＬＬＨＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ２０７７９＿Ｐ２のアミノ酸１７０〜１８７に対応する配列ＣＹＫＩＥＩＴＭＰＫＲＲＫＶＫＬＲＤを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ２０７７９＿Ｐ２をコードする単離キメラポリペプチド。

２．Ｒ２０７７９＿Ｐ２中の配列ＣＹＫＩＥＩＴＭＰＫＲＲＫＶＫＬＲＤと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ２０７７９＿Ｐ２のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ２０７７９＿Ｐ２はまた、表１１４２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ２０７７９＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質スタニオカルシン２前駆体と比較した変異タンパク質Ｒ２０７７９＿Ｐ２のグリコシル化部位を表１１４３に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ２０７７９＿Ｐ２は、以下の転写物によってコードされる：Ｒ２０７７９＿Ｔ７（配列は出願書類の最後に示す）。転写物Ｒ２０７７９＿Ｔ７のコード部分を太字で示し、このコード部分は１３９７位から開始され、１９５７位で終結する。転写物はまた、表１１４４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ２０７７９＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ２０７７９は、上の表２に列挙した２４個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿０は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１４５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２は、５５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿７は、６３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿９は、６６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１８は、６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２１は、１０６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２４は、１００個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２７は、２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２８は、３１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿３０は、３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿３１は、４６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿３２は、８８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１は、２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿３は、５２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１０を、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１１は、５８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１４は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１７は、５４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿１９を、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２０は、５３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２２は、７６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２３は、８１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２５を、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ２０７７９＿ｎｏｄｅ＿２９を、以下の転写物中に見出すことができる：Ｒ２０７７９＿Ｔ７。以下の表１１６８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: STC2_HUMAN

Sequence documentation:

Alignment of: R20779_P2 x STC2_HUMAN ..

Alignment segment 1/1:

Quality: 1688.00 Escore: 0
Matching length: 171 Total length: 171
Matching Percent Similarity: 99.42 Matching Percent Identity: 99.42
Total Percent Similarity: 99.42 Total Percent Identity: 99.42
Gaps: 0

Alignment:
. . . . .
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
. . . . .
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
. . . . .
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
. .
151 ENTRVIVEMIHFKDLLLHECY 171
||||||||||||||||||| |
151 ENTRVIVEMIHFKDLLLHEPY 171

クラスターＲ３８１４４の説明
クラスターＲ３８１４４は、目的の６つの転写物および２４個のセグメントを特徴とし、その名称を、それぞれ表１１６９および１１７０に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１１７１に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＣＴ３１＿ＨＵＭＡＮ、同義語ＥＣ３．２．１としても公知である）（配列番号１４５９）の変異型である。

タンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体の配列を、「推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１１７２に示す。

タンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体の局在化は、分泌と考えられる（可能性）。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである炭水化物代謝、Ｎ結合グリコシル化、分子機能に関連する注釈付けであるグリコシル結合に対して作用するマンノシル−オリゴサッカリド１，２−α−マンノシダーゼ、カルシウム結合、ヒドロラーゼ、細胞成分に関連する注釈付けである膜。

クラスターＲ３８１４４を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図４５のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４５および表１１７３中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍、肺悪性腫瘍、皮膚悪性腫瘍、および胃癌。

上記のように、クラスターＲ３８１４４は、上の表１に列挙した６つの転写物を特徴とする。これらの転写物は、タンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６によってコードされる。公知のタンパク質（推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６とＣＴ３１＿ＨＵＭＡＮとの間の比較の報告
１．ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜４１２に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のアミノ酸１〜４１２にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱＳＬＩＧＤＩＤＮＡＭＲＴＦＬＮＹＹＴＶＷＫＱＦＧＧＬＰＥＦＹＮＩＰＱＧＹＴＶＥＫＲＥＧＹＰＬＲＰＥＬＩＥＳＡＭＹＬＹＲＡＴＧＤＰＴＬＬＥＬＧＲＤＡＶＥＳＩＥＫＩＳＫＶＥＣＧＦＡＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のアミノ酸４１３〜４４９に対応する配列ＬＡＳＦＳＨＭＳＤＱＲＳＡＲＰＱＡＧＱＰＨＧＶＶＬＰＧＲＤＣＥＩＰＬＰＰＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６をコードする単離キメラポリペプチド。

２．Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６中の配列ＬＡＳＦＳＨＭＳＤＱＲＳＡＲＰＱＡＧＱＰＨＧＶＶＬＰＧＲＤＣＥＩＰＬＰＰＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６はまた、表１１７５に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体と比較した変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６のグリコシル化部位を表１１７６に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６は、以下の転写物によってコードされる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６のコード部分を太字で示し、このコード部分は９１位から開始され、１４３７位で終結する。転写物はまた、表１１７７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３によってコードされる。公知のタンパク質（推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３とＣＴ３１＿ＨＵＭＡＮとの間の比較の報告
１．ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜３２３に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のアミノ酸１〜３２３にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のアミノ酸３２４〜３４１に対応する配列ＮＬＬＫＡＱＣＴＳＴＶＰＲＧＩＰＰＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３をコードする単離キメラポリペプチド。

２．Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３中の配列ＮＬＬＫＡＱＣＴＳＴＶＰＲＧＩＰＰＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３はまた、表１１７８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体と比較した変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３のグリコシル化部位を表１１７９に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３は、以下の転写物によってコードされる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３（配列は出願書類の最後に示す）。転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３のコード部分を太字で示し、このコード部分は９１位から開始され、１１１３位で終結する。転写物はまた、表１１８０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５によってコードされる。公知のタンパク質（推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５とＣＴ３１＿ＨＵＭＡＮとの間の比較の報告
１．ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜２８２に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のアミノ酸１〜２８２にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のアミノ酸２８３〜２８７に対応する配列ＰＨＷＲＨを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５をコードする単離キメラポリペプチド。

２．Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５中の配列ＰＨＷＲＨと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５はまた、表１１８１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体と比較した変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５のグリコシル化部位を表１１８２に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５は、以下の転写物によってコードされる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５（配列は出願書類の最後に示す）。転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５のコード部分を太字で示し、このコード部分は９１位から開始され、９５１位で終結する。転写物はまた、表１１８３に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９によってコードされる。公知のタンパク質（推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９とＣＴ３１＿ＨＵＭＡＮとの間の比較の報告
１．ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜４１２に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のアミノ酸１〜４１２にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲＶＶＧＧＬＬＳＡＨＬＬＳＫＫＡＧＶＥＶＥＡＧＷＰＣＳＧＰＬＬＲＭＡＥＥＡＡＲＫＬＬＰＡＦＱＴＰＴＧＭＰＹＧＴＶＮＬＬＨＧＶＮＰＧＥＴＰＶＴＣＴＡＧＩＧＴＦＩＶＥＦＡＴＬＳＳＬＴＧＤＰＶＦＥＤＶＡＲＶＡＬＭＲＬＷＥＳＲＳＤＩＧＬＶＧＮＨＩＤＶＬＴＧＫＷＶＡＱＤＡＧＩＧＡＧＶＤＳＹＦＥＹＬＶＫＧＡＩＬＬＱＤＫＫＬＭＡＭＦＬＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱＳＬＩＧＤＩＤＮＡＭＲＴＦＬＮＹＹＴＶＷＫＱＦＧＧＬＰＥＦＹＮＩＰＱＧＹＴＶＥＫＲＥＧＹＰＬＲＰＥＬＩＥＳＡＭＹＬＹＲＡＴＧＤＰＴＬＬＥＬＧＲＤＡＶＥＳＩＥＫＩＳＫＶＥＣＧＦＡＴと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のアミノ酸４１３〜４３３に対応する配列ＫＲＳＲＳＶＡＱＡＧＶＱＷＣＤＨＤＳＰＱＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９をコードする単離キメラポリペプチド。

２．Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９中の配列ＫＲＳＲＳＶＡＱＡＧＶＱＷＣＤＨＤＳＰＱＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９はまた、表１１８４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体と比較した変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９のグリコシル化部位を表１１８５に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９は、以下の転写物によってコードされる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９（配列は出願書類の最後に示す）。転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９のコード部分を太字で示し、このコード部分は９１位から開始され、１３８９位で終結する。転写物はまた、表１１８６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ１９配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ２７によってコードされる。公知のタンパク質（推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４とＣＴ３１＿ＨＵＭＡＮとの間の比較の報告
１．ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜１２１に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４のアミノ酸１〜１２１にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲＥＲＶＫＡＭＦＹＨＡＹＤＳＹＬＥＮＡＦＰＦＤＥＬＲＰＬＴＣＤＧＨＤＴＷＧＳＦＳＬＴＬＩＤＡＬＤＴＬＬＩＬＧＮＶＳＥＦＱＲＶＶＥＶＬＱＤＳＶＤＦＤＩＤＶＮＡＳＶＦＥＴＮＩＲと少なくとも９０％相同な第１のアミノ酸配列と、ＣＴ３１＿ＨＵＭＡＮのアミノ酸２８２〜５７８に対応する配列ＥＹＮＫＡＩＲＮＹＴＲＦＤＤＷＹＬＷＶＱＭＹＫＧＴＶＳＭＰＶＦＱＳＬＥＡＹＷＰＧＬＱＳＬＩＧＤＩＤＮＡＭＲＴＦＬＮＹＹＴＶＷＫＱＦＧＧＬＰＥＦＹＮＩＰＱＧＹＴＶＥＫＲＥＧＹＰＬＲＰＥＬＩＥＳＡＭＹＬＹＲＡＴＧＤＰＴＬＬＥＬＧＲＤＡＶＥＳＩＥＫＩＳＫＶＥＣＧＦＡＴＩＫＤＬＲＤＨＫＬＤＮＲＭＥＳＦＦＬＡＥＴＶＫＹＬＹＬＬＦＤＰＴＮＦＩＨＮＮＧＳＴＦＤＡＶＩＴＰＹＧＥＣＩＬＧＡＧＧＹＩＦＮＴＥＡＨＰＩＤＰＡＡＬＨＣＣＱＲＬＫＥＥＱＷＥＶＥＤＬＭＲＥＦＹＳＬＫＲＳＲＳＫＦＱＫＮＴＶＳＳＧＰＷＥＰＰＡＲＰＧＴＬＦＳＰＥＮＨＤＱＡＲＥＲＫＰＡＫＱＫＶＰＬＬＳＣＰＳＱＰＦＴＳＫＬＡＬＬＧＱＶＦＬＤＳＳと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４をコードする単離キメラポリペプチド。

２．長さ「ｎ」（式中、ｎは、少なくとも約１０アミノ酸長、任意選択的に少なくとも約２０アミノ酸長、好ましくは少なくとも約３０アミノ酸長、より好ましくは少なくとも約４０アミノ酸長、最も好ましくは少なくとも約５０アミノ酸長である）を有し、少なくとも２つのアミノ酸がＲＥを含み、以下の構造：アミノ酸番号１２１−ｘ〜１２１のいずれかから始まり、アミノ酸番号１２２＋（（ｎ−２）−ｘ）（式中、ｘは０からｎ−２まで変化する）で終結する配列、を有する、ポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４の縁部分をコードする単離キメラポリペプチド。

変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４はまた、表１１８７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体と比較した変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４のグリコシル化部位を表１１８８に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４は、以下の転写物によってコードされる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ２７（配列は出願書類の最後に示す）。転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ２７のコード部分を太字で示し、このコード部分は９１位から開始され、１３４４位で終結する。転写物はまた、表１１８９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ２４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０によってコードされる。公知のタンパク質（推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体、配列番号１４５９）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６とＡＡＨ１６１８４（配列番号１４６０）との間の比較の報告
１．ＡＡＨ１６１８４のアミノ酸１〜３６に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸１〜３６にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸３７〜６０に対応する配列ＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチド。

２．Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６中の配列ＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のテールをコードする単離ポリペプチド。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６とＡＡＱ８８９４３（配列番号１４６１）との間の比較の報告
１．ＡＡＱ８８９４３のアミノ酸１〜３５に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸１〜３５にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸３６〜６０に対応する配列ＲＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチド。

２．Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６中の配列ＲＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のテールをコードする単離ポリペプチド。

Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６とＣＴ３１＿ＨＵＭＡＮとの間の比較の報告
１．ＣＴ３１＿ＨＵＭＡＮのアミノ酸１〜３６に対応し、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸１〜３６にも対応するＭＰＦＲＬＬＩＰＬＧＬＬＣＡＬＬＰＱＨＨＧＡＰＧＰＤＧＳＡＰＤＰＡＨＹＲと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のアミノ酸３７〜６０に対応する配列ＦＷＧＭＳＱＮＳＫＥＷＬＫＣＳＲＴＡＷＴＬＩＬＭを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６をコードする単離キメラポリペプチド。

変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６はまた、表１１９０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質推定α−マンノシダーゼＣ２０ｏｒｆ３１前駆体と比較した変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６のグリコシル化部位を表１１９１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６は、以下の転写物によってコードされる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０（配列は出願書類の最後に示す）。転写物Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０のコード部分を太字で示し、このコード部分は９１位から開始され、２７０位で終結する。転写物はまた、表１１９２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ３８１４４＿ＰＥＡ＿２＿Ｐ３６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ３８１４４は、上の表２に列挙した２４個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿２１は、１０８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１１９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿２６は、９８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１１９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿２９は、９８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１１９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿３１は、９５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１１９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４６は、１４７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１１９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４７は、１４７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１１９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４９は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１１９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿０は、１０１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿１は、１０５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４は、１０７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿５を、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２０４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿７は、９２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２０５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿１１は、１０６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２０６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿１４を、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１２０７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿１５は、１０５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１２０８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿１６は、１０６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１２０９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿１９は、９３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１２１０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿２０を、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１２１１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿３６は、９５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２１２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿３７は、９７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２１３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４３を、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６。以下の表１２１４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４４を、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６。以下の表１２１５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿４５を、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ６、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１０、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１３、Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１５、およびＲ３８１４４＿ＰＥＡ＿２＿Ｔ２７。以下の表１２１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ３８１４４＿ＰＥＡ＿２＿ｎｏｄｅ＿５１は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ３８１４４＿ＰＥＡ＿２＿Ｔ１９。以下の表１２１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P6 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4031.00 Escore: 0
Matching length: 413 Total length: 413
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.76
Total Percent Similarity: 100.00 Total Percent Identity: 99.76
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
.
401 EKISKVECGFATL 413
||||||||||||:
401 EKISKVECGFATI 413

Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P13 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 3167.00 Escore: 0
Matching length: 326 Total length: 326
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.39
Total Percent Similarity: 100.00 Total Percent Identity: 99.39
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. .
301 QMYKGTVSMPVFQSLEAYWPGLQNLL 326
|||||||||||||||||||||||:|:
301 QMYKGTVSMPVFQSLEAYWPGLQSLI 326

Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P15 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 2725.00 Escore: 0
Matching length: 282 Total length: 282
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282
||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282

Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P19 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4029.00 Escore: 0
Matching length: 412 Total length: 412
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
.
401 EKISKVECGFAT 412
||||||||||||
401 EKISKVECGFAT 412

Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P24 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4063.00 Escore: 0
Matching length: 418 Total length: 578
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 72.32 Total Percent Identity: 72.32
Gaps: 1

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIR............................. 121
|||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
121 .................................................. 121

151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
121 .................................................. 121

201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
122 ...............................EYNKAIRNYTRFDDWYLWV 140
|||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
141 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 190
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
191 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 240
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
. . . . .
241 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 290
||||||||||||||||||||||||||||||||||||||||||||||||||
401 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 450
. . . . .
291 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 340
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 500
. . . . .
341 LMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAK 390
||||||||||||||||||||||||||||||||||||||||||||||||||
501 LMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAK 550
. .
391 QKVPLLSCPSQPFTSKLALLGQVFLDSS 418
||||||||||||||||||||||||||||
551 QKVPLLSCPSQPFTSKLALLGQVFLDSS 578

Sequence name: AAH16184

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAH16184 ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36
||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36

Sequence name: AAQ88943

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAQ88943 ..

Alignment segment 1/1:

Quality: 362.00 Escore: 0
Matching length: 37 Total length: 37
Matching Percent Similarity: 97.30 Matching Percent Identity: 97.30
Total Percent Similarity: 97.30 Total Percent Identity: 97.30
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRF 37
||||||||||||||||||||||||||||||||||| |
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYSF 37

Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36
||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36

クラスターＨＵＭＯＳＴＲＯの説明
クラスターＨＵＭＯＳＴＲＯは、目的の３つの転写物および３０個のセグメントを特徴とし、その名称を、それぞれ表１２１８および１２１９に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１２２０に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるオステオポンチン前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＯＳＴＰ＿ＨＵＭＡＮ、同義語骨シアロタンパク質１、尿結石タンパク質、分泌性リンタンパク質１、ＳＰＰ−１、ネフロポンチン、ウロポンチンとしても公知である）（配列番号１４６２）の変異型である。

タンパク質オステオポンチン前駆体は、以下の機能を有することが公知であるか、そのように見なされている：石灰化基質の不可欠部分を形成するようである。おそらく、細胞−基質相互作用に重要である。インターフェロンγおよびインターロイキン−１２の産生の増強ならびにインターロイキン−１０産生の減少に関与するサイトカインとして作用し、Ｉ型免疫を生じる経路に不可欠である（類似性による）。タンパク質オステオポンチン前駆体の配列を、「オステオポンチン前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１２２１に示す。

タンパク質オステオポンチン前駆体の局在化は、分泌と考えられる。

以前に公知のタンパク質はまた、以下の適応症および／または潜在的治療用途を有する：再生（骨）。ヒトにおける臨床／治療用途（例えば、抗体または小分子の標的として、および／または直接的な治療として）が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である：骨形成刺激薬。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する（筋骨格）ために使用するか使用することができる薬物データベースまたは公的なデータベース（例えば、上記）に情報が存在するので、クラスターをこの分野に割り当てた。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである骨化、抗アポトーシス、炎症反応、細胞−基質接着、細胞−細胞シグナル伝達、分子機能に関連する注釈付けである防御／免疫タンパク質、サイトカイン、インテグリンリガンド、タンパク質結合、成長因子、アポトーシスインヒビター、および細胞成分に関連する注釈付けである細胞外基質。

クラスターＨＵＭＯＳＴＲＯを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図４６のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４６および表１２２２中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性腫瘍、悪性乳癌、卵巣癌、および皮膚悪性腫瘍。

上記のように、クラスターＨＵＭＯＳＴＲＯは、上の表１に列挙した３つの転写物を特徴とする。これらの転写物は、タンパク質オステオポンチン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４によってコードされる。公知のタンパク質（オステオポンチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１とＯＳＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＯＳＴＰ＿ＨＵＭＡＮのアミノ酸１〜５８に対応し、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のアミノ酸１〜５８にも対応するＭＲＩＡＶＩＣＦＣＬＬＧＩＴＣＡＩＰＶＫＱＡＤＳＧＳＳＥＥＫＱＬＹＮＫＹＰＤＡＶＡＴＷＬＮＰＤＰＳＱＫＱＮＬＬＡＰＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のアミノ酸５９〜６４に対応する配列ＶＦＬＮＦＳを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１をコードする単離キメラポリペプチド。

２．ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１中の配列ＶＦＬＮＦＳと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のテールをコードする単離ポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、公知のタンパク質局在化および／または遺伝子構造の手作業による調査によって、分泌と考えられる。

変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１はまた、表１２２４に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１のグリコシル化部位を表１２２５に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１は、以下の転写物によってコードされる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４（配列は出願書類の最後に示す）。転写物ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４のコード部分を太字で示し、このコード部分は１９９位から開始され、３９０位で終結する。転写物はまた、表１２２６に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２１配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６によってコードされる。公知のタンパク質（オステオポンチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５とＯＳＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＯＳＴＰ＿ＨＵＭＡＮのアミノ酸１〜３１に対応し、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５のアミノ酸１〜３１にも対応するＭＲＩＡＶＩＣＦＣＬＬＧＩＴＣＡＩＰＶＫＱＡＤＳＧＳＳＥＥＫＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５のアミノ酸３２〜３２に対応する配列Ｈを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５をコードする単離キメラポリペプチド。

変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５はまた、表１２２７に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５のグリコシル化部位を表１２２８に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５は、以下の転写物によってコードされる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６（配列は出願書類の最後に示す）。転写物ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６のコード部分を太字で示し、このコード部分は１９９位から開始され、２９４位で終結する。転写物はまた、表１２２９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ２５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０は、出願書類の最後に示すアミノ酸配列を有し、転写物ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０によってコードされる。公知のタンパク質（オステオポンチン前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０とＯＳＴＰ＿ＨＵＭＡＮとの間の比較の報告
１．ＯＳＴＰ＿ＨＵＭＡＮのアミノ酸１〜３１に対応し、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のアミノ酸１〜３１にも対応するＭＲＩＡＶＩＣＦＣＬＬＧＩＴＣＡＩＰＶＫＱＡＤＳＧＳＳＥＥＫＱと少なくとも９０％相同な第１のアミノ酸配列と、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のアミノ酸３２〜３９に対応する配列ＶＳＩＦＹＶＦＩを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１のアミノ酸配列および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０をコードする単離キメラポリペプチド。

２．ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０中の配列ＶＳＩＦＹＶＦＩと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のテールをコードする単離ポリペプチド。

変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０はまた、表１２３０に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０のグリコシル化部位を表１２３１に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０は、以下の転写物によってコードされる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０（配列は出願書類の最後に示す）。転写物ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０のコード部分を太字で示し、このコード部分は１９９位から開始され、３１５位で終結する。転写物はまた、表１２３２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｐ３０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨＵＭＯＳＴＲＯは、上の表２に列挙した３０個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、３３３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６、およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０。以下の表１２３３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２３５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４。以下の表１２３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、３３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２３７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、３５０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿４３は、１９２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２３９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３は、３５３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６、およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０。以下の表１２４０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、３５３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６、およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０。以下の表１２４１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、３５７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４、ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６、およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０。以下の表１２４２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ３０。以下の表１２４３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、３６６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２４４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿１７は、２６１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２４５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２０を、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、３１５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、３２２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、２７０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２６を、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、２６０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２８は、２７３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、２７２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３０を、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３２は、２９３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、３０１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、２９２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３７は、２９５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３８を、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２５９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿３９は、２６８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２６０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿４０を、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２６１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿４１を、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２６２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿ｎｏｄｅ＿４２は、２２４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：ＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１４およびＨＵＭＯＳＴＲＯ＿ＰＥＡ＿１＿ＰＥＡ＿１＿Ｔ１６。以下の表１２６３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P21 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 578.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50

51 KQNLLAPQ 58
||||||||
51 KQNLLAPQ 58

Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P25 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31

Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P30 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31

クラスターＲ１１７２３の説明
クラスターＲ１１７２３は、目的の６つの転写物および２６個のセグメントを特徴とし、その名称を、それぞれ表１２６４および１２６５に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１２６６に示す。

クラスターＲ１１７２３を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図４７のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図４７および表１２６７中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および腎臓悪性腫瘍。

上記のように、コンティグＲ１１７２３は、上の表１に列挙した６つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ２は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ６によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。

変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ２はまた、表１２６９に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ２は、以下の転写物によってコードされる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ６のコード部分を太字で示し、このコード部分は１７１６位から開始され、２０５１位で終結する。転写物はまた、表１２７０に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ２配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６とＱ８ＩＸＭ０（配列番号１７０７）との間の比較の報告
１．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜１１０に対応する配列ＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、Ｑ８ＩＸＭ０のアミノ酸１〜１１２に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１１１〜１２２にも対応するＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱと少なくとも９０％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６の配列ＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６の先端をコードする単離ポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６とＱ９６ＡＣ２（配列番号１７０８）との間の比較の報告
１．Ｑ９６ＡＣ２のアミノ酸１〜８３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜８３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸８４〜２２２に対応する配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６中の配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のテールをコードする単離ポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６とＱ８Ｎ２Ｇ４（配列番号１７０９）との間の比較の報告
１．Ｑ８Ｎ２Ｇ４のアミノ酸１〜８３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜８３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸８４〜２２２に対応する配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６とＢＡＣ８５５１８（配列番号１７１０）との間の比較の報告
１．ＢＡＣ８５５１８のアミノ酸２４〜１０６に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸１〜８３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧＩＭＹＲＫＳＣＡＳＳＡＡＣＬＩＡＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６のアミノ酸８４〜２２２に対応する配列ＳＰＣＲＧＬＡＰＧＲＥＥＱＲＡＬＨＫＡＧＡＶＧＧＧＶＲＭＹＡＱＡＬＬＶＶＧＶＬＱＲＱＡＡＡＱＨＬＨＥＨＰＰＫＬＬＲＧＨＲＶＱＥＲＶＤＤＲＡＥＶＥＫＲＬＲＥＧＥＥＤＨＶＲＰＥＶＧＰＲＰＶＶＬＧＦＧＲＳＨＤＰＰＮＬＶＧＨＰＡＹＧＱＣＨＮＮＱＰＷＡＤＴＳＲＲＥＲＱＲＫＥＫＨＳＭＲＴＱを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６をコードする単離キメラポリペプチド。

変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６はまた、表１２７１に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６は、以下の転写物によってコードされる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５（配列は出願書類の最後に示す）。転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５のコード部分を太字で示し、このコード部分は４３４位から開始され、１０９９位で終結する。転写物はまた、表１２７２に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ６配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７とＱ９６ＡＣ２との間の比較の報告
１．Ｑ９６ＡＣ２のアミノ酸１〜６４に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜６４にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７中の配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７とＱ８Ｎ２Ｇ４との間の比較の報告
１．Ｑ８Ｎ２Ｇ４のアミノ酸１〜６４に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜６４にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７とＢＡＣ８５２７３との間の比較の報告
１．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜５に対応する配列ＭＷＶＬＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＡＣ８５２７３のアミノ酸２２〜８０に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６〜６４にも対応するＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７の配列ＭＷＶＬＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７の先端をコードする単離ポリペプチド。

３．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７中の配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７とＢＡＣ８５５１８との間の比較の報告
１．ＢＡＣ８５５１８のアミノ酸２４〜８７に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜６４にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７のアミノ酸６５〜９３に対応する配列ＳＨＣＶＴＲＬＥＣＳＧＴＩＳＡＨＣＮＬＣＬＰＧＳＮＤＨＰＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７はまた、表１２７３に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７は、以下の転写物によってコードされる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７（配列は出願書類の最後に示す）。転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７のコード部分を太字で示し、このコード部分は４３４位から開始され、７１２位で終結する。転写物はまた、表１２７４に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３とＱ９６ＡＣ２との間の比較の報告
１．Ｑ９６ＡＣ２のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のアミノ酸６４〜８４に対応する配列ＤＴＫＲＴＮＴＬＬＦＥＭＲＨＦＡＫＱＬＴＴを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３中の配列ＤＴＫＲＴＮＴＬＬＦＥＭＲＨＦＡＫＱＬＴＴと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のテールをコードする単離ポリペプチド。

変異タンパク質、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３は、以下の転写物によってコードされる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ５（配列は出願書類の最後に示す）。転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９のコード部分を太字で示し、このコード部分は４３４位から開始され、６８５位で終結する。転写物はまた、表１２７５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０によってコードされる。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０とＱ９６ＡＣ２との間の比較の報告
１．Ｑ９６ＡＣ２のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０中の配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０とＱ８Ｎ２Ｇ４との間の比較の報告
１．Ｑ８Ｎ２Ｇ４のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０とＢＡＣ８５２７３との間の比較の報告
１．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜５に対応する配列ＭＷＶＬＧを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第１のアミノ酸配列と、ＢＡＣ８５２７３のアミノ酸２２〜７９に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６〜６３にも対応するＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

２．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０の配列ＭＷＶＬＧと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０の先端をコードする単離ポリペプチド。

３．Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０中の配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のテールをコードする単離ポリペプチド。

Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０とＢＡＣ８５５１８との間の比較の報告
１．ＢＡＣ８５５１８のアミノ酸２４〜８６に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０のアミノ酸６４〜９０に対応する配列ＤＲＶＳＬＣＨＥＡＧＶＱＷＮＮＦＳＴＬＱＰＬＰＰＲＬＫを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配が、隣接し、且つ連続した順序にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０をコードする単離キメラポリペプチド。

変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０はまた、表１２７６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０は、以下の転写物によってコードされる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０（配列は出願書類の最後に示す）。転写物Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０のコード部分を太字で示し、このコード部分は４３４位から開始され、７０３位で終結する。転写物はまた、表１２７７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１０配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ１１７２３は、上の表２に列挙した２６個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１３は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２７８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１６は、３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ２０。以下の表１２７９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、４５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、６５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、７０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８３は、各転写物上のこのセグメントの開始位置および終結位置を記載する（これらの転写物が別のポリアデニル化を示すことに留意すべきである）。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１０は、３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、４２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１５を、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０。以下の表１２８６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１８は、４０個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２０を、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２１は、３６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２８９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２３は、３９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、５１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、５４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、６２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２８を、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、６９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿３を、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿３０を、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１２９９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、２６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１３００は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１３０１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿７は、２９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１５、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１７、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ１９、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ２０、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５、およびＲ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１３０２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿８は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ６。以下の表１３０３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8IXM0

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8IXM0 ..

Alignment segment 1/1:

Quality: 1128.00 Escore: 0
Matching length: 112 Total length: 112
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
111 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 160
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 50
. . . . .
161 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 210
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 100
.
211 RQRKEKHSMRTQ 222
||||||||||||
101 RQRKEKHSMRTQ 112

Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q96AC2 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83

Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83

Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x BAC85518 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
74 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 106

Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q96AC2 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64

Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64

Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85273 ..

Alignment segment 1/1:

Quality: 600.00 Escore: 0
Matching length: 59 Total length: 59
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSAG 64
|||||||||
72 KEVMEQSAG 80

Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85518 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
74 QDMCQKEVMEQSAG 87

Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63

Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63

Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85273 ..

Alignment segment 1/1:

Quality: 591.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSA 63
||||||||
72 KEVMEQSA 79

Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85518 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSA 63
|||||||||||||
74 QDMCQKEVMEQSA 86

Alignment of: R11723_PEA_1_P13 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63

公知のタンパク質（ＰＳＥＣ、本明細書中で「野生型」またはＷＴタンパク質とも呼ばれる）のヌクレオチド転写物配列が少なくとも１つのＳＮＰを特徴とし、これが、一定のサイレントＳＮＰに加えて、コード領域に影響を与えるようであることに留意すべきである。このＳＮＰは、Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５スプライスバリアント配列（「Ｇ−＞」）に影響を与えず、ヌクレオチドを失わせる（９１位以降のアミノ酸に影響を与える）。失われたヌクレオチドによってフレームシフトが起こり、新規のタンパク質が産生される。このＳＮＰは、以前に同定されておらず、このエクソン中の約７０ＥＳＴのうちの５ＥＳＴによって支持される。

このクラスターの変異型は、仮説上のタンパク質ＰＳＥＣ０１８１の変異型（本明細書中で、「ＰＳＥＣ」と呼ばれる）であることに留意すべきである。さらに、肺癌検出のための単独またはこのクラスターおよび／または任意の他のクラスターおよび／または任意の公知のマーカーの１つまたは複数の変異型と組み合わせた公知のタンパク質（ＷＴタンパク質）の使用は、本発明の実施形態を含む。

正常および癌性肺組織における配列名Ｒ１１７２３ｓｅｇ１３中に示すアンプリコンによって検出可能なＲ１１７２３転写物の発現
Ｒ１１７２３ｓｅｇ１３、Ｒ１１７２３ｓｅｇ１３アンプリコン（配列番号１６８４）ならびにＲ１１７２３ｓｅｇ１３Ｆ（配列番号１６８２）およびＲ１１７２３ｓｅｇ１３Ｒ（配列番号１６８３）プライマーによって検出可能な転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）、およびユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図４８は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の過剰発現を示すヒストグラムである。総試験サンプル数のうちの少なくとも５倍の過剰発現を示すサンプルの数および比率を、下に示す。

図４８から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも高かった。明白には、１５個の腺癌サンプルのうちの１０個および８個の小細胞癌サンプルのうちの４個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｒ１１７２３ｓｅｇ１３Ｆ順方向プライマーおよびＲ１１７２３ｓｅｇ１３Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｒ１１７２３ｓｅｇ１３。

Ｒ１１７２３ｓｅｇ１３Ｆ（配列番号１６８２）−ＡＣＡＣＴＡＡＡＡＧＡＡＣＡＡＡＣＡＣＣＴＴＧＣＴＣ
Ｒ１１７２３ｓｅｇ１３Ｒ（配列番号１６８３）−ＴＣＣＴＣＡＧＡＡＧＧＣＡＣＡＴＧＡＡＡＧＡ
Ｒ１１７２３ｓｅｇ１３–アンプリコン（配列番号１６８４）：
ＡＣＡＣＴＡＡＡＡＧＡＡＣＡＡＡＣＡＣＣＴＴＧＣＴＣＴＴＣＧＡＧＡＴＧＡＧＡＣＡＴＴＴＴＧＣＣＡＡＧＣＡＧＴＴＧＡＣＣＡＣＴＴＡＧＴＴＣＴＣＡＡＧＡＡＧＣＡＡＣＴＡＴＣＴＣＴＴＴＣＡＴＧＴＧＣＣＴＴＣＴＧＡＧＧＡ

異なる正常組織における配列名Ｒ１１７２３ｓｅｇ１３中に示すアンプリコンによって検出可能なＲ１１７２３転写物の発現
Ｒ１１７２３ｓｅｇ１３アンプリコン（配列番号１６８４）ならびにＲ１１７２３ｓｅｇ１３Ｆ（配列番号１６８２）およびＲ１１７２３ｓｅｇ１３Ｒ（配列番号１６８３）によって検出可能なＲ１１７２３転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、卵巣サンプル（上記のサンプル番号１８〜２０、表２、「正常パネル中の組織サンプル」）の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現の値を得た。

結果を図４９に示し、これは、異なる正常組織における配列名Ｒ１１７２３ｓｅｇ１３中に示されるアンプリコンによって検出可能なＲ１１７２３転写物の発現を示す。

正常および癌性肺組織における配列名Ｒ１１７２３ｊｕｎｃ１１−１８中に示すアンプリコンによって検出可能なＲ１１７２３転写物の発現
ｊｕｎｃ１１−１８、Ｒ１１７２３ｊｕｎｃ１１−１８アンプリコン（配列番号１６８７）ならびにＲ１１７２３ｊｕｎｃ１１−１８Ｆ（配列番号１６８５）およびＲ１１７２３ｊｕｎｃ１１−１８Ｒ（配列番号１６８６）プライマーによって検出可能な転写物の発現を、実時間ＰＣＲによって測定した（この連結点は、本明細書中でＰＳＥＣ配列とも呼ばれる公知のタンパク質配列または「野生型」（ＷＴ）配列中に見出される）。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）、およびユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「肺癌試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５０は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の過剰発現を示すヒストグラムである。値は、２連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。

図５０から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な転写物の発現は、非癌性サンプル（サンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「肺癌試験パネル中の組織サンプル」）よりも高かった。明白には、１５個の腺癌サンプルのうちの１１個、１６個の扁平上皮細胞癌サンプルのうちの４個、４個の大細胞癌サンプルのうちの１個、８個の小細胞癌サンプルのうちの５個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｒ１１７２３ｊｕｎｃ１１−１８Ｆ順方向プライマーおよびＲ１１７２３ｊｕｎｃ１１−１８Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｒ１１７２３ｊｕｎｃ１１−１８。

Ｒ１１７２３ｊｕｎｃ１１−１８Ｆ（配列番号１６８５）–ＡＧＴＧＡＴＧＧＡＧＣＡＡＡＧＴＧＣＣＧ
Ｒ１１７２３ｊｕｎｃ１１−１８Ｒ（配列番号１６８６）−ＣＡＧＣＡＧＣＴＧＡＴＧＣＡＡＡＣＴＧＡＧ
Ｒ１１７２３ｊｕｎｃ１１−１８–アンプリコン（配列番号１６８７）
ＡＧＴＧＡＴＧＧＡＧＣＡＡＡＧＴＧＣＣＧＧＧＡＴＣＡＴＧＴＡＣＣＧＣＡＡＧＴＣＣＴＧＴＧＣＡＴＣＡＴＣＡＧＣＧＧＣＣＴＧＴＣＴＣＡＴＣＧＣＣＴＣＴＧＣＣＧＧＧＴＡＣＣＡＧＴＣＣＴＴＣＴＧＣＴＣＣＣＣＡＧＧＧＡＡＡＣＴＧＡＡＣＴＣＡＧＴＴＴＧＣＡＴＣＡＧＣＴＧＣＴＧ

異なる正常組織における配列名Ｒ１１７２３ｊｕｎｃ１１−１８中に示すアンプリコンによって検出可能なＲ１１７２３転写物の発現
Ｒ１１７２３ｓｅｇ１３アンプリコン（配列番号１６８７）ならびにＲ１１７２３ｊｕｎｃ１１−１８Ｆ（配列番号１６８５）およびＲ１１７２３ｊｕｎｃ１１−１８Ｒ（配列番号１６８６）によって検出可能なＲ１１７２３転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、卵巣サンプル（上記のサンプル番号１８〜２０、表３）の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現の値を得た。

結果を図７３に示し、これは、異なる正常組織における配列名Ｒ１１７２３ｊｕｎｃ１１−１８中に示すアンプリコンによって検出可能なＲ１１７２３転写物の発現を示す。

この変異型のクローニング
全長の検証
ＲＮＡの調製
ヒト成体乳頭腺癌卵巣ＲＮＡプール（ロット番号ＩＬＳ１４０８）を、ＡＢＳ（ｈｔｔｐ：／／ｗｗｗ．ａｂｓｂｉｏｒｅａｇｅｎｔｓ，Ｗｉｌｍｉｎｇｔｏｎ，ＤＥ１９８０１，ＵＳＡｃｏｍ）から得た。総ＲＮＡサンプルを、ＤＮａｓｅＩ（Ａｍｂｉｏｎカタログ番号１９０６）を使用して処理した。

ＲＴＰＣＲ
ＲＴの調製
精製ＲＮＡ（１μｇ）を、１５０ｎｇＲａｎｄｏｍＨｅｘａｍｅｒプライマー（Ｉｎｖｉｔｒｏｇｅｎカタログ番号４８１９０−０１１）および５００μＭｄＮＴＰ（Ｔａｋａｒａ、カタログ番号Ｂ９５０１−１）と、全量が１５．６μｌのＤＥＰＣ−Ｈ_２Ｏ（ＢｅｉｔＨａｅｍｅｋ、カタログ番号０１−８５２−１Ａ）中で混合した。混合物を、６５℃で５分間インキュベートし、氷上で急速に冷却した。その後、５μｌの５×ＳｕｐｅｒｓｃｒｉｐｔＩＩｆｉｒｓｔｓｔｒａｎｄ緩衝液（Ｉｎｖｉｔｒｏｇｅｎ、カタログ番号Ｙ００１４６）、２．４μｌ０．１ＭＤＴＴ（Ｉｎｖｉｔｒｏｇｅｎ、カタログ番号Ｙ００１４７）、および４０単位のＲＮａｓｉｎ（Ｐｒｏｍｅｇａ、カタログ番号Ｎ２５１Ａ）を添加し、混合物を４２℃で２分間インキュベートした。その後、１μｌ（２００単位）のＳｕｐｅｒｓｃｒｉｐｔＩＩ（Ｉｎｖｉｔｒｏｇｅｎ、カタログ番号１８０６４−０２２）を添加し、反応物を４２℃で５０分間インキュベートし、その後、７０℃で１５分間インキュベートした。得られたｃＤＮＡを、ＴＥ緩衝液（１０ｍＭＴｒｉｓ（ｐＨ=８）、１ｍＭＥＤＴＡ（ｐＨ=８）で２０倍に希釈した。

ＰＣＲ増幅および分析
上記のように調製したｃＤＮＡ（５μｌ）を、ＰＣＲ反応のテンプレートとして使用した。以下のの条件下でＡｃｃｕＰｏｗｅｒＰＣＲＰｒｅＭｉｘ（Ｂｉｏｎｅｅｒ，Ｋｏｒｅａ、カタログ番号Ｋ２０１６）を使用して増幅を行った。１μｌの以下ののプライマー（１０μＭ）：
ＰＳＥＣｆｏｒ−ＴＧＣＴＧＴＣＧＣＣＴＣＣＴＣＴＧＡＴＧ
ＰＳＥＣｒｅｖ−ＣＣＴＣＡＧＡＡＧＧＣＡＣＡＴＧＡＡＡＧ
＋１３μｌ–Ｈ_２Ｏを、ＡｃｃｕＰｏｗｅｒＰＣＲＰｒｅＭｉｘチューブに添加し、以下の反応プログラムを使用した：９４℃で５分間、（９４℃で３０秒間、５２℃で３０秒間、７２℃で４０秒間）を３５サイクル、７２℃で１０分間。ＰＣＲ増幅の完了後、産物を、臭化エチジウムで染色し、ＵＶ光で視覚化したアガロースゲルを分析した。ＰＣＲ産物を、ＱｉａＱｕｉｃｋ（商標）ゲル抽出キット（Ｑｉａｇｅｎ（商標）、カタログ番号２８７０６）を使用してゲルから抽出した。抽出したＤＮＡ産物（図７９）を、上記の遺伝子特異的プライマー（Ｈｙ−Ｌａｂｓ，Ｉｓｒａｅｌ）を使用した直接的配列決定によって配列決定し、ＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５の推定配列を得た（図８０）。

図７９に示すように、推定ＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５が実際に成体乳頭腺腫卵巣ヒト組織中で天然に発現されたと結論づけた。

細菌発現ベクターでのＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５のクローニング
ＰＳＥＣスプライスバリアントＲ１１７２３＿ＰＥＡ＿１Ｔ５コード配列を、以下の条件下でテンプレートとしての上記のフラグメントおよびＰｌａｔｉｎｕｍＰｆｘＤＮＡポリメラーゼ（Ｉｎｖｉｔｒｏｇｅｎカタログ番号１１７０８０２１）を使用したＰＣＲ増幅のために調製した：全反応量が５０μｌの５ μｌ–ＡｍｐｌｉｆｉｃａｔｉｏｎＸ１０緩衝液（Ｉｎｖｉｔｒｏｇｅｎカタログ番号１１７０８０２１）；２μｌ–上記のＰＣＲ産物；１μｌ–ｄＮＴＰ（各１０ｍＭ）；１μｌＭｇＳＯ４（５０ｍＭ）、５μｌエンハンサー溶液（Ｉｎｖｉｔｒｏｇｅｎカタログ番号１１７０８０２１）；３３μｌ–Ｈ２Ｏ；１μｌの各プライマー（１０μＭ）、および１．２５単位のＴａｑポリメラーゼ（ＰｌａｔｉｎｕｍＰｆｘＤＮＡポリメラーゼ（Ｉｎｖｉｔｒｏｇｅｎカタログ番号１１７０８０２１））を、９４℃で３分間、（９４で３０秒間、５８℃で３０秒間、６８℃で４０秒間）を２９サイクル、６８℃で７分間の反応プログラムに供する。下記のプライマーは、スプライスバリアントに対応するヌクレオチド配列の特異的配列およびＮｈｅＩおよびＨｉｎｄＩＩＩ制限部位を含む。

ＰＳＥＣＮｈｅＩｆｏｒ− ＡＴＡＧＣＴＡＧＣＡＴＧＴＧＧＧＴＣＣＴＡＧＧＣＡＴＣＧＣＧＧ
ＰＳＥＣＨｉｎｄＩＩＩｒｅｖ− ＣＣＣＡＡＧＣＴＴＣＴＡＡＧＴＧＧＴＣＡＡＣＴＧＣＴＴＧＧＣ

次いで、ＰＣＲ産物を、ＮｈｅＩおよびＨｉｎｄＩＩＩ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ（ＵＫ）ＬＴＤ）で二重に消化し（図８１）、Ｎ末端６Ｈｉｓタグに対してインフレームで上記酵素で事前に消化したｐＲＳＥＴ−Ａ（Ｉｎｖｉｔｒｏｇｅｎ、カタログ番号Ｖ３５１−２０）に挿入して、ＨｉｓＰＳＥＣＴ５ｐＲＳＥＴを得た（図８２）。コード配列は、Ｎ末端に６Ｈｉｓ（６Ｈｉｓ残基はタンパク質の片端に連続している）タグを有し、ｐＲＳＥＴベクターによってコードされる８つのさらなるアミノ酸を有するタンパク質をコードする。

最終プラスミド中のＰＳＥＣインサートおよびその隣接領域の配列を、配列決定によって検証し、所望の配列と同一であることが見出された。配列決定された領域を含むＨｉｓＰＳＥＣＴ５ｐＲＥＳＴＡの完全な配列を、図８４に示す。

図８３は、ＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５の翻訳配列を示す。

細菌培養およびタンパク質発現の誘導
ＨｉｓＰＳＥＣｐＲＳＥＴＡＤＮＡを、完全なＤＨ５ａ細胞（Ｉｎｖｉｔｒｏｇｅｎカタログ番号１８２５８−０１２）に形質転換した。アンピシリン耐性形質転換体をスクリーニングし、陽性クローンを、制限酵素消化および配列の検証によってさらに分析した。

組換えタンパク質を発現するために、ＨｉｓＰＳＥＣｐＲＳＥＴＡＤＮＡを、コンピテントＢＬ２１Ｇｏｌｄ細胞（Ｓｔｒａｔａｇｅｎｅカタログ番号２３０１３４）およびＢＬ２１ｓｔａｒ（Ｉｎｖｉｔｒｏｇｅｎカタログ番号４４−００５４）にさらに形質転換した。アンピシリン耐性形質転換体をスクリーニングし、陽性クローンを選択した。

ＨｉｓＰＳＥＣＴ５ｐＲＳＥＴベクターおよび空のｐＲＳＥＴベクター（負のコントロールとして）を含む細菌細胞を、アンピシリン（５０μｇ／ｍｌ）およびクロラムフェニコール（３４μｇ／ｍｌ）を補足したＬＢ培地中で、Ｏ．Ｄ．６００ｎｍが０．５５に達するまで成長させた。約３時間でこの値に達した。１ｍＭＩＰＴＧ（Ｒｏｃｈｅ、カタログ番号７２４８１５）を添加し、細胞を、３７℃で一晩成長させた。ゲル分析のために、０時間、インキュベーション３時間後、および一晩インキュベーション後に１ｍｌアリコートの各培養物を取り出した（それぞれ、Ｔ０、Ｔ３、およびＴＯ／Ｎ）。

発現の結果
ＢＬ２１Ｇｏｌｄ中のＰＳＥＣの少量発現の経時変化を、図８５に示す。適切な分子量（９．２ｋＤａ）の組換えタンパク質の発現を、抗Ｈｉｓ抗体（ＢＤＣｌｏｎｔｅｃｈ，Ｒｅｆ６３１２１２、図８５）を使用するが、クーマシー染色によらないウェスタンブロットによって視覚化した（データ示さず）。同様にＢＬ２１ｓｔａｒを使用して類似の発現パターンが得られた（データ示さず）。

これらの結果は、ＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５によってコードされるタンパク質が細菌細胞中で実際に発現されることを示す。

クラスターＲ１６２７６の説明
クラスターＲ１６２７６は、目的の１つの転写物および５個のセグメントを特徴とし、その名称を、それぞれ表１３０５および１３０６に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表１３０７に示す。

これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるＮＯＶタンパク質ホモログ前駆体（ＳｗｉｓｓＰｒｏｔアクセッション識別子ＮＯＶ＿ＨＵＭＡＮ、同義語ＮｏｖＨ、腎芽腫過剰発現遺伝子タンパク質ホモログとしても公知である）（配列番号１４６３）の変異型である。

タンパク質ＮＯＶタンパク質ホモログ前駆体は、以下の機能を有することが公知であるか、そのように見なされている：細胞成長の制御で役割を果たす可能性が高い即時型タンパク質（類似性による）。タンパク質ＮＯＶタンパク質ホモログ前駆体の配列を、「ＮＯＶタンパク質ホモログ前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表１３０８に示す。

タンパク質ＮＯＶタンパク質ホモログ前駆体の局在化は、分泌と考えられる。

以下のＧＯ注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された：生物学的過程に関連する注釈付けである細胞成長の制御、分子機能に関連する注釈付けであるインスリン様成長因子結合、成長因子、および細胞成分に関連する注釈付けである細胞外。

クラスターＲ１６２７６を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図５１のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図５１および表１３０９中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：悪性肺腫瘍。

上記のように、クラスターＲ１６２７６は、上の表１に列挙した１つの転写物を特徴とする。これらの転写物は、タンパク質ＮＯＶタンパク質ホモログ前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６によってコードされる。公知のタンパク質（ＮＯＶタンパク質ホモログ前駆体）に対するアラインメントを、出願書類の最後に示す。１つまたは複数の以前に公開したタンパク質配列に対する１つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。

Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７とＮＯＶ＿ＨＵＭＡＮとの間の比較の報告
１．ＮＯＶ＿ＨＵＭＡＮのアミノ酸１〜４１に対応し、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸１〜４１にも対応するＭＱＳＶＱＳＴＳＦＣＬＲＫＱＣＬＣＬＴＦＬＬＬＨＬＬＧＱＶＡＡＴＱＲＣＰＰＱＣＰＧと少なくとも９０％相同な第１のアミノ酸配列と、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸４２に対応する架橋アミノ酸Ｑと、ＮＯＶ＿ＨＵＭＡＮのアミノ酸４３〜１０３に対応し、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸４３〜１０３にも対応するＣＰＡＴＰＰＴＣＡＰＧＶＲＡＶＬＤＧＣＳＣＣＬＶＣＡＲＱＲＧＥＳＣＳＤＬＥＰＣＤＥＳＳＧＬＹＣＤＲＳＡＤＰＳＮＱＴＧＩＣＴと少なくとも９０％相同な第２のアミノ酸配列と、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のアミノ酸１０４〜１１１に対応する配列ＧＮＰＡＰＳＡＶを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第３のアミノ酸配列とを含み、前記第１のアミノ酸配列、架橋アミノ酸、第２のアミノ酸配列、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７をコードする単離キメラポリペプチド。

２．Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７中の配列ＧＮＰＡＰＳＡＶと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のテールをコードする単離ポリペプチド。

変異タンパク質Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７はまた、表１３１２に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

公知のタンパク質ＮＯＶタンパク質ホモログ前駆体と比較した変異タンパク質Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７のグリコシル化部位を表１３１４に示す（第１のカラム中にアミノ酸配列上のその位置を示し、第２のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す）。

変異タンパク質、Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７は、以下の転写物によってコードされる：Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６（配列は出願書類の最後に示す）。転写物Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６のコード部分を太字で示し、このコード部分は４４５位から開始され、７７７位で終結する。転写物はまた、表１３１５に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｒ１６２７６＿ＰＥＡ＿１＿Ｐ７配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＲ１６２７６は、上の表２に列挙した５個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＲ１６２７６＿ＰＥＡ＿１＿ｎｏｄｅ＿０は、３５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６。以下の表１３１６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１６２７６＿ＰＥＡ＿１＿ｎｏｄｅ＿６は、２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６。以下の表１３１７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１６２７６＿ＰＥＡ＿１＿ｎｏｄｅ＿１は、３７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６。以下の表１３１８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１６２７６＿ＰＥＡ＿１＿ｎｏｄｅ＿４は、３８個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６。以下の表１３１９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＲ１６２７６＿ＰＥＡ＿１＿ｎｏｄｅ＿５は、３７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｒ１６２７６＿ＰＥＡ＿１＿Ｔ６。以下の表１３２０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: NOV_HUMAN

Sequence documentation:

Alignment of: R16276_PEA_1_P7 x NOV_HUMAN ..

Alignment segment 1/1:

Quality: 1042.00 Escore: 0
Matching length: 103 Total length: 103
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.03
Total Percent Similarity: 100.00 Total Percent Identity: 99.03
Gaps: 0

Alignment:
. . . . .
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGQCPATPPTC 50
|||||||||||||||||||||||||||||||||||||||||:||||||||
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGRCPATPPTC 50
. . . . .
51 APGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTG 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 APGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTG 100

101 ICT 103
|||
101 ICT 103

正常および癌性肺組織における６つの配列Ｈ６１７７５ｓｅｇ８、ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７、Ｍ８５４９１Ｓｅｇ２４、Ｚ２１３６８ｊｕｎｃ１７−２１、ＨＳＳＴＲＯＬ３ｓｅｇ２４、およびＺ２５２９９ｓｅｇ２０の組み合わせ発現
Ｈ６１７７５ｓｅｇ８（配列番号１６３６）、ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７（配列番号１６４８）、Ｍ８５４９１Ｓｅｇ２４（配列番号１６３９）、Ｚ２１３６８ｊｕｎｃ１７−２１（配列番号１６４２）、ＨＳＳＴＲＯＬ３ｓｅｇ２４（配列番号１６７５）、およびＺ２５２９９ｓｅｇ２０アンプリコン（配列番号１６６９）ならびにＨ６１７７５ｓｅｇ８Ｆ２（配列番号１６３４）、Ｈ６１７７５ｓｅｇ８Ｒ２（配列番号１６３５）、ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｆ（配列番号１６４６）、ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７Ｒ（配列番号１６４７）、Ｍ８５４９１Ｓｅｇ２４Ｆ（配列番号１６３７）、Ｍ８５４９１Ｓｅｇ２４Ｒ（配列番号１６３８）、Ｚ２１３６８ｊｕｎｃ１７−２１Ｆ（配列番号１６４０）、Ｚ２１３６８ｊｕｎｃ１７−２１Ｒ（配列番号１６４１）、ＨＳＳＴＲＯＬ３ｓｅｇ２４Ｆ（配列番号１６７３）、ＨＳＳＴＲＯＬ３ｓｅｇ２４Ｒ（配列番号１６７４）、Ｚ２５２９９ｓｅｇ２０Ｆ（配列番号１６６７）、Ｚ２５２９９ｓｅｇ２０Ｒ（配列番号１６６８）プライマーによって検出可能な免疫グロブリンスーパーファミリーメンバー９、ガストリン放出ペプチド、ＥｐｈｒｉｎＢ型受容体２前駆体、ＳＵＬ１＿ＨＵＭＡＮ、ストロメリシン−３前駆体（ＥＣ３．４．２４．−）（マトリクス金属プロテイナーゼ−１１）（ＭＭＰ−１１）（ＳＴ３）（ＳＬ−３）、および分泌性白血球プロテイナーゼインヒビターである酸安定性プロテイナーゼインヒビター転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）、の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各アンプリコンの各ＲＴサンプルの正規化した量を、同一アンプリコンについて検出された正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。Ｚ２５２９９ｓｅｇ２０（配列番号１６６９）についてのこの比の逆数を計算して、正常なＰＭサンプルの中央値に対する各サンプルの下方制御の倍率を得た。

図５２〜５３は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の差分発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも１つの配列の少なくとも５倍の差分発現を示すサンプルの数および比率を、下に示す。

図５２〜５３から明らかなように、１５個の腺癌サンプルのうちの１５個、１６個の扁平上皮細胞癌サンプルのうちの１４個、４個の大細胞癌サンプルのうちの４個、８個の小細胞癌サンプルのうちの８個の少なくとも１つの配列で少なくとも５倍の差分発現が見出された。

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。少なくとも１つのアンプリコンの５倍差分制御の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、腺癌で７．８２Ｅ−０６、扁平上皮細胞癌で２．６３Ｅ−０４、大細胞癌で８．２４Ｅ−０３、小細胞癌で３．５７Ｅ−０４であった。

上記値は、結果が統計的に有意であることを示す。

クラスターＨ５３６２６の説明
クラスターＨ５３６２６は、目的の２つの転写物および２０個のセグメントを特徴とし、その名称を、それぞれ表１３２１および１３２２に示し、配列自体を、出願書類の最後に示す。

クラスターＨ５３６２６を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および以下の図７６のｙ軸上の数は、「ｐｐｍ」として各カテゴリーにおけるＥＳＴの重みを付けた発現をいう（ｐｐｍによるこのカテゴリーにおける特定のクラスターのＥＳＴの発現と全ＥＳＴの発現との比）。

概して、図７６および表１３２４中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した（少なくとも最小レベルで）：上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および筋肉腫。

上記のように、コンティグＨ５３６２６は、上の表１３２１に列挙した２つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。

本発明の変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５によってコードされる。野生型タンパク質に対するアラインメントを、出願書類の最後に示す。本発明の変異タンパク質と野生型タンパク質との関係の簡単な説明は以下である。

Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４と野生型Ｑ８Ｎ４４１（配列番号１６９９）との間の比較の報告
１．Ｑ８Ｎ４４１のアミノ酸１〜３５７に対応し、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４のアミノ酸１〜３５７にも対応するＭＴＰＳＰＬＬＬＬＬＬＰＰＬＬＬＧＡＦＰＰＡＡＡＡＲＧＰＰＫＭＡＤＫＶＶＰＲＱＶＡＲＬＧＲＴＶＲＬＱＣＰＶＥＧＤＰＰＰＬＴＭＷＴＫＤＧＲＴＩＨＳＧＷＳＲＦＲＶＬＰＱＧＬＫＶＫＱＶＥＲＥＤＡＧＶＹＶＣＫＡＴＮＧＦＧＳＬＳＶＮＹＴＬＶＶＬＤＤＩＳＰＧＫＥＳＬＧＰＤＳＳＳＧＧＱＥＤＰＡＳＱＱＷＡＲＰＲＦＴＱＰＳＫＭＲＲＲＶＩＡＲＰＶＧＳＳＶＲＬＫＣＶＡＳＧＨＰＲＰＤＩＴＷＭＫＤＤＱＡＬＴＲＰＥＡＡＥＰＲＫＫＫＷＴＬＳＬＫＮＬＲＰＥＤＳＧＫＹＴＣＲＶＳＮＲＡＧＡＩＮＡＴＹＫＶＤＶＩＱＲＴＲＳＫＰＶＬＴＧＴＨＰＶＮＴＴＶＤＦＧＧＴＴＳＦＱＣＫＶＲＳＤＶＫＰＶＩＱＷＬＫＲＶＥＹＧＡＥＧＲＨＮＳＴＩＤＶＧＧＱＫＦＶＶＬＰＴＧＤＶＷＳＲＰＤＧＳＹＬＮＫＬＬＩＴＲＡＲＱＤＤＡＧＭＹＩＣＬＧＡＮＴＭＧＹＳＦＲＳＡＦＬＴＶＬＰと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４のアミノ酸３５８〜４３７に対応する配列ＧＡＲＬＰＲＨＡＴＰＣＷＣＰＤＰＰＰＧＰＧＶＰＰＴＧＷＧＰＴＬＰＳＲＡＶＬＡＲＳＳＡＥＧＧＱＰＲＧＴＶＳＴＡＰＧＭＧＬＧＣＳＰＧＬＣＶＧＶＰＬＰＴＳＦＰＬＡＬＡを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列と、Ｑ８Ｎ４４１のアミノ酸３５８〜５０４に対応し、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４のアミノ酸４３８〜５８４も対応するＤＰＫＰＰＧＰＰＶＡＳＳＳＳＡＴＳＬＰＷＰＶＶＩＧＩＰＡＧＡＶＦＩＬＧＴＬＬＬＷＬＣＱＡＱＫＫＰＣＴＰＡＰＡＰＰＬＰＧＨＲＰＰＧＴＡＲＤＲＳＧＤＫＤＬＰＳＬＡＡＬＳＡＧＰＧＶＧＬＣＥＥＨＧＳＰＡＡＰＱＨＬＬＧＰＧＰＶＡＧＰＫＬＹＰＫＬＹＴＤＩＨＴＨＴＨＴＨＳＨＴＨＳＨＶＥＧＫＶＨＱＨＩＨＹＱＣと少なくとも９０％相同な第３のアミノ酸配列とを含み、前記第１、第２、および第３のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４をコードする単離キメラポリペプチド。

２．Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４に対応するＧＡＲＬＰＲＨＡＴＰＣＷＣＰＤＰＰＰＧＰＧＶＰＰＴＧＷＧＰＴＬＰＳＲＡＶＬＡＲＳＳＡＥＧＧＱＰＲＧＴＶＳＴＡＰＧＭＧＬＧＣＳＰＧＬＣＶＧＶＰＬＰＴＳＦＰＬＡＬＡをコードする配列と少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なアミノ酸配列を含む、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４の縁部分をコードする単離ポリペプチド。

変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析（ＳｉｇｎａｌＰおよび他の専門プログラムによる分析が含まれる）由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる：膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意されるが、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。

変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４はまた、表１３２６に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４は、以下の転写物によってコードされる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５（配列は出願書類の最後に示す）。転写物Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５のコード部分を太字で示し、このコード部分は１７位から開始され、１７７１位で終結する。転写物はまた、表１３２７に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ４配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

本発明の変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５は、出願書類の最後に示すアミノ酸配列を有し、転写物Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１６によってコードされる。野生型タンパク質に対するアラインメントを、出願書類の最後に示す。本発明の変異タンパク質と野生型タンパク質との関係の簡単な説明は以下である。

Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５と野生型Ｑ９Ｈ４Ｄ７（配列番号１７００）との間の比較の報告
１．Ｑ９Ｈ４Ｄ７のアミノ酸１〜２６９に対応し、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜２６９にも対応するＭＴＰＳＰＬＬＬＬＬＬＰＰＬＬＬＧＡＦＰＰＡＡＡＡＲＧＰＰＫＭＡＤＫＶＶＰＲＱＶＡＲＬＧＲＴＶＲＬＱＣＰＶＥＧＤＰＰＰＬＴＭＷＴＫＤＧＲＴＩＨＳＧＷＳＲＦＲＶＬＰＱＧＬＫＶＫＱＶＥＲＥＤＡＧＶＹＶＣＫＡＴＮＧＦＧＳＬＳＶＮＹＴＬＶＶＬＤＤＩＳＰＧＫＥＳＬＧＰＤＳＳＳＧＧＱＥＤＰＡＳＱＱＷＡＲＰＲＦＴＱＰＳＫＭＲＲＲＶＩＡＲＰＶＧＳＳＶＲＬＫＣＶＡＳＧＨＰＲＰＤＩＴＷＭＫＤＤＱＡＬＴＲＰＥＡＡＥＰＲＫＫＫＷＴＬＳＬＫＮＬＲＰＥＤＳＧＫＹＴＣＲＶＳＮＲＡＧＡＩＮＡＴＹＫＶＤＶＩＱＲＴＲＳＫＰＶＬＴＧＴＨＰＶＮＴＴＶＤＦＧＧＴＴＳＦＱＣＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５のアミノ酸２７０〜４９０に対応する配列ＴＱＮＲＱＧＨＬＷＰＰＲＰＲＰＬＡＣＲＧＰＷＳＳＡＳＱＰＡＬＳＳＳＷＡＰＣＳＣＧＦＡＲＰＲＲＳＲＡＰＰＲＬＰＬＰＣＬＧＴＡＲＲＧＲＰＡＴＡＡＥＴＲＴＦＰＲＷＰＰＳＡＬＡＬＶＷＧＣＶＲＳＭＧＬＲＱＰＰＳＴＹＷＡＱＡＱＬＬＡＬＳＣＴＰＮＳＴＱＴＳＴＨＴＨＴＨＴＬＴＨＴＨＴＷＲＡＲＳＴＳＴＳＴＩＳＡＲＲＨＲＩＣＳＧＨＧＧＡＧＱＴＧＲＬＧＧＷＲＴＥＬＱＴＫＡＧＤＰＷＲＧＧＭＡＳＴＰＧＳＬＣＶＲＨＳＰＷＴＨＴＨＲＨＴＨＹＬＤＡＣＭＨＴＨＡＲＴＲＡＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

２．Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５中の配列ＴＱＮＲＱＧＨＬＷＰＰＲＰＲＰＬＡＣＲＧＰＷＳＳＡＳＱＰＡＬＳＳＳＷＡＰＣＳＣＧＦＡＲＰＲＲＳＲＡＰＰＲＬＰＬＰＣＬＧＴＡＲＲＧＲＰＡＴＡＡＥＴＲＴＦＰＲＷＰＰＳＡＬＡＬＶＷＧＣＶＲＳＭＧＬＲＱＰＰＳＴＹＷＡＱＡＱＬＬＡＬＳＣＴＰＮＳＴＱＴＳＴＨＴＨＴＨＴＬＴＨＴＨＴＷＲＡＲＳＴＳＴＳＴＩＳＡＲＲＨＲＩＣＳＧＨＧＧＡＧＱＴＧＲＬＧＧＷＲＴＥＬＱＴＫＡＧＤＰＷＲＧＧＭＡＳＴＰＧＳＬＣＶＲＨＳＰＷＴＨＴＨＲＨＴＨＹＬＤＡＣＭＨＴＨＡＲＴＲＡＰと少なくとも７０％、任意選択的に少なくとも約８０％、好ましくは少なくとも約８５％、より好ましくは少なくとも約９０％、最も好ましくは少なくとも約９５％相同なポリペプチドを含む、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５のテールをコードする単離ポリペプチド。

Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５と野生型Ｑ８Ｎ４４１との間の比較の報告
１．Ｑ８Ｎ４４１のアミノ酸１〜２６９に対応し、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５のアミノ酸１〜２６９にも対応するＭＴＰＳＰＬＬＬＬＬＬＰＰＬＬＬＧＡＦＰＰＡＡＡＡＲＧＰＰＫＭＡＤＫＶＶＰＲＱＶＡＲＬＧＲＴＶＲＬＱＣＰＶＥＧＤＰＰＰＬＴＭＷＴＫＤＧＲＴＩＨＳＧＷＳＲＦＲＶＬＰＱＧＬＫＶＫＱＶＥＲＥＤＡＧＶＹＶＣＫＡＴＮＧＦＧＳＬＳＶＮＹＴＬＶＶＬＤＤＩＳＰＧＫＥＳＬＧＰＤＳＳＳＧＧＱＥＤＰＡＳＱＱＷＡＲＰＲＦＴＱＰＳＫＭＲＲＲＶＩＡＲＰＶＧＳＳＶＲＬＫＣＶＡＳＧＨＰＲＰＤＩＴＷＭＫＤＤＱＡＬＴＲＰＥＡＡＥＰＲＫＫＫＷＴＬＳＬＫＮＬＲＰＥＤＳＧＫＹＴＣＲＶＳＮＲＡＧＡＩＮＡＴＹＫＶＤＶＩＱＲＴＲＳＫＰＶＬＴＧＴＨＰＶＮＴＴＶＤＦＧＧＴＴＳＦＱＣＫと少なくとも９０％相同な第１のアミノ酸配列と、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５のアミノ酸２７０〜４９０に対応する配列ＴＱＮＲＱＧＨＬＷＰＰＲＰＲＰＬＡＣＲＧＰＷＳＳＡＳＱＰＡＬＳＳＳＷＡＰＣＳＣＧＦＡＲＰＲＲＳＲＡＰＰＲＬＰＬＰＣＬＧＴＡＲＲＧＲＰＡＴＡＡＥＴＲＴＦＰＲＷＰＰＳＡＬＡＬＶＷＧＣＶＲＳＭＧＬＲＱＰＰＳＴＹＷＡＱＡＱＬＬＡＬＳＣＴＰＮＳＴＱＴＳＴＨＴＨＴＨＴＬＴＨＴＨＴＷＲＡＲＳＴＳＴＳＴＩＳＡＲＲＨＲＩＣＳＧＨＧＧＡＧＱＴＧＲＬＧＧＷＲＴＥＬＱＴＫＡＧＤＰＷＲＧＧＭＡＳＴＰＧＳＬＣＶＲＨＳＰＷＴＨＴＨＲＨＴＨＹＬＤＡＣＭＨＴＨＡＲＴＲＡＰを有するポリペプチドと少なくとも７０％、任意選択的に少なくとも８０％、好ましくは少なくとも８５％、より好ましくは少なくとも９０％、最も好ましくは少なくとも９５％相同な第２のアミノ酸配列とを含み、前記第１および第２のアミノ酸配列が、隣接し、且つ連続した順序にある、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５をコードする単離キメラポリペプチド。

変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５はまた、表１３２８に示すように、以下の非サイレントＳＮＰ（１塩基多型）を有する（アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

変異タンパク質、Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５は、以下の転写物によってコードされる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１６（配列は出願書類の最後に示す）。転写物Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１６のコード部分を太字で示し、このコード部分は１７位から開始され、１４８９位で終結する。転写物はまた、表１３２９に列挙した以下のＳＮＰを有する（ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、ＳＮＰが公知であるかどうかを示し、変異タンパク質Ｈ５３６２６＿ＰＥＡ＿１＿Ｐ５配列中の公知のＳＮＰの存在は、本発明のこの変異タンパク質の推定配列を支持する）。

上記のように、クラスターＨ５３６２６は、上の表２に列挙した２０個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿１５は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３３０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２２は、４２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３３２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２５は、４１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５。以下の表１３３４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２６は、５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５。以下の表１３３６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２７は、１０６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３３８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３４は、１２１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３５は、８５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（表１３４３に示す）。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３６は、６９個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以下のように、このセグメントのマイクロアレイ（チップ）データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態（特に、癌）での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された（表１３４５５に示す）。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿１１は、１２個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿１２は、１１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿１６を、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４８は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿１９は、２５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３４９は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２０は、２７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５０は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２４は、３４個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５１は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２８は、６６個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５２は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿２９は、７３個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５３は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３０は、７１個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５４は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３１は、６７個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５５は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３２は、６５個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５６は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

本発明のセグメントクラスターＨ５３６２６＿ＰＥＡ＿１＿ｎｏｄｅ＿３３を、以下の転写物中に見出すことができる：Ｈ５３６２６＿ＰＥＡ＿１＿Ｔ１５およびＨ５３６２６＿ＰＥＡ＿１＿Ｔ１６。以下の表１３５７は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/K1Mec2ReKO/eg1EUS2AXY:Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P4 x Q8N441 ..

Alignment segment 1/1:

Quality: 4882.00 Escore: 0
Matching length: 504 Total length: 584
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 86.30 Total Percent Identity: 86.30
Gaps: 1

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
. . . . .
251 THPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGG 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 THPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGG 300
. . . . .
301 QKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRS 350
. . . . .
351 AFLTVLPGARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAE 400
|||||||
351 AFLTVLP........................................... 357
. . . . .
401 GGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALADPKPPGPPVASSS 450
|||||||||||||
358 .....................................DPKPPGPPVASSS 370
. . . . .
451 SATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
371 SATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPP 420
. . . . .
501 GTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKL 550
||||||||||||||||||||||||||||||||||||||||||||||||||
421 GTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKL 470
. . .
551 YPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQC 584
||||||||||||||||||||||||||||||||||
471 YPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQC 504

Sequence name: /tmp/oSUZaRW3WK/oSh3fN5Zt0:Q9H4D7

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q9H4D7 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGTTSFQCK 269
|||||||||||||||||||
251 THPVNTTVDFGGTTSFQCK 269

Sequence name: /tmp/oSUZaRW3WK/oSh3fN5Zt0:Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q8N441 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGTTSFQCK 269
|||||||||||||||||||
251 THPVNTTVDFGGTTSFQCK 269

正常および癌性肺組織における配列名Ｈ５３６２６ｊｕｎｃ２４−２７Ｆ１Ｒ３中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現
ｊｕｎｃ２４−２７、Ｈ５３６２６ｊｕｎｃ２４−２７Ｆ１Ｒ３アンプリコン（配列番号１６９０）ならびにＨ５３６２６ｊｕｎｃ２４−２７Ｆ１（配列番号１６８８）およびＨ５３６２６ｊｕｎｃ２４−２７Ｒ３（配列番号１６８９）プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図７４は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の過剰発現を示すヒストグラムである。

図７４から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２）よりも高かった。明白には、１５個の腺癌サンプルのうちの７個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｈ５３６２６ｊｕｎｃ２４−２７Ｆ１順方向プライマーおよびＨ５３６２６ｊｕｎｃ２４−２７Ｒ３逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｈ５３２６ｊｕｎｃ２４−２７Ｆ１Ｒ３。

順方向プライマー（配列番号１６８８）：ＧＴＣＣＴＴＣＣＡＧＴＧＣＡＡＧＡＣＣＣＡ
逆方向プライマー（配列番号１６８９）：ＴＧＧＧＣＣＴＧＧＣＡＡＡＧＣＣ
アンプリコン（配列番号１６９０）：ＧＴＣＣＴＴＣＣＡＧＴＧＣＡＡＧＡＣＣＣＡＡＡＡＣＣＧＣＣＡＧＧＧＣＣＡＣＣＴＧＴＧＧＣＣＴＣＣＴＣＧＴＣＣＴＣＧＧＣＣＡＣＴＡＧＣＣＴＧＣＣＧＴＧＧＣＣＣＧＴＧＧＴＣＡＴＣＧＧＣＡＴＣＣＣＡＧＣＣＧＧＣＧＣＴＧＴＣＴＴＣＡＴＣＣＴＧＧＧＣＡＣＣＣＴＧＣＴＣＣＴＧＴＧＧＣＴＴＴＧＣＣＡＧＧＣＣＣＡ

正常および癌性肺組織における配列名Ｈ５３６２６ｓｅｇ２５中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現
ｓｅｇ２５、Ｈ５３６２６ｓｅｇ２５アンプリコン（配列番号１６９３）、ならびにＨ５３６２６ｓｅｇ２５Ｆ（配列番号１６９１）およびＨ５３６２６ｓｅｇ２５Ｒ（配列番号１６９２）プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–ＰＢＧＤ−アンプリコン、配列番号３３４）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–ＨＰＲＴ１−アンプリコン、配列番号１２９７）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図７５から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２）よりも高かった。明白には、１５個の腺癌サンプルのうちの３個で少なくとも５倍の過剰発現が見出された。

プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：Ｈ５３６２６ｓｅｇ２５Ｆ順方向プライマーおよびＨ５３６２６ｓｅｇ２５Ｒ逆方向プライマー。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：Ｈ５３６２６ｓｅｇ２５。

順方向プライマー（配列番号１６９１）；ＣＣＧＡＣＧＧＣＴＣＣＴＡＣＣＴＣＡＡ
逆方向プライマー（配列番号１６９２）：ＧＧＡＡＧＣＴＧＴＡＧＣＣＣＡＴＧＧＴＧＴ
逆方向プライマー（配列番号１６９３）：ＣＣＧＡＣＧＧＣＴＣＣＴＡＣＣＴＣＡＡＴＡＡＧＣＴＧＣＴＣＡＴＣＡＣＣＣＧＴＧＣＣＣＧＣＣＡＧＧＡＣＧＡＴＧＣＧＧＧＣＡＴＧＴＡＣＡＴＣＴＧＣＣＴＴＧＧＣＧＣＣＡＡＣＡＣＣＡＴＧＧＧＣＴＡＣＡＧＣＴＴＣＣ

異なる正常組織における配列名Ｈ５３６２６ｓｅｇ２５中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現
Ｈ５３６２６ｓｅｇ２５アンプリコン（配列番号１６９３）ならびにＨ５３６２６ｓｅｇ２５Ｆ（配列番号１６９１）およびＨ５３６２６ｓｅｇ２５Ｒ（配列番号１６９２）プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、肺サンプル（上記のサンプル番号１５〜１７、表３）の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。

結果を図７７に示し、これは、異なる正常組織における配列名Ｈ５３６２６ｓｅｇ２５中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現を示す。

異なる正常組織における配列名Ｈ５３６２６ｊｕｎｃ２４−２７Ｆ１Ｒ３中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現
Ｈ５３６２６ｊｕｎｃ２４−２７Ｆ１Ｒ３アンプリコン（配列番号１６９０）ならびにＨ５３６２６ｊｕｎｃ２４−２７Ｆ１（配列番号１６８８）およびＨ５３６２６ｊｕｎｃ２４−２７Ｒ３（配列番号１６８９）によって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）転写物の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＲＰＬ１９（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００９８１、ＲＰＬ１９アンプリコン、配列番号１６３０）、ＴＡＴＡボックス（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００３１９４、ＴＡＴＡアンプリコン、配列番号１６３３、プライマー配列番号１６３１および１６３２）、ＵＢＣ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–ユビキチン−アンプリコン、配列番号３２８）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–ＳＤＨＡ−アンプリコン配列番号３３１）の発現を同様に測定した。各ＲＴサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、肺サンプル（上記のサンプル番号１５〜１７、表３）の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。

順方向プライマー（配列番号１６８８）：ＧＴＣＣＴＴＣＣＡＧＴＧＣＡＡＧＡＣＣＣＡ
逆方向プライマー（配列番号１６８９）：ＴＧＧＧＣＣＴＧＧＣＡＡＡＧＣＣ
逆方向プライマー（配列番号１６９０）：ＧＴＣＣＴＴＣＣＡＧＴＧＣＡＡＧＡＣＣＣＡＡＡＡＣＣＧＣＣＡＧＧＧＣＣＡＣＣＴＧＴＧＧＣＣＴＣＣＴＣＧＴＣＣＴＣＧＧＣＣＡＣＴＡＧＣＣＴＧＣＣＧＴＧＧＣＣＣＧＴＧＧＴＣＡＴＣＧＧＣＡＴＣＣＣＡＧＣＣＧＧＣＧＣＴＧＴＣＴＴＣＡＴＣＣＴＧＧＧＣＡＣＣＣＴＧＣＴＣＣＴＧＴＧＧＣＴＴＴＧＣＣＡＧＧＣＣＣＡ

結果を図７８に示し、これは、異なる正常組織における配列名Ｈ５３６２６ｊｕｎｃｃ２４−２７Ｆ１Ｒ３中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現を示す。

正常および癌性肺組織における配列番号１４８０中に示すアンプリコンによって検出可能なトロフィニン関連タンパク質（タスチン）（Ｔ８６２３５）転写物の発現
配列番号１４８０によって検出可能なトロフィニン関連タンパク質（タスチン）転写物（例えば、配列番号１４８５〜１４８８、１６０９、１６１０によって示される変異型番号２３〜２６、３１、３２）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１４８０の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５４ａは、正常サンプルに対する癌性肺組織における上記トロフィニン関連タンパク質（タスチン）転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも５倍の過剰発現を示すサンプルの数および比率を、下に示す。

図５４ａから明らかなように、癌サンプル中の配列番号１４８０によって検出可能なトロフィニン関連タンパク質（タスチン）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの６個、１６個の扁平上皮細胞癌サンプルのうちの８個、４個の大細胞癌サンプルのうちの２個、８個の小細胞癌サンプルのうちの８個で少なくとも５倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１４８０によって検出可能なトロフィニン関連タンパク質（タスチン）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、１．６１Ｅ−０４と決定された。

５倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、１．４９Ｅ−０２であった。上記値は、結果が統計的に有意であることを示す。

本発明によれば、トロフィニン関連タンパク質（タスチン）は、肺癌診断用マーカーの非限定的な例である。本発明のトロフィニン関連タンパク質（タスチン）マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、トロフィニン関連タンパク質（タスチン）と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した：トロフィニン関連タンパク質（タスチン）−ＴＡＡ−ｓｅｇ４４−順方向プライマー（配列番号１４７８）：ＡＧＡＣＴＣＣＡＡＣＣＣＡＣＡＧＣＣＣトロフィニン関連タンパク質（タスチン）−ＴＡＡ−ｓｅｇ４４−逆方向プライマー（配列番号１４７９）：ＣＡＧＣＴＣＡＧＣＣＡＡＣＣＴＴＧＣＡ。

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：トロフィニン関連タンパク質（タスチン）アンプリコン、配列番号１４８０：ＡＧＡＣＴＣＣＡＡＣＣＣＡＣＡＧＣＣＣＡＧＣＴＧＴＧＧＣＴＧＣＡＣＡＧＴＧＡＧＣＣＴＧＡＴＧＧＧＡＧＧＴＧＧＧＧＡＡＣＡＧＧＧＡＣＡＧＧＧＧＧＣＣＡＣＣＴＧＧＧＣＴＴＣＴＴＣＡＣＡＧＡＧＡＧＧＴＣＡＧＣＡＧＧＡＡＧＧＣＴＴＧＧＣＴＡＣＡＧＴＧＣＡＡＧＧＴＴＧＧＣＴＧＡＧＣＴＧ。

本発明の他の好ましい実施形態によれば、トロフィニン関連タンパク質（タスチン）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１４８５〜１４８８、１６０９、１６１０（例えば、変異型番号２３〜２６、３１、３２）に示すトロフィニン関連タンパク質（タスチン）スプライスバリアントまたはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、トロフィニン関連タンパク質（タスチン）のフラグメントは、セグメント＿ＴＡＡ−４４−配列番号１５０７を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、トロフィニン関連タンパク質（タスチン）＿セグメント＿ＴＡＡ−４４−配列番号１５０７などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のトロフィニン関連タンパク質（タスチン）に対応する核酸配列によってコードされる任意のアミノ酸配列またはそのフラグメント（配列番号１４９２〜１５０１、１６１２が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド（配列番号１５０８〜１５１１、１６１３に記載のこれらのタンパク質の固有のアミノ酸配列が含まれるが、これらに限定されない）も、任意選択的に（さらにまたは二者択一的に）、バイオマーカーとして使用することができる。本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして／またはこれらによって誘発することができる抗体を含む。

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質（タスチン）に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。

正常および癌性肺組織における配列番号１５１２〜１５１４中に示すオリゴヌクレオチドによって検出可能なトロフィニン関連タンパク質（タスチン）（Ｔ８６２３５）転写物の発現
オリゴヌクレオチド配列番号１５１２〜１５１４によって検出可能なトロフィニン関連タンパク質（タスチン）（Ｔ８６２３５）転写物（例えば、配列番号１４８１〜１４８５、１４８８〜１４９１、１６０９、１６１１によって示される変異型番号８〜１０、２２、２３、２６、２７、２９〜３１、３３）の発現を、オリゴヌクレオチドベースのマイクロアレイによって測定した。配列番号１５１２〜１５１４に記載の上記オリゴヌクレオチドによって検出されたセグメントは、例えば、配列番号１５０３、１５０４、１５０６に記載のヌクレオチド配列である。

各フィーチャーの画像強度の結果を、チップ上の全フィーチャーの画像強度の９０パーセンタイルにしたがって正規化した。次いで、チップ上の同一ヌクレオチドの複製物および同一サンプルの複製物のフィーチャー画像強度を平均化した。範囲外の結果を破棄した。

各オリゴヌクレオチド（配列番号１５１２〜１５１４）のために、各サンプルについて決定したの平均化強度を、全正常サンプル（上記のサンプル番号４８、５０、９０〜９２、９６〜９９、表２、「試験パネル中の組織サンプル」）の平均化した強度で割って、平均化した正常サンプルに対する各サンプルの上方制御の倍率を得た。これらのデータを、図５４ｂのヒストグラムに示す。図５４ｂから明らかなように、癌サンプル中の配列番号１５１２〜１５１４のオリゴヌクレオチドを使用して検出可能なトロフィニン関連タンパク質（タスチン）（Ｔ８６２３５）転写物の発現は、正常サンプルよりも有意に高かった。

本発明によれば、トロフィニン関連タンパク質（タスチン）は、肺癌診断用マーカーの非限定的な例である。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、トロフィニン関連タンパク質（タスチン）と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。オリゴヌクレオチドも、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なオリゴヌクレオチドの制限されない例示のみとして以下のオリゴヌクレオチドを使用した：配列番号１５１２〜１５１４。

配列番号１５１２：ＣＡＴＧＧＴＡＡＣＡＣＧＧＣＣＴＣＣＡＴＧＧＣＴＧＡＧＴＡＧＧＧＧＡＣＴＡＧＧＡＡＧＧＧＴＡＡＡＡＧ
配列番号１５１３：ＴＧＴＡＣＡＴＣＴＡＧＧＧＣＣＴＣＴＣＡＧＴＴＡＧＧＧＧＣＴＴＣＡＡＴＣＣＡＴＴＣＣＴＣＡＴＧＡＧＧ
配列番号１５１４：ＴＧＴＧＡＡＣＡＣＡＡＧＡＧＧＴＣＣＴＣＡＣＣＴＣＡＣＴＧＴＧＡＧＣＴＧＣＡＣＡＣＣＴＧＣＣＣＴＧＣ

本発明の他の好ましい実施形態によれば、トロフィニン関連タンパク質（タスチン）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１４８１〜１４８５、１４８８〜１４９１、１６０９、１６１１（例えば、変異型番号８〜１０、２２、２３、２６、２７、２９〜３１、３３）に示すトロフィニン関連タンパク質（タスチン）スプライスバリアントまたはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、トロフィニン関連タンパク質（タスチン）のフラグメントは、セグメント＿ＴＡＡ−１４、３５、および４２−配列番号１５０３、１５０４、１５０６を含む。同様に、任意選択的およびより好ましくは、任意の好ましい方法を、例えば、トロフィニン関連タンパク質（タスチン）＿セグメント＿ＴＡＡ−１４、３５、および４２−配列番号１５０３、１５０４、１５０６などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

本発明の他の好ましい実施形態によれば、配列番号１５０２および１５０５に記載の固有のセグメントを含むトロフィニン関連タンパク質（タスチン）スプライスバリアント（例えば、変異型９および２９に含まれるもの（それぞれ、配列番号１４８２および１４９０））は、肺癌検出用バイオマーカーとして有用である。

正常および癌性肺組織における配列番号１５１７中に示すアンプリコンによって検出可能なホメオボックスＣ１０（ＨＯＸＣ１０）（Ｎ３１８４２）転写物の発現
配列番号１５１７によって検出可能なホメオボックスＣ１０（ＨＯＸＣ１０）転写物（例えば、配列番号１５１９によって示される変異型番号３）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号３）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号９）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１５１７の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５５は、正常サンプルに対する癌性肺組織における上記ホメオボックスＣ１０（ＨＯＸＣ１０）転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも２０倍の過剰発現を示すサンプルの数および比率を、下に示す。

図５５から明らかなように、癌サンプル中の配列番号１５１７によって検出可能なホメオボックスＣ１０（ＨＯＸＣ１０）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの６個、１６個の扁平上皮細胞癌サンプルのうちの９個、および４個の大細胞癌サンプルのうちの３個で少なくとも２０倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１５１７によって検出可能なホメオボックスＣ１０（ＨＯＸＣ１０）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、４．４３Ｅ−０３と決定された。

２０倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、２．８８Ｅ−０２であった。上記値は、結果が統計的に有意であることを示す。

本発明によれば、ホメオボックスＣ１０（ＨＯＸＣ１０）は、肺癌診断用マーカーの非限定的な例である。本発明のホメオボックスＣ１０（ＨＯＸＣ１０）マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、ホメオボックスＣ１０（ＨＯＸＣ１０）と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

ホメオボックスＣ１０（ＨＯＸＣ１０）−順方向プライマー（配列番号１５１５）：ＧＣＧＡＡＡＣＧＣＧＡＴＴＴＧＴＴＧＴＴおよびホメオボックスＣ１０（ＨＯＸＣ１０）−逆方向プライマー（配列番号１５１６）：ＣＡＴＣＴＧＧＡＧＧＡＧＧＧＡＧＧＧＡ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ホメオボックスＣ１０（ＨＯＸＣ１０）アンプリコン（配列番号１５１７）。

ＧＣＧＡＡＡＣＧＣＧＡＴＴＴＧＴＴＧＴＴＴＧＴＧＧＧＴＣＴＧＡＴＴＴＧＴＧＣＧＴＧＣＧＧＣＴＴＧＧＧＣＴＣＣＴＧＣＧＧＣＴＴＴＴＧＧＣＴＣＧＧＣＣＧＧＧＧＧＣＣＴＴＧＧＧＣＡＧＣＧＡＧＧＣＴＧＧＡＧＣＣＧＧＡＡＧＡＧＧＴＧＧＡＧＧＴＧＡＡＧＧＧＣＴＧＣＣＣＧＣＣＡＣＧＴＣＣＣＴＣＣＣＴＣＣＴＣＣＡＧＡＴＧ

本発明の他の好ましい実施形態によれば、ホメオボックスＣ１０（ＨＯＸＣ１０）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号５４に記載のホメオボックスＣ１０（ＨＯＸＣ１０）スプライスバリアント（例えば、変異型番号３）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、ホメオボックスＣ１０（ＨＯＸＣ１０）のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ６（配列番号１５２６）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、ホメオボックスＣ１０（ＨＯＸＣ１０）＿セグメント＿ＴＡＡ−ｓｅｇ６（配列番号１５２６）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

本発明の他の好ましい実施形態によれば、配列番号１５２４および１５２５に記載の固有のセグメントを含むホメオボックスＣ１０（ＨＯＸＣ１０）スプライスバリアント（例えば、配列番号１５１５、１５１９、および１５２０に記載の転写物）は、肺癌検出用バイオマーカーを含む。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のトロフィニン関連タンパク質（タスチン）に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１５２１および１５２２が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド（配列番号１５２３に記載のタンパク質（配列番号１５２２）の固有のアミノ酸配列が含まれるが、これらに限定されない）も、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして／またはこれらによって誘発することができる抗体を含む。

正常および癌性肺組織における配列番号１５２９中に示すアンプリコンによって検出可能な核タンパク質４（ＮＯＬ４）−（Ｔ０６０１４）転写物の発現
配列番号１５２９によって検出可能な核タンパク質４（ＮＯＬ４）転写物（例えば、配列番号１５３３、１５３７、１５３８によって示される変異型番号３、１１、および１２）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１５２９の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５６ａおよびｂは、正常サンプルに対する癌性肺組織における上記核タンパク質４（ＮＯＬ４）転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも２００倍または６倍の過剰発現を示すサンプルの数および比率を、以下の図５６ａおよび５６ｂにそれぞれ示す。

図５６ａから明らかなように、肺小細胞癌由来のサンプル中の配列番号１５２９によって検出可能な核タンパク質４（ＮＯＬ４）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、８個の小細胞癌サンプルのうちの８個で少なくとも２００倍の過剰発現が認められた。図５６ｂから明らかなように、１５個の腺癌サンプルのうちの２個、１６個の扁平上皮細胞癌サンプルのうちの３個で少なくとも６倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１５２９によって検出可能な核タンパク質４（ＮＯＬ４）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、１．３６Ｅ−０２と決定された。

６倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、２．５２Ｅ−０２であった。

小細胞肺癌サンプル対正常肺サンプルにおける配列番号１５２９よって検出可能な核タンパク質４（ＮＯＬ４）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、３．８６Ｅ−０３と決定された。

２００倍過剰発現の閾値は、小細胞癌と正常肺サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、７．９４Ｅ−０６であった。上記値は、結果が統計的に有意であることを示す。

本発明によれば、核タンパク質４（ＮＯＬ４）は、肺癌診断用マーカーの非限定的な例である。本発明の核タンパク質４（ＮＯＬ４）マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、核タンパク質４（ＮＯＬ４）と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

核タンパク質４（ＮＯＬ４）−ＴＡＡ−ｓｅｇ１−順方向プライマー（配列番号１５２７）：ＣＴＣＧＣＴＣＣＣＴＴＧＣＴＣＡＣＡＣおよび核タンパク質４（ＮＯＬ４）−ＴＡＡ−ｓｅｇ１−逆方向プライマー（配列番号１５２８）：ＡＡＡＧＧＧＡＡＡＧＣＧＧＧＡＴＧＴＴＴ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：核タンパク質４（ＮＯＬ４）アンプリコン（配列番号１５２９）。

ＣＴＣＧＣＴＣＣＣＴＴＧＣＴＣＡＣＡＣＡＣＡＣＧＣＡＣＡＣＡＣＴＣＡＧＣＣＴＧＧＣＣＧＡＧＣＡＧＧＡＧＣＣＡＣＴＧＡＣＣＡＴＴＴＴＧＣＡＡＧＴＧＴＣＡＧＧＡＣＣＡＧＣＴＡＣＡＧＣＧＣＧＧＴＧＧＧＣＧＣＡＡＡＣＡＴＣＣＣＧＣＴＴＴＣＣＣＴＴＴ

本発明の他の好ましい実施形態によれば、核タンパク質４（ＮＯＬ４）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１５２９に記載の核タンパク質４（ＮＯＬ４）スプライスバリアント（例えば、変異型番号３、１１、および１２）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、核タンパク質４（ＮＯＬ４）のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ−１（配列番号１５５２）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、核タンパク質４（ＮＯＬ４）＿セグメント＿ＴＡＡ−ｓｅｇ−１（配列番号１５５２）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

本発明の他の好ましい実施形態によれば、配列番号１５５４および１５５５に記載の固有のセグメントを含む核タンパク質４（ＮＯＬ４）スプライスバリアント（例えば、配列番号１５３４〜１５３６および１５３９〜１５４１に記載の転写物）は、肺癌検出用バイオマーカーを含む。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記の核タンパク質４（ＮＯＬ４）に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１５４２、１５４７、および１５４３ならびに１５４８、１５４５、１５４６、および１５４９〜１５５１が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド（配列番号１５４４に記載のタンパク質（配列番号１５４３、１５４６、１５４９）の固有のアミノ酸配列が含まれるが、これらに限定されない）も、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。

本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして／またはこれらによって誘発することができる抗体を含む。

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質４（ＮＯＬ４）に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。

正常および癌性肺組織における配列番号１５３２中に示すアンプリコンによって検出可能な核タンパク質４（ＮＯＬ４）−（Ｔ０６０１４）転写物の発現
配列番号１５３２によって検出可能な核タンパク質４（ＮＯＬ４）転写物（例えば、配列番号１５３３、１５３７、１５３８によって示される変異型番号３、１１、および１２）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４８１）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１５３２の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５７ａおよびｂは、正常サンプルに対する癌性肺組織における上記核タンパク質４（ＮＯＬ４）転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも４００倍または６倍の過剰発現を示すサンプルの数および比率を、以下の図５７ａおよび５６ｂにそれぞれ示す。

図５７ａから明らかなように、肺小細胞癌由来のサンプル中の配列番号１５３２によって検出可能な核タンパク質４（ＮＯＬ４）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、８個の小細胞癌サンプルのうちの８個で少なくとも４００倍の過剰発現が認められた。図４ｂから明らかなように、１５個の腺癌サンプルのうちの４個、１６個の扁平上皮細胞癌サンプルのうちの３個で少なくとも６倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１５３２によって検出可能な核タンパク質４（ＮＯＬ４）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、１．７０Ｅ−０２と決定された。

６倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、１．８０Ｅ−０２であった。

小細胞肺癌サンプル対正常肺サンプルにおける配列番号１５３２よって検出可能な核タンパク質４（ＮＯＬ４）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、７．０８Ｅ−０３と決定された。

４００倍過剰発現の閾値は、小細胞癌と正常肺サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、１．０３Ｅ−０４であった。上記値は、結果が統計的に有意であることを示す。

核タンパク質４（ＮＯＬ４）–ＴＡＡ−ｓｅｇ３−順方向プライマー（配列番号１５３０）：ＡＣＡＴＣＣＣＣＣＴＧＧＡＡＣＧＧＡＴおよび核タンパク質４（ＮＯＬ４）−ＴＡＡ−ｓｅｇ３−逆方向プライマー（配列番号１５３１）：ＣＡＧＡＡＡＴＴＡＧＣＡＡＡＧＣＡＴＴＧＡＴＧＧ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：核タンパク質４（ＮＯＬ４）アンプリコン（配列番号１５３２）。

ＡＣＡＴＣＣＣＣＣＴＧＧＡＡＣＧＧＡＴＡＴＣＴＧＴＴＴＧＧＧＧＣＡＣＴＡＣＡＡＴＣＴＡＴＣＣＴＧＴＡＧＡＡＣＴＡＴＧＧＣＣＡＡＡＴＣＴＣＣＡＴＣＡＡＴＧＣＴＴＴＧＣＴＡＡＴＴＴＣＴＧ

本発明の他の好ましい実施形態によれば、核タンパク質４（ＮＯＬ４）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１５３３、１５３７、１５３８に記載の核タンパク質４（ＮＯＬ４）スプライスバリアント（例えば、変異型番号３、１１、１２）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、核タンパク質４（ＮＯＬ４）のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ−３（配列番号１５５３）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、核タンパク質４（ＮＯＬ４）＿セグメント＿ＴＡＡ−ｓｅｇ−３（配列番号１５５３）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記の核タンパク質４（ＮＯＬ４）に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１５４２、１５４７、および１５４８が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。

正常および癌性肺組織における配列番号１５５８中に示すアンプリコンによって検出可能なＡＡ２８１３７０転写物の発現
肺癌中に過剰発現されたＡＡ２８１３７０遺伝子を、上記の計算過程によって同定した。ＡＡ２８１３７０コードタンパク質（配列番号１５６３、１５６４）は、広範な種々の機能を対象とする多数の真核生物タンパク質中で見出されるいくつかのＷＤ４０ドメインを含む（シグナル伝達、プレｍＲＮＡプロセシング、および細胞骨格アセンブリにおけるアダプター分子および／または調節分子が含まれる）。図６３に示すように、配列番号１５６４に示すＡＡ２８１３７０コードタンパク質のＷＤ４３ドメイン領域はいくらか類似しており、シグナル伝達ＭＡＰＫ経路への関与が示唆され得る。例えば、４０〜７９０位のアミノ酸の間に存在するＡＡ２８１３７０ポリペプチド（配列番号１５６４）の領域は、マウスＭａｐｋｂｐ１タンパク質（ｇｉ｜４７１２４６２２）のＷＤドメイン領域と７５％相同であり（図６３ａ）、ＡＡ２８１３７０ポリペプチド（配列番号１５６４）の４０〜８８６位のアミノ酸は、ラットＪＮＫ結合タンパク質ＪＮＫＢＰ１（ｇｉ｜３４８５６７１７）と７０％相同である（図６３ｂ）。

配列番号１５５８によって検出可能なＡＡ２８１３７０転写物（例えば、配列番号１５５９〜１５６２中に示される変異型番号０、１、４、および５）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１５５８の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５８は、正常サンプルに対する癌性肺組織における上記ＡＡ２８１３７０転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも６倍の過剰発現を示すサンプルの数および比率を、以下に示す。

図５８から明らかなように、癌サンプル中の配列番号１５５８によって検出可能なＡＡ２８１３７０転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、８個の小細胞癌サンプルのうちの８個、１６個の扁平上皮細胞癌サンプルのうちの２個、４個の大細胞癌サンプルのうちの１個で少なくとも６倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１５５８によって検出可能なＡＡ２８１３７０転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、８．５８Ｅ−０７と決定された。

６倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、４．８１Ｅ−０２であった。

上記値は、結果が統計的に有意であることを示す。

本発明によれば、ＡＡ２８１３７０転写物は、肺癌診断用マーカーの非限定的な例である。本発明のＡＡ２８１３７０マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、ＡＡ２８１３７０と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

ＡＡ２８１３７０−順方向プライマー（配列番号１５５６）：ＧＧＴＴＣＧＧＡＴＧＧＡＣＴＡＣＡＣＴＴＴＧＴＣ；およびＡＡ２８１３７０−逆方向プライマー（配列番号１５５７）：ＣＣＡＣＧＴＡＣＴＴＣＴＧＧＧＴＧＡＴＧＴＣ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＡＡ２８１３７０アンプリコン（配列番号１５５８）。

ＡＡ２８１３７０−アンプリコン（配列番号１５５８）：ＧＧＴＴＣＧＧＡＴＧＧＡＣＴＡＣＡＣＴＴＴＧＴＣＣＧＴＡＣＣＣＡＣＣＡＣＧＴＡＧＣＡＧＡＧＡＡＡＡＣＣＡＣＣＴＴＧＴＡＴＧＡＣＡＴＧＧＡＣＡＴＴＧＡＣＡＴＣＡＣＣＣＡＧＡＡＧＴＡＣＧＴＧＧ

本発明の他の好ましい実施形態によれば、ＡＡ２８１３７０またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１５５８に記載のＡＡ２８１３７０スプライスバリアント（例えば、変異型番号０、１、４、および５）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、ＡＡ２８１３７０のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ１０（配列番号１５６７）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、ＡＡ２８１３７０＿セグメント＿ＴＡＡ−ｓｅｇ１０（配列番号１５６７）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

他の好ましい実施形態によれば、本発明はまた、任意選択的およびより好ましくは、配列番号１５６８に記載の固有のセグメントを含むＡＡ２８１３７０スプライスバリアント（例えば、配列番号１５６１および１５６２に記載の転写物）は、肺癌検出用バイオマーカーを含む。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のＡＡ２８１３７０に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１５６３〜１５６６が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド（配列番号１５６９、１５７０、および１５７１に記載のタンパク質（配列番号１５６３〜１５６６）の固有のアミノ酸配列が含まれるが、これらに限定されない）も、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のＡＡ２８１３７０に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。

正常および癌性肺組織における配列番号１５７４中に示すアンプリコンによって検出可能なスルファターゼ１（ＳＵＬＦ１）−（Ｚ２１３６８）転写物の発現
ＳＵＬＦ１は、細胞外基質中で見出される分泌タンパク質である。ＳＵＬＦ１は、多数の上皮癌型で下方制御されることが公知である。

配列番号１５７４によって検出可能なスルファターゼ１（ＳＵＬＦ１）転写物（例えば、配列番号１５７８、１５７９中に示される変異型番号１３および１４）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１５７４の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図５９は、正常サンプルに対する癌性肺組織における上記スルファターゼ１（ＳＵＬＦ１）転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも８倍の過剰発現を示すサンプルの数および比率を、以下に示す。

図５９から明らかなように、非細胞癌由来の癌サンプル中の配列番号１５７４によって検出可能なスルファターゼ１（ＳＵＬＦ１）転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの１１個、１６個の扁平上皮細胞癌サンプルのうちの１１個、４個の大細胞癌サンプルのうちの４個で少なくとも８倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１５７４によって検出可能なスルファターゼ１（ＳＵＬＦ１）転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、３．１８Ｅ−０７と決定された。

８倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、１．１８Ｅ−０４であった。

上記値は、結果が統計的に有意であることを示す。

本発明によれば、スルファターゼ１（ＳＵＬＦ１）は、肺癌診断用マーカーの非限定的な例である。本発明のスルファターゼ１（ＳＵＬＦ１）マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、スルファターゼ１（ＳＵＬＦ１）と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

スルファターゼ１（ＳＵＬＦ１）−順方向プライマー（配列番号１５７２）：ＡＣＴＣＡＣＴＣＡＧＡＧＡＣＴＡＡＣＡＣＡＡＡＧＧＡＡＧおよびスルファターゼ１（ＳＵＬＦ１）−逆方向プライマー（配列番号１５７３）：ＡＧＴＡＴＧＧＧＡＡＧＡＡＴＴＴＡＣＴＧＧＴＣＡＣＡ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：スルファターゼ１（ＳＵＬＦ１）アンプリコン（配列番号１５７４）。

ＡＣＴＣＡＣＴＣＡＧＡＧＡＣＴＡＡＣＡＣＡＡＡＧＧＡＡＧＴＡＡＴＴＴＣＴＴＡＣＣＴＧＧＴＣＡＴＴＡＴＴＴＡＧＴＣＴＡＣＡＡＴＡＡＧＴＴＣＡＴＣＣＴＴＣＴＴＣＡＧＴＧＴＧＡＣＣＡＧＴＡＡＡＴＴＣＴＴＣＣＣＡＴＡＣＴ

本発明の他の好ましい実施形態によれば、スルファターゼ１（ＳＵＬＦ１）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１５７８、１５７９に記載のスルファターゼ１（ＳＵＬＦ１）スプライスバリアント（例えば、変異型番号１３および１４）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、スルファターゼ１（ＳＵＬＦ１）のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ５（配列番号１５８７）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、スルファターゼ１（ＳＵＬＦ１）＿セグメント＿ＴＡＡ−ｓｅｇ５（配列番号１８５７）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

本発明の他の好ましい実施形態によれば、配列番号１５８８、１５９１に記載の固有のセグメントを含むスルファターゼ１（ＳＵＬＦ１）スプライスバリアント（例えば、配列番号１５７５〜１５７７に記載の転写物）は、肺癌検出用バイオマーカーを含む。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のスルファターゼ１（ＳＵＬＦ１）に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１５８６、１５８０、１５８２、１５８４が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド（それぞれ、配列番号１５８１、１５８３、および１５８５に記載のタンパク質（配列番号１５８０、１５８２、１５８４）の固有のアミノ酸配列が含まれるが、これらに限定されない）も、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。

正常および癌性肺組織における配列番号１５９４中に示すアンプリコンによって検出可能なＳＲＹ（性決定領域Ｙ）−ボックス２（ＳＯＸ２））−（ＨＵＭＨＭＧＢＯＸ）転写物の発現
配列番号１５９４によって検出可能なＳＯＸ２転写物（例えば、配列番号１５９５によって示される変異型番号０）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１５９４の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６０は、正常サンプルに対する癌性肺組織における上記ＳＯＸ２転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも５倍の過剰発現を示すサンプルの数および比率を、以下に示す。

図６０から明らかなように、肺癌由来の癌サンプル中の配列番号１５９４によって検出可能なＳＯＸ２転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１５個の腺癌サンプルのうちの４個、１６個の扁平上皮細胞癌サンプルのうちの１０個、４個の大細胞癌サンプルのうちの２個、および８個の小細胞癌のうちの７個で少なくとも５倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１５９４によって検出可能なＳＯＸ２転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、４．３８Ｅ−０５と決定された。

５倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、８．０９Ｅ−０４であった。

上記値は、結果が統計的に有意であることを示す。

本発明によれば、ＳＯＸ２は、肺癌診断用マーカーの非限定的な例である。本発明のＳＯＸ２マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、ＳＯＸ２と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

ＳＯＸ２−順方向プライマー（配列番号１５９２）：ＧＧＣＧＧＣＧＧＣＡＧＧＡＴおよびＳＯＸ２−逆方向プライマー（配列番号１５９３）：ＧＴＣＧＧＧＡＧＣＧＣＡＧＧＧ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＳＯＸ２アンプリコン（配列番号１５９４）。

ＧＧＣＧＧＣＧＧＣＡＧＧＡＴＣＧＧＣＣＡＧＡＧＧＡＧＧＡＧＧＧＡＡＧＣＧＣＴＴＴＴＴＴＴＧＡＴＣＣＴＧＡＴＴＣＣＡＧＴＴＴＧＣＣＴＣＴＣＴＣＴＴＴＴＴＴＴＣＣＣＣＣＡＡＡＴＴＡＴＴＣＴＴＣＧＣＣＴＧＡＴＴＴＴＣＣＴＣＧＣＧＧＡＧＣＣＣＴＧＣＧＣＴＣＣＣＧＡＣ

本発明の他の好ましい実施形態によれば、ＳＯＸ２またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１５９５に記載のＳＯＸ２スプライスバリアント（例えば、変異型番号０）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、ＳＯＸ２のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ２（配列番号１５９７）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、ＳＯＸ２＿セグメント＿ＴＡＡ−ｓｅｇ２（配列番号１５９７）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のＳＯＸ２に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１５９６が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のＳＯＸに対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。

正常および癌性肺組織における配列番号１６００中に示すアンプリコンによって検出可能なプラコフィリン１（外胚葉異形成／表皮水疱症候群）（ＰＫＰ１）−（ＨＳＢ６ＰＲ）転写物の発現
配列番号１６００によって検出可能なＰＫＰ１転写物（例えば、配列番号１６０１〜１６０３によって示される変異型番号０、５、および６）の発現を、実時間ＰＣＲによって測定した。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１６００の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６１は、正常サンプルに対する癌性肺組織における上記ＰＫＰ１転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも７倍の過剰発現を示すサンプルの数および比率を、以下に示す。

図６１から明らかなように、肺癌由来の癌サンプル中の配列番号１６００によって検出可能なＰＫＰ１転写物の発現は、非癌性サンプル（サンプル番号４６〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）よりも有意に高かった。明白には、１６個の扁平上皮細胞癌サンプルのうちの１１個および４個の大細胞癌サンプルのうちの１個で少なくとも７倍の過剰発現が見出された。

肺癌サンプル対正常肺サンプルにおける配列番号１６００によって検出可能なＰＫＰ１転写物の発現レベルの相違についてのＰ値は、Ｔ検定によって、３．１８Ｅ−０３と決定された。

７倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、３．５０Ｅ−０２であった。

上記値は、結果が統計的に有意であることを示す。

本発明によれば、ＰＫＰ１は、肺癌診断用マーカーの非限定的な例である。本発明のＰＫＰ１マーカーを、単独または組み合わせて、種々の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）に使用することができる。このマーカーの過剰発現および／または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、ＮＡＴベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、ＰＫＰ１と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

ＰＫＰ１−順方向プライマー（配列番号１５９８）：ＣＣＣＣＡＧＡＣＴＣＴＧＴＧＣＡＣＴＴＣＡおよびＰＫＰ１−逆方向プライマー（配列番号１５９９）：ＴＧＧＧＣＴＣＴＧＣＴＣＴＧＴＣＴＴＡＧＴＧＴＡ

本発明はまた、好ましくは、（例えば、上記実験に）適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た：ＰＫＰ１アンプリコン（配列番号１６００）。

ＰＫＰ１–アンプリコン（配列番号１６００）：ＣＣＣＣＡＧＡＣＴＣＴＧＴＧＣＡＣＴＴＣＡＧＡＣＣＡＧＣＡＧＣＡＧＣＡＧＧＡＧＧＧＣＴＣＣＣＧＡＧＧＧＣＣＴＴＡＴＧＡＧＡＡＡＡＣＣＴＧＴＧＴＧＧＡＣＡＴＣＣＣＴＴＧＧＴＧＴＡＣＡＣＴＡＡＧＡＣＡＧＡＧＣＡＧＡＧＣＣＣＡ

本発明の他の好ましい実施形態によれば、ＰＫＰ１またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号１６０１〜１６０３に記載のＰＫＰ１スプライスバリアント（例えば、変異型番号０、５、および６）またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、ＰＫＰ１のフラグメントは、セグメント＿ＴＡＡ−ｓｅｇ３４（配列番号１６０８）を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、ＰＫＰ１＿セグメント＿ＴＡＡ−ｓｅｇ３４（配列番号１６０８）などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのＮＡＴベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。

本発明の他の好ましい実施形態によれば、配列番号１６０７に記載の固有のセグメントを含むＰＫＰ１スプライスバリアント（例えば、配列番号１６０３に記載の変異型６）は、肺癌検出用バイオマーカーとして適切である。

さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のＰＫＰ１に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント（配列番号１６０４〜１６０６が含まれるが、これらに限定されない）を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、（さらにまたは二者択一的に）バイオマーカーとして使用することができる。

本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のＰＫＰ１に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。

正常および癌性肺組織における１２の配列（配列番号１４８０、１５１７、１５２９、１５３２、１５５８、１５７４、１５９４、１６００、１６１６、１６１９、１６２２、１６２５）の組み合わせ発現
配列番号１４８０、１５１７、１５２９、１５３２、１５５８、１５７４、１５９４、１６００、１６１６、１６１９、１６２２、１６２５によって検出可能ないくつかの転写物の発現を、実時間ＰＣＲによって測定した（各配列番号の発現を個別にチェックした）。並行して、４つのハウスキーピング遺伝子−ＰＢＧＤ（ＧｅｎＢａｎｋアクセッション番号ＢＣ０１９３２３、アンプリコン–配列番号１４７１）、ＨＰＲＴ１（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿０００１９４、アンプリコン–配列番号１４６８）、ユビキチン（ＧｅｎＢａｎｋアクセッション番号ＢＣ０００４４９、アンプリコン–配列番号１４７４）、およびＳＤＨＡ（ＧｅｎＢａｎｋアクセッション番号ＮＭ＿００４１６８、アンプリコン–配列番号１４７７）の発現を同様に測定した。各ＲＴサンプルのために、配列番号１４８０、１５１７、１５２９、１５３２、１５５８、１５７４、１５９４、１６００、１６１６、１６１９、１６２２、１６２５の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各ＲＴサンプルの正規化した量を、正常な死後（ＰＭ）サンプル（上記のサンプル番号４７〜５０、９０〜９３、９６〜９９、表２、「試験パネル中の組織サンプル」）の量の中央値で割って、正常なＰＭサンプルの中央値に対する各サンプルの上方制御の倍率を得た。

図６２は、正常サンプルに対する癌性肺組織における上記転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで上記配列番号の少なくとも１つにおいて少なくとも１０倍の過剰発現を示すサンプルの数および比率を、以下に示す。

図６２から明らかなように、上記配列番号の少なくとも１つにおいて、１５個の腺癌サンプルのうちの１５個、１６個の扁平上皮細胞癌サンプルのうちの１５個、４個の大細胞癌サンプルのうちの４個、および８個の小細胞癌サンプルのうちの８個で少なくとも１０倍の過剰発現が見出された。

下記のように、これらの結果の有意性を検証するために、統計分析を適用した。配列番号１４８０、１５１７、１５２９、１５３２、１５５８、１５７４、１５９４、１６００、１６１６、１６１９、１６２２、１６２５に記載のアンプリコンの少なくとも１つの１０倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、Ｐ値は、２．３７Ｅ−０８であった。

上記値は、結果が統計的に有意であることを示す。

キットおよび診断アッセイおよび診断方法
上記実施例のいずれかに関して記載のマーカーを、肺癌診断を補助するために、単独、上記の他のマーカーおよび／または他の完全に異なるマーカー（ＵｂｃＨ１０（それぞれ２００４年１月１３日および３月１９日出願の米国特許出願番号６０／５３５，９０４号および同第６０／５７２，１２２号（代理人整理番号２７０８０および２８０４５を参照のこと）、トロポニン（米国特許出願番号６０／５３９，１２９号（代理人整理番号２６９４０を参照のこと）、Ｓｉｍ２（ＰＣＴ出願番号ＷＯ２００４／０１２８４７号を参照のこと）、ＰＥ−１０（ＳＰ−Ａ）、ＴＴＦ−１、サイトケラチン５／６が含まれるが、これらに限定されない）と組み合わせて使用することができる。これら全ての出願は、本明細書中に完全に記載されているかのように本明細書中で参考として援用される。これらのマーカーを、他のマーカーと組み合わせて、多数の用途（肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない）（および、任意選択的に、疾患の病期分類も含まれる）に使用することができる。併用した場合、これらにより、１つのマーカーのみを使用して得られる結果と比較して、診断医がより多くの情報を得ることができ、真の陽性および真の陰性の診断の比率が増加し、偽陽性または偽陰性の診断の比率が減少する。

本発明のアッセイおよび方法には、上記のように、免疫アッセイ、ハイブリッド形成アッセイ、およびＮＡＴベースのアッセイが含まれるが、これらに限定されない。肺癌診断を補助するための本発明のマーカーと上記の他のマーカーおよび／または完全に異なるマーカーとの組合わせを、ＮＡＴベースのアッセイ、免疫アッセイ、およびハイブリッド形成アッセイの組み合わせとして実施することができる。本発明の好ましい実施形態によれば、アッセイは、上記実施例に関する例として記載のＮＡＴベースのアッセイである。

さらに別の態様では、本発明は、肺癌診断を補助するためのキットであって、前記キットを使用して本発明のマーカーを検出することができる、キットを提供する。例えば、キットを使用して、肺癌患者および通常の患者のサンプル中で差分的に存在する上記のマーカーの任意の１つまたは組み合わせを検出することができる。本発明のキットは、広く適用される。例えば、キットを使用して、被験体が小細胞肺癌、非小細胞肺癌、腺癌、気管支肺胞癌、扁平上皮細胞癌、または大細胞癌を有するかどうかを識別するか、負の診断をすることにより肺癌診断を補助することができる。別の例では、キットを使用して、肺癌用のｉｎｖｉｔｒｏでの肺細胞またはｉｎｖｉｖｏでの動物モデルにおいてマーカーの発現を調整する化合物を同定することができる。

１つの実施形態では、キットは、（ａ）吸着剤を含む基質であって、前記吸着剤がマーカーの結合に適切である、基質と、（ｂ）洗浄液または洗浄液作製のための説明書を含み、前記吸着剤と洗浄液との組み合わせにより、前述のマーカーが検出される。

任意選択的に、キットは、さらに、標識または別のインサートの形態の適切な操作パラメータのための説明者を含み得る。例えば、キットは、消費者／キット使用者に、精漿サンプルまたは他の組織サンプルがプローブに接触した後にどのようにしてプローブを洗浄するのかについての情報を与える標準的な説明書を有し得る。

別の実施形態では、キットは、（ａ）マーカーに特異的に結合する抗体および（ｂ）検出試薬を含む。このようなキットを、上記の材料から調製することができる。

いずれかの実施形態では、キットは、任意選択的に、試験サンプルをコントロール情報標準および／またはコントロール量と比較して、サンプル中で検出されたマーカーの試験量が肺癌診断と一致する診断量であるかどうかを決定することができるような標準もしくはコントロールの情報および／またはコントロール量の材料をさらに含み得る。

本発明のスプライスバリアントの治療への適用
本明細書中に記載のスプライスバリアント（任意のポリヌクレオチド、オリゴヌクレオチド、ポリペプチド、ペプチド、またはこれらのフラグメントが含まれる）またはこれらに特異的に結合する抗体を、任意選択的に、例えば、その診断への適用に関して本明細書中に記載の疾患を治療するための治療への適用に使用することができる。「変異型治療可能な」疾患は、本発明の任意の治療タンパク質のスプライスバリアントの使用によって治療可能な任意の疾患をいう。「治療」はまた、疾患および／または病的状態の予防、改善、消失、および制御を含む。このような変異型が有用な治療薬であり得る疾患を、各変異型について以下により詳細に記載する。これらの変異型は公知のタンパク質のスプライスバリアントであるので、変異型自体を、「クラスター」または遺伝子と記載する。したがって、「クラスター関連疾患」または「変異型関連疾患」は、特定のタンパク質（このような疾患の記載に関して、本発明の治療タンパク質変異型）によって治療することができる疾患をいう。

本明細書中で使用される、用語「生物学的に活性な」は、天然に存在する分子の構造、調節、または生化学的機能を有するタンパク質をいう。同様に、「免疫学的に活性な」は、天然、組換え、または合成のリガンドまたはこれらの任意のオリゴペプチドが適切な動物または細胞における特異的免疫応答を誘導して特異的抗体と結合する能力をいう。

本明細書中で使用される、用語「調整する」は、少なくとも１つの受容体媒介活性の活性の変化をいう。例えば、調整により、タンパク質の活性、結合特性、またはリガンドの任意の他の生物学的、機能的、もしくは免疫学的性質が増加または減少し得る。

治療方法
上記のように、本発明の新規の治療タンパク質変異型およびこれに由来する組成物（すなわち、ペプチド、オリゴヌクレオチド）を使用して、クラスター関連疾患を治療することができる。

したがって、本発明のさらなる態様によれば、被験体におけるクラスター関連疾患の治療方法を提供する。

本発明の被験体は、上記のクラスター関連疾患の少なくとも１つの型を有する哺乳動物（好ましくは、ヒト）である。

上記のように、本発明の生体分子の配列を使用して、上記疾患を有する被験体を治療することができる。

本発明の被験体は、上記の疾患の１つを罹患していると診断されたか、上記の疾患の１つを罹患しやすい哺乳動物（好ましくは、ヒト）である。

本明細書中で使用される、用語「治療」は、上記疾患の治癒、逆転、軽減、緩和、最小化、抑制、または副作用の阻止をいう。

本発明によれば、被験体における本発明のポリペプチドの少なくとも１つの発現の特異的上方制御または下方制御によって治療することができる。

任意選択的に、被験体への本明細書中に記載の本発明のポリペプチド（例えば、組換えまたは合成）の少なくとも１つまたはその活性部分の投与によって上方制御することができる。しかし、巨大なポリペプチドの生物学的利用能は、分解率の高さおよび透過率の低さによって潜在的に比較的小さいので、ポリペプチドの投与を、小さなペプチドフラグメント（例えば、約１００アミノ酸）に制限することが好ましい。ポリペプチドまたはペプチドを、任意選択的に、以下により詳細に記載する薬学的組成物中で投与することができる。

本発明の上記疾患の治療を当該分野で公知の他の治療方法と組み合わせることができる（すなわち、併用療法）ことが認識される。したがって、本発明の薬剤を使用した悪性腫瘍の治療を、例えば、放射線療法、抗体療法、および／または化学療法と組み合わせることができる。

あるいはまたはさらに、任意選択的に、本発明のポリペプチドの少なくとも１つまたはその活性部分の被験体中の量（任意選択的に発現）の特異的上方制御によって上方制御法を行うことができる。

上記および以下の実施例に記載のように、本発明のこの態様の生体分子配列を、野生型遺伝子産物の活性または発現の変化が疾患の発症または進行に寄与することが公知である疾患の治療のための有益な治療ツールとして使用することができる。例えば、疾患が膜結合受容体の過剰発現に起因する場合、その可溶性変異型を、受容体と結合を競合し、それにより受容体からのシグナル伝達が終了するアンタゴニストとして使用することができる。

このような疾患の例を、以下の実施例の部に列挙する。

本発明のポリペプチドはまた、作動特性を有し得ることが認識される。これらには、リガンド（例えば、ＩＬ−４）の安定性、タンパク質分解からの防御、およびリガンドの薬物動態学的性質の改変（すなわち、リガンドの半減期が増加する一方で、そのクリアランスが減少する）が含まれる。したがって、本発明のこの態様の生体分子配列を使用して、野生型遺伝子産物が好ましい役割を果たす容態または疾患（例えば、糖尿病または虚血における血管形成の増加）を治療することができる。

本発明の治療タンパク質変異型発現を、上記のように、真核細胞（例えば、哺乳動物細）中でのコード配列の発現のためにデザインされた核酸発現構築物にライゲーションされた本発明の外因性ポリヌクレオチド配列の少なくとも１つの投与を介して上方制御することができる。したがって、外因性ポリヌクレオチド配列は、本発明の変異型をコードするＤＮＡもしくはＲＮＡまたはその活性部分であり得る。

下記の任意の適切な投与様式（すなわち、ｉｎ−ｖｉｖｏ遺伝子療法）を使用して、核酸構築物を個体に投与することができることが認識される。あるいは、適切な遺伝子送達体／方法（トランスフェクション、形質導入、相同組換えなど）および必要に応じて発現系によって核酸構築物を適切な細胞に導入し、改変された細胞を培養で拡大し、個体に戻す（すなわち、ｅｘ−ｖｉｖｏ遺伝子療法）。核酸構築物は、上により詳細に記載している。

本方法を、被験体における本発明の変異型の発現の特異的な内因性上方制御によって行うこともできることが認識される。所与の遺伝子の特異的スプライスバリアントの内因性発現の上方制御のための薬剤には、目的のスプライス部位に指向し、それにより遺伝子のスプライシングパターンが変化するアンチセンスオリゴヌクレオチドが含まれる。このアプローチは、Ｂｃｌ−ｘ（Ｔａｙｌｏｒ（１９９９）Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．１７：１０９７−１１００；ａｎｄＭｅｒｃａｔａｎｔｅ（２００１）Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７６：１６４１１−１６４１７）、ＩＬ−５Ｒ（Ｋａｒｒａｓ（２０００）Ｍｏｌ．Ｐｈａｒｍａｃｏｌ．５８：３８０−３８７）、およびｃ−ｍｙｃ（Ｇｉｌｅｓ（１９９９）ＡｎｔｉｓｅｎｓｅＡｃｉｄＤｒｕｇＤｅｖ．９：２１３−２２０）の２つのイソ型の発現の均衡を変化させるために首尾よく使用されている。

例えば、インターロイキン５およびその受容体は、造血の調節因子ならびにアレルギーおよび喘息などのいくつかの炎症性疾患におけるメディエーターとして重要な役割を果たす。２つの選択的にスプライシングされたイソ型は、ＩＬ−５Ｒ遺伝子から生成され、それぞれ、エクソン９を含むか（すなわち、長鎖形態）排除されている（すなわち、短鎖形態）。長鎖形態はインタクトな膜結合受容体をコードし、より短い形態は分泌された可溶性非機能性受容体をコードする。エクソン９領域に特異的な２’−Ｏ−ＭＯＥ−オリゴヌクレオチドを使用して、Ｋａｒｒａｓａｎｄｃｏ−ｗｏｒｋｅｒｓ（上記）は、野生型受容体の発現を有意に減少させ、より短いイソ型の発現を増加させることができた。本発明に使用することができるオリゴヌクレオチドのデザインおよび合成を以下に記載し、これらは、ＳａｚａｎｉａｎｄＫｏｌｅ（２００３）ＰｒｏｇｒｅｓｓｉｎＭｏｌｅｃｌｕｌａｒａｎｄＳｕｂｃｅｌｌｕｌａｒＢｉｏｌｏｇｙ３１：２１７−２３９による。

真核細胞（例えば、哺乳動物細胞）中でのコード配列の発現のためにデザインした核酸発現構築物にライゲーションした本発明の外因性ポリヌクレオチド配列（例えば、配列番号３、７、１１、１５、１９、２３、２７、３１、３５、３９、または４３）の少なくとも１つの投与によって、被験体における本発明のポリペプチド発現を上方制御することがができる。したがって、外因性ポリヌクレオチド配列は、本発明の変異型をコードするＤＮＡもしくはＲＮＡ配列またはその活性部分であり得る。

下記の任意の適切な投与様式（すなわち、ｉｎ−ｖｉｖｏ遺伝子療法）を使用して、核酸構築物を個体に投与することができることが認識される。あるいは、適切な遺伝子送達体／方法（トランスフェクション、形質導入、相同組換えなど）および必要に応じて発現系によって核酸構築物を適切な細胞に導入し、改変された細胞を培養で拡大し、個体に戻す（すなわち、ｅｘ−ｖｉｖｏ遺伝子療法）。

好ましくは、本発明の核酸構築物によって利用されるプロモーターは、形質転換された特定の細胞集団で活性である。細胞型特異的および／または組織特異的プロモーターの例には、肝臓特異的であるアルブミン（Ｐｉｎｋｅｒｔｅｔａｌ．，（１９８７）ＧｅｎｅｓＤｅｖ．１：２６８−２７７）、リンパ特異的プロモーター（Ｃａｌａｍｅｅｔａｌ．，（１９８８）Ａｄｖ．Ｉｍｍｕｎｏｌ．４３：２３５−２７５）、特に、Ｔ細胞受容体（Ｗｉｎｏｔｏｅｔａｌ．，（１９８９）ＥＭＢＯＪ．８：７２９−７３３）および免疫グロブリン（Ｂａｎｅｒｊｉｅｔａｌ．（１９８３）Ｃｅｌｌ３３７２９−７４０）のプロモーター、神経フィラメントプロモーター（Ｂｙｒｎｅｅｔａｌ．（１９８９）Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：５４７３−５４７７）などのニューロン特異的プロモーター、膵臓特異的プロモーター（Ｅｄｌｕｎｃｈｅｔａｌ．（１９８５）Ｓｃｉｅｎｃｅ２３０：９１２−９１６）、または乳清プロモーター（米国特許第４，８７３，３１６号および欧州特許出願番号ＥＰ２６４，１６６号）などの乳腺特異的プロモーターなどのプロモーターが含まれる。

適切な構築物の例には、ｐｃＤＮＡ３、ｐｃＤＮＡ３．１（+／−）、ｐＧＬ３、ＰｚｅｏＳＶ２（+／−）、ｐＤｉｓｐｌａｙ、ｐＥＦ／ｍｙｃ／ｃｙｔｏ、ｐＣＭＶ／ｍｙｃ／ｃｙｔｏ（それぞれＩｎｖｉｔｒｏｇｅｎＣｏ．（ｗｗｗ．ｉｎｖｉｔｒｏｇｅｎ．ｃｏｍ）から市販されている）が含まれるが、これらに限定されない。レトロウイルスベクターおよびパッケージング系の例は、Ｃｌｏｎｔｅｃｈ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．で販売されており、複数のクローニング部位にクローニング可能であり、導入遺伝子がＣＭＶプロモーターによって転写される、Ｒｅｔｒｏ−ＸベクターｐＬＮＣＸおよびｐＬＸＳＮが含まれる。導入遺伝子が５’ＬＴＲプロモーターから転写されるｐＢａｂｅなどのＭｏ−ＭｕＬＶ由来のベクターも含まれる。

現在好ましいｉｎｖｉｖｏ核酸導入技術には、アデノウイルス、レンチウイルス、単純ヘルペスＩウイルス、またはアデノ随伴ウイルス（ＡＡＶ）および脂質ベースの系などのウイルス構築物または非ウイルス構築物でのトランスフェクションが含まれる。脂質媒介遺伝子導入に有用な脂質は、例えば、ＤＯＴＭＡ、ＤＯＰＥ、およびＤＣ−Ｃｈｏｌである（Ｔｏｎｋｉｎｓｏｎｅｔａｌ．，ＣａｎｃｅｒＩｎｖｅｓｔｉｇａｔｉｏｎ，１４（１）：５４−６５（１９９６））。遺伝子療法で使用するための最も好まし構築物はウイルスであり、最も好ましくはアデノウイルス、ＡＡ、レンチウイルス、またはレトロウイルスである。レトロウイルス構築物などのウイルス構築物は、少なくとも１つの転写プロモーター／エンハンサーもしくは遺伝子座定義エレメント（ｌｏｃｕｓ−ｄｅｆｉｎｉｎｇｅｌｅｍｅｎｔ（ｓ））、または選択的スプライシング、核ＲＮＡ輸送、もしくはメッセンジャーの翻訳後修飾などの他の手段によって遺伝子発現を調節する他のエレメントを含む。このようなベクター構築物はまた、ウイルス構築物中に既に存在しない場合、使用ウイルスに適切なパッケージングシグナル、長末端反復（ＬＴＲｓ）もしくはその一部、およびプラス鎖およびマイナス鎖プライマー結合部位を含む。さらに、このような構築物は、典型呈には、配置される宿主細胞からのペプチドの分泌のためのシグナル配列を含む。好ましくは、この目的のためのシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異型のシグナル配列である。任意選択的に、構築物はまた、ポリアデニル化を指示するシグナルならびに１つまたは複数の制限部位および翻訳終結配列を含み得る。例として、このような構築物は、典型的には、５’ＬＴＲ、ｔＲＮＡ結合部位、パッケージングシグナル、二本鎖ＤＮＡ合成起源、および３’ＬＴＲまたはその一部を含む。カチオン性脂質、ポリリジン、およびデンドリマーなどの非ウイルス性の他のベクターを使用することができる。

本方法を、被験体における本発明のスプライスバリアントの発現の特異的な内因性上方制御によって行うこともできることが認識される。所与の遺伝子の特異的スプライスバリアントの内因性発現の上方制御のための薬剤には、目的のスプライス部位に指向し、それにより遺伝子のスプライシングパターンが変化するアンチセンスオリゴヌクレオチドが含まれる。このアプローチは、Ｂｃｌ−ｘ（Ｔａｙｌｏｒ（１９９９）Ｎａｔ．Ｂｉｏｔｅｃｈｎｏｌ．１７：１０９７−１１００；ａｎｄＭｅｒｃａｔａｎｔｅ（２００１）Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．２７６：１６４１１−１６４１７）、ＩＬ−５Ｒ（Ｋａｒｒａｓ（２０００）Ｍｏｌ．Ｐｈａｒｍａｃｏｌ．５８：３８０−３８７）、およびｃ−ｍｙｃ（Ｇｉｌｅｓ（１９９９）ＡｎｔｉｓｅｎｓｅＡｃｉｄＤｒｕｇＤｅｖ．９：２１３−２２０）の２つのイソ型の発現の均衡を変化させるために首尾よく使用されている。

好ましくは、本発明のポリペプチド変異型の少なくとも１つの発現（または活性）を特異的に下方制御することができる薬剤によって治療することができる。

以下により詳細に記載のオリゴヌクレオチドなどのオリゴヌクレオチドを使用して、本発明の治療タンパク質変異型の発現を下方制御することができる。

ｓｉＲＮＡ分子−小干渉ＲＮＡ（ｓｉＲＮＡ）分子を使用して、本発明の治療タンパク質変異型の発現を下方制御することができる。ＲＮＡ干渉は、２工程プロセスである。初期工程と呼ばれる第１の工程では、入力（ｉｎｐｕｔ）ｄｓＲＮＡを２１〜２３ヌクレオチド（ｎｔ）の小干渉ＲＮＡ（ｓｉＲＮＡ）に消化し、これはおそらくダイサー（ＡＴＰ依存性様式でｄｓＲＮＡ（直接か導入遺伝子またはウイルスによって導入される）をプロセシングする（切断する）ｄｓＲＮＡ特異的リボヌクレアーゼのＲＮアーゼＩＩＩファミリーのメンバー）の作用による。連続的切断により、ＲＮＡがそれぞれ２−ヌクレオチド３’オーバーハングを有する１９〜２１ｂｐの二重鎖（ｓｉＲＮＡ）に分解される（ＨｕｔｖａｇｎｅｒａｎｄＺａｍｏｒｅＣｕｒｒ．Ｏｐｉｎ．ＧｅｎｅｔｉｃｓａｎｄＤｅｖｅｌｏｐｍｅｎｔ１２：２２５−２３２（２００２）およびＢｅｒｎｓｔｅｉｎＮａｔｕｒｅ４０９：３６３−３６６（２００１））。

エフェクター工程では、ｓｉＲＮＡ二重鎖は、ヌクレアーゼ複合体と結合して、ＲＮＡ誘導サイレンシング複合体（ＲＩＳＣ）を形成する。ＲＩＳＣの活性化にはｓｉＲＮＡ二重鎖のＡＴＰ依存性巻き戻しが必要である。次いで、活性ＲＩＳＣは、塩基対合相互作用によって相同転写物をターゲティングし、ｍＲＮＡをｓｉＲＮＡの３’末端由来の１２ヌクレオチドフラグメントに切断する（ＨｕｔｖａｇｎｅｒａｎｄＺａｍｏｒｅＣｕｒｒ．Ｏｐｉｎ．ＧｅｎｅｔｉｃｓａｎｄＤｅｖｅｌｏｐｍｅｎｔ１２：２２５−２３２（２００２）；Ｈａｍｍｏｎｄｅｔａｌ．（２００１）Ｎａｔ．Ｒｅｖ．Ｇｅｎ．２：１１０−１１９（２００１）；ａｎｄＳｈａｒｐＧｅｎｅｓ．Ｄｅｖ．１５：４８５−９０（２００１））。切断機構は以前として解明されていないが、研究により、各ＲＩＳＣが１つのｓｉＲＮＡおよびＲＮアーゼを含むことが示されている（ＨｕｔｖａｇｎｅｒａｎｄＺａｍｏｒｅＣｕｒｒ．Ｏｐｉｎ．ＧｅｎｅｔｉｃｓａｎｄＤｅｖｅｌｏｐｍｅｎｔ１２：２２５−２３２（２００２））。

ＲＮＡｉの顕著な能力により、ＲＮＡｉ経路内の増幅工程が示唆されている。より多数のｓｉＲＮＡが生成されるであろう入力ｄｓＲＮＡのコピーまたは形成されたｓｉＲＮＡの複製によって増幅が起こり得る。あるいはまたはさらに、ＲＩＳＣの複数の代謝回転事象によって複製され得る（Ｈａｍｍｏｎｄｅｔａｌ．Ｎａｔ．Ｒｅｖ．Ｇｅｎ．２：１１０−１１９（２００１），ＳｈａｒｐＧｅｎｅｓ．Ｄｅｖ．１５：４８５−９０（２００１）；ＨｕｔｖａｇｎｅｒａｎｄＺａｍｏｒｅＣｕｒｒ．Ｏｐｉｎ．ＧｅｎｅｔｉｃｓａｎｄＤｅｖｅｌｏｐｍｅｎｔ１２：２２５−２３２（２００２））。ＲＮＡｉに関するより多くの情報については、以下の概説を参照のこと：ＴｕｓｃｈｌＣｈｅｍＢｉｏｃｈｅｍ．２：２３９−２４５（２００１）；ＣｕｌｌｅｎＮａｔ．Ｉｍｍｕｎｏｌ．３：５９７−５９９（２００２）；およびＢｒａｎｔｌＢｉｏｃｈｅｍ．Ｂｉｏｐｈｙｓ．Ａｃｔ．１５７５：１５−２５（２００２）。

本発明での使用に適切なＲＮＡｉ分子を以下のように合成することができる。第１に、ｍＲＮＡ配列を、ＡＡジヌクレオチド配列についてＡＵＧ開始コドンの下流をスキャンする。各ＡＡおよび３’隣接１９ヌクレオチドの発生を、潜在的ｓｉＲＮＡ標的部位として記録する。好ましくは、非翻訳領域（ＵＴＲ）はより多くの調節タンパク質結合部位に富むので、ｓｉＲＮＡ標的部位を、読み取り枠から選択する。ＵＴＲ結合タンパク質および／または翻訳開始複合体は、ｓｉＲＮＡエンドヌクレアーゼ複合体の結合を阻害し得る（ＴｕｓｃｈｌＣｈｅｍＢｉｏｃｈｅｍ．２：２３９−２４５）。ＧＡＰＤＨについて示すように、５’ＵＴＲに指向するｓｉＲＮＡは細胞ＧＡＰＤＨｍＲＮＡの約９０％減少を媒介し、タンパク質レベルを完全に消失させる（ｗｗｗ．ａｍｂｉｏｎ．ｃｏｍ／ｔｅｃｈｌｉｂ／ｔｎ／９１／９１２．ｈｔｍｌ）ので、非翻訳領域に指向するｓｉＲＮＡも有効であり得ることが認識される。

第２に、ＮＣＢＩサーバ（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＢＬＡＳＴ／）から利用可能なＢＬＡＳＴソフトウェアなどの任意の配列アラインメントソフトウェアを使用して、潜在的標的部位を適切なゲノムデータベース（例えば、ヒト、マウス、ラットなど）と比較する。他のコード配列に有意な相同性を示す推定標的部位をフィルターにかけて除去する。

適した標的配列を、ｓｉＲＮＡ合成のテンプレートとして選択する。好ましい配列は、Ｇ／Ｃ含量が５５％を超える配列と比較して遺伝子サイレンシングの効果がより高いことが証明されているので、Ｇ／Ｃ含量が低い配列である。好ましくは、評価のために、標的遺伝子の長さに沿っていくつかの標的部位を選択する。各ポリヌクレオチドが特異的に下方制御するように、標的部位を本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。選択されたｓｉＲＮＡのより良好な評価のために、ネガティブコントロールを組み合わせて使用することが好ましい。ネガティブコントロールｓｉＲＮＡは、好ましくは、ｓｉＲＮＡと同一のヌクレオチド組成を含むが、ゲノムとの有意な相同性を欠く。したがって、任意の他の遺伝子に対して有意な相同性を示さない場合、ｓｉＲＮＡのスクアランブルしたヌクレオチド配列を使用することが好ましい。

ＤＮＡｚｙｍｅ分子−本発明のポリペプチドの発現を下方制御することができる別の薬剤は、本発明のポリヌクレオチドのｍＲＮＡ転写物またはＤＮＡ配列を特異的に切断することができるＤＮＡｚｙｍｅ分子である。ＤＮＡｚｙｍｅは、一本鎖および二本鎖の標的配列の両方を切断することができる一本鎖ポリヌクレオチドである（Ｂｒｅａｋｅｒ，Ｒ．Ｒ．ａｎｄＪｏｙｃｅ，Ｇ．ＣｈｅｍｉｓｔｒｙａｎｄＢｉｏｌｏｇｙ１９９５；２：６５５；Ｓａｎｔｏｒｏ，Ｓ．Ｗ．＆Ｊｏｙｃｅ，Ｇ．Ｆ．Ｐｒｏｃ．Ｎａｔｌ，Ａｃａｄ．Ｓｃｉ．ＵＳＡ１９９７；９４３：４２６２）。ＤＮＡｚｙｍｅの一般的モデル（「１０−２３」モデル）が提案されている。「１０−２３」ＤＮＡｚｙｍｅは、７つ〜９つの各デオキシリボヌクレオチドの２つの基質認識ドメインに隣接した１５個のデオキシリボヌクレオチドの触媒触媒ドメインを有する。このＤＮＡｚｙｍｅ型は、プリン：ピリミジン連結点で基質ＲＮＡを有効に切断することができる（Ｓａｎｔｏｒｏ，Ｓ．Ｗ．＆Ｊｏｙｃｅ，Ｇ．Ｆ．Ｐｒｏｃ．Ｎａｔｌ，Ａｃａｄ．Ｓｃｉ．ＵＳＡ１９９、ＤＮＡｚｙｍｅの概説については、Ｋｈａｃｈｉｇｉａｎ，ＬＭ［ＣｕｒｒＯｐｉｎＭｏｌＴｈｅｒ４：１１９−２１（２００２）を参照のこと）。

ＤＮＡｚｙｍｅの標的部位を、各ポリヌクレオチドが特異的に下方制御するように、本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。

合成された操作ＤＮＡｚｙｍｅ認識される一本鎖および二本鎖標的切断部位の構築および増幅の例は、Ｊｏｙｃｅｅｔａｌ．に付与された米国特許第６，３２６，１７４号に開示されている。ヒトウロキナーゼ受容体に指向する類似のデザインのＤＮＡｚｙｍｅは、最近、ウロキナーゼ受容体発現を阻害し、ｉｎｖｉｖｏで結腸癌細胞の転移を首尾よく阻害することが認められた（Ｉｔｏｈｅｔａｌ，２０００２，Ａｂｓｔｒａｃｔ４０９，ＡｎｎＭｅｅｔｉｎｇＡｍＳｏｃＧｅｎＴｈｅｒｗｗｗ．ａｓｇｔ．ｏｒｇ）。別の適用では、ｂｃｒ−ａｂ１癌遺伝子に相補的なＤＮＡｚｙｍｅは、首尾の良く白血球中での癌遺伝子発現を阻害し、ＣＭＬおよびＡＬＬの場合に自己骨髄移植片中の再発率を減少させた。

アンチセンス分子−本発明のポリペプチド変異型をコードするｍＲＮＡ転写物と特異的にハイブリッド形成する個とができるアンチセンスポリヌクレオチドの使用によって、本発明のポリヌクレオチドを下方制御することもできる。

本明細書中で使用される、用語「アンチセンス」は、特異的にＤＮＡまたはＲＮＡ配列に相補的なヌクレオチド配列を含む任意の組成物をいう。

用語「アンチセンス鎖」は、「センス」鎖に相補的な核酸鎖に関して使用される。アンチセンス分子にはペプチド核酸も含まれ、合成または転写が含まれる任意の方法によって産生することができる。一旦細胞に移入されると、相補ヌクレオチドは、細胞によって産生された天然の配列と組み合わされて二重鎖を形成し、転写または翻訳のいずれかを遮断する。用語「ネガティブ」を、しばしばアンチセンス鎖に関して使用し、「ポジティブ」を、しばしばセンス鎖に関して使用する。アンチセンスオリゴヌクレオチドはまた、ｉｎｖｉｖｏでの選択的スプライシングの改変およびｉｎｖｉｖｏおよびｉｎｖｉｔｒｏでの診断のために使用される（ＫｈｅｌｉｆｉＣ．ｅｔａｌ．，２００２，ＣｕｒｒｅｎｔＰｈａｒｍａｃｅｕｔｉｃａｌＤｅｓｉｇｎ８：４５１−１４６６；Ｓａｚａｎｉ，Ｐ．，ａｎｄＫｏｌｅ．Ｒ．ＰｒｏｇｒｅｓｓｉｎＭｏｌｅｃｕｌａｒａｎｄＣｅｌｌｕｌａｒＢｉｏｌｏｇｙ，２００３，３１：２１７−２３９）。

アンチセンスアプローチに重要な以下の２つの態様を考慮しながら本発明のポリペプチドの発現を有効に下方制御するために使用することができるアンチセンス分子をデザインすることができる。第１の態様は、適切な細胞の細胞質へのオリゴヌクレオチドの送達であり、第２の態様は、デザインされたｍＲＮＡがその翻訳を阻害する方法で細胞内で特異的に結合するオリゴヌクレオチドのデザインである。

先行技術は、広範な種々の細胞型にオリゴヌクレオチドを有効に送達させるために使用することができる多数の送達ストラテジーを教示している（例えば、ＬｕｆｔＪＭｏｌＭｅｄ７６：７５−６（１９９８）；Ｋｒｏｎｅｎｗｅｔｔｅｔａｌ．Ｂｌｏｏｄ９１：８５２−６２（１９９８）；Ｒａｊｕｒｅｔａｌ．ＢｉｏｃｏｎｊｕｇＣｈｅｍ８：９３５−４０（１９９７）；Ｌａｖｉｇｎｅｅｔａｌ．ＢｉｏｃｈｅｍＢｉｏｐｈｙｓＲｅｓＣｏｍｍｕｎ２３７：５６６−７１（１９９７）およびＡｏｋｉｅｔａｌ．（１９９７）ＢｉｏｃｈｅｍＢｉｏｐｈｙｓＲｅｓＣｏｍｍｕｎ２３１：５４０−５（１９９７）を参照のこと）。

さらに、標的ｍＲＮＡおよびオリゴヌクレオチドの両方の構造変化のエネルギーを明らかにする熱力学サイクルに基づいてその標的ｍＲＮＡに対する最も高い推定結合親和性を有する配列を同定するためのアルゴリズムも利用可能である（例えば、Ｗａｌｔｏｎｅｔａｌ．ＢｉｏｔｅｃｈｎｏｌＢｉｏｅｎｇ６５：１−９（１９９９）を参照のこと）。

このようなアルゴリズムは、細胞におけるアンチセンスアプローチを実施するために首尾よく使用されている。例えば、Ｗａｌｔｏｎｅｔａｌ．によって開発されたアルゴリズムにより、科学者は、ウサギβ−グロビン（ＲＢＧ）およびマウス腫瘍壊死因子α（ＴＮＦα）転写物のアンチセンスオリゴヌクレオチドを首尾よくデザインすることができた。同一の研究グループは、最近、速度ＰＣＲ技術によって評価したところ、細胞培養物中の３つのモデル標的ｍＲＮＡ（ヒト乳酸デヒドロゲナーゼＡおよびＢならびにラットｇｐ１３０）に対して合理的に選択されたオリゴヌクレオチドのアンチセンス活性がほとんど全ての場合（ホスホジエステルおよびホスホロチオエートオリゴヌクレオチドの化学的性質を有する２つの細胞型における３つの異なる標的に体する試験が含まれる）で有効であることが証明されたことを報告している。

さらに、ｉｎｖｉｔｒｏ系を使用した特異的オリゴヌクレオチドの有効性のデザインおよび予想のためのいくつかのアプローチも公開されている（Ｍａｔｖｅｅｖａｅｔａｌ．，ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ１６：１３７４ − １３７５（１９９８））。

いくつかの臨床試験により、アンチセンスオリゴヌクレオチドの安全性、実現可能性、および活性が証明されている。例えば、癌治療に適切なアンチセンスオリゴヌクレオチドが首尾よく使用されており（Ｈｏｌｍｕｎｄｅｔａｌ．，ＣｕｒｒＯｐｉｎＭｏｌＴｈｅｒ１：３７２−８５（１９９９））、一方で、ｃ−ｍｙｂ遺伝子、ｐ５３、およびＢｃｌ−２をターゲティングするアンチセンスオリゴヌクレオチドによる血液悪性疾患の治療は臨床試験に入っており、患者に許容されることが認められている（ＧｅｒｗｉｔｚＣｕｒｒＯｐｉｎＭｏｌＴｈｅｒ１：２９７−３０６（１９９９））。

より最近では、ヘパラナーゼ遺伝子発現のアンチセンス媒介抑制は、マウスモデルにおいてヒト癌細胞の胸膜播種を阻害することが報告されている（Ｕｎｏｅｔａｌ．，ＣａｎｃｅｒＲｅｓ６１：７８５５−６０（２００１））。

したがって、上記のアンチセンステクノロジー分野の最近の開発により、高精度のアンチセンスデザインアルゴリズムおよび広範な種々のオリゴヌクレオチド送達系が得られ、当業者が過度な試験および誤った実験を用いることなく公知の配列の発現の下方制御に適切なアンチセンスアプローチをデザインして実施することができることが現在認められている。

各ポリヌクレオチドが特異的に下方制御されるように、アンチセンス分子の標的部位を本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。

リボザイム−本発明のポリペプチド発現を下方制御することができる別の薬剤は、本発明のポリペプチド変異型をコードするｍＲＮＡ転写物を特異的に切断することができるリボザイム分子である。リボザイムは、目的のタンパク質をコードするｍＲＮＡの切断による遺伝子発現の配列特異的阻害での使用が増加している（Ｗｅｌｃｈｅｔａｌ．，ＣｕｒｒＯｐｉｎＢｉｏｔｅｃｈｎｏｌ．９：４８６−９６（１９９８））。任意の特異的標的ＲＮＡを切断するためのリボザイムをデザインする可能性により、リボザイムは基礎研究および治療への適用の両方における有益なツールとなる。治療領域では、リボザイムは、感染症におけるウイルスＲＮＡ、癌における優性癌遺伝子、および遺伝子障害における特異的体細胞変異をターゲティングするために使用されている（Ｗｅｌｃｈｅｔａｌ．，ＣｌｉｎＤｉａｇｎＶｉｒｏｌ．１０：１６３−７１（１９９８））。最も顕著には、ＨＩＶ患者のためのいくつかのリボザイム遺伝子療法プロトコールは、既に第１相試験段階である。より最近には、トランスジェニック動物研究、遺伝子標的の検証、および経路の解明のためにリボザイムが使用されている。いくつかのリボザイムは、種々の臨床試験段階にある。ＡＮＧＩＯＺＹＭＥは、ヒト臨床試験で研究されるべき最初に合成されたリボザイムであった。ＡＮＧＩＯＺＹＭＥは、ＶＥＧＦ−ｒ（血管内皮成長因子受容体の形成（血管形成経路における重要成分）を特異的に阻害する。ＲｉｂｏｚｙｍｅＰｈａｒｍａｃｅｕｔｉｃａｌｓ，Ｉｎｃ．および他の企業は、動物モデルにおける抗血管形成療法の重要性を証明している。ＨＥＰＴＡＺＹＭＥ（Ｃ型肝炎ウイルス（ＨＣＶ）ＲＮＡを選択的に破壊するようにデザインされたリボザイムは、細胞培養アッセイにおけるＣ型肝炎ウイルスＲＮＡの減少に有効であることが見出された（ＲｉｂｏｚｙｍｅＰｈａｒｍａｃｅｕｔｉｃａｌｓ，Ｉｎｃｏｒｐｏｒａｔｅｄ − ＷＥＢホームページ）。

あるいは、本発明のポリペプチドに特異的に結合してその活性を阻害することができる抗体または抗体フラグメント（すなわち、中和抗体）などの下方制御薬を使用して、本発明のポリペプチド変異型をポリペプチドレベルで下方制御することができる。このような抗体は、例えば、変異型上のヘテロ二量体形成ドメインまたは推定リガンド結合ドメインに指向することができる。抗体および抗体の生成方法のさらなる説明を以下に示す。

薬学的組成物およびその送達
本発明は、治療有効量の本発明の治療薬（好ましくは、本明細書中に記載の治療タンパク質変異型である）を含む薬学的組成物を特徴とする。任意選択的およびあるいは、治療薬は、治療タンパク質変異型を特異的に認識して結合するが、対応する公知の全長タンパク質に対してはそうではない抗体またはオリゴヌクレオチドであり得る。

あるいは、本発明の薬学的組成物は、治療有効量の治療タンパク質変異ポリペプチドの少なくとも活性部分を含む。

本発明の薬学的組成物を、クラスター関連疾患の治療のために使用することが好ましい。

「治療」は、治療上の処置および予防手段または防止手段をいう。治療を必要とする者には、既に障害を罹患している者および障害を防止すべき者が含まれる。したがって、本明細書中で治療すべき哺乳動物は、障害を罹患していると診断され得るか、障害を罹患しやすいか障害が疑われ得る。治療を目的とする「哺乳動物」は、哺乳動物として分類される任意の動物（ヒト、家畜、動物園の動物、競技用の動物、またはペット（イヌ、ウマ、ネコ、ウシなど）が含まれる）をいう。好ましくは、哺乳動物はヒトである。

「障害」は、本発明の薬剤を使用した治療から利益を得るであろう任意の容態である。これには、慢性および急性障害または疾患（哺乳動物が問題の障害を罹患しやすい病的状態が含まれる）含まれる。本明細書中の治療すべき障害の非限定的な例を、本明細書中に記載の特定の例に関して記載する。

用語「治療有効量」は、哺乳動物の疾患または障害を有効に治療する本発明の薬剤の量をいう。癌の場合、治療有効量の薬剤により、癌細胞数が減少し、腫瘍サイズが減少し、癌細胞の周辺組織への浸潤を阻害し（すなわち、拡大が幾らか遅延し、好ましくは停止する）、腫瘍の転移を阻害し（すなわち、拡大が幾らか遅延し、好ましくは停止する）、腫瘍成長の拡大を幾らか阻害し、そして／または癌に関連する１つまたは複数の症状の拡大をいくらか緩和することができる。薬剤が既存の癌細胞の成長を防止し、そして／または死滅させることができる範囲で、細胞増殖抑制性および／または細胞傷害性を示し得る。癌療法のために、有効性を、例えば、疾患の進行（ＴＴＰ）の評価および／または応答率（ＲＲ）の決定によって測定することができる。

本発明の治療薬を、被験体自体に投与することができるか、薬学的に許容可能なキャリアと混合した薬学的組成物の一部として投与することができる。

本明細書中で使用される、「薬学的組成物」は、生理学的に適切なキャリアおよび賦形剤などの他の化学成分を含む本明細書中に記載の１つまたは複数の有効成分の調製物をいう。薬学的組成物の目的は、生物への化合物の投与を容易にすることである。

本明細書中に記載の用語「有効成分」は、生物学的効果を担う調製物をいう。

以後、交換可能に使用することができる句「生理学的に許容可能なキャリア」および「薬学的に許容可能なキャリア」は、生物に有意な炎症を引き起こさず、且つ生物活性およびおよび投与した化合物の性質を無効にしないキャリアまたは希釈剤をいう。アジュバントは、これらの句に含まれる。薬学的に許容可能なキャリアに含まれる成分の１つは、例えば、ポリエチレングリコール（ＰＥＧ）（有機媒体および水性媒体の両方に広範な溶解性を示す生体適合ポリマー）であり得る（Ｍｕｔｔｅｒｅｔａｌ．（１９７９）。

本明細書中の用語「賦形剤」は、有効成分の投与をさらに容易にするために薬学的組成物に添加される不活性物質をいう。制限されない賦形剤の例には、炭酸カルシウム、リン酸カルシウム、種々の糖およびデンプン型、セルロース誘導体、ゼラチン、植物油、ならびにポリエチレングリコールが含まれる。

薬物の処方および投与技術を、"Ｒｅｍｉｎｇｔｏｎ’ｓＰｈａｒｍａｃｅｕｔｉｃａｌＳｃｉｅｎｃｅｓ，" ＭａｃｋＰｕｂｌｉｓｈｉｎｇＣｏ．，Ｅａｓｔｏｎ，ＰＡ，ｌａｔｅｓｔｅｄｉｔｉｏｎ（本明細書中で参考として援用される）に見出すことができる。

適切な投与経路には、例えば、経口、直腸、経粘膜（特に、経鼻、腸）、または非経口送達（筋肉内、皮下、および脊髄内が含まれる）、および髄腔内、直接脳室内、静脈内、腹腔内、鼻腔内、または眼内注射が含まれる。あるいは、全身様式よりもむしろ、例えば、患者の身体の特定の領域への直接的な調製物の注射によって局所的に調製物を投与することができる。

本発明の薬学的組成物を、当該分野で周知のプロセス（例えば、従来の混合、溶解、顆粒化、ドラジェ作製、粉末化、乳化、カプセル化、捕捉、または凍結乾燥プロセス）によって製造することができる。

本発明で使用される薬学的組成物を、有効成分の薬学的に使用することができる調製物への処理を容易にする賦形剤および助剤を含む１つまたは複数の生理学的に許容可能なキャリアを使用した従来の様式で処方することができる。適切な処方物は、選択した投与経路に依存する。

注射のために、本発明の有効成分を、水溶液、好ましくは、ハンクス液、リンゲル液、または生理食塩水等の生理学的に適合可能な緩衝液中に処方することができる。経粘膜投与のために、透過すべき障壁に適切な浸透剤を処方に使用する。このような浸透剤は、当該分野で公知である。

経口投与のために、化合物を、活性化合物と当該分野で周知の薬学的に許容可能なキャリアとの組み合わせによって容易に処方することができる。このようなキャリアにより、本発明の化合物を、患者が経口摂取するための錠剤、丸薬、ドラジェ、カプセル、液体、ゲル、シロップ、および懸濁液などとして処方することができる。固体賦形剤を使用して経口用の薬理学的調製物を作製することができ、任意選択的に、得られた混合物を摩砕し、所望ならばその後適切な助剤を添加して顆粒混合物を処理し、錠剤またはドラジェコアを得ることができる。適切な賦形剤は、特に、糖（ラクトース、スクロース、マンニトール、またはソルビトールが含まれる）などの充填剤、例えば、トウモロコシデンプン、コムギデンプン、コメデンプン、ジャガイモデンプン、ゼラチン、トラガカントガム、メチルセルロース、ヒドロキシプロピルメチルセルロース、カルボメチルセルロースナトリウムなどのセルロース調製物、および／またはポリビニルピロリドン（ＰＶＰ）などの生理学的に許容可能なポリマーである。所望ならば、架橋ポリビニルピロリドン、寒天、またはアルギン酸もしくはアルギン酸ナトリウムなどのその塩などの崩壊剤を添加することができる。

適切なコーティングを使用してドラジェコアが得られる。この目的のために、任意選択的に、アラビアゴム、タルク、ポリビニルピロリドン、カルボポールゲル、ポリエチレングリコール、二酸化チタン、ラッカー液、および適切な有機溶媒または溶媒混合物を含み得る濃縮糖溶液を使用することができる。活性化合物の用量の異なる組み合せの識別または特徴づけのために、錠剤またはドラジェコーティングに染料または色素を添加することができる。

経口で使用することができる薬学的組成物には、ゼラチンおよび軟ゼラチン製の押し込み型カプセル、ゼラチンおよび可塑剤（グリセロールまたはソルビトールなど）から作製された密閉カプセルが含まれる。押し込み型カプセルは、ラクトースなどの充填剤、デンプンなどの結合剤、タルクまたはステアリン酸マグネシウムなどの潤滑剤、および任意選択的に安定剤との混合物中に有効成分を含み得る。軟カプセルでは、有効成分を、脂肪油、液体パラフィン、または液体ポリエチレングリコール等の適切な液体中に溶解または懸濁することができる。さらに、安定剤を添加することができる。経口投与用の全処方物は、選択された投与経路に適切な投薬量であるべきである。

口内投与のために、組成物は、従来の様式で処方された錠剤またはロゼンジの形態をとることができる。

鼻孔吸入による投与のために、本発明で使用される有効成分を、適切な噴射剤（例えば、ジクロロジフルオロメタン、トリクロロフルオロメタン、ジクロロ−テトラフルオロエタン、または二酸化炭素）を使用した加圧パックまたは噴霧器由来のエアゾールスプレー調製物の形態で都合よく送達される。加圧エアゾールの場合、一定量を送達するためのバルブを設置することによって、投薬単位を決定することができる。化合物とラクトースまたはデンプン等の適切な粉末基剤との粉末混合物を含む、例えば、投薬用のゼラチンのカプセルおよび薬包を処方することができる。

本明細書中に記載の調製物を、例えば、ボーラス注射または持続注入による非経口投与のために処方することができる。注射用処方物は、任意選択的に防腐剤を添加した単位投薬形態（例えば、アンプルまたは複数回投与容器）で存在し得る。組成物は、油性または水性媒体の懸濁液、溶液、または乳濁液であってよく、懸濁剤、安定剤、および／または分散剤などの処方薬（ｆｏｒｍｕｌａｔｏｒｙａｇｅｎｔ）を含み得る。

非経口投与用の薬学的組成物には、水溶性形態の活性調製物水溶液が含まれる。さらに、有効成分の懸濁液を、適切な油性または水ベースの懸濁液として調製することができる。適切な親油性溶媒または媒体には、ゴマ油などの脂肪油またはオレイン酸エチル、トリグリセリド、またはリポソーム等の合成脂肪酸エステルが含まれる。注射用水性懸濁液は、カルボキシメチルセルロースナトリウム、ソルビトール、またはデキストランなどの懸濁液の粘度を増加させる物質を含み得る。任意選択的に、懸濁液はまた、高度に濃縮された溶液を調製するために有効成分の溶解性を増加させる適切な安定剤または薬剤を含み得る。

あるいは、有効成分は、使用前に、適切な媒体（例えば、滅菌した無発熱物質ベースの溶液）で構成するための粉末形態であり得る。

本発明の調製物を、例えば、ココアバターまたは他のグリセリドなどの従来の座剤の基剤を使用した座剤または保留浣腸などの直腸組成物で処方することもできる。

本発明の状況での使用に適切な薬学的組成物には、意図する目的を達成するための有効量の有効成分を含む組成物が含まれる。より詳細には、治療有効量は、疾患の症状を予防、緩和、または改善するか、治療を受ける被験体の生存を延長するのに有効な有効成分の量を意味する。

治療有効量の決定は、十分に当業者の能力の範囲内である。

本発明の方法で使用された任意の調製物のために、治療有効量または用量を、最初にｉｎｖｉｔｒｏアッセイから評価することができる。例えば、用量を動物モデルで決定し、このような情報を使用してヒトで有用な用量をより正確に決定することができる。

本明細書中に記載の有効成分の毒性および治療有効性を、ｉｎｖｉｔｒｏでの標準的な薬学的手順、細胞培養、または実験動物によって決定することができる。これらのｉｎｖｉｔｒｏアッセイおよび細胞培養アッセイならびに動物研究から得たデータを、ヒトで用いる投薬量範囲の決定で使用することができる。投薬量は、使用した投薬形態および使用した投与経路によって変化し得る。正確な処方物、投与経路、および投薬量を、患者の状態を考慮して各医師が選択することができる（例えば、Ｆｉｎｇｌ，ｅｔａｌ．，１９７５，ｉｎ "ＴｈｅＰｈａｒｍａｃｏｌｏｇｉｃａｌＢａｓｉｓｏｆＴｈｅｒａｐｅｕｔｉｃｓ"，Ｃｈ．１ｐ．１を参照のこと）。

治療すべき容態の重症度および応答性に依存して、投与は、単回投与または複数回投与であり、数日から数週間または治癒するか病態の軽減が達成されるまで治療が続けることができる。

組成物の投与量は、勿論、治療を受ける被験体、苦痛の重症度、投与様式、主治医の判断に依存する。

適合可能な薬学的キャリア中に処方された本発明の調製物を含む組成物を、適用される病態の治療のために調製し、適切なキャリア中に配置し、ラベルをつけることができる。

本発明の薬学的組成物を、所望ならば、有効成分を含む１つまたは複数の単位投薬形態を含み得るＦＤＡ承認キットなどのパックまたは分注デバイス中に入れることができる。パックは、例えば、金属箔またはプラスチック箔を含み得る（ブリスターパックなど）。パックまたは分注器を、政府機関による製造、医薬品の使用または販売に関する規制にしたがって処方された形態で容器に付随する通知に適合させることもでき、通知は、組成物の形態またはヒトもしくは動物への投与についての政府による承認を反映する。このような通知は、例えば、薬物の処方について米国食品医薬品局によって承認された表示または承認された製品の挿入物であり得る。

免疫原性組成物
本発明の治療薬は、任意選択的に、被験体における本発明のポリペプチドの少なくとも１つに対する特異的免疫原性応答を促進する分子であり得る。分子は、本発明のポリペプチド変異型、これに由来するフラグメント、またはこれをコードする核酸配列であり得る。このような分子を被験体自身に投与することができるが、薬剤を、免疫原性組成物中で免疫賦活剤と共に投与することが好ましい。免疫賦活剤は、外因性抗原に対する免疫応答（抗体および／または細胞媒介性）を増強または強化する任意の物質であり得る。免疫賦活剤の例には、化合物が組み込まれるアジュバント、生分解性ミクロスフィア（例えば、ポリ乳酸ガラクチド）、およびリポソームが含まれる（例えば、米国特許第４，２３５，８７７号を参照のこと）。ワクチン調製物は、一般に、例えば、Ｍ．Ｆ．ＰｏｗｅｌｌａｎｄＭ．Ｊ．Ｎｅｗｍａｎ，ｅｄｓ．，"ＶａｃｃｉｎｅＤｅｓｉｇｎ（ｔｈｅｓｕｂｕｎｉｔａｎｄａｄｊｕｖａｎｔａｐｐｒｏａｃｈ），"ＰｌｅｎｕｍＰｒｅｓｓ（ＮＹ，１９９５）に記載されている。

例示的免疫原性組成物は、ポリペプチドがｉｎｓｉｔｕで生成するように、１つまたは複数の上記のポリペプチドをコードするＤＮＡを含み得る。ＤＮＡは、当業者に公知の任意の種々の送達系（核酸発現系（以下を参照のこと）、細菌およびウイルス発現系が含まれる）に存在し得る。多数の遺伝子送達技術（Ｒｏｌｌａｎｄ，Ｃｒｉｔ．Ｒｅｖ．Ｔｈｅｒａｐ．ＤｒｕｇＣａｒｒｉｅｒＳｙｓｔｅｍｓ１５：１４３−１９８，１９９８およびその参考文献に記載のものなど）が当該分野で周知である。適切な核酸発現系は、被験体中での発現に必要なＤＮＡ配列（適切なプロモーターおよび終結シグナルなど）を含む。細菌送達系は、その細胞表面上のポリペプチドの免疫原性部分を発現するか、このようなエピトープを分泌する細菌（カルメット・ゲラン菌など）の投与を含む。好ましい実施形態では、ＤＮＡを、ウイルス発現系（例えば、ワクシニアもしくは他のポックスウイルス、レトロウイルス、またはアデノウイルス）を使用して移入することができ、非病原性（欠損）複製コンピテントウイルスの使用を含み得る。適切な系は、例えば、Ｆｉｓｈｅｒ−Ｈｏｃｈｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：３１７−３２１，１９８９；Ｆｌｅｘｎｅｒｅｔａｌ．，Ａｎｎ．Ｎ．ＹＡｃａｄ．Ｓｃｉ．５６９：８６−１０３，１９８９；Ｆｌｅｘｎｅｒｅｔａｌ．，Ｖａｃｃｉｎｅ８：１７−２１，１９９０；米国特許第４，６０３，１１２、同第４，７６９，３３０号、および同第５，０１７，４８７号、ＷＯ８９／０１９７３；米国特許第４，７７７，１２７号；英国特許第２，２００，６５１号；欧州特許第０，３４５，２４２号；ＷＯ９１／０２８０５；Ｂｅｒｋｎｅｒ，Ｂｉｏｔｅｃｈｎｉｑｕｅｓ６：６１６−６２７，１９８８；Ｒｏｓｅｎｆｅｌｄｅｔａｌ．，Ｓｃｉｅｎｃｅ２５２：４３１−４３４，１９９１；Ｋｏｌｌｓｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９１：２１５−２１９，１９９４；Ｋａｓｓ−Ｅｉｓｌｅｒｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９０：１１４９８−１１５０２，１９９３；Ｇｕｚｍａｎｅｔａｌ．，Ｃｉｒｃｕｌａｔｉｏｎ８８：２８３８−２８４８，１９９３；およびＧｕｚｍａｎｅｔａｌ．，Ｃｉｒ．Ｒｅｓ．７３：１２０２−１２０７，１９９３に開示されている。ＤＮＡをこのような発現系に組み込む技術は、当業者に周知である。例えば、Ｕｌｍｅｒｅｔａｌ．，Ｓｃｉｅｎｃｅ２５９：１７４５−１７４９，１９９３に記載され、Ｃｏｈｅｎ，Ｓｃｉｅｎｃｅ２５９：１６９１−１６９２，１９９３に概説されるように、ＤＮＡを、「裸にする」こともできる。裸のＤＮＡの取り込みを、生分解性ビーズにＤＮＡをコーティングし、細胞に有効に輸送することによって増加させることができる。

免疫原性組成物がポリヌクレオチド成分およびポリペプチド成分の両方を含むことができることが認識される。このような免疫原性組成物は、免疫応答を増強することができる。

任意の種々の免疫賦活剤を、本発明の免疫原性組成物で使用することができる。例えば、アジュバントを含むことができる。ほとんどのアジュバントは、急速な代謝から抗原を保護するためにデザインされた物質（水酸化アルミニウムまたは鉱物油）および免疫応答の刺激物質（脂質Ａ、百日咳菌または結核菌由来のタンパク質など）を含む。適切なアジュバントは、例えば、フロイントの不完全アジュバントおよび完全アジュバント（ＤｉｆｃｏＬａｂｏｒａｔｏｒｉｅｓ，Ｄｅｔｒｏｉｔ，Ｍｉｃｈ．）、Ｍｅｒｃｋアジュバント６５（ＭｅｒｃｋａｎｄＣｏｍｐａｎｙ，Ｉｎｃ．，Ｒａｈｗａｙ，Ｎ．Ｊ．）、ＡＳ−２（ＳｍｉｔｈＫｌｉｎｅＢｅｅｃｈａｍ，Ｐｈｉｌａｄｅｌｐｈｉａ，Ｐａ．）、水酸化アルミニウムゲル（ミョウバン）またはリン酸アルミニウムなどのアルミニウム塩、カルシウム塩、鉄、または亜鉛の塩、アシル化チロシンの不溶性懸濁液、アシル化糖、カチオン性またはアニオン性誘導多糖類、ポリホスファゼン、生分解性ミクロスフィア、モノホスホリル脂質ＡおよびｑｕｉＡとして市販されている。ＧＭ−ＣＳＦまたはインターロイキン−２、−７、もしくは−１２などのサイトカインもアジュバントとして使用することができる。

アジュバント組成物を、Ｔｈ１型の免疫応答を支配的に誘導するようにデザインすることができる。高レベルのＴｈ１型サイトカイン（例えば、ＩＦＮ−γ、ＴＮＦ−α、ＩＬ−２、およびＩＬ−１２）は、投与した抗原に対して細胞性免疫応答を誘導する傾向がある。対照的に、高レベルのＴｈ２型サイトカイン（例えば、ＩＬ−４、ＩＬ−５、ＩＬ−６、およびＩＬ−１０）は体液性免疫を誘導する傾向がある。本明細書中に記載の免疫原性組成物の適用後、被験体は、Ｔｈ１型応答およびＴｈ２型応答を誘導する免疫応答を支持する。これらのサイトカインのレベルを、標準的なアッセイを使用して容易に評価することができる。サイトカインファミリーの概説については、ＭｏｓｍａｎｎａｎｄＣｏｆｆｉｎａｎ，Ａｎｎ．Ｒｅｖ．Ｉｍｍｕｎｏｌ．７：１４５−１７３，１９８９を参照のこと。

Ｔｈ１型応答の支配的な誘発で用いる好ましいアジュバントには、例えば、モノホスホリル脂質Ａ（好ましくは、３−ｄｅ−Ｏアシル化モノホスホリル脂質Ａ（３Ｄ−ＭＰＬ））とアルミニウム塩との組み合わせが含まれる。ＭＰＬアジュバントは、ＣｏｒｉｘａＣｏｒｐｏｒａｔｉｏｎから市販されている（Ｓｅａｔｔｌｅ，Ｗａｓｈ．、米国特許第４，４３６，７２７号、同第４，８７７，６１１号、同第４，８６６，０３４号、および同第４，９１２，０９４号を参照のこと）。ＣｐＧ含有オリゴヌクレオチド（ＣｐＧジヌクレオチドが非メチル化されている）もＴｈ１応答を支配的に誘導する。このようなオリゴヌクレオチドは当該分野で周知であり、例えば、ＷＯ９６／０２５５５号、ＷＯ９９／３３４８８号、ならびに米国特許第６，００８，２００号および同第５，８５６，４６２号に記載されている。免疫促進性ＤＮＡ配列はまた、例えば、Ｓａｔｏｅｔａｌ．，Ｓｃｉｅｎｃｅ２７３：３５２，１９９６に記載されている。別の好ましいアジュバントはサポニン（好ましくは、ＱＳ２１（ＡｑｕｉｌａＢｉｏｐｈａｒｍａｃｅｕｔｉｃａｌｓＩｎｃ．，Ｆｒａｍｉｎｇｈａｍ，Ｍａｓｓ．））であり、これは、単独または他のアジュバントと組み合わせて使用することができる。例えば、増強された系は、モノホスホリル脂質Ａとサポニン誘導体との組み合わせ（ＷＯ９４／００１５３に記載のＱＳ２１と３Ｄ−ＭＰＬとの組み合わせまたはＷＯ９６／３３７３９号に記載のＱ２１がコレステロールで抑制されたより反応性の低い組み合わせなど）を含む。他の好ましい処方物は、水中油滴型乳濁液およびトコフェロールを含む。ＱＳ２１、３Ｄ−ＭＰＬ、およびトコフェロールを含む水中油滴型乳濁液を含む特に強力なアジュバント処方物は、ＷＯ９５／１７２１０号に記載されている。

他の好ましいアジュバントには、ＭｏｎｔａｎｉｄｅＩＳＡ７２０（Ｓｅｐｐｉｃ，Ｆｒａｎｃｅ）、ＳＡＦ（Ｃｈｉｒｏｎ，Ｃａｌｉｆ．，ＵｎｉｔｅｄＳｔａｔｅｓ）、ＩＳＣＯＭＳ（ＣＳＬ）、ＭＦ−５９（Ｃｈｉｒｏｎ）、ＳＢＡＳシリーズのアジュバント（例えば、ＳｍｉｔｈＫｌｉｎｅＢｅｅｃｈａｍ，Ｒｉｘｅｎｓａｒｔ，Ｂｅｌｇｉｕｍから市販されているＳＢＡＳ−２またはＳＢＡＳ−４）、Ｄｅｔｏｘ（Ｃｏｒｉｘａ，Ｈａｍｉｌｔｏｎ，Ｍｏｎｔ．）、ＲＣ−５２９（Ｃｏｒｉｘａ，Ｈａｍｉｌｔｏｎ，Ｍｏｎｔ．）、および他のアミノアルキルグルコサミニド四リン酸（ＡＧＰ）（係属中の米国特許出願番号０８／８５３，８２６号および同第０９／０７４，７２０号に記載のものなど）が含まれる。

送達体（ｄｅｌｉｖｅｒｙｖｅｈｉｃｌｅ）を本発明の免疫原性組成物内で使用して、腫瘍細胞をターゲティングする抗原特異的免疫応答を容易にすることができる。送達体には、抗原提示細胞（ＡＰＣ）（樹状細胞、マクロファージ、Ｂ細胞、単球など）およびＡＰＣを効率的にするように操作することができる他の細胞が含まれる。このような細胞を、抗原提示能力を増加させ、活性化および／またはＴ細胞応答の維持を改良し、それ自体が抗腫瘍効果を有し、そして／またはレシーバと免疫学的に適合するように遺伝子操作することができる。ＡＰＣを、一般に、任意の種々の生体液（腫瘍および腫瘍周辺組織が含まれる）から単離することができ、これらは、自系細胞、同種異型細胞、同系細胞、または異種細胞であり得る。

樹状細胞は、非常に強力なＡＰＣであり（ＢａｎｃｈｅｒｅａｕａｎｄＳｔｅｉｎｍａｎ，Ｎａｔｕｒｅ３９２：２４５−２５１，１９９８）、予防的または治療的抗腫瘍免疫を誘発するための生理学的アジュバントとして有効であることが示されている（ＴｉｍｍｅｒｎａｎａｎｄＬｅｖｙ，Ａｎｎ．Ｒｅｖ．Ｍｅｄ．５０：５０７−５２９，１９９９を参照のこと）。一般に、樹状細胞を、その典型的な形状（ｉｎｓｉｔｕで星形、ｉｎｖｉｔｒｏで認められる際立った細胞質突起（樹状突起））、効率の良い抗原の取り込み、処理、および提示能力、ならびにナイーブＴ細胞応答を活性化する能力に基づいて同定することができる。樹状細胞を、勿論、ｉｎｖｉｖｏまたはｅｘｖｉｖｏにて樹状細胞上で一般に見出されない特異的な細胞表面受容体またはリガンドを発現するように操作することができ、このような修飾樹状細胞は、本発明で意図される。樹状細胞の代わりとして、分泌性小胞である抗原負荷樹状細胞（エキソソームと呼ばれる）を、免疫原性組成物内で使用することができる（Ｚｉｔｖｏｇｅｌｅｔａｌ．，ＮａｔｕｒｅＭｅｄ．４：５９４−６００，１９９８を参照のこと）。

樹状細胞および前駆体を、末梢血、骨髄、腫瘍浸潤細胞、腫瘍周辺組織浸潤細胞、リンパ節、脾臓、皮膚、臍帯血、または任意の他の適切な組織もしくは流動物から得ることができる。例えば、末梢血から採取した単球の培養物へのＧＭ−ＣＳＦ、ＩＬ−４、ＩＬ−１３、および／またはＴＮＦαなどのサイトカインの組み合わせの添加によって、樹状細胞をｅｘｖｉｖｏで分化させることができる。あるいは、末梢血、臍帯血、または骨髄から採取したＣＤ３４陽性細胞を、培養液へのＧＭ−ＣＳＦ、ＩＬ−１３、ＴＮＦα、ＣＤ４０リガンド、ＬＰＳ、ｆｌｔ３リガンド、および／または樹状細胞の分化、成熟、および増殖を誘導する他の化合物の組み合わせの添加によって樹状細胞に分化させることができる。

樹状細胞を、「未熟」細胞および「成熟」細胞に分類し、これらは、簡単な方法によって２つの十分に特徴づけられた表現型に区別される。未熟樹状細胞は、高い抗原の取り込みおよび処理能力を有するＡＰＣとして特徴づけられ、この能力は高いＦｃｙ受容体およびマンノース受容体発現と相関する。成熟表現型は、典型的には、これらのマーカーの発現はより低いが、クラスＩおよびクラスＩＩＭＨＣなどのＴ細胞活性化を担う細胞表面分子、接着分子（例えば、ＣＤ５４およびＣＤ１１）、ならびに共起刺激分子（例えば、ＣＤ４０、ＣＤ８０、ＣＤ８６、および４−１ＢＢ）の発現は高いことを特徴とする。

ＡＰＣを、一般に、変異型ＩＩまたはその免疫原性部分が細胞表面上に発現するように、本発明のポリペプチドをコードする少なくとも１つのポリヌクレオチドでトランスフェクトすることができる。このようなトランスフェクションはｅｘｖｉｖｏで起こる可能性があり、本明細書中に記載のように、このようなトランスフェクトされた細胞を含む組成物を、治療目的のために使用することができる。あるいは、樹状細胞または他の抗原提示細胞をターゲティングする遺伝子送達体を被験体に投与し、ｉｎｖｉｖｏでトランスフェクションを起こすことができる。例えば、樹状細胞のｉｎｖｉｖｏおよびｅｘｖｉｖｏトランスフェクションを、当該分野で公知の任意の方法（ＷＯ９７／２４４４７号に記載の方法またはＭａｈｖｉｅｔａｌ．，ＩｍｍｕｎｏｌｏｇｙａｎｄｃｅｌｌＢｉｏｌｏｇｙ７５：４５６−４６０，１９９７に記載の遺伝子銃アプローチなど）を使用して行うことができる。樹状細胞または前駆細胞と本発明のポリペプチド、ＤＮＡ（裸またはプラスミドベクター内）もしくはＲＮＡまたは抗原発現組換え細菌もしくはウイルス（例えば、ワクシニア、鶏痘ウイルス、アデノウイルス、またはレンチウイルスのベクター）とのインキュベーションによって、樹状細胞の抗原負荷を行うことができる。負荷前に、ポリペプチドを、免疫学的パートナーに共有結合させて、上記などのＴ細胞ヘルプ（例えば、キャリア分子）を得ることができる。あるいは、樹状細胞を、個別またはポリペプチドの存在下で、非抱合免疫学的パートナーでパルスすることができる。

明確にするために個別の実施形態に記載した本発明の一定の特徴を１つの実施形態に組み合わせて提供することもできることが認識される。逆に、明確にするために１つの実施形態に記載した本発明の種々の特徴を、個別または任意の適切なサブコンビネーション中に提供することもできる。

本発明をその特定の実施形態と組み合わせて記載しているが、多数の変更形態、修正形態、および変形形態が当業者に自明であることが明白である。したがって、添付の特許請求の範囲の精神および範囲内に含まれるこのような全ての変更形態、修正形態、および変形形態が含まれることが意図される。本明細書中に記載の全ての刊行物、特許、および特許出願は、それぞれ刊行物、特許、および特許出願が具体的且つ個別に本明細書中で参考として援用されることが示されるのと同一の範囲でその全体が本明細書中で参考として援用される。さらに、本明細書中の任意の引例を引用および同定することにより、このような引例が本発明の先行技術として利用可能であると解釈されるべきではない。

癌バイオマーカー選択エンジンおよびウェットバリデーション（ｗｅｔｖａｌｉｄａｔｉｏｎ）段階の概要のまとめを示す図である。固有の配列領域の有無に基づいた所与のコンティグの転写物の分類を示す略図である。定量的実時間ＰＣＲ分析の概要のまとめを示す図である。オリゴヌクレオチドベースのマイクロアレイ作製についての略図である。オリゴヌクレオチドベースのマイクロアレイ実験の流れの概要のまとめを示す図である。脳悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＨ６１７７５についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常および癌性肺組織における配列名Ｈ６１７７５ｓｅｇ８中に示された、アンプリコンによって検出可能な免疫グロブリンスーパーファミリーのメンバー９の変異型の転写物（Ｈ６１７７５転写物）の発現を示すヒストグラムである。異なる正常組織における配列名配列名Ｈ６１７７５ｓｅｇ８中に示された、アンプリコンによって検出可能な免疫グロブリンスーパーファミリーのメンバー９のＨ６１７７５転写物の発現を示すヒストグラムである。上皮悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＭ８５４９１についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｍ８５４９１ｓｅｇ２４中に示された、アンプリコンによって検出可能な上記ＥｐｈｒｉｎＢ型受容体２前駆体Ｍ８５４９１転写物の過剰発現を示すヒストグラムである。異なる正常組織における配列名Ｍ８５４９１ｓｅｇ２４中に示された、アンプリコンによって検出可能なＥｐｈｒｉｎＢ型受容体２前駆体（チロシン−タンパク質キナーゼ受容体ＥＰＨ−３）Ｍ８５４９１転写物の発現を示すヒストグラムである。肝臓癌、肺悪性腫瘍、および膵臓癌において過剰発現を示す、クラスターＴ３９９７１についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターＺ２１３６８についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｚ２１３６８ｊｕｎｃ１７−２１中に示された、アンプリコンによって検出可能な細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の過剰発現を示すヒストグラムである。異なる正常組織における配列名Ｚ２１３６８ｊｕｎｃ１７−２１中に示された、アンプリコンによって検出可能な細胞外スルファターゼＳｕｌｆ−１Ｚ２１３６８転写物の発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｚ２１３６８ｓｅｇ３９中に示された、アンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１（Ｚ２１３６８転写物）の過剰発現を示すヒストグラムである。異なる正常組織における配列名Ｚ２１３６８ｓｅｇ３９中に示された、アンプリコンによって検出可能なＳＵＬ１＿ＨＵＭＡＮ−細胞外スルファターゼＳｕｌｆ−１（Ｚ２１３６８転写物）の発現を示すヒストグラムである。異なる正常組織における配列名Ｚ４４８０８ｊｕｎｃ８−１１中に示された、アンプリコンによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２受容体（分泌性モジュラーカルシウム結合タンパク質２）（ＳＭＯＣ−２）（平滑筋関連タンパク質２）Ｚ４４８０８転写物の発現を示すヒストグラムである。正常サンプルと比較したいくつかの癌性肺サンプルにおける配列名ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７中に示された、アンプリコンによって検出可能なガストリン放出ペプチド（ＨＵＭＧＲＰ５Ｅ）転写物の過剰発現を示すヒストグラムである。異なる正常組織における配列名ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７中に示された、アンプリコンによって検出可能なガストリン放出ペプチド（ＨＵＭＧＲＰ５Ｅ）転写物の発現を示すヒストグラムである。子宮悪性脳腫瘍において過剰発現を示す、クラスターＦ０５０６８についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。結腸直腸癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性脳腫瘍、および膵臓癌において過剰発現を示す、クラスターＨ１４６２４についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。移行上皮癌、脳悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および胃癌において過剰発現を示す、クラスターＨ３８８０４についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性腫瘍および肺悪性腫瘍において過剰発現を示す、クラスターＨＳＥＮＡ７８についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。脳悪性腫瘍、結腸直腸癌、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＨＵＭＯＤＣＡについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。肺悪性腫瘍において過剰発現を示す、クラスターＲ００２９９についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。肺悪性腫瘍、悪性乳癌、および膵臓癌において過剰発現を示す、クラスターＺ４１６４４についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。結腸直腸癌、肺癌、および膵臓癌において過剰発現を示す、クラスターＺ４４８０８についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｚ４４８０８ｊｕｎｃ８−１１中に示された、アンプリコンによって検出可能なＳＭＯ２＿ＨＵＭＡＮＳＰＡＲＣ関連モジュラーカルシウム結合タンパク質２Ｚ４４８０８転写物の過剰発現を示すヒストグラムである。悪性脳腫瘍、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＡＡ１６１１８７についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＡＡ１６１１８７についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。悪性骨腫瘍、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および肺悪性腫瘍において過剰発現を示す、クラスターＨＵＭＣＡ１ＸＩＡについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターＨＵＭＣＥＡについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。肝細胞癌において過剰発現を示す、クラスターＲ３５１３７についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および卵巣癌において過剰発現を示す、クラスターＺ２５２９９についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｚ２５２９９ｊｕｎｃ１３−１４−２１中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の下方制御を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｚ２５２９９ｓｅｇ２０中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の下方制御を示すヒストグラムである。移行上皮癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターＨＳＳＴＲＯＬ３についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名ＨＳＳＴＲＯＬ３ｓｅｇ２４中に示された、アンプリコンによって検出可能なストロメリシン−３ＨＳＳＴＲＯＬ３転写物の過剰発現を示すヒストグラムである。異なる正常組織における配列名ＨＳＳＴＲＯＬ３ｓｅｇ２４中に示された、アンプリコンによって検出可能なストロメリシン−３ＨＳＳＴＲＯＬ３転写物の発現を示すヒストグラムである。異なる組織由来の悪性腫瘍の混合物、悪性乳癌、膵臓癌、および前立腺癌において過剰発現を示す、クラスターＨＵＭＴＲＥＦＡＣについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＨＳＳ１００ＰＣＢについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターＨＳＵ３３１４７についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物および悪性肺腫瘍において過剰発現を示す、クラスターＲ２０７７９についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性腫瘍、肺悪性腫瘍、皮膚悪性腫瘍、および胃癌において過剰発現を示す、クラスターＲ３８１４４についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性腫瘍、悪性乳癌、卵巣癌、および皮膚悪性腫瘍において過剰発現を示す、クラスターＨＵＭＯＳＴＲＯについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および腎臓悪性腫瘍において過剰発現を示す、クラスターＨＵＭＯＳＴＲＯについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｒ１１７２３ｓｅｇ１３中に示された、アンプリコンによって検出可能なＲ１１７２３転写物の過剰発現を示すヒストグラムである。異なる正常組織における配列名Ｒ１１７２３ｓｅｇ１３中に示された、アンプリコンによって検出可能なＲ１１７２３転写物の発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｒ１１７２３ｊｕｎｃ１１−１８中に示された、アンプリコンによって検出可能なＲ１１７２３転写物の過剰発現を示すヒストグラムである。悪性肺腫瘍において過剰発現を示す、クラスターＲ１６２７６についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける６つの配列Ｈ６１７７５ｓｅｇ８、ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７、Ｍ８５４９１Ｓｅｇ２４、Ｚ２１３６８ｊｕｎｃ１７−２１、ＨＳＳＴＲＯＬ３ｓｅｇ２４、およびＺ２５２９９ｓｅｇ２０の異なる発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける６つの配列Ｈ６１７７５ｓｅｇ８、ＨＵＭＧＲＰ５Ｅｊｕｎｃ３−７、Ｍ８５４９１Ｓｅｇ２４、Ｚ２１３６８ｊｕｎｃ１７−２１、ＨＳＳＴＲＯＬ３ｓｅｇ２４、およびＺ２５２９９ｓｅｇ２０の異なる発現を示すヒストグラムである。配列番号１４８０のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおけるトロフィニン関連タンパク質（タスチン）［Ｔ８６２３５］変異型（例えば、変異型番号２３〜２６、３１、３２）の相対発現を示すヒストグラムである。配列番号１５１２〜１５１４に詳述のオリゴを使用したマイクロアレイ分析によって決定した、正常および腫瘍由来の肺サンプルにおけるトロフィニン関連タンパク質（タスチン）［Ｔ８６２３５］変異型（例えば、変異型番号８〜１０、２２、２３、２６、２７、２９〜３１、３３）の相対発現を示すヒストグラムである。配列番号１５１７のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおけるＨｏｍｅｏボックスＣ１０（ＨＯＸＣ１０）［Ｎ３１８４２］変異型（例えば、変異型番号３）の相対発現を示すヒストグラムである。配列番号１５２９のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおける核小体タンパク質４（ＮＯＬ４）［Ｔ０６０１４］変異型（例えば、変異型番号３、１１、１２）の相対発現を２つの異なる尺度で示すヒストグラムである。図５６ａは、尺度０〜１２００での結果を示す。図５６ｂは、尺度０〜２４での結果を示す。配列番号１５３２のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおける核小体タンパク質４（ＮＯＬ４）［Ｔ０６０１４］変異型（例えば、変異型番号３、１１、１２）の相対発現を２つの異なる尺度で示すヒストグラムである。図５７ａは、尺度０〜２０００での結果を示す。図５７ｂは、尺度０〜４２での結果を示す。配列番号１５５８のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおけるＡＡ２８１３７０変異型（例えば、変異型番号０、１、４、および５）の相対発現を示すヒストグラムである。配列番号１５７４のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおけるスルファターゼ１（ＳＵＬＦ１）−［Ｚ２１３６８］変異型（例えば、変異型番号１３および１４）の相対発現を示すヒストグラムである。配列番号１５９４のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおけるＳＲＹ（性決定領域Ｙ）−ボックス２（ＳＯＸ２））−［ＨＵＭＨＭＧＢＯＸ］変異型（例えば、変異型番号０）の相対発現を示すヒストグラムである。配列番号１６００のプライマーを使用した実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおけるプラコフィリン１（外胚葉異形成／表皮水疱症候群）（ＰＫＰ−１）−［ＨＳＢ６ＰＲ］変異型（例えば、変異型番号０、５、および６）の相対発現を示すヒストグラムである。実時間ＰＣＲによって決定した、正常および腫瘍由来の肺サンプルにおける配列番号１４８０、１５１７、１５２９、１５３２、１５５８、１５７４、１５９４、１６００、１６１６、１６１９、１６２２、１６２５によって検出可能な転写物の相対発現を示すヒストグラムである。本発明のＡＡ２８１３７０肺癌バイオマーカーとＭＡＰＫシグナル伝達経路に関与する種々のタンパク質のＷＤ４０ドメインとの間の類似性を示す、ＮＣＢＩＢＬＡＳＴデフォルトパラメーターを使用したアミノ酸配列アラインメントを示す図である。図６３ａ：配列番号９９のＡＡ２８１３７０ポリペプチドの４０〜７９０位のアミノ酸がマウスＭａｐｋｂｐ１タンパク質（ｇｉ｜４７１２４６２２）と７５％相同である。本発明のＡＡ２８１３７０肺癌バイオマーカーとＭＡＰＫシグナル伝達経路に関与する種々のタンパク質のＷＤ４０ドメインとの間の類似性を示す、ＮＣＢＩＢＬＡＳＴデフォルトパラメーターを使用したアミノ酸配列アラインメントを示す図である。図６３ｂ：配列番号９９のＡＡ２８１３７０ポリペプチドの４０〜８８６位のアミノ酸がＪＮＫ結合タンパク質ＪＮＫＢＰ１（ｇｉ｜３４８５６７１７）と７０％相同である。正常サンプルと比較した癌性肺サンプルにおける配列名ＡＡ１６１１８７ｓｅｇ２５中に示された、アンプリコンによって検出可能なホモ・サピエンスプロテアーゼセリン２１（テスティシン（ｔｅｓｔｉｓｉｎ））（ＰＲＳＳ２１）ＡＡ１６１１８７転写物の過剰発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｍ６２０６９ｓｅｇ１９中に示された、アンプリコンによって検出可能なタンパク質であるチロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）Ｍ６２０６９転写物の過剰発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｍ６２０６９ｓｅｇ２９中に示された、アンプリコンによって検出可能なタンパク質であるチロシンホスファターゼ受容体Ｓ型（ＰＴＰＲＳ）Ｍ６２０６９転写物の過剰発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名ＨＵＭＣＡ１Ｘ１Ａｓｅｇ５５中に示された、アンプリコンによって検出可能な上記ホモ・サピエンスコラーゲンＸＩ型α１（ＣＯＬ１１Ａ１）転写物の過剰発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｚ２５２９９ｓｅｇ２３中に示された、アンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター（抗ロイコプロテイナーゼ）（ＳＬＰＩ）Ｚ２５２９９転写物の下方制御を示すヒストグラムである。異なる正常組織における配列名Ｚ２５２９９ｓｅｇ２０中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の発現を示すヒストグラムである。異なる正常組織における配列名Ｚ２５２９９ｓｅｇ２３中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターＺ２５２９９転写物の発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名ＨＳＳＴＲＯＬ３ｓｅｇ２０−２中に示された、アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ１１（ストロメリシン３）（ＭＭＰ１１）（ＨＳＳＴＲＯＬ３）転写物の過剰発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名ＨＳＳＴＲＯＬ３ｊｕｎｃ２１−２７中に示された、アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ１１（ストロメリシン３）（ＭＭＰ１１）（ＨＳＳＴＲＯＬ３）転写物の過剰発現を示すヒストグラムである。異なる正常組織における配列名Ｒ１１７２３ｊｕｎｃ１１−２８中に示された、アンプリコンによって検出可能なＲ１１７２３転写物の発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｈ５３６２６ｊｕｎｃ２４−２７Ｆ１Ｒ３中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様（ｌｉｋｅ）１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の過剰発現を示すヒストグラムである。正常サンプルと比較した癌性肺サンプルにおける配列名Ｈ５３６２６ｓｅｇ２５中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現を示すヒストグラムである。上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および筋肉腫において過剰発現を示す、クラスターＨ５３６２６についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。異なる正常組織における配列名Ｈ５３６２６ｓｅｇ２５中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現を示すヒストグラムである。異なる正常組織における配列名Ｈ５３６２６ｊｕｎｃｃ２４−２７Ｆ１Ｒ３中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様１（ＦＧＦＲＬ１）Ｈ５３６２６転写物の発現を示すヒストグラムである。ＰＳＥＣＲ１１７２３＿ＰＥＡ＿１Ｔ５ＰＣＲ産物を示す図である。レーン１：ＰＣＲ産物、レーン２：ＬｏｗＤＮＡＭａｓｓＬａｄｄｅｒＭＷマーカー（ＩｎｖｉｔｒｏｇｅｎＣａｔ# １００６８−０１３）。ＰＳＥＣＲ１１７２３＿ＰＥＡ＿１Ｔ５ＰＣＲ産物配列を示す図である。赤色−ＰＳＥＣ順方向プライマー、青色−ＰＳＥＣ逆相補配列、強調した配列−ＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５ＯＲＦ。ＮｈｅＩおよびＨｉｎｄＩＩＩで消化したＰＲＳＥＣＰＣＲ産物を示す図である。レーン１−ＰＲＳＥＴＰＣＲ産物、レーン２−ＦｅｒｍｅｎｔａｓＧｅｎｅＲｕｌｅｒ１ＫｂＤＮＡラダー番号ＳＭ０３１３。ＨｉｓＰＳＥＣＴ５ｐＲＳＥＴＡのプラスミドマップを示す図である。ＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５のタンパク質配列を示す図である。赤色−６Ｈｉｓタグ、青色−ＰＳＥＣ。ＨｉｓＰＳＥＣＴ５ｐＲＳＥＴＡのＤＮＡ配列を示す図である。太字− ＨｉｓＰＳＥＣＴ５読み取り枠、斜体−配列分析によって検証した隣接ＤＮＡ配列。組換えＨｉｓＰＳＥＣ変異型Ｒ１１７２３＿ＰＥＡ＿１Ｔ５のウェスタンブロット分析を示す図である。レーン１：分子量マーカー（ＰｒｏＳｉｅｖｅｃｏｌｏｒ，Ｃａｍｂｒｅｘ，Ｃａｔ #５０５５０）、レーン２：ＨｉｓＰＳＥＣＴ５ｐＲＳＥＴＡＴ０、レーン３：ＨｉｓＨｉｓＰＳＥＣＴ５ｐＲＳＥＴＡＴ３、レーン４：ＨｉｓＨｉｓＰＳＥＣＴ５ｐＲＳＥＴＡＴｏ．ｎ、レーン５：ｐＲＳＥＴ空ベクターＴ０（ネガティブコントロール）、レーン６：ｐＲＳＥＴ空ベクターＴ３（ネガティブコントロール）、レーン７：ｐＲＳＥＴ空ベクターＴｏ．ｎ（ネガティブコントロール）、レーン８：Ｈｉｓポジティブコントロールタンパク質（ＨｉｓＴｒｏｐｏｎｉｎＴ７ｐＲＳＥＴＡＴ３）。

Claims

Ｒ１１７２３＿ＰＥＡ＿１＿Ｔ５の配列を有するポリヌクレオチドを含む単離ポリヌクレオチド。
Ｒ１１７２３＿ＰＥＡ＿１＿ｎｏｄｅ＿１３の配列を有するノードを含む、請求項１に記載の単離ポリヌクレオチド。
Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３の配列を有するポリペプチドを含む単離ポリペプチド。
Ｑ９６ＡＣ２のアミノ酸１〜６３に対応し、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のアミノ酸１〜６３にも対応するＭＷＶＬＧＩＡＡＴＦＣＧＬＦＬＬＰＧＦＡＬＱＩＱＣＹＱＣＥＥＦＱＬＮＮＤＣＳＳＰＥＦＩＶＮＣＴＶＮＶＱＤＭＣＱＫＥＶＭＥＱＳＡと少なくとも９５％相同である第１のアミノ酸配列と、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３のアミノ酸６４〜８４に対応する配列ＤＴＫＲＴＮＴＬＬＦＥＭＲＨＦＡＫＱＬＴＴを有するポリペプチドと少なくとも約９５％相同である第２のアミノ酸配列とを含み、前記第１のアミノ酸配列及び前記第２のアミノ酸配列が隣接し、且つ配列順にある、Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３をコードするキメラポリペプチドを含む、請求項３に記載の単離物。
Ｒ１１７２３＿ＰＥＡ＿１＿Ｐ１３中の配列ＤＴＫＲＴＮＴＬＬＦＥＭＲＨＦＡＫＱＬＴＴと少なくとも約９５％相同であるポリペプチドを含むＲ１１７２３＿ＰＥＡ＿１＿Ｐ１３のテールを含む、請求項４に記載の単離ポリペプチド。
配列番号１６８４のアンプリコンを含む、請求項１に記載の単離オリゴヌクレオチド。
請求項５のアンプリコンを増幅することができる単離オリゴヌクレオチド対を含む、プライマー対。
配列番号１６８２及び１６８３の単離オリゴヌクレオチド対を含む、請求項６に記載のプライマー対。
請求項３に記載のアミノ酸配列のエピトープに特異的に結合することができる抗体。
前記アミノ酸配列が請求項４に記載のテールを含む、請求項８に記載の抗体。
前記抗体が、前記エピトープを有するスプライス変異体と対応する公知のタンパク質ＰＳＥＣとを識別することができる、請求項８に記載の抗体。
請求項１に記載のスプライス変異体の過剰発現を検出する、肺癌検出用キット。
前記キットがＮＡＴベースのテクノロジーを含む、請求項１１に記載のキット。
前記キットが、請求項１に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも１つのプライマー対を更に含む、請求項１１に記載のキット。
前記キットが、請求項１に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも１つのオリゴヌクレオチドを更に含む、請求項１１に記載のキット。
請求項３に記載のスプライス変異体の過剰発現を検出するキットを含み、前記キットが請求項８に記載の抗体を含む、肺癌検出用キット。
前記キットが、ＥＬＩＳＡ又はウェスタンブロットの実施のための少なくとも１つの試薬を更に含む、請求項１２に記載のキット。
請求項１に記載のスプライス変異体の過剰発現を検出する工程を含む、肺癌の検出方法。
前記過剰発現の検出を、ＮＡＴベースのテクノロジーを使用して実施する、請求項１４に記載の方法。
請求項３に記載のスプライス変異体の過剰発現を検出する工程を含み、前記過剰発現の検出を、イムノアッセイを使用して実施する、肺癌の検出方法。
前記イムノアッセイが、請求項８に記載の抗体を含む、請求項１６に記載の方法。
請求項１に記載の核酸配列若しくはそのフラグメント又は請求項３に記載のアミノ酸配列若しくはそのフラグメントを含む、肺癌を検出することができるバイオマーカー。
請求項１８に記載のバイオマーカーで肺癌細胞を検出する工程を含む、肺癌のスクリーニング方法。
請求項１８に記載のバイオマーカーで肺癌細胞を検出する工程を含む、肺癌の診断方法。
請求項１８に記載のバイオマーカーで肺癌細胞を検出する工程を含む、疾患の進行及び／又は治療有効性及び／又は肺癌の再発をモニタリングする方法。
請求項１８に記載のバイオマーカーで肺癌細胞を検出する工程と、前記検出によって治療を選択する工程とを含む、肺癌治療の選択方法。