[go: up one dir, main page]

JP2008507261A - 肺癌診断のための新規のヌクレオチド配列およびアミノ酸配列、ならびにそのアッセイおよび使用方法 - Google Patents

肺癌診断のための新規のヌクレオチド配列およびアミノ酸配列、ならびにそのアッセイおよび使用方法 Download PDF

Info

Publication number
JP2008507261A
JP2008507261A JP2007519922A JP2007519922A JP2008507261A JP 2008507261 A JP2008507261 A JP 2008507261A JP 2007519922 A JP2007519922 A JP 2007519922A JP 2007519922 A JP2007519922 A JP 2007519922A JP 2008507261 A JP2008507261 A JP 2008507261A
Authority
JP
Japan
Prior art keywords
pea
amino acid
amino acids
acid sequence
isolated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007519922A
Other languages
English (en)
Other versions
JP2008507261A5 (ja
Inventor
ポロック,サラ
レビン,ズリット
ノヴィク,アミト
ダハリ,ドゥビル
ソレク,ロテム
トポリク,アミル
サメア−グリーンワルド,シャ−リー
セラ−タヴォル,オスナット
ディベル,アレキサンダー
コジョカル,ガッド,エス.
アヤロン−ソファー,マイケル
ワラチ,シラ
アキヴァ,ピンチャス
ケレン,ナオミ
シェメシ,ロネン
Original Assignee
コンピュゲン ユーエスエイ,インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by コンピュゲン ユーエスエイ,インク. filed Critical コンピュゲン ユーエスエイ,インク.
Priority claimed from US11/051,720 external-priority patent/US7569662B2/en
Publication of JP2008507261A publication Critical patent/JP2008507261A/ja
Publication of JP2008507261A5 publication Critical patent/JP2008507261A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Oncology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

高感度且つ正確な新規の肺癌用マーカー。これらのマーカーは、正常な肺組織とは対照的に肺癌中で特異的に過剰発現する。患者サンプルにおける単独または組み合わせたこれらのマーカーの測定により、診断医が肺癌の診断予測と相関させることができる情報が得られる。本発明のマーカーは、単独または組み合わせて、肺癌と非癌状態とを高度に識別検出する。

Description

発明の分野
本発明は、肺癌の診断マーカーである新規のヌクレオチド配列およびタンパク質配列ならびにそのアッセイおよび使用方法に関する。
発明の背景
肺癌は、米国の男性および女性の癌死亡の主な原因であり、1994年に推定172,000の新規の症例が報告されている。全肺癌患者の5年生存率は、診断時の病期と無関係に、13%でしかない。これは、疾患がまだ限局している検出症例の5年生存率が46%であることと対照的である。しかし、肺癌は、疾患の拡大前に16%しか発見されない。肺癌は、小細胞肺癌または非小細胞肺癌に大きく分類される。非小細胞肺癌は、腺癌、気管支肺胞癌(bronchoalveolar−alveolar)、扁平上皮癌、および大細胞癌にさらに分類される。ほぼ75〜85%の肺癌が非小細胞肺癌であり、15〜25%が小細胞肺癌である。
疾患が進行した病期に達するまでしばしば臨床症状が認められないので、早期発見は困難である。現在、診断は、胸部X線の使用、痰に含まれる細胞型の分析、および気管支のファイバースコープ試験が用いられている。癌の型および病期によって治療計画を決定し、治療計画には、手術、放射線療法、および/または化学療法が含まれる。
原発性疾患、転移性疾患、および再発性疾患の早期発見は、肺癌を罹患した個体の予後に有意に影響を与え得る。初期段階で診断された非小細胞肺癌は、より進行した段階で診断されたものより結果が有意に良好である。同様に、小細胞肺癌の早期診断もより良好な予後の可能性を秘めている。
現行の放射線療法薬、化学療法薬、および生物毒素は強力な細胞毒素であるにもかかわらず、これらは正常な細胞と悪性細胞とを区別せず、副作用および用量規定毒性を生じる。肺癌特異的癌マーカーが依然として必要である。患者由来サンプル中の肺癌マーカーの存在を検出するために使用することができる試薬およびキットが依然として必要である。肺癌を有する個体のスクリーニング方法および診断方法、ならびに肺癌と診断された患者の治療に対する応答、疾患の進行、および疾患の再発のモニタリング方法が依然として必要である。肺癌を有する個体の肺癌型を決定するための試薬、キット、および方法が依然として必要である。肺癌細胞を特異的にターゲティングすることができる組成物が依然として必要である。肺癌細胞に特異的に結合することができる造影剤が依然として必要である。改良された肺癌細胞の画像化方法が依然として必要である。肺癌細胞に特異的に結合することができる治療薬が依然として必要である。肺癌を罹患している疑いのある個体の改良された治療方法が依然として必要である。
発明の要旨
背景技術は、単独または組み合わせて十分に高感度および/または正確な肺癌用マーカーを教示も示唆もしていない。
本発明は、高感度且つ正確な肺癌用の新規のマーカーを提供することによって背景技術のこれらの欠点を克服している。さらに、これらのマーカーは、小細胞肺癌または非小細胞肺癌などの異なる肺癌型を区別することができ、さらに腺癌、扁平上皮癌、および大細胞癌などの非小細胞肺癌型を区別することができる。これらのマーカーは、正常な肺組織と対照的に肺癌中で特異的に過剰発現する。患者(生体)サンプル中での単独または組み合わせたこれらのマーカーの測定により、診断医が予想される肺癌診断と相関し得る情報が得られる。本発明のマーカーにより、単独または組み合わせて、肺癌と非癌性状態とが高度に差分検出される。
本発明の好ましい実施形態によれば、任意選択的に本発明の好ましい実施形態と共に使用することができる適切な生体サンプルの例には、血液、血清、血漿、血球、尿、痰、唾液、糞便、髄液またはCSF、リンパ液、皮膚の外分泌物、気道、腸管、および尿生殖路、涙、ミルク、神経組織、肺組織、任意のヒト器官または組織(任意の腫瘍組織または正常組織、洗浄によって得られた任意の(例えば、気管支系または胸管系の)サンプル、およびin vivo細胞培養構成要素のサンプルが含まれる)が含まれるが、これらに限定されない。好ましい実施形態では、生体サンプルは、肺組織および/または痰および/または血清サンプルおよび/または尿サンプルおよび/または任意の他の組織または液体サンプルを含む。サンプルを、任意選択的に、サンプルを抗体と接触させる前および/または任意の他の診断アッセイの実施前に適切な溶出剤で希釈することができる。
細胞局在化に関するテキストで与えられた情報を、以下の4つの異なるソフトウェアプログラムにしたがって確定した:膜貫通領域の予想のための(i)tmhmm(Center for Biological Sequence Analysis,Technical University of Denmark DTU,http://www.cbs.dtu.dk/services/TMHMM/TMHMM2.0b.guide.php由来)または(ii)tmpred(ISREC Bionformatics group and the LICR Information Technology Office,Ludwig Institute for Cancer Research,Swiss Institute of Bioinformatics,http://www.ch.embnet.org/software/TMPRED_form.htmlによって維持されたEMBnet;シグナルペプチド予想のための(iii)signalp_hmmまたは(iv)signalp_nn(共に、Center for Biological Sequence Analysis,Technical University of Denmark DTU,http://www.cbs.dtu.dk/services/SignalP/background/prediction.php由来)。用語「signalp_hmm」および「signalp_nn」は、プログラムSignalPについての2つの操作モードをいい、hmmはHidden Markov Modelをいい、nnは神経回路網をいう。公知のタンパク質局在化および/または遺伝子構造の手による検査ならびに各発明者による発見的方法の使用によっても局在化を決定した。ある場合には、細胞局在化予想の手による検査について、発明者らは、ProLoc計算プラットフォーム(Einat Hazkani−Covo,Erez Levanon,Galit Rotman,Dan Graur and Amit Novik;(2004)“Evolution of multicellularity in metazoa:comparative analysis of the subcellular localization of proteins in Saccharomyces,Drosophila and Caenorhabditis.” Cell Biology International 2004;28(3):171−8.)を使用し、このプラットフォームは、種々のパラメータ(タンパク質ドメイン(例えば、タンパク質内の膜貫通領域およびその局在化の予想)、pI、タンパク質の長さ、アミノ酸組成、予め注釈をつけたタンパク質に対する相同性、一定のオルガネラにタンパク質を向かわせる配列パターン(核局在化シグナル(NLS)、ミトコンドリア局在化シグナルなど)の認識、シグナルペプチドおよびアンカーのモデリング、ならびに単一区画に特異的なPfam由来の固有のドメインの使用が含まれる)に基づいてタンパク質局在化を予想する。
SNP(一塩基多型)に関するテキストから情報が得られる。略語の説明を以下に示す。「T−>C」は、例えば、SNPによってテーブル中に与えられた位置がTからCに変化することを意味する。同様に、「M−>Q」は、例えば、SNPにより、対応するアミノ酸配列中のメチオニン(M)がグアニン(Q)に変化したことを意味する。ヌクレオチド配列SNPの右側の文字の代わりに、スペースが存在する場合、フレームシフトが生じたことを示す。フレームシフトを、ハイフン(−)で示すこともできる。終止コドンを、右側にアスタリスク(*)で示す。SNPの記載の一部として、SNP自体の上記記述後に括弧内にコメントを見出すことができる。このコメントは、示したANPを使用して作製したSwissProtエントリーに対する識別子であるFTIdを含み得る。FTIdは固有且つ安定なフィーチャー(feature)識別子であり、フィーチャーテーブル中の位置特異的注釈から特化したタンパク質関連データベースへのリンクを直接的に構築する。FTIdは常に記述フィールド中のフィーチャーの最後の構成要素である:FTId=XXX_数(XXXは、6桁数から下線によって分離された特定のフィーチャーキーの3文字表記である)。本発明の選択されたスプライスバリアントの野生型タンパク質のアミノ酸変異の表では、第1行目のヘッダーは、「アミノ酸配列上のSNPの位置」であり、アミノ酸配列上の公知の変異の位置を示す。SNPを、任意選択的に、単独または1つまたは複数の他のSNPおよび/または任意の他の診断マーカーと組み合わせて、本発明の診断マーカーとして使用することができる。本発明の好ましい実施形態は、このようなSNP(以下に示した公知の(WTまたは野生型)タンパク質配列上のSNPならびにこのようなSNPによって形成された新規の核酸配列および/またはアミノ酸配列、および/または本明細書中に記載の変異アミノ酸配列および/または核酸配列上の任意のSNPが含まれるが、これらに限定されない)を含む。
公知のタンパク質との相同性に関してテキスト中に示した情報を、以下の特定の(非デフォルト)パラメータを使用したSmith−Waterman version 5.1.2によって決定した:
−model=sw.model
−GAPEXT=0
−GAPOP=100.0
−MATRIX=blosum100
ESTに基づいた癌中のクラスターの過剰発現に関する情報が得られる。このような過剰発現分析に関するp値の手がかりは以下である:

−ライブラリベースの統計学:細胞株中での発現レベルを含まないP値(P1)
−ライブラリベースの統計学:細胞株中での発現レベルを含むP値(P2)
−ESTクローン統計学:細胞株中での発現レベルを含まないP値(SP1)
−ESTクローン統計学:細胞株中での発現レベルを含まない推定過剰発現率(R3)
− ESTクローン統計学:細胞株中での発現レベルを含むP値(SP2)
− ESTクローン統計学:細胞株中での発現レベルを含む推定過剰発現率(R4)
ライブラリベースの統計学は、全ライブラリにわたる統計学をいい、ESTクローン統計学は、特定の組織または癌からのESTについてのみの発現をいう。
マイクロアレイに基づいた癌中のクラスターの過剰発現についての情報が得られる。マイクロアレイの基準として、特定のセグメントパラグラフでは、省略していない組織名を、発現を測定したチップ型を基準として使用した。マイクロアレイの結果は以下の2つのタイプがある:本発明によるデザインによって調製したマイクロアレイ由来のタイプ(マイクロアレイ作製手順は、本明細書中の「材料と実験手順」の項に詳述している)およびAffymetrix technologyを使用したマイクロアレイ由来の型。マイクロアレイ基準として、特定のセグメントパラグラフでは、省略していない組織名を、発現を測定したチップ型を基準として使用した。本発明によるデザインにしたがって調製したマイクロアレイについて、プローブ名は、クラスター(遺伝子)名から始まり、識別番号が続く。Affymetrixデータから得たオリゴヌクレオチドマイクロアレイの結果は、Affymetrix Inc,Santa Clara,CA,USAから利用可能なチップに由来した(例えば、www.affymetrix.com/products/arrays/specific/hgu133.affxのHuman Genome U133(HG−U133)Set;www.affymetrix.com/products/arrays/specific/hgu133av2.affxのGeneChip Human Genome U133A 2.0 Array;およびwww.affymetrix.com/products/arrays/specific/hgu133plus.affxのHuman Genome U133 Plus 2.0 Arrayに関するデータを参照のこと)。プローブ名は、Affymetrix命名規則のあとにくる。データは、NCBI Gene Expression Omnibus(www.ncbi.nlm.nih.gov/projects/geo/ and Edgar et al,Nucleic Acids Research,2002,Vol.30,No.1 207−210を参照のこと)から利用可能である。Series GSE1133データベース(2004年3月公開)のデータセット(結果を含む)は、www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1133から利用可能である;これらの結果の参考文献は以下である:Su et al(Proc Natl Acad Sci U S A.2004 Apr 20;101(16):6062−7.Epub 2004 Apr 09)。本発明者がデザインしたプローブを以下に列挙する。

>H61775_0_11_0
CCCCAGCTTTTATAGAGCGGCCCAAGGAAGAATATTTCCAAGAAGTAGGG
>M85491_0_0_25999
GACATCTTTGCATATCATGTCAGAGCTATAACATCATTGTGGAGAAGCTC
>M85491_0_14_0
GTCATGAAAATCAACACCGAGGTGCGGAGCTTCGGACCTGTGTCCCGCAG
>Z21368_0_0_61857
AGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACTCTTGAAG
>HUMGRP5E_0_0_16630
GCTGATATGGAAGTTGGGGAATCTGAATTGCCAGAGAATCTTGGGAAGAG
>HUMGRP5E_0_2_0
TCTCATAGAAGCAAAGGAGAACAGAAACCACCAGCCACCTCAACCCAAGG
>D56406_0_5_0
TCTGACTTTTACGGACTTGGCTTGTTAGAAGGCTGAAAGATGATGGCAGG
>F05068_0_0_5744
ACGGGAGGGAAGGAAGGTGTGCGGGAGGAGTTCTCTGTCTCCACTCCCCT
>F05068_0_0_5754
CAAGGGGAACTGACCGTTGGTCCCGAAGGTCTAGAAGTGAATGGGAGCAG
>F05068_0_8_0
CTGGGCTTGGACTTCGGAGTTTTGCCATTGCCAGTGGGACGTCTGAGACT
>F05068_0_1_5751
TCTTAGCAGGTAGGTGCCGCAGACCCTGCGGGTTAAGAGGTGGGGTGGGG
>H38804_0_3_0
CGTAATTGCAGTGCATTTAGACAGGCATCTATTTGGACCTGTTTCTATCT
>HSENA78_0_1_0
TGAAGAGTGTGAGGAAAACCTATGTTTGCCGCTTAAGCTTTCAGCTCAGC
>R00299_0_8_0
CCAAGGCTCGTCTGCGCACCTTGTGTCTTGTAGGGTATGGTATGTGGGAC
>Z44808_0_8_0
AAAAGCATGAGTTTCTGACCAGCGTTCTGGACGCGCTGTCCACGGACATG
>Z44808_0_0_72347
ATGTTCTTAGGAGGCAAGCCAGGAGAAGCCGGGTCTGACTTTTCAGCTCA
>Z44808_0_0_72349
TCCTCCAGACCCAAAGCCACAACCCATCGCAAGTCAAGAACACTTTCCAG
>AA161187_0_0_433
ACCCTGGGTGGGCAAAAACGTGCTTTCCCGGACGGGGTTGAAGGGGAGAA
>AA161187_0_0_430
TGGAGACTGTTGCCCCACTCTGCAGATGCAGAAACGGAGGCTTGGCTGCT
>R66178_0_7_0
CCAGTGTGGTATCCTGGGAAACTCGGTTAAAAGGTGAGGCAGAGTACCAG
>HUMPHOSLIP_0_0_18458
AAGGAAGCAGGACCAGTGGATGTGAGGCGTGGTCGAAGAACAACAGAAAG
>HUMPHOSLIP_0_0_18487
ACAGGGGCCAGATGGTGACCCATGACCCAGCCTAAAAGGCAGCCAGAGGG
>AI076020_0_3_0
ATCAGCACTGCCACCTACACCACGGTGCCGCGCGTGGCCTTCTACGCCGG
>T23580_0_0_902
GTGAAACCCCATTGGCTTCATTGGCTCCTTGATTTAAACCACGCCCGGCT
>T23580_0_0_901
TGAGTCCGTGTTATATCATCTGGTCTCATTGATAGGCGGGATAGGGAGGG
>M79217_0_9_0
TTTGTGGAATAGCAACCCATGGTTATGGCGAGTGACCCGACGTGATCTGG
>M62096_0_0_20588
AAGGCTTAGGTGCAAAGCCATTGGATACCATACCTGAGACCACACAGCCA
>M62096_0_7_0
ACCAGAAGCAGCTGTCCAGACTCCGAGACGAAATTGAGGAGAAGCAGAAA
>M78076_0_7_0
GAGAAGATGAACCCGCTGGAACAGTATGAGCGAAAGGTGAATGCGTCTGT
>T99080_0_0_58896
AACTCACAGCAAGAGCTGTGTTCCAGTTAGCTTTGCTACCAGTTATGCAG
>T08446_0_9_0
CATTTCCACTACGAGAACGTTGACTTTGGCCACATTCAGCTCCTGCTGTC
>HUMCA1XIA_0_0_14909
GCTGCAATCTAAGTTTCGGAATACTTATACCACTCCAGAAATAATCCTCG
>HUMCA1XIA_0_18_0
TTCAGAACTGTTAACATCGCTGACGGGAAGTGGCATCGGGTAGCAATCAG
>T11628_0_9_0
ACAAGATCCCCGTGAAGTACCTGGAGTTCATCTCGGAATGCATCATCCAG
>T11628_0_0_45174
TAAACAATCAAAGAGCATGTTGGCCTGGTCCTTTGCTAGGTACTGTAGAG
>T11628_0_0_45161
TGCCTCGCCACAATGGCACCTGCCCTAAAATAGCTTCCCATGTGAGGGCT
>HUMCEA_0_0_96
CAAGAGGGGTTTGGCTGAGACTTTAGGATTGTGATTCAGCTTAGAGGGAC
>HUMCEA_0_0_15183
CCTGGTGGGAGCCCATGAGAAGCGAGTTCTCTGTGCAACGGACTTAGTAA
>HUMCEA_0_0_15182
GCTCCCTGGAGCATCAGCATCATATTCTGGGGTGGAGTCTATCTGGTTCT
>HUMCEA_0_0_15168
TCCTGCCTGTCACCTGAAGTTCTAGATCATTCCCTGGACTCCACTCTATC
>HUMCEA_0_0_15180
TTTAACACAGGATTGGGACAGGATTCAGAGGGACACTGTGGCCCTTCTAC
>R35137_0_5_0
TATGTGGAGGTGGTGAACATGGACGCTGCAGTGCAGCAGCAGATGCTGAA
>Z25299_0_3_0
AACTCTGGCACCTTGGGCTGTGGAAGGCTCTGGAAAGTCCTTCAAAGCTG
>HSSTROL3_0_0_12518
ATGAGAGTAACCTCACCCGTGCACTAGTTTACAGAGCATTCACTGCCCCA
>HSSTROL3_0_0_12517
CAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAA
>HSS100PCB_0_0_12280
CTCAAAATGAAACTCCCTCTCGCAGAGCACAATTCCAATTCGCTCTAAAA
>R20779_0_0_30670
CCGCGTTGCTTCTAGAGGCTGAATGCCTTTCAAATGGAGAAGGCTTCCAT
以下の組織の略語のリストを、TAAヒストグラムで使用した。用語「TAA」は、「腫瘍関連抗原」を示し、テキスト中に示したTAAヒストグラムは、以下の実施例1〜5に詳述するように、バイオマーカー選択エンジンによって予想される癌組織発現パターンを示す。
「BONE」は「骨」であり;
「COL」は「結腸」であり;
「EPI」は「上皮」であり;
「GEN」は「全体(general)」であり;
「LIVER」は「肝臓」であり;
「LUN」は「肺」であり;
「LYMPH」は「リンパ節」であり;
「MARROW」は「骨髄」であり;
「OVA」は「卵巣」であり;
「PANCREAS」は「膵臓」であり;
「PRO」は「前立腺」であり;
「STOMACH」は「胃」であり;
「TCELL」は「T細胞」であり;
「THYROID」は「甲状腺」であり;
「MAM」は「乳房」であり;
「BRAIN」は「脳」であり;
「UTERUS」は「子宮」であり;
「SKIN」は「皮膚」であり;
「KIDNEY」は「腎臓」であり;
「MUSCLE」は「筋肉」であり;
「ADREN」は「副腎」であり;
「HEAD」は「頭頸部」であり;
「BLADDER」は「膀胱」である。
用語「セグメント」、「seg」、および「ノード」は、本発明の核酸配列に関して交換可能に使用されることに留意すべきであり、これらは、下記の1つまたは複数の性質を有することが示された核酸配列の一部をいう。これらはまた、下記でより詳細に記載されるように、完全な核酸配列を構築するために使用された基礎単位である。任意選択的且つ好ましくは、これらは、本発明の実施形態であり(例えば、アンプリコン、ハイブリッド形成単位として)、そして/またはこれらに任意選択的にプライマーおよび/もしくは相補オリゴヌクレオチドが由来してもよく、そして/または任意の他の使用のためのオリゴヌクレオチドの例である。
本明細書中で使用される、句「肺癌」は、小細胞肺癌および非小細胞肺癌が含まれる肺の癌(肺腺癌、扁平上皮癌、および腺癌が含まれるが、これらに限定されない)をいう。
本発明の文脈中の用語「マーカー」は、肺癌(または上記の容態の1つ)を罹患していない被験体から採取した匹敵するサンプルと比較して、肺癌(または指示的容態(indicative condition)の1つ)を罹患した被験体(患者)から採取したサンプル中で異なって存在する核酸フラグメント、ペプチド、またはポリペプチドをいう。
句「異なって存在する」は、肺癌(または上記の容態の1つ)を罹患していない患者から採取した匹敵するサンプルと比較して、肺癌(または指示的容態の1つ)を罹患した患者から採取したサンプル中に存在するマーカーの量が異なることをいう。例えば、ハイブリッド形成および/またはNATベースのアッセイによって測定したところ、核酸フラグメントは、任意選択的に、一方のサンプル中の核酸フラグメント量が他方のサンプル中の核酸フラグメント量と有意に異なる場合、2サンプル間で異なって存在し得る。ポリペプチドは、一方のサンプル中のポリペプチド量が他方のサンプル中のポリペプチド量と有意に異なる場合、2サンプル間で異なって存在する。マーカーが一方のサンプルで検出可能であるが、他方のサンプルで検出不可能である場合、このようなマーカーを異なって存在すると見なすことができることに留意すべきである。
本明細書中で使用される、句「診断」は、病的状態の存在または性質の同定を意味する。診断方法は、その感度および特異性の点で異なる。診断アッセイの「感度」は、陽性反応を示す罹患個体の比率(「真の陽性」の比率)である。アッセイによって検出されない罹患個体は、「偽陰性」であえる。罹患せず、且つアッセイで陽性反応を示す被験体を、「真の陰性」と呼ぶ。診断アッセイの「特異性」は、1−偽陽性率(式中、「偽陰性」率を、陽性反応を示す罹患していない被験体の比率と定義する)である。特定の診断方法で容態を確実に診断できないとはいえ、この方法が診断を補助する明確な表示をする場合、十分である。
本明細書中で使用される、句「診断」は、疾患または症状の分類、疾患の重症度の決定、疾患の進行のモニタリング、疾患の結果および/または回復の見込みの予測をいう。用語「検出」はまた、任意選択的に、上記のいずれかを含み得る。
本発明の疾患の診断を、被験体から得た生体サンプル中の本発明のポリヌクレオチドまたはポリペプチドレベルの決定によって行うことができ、決定されたレベルは、疾患素因または疾患の有無と相関し得る。「被験体から得た生体サンプル」はまた、任意選択的に、以下でさらに詳述するように、被験体から物理的に取り出していないサンプルを含み得ることに留意すべきである。
本明細書中で使用される、用語「レベル」は、本発明のRNAおよび/もしくはタンパク質の発現レベルまたはマーカーのDNAコピー数をいう。
典型的には、被験体から得た生体サンプル中のマーカーレベルは、健常な個体から得た類似のサンプル中の同一の変異型のレベルと異なる(すなわち、多いか少ない)(生体サンプルの例は、本明細書中に記載されている)。
多数の周知の組織または流動物の回収方法を使用して、被験体から生体サンプルを回収し、被験体中の目的の変異型のDNA、RNA、および/またはポリペプチドのレベルを決定することができる。
例には、細針生検、針生検、コアニードル生検(core needle biopsy)、および外科生検(例えば、脳生検)、および洗浄が含まれるが、これらに限定されない。使用手順に関係なく、一旦生検/サンプルが得られると、変異型のレベルを決定し、それにより診断することができる。
同一起源の正常組織中の同一変異型のレベルの決定を、正常組織と対照的な変異型の発現および/または増幅の増加および/または発現の減少を検出するために同時に行うことが好ましい。
マーカーの「試験量」は、肺癌(または指示的容態の1つ)の診断と一致する被験体サンプル中のマーカーの量をいう。試験量は、絶対量(例えば、μg/ml)または相対量(例えば、シグナルの相対強度)のいずれかであり得る。
マーカーの「コントロール量」は、マーカーの試験量と比較すべき任意の量または量の範囲であり得る。例えば、マーカーのコントロール量は、肺癌(または指示的容態の1つ)患者または肺癌(または指示的容態の1つ)を罹患していないヒトのマーカーの量であり得る。コントロール量は、絶対量(例えば、μg/ml)または相対量(例えば、シグナルの相対強度)のいずれかであり得る。
「検出」は、検出すべき目的物の存在、非存在、または量の同定をいう。
「標識」は、顕微鏡手段、光化学的手段、生化学的手段、免疫化学的手段、または化学的手段によって検出可能な任意の部分または要素(item)を含む。例えば、有用な標識には、32P、35S、蛍光色素、電子密度の高い試薬、酵素(例えば、一般に、ELISAで使用される)、ビオチン−ストレプトアビジン、ジオキシゲニン、抗血清もしくはモノクローナル抗体を利用可能なハプテンおよびタンパク質、または標的と配列が相補的な核酸分子が含まれる。標識は、しばしば、放射性、発色性、または蛍光のシグナルなどの測定可能なシグナルを生じ、これらを使用して、サンプル中の結合標識量を定量することができる。標識を、共有結合、イオン結合、ファンデルワールス結合、または水素結合のいずれかによってプライマーまたはプローブ中に組み込むか、これらに結合させることができる(例えば、放射性ヌクレオチドまたはストレプトアビジンによって認識されるビオチン化ヌクレオチドの組み込み)。標識を、直接または間接的に検出することができる。間接的検出は、直接または間接的な第1の標識への第2の標識の結合を含み得る。例えば、標識は、ストレプトアビジンの結合パートナーであるビオチンまたは特異的にハイブリッド形成することができる相補配列の結合パートナーであるヌクレオチド配列などの結合パートナーのリガンドであり得る。結合パートナー自体を直接検出することができ、例えば、抗体自体を蛍光分子で標識することができる。結合パートナーは間接的にも検出することができ、例えば、相補ヌクレオチド配列を有する核酸は、他の標識核酸分子とのハイブリッド形成によって検出することができる分岐DNA分子の一部であり得る(例えば、P.D.Fahrlander and A.Klausner,Bio/Technology 6:1165(1988)を参照のこと)。例えば、シンチレーション計数、デンシトメトリー、またはフローサイトメトリーによってシグナルを定量する。
任意選択的および好ましくは免疫アッセイと共に使用するための例示的な検出可能な標識には、磁性ビーズ、蛍光色素、放射性標識、酵素(例えば、西洋ワサビペルオキシダーゼ、アルカリホスファターゼ、およびELISAで一般的に使用されている他の酵素)、および熱量測定標識(コロイド金もしくは着色ガラスなど)、またはプラスチックビーズが含まれるが、これらに限定されない。あるいは、サンプル中のマーカーを、間接的アッセイ(例えば、第2の標識抗体を使用して結合したマーカー特異的抗体を検出する)を使用し、そして/または競合アッセイまたは阻害アッセイ(例えば、マーカーの異なるエピトープに結合するモノクローナル抗体を混合物と同時にインキュベートする)で検出することができる。
「免疫アッセイ」は、抗原に特異的に結合する抗体を使用するアッセイである。免疫アッセイは、抗原を単離、ターゲティング、および/または定量するための特定の抗体の特異的結合特性の使用によって特徴づけられる。
句、抗体に「特異的に(または選択的に)結合する」または「〜と特異的に(または選択的に)免疫反応性を示す」は、タンパク質またはペプチド(または他のエピトープ)をいう場合、タンパク質または他の生物製剤(biologics)の不均一な集団中のタンパク質の存在を決定する結合反応をいう。したがって、指定の免疫アッセイ条件下で、特定の抗体は、特定のタンパク質にバックグラウンド(非特異的シグナル)の少なくとも2倍を超えて結合し、サンプル中に存在する他のタンパク質に有意な量で実質的に結合しない。このような条件下での抗体の特異的結合は、特定のタンパク質に対するその特異性について選択された抗体が必要であり得る。例えば、ラット、マウス、またはヒトなどの特定の種由来の精液塩基性タンパク質に対して惹起したポリクローナル抗体を選択して、精液塩基性タンパク質と特異的に免疫反応するが、他のタンパク質(精液塩基性タンパク質の多型性変異型および対立遺伝子を除く)と反応しないポリクローナル抗体のみを得ることができる。他の種から精液塩基性タンパク質分子と交差反応する抗体を引くことによって、この選択を行うことができる。種々の免疫アッセイ形式を使用して、特定のタンパク質と特異的な免疫反応性を示す抗体を選択することができる。例えば、固相ELISA免疫アッセイを日常的に使用して、タンパク質と特異的免疫反応性を示す抗体を選択する(例えば、特異的免疫反応性を検出するために使用することができる免疫アッセイの形式および条件の説明については、Harlow & Lane,Antibodies,A Laboratory Manual(1988)を参照のこと)。典型的には、特異的反応または選択的反応は、バックグラウンドシグナルまたはノイズの少なくとも2倍、より典型的にはバックグラウンドの10〜100倍である。
本発明の好ましい実施形態によれば、好ましくは、任意の上記核酸配列および/またはアミノ酸配列は、これらの配列と少なくとも約70%、好ましくは少なくとも約80%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同な任意の配列をさらに含む。
他で示さない限り、全ての実験データは、本発明の変異型に関し、試験されたセグメントにしたがって命名される(記載のように発現をRT−PCRによって試験した場合)。
本発明の実施形態として本明細書中に示した全ての核酸配列および/またはアミノ酸配列は、その単離形態(単離ポリヌクレオチド(全転写物が含まれる)、オリゴヌクレオチド(全セグメント、アンプリコン、およびプライマーが含まれる)、ペプチド(全てのテール、架橋、挿入、または先端(任意選択的に、本明細書中に記載の他の抗体エピトープが含まれる)、および/またはポリペプチド(全タンパク質が含まれる)が含まれる)など)に関する。オリゴヌクレオチドとポリヌクレオチドまたはペプチドとポリペプチドとを、任意選択的に、交換可能に使用することができることに留意すべきである。
本発明の好ましい実施形態によれば、配列番号1および2を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1022、1023、1024、1025、1026、および1027を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1281および1282を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号3および4を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1028、1029、1030、1031、1032、1033、1034、1035、1036、1037、および1038を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1283および1284を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号5、6、7、および8を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1039、1040、1041、1042、1043、1044、1045、1046、1047、1048、1049、1050、1051、1052、1053、1054、1055、1056、1057、1058、1059、1060、1061、1062、1063、1064、1065、および1066を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1285、1286、1287、および1288を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号9、10、11、12、13、14、および15を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1067、1068、1069、1070、1071、1072、1073、1074、1075、1076、1077、1078、1079、1080、1081、1082、1083、1084、1085、1086、1087、1088、1089、1090、1091、1092、1093、1094、1095、1096、1097、1098、1099、および1100を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1289、1290、1291、1292、1293、および1294を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号20および21を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1130、1131、1132、1133、および1134を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1299および1300を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号22、23、および24を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1135、1136、1137、1138、1139、1140、1141、1142、1143、および1144を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1301、1302、および1303を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号25、26、および27を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1145、1146、1147、1148、1149、1150、1151、1152、1153、1154、1155、および1156を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1304および1305を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号28を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1157、1158、1159、1160、1161、1162、1163、1164、1165、1166、1167、1168、1169、1170、および1171を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1306を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号29および30を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1172、1173、1174、1175、1176、1177、1178、1179、1180、1181、1182、1183、1184、1185、1186、1187、1188、1189、1190、および1191を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1307および1308を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号31を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1192、1193、1194、1195、1196、1197、および1198を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1309を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号32を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1199、1200、1201、1202、1203、1204、1205、1206、1207、1208、1209、1210、1211、1212、1213、1214、および1215を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1310を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号33を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1216および1217、1218、1219、1220、1221、1222、1223、1224、1225、1226、および1227を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1311を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号34を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1228、1229、1230、1231、1232、および1223を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1312を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号35を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1234、1235、1236、1237、1238、1239、1240、1241、1242、1243、1244、1245、1246、1247、1248、1249、1250、1251、1252、1253、および1254を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1313を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号36、37、38、39、および40を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1255、1256、1257、1258、1259、1260、1261、1262、1263、1264、1265、1266、1267、1268、1269、1270、1271、1272、1273、1274、および1275を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1314、1315、1316、および1317を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号125、126、127、128、129、および130を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号887、888、889、890、891、892、893、894、895、896、897、898、899、900、901、および902を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1394、1395、1396、1397、および1398を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号131および132の転写物を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号903、904、905、906、907、907、908、および909を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1399および1400を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号99、100、101、および102を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号742、743、744、745、746、747、748、749、750、751、752、753、754、755、756、757、758、759、760、761、762、763、764、765、766、767、768、769、770、771、772、773、774、775、776、777、778、779、780、781、782、783、784、785、786、787、および788を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1372、1373、1374、および1375を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号134を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号913、914、915、916、917、918、919、920、921、922、923、924、925、926、927、928、929、930、931、932、933、934、935、および936を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1402を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号133を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号910、911、および912を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号141、142、および142を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号961、962、963、964、965、966、967、968、969、970、971、972、973、974、975、976、977、978、979、980、981、982、983、984、985、986、987、988、989、および990を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、タンパク質名:
HUMOSTRO_PEA_1_PEA_1_P21、
HUMOSTRO_PEA_1_PEA_1_P25、
HUMOSTRO_PEA_1_PEA_1_P30を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号51、52、53、54、55、56、および57を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号518、519、520、521、522、523、524、525、526、527、528、529、530、531、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、557、558、559、560、561、562、563、564、565、566、567、568、569、および570を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1327、1328、1329、1330、1331、1332、および1333を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号135、136、137、138、139、および140を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号937、938、939、940、941、942、943、944、945、946、947、948、949、950、951、952、953、954、955、956、957、958、959、および960を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1403、1404、1405、1406、1407、および1408を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号41、42、43、44、45、46、および47を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号482、483、484、495、486、487、488、489、490、491、492、493、494、495、496、497、498、499、500、および501を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1318、1319、1320、1321、1322、および1323を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号121、122、123、および124を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号876、877、878、879、880、881、882、883、884、885、および886を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1390、1391、1392、および1393を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号48、49、および50を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号502、503、504、505、506、507、508、509、510、511、512、513、514、515、516、および517を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1324、1325、および1326を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号1464および1465を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1276、1277、1278、1279、および1280を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1415を含む単離ポリペプチドを提供する。
転写物に対応するタンパク質名:
HSU33147_PEA_1_P5;HSU33147_PEA_1_T1;HSU33147_PEA_1_T2。
本発明の好ましい実施形態によれば、配列番号58を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号571、572、573、574、575、576、577、および578を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1334を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号74、75、76、77、78、79、80、81、および82を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号659、660、661、662、663、664、665、666、667、668、669、670、671、672、673、674、675、676、677、678、679、680、681、682、683、684、685、686、687、688、689、690、691、692、および693を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1350、1351、1352、1353、1354、1355、1356、および1357を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号:転写物名T23580_T10を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号579、580、581、582、および583を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1335を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号59、60、61、62、63、および64を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号584、585、586、587、588、589、590、591、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、および615を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1336、1337、1338、1339、および1340を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号65、66、67、68、69、70、71、72、および73を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号616、617、618、619、620、621、622、623、624、625、626、627、628、629、630、631、632、633、634、635、636、637、638、639、640、641、642、643、644、645、646、647、648、649、650、651、652、653、654、655、656、657、658、および659を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1341、1342、1343、1344、1345、1346、1347、1348、および1349を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号83、84、85、86、87、88、89、90、91、92、93、94、95、および96を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号695、696、697、698、699、700、701、702、703、704、および705を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1358、1359、1360、1361、1362、1363、1364、1365、1366、1367、1368、および1369を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号97および98を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号706、707、708、709、710、711、712、713、714、715、716、717、718、719、720、721、722、723、724、725、726、727、728、729、730、731、732、733、734、735、736、737、738、739、740、および741を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1370および1371を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号103、104、105、106、107、および108を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号789、790、791、792、793、794、795、796、797、798、799、800、801、802、803、804、805、806、807、808、809、810、811、812、および813を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1376、1377、1378、および1379を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号114、115、116、117、118、および119を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号856、857、858、859、860、861、862、863、864、865、866、867、868、869、870、871、872、873、874、および875を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1385、1386、1387、1388、および1389を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号144、145、146、147、148、および149を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号991、992、993、994、995、996、997、998、999、1000、1001、1002、1003、1004、1005、1006、1007、1008、1009、1010、1011、1012、1013、1014、1015、および1016を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1409、1410、1411、1412、および1413を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号150を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1017、1018、1019、1020、および1021を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1414を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、配列番号109、110、111、112、および113を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号814、815、816、817、818、819、820、821、822、823、824、825、826、827、829、830、831、832、833、834、835、836、837、838、839、840、841、842、843、844、845、846、847、848、849、850、851、852、853、854、および855を含む単離ポリヌクレオチドを提供する。
本発明の好ましい実施形態によれば、配列番号1380、1381、1382、1383、および1384を含む単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P4をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P4のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P4のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜445に対応し、HSSTROL3_P4のアミノ酸165〜445にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P4のアミノ酸446〜496に対応する配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P4のテールをコードする単離ポリペプチドであって、HSSTROL3_P4中の配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P4のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P5をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P5のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P5のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜358に対応し、HSSTROL3_P5のアミノ酸165〜358にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P5のアミノ酸359〜382に対応する配列ELGFPSSTGRDESLEHCRCQGLHKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P5のテールをコードする単離ポリペプチドであって、HSSTROL3_P5中の配列ELGFPSSTGRDESLEHCRCQGLHKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P5のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P7をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P7のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P7のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P7のアミノ酸165〜359にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P7のアミノ酸360〜370に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P7のテールをコードする単離ポリペプチドであって、HSSTROL3_P7中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P8をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P8のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P8のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜286に対応し、HSSTROL3_P8のアミノ酸165〜286にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P8のアミノ酸278〜301に対応する配列VRPCLPVPLLLCWPLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P8のテールをコードする単離ポリペプチドであって、HSSTROL3_P8中の配列VRPCLPVPLLLCWPLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P8のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P9をコードする単離キメラポリペプチドであって、MM11_HUMANのアミノ酸1〜96に対応し、HSSTROL3_P9のアミノ酸1〜96にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKと少なくとも90%相同な第1のアミノ酸配列と、MM11_HUMANのアミノ酸113〜163に対応し、HSSTROL3_P9のアミノ酸97〜147にも対応するRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P9のアミノ酸148に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P9のアミノ酸149〜343にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第3のアミノ酸配列と、HSSTROL3_P9のアミノ酸344に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P9の縁(edge)部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKRを含み、以下の構造:アミノ酸番号96−x〜96のいずれかから始まり、アミノ酸番号97+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSSTROL3_P9の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSSTROL3_P9のテールをコードする単離ポリペプチドであって、HSSTROL3_P9中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P9のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P14をコードする単離キメラポリペプチドであって、CA1B_HUMAN_V5のアミノ酸1〜1056に対応し、HUMCA1XIA_P14のアミノ酸1〜1056にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQRGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPGAAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQGPPGPVと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P14のアミノ酸1057〜1081に対応する配列VSMMIINSQTIMVVNYSSSFITLMLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P14をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P14のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P14中の配列VSMMIINSQTIMVVNYSSSFITLMLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P14のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P15をコードする単離キメラポリペプチドであって、CA1B_HUMANのアミノ酸1〜714に対応し、HUMCA1XIA_P15のアミノ酸1〜714にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P15のアミノ酸715〜729に対応する配列MCCNLSFGILIPLQKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P15をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P15のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P15中の配列MCCNLSFGILIPLQKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P15のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P16をコードする単離キメラポリペプチドであって、CA1B_HUMANのアミノ酸1〜648に対応し、HUMCA1XIA_P16のアミノ酸1〜648にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAと少なくとも90%相同な第1のアミノ酸配列と、CA1B_HUMANのアミノ酸667〜714に対応し、HUMCA1XIA_P16のアミノ酸649〜696にも対応するGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第2のアミノ酸配列と、HUMCA1XIA_P16のアミノ酸697〜738に対応する配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P16をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P16の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がAGを含み、以下の構造:アミノ酸番号648−x〜648のいずれかから始まり、アミノ酸番号649+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCA1XIA_P16の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P16のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P16中の配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P16のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P17をコードする単離キメラポリペプチドであって、CA1B_HUMANのアミノ酸1〜260に対応し、HUMCA1XIA_P17のアミノ酸1〜260にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P17のアミノ酸261〜273に対応する配列VRSTRPEKVFVFQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P17をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCA1XIA_P17のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P17中の配列VRSTRPEKVFVFQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P17のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R20779_P2をコードする単離キメラポリペプチドであって、STC2_HUMANのアミノ酸1〜169に対応し、R20779_P2のアミノ酸1〜169にも対応するMCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHEと少なくとも90%相同な第1のアミノ酸配列と、R20779_P2のアミノ酸170〜187に対応する配列CYKIEITMPKRRKVKLRDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R20779_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R20779_P2のテールをコードする単離ポリペプチドであって、R20779_P2中の配列CYKIEITMPKRRKVKLRDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R20779_P2のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P21をコードする単離キメラポリペプチドであって、OSTP_HUMANのアミノ酸1〜58に対応し、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜58にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸59〜64に対応する配列VFLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P21をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P21のテールをコードする単離ポリペプチドであって、HUMOSTRO_PEA_1_PEA_1_P21中の配列VFLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P21のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P25をコードする単離キメラポリペプチドであって、OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸32〜32に対応する配列Hを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P25をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P30をコードする単離キメラポリペプチドであって、OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸32〜39に対応する配列VSIFYVFIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P30をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMOSTRO_PEA_1_PEA_1_P30のテールをコードする単離ポリペプチドであって、HUMOSTRO_PEA_1_PEA_1_P30中の配列VSIFYVFIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P30のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P10をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、PLTP_HUMANのアミノ酸163〜493に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸68〜398にも対応するKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVTNHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P10の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEKを含み、以下の構造:アミノ酸番号67−x〜67のいずれかから始まり、アミノ酸番号68+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P10の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P12をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜427に対応し、HUMPHOSLIP_PEA_2_P12のアミノ酸1〜427にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P12のアミノ酸428〜432に対応する配列GKAGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P12をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P12のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P12中の配列GKAGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P12のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P31をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P31のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P31のアミノ酸68〜98に対応する配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P31をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P31のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P31中の配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P31のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P33をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜183に対応し、HUMPHOSLIP_PEA_2_P33のアミノ酸1〜183にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P33のアミノ酸184〜200に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P33をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P33のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P33中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P33のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P34をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜205に対応し、HUMPHOSLIP_PEA_2_P34のアミノ酸1〜205にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P34のアミノ酸206〜217に対応する配列LWTSLLALTIPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P34をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P34のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P34中の配列LWTSLLALTIPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P34のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P35をコードする単離キメラポリペプチドであって、PLTP_HUMANのアミノ酸1〜109に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸1〜109にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFと少なくとも90%相同な第1のアミノ酸配列と、第2のアミノ酸配列と、Lを含む架橋アミノ酸Hと、PLTP_HUMANのアミノ酸163〜183に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸111〜131にも対応するKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第3のアミノ酸配列と、HUMPHOSLIP_PEA_2_P35のアミノ酸132〜148に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P35をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P35の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がFLKを含み、以下の構造(HUMPHOSLIP_PEA_2_P35に対応する番号付け):アミノ酸番号109−x〜109のいずれかから始まり、アミノ酸番号111+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P35の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMPHOSLIP_PEA_2_P35のテールをコードする単離ポリペプチドであって、HUMPHOSLIP_PEA_2_P35中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P35のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P6をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P6のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P6のアミノ酸413〜449に対応する配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P6のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P6中の配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P6のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P13をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜323に対応し、R38144_PEA_2_P13のアミノ酸1〜323にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P13のアミノ酸324〜341に対応する配列NLLKAQCTSTVPRGIPPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P13をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P13のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P13中の配列NLLKAQCTSTVPRGIPPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P13のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P15をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜282に対応し、R38144_PEA_2_P15のアミノ酸1〜282にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P15のアミノ酸283〜287に対応する配列PHWRHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P15をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P15のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P15中の配列PHWRHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P15のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P19をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P19のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P19のアミノ酸413〜433に対応する配列KRSRSVAQAGVQWCDHDSPQPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P19をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P19のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P19中の配列KRSRSVAQAGVQWCDHDSPQPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P19のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P24をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜121に対応し、R38144_PEA_2_P24のアミノ酸1〜121にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRと少なくとも90%相同な第1のアミノ酸配列と、CT31_HUMANのアミノ酸282〜578に対応する配列EYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P24をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P24の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がREを含み、以下の構造:アミノ酸番号121−x〜121のいずれかから始まり、アミノ酸番号122+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R38144_PEA_2_P24の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P36をコードする単離キメラポリペプチドであって、AAH16184のアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P36のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P36をコードする単離キメラポリペプチドであって、AAQ88943のアミノ酸1〜35に対応し、R38144_PEA_2_P36のアミノ酸1〜35にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸36〜60に対応する配列RFWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P36のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P36中の配列RFWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P36をコードする単離キメラポリペプチドであって、CT31_HUMANのアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R38144_PEA_2_P36のテールをコードする単離ポリペプチドであって、R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P6をコードする単離キメラポリペプチドであって、AA161187_P6のアミノ酸1〜42に対応するHTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜314に対応し、AA161187_P6のアミノ酸43〜326にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P6の先端をコードする単離ポリペプチドであって、AA161187_P6の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P6の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P13をコードする単離キメラポリペプチドであって、TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P13のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P13のアミノ酸184〜213に対応する配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P13をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P13のテールをコードする単離ポリペプチドであって、AA161187_P13中の配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P13のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P14をコードする単離キメラポリペプチドであって、TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P14のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P14のアミノ酸184〜307に対応する配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P14をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P14のテールをコードする単離ポリペプチドであって、AA161187_P14中の配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P14のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P18をコードする単離キメラポリペプチドであって、AA161187_P18のアミノ酸1〜42に対応する配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜86に対応し、AA161187_P18のアミノ酸43〜98にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETと少なくとも90%相同な第2のアミノ酸配列と、TEST_HUMANのアミノ酸89〜235に対応し、AA161187_P18のアミノ酸99〜245にも対応するDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFと少なくとも90%相同な第3のアミノ酸配列と、AA161187_P18のアミノ酸246〜265に対応する配列VSVPATTPSPGKHPVSLCLIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P18をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P18の先端をコードする単離ポリペプチドであって、AA161187_P18の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P18の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号98−x〜99のいずれかから始まり、アミノ酸番号99+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、AA161187_P18の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P18のテールをコードする単離ポリペプチドであって、AA161187_P18中の配列VSVPATTPSPGKHPVSLCLIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P19をコードする単離キメラポリペプチドであって、TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P19のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P19のアミノ酸184〜188に対応する配列DKRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P19をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、AA161187_P19のテールをコードする単離ポリペプチドであって、AA161187_P19中の配列DKRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P19のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P2をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P2のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P2のアミノ酸132〜139に対応する配列GKQGMRAHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P2のテールをコードする単離ポリペプチドであって、Z25299_PEA_2_P2中の配列GKQGMRAHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P2のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P3をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P3のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P3のアミノ酸132〜156に対応する配列GEKRHHKQLRDQEVDPLEMRRHSAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P3をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P3のテールをコードする単離ポリペプチドであって、Z25299_PEA_2_P3中の配列GEKRHHKQLRDQEVDPLEMRRHSAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P3のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P7をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜81に対応し、Z25299_PEA_2_P7のアミノ酸1〜81にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P7のアミノ酸82〜89に対応する配列RGSLGSAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P7のテールをコードする単離ポリペプチドであって、Z25299_PEA_2_P7中の配列RGSLGSAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z25299_PEA_2_P10をコードする単離キメラポリペプチドであって、ALK1_HUMANのアミノ酸1〜82に対応し、Z25299_PEA_2_P10のアミノ酸1〜82にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTと少なくとも90%相同な第1のアミノ酸配列を含む、Z25299_PEA_2_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R66178_P3をコードする単離キメラポリペプチドであって、PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P3のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P3のアミノ酸335〜354に対応する配列GEGHSLPISPGVLQTQNCGPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P3をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R66178_P3のテールをコードする単離ポリペプチドであって、R66178_P3中の配列GEGHSLPISPGVLQTQNCGPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P3のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R66178_P4をコードする単離キメラポリペプチドであって、PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P4のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P4のアミノ酸335〜352に対応する配列AFCQLIYPGKGRTRARMFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R66178_P4のテールをコードする単離ポリペプチドであって、R66178_P4中の配列AFCQLIYPGKGRTRARMFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P4のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R66178_P8をコードする単離キメラポリペプチドであって、PVR1_HUMANのアミノ酸1〜330に対応し、R66178_P8のアミノ酸1〜330にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEと少なくとも90%相同な第1のアミノ酸配列と、R66178_P8のアミノ酸331〜363に対応する配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R66178_P8のテールをコードする単離ポリペプチドであって、R66178_P8中の配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P8のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドであって、MGBA_HUMANのアミノ酸1〜78に対応し、HSU33147_PEA_1_P5のアミノ酸1〜78にも対応するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEと少なくとも90%相同な第1のアミノ酸配列と、MGBA_HUMANのアミノ酸82〜93に対応し、HSU33147_PEA_1_P5のアミノ酸79〜90にも対応するQLIYDSSLCDLFと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEQを含み、以下の構造:アミノ酸番号78−x〜78のいずれかから始まり、アミノ酸番号79+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドであって、MGBA_HUMANのアミノ酸1〜78に対応し、HSU33147_PEA_1_P5のアミノ酸1〜78にも対応するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEと少なくとも90%相同な第1のアミノ酸配列と、MGBA_HUMANのアミノ酸82〜93に対応し、HSU33147_PEA_1_P5のアミノ酸79〜90にも対応するQLIYDSSLCDLFと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HSU33147_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEQを含み、以下の構造:アミノ酸番号78−x〜78のいずれかから始まり、アミノ酸番号79+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P3をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜517に対応し、M78076_PEA_1_P3のアミノ酸1〜517にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P3のアミノ酸518〜519に対応する配列GEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P3をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P4をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P4のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P4のアミノ酸527〜541に対応する配列ECLTVNPSLQIPLNPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P4のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P4中の配列ECLTVNPSLQIPLNPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P4のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P12をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P12のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P12のアミノ酸527〜544に対応する配列ECVCSKGFPFPLIGDSEGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P12をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P12のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P12中の配列ECVCSKGFPFPLIGDSEGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P12のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P14をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜570に対応し、M78076_PEA_1_P14のアミノ酸1〜570にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P14のアミノ酸571〜619に対応する配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P14をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P14のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P14中の配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P14のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P21をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜352に対応し、M78076_PEA_1_P21のアミノ酸1〜352にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEと少なくとも90%相同な第1のアミノ酸配列と、APP1_HUMANのアミノ酸406〜650に対応し、M78076_PEA_1_P21のアミノ酸353〜597にも対応するAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERPと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P21をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P21の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEAを含み、以下の構造:アミノ酸番号352−x〜352のいずれかから始まり、アミノ酸番号353+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M78076_PEA_1_P21の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P24をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜481に対応し、M78076_PEA_1_P24のアミノ酸1〜481にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P24のアミノ酸482〜498に対応する配列RECLLPWLPLQISEGRSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P24をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P24のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P24中の配列RECLLPWLPLQISEGRSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P24のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P2をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜449に対応し、M78076_PEA_1_P2のアミノ酸1〜449にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P2のアミノ酸450〜588に対応する配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P2のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P2中の配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P2のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P25をコードする単離キメラポリペプチドであって、APP1_HUMANのアミノ酸1〜448に対応し、M78076_PEA_1_P25のアミノ酸1〜448にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P25のアミノ酸449〜505に対応する配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P25をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M78076_PEA_1_P25のテールをコードする単離ポリペプチドであって、M78076_PEA_1_P25中の配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P25のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P1をコードする単離キメラポリペプチドであって、BAA25445のアミノ酸13〜931に対応し、M79217_PEA_1_P1のアミノ酸1〜919にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第1のアミノ酸配列を含む、M79217_PEA_1_P1をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P2をコードする単離キメラポリペプチドであって、EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P2のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸820〜919に対応し、M79217_PEA_1_P2のアミノ酸808〜907にも対応するAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P2の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKAを含み、以下の構造:アミノ酸番号807−x〜807のいずれかから始まり、アミノ酸番号808+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M79217_PEA_1_P2の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P4をコードする単離キメラポリペプチドであって、M79217_PEA_1_P4のアミノ酸1〜51に対応する配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸759〜919に対応し、M79217_PEA_1_P4のアミノ酸52〜212にも対応するRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P4の先端をコードする単離ポリペプチドであって、M79217_PEA_1_P4の配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P4の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P8をコードする単離キメラポリペプチドであって、EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P8のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、M79217_PEA_1_P8のアミノ酸808〜812に対応する配列VRKSWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M79217_PEA_1_P8のテールをコードする単離ポリペプチドであって、M79217_PEA_1_P8中の配列VRKSWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P8のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P4をコードする単離キメラポリペプチドであって、M62096_PEA_1_P4のアミノ酸1〜6に対応する配列MATYIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸239〜957に対応し、M62096_PEA_1_P4のアミノ酸7〜725にも対応するVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P4の先端をコードする単離ポリペプチドであって、M62096_PEA_1_P4の配列MATYIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P4の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P5をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸284〜957に対応し、M62096_PEA_1_P5のアミノ酸1〜674にも対応するMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P3をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸365〜957に対応し、M62096_PEA_1_P3のアミノ酸1〜593にも対応するMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P3をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P7をコードする単離キメラポリペプチドであって、M62096_PEA_1_P7のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜957に対応し、M62096_PEA_1_P7のアミノ酸20〜239にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P7の先端をコードする単離ポリペプチドであって、M62096_PEA_1_P7の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P7の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P8をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜736に対応し、M62096_PEA_1_P8のアミノ酸1〜736にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P8のアミノ酸737〜737に対応する配列Eを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P9をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜454に対応し、M62096_PEA_1_P9のアミノ酸1〜454にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDEと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P9のアミノ酸455〜514に対応する配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P9のテールをコードする単離ポリペプチドであって、M62096_PEA_1_P9中の配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P9のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P10をコードする単離キメラポリペプチドであって、M62096_PEA_1_P10のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドとと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜815に対応し、M62096_PEA_1_P10のアミノ酸20〜97にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKと少なくとも90%相同な第2のアミノ酸配列と、M62096_PEA_1_P10のアミノ酸98〜125に対応する配列VSSLCLNGTEKKIKDGREESFSVEISLAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P10の先端をコードする単離ポリペプチドであって、M62096_PEA_1_P10の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P10のテールをコードする単離ポリペプチドであって、M62096_PEA_1_P10中の配列VSSLCLNGTEKKIKDGREESFSVEISLAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P11をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜372に対応し、M62096_PEA_1_P11のアミノ酸1〜372にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P11のアミノ酸373〜385に対応する配列DFLAAHVFGKLLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P11をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P11のテールをコードする単離ポリペプチドであって、M62096_PEA_1_P11中の配列DFLAAHVFGKLLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P11のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M62096_PEA_1_P12をコードする単離キメラポリペプチドであって、KF5C_HUMANのアミノ酸1〜323に対応し、M62096_PEA_1_P12のアミノ酸1〜323にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P12のアミノ酸324〜324に対応する配列Vを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P12をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T99080_PEA_4_P5をコードする単離キメラポリペプチドであって、T99080_PEA_4_P5のアミノ酸1〜30に対応する配列MPASARLAGAGLLLAFLRALGCAGRAPGLSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸1〜99に対応し、T99080_PEA_4_P5のアミノ酸31〜129にも対応するMAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T99080_PEA_4_P5の先端をコードする単離ポリペプチドであって、T99080_PEA_4_P5の配列MPASARLAGAGLLLAFLRALGCAGRAPGLSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T99080_PEA_4_P5の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T99080_PEA_4_P8をコードする単離キメラポリペプチドであって、T99080_PEA_4_P8のアミノ酸1〜1に対応する配列Mを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸28〜99に対応し、T99080_PEA_4_P8のアミノ酸2〜73にも対応するQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、SNXQ_HUMANのアミノ酸1〜185に対応し、T08446_PEA_1_P18のアミノ酸1〜185にも対応するMLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMEと少なくとも90%相同な第1のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸186〜1305に対応する配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18のテールをコードする単離ポリペプチドであって、T08446_PEA_1_P18中の配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、T08446_PEA_1_P18のアミノ酸1〜443に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NT23のアミノ酸1〜674に対応し、T08446_PEA_1_P18のアミノ酸444〜1117にも対応するHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1118に対応する架橋アミノ酸Pと、Q9NT23のアミノ酸676〜862に対応し、T08446_PEA_1_P18のアミノ酸1119〜1305にも対応するTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。

本発明の好ましい実施形態によれば、T08446_PEA_1_P18の先端をコードする単離ポリペプチドであって、T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、T08446_PEA_1_P18のアミノ酸1〜1010に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q96CP3のアミノ酸1〜295に対応し、T08446_PEA_1_P18のアミノ酸1011〜1305にも対応するLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18の先端をコードする単離ポリペプチドであって、T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18をコードする単離キメラポリペプチドであって、T08446_PEA_1_P18のアミノ酸1〜154に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC86902のアミノ酸1〜861に対応し、T08446_PEA_1_P18のアミノ酸155〜1015にも対応するMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1016〜1043に対応する配列QVSAQLRAGGGGRDAPEAAAQSPCSVPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列と、BAC86902のアミノ酸862〜989に対応し、T08446_PEA_1_P18のアミノ酸1044〜1171にも対応するQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSと少なくとも90%相同な第4のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1172〜1305に対応する配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第5のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、第4のアミノ酸配列、および第5のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18の先端をコードする単離ポリペプチドであって、T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18の縁部分をコードする単離ポリペプチドであって、T08446_PEA_1_P18に対応するQVSAQLRAGGGGRDAPEAAAQSPCSVPSをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、T08446_PEA_1_P18の縁部分をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T08446_PEA_1_P18のテールをコードする単離ポリペプチドであって、T08446_PEA_1_P18中の配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T11628_PEA_1_P2をコードする単離キメラポリペプチドであって、T11628_PEA_1_P2のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P2のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T11628_PEA_1_P2の先端をコードする単離ポリペプチドであって、T11628_PEA_1_P2の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P2の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T11628_PEA_1_P5をコードする単離キメラポリペプチドであって、MYG_HUMAN_V1のアミノ酸56〜154に対応し、T11628_PEA_1_P5のアミノ酸1〜99にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第1のアミノ酸配列を含む、T11628_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T11628_PEA_1_P7をコードする単離キメラポリペプチドであって、MYG_HUMAN_V1のアミノ酸1〜134に対応し、T11628_PEA_1_P7のアミノ酸1〜134にも対応するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKと少なくとも90%相同な第1のアミノ酸配列と、T11628_PEA_1_P7のアミノ酸135〜135に対応する配列Gを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T11628_PEA_1_P10をコードする単離キメラポリペプチドであって、T11628_PEA_1_P10のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P10のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T11628_PEA_1_P10の先端をコードする単離ポリペプチドであって、T11628_PEA_1_P10の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P10の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P9をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸275〜385に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P9のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P9中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P9のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P8をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜320に対応し、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸1〜320にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸321〜346に対応する配列VRTRRVGARGPWPGPPRPMGHPLLRTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P8のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P8中の配列VRTRRVGARGPWPGPPRPMGHPLLRTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P8のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P11をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜229に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸1〜229にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARと少なくとも90%相同な第1のアミノ酸配列と、ALAT_HUMAN_V1のアミノ酸455〜496に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸230〜271にも対応するSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P11をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がRSを含み、以下の構造:アミノ酸番号229−x〜229のいずれかから始まり、アミノ酸番号230+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P11の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P2をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸275〜399に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P2のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P2中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P2のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P4をコードする単離キメラポリペプチドであって、ALAT_HUMAN_V1のアミノ酸1〜494に対応し、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸1〜494にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCPPVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEAPGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGICVVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸495〜555に対応する配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R35137_PEA_1_PEA_1_PEA_1_P4のテールをコードする単離ポリペプチドであって、R35137_PEA_1_PEA_1_PEA_1_P4中の配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P4のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、R11723_PEA_1_P6のアミノ酸1〜110に対応する配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8IXM0のアミノ酸1〜112に対応し、R11723_PEA_1_P6のアミノ酸111〜122にも対応するMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6の先端をコードする単離ポリペプチドであって、R11723_PEA_1_P6の配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、Q8N2G4のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6をコードする単離キメラポリペプチドであって、BAC85518のアミノ酸24〜106に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P6のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、Q8N2G4のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、R11723_PEA_1_P7のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜80に対応し、R11723_PEA_1_P7のアミノ酸6〜64にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7の先端をコードする単離ポリペプチドであって、R11723_PEA_1_P7の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7をコードする単離キメラポリペプチドであって、BAC85518のアミノ酸24〜87に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P7のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P13をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P13のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P13のアミノ酸64〜84に対応する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P13をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P13のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P13中の配列DTKRTNTLLFEMRHFAKQLTTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P13のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、Q8N2G4のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、R11723_PEA_1_P10のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜79に対応し、R11723_PEA_1_P10のアミノ酸6〜63にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10の先端をコードする単離ポリペプチドであって、R11723_PEA_1_P10の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10の先端をコードする単離ポリペプチドを提供する。

本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10をコードする単離キメラポリペプチドであって、BAC85518のアミノ酸24〜86に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R11723_PEA_1_P10のテールをコードする単離ポリペプチドであって、R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R16276_PEA_1_P7をコードする単離キメラポリペプチドであって、NOV_HUMANのアミノ酸1〜41に対応し、R16276_PEA_1_P7のアミノ酸1〜41にも対応するMQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGと少なくとも90%相同な第1のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸42に対応する架橋アミノ酸Qと、NOV_HUMANのアミノ酸43〜103に対応し、R16276_PEA_1_P7のアミノ酸43〜103にも対応するCPATPPTCAPGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTGICTと少なくとも90%相同な第2のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸104〜111に対応する配列GNPAPSAVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、R16276_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R16276_PEA_1_P7のテールをコードする単離ポリペプチドであって、R16276_PEA_1_P7中の配列GNPAPSAVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R16276_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R16276_PEA_1_P7をコードする単離キメラポリペプチドであって、NOV_HUMANのアミノ酸1〜41に対応し、R16276_PEA_1_P7のアミノ酸1〜41にも対応するMQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGと少なくとも90%相同な第1のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸42に対応する架橋アミノ酸Qと、NOV_HUMANのアミノ酸43〜103に対応し、R16276_PEA_1_P7のアミノ酸43〜103にも対応するCPATPPTCAPGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTGICTと少なくとも90%相同な第2のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸104〜111に対応する配列GNPAPSAVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、R16276_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R16276_PEA_1_P7のテールをコードする単離ポリペプチドであって、R16276_PEA_1_P7中の配列GNPAPSAVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R16276_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P4をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜234に対応し、HUMCEA_PEA_1_P4のアミノ酸1〜234にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P4のアミノ酸235〜315に対応する配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P4のテールをコードする単離ポリペプチドであって、HUMCEA_PEA_1_P4中の配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P4のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P5をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜675に対応し、HUMCEA_PEA_1_P5のアミノ酸1〜675にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYRSGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQAHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQNTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELSVDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWLIDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P5のアミノ酸676〜719に対応する配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P5のテールをコードする単離ポリペプチドであって、HUMCEA_PEA_1_P5中の配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P5のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P19をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜232に対応し、HUMCEA_PEA_1_P19のアミノ酸1〜232にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸589〜702に対応し、HUMCEA_PEA_1_P19のアミノ酸233〜346にも対応するVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P19をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P19の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がNVを含み、以下の構造:アミノ酸番号232−x〜232のいずれかから始まり、アミノ酸番号233+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P19の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P20をコードする単離キメラポリペプチドであって、CEA5_HUMANのアミノ酸1〜142に対応し、HUMCEA_PEA_1_P20のアミノ酸1〜142にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸499〜702に対応し、HUMCEA_PEA_1_P20のアミノ酸143〜346にも対応するELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P20をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMCEA_PEA_1_P20の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がPEを含み、以下の構造:アミノ酸番号142−x〜142のいずれかから始まり、アミノ酸番号143+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P20の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P5をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P5のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P5のアミノ酸442〜464に対応する配列DAMVVSSRPKATTHRKSRTLSRRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P5のテールをコードする単離ポリペプチドであって、Z44808_PEA_1_P5中の配列DAMVVSSRPKATTHRKSRTLSRRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P5のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P6をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜428に対応し、Z44808_PEA_1_P6のアミノ酸1〜428にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P6のアミノ酸429〜434に対応する配列RSKRNLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P6のテールをコードする単離ポリペプチドであって、Z44808_PEA_1_P6中の配列RSKRNLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P6のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P7をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P7のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P7のアミノ酸442〜454に対応する配列LLWLRGKVSFYCFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P7のテールをコードする単離ポリペプチドであって、Z44808_PEA_1_P7中の配列LLWLRGKVSFYCFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P7のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P11をコードする単離キメラポリペプチドであって、SMO2_HUMANのアミノ酸1〜170に対応し、Z44808_PEA_1_P11のアミノ酸1〜170にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTと少なくとも90%相同な第1のアミノ酸配列と、SMO2_HUMANのアミノ酸188〜446に対応し、Z44808_PEA_1_P11のアミノ酸171〜429にも対応するDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P11をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z44808_PEA_1_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号170−x〜170のいずれかから始まり、アミノ酸番号171+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z44808_PEA_1_P11の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H61775_P16をコードする単離キメラポリペプチドであって、Q9P2J2のアミノ酸11〜93に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H61775_P16のテールをコードする単離ポリペプチドであって、H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、H61775_P16をコードする単離キメラポリペプチドであって、AAQ88495のアミノ酸1〜83に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H61775_P16のテールをコードする単離ポリペプチドであって、H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、H61775_P17をコードする単離キメラポリペプチドであって、Q9P2J2のアミノ酸11〜93に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H61775_P17をコードする単離キメラポリペプチドであって、AAQ88495のアミノ酸1〜83に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M85491_PEA_1_P13をコードする単離キメラポリペプチドであって、EPB2_HUMANのアミノ酸1〜476に対応し、M85491_PEA_1_P13のアミノ酸1〜476にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEKと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P13のアミノ酸477〜496に対応する配列VPIGWVLSPSPTSLRAPLPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P13をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M85491_PEA_1_P13のテールをコードする単離ポリペプチドであって、M85491_PEA_1_P13中の配列VPIGWVLSPSPTSLRAPLPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、M85491_PEA_1_P14をコードする単離キメラポリペプチドであって、EPB2_HUMANのアミノ酸1〜270に対応し、M85491_PEA_1_P14のアミノ酸1〜270にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P14のアミノ酸271〜301に対応する配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P14をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、M85491_PEA_1_P14のテールをコードする単離ポリペプチドであって、M85491_PEA_1_P14中の配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M85491_PEA_1_P14のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P6をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜276に対応し、T39971_P6のアミノ酸1〜276にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGと少なくとも90%相同な第1のアミノ酸配列と、T39971_P6のアミノ酸277〜283に対応する配列TQGVVGDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P6のテールをコードする単離ポリペプチドであって、T39971_P6中の配列TQGVVGDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P6のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P9をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜325に対応し、T39971_P9のアミノ酸1〜325にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸357〜478に対応し、T39971_P9のアミノ酸326〜447にも対応するSGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P9の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTSを含み、以下の構造:アミノ酸番号325−x〜325のいずれかから始まり、アミノ酸番号326+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P9の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P11をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P11をコードする単離キメラポリペプチドであって、Q9BSH7のアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、Q9BSH7のアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P11の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P12をコードする単離キメラポリペプチドであって、VTNC_HUMANのアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P12のテールをコードする単離ポリペプチドであって、T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P12をコードする単離キメラポリペプチドであって、Q9BSH7のアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、T39971_P12のテールをコードする単離ポリペプチドであって、T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P2をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜761に対応し、Z21368_PEA_1_P2のアミノ酸1〜761にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P2のアミノ酸762〜790に対応する配列PHKYSAHGRTRHFESATRTTNGAQKLSRIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P2のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P2中の配列PHKYSAHGRTRHFESATRTTNGAQKLSRIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P2のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P5をコードする単離キメラポリペプチドであって、Q7Z2W2のアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、Aを含む第2の架橋アミノ酸配列と、Q7Z2W2のアミノ酸139〜871に対応し、Z21368_PEA_1_P5のアミノ酸59〜791にも対応するFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P5の縁部分をコードする単離ポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAFを含み、以下の構造(Z21368_PEA_1_P5に対応する番号付け):アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号59+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、の縁部分をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P5をコードする単離キメラポリペプチドであって、Z21368_PEA_1_P5のアミノ酸1〜751に対応する配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH12997のアミノ酸1〜40に対応し、Z21368_PEA_1_P5のアミノ酸752〜791にも対応するLRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P5の先端をコードする単離ポリペプチドであって、Z21368_PEA_1_P5の配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P5の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P5をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、SUL1_HUMANのアミノ酸138〜871に対応し、Z21368_PEA_1_P5のアミノ酸58〜791にも対応するAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAを含み、以下の構造:アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号58+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z21368_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P15をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜416に対応し、Z21368_PEA_1_P15のアミノ酸1〜416にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGと少なくとも90%相同な第1のアミノ酸配列を含む、Z21368_PEA_1_P15をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P16をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜397に対応し、Z21368_PEA_1_P16のアミノ酸1〜397にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P16のアミノ酸398〜410に対応する配列CVIVPPLSQPQIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P16をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P16のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P16中の配列CVIVPPLSQPQIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P16のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P22をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜188に対応し、Z21368_PEA_1_P22のアミノ酸1〜188にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P22のアミノ酸189〜210に対応する配列ARYDGDQPRCAPRPRGLSPTVFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P22をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P22のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P22中の配列ARYDGDQPRCAPRPRGLSPTVFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P22のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P23をコードする単離キメラポリペプチドであって、Q7Z2W2のアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P23をコードする単離キメラポリペプチドであって、SUL1_HUMANのアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドであって、Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMGRP5E_P4をコードする単離キメラポリペプチドであって、GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P4のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、GRP_HUMANのアミノ酸135〜148に対応し、HUMGRP5E_P4のアミノ酸128〜141にも対応するGSQREGRNPQLNQQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P4をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMGRP5E_P4の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKGを含み、以下の構造:アミノ酸番号127−x〜127のいずれかから始まり、アミノ酸番号128+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMGRP5E_P4の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMGRP5E_P5をコードする単離キメラポリペプチドであって、GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P5のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、HUMGRP5E_P5のアミノ酸128〜142に対応する配列DSLLQVLNVKEGTPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMGRP5E_P5のテールをコードする単離ポリペプチドであって、HUMGRP5E_P5中の配列DSLLQVLNVKEGTPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMGRP5E_P5のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、D56406_PEA_1_P2をコードする単離キメラポリペプチドであって、NEUT_HUMANのアミノ酸1〜120に対応し、D56406_PEA_1_P2のアミノ酸1〜120にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWEと少なくとも90%相同な第1のアミノ酸配列と、D56406_PEA_1_P2のアミノ酸121〜151に対応する配列ARWLTPVIPALWEAETGGSRGQEMETIPANTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P2のアミノ酸152〜201にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、D56406_PEA_1_P2の縁部分をコードする単離ポリペプチドであって、D56406_PEA_1_P2に対応するARWLTPVIPALWEAETGGSRGQEMETIPANTをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、D56406_PEA_1_P2の縁部分をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、D56406_PEA_1_P5をコードする単離キメラポリペプチドであって、NEUT_HUMANのアミノ酸1〜23に対応し、D56406_PEA_1_P5のアミノ酸1〜23にも対応するMMAGMKIQLVCMLLLAFSSWSLCと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸26〜170に対応し、D56406_PEA_1_P5のアミノ酸24〜168にも対応するSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、D56406_PEA_1_P5の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がCSを含み、以下の構造:アミノ酸番号23−x〜24のいずれかから始まり、アミノ酸番号+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P5の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、D56406_PEA_1_P6をコードする単離キメラポリペプチドであって、NEUT_HUMANのアミノ酸1〜45に対応し、D56406_PEA_1_P6のアミノ酸1〜45にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P6のアミノ酸46〜95にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P6をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、D56406_PEA_1_P6の縁部分をコードする単離キメラポリペプチドであって、長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKLを含み、以下の構造:アミノ酸番号45−x〜46のいずれかから始まり、アミノ酸番号46+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P6の縁部分をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、F05068_PEA_1_P7をコードする単離キメラポリペプチドであって、ADML_HUMANのアミノ酸1〜33に対応し、F05068_PEA_1_P7のアミノ酸1〜33にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKと少なくとも90%相同な第1のアミノ酸配列を含む、F05068_PEA_1_P7をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、F05068_PEA_1_P8をコードする単離キメラポリペプチドであって、ADML_HUMANのアミノ酸1〜82に対応し、F05068_PEA_1_P8のアミノ酸1〜82にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSSSYPTGLADVKAGPAQTLIRPQDMKGASRSPEDと少なくとも90%相同な第1のアミノ酸配列と、F05068_PEA_1_P8のアミノ酸83〜83に対応する配列Rを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、F05068_PEA_1_P8をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H14624_P15をコードする単離キメラポリペプチドであって、Q9HAP5のアミノ酸1〜167に対応し、H14624_P15のアミノ酸1〜167にも対応するMLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLCHGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFAPVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDNDLCIPLASSDHLLPATEEと少なくとも90%相同な第1のアミノ酸配列と、H14624_P15のアミノ酸168〜180に対応する配列GKPSLLLPHSLLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H14624_P15をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H14624_P15のテールをコードする単離ポリペプチドであって、H14624_P15中の配列GKPSLLLPHSLLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H14624_P15のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、H38804_PEA_1_P5をコードする単離キメラポリペプチドであって、H38804_PEA_1_P5のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜324に対応し、H38804_PEA_1_P5のアミノ酸58〜381にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P5をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H38804_PEA_1_P5の先端をコードする単離ポリペプチドであって、H38804_PEA_1_P5の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P5の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、H38804_PEA_1_P17をコードする単離キメラポリペプチドであって、H38804_PEA_1_P17のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜328に対応し、H38804_PEA_1_P17のアミノ酸58〜385にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKSPCTと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P17をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、H38804_PEA_1_P17の先端をコードする単離ポリペプチドであって、H38804_PEA_1_P17の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P17の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HSENA78_P2をコードする単離キメラポリペプチドであって、SZ05_HUMANのアミノ酸1〜81に対応し、HSENA78_P2のアミノ酸1〜81にも対応するMSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVVと少なくとも90%相同な第1のアミノ酸配列を含む、HSENA78_P2をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMODCA_P9をコードする単離キメラポリペプチドであって、HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、DCOR_HUMANのアミノ酸151〜461に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMODCA_P9の先端をコードする単離ポリペプチドであって、HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMODCA_P9をコードする単離キメラポリペプチドであって、HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAA59968のアミノ酸40〜350に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMODCA_P9の先端をコードする単離ポリペプチドであって、HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMODCA_P9をコードする単離キメラポリペプチドであって、HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH14562のアミノ酸86〜396に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、HUMODCA_P9の先端をコードする単離ポリペプチドであって、HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R00299_P3をコードする単離キメラポリペプチドであって、R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NWT9のアミノ酸74〜191に対応し、R00299_P3のアミノ酸45〜162にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R00299_P3の先端をコードする単離ポリペプチドであって、R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R00299_P3のテールをコードする単離ポリペプチドであって、R00299_P3中の配列VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、R00299_P3をコードする単離キメラポリペプチドであって、R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TESC_HUMANのアミノ酸21〜214に対応し、R00299_P3のアミノ酸45〜238にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、R00299_P3の先端をコードする単離ポリペプチドであって、R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、W60282_PEA_1_P14をコードする単離キメラポリペプチドであって、Q8IXD7のアミノ酸1〜66に対応し、W60282_PEA_1_P14のアミノ酸1〜66にも対応するMRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGATLIAPRWLLTAAHCLKPと少なくとも90%相同な第1のアミノ酸配列と、W60282_PEA_1_P14のアミノ酸67〜80に対応する配列TPASHLAMRQHHHHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、W60282_PEA_1_P14をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、W60282_PEA_1_P14のテールをコードする単離ポリペプチドであって、W60282_PEA_1_P14中の配列TPASHLAMRQHHHHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、W60282_PEA_1_P14のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z41644_PEA_1_P10をコードする単離キメラポリペプチドであって、SZ14_HUMANのアミノ酸1〜95に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドであって、Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z41644_PEA_1_P10をコードする単離キメラポリペプチドであって、Q9NS21のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドであって、Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z41644_PEA_1_P10をコードする単離キメラポリペプチドであって、AAQ89265のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチドを提供する。
本発明の好ましい実施形態によれば、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドであって、Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチドを提供する。
本発明の好ましい実施形態によれば、アミノ酸配列のエピトープに特異的に結合することができる抗体を提供する。
任意選択的に、アミノ酸配列は、架橋、縁部分、テール、先端、または挿入に対応する。
任意選択的に、抗体は、前記エピトープを有するスプライスバリアントと対応する公知のタンパク質とを区別することができる。
本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のスプライスバリアントの過剰発現を検出する肺癌検出用キットを提供する。
任意選択的に、キットは、NATベースのテクノロジーを含む。
任意選択的に、キットは、前記請求項のいずれか1項に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのプライマー対をさらに含む。
任意選択的に、前記キットが、前記請求項のいずれか1項に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのオリゴヌクレオチドをさらに含む。
任意選択的に、キットは、前記請求項のいずれか1項に記載の抗体を含む。
任意選択的に、キットは、ELISAまたはウェスタンブロットの実施のための少なくとも1つの試薬をさらに含む。
本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のスプライスバリアントの過剰発現を検出する工程を含む、肺癌の検出方法。
任意選択的に、過剰発現の検出を、NATベースのテクノロジーを使用して実施する。
任意選択的に、過剰発現の検出を、免疫アッセイを使用して実施する。
任意選択的に、免疫アッセイは、前記請求項のいずれか1項に記載の抗体を含む。
本発明の好ましい実施形態によれば、上記の核酸配列もしくはそのフラグメントのいずれかまたは上記のアミノ酸配列もしくはそのフラグメントを含む、肺癌を検出することができるバイオマーカーを提供する。
本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーまたは方法もしくはアッセイで肺癌細胞を検出する工程を含む、肺癌のスクリーニング方法を提供する。
本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程を含む、肺癌の診断方法を提供する。
本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程を含む、疾患の進行および/または治療有効性および/または肺癌の再発をモニタリングする方法を提供する。
本発明の好ましい実施形態によれば、前記請求項のいずれか1項に記載のバイオマーカーもしくは抗体または方法もしくはアッセイで肺癌細胞を検出する工程と、前記検出によって治療を選択する工程とを含む、肺癌治療の選択方法を提供する。
他で定義しない限り、本明細書中で使用した全ての技術用語および科学用語は、本発明に属する当業者によって一般に理解されている意味を有する。以下の参考文献により、当業者は、本発明で使用した多数の用語の一般的定義が得られる:Singleton et al.,Dictionary of Microbiology and Molecular Biology(2nd ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5th Ed.,R.Rieger et al.(eds.),Springer Verlag(1991);およびHale & Marham,The Harper Collins Dictionary of Biology(1991)。これらは全て、本明細書中に完全に記載されているかのように本明細書中で参考として援用される。本明細書中で使用される場合、以下の用語は、他で明記しない限り、これらに帰する意味を有する。
好ましい実施形態の説明
本発明は、高感度且つ正確な新規の肺癌マーカーである。さらに、少なくとも一定のこれらのマーカーは、単独または組み合わせて、小細胞癌、大細胞癌、扁平上皮癌、および腺癌などの種々の肺癌型を区別することができる。これらのマーカーは、正常な肺組織と対照的に、肺癌で特異的に差分発現し、好ましくは過剰発現する。患者サンプル中の単独または組み合わせたこれらのマーカーの測定により、診断医が有望な肺癌診断と相関させることができる情報が得られる。本発明のマーカーにより、単独または組み合わせて、肺癌と非癌状態とが高度に差分検出される。本発明のマーカーを、単独または組み合わせて、肺癌の予後、予想、スクリーニング、早期検診、治療の選択、治療のモニタリングに使用することができる。例えば、任意選択的および好ましくは、これらのマーカーを、肺癌の病期分類および/または疾患進行のモニタリングに使用することができる。さらに、本発明のマーカーを、単独または組み合わせて、肺以外の解剖学的位置で見出される転移源の検出に使用することができる。また、1つまたは複数のマーカーを、任意選択的に、1つまたは複数の他の癌マーカー(本明細書中に記載のもの以外)と組み合わせて使用することができる。本発明の任意選択的な実施形態によれば、このような組み合わせを使用して、小細胞癌、大細胞癌、扁平上皮癌、および腺癌などの種々の肺癌型を区別することができる。さらに、本発明のマーカーを、単独または組み合わせて、消失による他の腫瘍型の検出(例えば、肺癌の5%を占めるカルチノイド腫瘍の検出)に使用することができる。
本発明のマーカーを、単独または組み合わせて、肺癌の予後、予想、スクリーニング、早期検診、病期分類、治療の選択、治療のモニタリングに使用することができる。例えば、任意選択的および好ましくは、これらのマーカーを、肺癌の病期分類および/または疾患進行のモニタリングに使用することができる。さらに、本発明のマーカーを、単独または組み合わせて、肺以外の解剖学的位置で見出される転移源の検出に使用することができる。また、1つまたは複数のマーカーを、任意選択的に、1つまたは複数の他の癌マーカー(本明細書中に記載のもの以外)と組み合わせて使用することができる。
本発明の方法を使用して明らかとなり、且つ本明細書中に記載の生体分子配列(アミノ酸配列および/または核酸配列)を、疾患の治療または予防のための組織もしくは病理学的マーカーとしておよび/または薬物もしくは薬物標的として有効に利用することができる。
これらのマーカーは、肺癌条件下で血流に特異的に放出され、そして/または、そうでなければ、肺癌組織もしくは細胞中でさらにより高いレベルで発現するか、特異的に発現する。患者サンプル中の単独または組み合わせたこれらのマーカーの測定により、診断医が有望な肺癌診断と相関させることができる情報が得られる。
したがって、本発明はまた、肺癌および/または指示的容態の診断アッセイ、ならびに、任意選択的および好ましくは、被験体(患者)から採取したサンプル、より好ましくはいくつかの血液サンプル型における肺癌および/または指示的容態の検出のためのこのようなマーカーの使用方法に関する。
別の実施形態では、本発明は、架橋、テール、先端、および/もしくは挿入、ならびに/またはこのようなペプチドのアナログ、ホモログ、および誘導体に関する。このような架橋、テール、先端、および/または挿入を、実施例により詳細に記載する。
本明細書中で使用される、「テール」は、本発明のスプライスバリアントに固有のアミノ酸配列の末端のペプチド配列をいう。したがって、任意選択的に、このようなテールを有するスプライスバリアントは、典型的には、スプライスバリアントの少なくとも第1の部分が対応する公知のタンパク質の一部と高度に相同し(しばしば、100%同一)、変異型の少なくとも第2の部分はテールを含むという点で、キメラと見なすことができる。
本明細書中で使用される、「先端」は、本発明のスプライスバリアントに固有のアミノ酸配列の最初のペプチド配列をいう。したがって、このような先端を有するスプライスバリアントは、任意選択的に、スプライスバリアントの少なくとも第1の部分が先端を含み、少なくとも第2の部分が、典型的には、対応する公知のタンパク質の一部と高度に相同する(しばしば、100%同一)という点でキメラと見なすことができる。
本明細書中で使用される、「縁部分」は、野生型または公知のタンパク質中で連結されなかった本発明のスプライスバリアントの2つの部分の間の接続(connection)をいう。縁は、任意選択的に、変異型の上記の「公知のタンパク質」部分とテールとの間の連結によって起こる可能性があり、そして/または、例えば、野生型配列の内部部分がもはや存在しない場合に起こる可能性があり、その結果、公知のタンパク質中で過去には隣接していなかった配列の2つの部分がスプライスバリアント中で隣接する。「架橋」は、任意選択的に、上記の縁部分であり得るが、先端と変異型の「公知のタンパク質」部分との間の連結部、テールと変異型の「公知のタンパク質」部分との間の連結部、または挿入と変異型の「公知のタンパク質」との間の連結部も含まれ得る。
任意選択的および好ましくは、テール、先端、または固有の挿入と変異型の「公知のタンパク質」部分との間の架橋は、少なくとも約10アミノ酸、より好ましくは少なくとも約20アミノ酸、もっと好ましくは少なくとも約30アミノ酸、さらにより好ましくは少なくとも約40アミノ酸を含み、その中の少なくとも1つのアミノ酸がテール/先端/挿入に由来し、少なくとも1つのアミノ酸が変異型の「公知のタンパク質」部分に由来する。また、任意選択的に、架橋は、約10〜約40個の任意の数(例えば、10、11、12、13、...37、38、39、40アミノ酸長またはその間の任意の数)のアミノ酸を含み得る。
架橋を、いずれかの方向で配列の長さを超えて伸長することができないことに留意すべきであり、架橋の記載毎に、架橋の長さが配列自体を超えて伸長しないような様式で読み取られると仮定すべきである。
さらに、以下の一定の文脈においてスライディングウィンドウに関して架橋を記載する。例えば、架橋の一定の記載は以下を特徴とする:2つの縁の間の架橋(公知のタンパク質の一部は変異型中に存在しない)を、任意選択的に以下のように記載することができる:CONTIG−NAME_P1(タンパク質名を示す)の架橋部分(長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がXX(架橋の中心の2アミノ酸、縁の各末端に由来する)を含み、以下の構造(CONTIG−NAME_P1の配列による番号づけ):アミノ酸番号49−x〜49(例えば)のいずれかから始まり、アミノ酸番号50+((n−2)−x)(例えば)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む。この例では、nが10〜50アミノ酸長の間の任意のアミノ酸数である架橋を含むと読み取るべきである。さらに、架橋ポリペプチドは配列を超えて伸長することができず、したがって、49−x(例えば)は少なくとも1であり、50+((n−2)−x)(例えば)は全アミノ酸長を超えないように読み取るべきである。
別の実施形態では、本発明は、本発明のスプライスバリアントおよびそのペプチドフラグメントを特異的に認識する抗体を提供する。好ましくは、このような抗体は、本発明のスプライスバリアントを差分的に認識するが、対応する公知のタンパク質(このような公知のタンパク質を、以下の実施例中でそのスプライスバリアントに関して考察する)を認識しない。
別の実施形態では、本発明は、本発明のスプライスバリアントをコードし、本明細書中に列挙した配列のいずれか1つに記載のヌクレオチド配列またはこれに相補的な配列を有する単離核酸分子を提供する。別の実施形態では、本発明は、本明細書中に列挙した配列のいずれか1つに記載のヌクレオチド配列またはこれに相補的な配列を有する単離核酸分子を提供する。別の実施形態では、本発明は、本発明の核酸分子と特異的にハイブリッド形成することができる少なくとも約12ヌクレオチドのオリゴヌクレオチドを提供する。別の実施形態では、本発明は、本発明の単離核酸を含む、ベクター、細胞、リポソーム、および組成物を提供する。
別の実施形態では、本発明は、抗体が生体サンプル中のスプライスバリアントと特異的に相互作用するが、公知の対応するタンパク質(公知のタンパク質を、以下の実施例中でそのスプライスバリアントに関して考察する)を認識しない条件下で生体サンプルを本発明のスプライスバリアントを特異的に認識する抗体と接触させる工程と、前記相互作用を検出する工程と、相互作用の存在が生体サンプル中のスプライスバリアントの存在と相関することとを含む、生体サンプル中の本発明のスプライスバリアントの検出方法を提供する。
別の実施形態では、本発明は、単離核酸分子または少なくともほぼ最短の長さのオリゴヌクレオチドフラグメントを生体サンプルの核酸材料とハイブリッド形成させる工程と、ハイブリッド形成複合体を検出する工程と、ハイブリッド形成複合体の存在が生体サンプル中のスプライスバリアントの核酸配列の存在と相関することとを含む、生体サンプル中のスプライスバリアントの核酸配列の検出方法を提供する。
本発明によれば、本明細書中に記載のスプライスバリアントは、肺癌診断のための限定されないマーカーの例である。本発明の各スプライスバリアントマーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、進行の判断、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。
本発明の任意選択的であるが好ましい実施形態によれば、本発明の任意のマーカーを、任意選択的に、単独または組み合わせて使用することができる。このような組み合わせは、任意選択的に、本明細書中に記載の複数のマーカー(任意選択的に、マーカーの任意の小組み合わせ(subcombination)および/または少なくとも1つの他のマーカー(例えば、公知のマーカー)を特色とする組み合わせが含まれる)を含み得る。さらに、このような組み合わせを、任意選択的および好ましくは、本明細書中に記載の任意のマーカーと本明細書中に記載の任意の他のマーカー、および/または任意の他の公知のマーカー、および/または任意の他のマーカーとの間の定量的または半定量的測定の比の決定に関して上記のように使用することができる。本明細書中に記載の任意のマーカー(またはその組み合わせ)と公知のマーカーとの間のこのような比に関して、より好ましくは、公知のマーカーは、各クラスターまたは遺伝子に関して以下により詳細に記載の「公知のタンパク質」を含む。
本発明の他の好ましい実施形態によれば、スプライスバリアントタンパク質もしくはそのフラグメントまたはスプライスバリアントの核酸配列もしくはそのフラグメントを、肺癌検出用のバイオマーカーと特徴づけることができ、それにより、バイオマーカーは、任意選択的に、上記の任意のバイオマーカーを含み得る。
本発明のさらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、本明細書中に記載のスプライスバリアントタンパク質に対応する核酸配列によってコードされる任意のアミノ酸配列またはそのフラグメントを含む。このようなアミノ酸配列またはそのフラグメントに関する任意のオリゴペプチドまたはペプチドを、任意選択的に(さらにまたはあるいは)、バイオマーカー(テール、先端、挿入、縁、または架橋として表現されるこれらのタンパク質の固有のアミノ酸配列が含まれるが、これらに限定されない)として使用することもできる。本発明はまた、任意選択的に、このようなオリゴヌクレオチドまたはタンパク質を認識し、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的に、任意の適用のための上記の本発明のスプライスバリアントに対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
方法またはアッセイの非限定的な例を、以下に記載する。
本発明はまた、このような診断方法またはアッセイに基づいたキットに関する。
核酸配列およびオリゴヌクレオチド
本発明の種々の実施形態は、上記の核酸配列、その配列フラグメント、これとハイブリッド形成可能な配列、これと相同な配列、異なるコドン使用頻度を有する類似のポリペプチドをコードする配列、無作為またはターゲティングされた様式で天然に存在するか人為的に誘導された1つまたは複数のヌクレオチドの欠失、挿入、または置換などの変異によって特徴づけられる変化した配列を含む。
本発明は、本明細書中に記載の核酸配列、そのフラグメント、これとハイブリッド形成可能な配列、これと相同な配列(例えば、下記の核酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも95%、または100%同一)、異なるコドン使用頻度を有する類似のポリペプチドをコードする配列、無作為またはターゲティングされた様式で天然に存在するか人為的に誘導された1つまたは複数のヌクレオチドの欠失、挿入、または置換などの変異によって特徴づけられる変化した配列を含む。本発明はまた、本発明のポリペプチドに固有の配列領域を含む相同な核酸配列(すなわち、本発明のポリヌクレオチド配列の一部を形成する)を含む。
本発明のポリヌクレオチド配列が依然に同定されていないポリペプチドをコードする場合、本発明はまた、上記の単離ポリヌクレオチドおよびその各核酸フラグメントによってコードされる新規のポリペプチドまたはその一部を含む。
「核酸フラグメント」、「オリゴヌクレオチド」、または「ポリヌクレオチド」は、核酸のポリマーをいうために本明細書中で交換可能に使用される。本発明のポリヌクレオチド配列は、RNA配列、相補ポリヌクレオチド配列(cDNA)、ゲノムポリヌクレオチド配列、および/または複合ポリヌクレオチド配列(例えば、上記の組み合わせ)の形態で単離および提供される一本鎖または二本鎖の核酸配列をいう。
本明細書中で使用される、句「相補ポリヌクレオチド配列」は、逆転写酵素または任意の他のRNA依存性DNAポリメラーゼを使用した伝令RNAの逆転写由来の配列をいう。このような配列を、その後、DNA依存性DNAポリメラーゼを使用して、in vivoまたはin vitroで増幅させることができる。
本明細書中で使用される、句「ゲノムポリヌクレオチド配列」は、染色体に由来し(単離され)、それにより、染色体の隣接部分を示す配列をいう。
本明細書中で使用される、句「複合ポリヌクレオチド配列」は、ゲノム配列およびcDNA配列から構成される配列をいう。複合配列は、本発明のポリペプチドをコードするために必要ないくつかのエクソン配列およびこれらの間を介在するいくつかのイントロン配列を含み得る。イントロン配列は任意の供給源(他の遺伝子が含まれる)に由来することができ、典型的には、保存スプライシングシグナル配列が含まれる。このようなイントロン配列には、シス作用発現調節エレメントがさらに含まれ得る。
本発明の好ましい実施形態は、オリゴヌクレオチドプローブを含む。
本発明によって利用することができるオリゴヌクレオチドプローブの例は、本発明の任意の変異型の固有の配列領域に相補的な配列(本発明の架橋、テール、先端、および/もしくは挿入のアミノ酸配列をコードするヌクレオチド配列、ならびに/または本明細書中に記載の任意のヌクレオチド配列の等価な部分(本明細書中に記載のノード、セグメント、またはアンプリコンのヌクレオチド配列が含まれるが、これらに限定されない)が含まれるが、これらに限定されない)を含む一本鎖ポリヌクレオチドである。
あるいは、本発明のオリゴヌクレオチドプローブを、上記核酸配列のいずれかに含まれる核酸配列、特に、上記の部分(本発明の架橋、テール、先端、および/もしくは挿入のアミノ酸配列をコードするヌクレオチド配列、ならびに/または本明細書中に記載の任意のヌクレオチド配列の等価な部分(本明細書中に記載のノード、セグメント、またはアンプリコンのヌクレオチド配列が含まれるが、これらに限定されない)が含まれるが、これらに限定されない)とハイブリッド形成するようにデザインすることができる。
本発明の技術によってデザインしたオリゴヌクレオチドを、酵素合成または固相合成などの当該分野で公知の任意のオリゴヌクレオチド合成方法にしたがって生成することができる。固相合成実施のための装置および試薬は、例えば、Applied Biosystemsから市販されている。任意の他のこのような合成手段も使用することができ、実際のオリゴヌクレオチド合成は、十分に当業者の能力の範囲内であり、例えば、固相化学(例えば、シアノエチルホスホラミダイトおよびその後の脱保護、脱塩、および例えば自動化トリチル−on(trityl−on)法またはHPLCによる精製)を使用した“Molecular Cloning:A laboratory Manual" Sambrook et al.,(1989);"Current Protocols in Molecular Biology" Volumes I−III Ausubel,R.M.,ed.(1994);Ausubel et al.,"Current Protocols in Molecular Biology",John Wiley and Sons,Baltimore,Maryland(1989);Perbal,"A Practical Guide to Molecular Cloning",John Wiley & Sons,New York(1988)and "Oligonucleotide Synthesis" Gait,M.J.,ed.(1984)に詳述の確立された方法によって実施することができる。
本発明のこの態様にしたがって使用されるオリゴヌクレオチドは、約10〜約200塩基、好ましくは約15〜約150塩基、より好ましくは約20〜約100塩基、最も好ましくは約20〜約50塩基の範囲から選択される長さを有するものである。好ましくは、本発明のオリゴヌクレオチドは、少なくとも17塩基、少なくとも18塩基、少なくとも19塩基、少なくとも20塩基、少なくとも22塩基、少なくとも25塩基、少なくとも30塩基、または少なくとも40塩基が本発明のバイオマーカーと特異的にハイブリッド形成可能であることを特徴とする。
本発明のオリゴヌクレオチドは、3’→5’リン酸ジエステル結合で結合したプリンおよびピリミジン塩基からなる複素環式ヌクレオシドを含み得る。
好ましくは、使用されるオリゴヌクレオチドは、以下に広範に記載されるように、1つまたは複数の骨格、ヌクレオシド間結合、または塩基で修飾されたものである。
本発明のこの態様に有用な好ましいオリゴヌクレオチドの特定の例には、修飾骨格または非天然ヌクレオシド間結合を含むオリゴヌクレオチドが含まれる。修飾骨格を有するオリゴヌクレオチドには、米国特許第4,469,863号;同第4,476,301号;同第5,023,243号;同第5,177,196号;同第5,188,897号;同第5,264,423号;同第5,276,019号;同第5,278,302号;同第5,286,717号;同第5,321,131号;同第5,399,676号;同第5,405,939号;同第5,453,496号;同第5,455,233号;同第5,466,677号;同第5,476,925号;同第5,519,126号;同第5,536,821号;同第5,541,306号;同第5,550,111号;同第5,563,253号;同第5,571,799号;同第5,587,361号;および同第5,625,050号に開示のように、骨格中にリン原子を保持するものが含まれる。
好ましい修飾オリゴヌクレオチド骨格には、例えば、ホスホロチオエート、キラルホスホロチオエート、ホスホロジチオエート、ホスホトリエステル、アルミアルキルホスホトリエステル、メチルおよび他のアルキルホスホネート(3’−アルキレンホスホネートおよびキラルホスホネートが含まれる)、ホスフィネート、ホスホラミデート(3’−アミノホスホラミデートおよびアミノアルキルホスホラミデートが含まれる)、チオノホスホラミデート、チオノアルキルホスホネート、チオノアルキルホスホトリエステル、ならびに通常の3’−5’結合を有するボラノホスフェート、これらの2’−5’結合アナログ、およびヌクレオシド単位の隣接対が3’−5’と5’−3’または2’−5’と5’−2’とで結合している極性が逆のものが含まれる。種々の塩、混合塩、および遊離酸形態も使用することができる。
あるいは、リン原子を含まない修飾オリゴヌクレオチド骨格は、短鎖アルキルもしくはシクロアルキルヌクレオシド間結合、混合ヘテロ原子およびアルキルもしくはシクロアルキルヌクレオシド間結合、または1つまたは複数の短鎖ヘテロ原子もしくは複素環式ヌクレオシド間結合によって形成された骨格を有する。これらには、モルホリノ結合(その一部がヌクレオシドの糖部分から形成されている);シロキサン骨格、スルフィド、スルホキシド、およびスルホン骨格;ホルムアセチルおよびチオホルムアセチル骨格;メチレンホルムアセチルおよびチオホルムアセチル骨格;アルケン含有骨格;スルファメート骨格;メチレンイミノおよびメチレンヒドラジノ骨格;スルホネートおよびスルホンアミド骨格;アミド骨格を有する骨格、ならびに混合されたN、O、S、およびCH成分を有する骨格が含まれ、これらは、米国特許第5,034,506号;同第5,166,315号;同第5,185,444号;同第5,214,134号;同第5,216,141号;同第5,235,033号;同第5,264,562号;同第5,264,564号;同第5,405,938号;同第5,434,257号;同第5,466,677号;同第5,470,967号;同第5,489,677号;同第5,541,307号;同第5,561,225号;同第5,596,086号;同第5,602,240号;同第5,610,289号;同第5,602,240号;同第5,608,046号;同第5,610,289号;同第5,618,704号;同第5,623,070号;同第5,663,312号;同第5,633,360号;同第5,677,437号;および同第5,677,439号に開示されている。
本発明で使用することができる他のオリゴヌクレオチドは、糖とヌクレオシド間結合の両方が修飾されたもの(すなわち、ヌクレオチド単位の骨格が新規の基で置換されている)である。塩基単位は、適切なポリヌクレオチド標的との相補性のために維持されている。このようなオリゴヌクレオチド模倣物の例には、ペプチド核酸(PNA)が含まれる。PNA化合物の調製を教示した米国特許には、米国特許第5,539,082号;同第5,714,331号および同第5,719,262号(それぞれ本明細書中で参考として援用される)が含まれるが、これらに限定されない。本発明で使用することができる他の骨格修飾は、米国特許第6,303,374号に開示されている。
本発明のオリゴヌクレオチドはまた、塩基の修飾または置換を含み得る。本明細書中で使用される、「非修飾」または「天然の」塩基には、プリン塩基であるアデニン(A)およびグアニン(G)ならびにピリミジン塩基であるチミン(T)、シトシン(C)、およびウラシル(U)が含まれる。修飾塩基には、5−メチルシトシン(5−me−C)、5−ヒドロキシメチルシトシン、キサンチン、ヒポキサンチン、2−アミノアデニン、アデニンおよびグアニンの6−メチルおよび他のアルキル誘導体、アデニンおよびグアニンの2−プロピルおよび他のアルキル誘導体、2−チオウラシル、2−チオチミン、および2−チオシトシン、5−ハロウラシルおよびシトシン、5−プロピニルウラシルおよびシトシン、6−アゾウラシル、シトシン、およびチミン、5−ウラシル(シュードウラシル)、4−チオウラシル、8−ハロ、8−アミノ、8−チオール、8−チオアルキル、8−ヒドロキシ、および他の8置換アデニンおよびグアニン、5−ハロ(特に5−ブロモ)、5−トリフルオロメチル、および他の5置換ウラシルおよびシトシン、7−メチルグアニンおよび7−メチルアデニン、8−アザグアニンおよび8−アザアデニン、7−デアザグアニンおよび7−デアザアデニン、ならびに3−デアザグアニンおよび3−デアザアデニンなどの他の合成塩基および天然の塩基が含まれるが、これらに限定されない。本発明のオリゴマー化合物の結合親和性の増加に特に有用なさらなる塩基には、5置換ピリミジン、6−アザピリミジン、およびN−2、N−6、およびO−6置換プリン(2−アミノプロピルアデニン、5−プロピニルウラシル、および5−プロピニルシトシンが含まれる)が含まれる。5−メチルシトシン置換により、核酸二重鎖の安定性が0.6〜1.2℃増加することが示されており、この置換は、さらにより詳細には、2’−O−メトキシエチル糖修飾と組み合わせた場合、現在好ましい塩基置換である。
本発明のオリゴヌクレオチドの別の修飾は、オリゴヌクレオチドの活性、細胞分布、または細胞取り込みを増大させるオリゴヌクレオチドへの1つまたは複数の部分または抱合体(conjugate)の化学結合を含む。このような部分には、米国特許第6,303,374号に開示のように、コレステロール部分などの脂質部分、コール酸、チオエーテル(例えば、ヘキシル−S−トリチルチオール)、チオコレステロール、脂肪族鎖(例えば、ドデカンジオールまたはウンデシル残基)、リン脂質(例えば、ジヘキサデシル−rac−グリセロールまたはトリエチルアンモニウム1,2−ジ−O−ヘキサデシル−rac−グリセロ−3−H−ホスホネート)、ポリアミンもしくはポリエチレングリコール鎖、またはアダマンタン酢酸、パルミチル部分、またはオクタデシルアミンもしくはヘキシルアミノ−カルボニル−オキシコレステロール部分が含まれるが、これらに限定されない。
所与のオリゴヌクレオチド分子の全ての位置が均一に修飾される必要はなく、実際、1つを超える上記修飾を1つの化合物またはオリゴヌクレオチド内の1つのヌクレオチドにさえも組み込むことができる。
本発明のオリゴヌクレオチドが診断薬としてのより有効な使用および/または生物学的利用能、治療有効性の増加および細胞傷害性の減少のためにさらに修飾することができると認識される。
本発明のポリヌクレオチドの細胞発現を可能にするために、上記核酸配列の1つの少なくともコード領域を含み、少なくとも1つのシス作用調節エレメントをさらに含む本発明の核酸構築物を使用することができる。本明細書中で使用される、句「シス作用調節エレメント」は、トランス作用調節因子に結合してその下流に存在するコード配列の転写を調節するポリヌクレオチド配列、好ましくはプロモーターをいう。
任意の適切なプロモーター配列を、本発明の核酸構築物によって使用することができる。
好ましくは、本発明の核酸構築物によって使用されるプロモーターは、形質転換された特異的細胞集団中で活性である。細胞型特異的および/または組織特異的プロモーターの例には、肝臓特異的であるアルブミンプロモーター、リンパ特異的プロモーター(Calame et al.,(1988)Adv.Immunol.43:235−275)、特に、T細胞受容体(Winoto et al.,(1989)EMBO J.8:729−733))および免疫グロブリン(Banerji et al.(1983)Cell 33729−740)のプロモーター、神経フィラメントプロモーターなどのニューロン特異的プロモーター(Byrne et al.(1989)Proc.Natl.Acad.Sci.USA 86:5473−5477)、膵臓特異的プロモーター(Edlunch et al.(1985)Science 230:912−916)または乳腺特異的プロモーター(乳清プロモーター(U.S.Pat.No.4,873,316 and European Application Publication No.264,166)など)などのプロモーターが含まれる。本発明の核酸構築物は、プロモーター配列に隣接するか遠位に存在し、構築物由来の転写の上方制御で機能し得るエンハンサーをさらに含み得る。
本発明の核酸構築物は、好ましくは、適切な選択マーカーおよび/または複製起点をさらに含む。好ましくは、使用される核酸構築物は、大腸菌においてその両方(構築物が適切な選択マーカーおよび複製起点を含む)が増殖し、最適な細胞における増殖または遺伝子および組織における組み込みに適合し得るシャトルベクターである。本発明の構築物は、例えば、プラスミド、バクミド、ファージミド、コスミド、ファージ、ウイルス、または人工染色体であり得る。
適切な構築物の例には、pcDNA3、pcDNA3.1(+/−)、pGL3,PzeoSV2(+/−)、pDisplay、pEF/myc/cyto、pCMV/myc/cyto(それぞれInvitrogen Co.(www.invitrogen.com)から市販されている)が含まれるが、これらに限定されない。レトロウイルスベクターおよびパッケージング系の例は、Clontech,San Diego,Calif.から市販されており、Retro−XベクターであるpLNCXおよびpLXSNが含まれ、これらは、複数のクローニング部位にクローニング可能であり、導入遺伝子がCMVプロモーターから転写される。導入遺伝子が5’LTRプロモーターから転写されるpBabeなどのMo−MuLV由来のベクターも含まれる。
現在好ましいin vivo核酸導入技術には、アデノウイルス、レンチウイルス、単純ヘルペスI型ウイルス、またはアデノ随伴ウイルス(AAV)、および脂質ベースの系などのウイルス構築物または非ウイルス構築物でのトランスフェクションが含まれる。遺伝子の脂質媒介性導入に有用な脂質は、例えば、DOTMA、DOPE、およびDC−Chol(Tonkinson et al.,Cancer Investigation,14(1):54−65(1996))である。遺伝子治療で用いる最も好ましい構築物は、ウイルス、最も好ましくはアデノウイルス、AAV、レンチウイルス、またはレトロウイルスである。レトロウイルス構築物などのウイルス構築物は、少なくとも1つの転写プロモーター/エンハンサー若しくは遺伝子座限定(defining)エレメント、または選択的スプライシング、核RNA輸送、もしくはメッセンジャーの翻訳後修飾などの他の手段によって遺伝子発現を調節する他のエレメントを含む。このようなベクター構築物はまた、ウイルス構築物中に既に存在しない限り、使用されるウイルスに適切なパッケージングシグナル、長末端反復(LTR)もしくはその一部、ならびにプラス鎖およびマイナス鎖のプライマー結合部位を含む。さらに、このような構築物は、典型的には、配置される宿主細胞からのペプチドの分泌のためのシグナルペプチドを含む。好ましくは、この目的のためのシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異型のシグナル配列である。任意選択的に、構築物はまた、ポリアデニル化を指示するシグナルならびに1つまたは複数の制限部位および転写終結配列を含み得る。例として、このような構築物は、典型的には、5’LTR、tRNA結合部位、パッケージングシグナル、二本鎖DNA合成起点、および3’LTR、またはその一部を含む。カチオン性脂質、ポリリジン、およびデンドリマーなどの非ウイルス性の他のベクターを使用することができる。
ハイブリッド形成アッセイ
生体サンプル中の目的の核酸の検出を、任意選択的に、オリゴヌクレオチドプローブを使用したハイブリッド形成ベースのアッセイによって行うことができる(本発明のプローブの非限定的な例は前述した)。
伝統的なハイブリッド形成アッセイには、PCR、RT−PCR、実時間PCR、RNアーゼ保護、in situハイブリッド形成、プライマー伸長、サザンブロット(DNA検出)、ドットブロットまたはスロットブロット(DNA、RNA)、およびノーザンブロット(RNA検出)(NAT型アッセイを、以下により詳細に記載する)が含まれる。最近、PNAが記載されている(Nielsen et al.1999,Current Opin.Biotechnol.10:71−75)。他の検出方法には、ディップスティック機構上にプローブを含むキットなどが含まれる。
生体サンプル中の目的の変異型(すなわち、DNAまたはRNA)を検出可能なハイブリッド形成ベースのアッセイは、10、15、20、または30〜100ヌクレオチド長、好ましくは10〜50ヌクレオチド長、より好ましくは40〜50ヌクレオチド長であり得るオリゴヌクレオチドの使用に依存する。
したがって、本発明の単離ポリヌクレオチド(オリゴヌクレオチド)は、好ましくは、中程度からストリンジェントなハイブリッド形成条件下で本明細書中に記載の核酸配列のいずれかとハイブリッド形成可能である。
中程度からストリンジェントなハイブリッド形成条件は、10%硫酸デキストラン、1M NaCl、1%SDS、および5×106cpmの32P標識プローブ(65℃)などを含むハイブリッド形成溶液、0.2×SSCおよび0.1%SDSの最終洗浄溶液、ならびに65℃での最終洗浄によって特徴づけられるのに対し、中程度のハイブリッド形成を、10%硫酸デキストラン、1M NaCl、1%SDS、および5×10cpmの32P標識プローブ(65℃)を含むハイブリッド形成溶液、1×SSCおよび0.1%SDSの最終洗浄溶液、ならびに50℃での最終洗浄を使用して行う。
より一般に、短い核酸(200bp長未満(例えば、17〜40bp長))のハイブリッド形成を、所望のストリンジェンシーにしたがって修正することができる以下の例示的ハイブリッド形成プロトコールを使用して行うことができる:(i)6×SSCおよび1%SDSまたは3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性サケ精子DNA、および0.1%無脂肪粉乳のハイブリッド形成溶液、Tmよりも1〜1.5℃低いハイブリッド形成温度、Tmよりも1〜1.5℃低い3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDSの最終洗浄溶液、(ii)6×SSCおよび0.1%SDSまたは3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性サケ精子DNA、および0.1%無脂肪粉乳のハイブリッド形成溶液、Tmよりも2〜2.5℃低いハイブリッド形成温度、Tmよりも1〜1.5℃低いハイブリッド形成温度での3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDSの最終洗浄溶液、6×SSCの最終洗浄溶液、ならびに22℃での最終洗浄、(iii)6×SSCおよび1%SDSまたは3M TMACI、0.01Mリン酸ナトリウム(pH6.8)、1mM EDTA(pH7.6)、0.5%SDS、100μg/ml変性サケ精子DNA、および0.1%無脂肪粉乳のハイブリッド溶液、ハイブリッド形成温度。
ハイブリッド二重鎖を、多数の方法によって検出することができる。典型的には、ハイブリッド二重鎖を非ハイブリッド形成核酸から分離し、二重鎖に結合した標識を検出する。このような標識は、当該分野で標準的に使用されている放射性、蛍光、生物、または酵素のタグまたは標識をいう。標識を、生体サンプル由来のオリゴヌクレオチドプローブまたは核酸のいずれかに抱合することができる。
多数の周知の方法によってプローブを標識することができる。放射性標識の非限定的な例には、3H、14C、32P、および35Sが含まれる。検出可能なマーカーの非限定的な例には、リガンド、フルオロフォア、化学発光物質、酵素、および抗体が含まれる。本発明の方法の感度を上げることができるプローブと共に使用する他の検出可能なマーカーには、ビオチンおよび放射性ヌクレオチドが含まれる。特定の標識の選択によりプローブに結合する様式が決定されることが当業者に明らかとなる。
例えば、ビオチン化dNTPもしくはrNTPの組み込みまたはいくつかの類似の手段(例えば、RNAへのビオチンのソラレン誘導体の光架橋)およびその後の標識ストレプトアビジン(例えば、フィコエリトリン抱合ストレプトアビジン)または等価物の付加によって本発明のオリゴヌクレオチドを合成後に標識することができる。あるいは、蛍光標識オリゴヌクレオチドプローブを使用する場合、フルオレセイン、リサミン、フィコエリトリン、ローダミン(Perkin Elmer Cetus)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、およびFluorX(Amersham)など(例えば、Kricka et al.(1992),Academic Press San Diego,Calif)を、オリゴヌクレオチドに結合させることができる。
当業者は、洗浄工程を使用して、過剰な標的DNAまたはプローブおよび非結合抱合体を洗い流すことを認識している。さらに、標準的な不均一アッセイ形式は、オリゴヌクレオチドプライマーおよびプローブ上に存在する標識を使用したハイブリッドの検出に適切である。
種々のコントロールを有用に使用してハイブリッド形成アッセイの精度を改良することができることが認識される。例えば、サンプルを無関係のプローブとハイブリッド形成し、ハイブリッド形成前にRNアーゼAで処理して偽ハイブリッド形成を評価することができる。
本発明は特定の核酸配列の検出のための標識の使用に特に依存しないが、このような標識は、検出感度を高めるので有利であり得る。さらに、標識により自動化が可能である。プローブを、多数の周知の方法によって標識することができる。
一般に知られるように、放射性ヌクレオチドを、いくつかの方法によって本発明のプローブに組み込むことができる。放射性標識の非限定的な例には、H、14C、32P、および35Sが含まれる。
当業者は、洗浄工程を使用して過剰な標的DNAまたはプローブおよび非結合抱合体を洗い流すことができることを認識する。さらに、標準的な不均一アッセイ形式は、オリゴヌクレオチドプライマーおよびプローブ上に存在する標識を使用したハイブリッドの検出に適切である。
種々のコントロールを有用に使用してハイブリッド形成アッセイの精度を改良することができることが認識される。
本発明のプローブを、天然に存在する糖−リン酸骨格ならびに修飾骨格(ホスホロチオエート、ジチオネート、アルキルホスホネート、およびa−ヌクレオチドなどが含まれる)と共に使用することができる。本発明のプローブを、リボ核酸(RNA)またはデオキシリボ核酸(DNA)(好ましくはDNA)から構築することができる。
NATアッセイ
生体サンプル中の目的の核酸を、任意選択的に、例えば、PCR(例えば、実時間PCR等のそのバリエーション)などの核酸増幅テクノロジーを含むNATベースのアッセイによって検出することもできる。
本明細書中で使用される、「プライマー」は、標的配列とアニーリング(ハイブリッド形成)し、それにより適切な条件下でのDNA合成の出発点としての機能を果たすことができる二本鎖領域を作製することができるオリゴヌクレオチドと定義する。
選択された配列、標的配列、または核酸配列を、多数の適切な方法によって増幅することができる。一般に、Kwoh et al.,1990,Am.Biotechnol.Lab.8:14を参照のこと。多数の増幅技術が記載されており、当業者の特定のニーズに合わせるように容易に適合させることができる。増幅技術の非限定的な例には、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、鎖置換増幅(SDA)、転写ベースの増幅、q3レプリカーゼ系、およびNASBAが含まれる(Kwoh et al.,1989,Proc.NatI.Acad.Sci.USA 86,1173−1177;Lizardi et al.,1988,BioTechnology 6:1197−1202;Malek et al.,1994,Methods Mol.Biol.,28:253−260;およびSambrook et al.,1989,supra)。
用語「増幅対」(または「プライマー対」)は、本明細書中で、多数の増幅プロセス型の1つ(好ましくはポリメラーゼ連鎖反応)による選択された核酸配列の増幅で共に使用されるように選択される本発明のオリゴヌクレオチド(オリゴ)対をいう。他の増幅プロセス型には、以下でより詳細に説明されるように、リガーゼ連鎖反応、鎖置換増幅、または核酸配列ベースの増幅が含まれる。当該分野で一般に知られるように、選択された条件下で相補配列に結合するようにオリゴをデザインする。
1つの特定の実施形態では、患者由来の核酸サンプルの増幅を、最も豊富な差分発現する核酸の増幅を好む条件下で増幅する。1つの好ましい実施形態では、最も豊富なmRNAの増幅を好む条件下で患者由来のmRNAサンプルに対してRT−PCRを行う。別の好ましい実施形態では、差分発現する核酸の増幅を同時に行う。このような方法を、差分発現する核酸配列の代わりに差分発現するタンパク質の検出に適合することができることが当業者に理解される。
本発明を実施するための核酸(すなわち、DNAまたはRNA)を、周知の方法によって得ることができる。
本発明のオリゴヌクレオチドプライマーは、使用される特定のアッセイ形式、特定のニーズ、およびターゲティングされるゲノムに依存して任意の適切な長さであり得る。任意選択的に、オリゴヌクレオチドプライマーは、少なくとも12ヌクレオチド長、好ましくは15分子と24分子との間であり、これらを、選択した核酸増幅システムに特に適切になるように適合することができる。当該分野で一般に知られるように、オリゴヌクレオチドプライマーを、そのターゲティングされる配列へのそのハイブリッド形成の融点を考慮することによってデザインすることができる(Sambrook et al.,1989,Molecular Cloning −A Laboratory Manual,2nd Edition,CSH Laboratories;Ausubel et al.,1989,in Current Protocols in Molecular Biology,John Wiley & Sons Inc.,N.Y.)。
アンチセンスオリゴヌクレオチドを使用して、目的のスプライスイソ型の発現を定量することができることが認識される。このような検出を、プレmRNAレベルで行う。本質的に、目的のスプライス部位からの転写を定量する能力は、スプライス部位の近づき易さに影響をうけ得る。オリゴヌクレオチドは、スプライシング因子とスプライス部位配列を競合し得る。したがって、アンチセンスオリゴヌクレオチド活性の低さは、スプライシング活性を示す。
ポリメラーゼ連鎖反応および他の核酸増幅反応は、当該分野で周知である(これらの反応の種々の非限定的な例を、以下により詳細に記載する)。本発明の態様のオリゴヌクレオチド対を、好ましくは、適合する融点(Tm)(例えば、7℃未満、好ましくは5℃未満、より好ましくは4℃未満、最も好ましくは3℃未満、理想的には3℃と0℃の間で異なる融点)を有するように選択する。
ポリメラーゼ連鎖反応(PCR):Mullis and Mullis et al.に付与された米国特許第4,683,195号および同第4,683,202号に記載のように、ポリメラーゼ連鎖反応(PCR)は、クローニングおよび精製を行うことなくゲノムDNAの混合物中の標的配列のセグメントの濃度を増加させる方法である。このテクノロジーにより、低標的配列濃度の問題に対する1つのアプローチが得られる。PCRを使用して、標的濃度を容易に検出可能なレベルに直接増加させることができる。この標的配列の増幅プロセスは、二本鎖標的配列の各鎖と所望の標的配列を含むDNA混合物とが相補的である1モル過剰の2つのオリゴヌクレオチドプライマーの移入を含む。混合物を変性させ、その後ハイブリッド形成させる。ハイブリッド形成後、プライマーをポリメラーゼで伸長して、相補鎖を形成する。変性工程、ハイブリッド形成(アニーリング)工程、およびポリメラーゼ伸長(延長)工程を必要に応じて繰り返し、比較的高濃度の所望の標的配列のセグメントを得ることができる。
所望の標的配列のセグメントの長さは、相互に関連するプライマーの相対的位置によって決定されるので、この長さは調節可能なパラメーターである。所望の標的配列のセグメントが混合物中で支配的な配列(濃度に関して)になるので、これらを、「PCR増幅された」と考えられる。
リガーゼ連鎖反応(LCRまたはLAR):リガーゼ連鎖反応(LCR;時折、「リガーゼ増幅反応」(LAR)という)は、十分に認識されている別の核酸増幅方法に発展している。LCRでは、4つのオリゴヌクレオチド、標的DNAの1つの鎖と固有にハイブリッド形成する2つの隣接オリゴヌクレオチド、および反対の鎖とハイブリッド形成する隣接オリゴヌクレオチドの相補組を混合し、混合物にDNAリガーゼを添加する。連結点で完全に相補的である場合、リガーゼはハイブリッド形成した各分子対と共有結合する。重要には、LCRでは、ギャップやミスマッチが無く標的サンプル中の配列と塩基対を形成する場合のみ、2つのプローブが互いにライゲーションする。変性サイクルの繰り返しおよびライゲーションにより、DNAの短いセグメントが増幅する。LCRはまたは、1塩基の変化の検出を強化するためにPCRと組み合わせて使用されている(例えば、Segev,PCT公開番号W09001069 A1(1990)を参照のこと)。しかし、このアッセイで使用される4つのオリゴヌクレオチドが対合して2つの短いライゲーション可能なフラグメントを形成することができるので、標的と独立したバックグラウンドシグナルが生成される可能性がある。変異体スクリーニングのためのLCRの使用は、特定の核酸の位置の試験に制限される。
自己保持合成反応(Self−Sustained−Synthetic−Reaction)(3SR/NASBA):自己保持配列複製反応(3SR)は、一定温度でRNA配列を指数関数的に増幅させることができる転写ベースのin vitro増幅システムである。次いで、増幅したRNAを、変異検出のために使用することができる。この方法では、オリゴヌクレオチドプライマーを使用して、目的の配列の5’末端にファージRNAポリメラーゼプロモーターを付加する。第2のプライマー、逆転写酵素、RNアーゼH、RNAポリメラーゼ、およびリボ−およびデオキシリボヌクレオチド三リン酸を含む酵素と基質のカクテルでは、標的配列は転写、cDNA合成、および第2の鎖合成のラウンドが反復されて目的の領域が増幅される。変異を検出するための3SRの使用は、速度的にDNAの小セグメント(例えば、200〜300塩基対)のスクリーニングに制限される。
Q−ベータ(Qβ)レプリカーゼ:この方法では、目的の配列を認識するプローブを、Qβレプリカーゼのための複製可能なRNAテンプレートに結合させる。配列特異的ライゲーション工程の使用によって、非ハイブリッド形成プローブの複製に起因する偽陽性についての事前に同定された主な問題に取り組んだ。しかし、利用可能な熱安定性DNAリガーゼはこのRNA基質に有効でないので、ライゲーションを、T4DNAリガーゼによって低温(37℃)で行わなければならない。これにより、LCRにおけるような特異性の達成手段としての高温の使用が回避され、ライゲーション事象を使用して、連結部位での変異を検出することができるが、他の場所は検出できない。
首尾の良い診断方法は、非常に特異的でなければならない。容易な核酸ハイブリッド形成の特異性の調節方法は、反応温度の調節による。3SR/NASBAおよびQβは全て大量のシグナルを生成することができる一方で、それぞれに関与する1つまたは複数の酵素を高温で(すなわち、55℃超)使用することができない。したがって、プローブの非特異的ハイブリッド形成を回避するために反応温度を上げることができない。低温でより容易にプローブを融解するためにプローブを短くする場合、複雑なゲノム中で1つを超える完全な適合が得られる可能性が増加する。これらの理由のために、PCRおよびLCRは、現在、検出テクノロジーの研究分野の中心となっている。
PCRおよびLCRにおける増幅手順の基本は、1サイクルの産物がその後の全サイクルで使用可能なテンプレートとなり、それにより、各サイクル毎に集団が倍増するという事実である。任意のこのような倍増システムの最終収率を、以下のように表現することができる:(1+X)=y(式中、「X」は平均効率(各サイクルでのコピー率)であり、「n」はサイクル数であり、「y」は全効率または反応収率である)。各標的DNAコピーを各ポリメラーゼ連鎖反応サイクルにおけるテンプレートとして使用する場合、平均効率は100%である。PCRを20サイクル行う場合、収率は220(すなわち、出発物質の1,048,576倍のコピー)である。反応条件によって平均効率が85%に減少する場合、20サイクルの収率は1.8520(すなわち、出発物質の220,513倍のコピー)にしかならない。言い換えれば、85%の効率でのPCRの実施では、100%の効率での反応実施と比較して最終生成物は21%しか得られない。平均効率が50%に減少した反応では、可能な生成物は1%未満である。
実際には、日常的なポリメラーゼ連鎖反応で理論上の最大収率を達成するのは稀であり、PCRは、通常、より低い収率を補うために20サイクルを超えて実施する。平均効率50%では、理論上での20サイクルで100万倍の増幅を達成するために、34サイクルを要し、より低い効率では、必要なサイクル数は非常に多くなる。さらに、意図する標的よりも高い平均効率で増幅する任意のバックグラウンド産物が主要な産物になる。
また、多数の可変因子(variable)(標的DNAの長さおよび二次構造、プライマーの長さおよびデザイン、プライマーおよびdNTPの濃度、ならびに緩衝液の組成などが含まれる)がPCRの平均効率に影響を与え得る。外因性DNA(例えば、実験室の表面に溢れたDNA)との反応の汚染または相互汚染も主な検討材料である。それぞれの異なるプライマー対および標的配列のための反応条件を慎重に至適化しなければならず、経験豊富な研究者でさえもこのプロセスに数日を要し得る。このプロセスの困難さ(多数の技術的配慮および他の要因が含まれる)が、臨床目的でのPCRの使用における重大な欠点である。実際、PCRは、依然として有意な様式で臨床市場に進出していない。LCRも各標的配列について異なるオリゴヌクレオチド配列を使用するために至適化しなければならないので、LCRでも同様の懸念が生じる。さらに、両方法には、正確な温度サイクリングを可能にするために高価な装置が必要である。
対立遺伝子の変化の研究などにおける核酸検出テクノロジーの多くの適用は、複雑なバックグラウンド中の特定の配列の検出だけでなく、少数または1つのヌクレオチドが異なる配列の区別も含む。PCRによる対立遺伝子特異的変異型の1つの検出方法は、テンプレート鎖とプライマーの3’末端との間にミスマッチが存在する場合にTaqポリメラーゼがDNA鎖を合成することが困難であるという事実に基づく。対立遺伝子特異的変異型を、たった1つの可能性のある対立遺伝子と完全に適合するプライマーの使用によって検出することができ、他の対立遺伝子とのミスマッチはプライマーの伸長を回避するように作用し、それにより、この配列の増幅が回避される。この方法は、ミスマッチの塩基組成がミスマッチを超える伸長を回避する能力に影響を与え、一定のミスマッチが伸長を回避しないか最小の影響しか与えないという点で、実質的に制限される。
LCRでのライゲーションを回避する効果がより高い類似の3’ミスマッチストラテジーを使用する。任意のミスマッチは、熱安定性リガーゼの作用を有効に遮断するが、LCRは依然として標的独立性バックグラウンドライゲーション産物が増幅を開始するという欠点を有する。さらに、各位置でヌクレオチドを同定するためのPCRとその後のLCRとの組み合わせも、臨床検査室での取扱いが困難であることが明らかである。
本発明の種々の好ましい実施形態の直接検出方法は、例えば、サイクリングプローブ反応(CPR)または分岐(branched)DNA分析であり得る。
利用可能な核酸の検出量が十分である場合、より多数の標的のコピーを作製する代わりに(例えば、PCRおよびLCRなどの場合)、この配列が直接検出されるという利点がある。より顕著には、シグナルを指数関数的に増幅しない方法は、定量分析により適切である。1つのオリゴヌクレオチドへの複数の色素の結合によってシグナルが増強された場合でさえも、最終シグナル強度と標的量とは直接相関する。このようなシステムは、反応産物自体がさらなる反応を促進せず、それにより、産物による実験室表面の汚染が懸念されるほど多くはないというさらなる利点を有する。最近考案された技術は、放射能使用を排除しようと努め、そして/または自動化できる形式での感度が改良されている。2つの例は、「サイクリングプローブ反応」(CPR)および「分岐DNA」(bDNA)である。
サイクリングプローブ反応(CPR):サイクリングプローブ反応(CPR)は、中央部分がRNAから作製されており、2つの末端がDNAで作製されている長いキメラオリゴヌクレオチドを使用する。標的DNAへのプローブのハイブリッド形成および熱安定性RNアーゼHへの曝露により、RNA部分が消化される。これによって二重鎖の残存DNA部分が不安定になり、標的DNAからプローブの残りが放出し、別のプローブ分子がプロセスを繰り返す。切断プローブ分子形態のシグナルは、直線的速度で蓄積する。反復プロセスはシグナルを増加させる一方で、オリゴヌクレオチドのRNA部分は、サンプル調製を通して保持され得るRNアーゼに対して脆弱である。
分岐DNA:分岐DNA(bDNA)は、各オリゴヌクレオチドが35〜40のラベル(例えば、アルカリホスファターゼ酵素)を保有できる分岐構造のオリゴヌクレオチドを含む。これによりハイブリッド形成由来のシグナルが増強される一方で、非特異的結合のシグナルも同様に増加する。
本発明の種々の好ましい実施形態の少なくとも1つの配列の変化を、例えば、制限フラグメント長多型(RFLP分析)、対立遺伝子特異的オリゴヌクレオチド(ASO)分析、変性/温度勾配ゲル電気泳動(DGGE/TGGE)、一本鎖高次構造多型(SSCP)分析、またはジデオキシフィンガープリンティング(ddF)によって検出することができる。
特定の核酸配列および配列の変化を検出可能な試験の需要は、臨床診断で急速に増大しつつある。ヒトおよび病原性生物由来の遺伝子についての核酸配列データが蓄積されているので、今までのところ、特定の配列内の変異のための迅速且つ費用効果が高く、使いやすい試験への需要が急速に増大している。
核酸セグメントを変異についてスキャンする方法は一握りしか考案されていない。各試験サンプル(例えば、細菌単離物)の全遺伝子配列を決定することが1つの選択肢である。約600ヌクレオチド未満の配列では、増幅材料(例えば、PCR反応産物)を使用してこれを行うことができる。これにより、目的のセグメントのクローニングに伴う時間および費用が回避される。しかし、専用の装置および高度に訓練された者が必要であり、この方法は非常に骨が折れ、且つ費用が高いので、臨床目的で実践的且つ有効ではない。
配列決定に関連する困難さを考慮して、核酸の所与のセグメントを、いくつかの他のレベルで特徴づけることができる。最も低い分解能では、電気泳動によって、サンプルゲル上での公知の標準の泳動との比較によって分子サイズを決定することができる。電気泳動前の制限酵素の組み合わせでの切断によって、より詳細な分子の実態(picture)を得て、順序付けられたマップを構築することができる。フラグメント内の特定の配列の存在を、標識プローブのハイブリッド形成によって検出することができるか、正確なヌクレオチド配列を、部分的化学的分解または鎖終結(chain−terminating)ヌクレオチドアナログの存在下でのプライマー伸長によって決定することができる。
制限フラグメント長多型(RFLP):類似配列間の1塩基の相違の検出には、しばしば、最も高い分解能での分析が必要である。問題のヌクレオチドの位置が予め知られている場合については、直接配列決定することなく1塩基の変化を試験する方法がいくつか開発されている。例えば、目的の変異が制限認識配列の範囲内で起こる場合、診断ツールとして消化パターンの変化を使用することができる(例えば、制限フラグメント長多型(RFLP)分析)。
1つの点変異はまた、RFLPの作製または破壊によって検出されている。ミスマッチでの切断によって生成されたRNAフラグメントの存在およびサイズによって、変異を検出し、局在化する。一般に、「ミスマッチ化学的切断」(MCC)と命名されている1塩基置換を検出するための別のストラテジーを使用する場合、DNAヘテロ二重鎖中の1つのヌクレオチドミスマッチを、いくつかの化学物質によっても認識および切断する。しかし、この方法には、四酸化オスミウムおよびピペリジンが必要であり、これら2つは非常に有毒な化合物であり、臨床検査室での使用は適切ではない。
RFLP分析は感度が低く、大量のサンプルが必要である。RFLP分析を、点変異の検出に使用する場合、その性質により、公知の制限エンドヌクレアーゼの制限配列内に含まれる1塩基変化のみの検出に制限される。さらに、大部分の利用可能な酵素は4〜6塩基対の配列を認識し、多数の大量DNA操作には頻繁に切断され過ぎる。したがって、小断片の場合のみに適用可能であるが、ほとんどの変異はこのような部位の範囲内にない。
8塩基対を特異的に認識する一握りのレアカット(rare−cutting)制限酵素が単離されており、これらは遺伝子マッピングに広く使用されているが、これらの酵素は数が少なく、G+Cリッチ配列の認識に制限され、高度にクラスター化される傾向のある部位を切断する。最近、12個を超える塩基対に特異性を示すグループIイントロンによってコードされるエンドヌクレアーゼが発見されたが、これらは少数である。
対立遺伝子特異的オリゴヌクレオチド(ASO):認識配列が変化しない場合、プライマー伸長またはライゲーション事象が適合またはミスマッチの指標として使用する(bused)ことができるように、変異ヌクレオチド付近とハイブリッド形成するための対立遺伝子特異的オリゴヌクレオチド(ASO)をデザインすることができる。放射性標識対立遺伝子特異的オリゴヌクレオチド(ASO)を使用したハイブリッド形成も特定の点変異の検出に適用されている。この方法は、1つのヌクレオチドが異なる短いDNAフラグメントの融点の相違に基づく。ストリンジェントなハイブリッド形成および洗浄条件二より、変異と野生型対立遺伝子とを区別することができる。PCR産物に適用したASOアプローチも、多くの研究者によって、ras遺伝子およびgsp/gip癌遺伝子の点変異を検出および特徴づけるために広く使用されている。複数の位置に種々のヌクレオチドの変化が存在するので、ASO法は、全ての可能な癌遺伝子変異を対象とするために多数のオリゴヌクレオチドを使用する必要がある。
上記の技術のいずれか(すなわち、RFLPおよびASO)の使用には、試験前に変異が疑われる正確な位置を知らなければならない。言い換えると、これらの技術は、目的の遺伝子または配列内の変異の存在を検出する必要がある場合、適用不可能である。
変性/温度勾配ゲル電気泳動(DGGE/TGGE):2つの他の方法は、小さな配列の変化に応じた電気泳動移動度の変化の検出に依存する。これらの方法のうち、「変性/温度勾配ゲル電気泳動」(DGGE)は、勾配ゲルで電気泳動によって分離した場合に僅かに異なる配列が異なる局所融解パターンを示すという所見に基づく。この様式では、その電気泳動移動度が変化に対応することによって1つのヌクレオチドにおけるホモ二重鎖とヘテロ二重鎖の融解特性の相違が変異の存在を検出することができるので、変異型を区別することができる。分析すべきフラグメント(通常、PCR産物)を、G−C塩基対の長いストレッチ(30〜80)の一方の端に「クランプし」、鎖を完全に解離することなく目的の配列を完全に変性させる。DNAフラグメントへのGC「クランプ」の結合により、変異フラグメントが増加し、DGGEによって認識することができる。1つのプライマーへのGCクランプの結合は、確実に増幅配列の解離温度を低くするために重要である。温度勾配を使用して技術が改良されており、この方法をRNA:RNA二重鎖に適用することもできる。
変性条件を試験すべき各DNA型に至適化しなければならないことにより、DGGEの利用が制限される。さらに、この方法には、ゲルを調製し、電気泳動時に必要な高温を維持するための専用の装置が必要である。試験すべき各配列の1つのオリゴヌクレオチドにクランプされたテールの合成に関連する費用も主な検討材料である。さらに、DGGEには、長い泳動時間が必要である。DGGEの長い泳動時間を、一定変性剤ゲル電気泳動(constant denaturant gel electrophoresis(CDGE)と呼ばれるDGGEの改良型によって短くした。CDGEには、変異検出の有効性を高めるために異なる変性条件下でゲルを泳動するが必要である。
温度勾配ゲル電気泳動(TGGE)と呼ばれるDGGEに類似の技術は、化学変性勾配よりもむしろ温度勾配を使用する。TGGEには、電場に対して垂直に配向した温度勾配を生じることができる専用装置を使用することが必要である。TGGEは、比較的小さなDNAフラグメントの変異を検出することができ、それにより、大きな遺伝子セグメントのスキャニングにはゲルの泳動前に複数のPCR産物を使用する必要がある。
一本鎖高次構造多型(SSCP):「一本鎖高次構造多型」(SSCP)と呼ばれる別の一般的な方法は、Hayashi,Sekya and colleaguesによって開発され、この方法は、単一の核酸鎖が未変性条件下で特徴的な高次構造を取ることができ、これらの高次構造が電気泳動移動度に影響を与えるという所見に基づく。相補鎖は、十分に異なる構造を有すると予想され、一方の鎖を他方の鎖から分離することができる。フラグメント内の配列の変化も高次構造を変化させ、それにより、移動度が変化し、これを配列の変動についてのアッセイとして使用可能である。
SSCPプロセスは、両鎖を標識したDNAセグメント(例えば、PCR産物)の変性、および分子内相互作用が起こり得るが、泳動を妨げないようなその後の未変性ポリアクリルアミドゲルでのゆっくりとした電気泳動による分離を含む。この技術は、ゲルの組成および温度の変動に対する感度が非常に高い。外見上類似の条件下での異なる研究所で得られたデータの比較が比較的困難であるであることにより、この方法は非常に制限される。
ジデオキシフィンガープリンティング(ddF):ジデオキシフィンガープリンティング(ddF)は、変異の存在について遺伝子をスキャニングするために開発された別の技術である。ddF技術は、サンガージデオキシ配列決定とSSCPとの構成要素を組み合わせている。1つのジデオキシターミネーターを使用してジデオキシ配列決定反応を行い、その後、反応産物を、未変性ポリアクリルアミドゲルで電気泳動して、SSCP分析と同様に終結セグメントの移動度の変化を検出する。ddFは感度の増大に関してはSSCPよりも改良されているが、ddFには、高価なジデオキシヌクレオチドの使用が必要であり、この技術は、SSCPに適切なサイズ(すなわち、変異の最適な検出のための200〜300塩基のフラグメント)のフラグメントの分析にさらに制限される。
上記制限に加えて、これら全ての方法は、分析することができる核酸フラグメントのサイズに制限される。直接配列決定アプローチには、600塩基対を超える配列がクローニングに必要であり、その結果、全フラグメントを対象とするための検出サブクローニングまたはプライマーウォーキングのいずれかのために時間および費用を要する。SSCPおよびDGGEは、さらにより厳密にサイズの制限を受ける。配列の変化によって感度が減少するので、これらの方法は、より大きなフラグメントに適切でないと見なされる。SSCPは、伝えられるところによれば、200塩基対フラグメントの90%の1塩基置換を検出することができるにもかかわらず、400塩基対フラグメントでは検出は50%未満に低下する。同様に、フラグメントの長さが500塩基対に達する場合、DGGEの感度は低下する。直接配列決定とSSCPとを組み合わせたddF技術も、スクリーニングできるDNAが比較的小さいサイズに制限される。
本発明の現在好ましい実施形態に因れば、腫瘍細胞または癌患者由来の細胞における本明細書中に記載の核酸配列のいずれかを検索する工程を、以下の適切な技術によって行う:核酸配列決定、ポリメラーゼ連鎖反応、リガーゼ連鎖反応、自律的合成反応、Qβ−レプリカーゼ、サイクリングプローブ反応、分岐DNA、制限フラグメント長多型分析、ミスマッチの化学的切断、ヘテロ二重鎖分析、対立遺伝子特異的オリゴヌクレオチド、変性勾配ゲル電気泳動、一定変性剤ゲル電気泳動、温度勾配ゲル電気泳動、およびジデオキシフィンガープリンティングが含まれるが、これらに限定されない。
チップまたは他のこのようなデバイスを使用して任意選択的に検出することもできる。分析すべき候補領域を含む核酸サンプルを、単離し、増幅し、レポーター基で標識することが好ましい。このレポーター基は、フィコエリトリンなどの蛍光基であり得る。次いで、標識核酸を、フルイディクスステーション(fluidics station)を使用してチップ上に固定したプローブとインキュベートし、シリコンおよびガラス基板中のフルイディクスデバイス、特にミクロキャピラリーデバイスの構築が記載されている。
一旦反応が完了すると、チップをスキャナに挿入し、ハイブリッド形成パターンを検出する。既に核酸に組み込まれており、この時点でチップに付着したプローブに結合しているレポーター基から放出されたシグナルとしてハイブリッド形成データを収集する。チップ上に固定された各プローブの配列および位置を承知しているので、所与のプローブとハイブリッド形成している核酸の同一性を決定することができる。
自動化装置といと共に使用する場合、上記検出方法を使用して、疾患および/または病的状態について複数のサンプルを迅速且つ容易にスクリーニングすることができると認識される。
アミノ酸配列決定およびペプチド
用語「ポリペプチド」、「ペプチド」、および「タンパク質」を、アミノ酸残基のポリマーをいうために本明細書中で交換可能に使用する。この用語は、1つまたは複数のアミノ酸残基が対応する天然に存在するアミノ酸のアナログまたは模倣物および天然に存在するアミノ酸ポリマーであるアミノ酸に適用する。ポリペプチドを、例えば、炭水化物残基の付加によって修飾して糖タンパク質を形成することができる。用語「ポリペプチド」、「ペプチド」、および「タンパク質」には、非糖タンパク質だけでなく、糖タンパク質が含まれる。
ポリペプチド産物を、標準的な固相技術などの使用によって生化学的に合成することができる。このような方法には、排他的固相合成、部分的固相合成方法、フラグメント縮重、古典的液体合成が含まれるが、これらに限定されない。これらの方法を、ペプチドが比較的短い場合(すなわち、10kDa)、および/または組換え技術によって産生することができず(すなわち、核酸配列によってコードされない)、それにより異なる化学的性質を含む場合に使用することが好ましい。
固相ポリペプチド合成手順は当該分野で周知であり、John Morrow Stewart and Janis Dillaha Young,Solid Phase Peptide Syntheses(2nd Ed.,Pierce Chemical Company,1984)にさらに記載されている。
合成ポリペプチドを、任意選択的に分取高速液体クロマトグラフィ(Creighton T.(1983)Proteins,structures and molecular principles.WH Freeman and Co.N.Y.)によって精製し、その後、その組成をアミノ酸配列決定によって確認することができる。
大量のポリペプチドを所望する場合、ポリペプチドを、Bitter et al.,(1987)Methods in Enzymol.153:516−544,Studier et al.(1990)Methods in Enzymol.185:60−89,Brisson et al.(1984)Nature 310:511−514,Takamatsu et al.(1987)EMBO J.6:307−311,Coruzzi et al.(1984)EMBO J.3:1671−1680 and Brogli et al.,(1984)Science 224:838−843,Gurley et al.(1986)Mol.Cell.Biol.6:559−565 and Weissbach & Weissbach,1988,Methods for Plant Molecular Biology,Academic Press,NY,Section VIII,pp 421−463等に記載の組換え技術を使用して生成することができる。
本発明はまた、本発明のポリヌクレオチド配列によってコードされるポリペプチドおよび本明細書中に記載のアミノ酸配列によるポリペプチドを含む。本発明はまた、これらのポリペプチドのホモログを含み、このようなホモログは、下記アミノ酸配列と少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも95%、またはさらに100%相同あり得るが、これらは、任意選択的および好ましくは以下を含むデフォルトパラメーターを使用したNational Center of Biotechnology Information(NCBI)のBlastPソフトウェアを使用して決定することができる:フィルタリングはオン(このオプションは、Seg(タンパク質)プログラムを使用してクエリーから反復配列または複雑さの低い配列をフィルタリングする)、タンパク質についてのスコアリング行列はBLOSUM62であり、ワードサイズは3であり、E値は10であり、ギャップコストは11,1(初期化および伸長)であり、表示するアラインメント数は50である。任意選択的に、核酸配列の同一性/相同性を、National Center of Biotechnology Information(NCBI)のBlastNソフトウェアの使用によって決定することができ、このソフトウェアは、好ましくはDUSTフィルタープログラムを使用し、好ましくは、E値が10、複雑さの低い配列をフィルタリングし、ワードサイズが11である。最終的に、本発明はまた、上記ポリペプチドのフラグメントおよび変異(無作為またはターゲティングされた様式での天然に存在するか人為的に誘導された1つまたは複数のアミノ酸の欠失、挿入、または置換など)を有するポリペプチドを含む。
本発明によって同定されるペプチドが、分解産物、合成ペプチドもしくは組換えペプチドおよびペプチド模倣物、典型的には、例えば、ペプチドをより安定にする一方で、ペプチドの体内または細胞への透過をより可能にする修飾を有し得る合成ペプチドならびにペプチドアナログであるペプトイドおよびセミペプトイドであり得ると認識される。このような修飾には、N末端修飾、Cま単修飾、ペプチド結合修飾(CH2−NH、CH2−S、CH2−S=O、O=C−NH、CH2−O、CH2−CH2、S=C−NH、CH=CH、またはCF=CHが含まれるが、これらに限定されない)、骨格修飾、および残基修飾が含まれるが、これらに限定されない。ペプチド模倣化合物の調製方法は当該分野で周知であり、明記されている。これに関するさらなる詳細を、以下に記載する。
ペプチド内のペプチド結合(−CO−NH−)を、例えば、N−メチル化結合(−N(CH3)−CO−)、エステル結合(−C(R)H−C−O−O−C(R)−N−)、ケトメチレン結合(−CO−CH2−)、α−アザ結合(−NH−N(R)−CO−)(式中、Rは任意のアルキル(例えば、メチル)である)、カルバ(carba)結合(−CH2−NH−)、ヒドロキシエチレン結合(−CH(OH)−CH2−)、チオアミド結合(−CS−NH−)、オレフィン二重結合(−CH=CH−)、レトロアミド結合(−NH−CO−)、ペプチド誘導体(−N(R)−CH2−CO−)(式中、Rは、炭素原子状に天然に存在する「通常の」側鎖である)に置換することができる。
これらの修飾は、ペプチド鎖に沿った結合のいずれか、さらにはいくつか(2〜3)が同時に生じ得る。
天然の芳香族アミノ酸(Trp、Tyr、およびPhe)を、フェニルグリシン、TIC、ナフチレルアニン(naphthylelanine)、Pheの環メチル化誘導体、Pheのハロゲン化誘導体、またはo−メチル−Tyrなどの非天然酸に置換することができる。
上記に加えて、本発明のペプチドには、1つまたは複数の修飾アミノ酸または1つまたは複数の非アミノ酸単量体(例えば、脂肪酸、複合糖質など)も含まれ得る。
明細書および以下の特許請求の範囲で使用される、用語「アミノ酸」は、20種の天然に存在するアミノ酸(これらのアミノ酸は、しばしば、in vivoで翻訳後に修飾されている(例えば、ヒドロキシプロリン、ホスホセリン、およびホスホトレオニンが含まれる))および通常でない(unusual)アミノ酸(2−アミノアジピン酸、ヒドロキシリジン、イソデスモシン、ノルバリン、ノルロイシン、およびオルニチンが含まれるが、これらに限定されない)が含まれると理解される。さらに、用語「アミノ酸」には、D型およびL型のアミノ酸が含まれる。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
本発明のペプチドを可溶化形態のペプチドが必要とされる診断で使用することが好ましいので、本発明のペプチドには、好ましくは、1つまたは複数の非天然または天然の極性アミノ酸(その水酸基含有側鎖によってペプチドの可溶性を増加させることができるセリンおよびトレオニンが含まれるが、これらに限定されない)が含まれる。
本発明のペプチドを線状形態で使用することが好ましいが、環状化がペプチド特性を重大に妨害しない場合、ペプチドの環状化形態も使用することができると認識される。
本発明のペプチドを、標準的な固相技術などの使用によって生化学的に合成することができる。これらの方法には、当該分野で周知の排他的固相合成、部分的固相合成方法、フラグメント縮重、古典的液体合成が含まれる。これらの方法を、ペプチドが比較的短い場合(すなわち、10kDa)、および/または組換え技術によって産生することができず(すなわち、核酸配列によってコードされない)、それにより異なる化学的性質を含む場合に使用することが好ましい。
合成ペプチドを、分取高速液体クロマトグラフィによって精製し、その組成をアミノ酸配列決定によって確認することができる。
大量の本発明のペプチドを所望する場合、本発明のペプチドを、Bitter et al.,(1987)Methods in Enzymol.153:516−544,Studier et al.(1990)Methods in Enzymol.185:60−89,Brisson et al.(1984)Nature 310:511−514,Takamatsu et al.(1987)EMBO J.6:307−311,Coruzzi et al.(1984)EMBO J.3:1671−1680 and Brogli et al.,(1984)Science 224:838−843,Gurley et al.(1986)Mol.Cell.Biol.6:559−565 and Weissbach & Weissbach,1988,Methods for Plant Molecular Biology,Academic Press,NY,Section VIII,pp 421−463などおよび上記にも記載の組換え技術を使用して生成することができる。
抗体
「抗体」は、好ましくは、免疫グロブリン遺伝子によって実質的にコードされるポリペプチドまたはエピトープ(例えば、抗原)に特異的に結合して認識するそのフラグメントをいう。認識される免疫グロブリン遺伝子には、κおよびλ軽鎖定常領域遺伝子、α、γ、δ、ε、およびμ重鎖定常領域遺伝子、ならびに無数の免疫グロブリン可変領域遺伝子が含まれる。抗体は、例えば、インタクトな免疫グロブリンまたは種々のペプチダーゼでの消化によって産生される多数の十分に特徴づけられたフラグメントとして存在する。これには、例えば、Fab’およびF(ab)’フラグメントが含まれる。本明細書中で使用される、用語「抗体」には、全抗体の修飾によって産生されるか、組換えDNA法を使用してde novoで合成される抗体フラグメントも含まれる。抗体には、ポリクローナル抗体、モノクローナル抗体、キメラ抗体、ヒト化抗体、または単鎖抗体も含まれる。抗体の「Fc」部分は、1つまたは複数の重鎖定常領域(CH1、CH2、およびCH3)を含むが、重鎖可変領域は含まれない免疫グロブリン重鎖の一部をいう。
マクロファージに結合することができる抗体の機能的フラグメント(Fab、F(ab’)2、およびFvなど)を以下に記載する:(1)Fab:抗体分子の1価の抗原結合フラグメントを含み、インタクトな軽鎖および1つの重鎖の一部を得るための酵素パパインでの全抗体の消化によって産生することができるフラグメント、(2)Fab’:インタクトな軽鎖および重鎖の一部を得るための全抗体のペプシンでの処理およびその後の還元によって得ることができる抗体分子のフラグメントであって、1つの抗体分子あたり2つのFab’フラグメントが得られる、(3)(Fab’)2:酵素ペプシンで全抗体を処理し、その後還元しないで得ることができる抗体のフラグメントであって、(Fab’)2は2つのジスルフィド結合によって互いに保持された2つのFab’フラグメントの二量体である、(4)Fv:2つの鎖として発現される軽鎖の可変領域および重鎖の可変領域を含む遺伝し操作されたフラグメントとして定義される、(5)単鎖抗体(「SCA」):遺伝子が融合された単鎖分子として適切なポリペプチドリンカーによって連結された軽鎖の可変領域および重鎖の可変領域を含む遺伝子操作された分子。
ポリクローナル抗体およびモノクローナル抗体ならびにそのフラグメントの産生方法は当該分野で周知である(例えば、Harlow and Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,New York,1988(本明細書中で参考として援用される)を参照のこと)。
本発明の抗体フラグメントを、抗体のタンパク質分解性加水分解または大腸菌もしくは哺乳動物細胞(例えば、チャイニーズハムスター卵巣細胞培養または他のタンパク質発現系)中でのフラグメントをコードするDNAの発現によって調製することができる。抗体フラグメントを、従来の方法による全抗体のペプシンまたはパパイン消化によって得ることができる。例えば、抗体フラグメントを、ペプシンで抗体を酵素切断し、それにより、F(ab’)2と示される5Sフラグメントを得ることによって産生することができる。このフラグメントを、チオール還元剤を使用してさらに切断し、任意選択的にジスルフィド結合の切断に起因するスルフヒドリル基を保護して、1価の3.5S Fab’フラグメントを生成することができる。あるいは、ペプシンを使用した酵素切断により、2つの1価のFab’フラグメントおよびFcフラグメントが直接生成される。これらの方法は、例えば、Goldenbergに付与された米国特許第4,036,945号および同第4,331,647号ならびにこれらに含まれる引例(これらの特許は、その全体が本明細書中で参考として援用される)に記載されている。Porter,R.R.[Biochem.J.73:119−126(1959)]も参照のこと。フラグメントがインタクトな抗体によって認識される抗原に結合する限り、1価の軽鎖−重鎖フラグメントを形成するための重鎖の分離、フラグメントのさなる切断、またはさらなる酵素的、化学的、または遺伝子技術などの他の抗体の切断方法も使用することができる。
Fvフラグメントは、VH鎖およびVL鎖の会合を含む。Inbar et al.[Proc.Nat’l Acad.Sci.USA 69:2659−62(19720]に記載のように、この会合は、非極性であり得る。あるいは、可変鎖を、分子間ジスルフィド結合またはグルタルアルデヒドなどの化学物質による架橋によって結合することができる。好ましくは、Fvフラグメントは、ペプチドリンカーによって連結したVH鎖およびVL鎖を含む。これらの単鎖抗原結合タンパク質(sFv)を、オリゴヌクレオチドによって連結されたVHおよびVLドメインをコードするDNA配列を含む構造遺伝子の構築によって調製する。構造遺伝子を、発現ベクターに挿入し、その後、大腸菌などの宿主細胞に移入する。組換え宿主細胞は、2つのVドメインを架橋するリンカーペプチドを有する1つのポリペプチド鎖を合成する。sFvの生成方法は、例えば、Whitlow and Filpula,Methods 2:97−105(1991);Bird et al.,Science 242:423−426(1988);Pack et al.,Bio/Technology 11:1271−77(1993);および米国特許第4,946,778号(その全体が本明細書中で参考として援用される)に記載されている。
抗体フラグメントの別の形態は、1つの相補性決定領域(CDR)をコードするペプチドである。CDRペプチド(「最小認識単位」)を、目的の抗体のCDRをコードする遺伝子の構築によって得ることができる。このような遺伝子を、例えば、ポリメラーゼ連鎖反応を使用して抗体産生細胞のRNAから可変領域を合成することによって調製する(例えば、Larrick and Fry [Methods,2:106−10(1991)]を参照のこと)。
非ヒト(例えば、マウス)抗体のヒト化形態は、非ヒト免疫グロブリン由来の最小配列を含む免疫グロブリンのキメラ分子、免疫グロブリン鎖、またはそのフラグメント(Fv、Fab、Fab’、F(ab’)、または抗体の他の抗原結合サブシーケンスなど)である。ヒト化抗体には、レシピエントの相補性決定領域(CDR)由来の残基が所望の特異性、親和性、および能力を有するマウス、ラット、またはウサギ等の非ヒト種のCDR由来の残基(ドナー抗体)に置換されたヒト免疫グロブリン(レシピエント抗体)が含まれる。いくつかの例では、ヒト免疫グロブリンのFvフレームワーク残基を、対応する非ヒト残基に置換する。ヒト化抗体はまた、レシピエント抗体や移入されたCDRまたはフレームワーク配列で認められない残基を含み得る。一般に、ヒト化抗体は、少なくとも1つ、典型的には2つの可変ドメインの実質的に全てを含み、全てまたは実質的に全てのCDR領域は非ヒト免疫グロブリンのCDRに対応し、全てまたは実質的に全てのFR領域はヒト免疫グロブリンコンセンサス配列のFR領域である。ヒト化抗体はまた、任意選択的に、免疫グロブリンの定常領域(Fc)の少なくとも一部、典型的には、ヒト免疫グロブリンの定常領域を含む(Jones et al.,Nature,321:522−525(1986);Riechmann et al.,Nature,332:323−329(1988);およびPresta,Curr.Op.Struct.Biol.,2:593−596(1992))。
非ヒト抗体のヒト化方法は、当該分野で周知である。一般に、ヒト化抗体は、非ヒトである供給源由来の抗体に移入された1つまたは複数のアミノ酸残基を有する。これらの非ヒトアミノ酸残基を、しばしば、移入残基(import residue)といい、典型的には、移入可変ドメインから採取される。ヒト化を、本質的に、Winter and co−workers [Jones et al.,Nature,321:522−525(1986);Riechmann et al.,Nature 332:323−327(1988);Verhoeyen et al.,Science,239:1534−1536(1988)]の方法にしたがって、げっ歯類CDRまたはCDR配列へのヒト抗体の対応する配列の置換によって行うことができる。したがって、このようなヒト化抗体は、実質的にインタクト未満のヒト可変ドメインが非ヒト種由来の対応する配列に置換されているキメラ抗体(米国特許第4,186,567号)である。実際には、ヒト化抗体は、典型的には、いくつかのCDR残基およびおそらくいくつかのFR残基がげっ歯類抗体中の類似の部位由来の残基に置換されたヒト抗体である。
ヒト抗体を、当該分野で公知の種々の技術(ファージディスプレイライブラリー(Hoogenboom and Winter,J.Mol.Biol.,227:381(1991);Marks et al.,J.Mol.Biol.,222:581(1991))が含まれる)を使用して産生することもできる。Cole et al.and Boerner et al.の技術もヒトモノクローナル抗体の調製に利用可能である(Cole et al.,Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,p.77(1985)and Boerner et al.,J.Immunol.,147(1):86−95(1991))。同様に、ヒト抗体を、トランスジェニック動物(例えば、内因性免疫グロブリン遺伝子が部分的または完全に不活化されているマウス)へのヒト免疫グロブリン遺伝子座の移入によって作製することができる。攻撃誘発の際、ヒト抗体の産生が認められ、これは、あらゆる点でヒトで認められる性質(遺伝子の再編成、アセンブリ、および抗体レパートリーが含まれる)に酷似している。このアプローチは、例えば、米国特許第5,545,807号;同第5,545,806号;同第5,569,825号;同第5,625,126号;同第5,633,425号;同第5,661,016号、および以下の科学刊行物に記載されている:Marks et al.,Bio/Technology 10,:779−783(1992);Lonberg et al.,Nature 368:856−859(1994);Morrison,Nature 368 812−13(1994);Fishwild et al.,Nature Biotechnology 14,845−51(1996);Neuberger,Nature Biotechnology 14:826(1996);and Lonberg and Huszar,Intern.Rev.Immunol.13,65−93(1995)。
好ましくは、本発明のこの態様の抗体は、本発明のポリペプチド変異型の少なくとも1つのエピトープに特異的に結合する。本明細書中で使用される、用語「エピトープ」は、抗体のパラトープが結合する抗原上の任意の抗原決定基をいう。
エピトープ決定基は、通常、アミノ酸または炭水化物の側鎖等の分子の化学的に活性な表面群からなり、通常、特異的な三次元構造特性および特異的な電荷の特徴を有する。
任意選択的に、下記のように、1つまたは複数の翻訳後修飾(グリコシル化および/またはリン酸化が含まれるが、これらに限定されない)の変化によって固有のエピトープを変異型中に作製することができる。このような変化により、例えば、特定の部位でのグリコシル化の除去によって新規のエピトープを作製することもできる。
本発明のエピトープはまた、任意選択的に、線状ポリペプチド自体における固有の配列部分に連続的であるが、依然として組み合わせてエピトープを形成することができる、変異型の少なくとも1つの他の部分と組み合わせた本発明の変異型の固有の配列部分の一部または全部を含み得る。1つまたは複数の固有の配列部分は、任意選択的に、1つまたは複数の変異型の他の不連続部分(公知のタンパク質の一部と高い相同性を有し得る部分が含まれる)と組み合わせてエピトープを形成することができる。
免疫アッセイ
本発明の別の実施形態では、免疫アッセイを使用して、サンプル中のマーカーを定性的または定量的に検出および分析することができる。この方法は、マーカーに特異的に結合する抗体を準備する工程と、サンプルを抗体に接触させる工程と、サンプル中のマーカーに結合した抗体の複合体の存在を検出する工程を含む。
マーカーに特異的に結合する抗体を調製するために、精製したタンパク質マーカーを使用することができる。タンパク質マーカーに特異的に結合する抗体を、当該分野で公知の任意の適切な方法を使用して調製することができる。
抗体を準備した後、マーカーを、十分に認識された多数の免疫学的結合アッセイを使用して検出および/または定量することができる。有用なアッセイには、例えば、酵素免疫アッセイ(EIA)(酵素結合免疫吸着アッセイ(ELISA)など)、放射免疫アッセイ(RIA)、ウェスタンブロットアッセイ、またはスロットブロットアッセイが含まれる(例えば、米国特許第4,366,241号;同第4,376,110号;同第4,517,288号;および同第4,837,168号を参照のこと)。一般に、被験体から得たサンプルを、マーカーに特異的に結合する抗体と接触させることができる。
任意選択的に、抗体を、抗体とサンプルとの接触前に固体支持体に固定して、複合体の線状およびその後の単離を容易にすることができる。固体支持体の例には、例えば、マイクロタイタープレート、スティック、ビーズ、またはマイクロビーズの形態のガラスまたはプラスチックが含まれるが、これらに限定されない。抗体を、固体支持体に付着させることもできる。
サンプルの抗体とのインキュベーション後、混合物を洗浄し、形成された抗体−マーカー複合体を、検出することができる。洗浄混合物と検出試薬とのインキュベーションによってこれを行うことができる。あるいは、サンプル中のマーカーを、例えば、第2の標識抗体を使用して結合したマーカー−特異的抗体を検出する直接アッセイ、および/または、例えば、マーカーの異なるエピトープに結合するモノクローナル抗体を混合物と同時にインキュベートする競合アッセイまたは阻害アッセイを使用して検出することができる。
アッセイを通して、試薬の各組合わせ後にインキュベーションおよび/または洗浄工程が必要であり得る。インキュベーション工程は、約5秒間から数時間まで、好ましくは約5分から約24時間まで変化し得る。しかし、インキュベーション時間は、アッセイの形式、マーカー、溶液の体積、および濃度などに依存する。通常、アッセイを、周囲温度で行うが、10℃〜40℃などの範囲で行うことができる。
免疫アッセイを使用して、被験体由来のサンプル中のマーカー試験量を決定することができる。第1に、サンプル中の試験量のマーカーを、上記の免疫アッセイ方法を使用して検出することができる。マーカーがサンプル中に存在する場合、サンプル中にマーカーが存在する場合、マーカーは、上記の適切なインキュベーション条件下でマーカーと特異的に結合する抗体との抗体−マーカー複合体を形成する。任意選択的に、抗体−マーカー複合体量を、標準との比較によって決定することができる。上記のように、測定単位をコントロール量および/またはシグナルと比較することができる限り、マーカーの試験量を、絶対単位中で測定する必要はない。
本発明のポリペプチドと特異的に相互作用するが、例えば、野生型タンパク質または他のイソ型と相互作用しない抗体を使用することが好ましい。このような抗体は、例えば、本発明のポリペプチド変異型の固有の配列部分(下により詳細に記載されている架橋、先端、テール、および挿入が含まれるが、これらに限定されない)に指向する。本発明の抗体の好ましい実施形態を、「抗体」の項により詳細に記載している。
放射免疫アッセイ(RIA):あるバージョンでは、この方法は、所望の基質の沈降、以下に詳述する方法では、アガロースビーズなどの沈殿可能なキャリア上に固定した特異的抗体および放射性標識抗体結合タンパク質(例えば、I125で標識したプロテインA)を含む。沈降ペレット数は、基質量に比例する。
RIAの別のバージョンでは、標識基質および非標識抗体結合タンパク質を使用する。未知量の基質を含むサンプルを、種々の量で添加する。標識基質の沈降数の減少は、添加したサンプル中の基質の量に比例する。
酵素結合免疫吸着アッセイ(ELISA):この方法は、タンパク質基質を含むサンプル(例えば、固定した細胞またはタンパク質溶液)のマイクロタイタープレートのウェルなどの表面への固定を含む。酵素にカップリングした基質特異的抗体を適用し、基質に結合させる。次いで、抗体の存在を検出し、抗体に結合した酵素を使用した比色反応によって定量する。この方法で一般に使用される酵素には、西洋ワサビペルオキシダーゼおよびアルカリホスファターゼが含まれる。十分に較正されており、且つ直線の反応範囲内の場合、サンプル中の基質の存在量は、発色量に比例する。一般に基質標準を使用して、量的精度を改良する。
ウェスタンブロット:この方法は、アクリルアミドゲルによる他のタンパク質からの基質の分離およびその後の膜(例えば、ナイロンまたはPVDF)への基質の移動を含む。次いで、基質の存在を、基質に特異的な抗体によって検出し、その後、抗体結合試薬によって結合する。抗体結合試薬は、例えば、プロテインAまたは他の抗体であり得る。抗体結合試薬を、上記のように、放射性標識するか、酵素に結合させることができる。オートラジオグラフィ、比色試薬、または化学発光によって検出することができる。この方法によって基質を定量し、電気泳動の際のアクリルアミドゲルにおける移動距離を示す膜の相対的位置によってその同一性を決定可能である。
免疫組織化学的分析:この方法は、基質特異的抗体による固定細胞におけるin situでの基質の検出を含む。基質特異的抗体を、酵素に結合するかフルオロフォアに結合することができる。顕微鏡および主観的評価によって検出する。酵素結合抗体を使用する場合、比色反応が必要であり得る。
蛍光標示式細胞分取(FACS):この方法は、基質特異的抗体による細胞におけるin situでの基質の検出を含む。基質特異的抗体を、光ビーム(light beam)からの通過時の各細胞から放出された光の波長を読み取る細胞分取装置によって検出する。この方法は、2つまたはそれ以上の抗体を同時に使用することができる。
ラジオイメージング法
これらの方法には、陽電子放出型断層撮影(PET)、単光子放出型コンピュータ断層撮影(SPECT)が含まれるが、これらに限定されない。これらの両技術は、非浸襲性であり、これらを使用して、広範な種々の組織事象および/または機能を検出および/または測定することができる(例えば、癌細胞の検出など)。PETと異なり、SPECTを、任意選択的に、2つの標識と同時に使用することができる。SPECTも同様に、例えば、費用および使用することができる標識の型に関していくつかの他の利点を有する。例えば、米国特許第6,696,686号は、乳癌検出のためのSPECTの使用を記載しており、この特許は、本明細書中で完全に記載されているかのように本明細書中で参考として援用される。
ディスプレイライブラリー
本発明のさらに別の態様によれば、それぞれが本発明のポリペプチド配列由来の少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、少なくとも10個、少なくとも10〜15個、少なくとも12〜17個、少なくとも15〜20個、少なくとも15〜30個、または少なくとも20〜50個の連続したアミノ酸を表示する複数のディスプレイ送達体(ファージ、ウイルス、または細菌など)を含むディスプレイライブラリーを提供する。
このようなディスプレイライブラリーの構築方法は、当該分野で周知である。このような方法は、例えば、Young AC,et al.,"The three−dimensional structures of a polysaccharide binding antibody to Cryptococcus neoformans and its complex with a peptide from a phage display library:implications for the identification of peptide mimotopes" J Mol Biol 1997 Dec 12;274(4):622−34;Giebel LB et al. "Screening of cyclic peptide phage libraries identifies ligands that bind streptavidin with high affinities" Biochemistry 1995 Nov 28;34(47):15430−5;Davies EL et al.,"Selection of specific phage−display antibodies using libraries derived from chicken immunoglobulin genes" J Immunol Methods 1995 Oct 12;186(1):125−35;Jones C RT al."Current trends in molecular recognition and bioseparation" J Chromatogr A 1995 Jul 14;707(1):3−22;Deng SJ et al."Basis for selection of improved carbohydrate−binding single−chain antibodies from synthetic gene libraries" Proc Natl Acad Sci U S A 1995 May 23;92(11):4992−6;and Deng SJ et al."Selection of antibody single−chain variable fragments with improved carbohydrate binding by phage display" J Biol Chem 1994 Apr 1;269(13):9533−8(本明細書中で参考として援用される)に記載されている。
以下の項は、候補マーカーの例(第1項)およびこれらのマーカーの例についての実験データ(第2項)に関する。
候補マーカーの例の項
この項は、本発明の配列の例(その例示的選択方法が含まれる)に関する。
本発明の生体分子を明らかにするために取り掛かった方法の説明
ヒトESTおよびcDNAを、GenBankバージョン136(2003年6月15日のftp.ncbi.nih.gov/genbank/release.notes/gb136.release.notes);2003年4月のNCBIゲノムアセンブリ;2003年6月のRefSeq配列;Genbankバージョン139(2003年12月);NCBIのヒトゲノム(Build 34)(2003年10月から);および2003年12月からのRefSeq配列;およびIncyte CorporationのLifeSeqライブラリー(ESTのみ;Wilmington,DE,USA)から得た。GenBank配列に関して、EST(GBEST)の項由来のヒトEST配列および霊長類(GBPRI)の項由来のヒトmRNA配列を使用し、ヒトヌクレオチドRefSeq mRNA配列も使用した(例えば、www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.htmlおよびESTの項の参考文献(www.ncbi.nlm.nih.gov/dbEST/を参照のこと);dbEST(GenBank中のESTデータベース)の一般的な参考文献(Boguski et al,Nat Genet.1993 Aug;4(4):332−3に見出すことができる)(その全てが本明細書中に完全に記載されているかのように本明細書中で参考として援用される)を参照のこと)。
新規のスプライス変異型を、Sorek,R.,Ast,G.& Graur,D.Alu−containing exons are alternatively spliced.Genome Res 12,1060−7(2002);米国特許第6,625,545号;2004年5月27日にUS20040101876として公開された米国特許出願番号10/426,002号(その全てが本明細書中に完全に記載されているかのように本明細書中で参考として援用される)に記載のLEADSクラスター化およびアセンブリシステムを使用して予想した。簡単に述べれば、ソフトウェアは、反復、ベクター、および免疫グロブリンから発現配列を取り除く。次いで、ソフトウェアは、発現配列を、選択的スプライシングを考慮したゲノムおよび遺伝子または部分的遺伝子を示す「クラスター」への発現配列と重複するクラスターとアラインメントする。
これらを、GeneCarta(Compugen,Tel−Aviv,Israel)プラットフォームを使用して注釈づけした。GeneCartaプラットフォームは、豊富な注釈づけプール、(特に、スプライシングした配列の)配列情報、染色体情報、アラインメント、およびさらなる情報(SNP、遺伝子オントロジーターム、発現プロフィール、機能分析、詳細なドメイン構造、既知および推定タンパク質および詳細な相同性レポートなど)を含む。
候補選択方法に関して簡単に説明する。しかし、この説明を記述のみを目的として説明し、本発明を制限することを決して意図しないことに留意すべきである。発現配列のデータベースの使用による腫瘍組織中で過剰発現する遺伝子および/またはそのスプライスバリアントを見出すようにデザインされた計算プロセスによって潜在的マーカーを同定した。手作業の分類プロセスにしたがって決定したESTライブラリー中の情報に関連する種々のパラメータを使用して、癌組織中で過剰発現する遺伝子および/またはそのスプライスバリアントの位置づけを補助した。選択方法の詳細な説明を、以下の実施例1に示す。癌マーカー選択エンジンおよび以下のウェットバリデーション(wet validation)段階の概要のまとめを図1に示す。
実施例1:差分発現した遺伝子産物の同定−アルゴリズム
差分発現した遺伝子産物と構成性に発現した遺伝子(すなわち、ハウスキーピング遺伝子)とを区別するために、頻度分析に基づくアルゴリズムを設定した。癌で過剰発現した転写物の同定のための特定のアルゴリズムを、以下に記載する。
乾式分析(Dry analysis)
ライブラリー注釈づけ−ESTライブラリーを以下にしたがって手作業で分類する。
・組織の起源
・生体供給源−ESTライブラリーの構築のために頻繁に使用される生体供給源の例には、癌細胞株、正常組織、癌組織、胎児組織、および他(正常細胞株、正常細胞株のプール、癌細胞株、およびその組み合わせなど)が含まれる。これらの組織/細胞株に関する以下に使用した略語の特定の説明を上に示す。
・ライブラリー構築のプロトコール−種々の方法がライブラリー構築分野で公知であり、標準化ライブラリー構築、非標準化ライブラリー構築、サブトラクションライブラリー、ORESTESなどが含まれる。時折、ライブラリー構築のプロトコールを示さないと認識される。
以下の規則に従う。
同一の生体サンプル由来のESTライブラリーを、1つのライブラリーと見なす。
上記平均レベルで汚染されている(例えば、DNA汚染など)ESTライブラリーを排除した。このような汚染の存在を、以下のように決定した。各ライブラリーについて、他のスプライシング配列内に完全に含まれない非スプライシングESTを計数した。(他の配列と比較した)このような配列の比率は、分析した全ライブラリーの平均よりも標準偏差が少なくとも4高い場合、ライブラリーを汚染としてタグ化し、以下の分析でのさらなる考慮から排除した(さらなる詳細については、Sorek,R.& Safer,H.M.A novel algorithm for computational identification of contaminated EST libraries.Nucleic Acids Res 31,1067−74(2003)も参照のこと)。
少なくとも5つの配列(目的の組織由来の少なくとも2つの配列が含まれる)を有するクラスター(遺伝子)を分析した。上記のように、スプライスバリアントを、LEADSソフトウェアパッケージの使用によって同定した。
実施例2:癌中で過剰発現する遺伝子の同定
2つの異なるスコアリングアルゴリズムを開発した。
ライブラリースコア−多数の癌ライブラリーによって支持される候補配列は、特異的且つ有効な診断マーカーとして機能する可能性がより高い。
基本アルゴリズム−各クラスターのために、クラスターに対する癌ライブラリーおよび正常ライブラリーの寄与配列を計数した。フィッシャーの正確確率検定を使用して、癌ライブラリーおよび正常なライブラリーの総数と比較して癌ライブラリーがクラスター中で有意に過剰発現するかどうかをチェックした。
ライブラリーの計数:クラスターに関与しない限り、小ライブラリー(例えば、1000配列未満)を、考慮から排除した。この理由のために、ライブラリーの総数を、各クラスターについて実際に調整している。
クローン番号スコア−一般に、EST数は、正常なライブラリーと比較して癌ライブラリーではるかに多く、これは、実際の過剰発現を示し得る。
アルゴリズム−
クローン計数:ESTクローンの計数のために、プロトコールが実際の発現レベルをどの程度反映しているという本発明者らの信念に基づいて、各ライブラリープロトコールクラスに以下の重みを付けた。
(i)非正規化:1
(ii)正規化:0.2
(iii)他の全てのクラス:0.1
クローン数スコア−癌ライブラリー由来の重みをつけたESTクローンの総数を、正常ライブラリー由来のESTクローンと比較した。1つのライブラリーが多数のスコアに寄与することを回避するために、所与のクラスターの最も多くのライブラリーに与えるライブラリーの寄与を2クローンに制限した。
スコアを、
Figure 2008507261
(式中、c−クラスター中の「癌」クローンの重み付けした数、
C−全「癌」ライブラリー中のクローンの重み付けした数、
n−クラスター中の「正常」クローンの重み付けした数、
N−全「正常」ライブラリー中のクローンの重み付けした数
)として計算した。
クローン数スコアの有意性−フィッシャーの正確確率検定を使用して、癌ライブラリーおよび正常なライブラリー由来のESTクローンの総数と比較して癌ライブラリー由来のESTクローンがクラスター中で有意に過剰発現するかどうかをチェックした。
以下の2つの検索アプローチを使用して、一般的な癌特異的候補または腫瘍特異的候補のいずれかを見出した。
・癌細胞株由来のライブラリーと同様に、腫瘍組織由来のライブラリー/配列を計数する(「正常」細胞株は無視した)。
・腫瘍組織由来のライブラリー/配列のみを計数する。
実施例3:組織特異的遺伝子の同定
組織特異的クラスターの検出のために、組織ライブラリー/配列を、クラスター中のライブラリー/配列の総数と比較した。上記と類似の統計ツールを使用して、組織特異的遺伝子を同定した。組織の略語は癌組織と同一であるが、見出し「正常組織」と共に示す。
アルゴリズム−各試験組織Tおよび各試験クラスターについて、以下を試験した。
1.各クラスターは、組織T由来の少なくとも2つのライブラリーを含む。クラスター中の組織T由来の少なくとも3つのクローン(上記のように重み付けした)、および
2.組織T由来のクローンは、試験クラスターに関与する全クローンの少なくとも40%である。
数が統計的に有意であることをチェックするために、フィッシャーの正確確率検定のP値を、ライブラリーおよび重み付けしたクローンの両方について計算した。
実施例4:癌中で過剰発現しないクラスターの癌中で過剰発現したスプライスバリアントの同定
固有の領域を含む癌特異的スプライスバリアントを同定した。
スプライスバリアント中の固有の配列領域の同定
領域を、各スプライスバリアント中で共に常に出現するか出現しない隣接エクソン群と定義する。
「セグメント」(時折、「seg」または「ノード」という)は、公知のスプライシング内部(inside)を含まない最も短い隣接転写領域と定義する。
信頼できるESTのみを、領域およびセグメントの分析のために考慮した。以下の場合、ESTを、信頼できないと定義した。
(i)非スプライシング、
(ii)RNAによって対象とされないこと、
(iii)スプライシングESTによって対象とされないこと、および
(iv)長ポリAストレッチの近位のゲノムの末端部分または長ポリTストレッチの近位の開始部分(start)とのアラインメント。
さらなるスコアリングのために信頼できる領域を選択した。以下の場合、固有の配列領域を、信頼できると見なした。
(i)ゲノムとのアラインメント、および
(ii)2EST超に支持される領域。
アルゴリズム
各固有の配列領域により、転写物組を以下の2つの群に分ける。
(i)この領域を含む転写物(TA群)
(ii)この領域を含まない転写物(TB群)
各クラスターのESTクローン組を、以下の3つの群に分ける。
(i)群TAの転写物(に由来する)を支持するもの(S1)。
(ii)群TBの転写物を支持するもの(S2)。
(iii)両群由来の転写物を支持するもの(S3)。
上記のライブラリーおよびクローン数のスコアを、S1群に与えた。
フィッシャーの正確確率検定のP値を使用して、S2と比較してS1が癌ESTクローンによって有意に富化するかどうか、およびクラスターバックグラウンド(S1+S2+S3)と比較して、S1が癌ESTクローンによって有意に富化するかどうかをチェックした。
したがって、固有の配列領域の同定および転写物群の分割を図2に示す。これらの各固有の配列領域は、「ノード」とも呼ばれるセグメントに対応する。
領域1:全転写物に共通であり、それにより、変異型が検出されたと見なさない;領域2:転写物1に特異的;領域3:転写物2および3に特異的、領域4:転写物3に特異的、領域5:転写物1および2に特異的、領域6:転写物1に特異的。
実施例5:癌中で加除発現した遺伝子の癌特異的スプライスバリアントの同定
以下の遺伝子のEST支持(mRNAなし)領域の検索:
(i)公知の癌マーカー
(ii)公開されたマイクロアレイ実験において癌中で過剰発現することが示された遺伝子。
信頼できるEST支持領域を、最低でも以下の1つによって支持されると定義した。
(i)3つのスプライシングEST、
(ii)2ライブラリー由来の2つのスプライシングEST、
(iii)2ライブラリー由来の10個の非スプライシングEST、または
(iv)3つのライブラリー。
実際のマーカーの例
以下の例は、特定の実際のマーカーの例に関する。
実験例の項
この項は、これらの配列ならびに例示的な制限されない方法、アッセイ、およびその使用の例を含む実験を記載する実施例に関する。全実験で実施した研究の基礎として使用したので、材料と実験手順を最初に説明する。
本発明のマーカーを、種々の癌性および非癌性組織サンプルでのその発現に関して試験した。パネル中で使用したサンプルを、以下の表2に記載する。正常組織パネル中で使用したサンプルを、以下の表3に記載する。次いで、試験を、以下の「材料と実験手順」の項に記載のように行った。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
材料と実験手順
RNAの調製−RNAをClontech(Franklin Lakes,NJ USA 07417,www.clontech.com)、BioChain Inst.Inc.(Hayward,CA 94545 USA www.biochain.com)、ABS(Wilmington,DE 19801,USA,http://www.absbioreagents.com)、またはAmbion(Austin,TX 78744 USA,http://www.ambion.com)から得た。あるいは、RNAを、製造者の説明書にしたがって、TRI試薬(Molecular Research Center)を使用して、組織サンプルから生成した。組織およびRNAサンプルを、患者または死亡後に得た。総RNAサンプルを、DNアーゼI(Ambion)で処理し、RNeasyカラム(Qiagen)を使用して精製した。
RT−PCR−精製RNA(1μg)を、総体積が15.6μlで150ngのRandom Hexamerプライマー(Invitrogen)および500μM dNTPと混合した。混合物を、65℃で5分間インキュベートし、氷上で急速冷却した。その後、5μlの5×SuperscritpII第1鎖緩衝液(Invitrogen)、2.4μlの0.1M DTT、および40単位のRNasin(Promega)を添加し、混合物を、25℃で10分間インキュベートし、その後、42℃で2分間さらにインキュベートした。次いで、1μl(200単位)のSuperscritpII(Invitrogen)を添加し、反応物(最終体積は25μl)を、42℃で50分間インキュベートし、その後、70℃で15分間インキュベートした。得られたcDNAを、TE緩衝液(10mM Tris(pH=8)、1mM EDTA(pH=8))で20倍希釈した。
実時間RT−PCR分析−上記のように調製したcDNA(5μl)を、特異的プライマーおよびUNG酵素(Eurogentech、ABI、またはRoche)を使用したSYBR Green Iアッセイ(PE Applied Biosystems)を使用して実時間PCR反応におけるテンプレートとして使用した。以下のように増幅を行なった:50℃で2分間、95℃で10分間、その後、95℃で15秒間を40サイクル、その後、60℃で1分間。PE Applied BiosystemsSDS7000の使用によって検出を行った。反応物が蛍光の閾値レベル(Ct)を達成したサイクルを記録し、これを使用して、RT反応中の相対転写量を計算した。相対量を、式:Q=効率^−Ctを使用して計算した。PCR反応効率を、いくつかの逆転写(RT)反応の連続希釈物の使用によって作成した検量線から計算した。RT反応の固有の相違を最小にするために、得られた相対量を、いくつかのハウスキーピング(HSKP)遺伝子の相対量の相乗平均に正規化した。定量的実時間PCR分析の概要のまとめを、図3に示す。示されるように、x軸は、サイクル数を示す。C=閾値サイクル点(増幅曲線が実験で設定した蛍光閾値を交差するサイクルである)。この点は、PCR産物のシグナルがバックグラウンドレベル(受動的色素ROX)を超えるが、以前として幾何/対数期にある計算したサイクル数である。(示されるように、一旦蛍光レベルが測定閾値を交差すると、幾何学的増大期となり、その間の測定は最も正確であり、その後、直線期(linear phase)およびプラトー期となる;定量的測定のために、後者の2つの期からは正確に測定されない)。y軸は、正規化レポーター蛍光を示す。この分析型は相対的定量を行うことに留意すべきである。
試験パネル中の全実施例中で測定されたハウスキーピング遺伝子の配列は以下であった:
ユビキチン(GenBankアクセッション番号BC000449)
ユビキチン順方向プライマー(配列番号326):ATTTGGGTCGCGGTTCTTG
ユビキチン逆方向プライマー(配列番号327):TGCCTTGACATTCTCGATGGT
ユビキチン−アンプリコン(配列番号328)
ATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGACAATGCAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGG TTGAGCCCAGTGACACCATCGAGAATGTCAAGGCA

SDHA(GenBankアクセッション番号NM_004168)
SDHA順方向プライマー(配列番号329):TGGGAACAAGAGGGCATCTG
SDHA逆方向プライマー(配列番号330):CCACCACTGCATCAAATTCATG
SDHA−アンプリコン(配列番号331):TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG

PBGD(GenBankアクセッション番号BC019323),
PBGD順方向プライマー(配列番号332):TGAGAGTGATTCGCGTGGG
PBGD逆方向プライマー(配列番号333):CCAGGGTACGAGGCTTTCAAT
PBGD−アンプリコン(配列番号334):TGAGAGTGATTCGCGTGGGTACCCGCAAGAGCCAGCTTGCTCGCATACAGACGGACAGTGTGGTGGCAACATTGAAAGCCTCGTACCCTGG

HPRT1(GenBankアクセッション番号NM_000194),
HPRT1順方向プライマー(配列番号1295):TGACACTGGCAAAACAATGCA
HPRT1逆方向プライマー(配列番号1296):GGTCCTTTTCACCAGCAAGCT
HPRT1−アンプリコン(配列番号1297):TGACACTGGCAAAACAATGCAGACTTTGCTTTCCTTGGTCAGGCAGTATAATCCAAAGATGGTCAAGGTCGCAAGCTTGCTGGTGAAAAGGACC
正常組織サンプルにおける全実施例中で測定されたハウスキーピング遺伝子の配列は以下であった:

RPL19(GenBankアクセッション番号NM_000981),
RPL19順方向プライマー(配列番号1298):TGGCAAGAAGAAGGTCTGGTTAG
RPL19逆方向プライマー(配列番号1420):TGATCAGCCCATCTTTGATGAG
RPL19 –アンプリコン(配列番号1630):TGGCAAGAAGAAGGTCTGGTTAGACCCCAATGAGACCAATGAAATCGCCAATGCCAACTCCCGTCAGCAGATCCGGAAGCTCATCAAAGATGGGCTGATCA
TATAボックス(GenBankアクセッション番号NM_003194),
TATAボックス順方向プライマー(配列番号1631):CGGTTTGCTGCGGTAATCAT
TATAボックス逆方向プライマー(配列番号1632):TTTCTTGCTGCCAGTCTGGAC
TATAボックス–アンプリコン(配列番号1633):CGGTTTGCTGCGGTAATCATGAGGATAAGAGAGCCACGAACCACGGCACTGATTTTCAGTTCTGGGAAAATGGTGTGCACAGGAGCCAAGAGTGAAGAACAGTCCAGACTGGCAGCAAGAAA
ユビキチン(GenBankアクセッション番号BC000449)
ユビキチン順方向プライマー(配列番号326):ATTTGGGTCGCGGTTCTTG
ユビキチン逆方向プライマー(配列番号327):TGCCTTGACATTCTCGATGGT
ユビキチン−アンプリコン(配列番号328)
ATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGACAATGCAGATCTTCGTGAAGACTCTGACTGGTAAGACCATCACCCTCGAGG TTGAGCCCAGTGACACCATCGAGAATGTCAAGGCA
SDHA(GenBankアクセッション番号NM_004168)
SDHA順方向プライマー(配列番号329):TGGGAACAAGAGGGCATCTG
SDHA逆方向プライマー(配列番号330):CCACCACTGCATCAAATTCATG
SDHA−アンプリコン(配列番号331):TGGGAACAAGAGGGCATCTGCTAAAGTTTCAGATTCCATTTCTGCTCAGTATCCAGTAGTGGATCATGAATTTGATGCAGTGGTGG
オリゴヌクレオチドベースのマイクロアレイ実験プロトコール
マイクロアレイの構築
マイクロアレイ(チップ)を、BioRobotics Limited(Cambridge,UK)のMicroGrid II MGII 600ロボットを使用したピン沈着(deposition)によってプリントした。A.Shoshan et al,“Optical technologies and informatics”,Proceedings of SPIE.Vol 4266,pp.86−95(2001)に記載のように、50量体のオリゴヌクレオチド標的配列を、Compugen Ltd(Tel−Aviv,IL)によってデザインした。デザインしたオリゴヌクレオチドを合成し、Sigma−Genosysシステム(The Woodlands,TX,US)を使用した脱塩によって精製し、全てのオリゴヌクレオチドを、5’末端でC6アミノ修飾リンカーに連結するか、CodeLinkスライド(Cat #25−6700−01 Amersham Bioscience,Piscataway,NJ,US)に直接付着させる。標的配列を形成する50量体のオリゴヌクレオチドを、最初に、Ultra−pure DDW(Cat # 01−866−1A Kibbutz Beit−Haemek,Israel)中に50μMの濃度まで懸濁した。スライドへのプリント前に、オリゴヌクレオチドを、300mMリン酸ナトリウム(pH 8.5)に最終濃度150mMまで再懸濁し、相対湿度35〜40%、21℃でプリントした。
各スライドは、32個のサブアレイ中に全部で9792個のフィーチャーを含んでいた。4224個のフィーチャーは、2つずつプリントされた本発明の目的の配列および負のコントロールであった。さらなる288このフィーチャー(3つずつプリントした96個の標的配列)は、Human Evaluation Library2,Compugen Ltd,Israelのハウスキーピング遺伝子を含んでいた。別の384個のフィーチャーは、Array Control product(Array control− sense oligo spots,Ambion Inc. Austin,TX.Cat#1781,Lot #112K06)で市販されている大腸菌遺伝子のオリゴである大腸菌スパイク1〜6である。
プリントしたスライドのカップリング後プロセシング
ガラス(CodeLink)スライドへのオリゴヌクレオチドのスポッティング後、スライドを、密封NaCl湿室(相対湿度70〜75%)中で24時間インキュベートした。
スライドを、残存反応基のブロッキングのために、スライドの50℃のブロッキング溶液(0.1M Tris、50mMエタノールアミン、0.1%SDSを含む10ml/スライドの緩衝液)中で15分間のインキュベーションによって処理した。次いで、スライドを、Ultra−pure DDW(2回蒸留水)で2回リンスした。次いで、スライドを、50℃の洗浄液(10ml/スライド、4×SSC、0.1%SDS)で30分間震盪器上で洗浄した。次いで、スライドを、Ultra−pure DDWで2回リンスし、800rpmで3分間の遠心分離によって乾燥させた。
次に、ハイブリッド形成プロトコールの自動操作を補助するために、スライドを、VentanaDiscoveryハイブリッド形成ステーションバーコード接着剤で処理した。プリントしたスライドを、Bio−Optica(Milan,Italy)血液(hematology)染色デバイスにロードし、50mlの3−アミノプロピルトリエトキシシラン(Sigma A3648 lot #122K589)中で10分間インキュベートした。過剰な液体を乾燥させ、スライドを、20mm/Hgの暗所減圧デシケーター(Pelco 2251,Ted Pella,Inc.Redding CA)中で3時間インキュベートした。
マイクロアレイ実験を行うために、Ventana Discovery HybStation™でのミニ溶離カラムを使用するGenisphere 900−RP(ランダムプライマー)を使用した以下のプロトコールに従った。簡単に述べれば、デバイス自体が提供する説明書および情報に関して記載のようにプロトコールを行った。プロトコールは、cDNA合成および標識を含んでいた。cDNA濃度を、OliGreen ssDNA定量試薬およびキットとともに使用するTBS−380(Turner Biosystems.Sunnyvale,CA.)PicoFlourを使用して測定した。
提供されたプロトコール(Discovery Hybridization Station Tuscon AZ)に従って、Ventanaハイブリッド形成デバイスを使用してハイブリッド形成を行った。
次いで、スライドを、Axon Instruments Inc のGenePix 4000Bデュアルレーザースキャナを使用してスキャンし、GenePix Pro 5.0ソフトウェアによって分析した。
オリゴヌクレオチドベースのマイクロアレイ作製および実験の流れの概要のまとめを、図4および5に示す。
簡単に述べれば、図4に示すように、15μMのDNAオリゴヌクレオチドを、Amersham’CodeLink’ガラススライド上に沈着(プリント)し、十分に輪郭を示す「スポット」を作製した。これらのスライドを、調査疎水性ポリマー化学物質(chemistry)で被覆し、C6−アミン修飾を介してDNAオリゴヌクレオチドの5’末端に共有結合する活性な3次元表面を作製する。この結合により、全長DNAオリゴヌクレオチドをcDNAとのハイブリッド形成に利用可能であり、より低いバックグラウンド、高感度、および再現性も得られることを確実にする。
図5は、マイクロアレイ実験の実施方法を示す。左側および右側のステージを、任意選択的に、ステージ4(ハイブリッド形成)まで任意の順序(並行を含む)で行うことができることに留意すべきである。簡単に述べれば、左側では、標的オリゴヌクレオチドを顕微鏡用のガラススライド(任意選択的に他の材料を使用することができる)上にスポッティングしてスポッティングスライドを形成する(ステージ1)。右側では、コントロールサンプルRNAおよび癌サンプルRNAを、それぞれCy3およびCy5標識して(ステージ2)、標識プローブを形成する。コントロールおよび癌サンプルは、対応する組織に由来する(例えば、正常な前立腺組織および癌性前立腺組織)ことに留意すべきである。さらに、RNAが採取された組織を、以下の「チップ」(マイクロアレイ)からのオリゴヌクレオチドの過剰発現に関する特定のクラスターについてのデータの特定の例に示す(例えば、癌性前立腺組織および正常組織を上記のように試験したチップについては「前立腺」)。ステージ3では、プローブを混合する。ステージ4では、ハイブリッド形成を行って、プロセシングしたスライドを形成する。ステージ5では、スライドを洗浄し、スキャンして画像ファイルを作成し、その後、ステージ6でデータを分析した。
以下のクラスターが、肺癌で過剰発現することが見出された。
W60282_PEA_1
F05068_PEA_1
H38804_PEA_1
HSENA78
T39971
(R00299)
H14624
Z41644_PEA_1
Z25299_PEA_2
HSSTROL3
HUMTREFAC_PEA_2
HSS100PCB
HSU33147_PEA_1
HUMCA1XIA
H61775
HUMGRP5E
HUMODCA
AA161187
R66178
D56406_PEA_1
M85491_PEA_1
Z21368_PEA_1
HUMCA1XIA
R20779
R38144_PEA_2
Z44808_PEA_1
HUMOSTRO_PEA_1_PEA_1
R11723_PEA_3
AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1
R16276_PEA_1
以下のクラスターが、肺小細胞癌で過剰発現することが見出された。

H61775
HUMGRP5E
M85491_PEA_1
Z44808_PEA_1
AA161187
R66178
HUMPHOSLIP_PEA_2

AI076020
T23580
M79217_PEA_1
M62096_PEA_1
M78076_PEA_1
T99080_PEA_4
T08446_PEA_1

以下のクラスターが、肺腺癌で過剰発現することが見出された。
R00299
M85491_PEA_1
Z21368_PEA_1
HUMCA1XIA
AA161187
R66178
T11628_PEA_1
以下のクラスターが、肺扁平上皮細胞で過剰発現することが見出された。
HUMODCA
R00299
D56406_PEA_1
Z44808_PEA_1
Z21368_PEA_1
HUMCA1XIA
AA161187
R66178
HUMCEA_PEA_1
R35137_PEA_1_PEA_1_PEA_1
クラスターH61775についての説明
クラスターH61775は、目的の2つの転写物および6つのセグメントを特徴とし、その名称を、それぞれ表4および5に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表6に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
クラスターH61775を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図6のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図6および表7中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):脳悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、コンティグH61775は、上記の表3に示した2つの転写物を特徴とする。本発明の各変異タンパク質の説明を、ここに示す。
本発明の変異タンパク質H61775_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物H61775_T21によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
H61775_P16とQ9P2J2(配列番号1694)との比較の報告
1.Q9P2J2のアミノ酸11〜93に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチド。
2.H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチド。
H61775_P16とAAQ88495(配列番号1695)との比較の報告
1.AAQ88495のアミノ酸1〜83に対応し、H61775_P16のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列と、H61775_P16のアミノ酸84〜152に対応する配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H61775_P16をコードする単離キメラポリペプチド。
2.H61775_P16中の配列DCGFPAFRELKRAETVSPVFFTRRCIWEDLKSTGFSPAGGGRPPGGGPRTQEDSGLPCWRSSCSVTLQVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H61775_P16のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質H61775_P16はまた、表9に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質H61775_P16は、以下の転写物によってコードされる:H61775_T21(配列は出願書類の最後に示す)。転写物H61775_T21のコード部分を太字で示し、このコード部分は261位から開始され、716位で終結する。転写物はまた、表10に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質H61775_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物H61775_T22によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
H61775_P17とQ9P2J2との比較の報告
1.Q9P2J2のアミノ酸11〜93に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチド。
H61775_P17とAAQ88495との比較の報告
1.AAQ88495のアミノ酸1〜83に対応し、H61775_P17のアミノ酸1〜83にも対応するMVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRPPLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVGと少なくとも90%相同な第1のアミノ酸配列を含む、H61775_P17をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質H61775_P17はまた、表11に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質H61775_P17は、以下の転写物によってコードされる:H61775_T22(配列は出願書類の最後に示す)。転写物H61775_T22のコード部分を太字で示し、このコード部分は261位から開始され、509位で終結する。転写物はまた、表12に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H61775_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターH61775は、上の表4に列挙した6つのセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターH61775_node_2は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21およびH61775_T22。以下の表13は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH61775_node_4は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21およびH61775_T22。以下の表14は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH61775_node_6は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T22。以下の表15は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH61775_node_8は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21。以下の表16は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターH61775_node_0は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H61775_T21およびH61775_T22。以下の表17は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH61775_node_5を、以下の転写物中に見出すことができる:H61775_T22。以下の表18は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、この遺伝子のマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表19に示す)。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/Psw0RJLCti/aLAXQjXh07:Q9P2J2

Sequence documentation:

Alignment of: H61775_P16 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
11 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 60
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93






Sequence name: /tmp/Psw0RJLCti/aLAXQjXh07:AAQ88495

Sequence documentation:

Alignment of: H61775_P16 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83






Sequence name: /tmp/naab8yR3GC/pSM4l2IL5o:Q9P2J2

Sequence documentation:

Alignment of: H61775_P17 x Q9P2J2 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
11 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 60
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
61 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 93






Sequence name: /tmp/naab8yR3GC/pSM4l2IL5o:AAQ88495

Sequence documentation:

Alignment of: H61775_P17 x AAQ88495 ..

Alignment segment 1/1:

Quality: 803.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MVWCLGLAVLSLVISQGADGRGKPEVVSVVGRAGESVVLGCDLLPPAGRP 50
. . .
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83
|||||||||||||||||||||||||||||||||
51 PLHVIEWLRFGFLLPIFIQFGLYSPRIDPDYVG 83

正常および癌性肺組織における配列名H61775seg8中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9のH61775転写物の発現
seg8、H61775seg8アンプリコン(配列番号1636)、およびH61775seg8F2(配列番号1634)、およびH61775seg8R2(配列番号1635)プライマーによって検出可能な免疫グロブリンスーパーファミリーメンバー9の転写物を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子–PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン(配列番号334)、プライマーの配列番号332および333)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン– HPRT1−アンプリコン(配列番号1297)、プライマーの配列番号1295および1296)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン– ユビキチン−アンプリコン(配列番号328)、プライマーの配列番号326および327)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン– SDHA−アンプリコン(配列番号331)、プライマーの配列番号329および330)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図7は、正常サンプルと比較した癌性肺サンプルにおける上記免疫グロブリンスーパーファミリーメンバー9の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも5倍の過剰発現を示すサンプルの数および比率を、下に示す。
図7から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち11個、16個の扁平上皮細胞癌サンプルのうち12個、4個の大細胞癌サンプルのうち1個、8個の小細胞癌サンプルのうち8個で少なくとも5倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9転写物の発現レベルの相違についてのP値を、T検定によって6.5E−02と決定された。腺癌では、最小値は、扁平上皮細胞癌で7.62E−03であり、小細胞癌で1.5E−03であった。
5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、P値は、腺癌で9.62E−04、扁平上皮細胞癌で5.9E−04であり、10倍過剰発現の閾値は、小細胞癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は7.14E−05であった。上記値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:H61775seg8F2順方向プライマーおよびH61775seg8R2逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:H61775seg8。
H61775seg8F2(配列番号1634)
GAAGGCTCTTGTCACTTACTAGCCAT
H61775seg8R2(配列番号1635)
TGTCACCATATTTAATCCTCCCAA
H61775seg8(配列番号1636)
GAAGGCTCTTGTCACTTACTAGCCATGTGATTTTGGAAAGAAACTTAACATTAATTCCTTCAGCTACAATGGAATTCTTGGGAGGATTAAATATGGTGACA
異なる正常組織における配列名H61775seg8中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9のH61775転写物の発現
H61775seg8アンプリコン(配列番号1636)、H61775 seg8F2(配列番号1634)、およびH61775seg8R2(配列番号1635)によって検出可能な免疫グロブリンスーパーファミリーメンバー9の転写物を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19 アンプリコン(配列番号1630))、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン(配列番号1633))、ユビキチン(GenBankアクセッション番号BC000449;アンプリコン–ユビキチン−アンプリコン(配列番号328))、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン–SDHA−アンプリコン(配列番号331))を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表4、「正常パネル中の組織サンプル」)の量の中央値で割って、卵巣サンプルに対する各サンプルの相対発現値を得た。
H61775seg8F2(配列番号1634)
GAAGGCTCTTGTCACTTACTAGCCAT
H61775seg8R2(配列番号1635)
TGTCACCATATTTAATCCTCCCAA
H61775seg8(配列番号1636)
GAAGGCTCTTGTCACTTACTAGCCATGTGATTTTGGAAAGAAACTTAACATTAATTCCTTCAGCTACAATGGAATTCTTGGGAGGATTAAATATGGTGACA
結果を図8に示し、これは、異なる正常組織における配列名H61775seg8中に示すアンプリコンによって検出可能な免疫グロブリンスーパーファミリーメンバー9のH61775転写物の発現を示す。
クラスターM85491の説明
クラスターM85491は、目的の2つの転写物および11個のセグメントを特徴とし、その名称を、それぞれ表20および21に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表22に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質EphrinB型受容体2(前駆体)(SwissProtアクセッション識別子EPB2_HUMAN、同義語EC 2.7.1.112、チロシン−タンパク質キナーゼ受容体EPH−3、DRT、受容体タンパク質−チロシンキナーゼHEK5、ERKとしても公知である)(配列番号1417)の変異型である。
タンパク質EphrinB型受容体2(前駆体)は、以下の機能を有することが公知であるか、そのように見なされている:ephrin−Bファミリーメンバーの受容体。タンパク質EphrinB型受容体2(前駆体)の配列を、「タンパク質EphrinB型受容体2(前駆体)アミノ酸配列」(配列番号1417)として出願書類の最後に示す。この配列の公知の多型を、表23に示す。
Figure 2008507261
局在化したタンパク質EphrinB型受容体2(前駆体)は、I型膜タンパク質と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるタンパク質アミノ酸リン酸化、膜貫通受容体タンパク質チロシンキナーゼシグナル伝達経路、ニューロン新生、分子機能に関連する注釈付けであるタンパク質チロシンキナーゼ、受容体、膜貫通エフリン受容体、ATP結合、トランスフェラーゼ、および細胞成分に関連する注釈付けである内在性膜タンパク質。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターM85491を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図9のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図9および表24中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、クラスターM85491は、上の表20に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質EphrinB型受容体2(前駆体)の変異型であるタンパク質をコードする。本発明の各変異型の説明をここに記載する。
本発明の変異タンパク質M85491_PEA_1_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物M85491_PEA_1_T16によってコードされる。公知のタンパク質(EphrinB型受容体2(前駆体))に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M85491_PEA_1_P13とEPB2_HUMANとの間の比較の報告
1.EPB2_HUMANのアミノ酸1〜476に対応し、M85491_PEA_1_P13のアミノ酸1〜476にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGATNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDSGGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLAHTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVDSITLSWSQPDQPNGVILDYELQYYEKと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P13のアミノ酸477〜496に対応する配列VPIGWVLSPSPTSLRAPLPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P13をコードする単離キメラポリペプチド。
2.M85491_PEA_1_P13中の配列VPIGWVLSPSPTSLRAPLPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M85491_PEA_1_P13のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M85491_PEA_1_P13は、以下の転写物によってコードされる:M85491_PEA_1_T16(配列は出願書類の最後に示す)。転写物M85491_PEA_1_T16のコード部分を太字で示し、このコード部分は143位から開始され、1630位で終結する。転写物はまた、表26に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M85491_PEA_1_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M85491_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物M85491_PEA_1_T20によってコードされる。公知のタンパク質(EphrinB型受容体2(前駆体))に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M85491_PEA_1_P14とEPB2_HUMANとの間の比較の報告
1.EPB2_HUMANのアミノ酸1〜270に対応し、M85491_PEA_1_P14のアミノ酸1〜270にも対応するMALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYDENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSIPSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQVDLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRIIQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVPIGRCMCKAGFEAVENGTVCRと少なくとも90%相同な第1のアミノ酸配列と、M85491_PEA_1_P14のアミノ酸271〜301に対応する配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、M85491_PEA_1_P14をコードする単離キメラポリペプチド。
2.M85491_PEA_1_P14中の配列ERQDLTMLSRLVLNSWPQMILPPQPPKVLELと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M85491_PEA_1_P14のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M85491_PEA_1_P14は、以下の転写物によってコードされる:M85491_PEA_1_T20(配列は出願書類の最後に示す)。転写物M85491_PEA_1_T20のコード部分を太字で示し、このコード部分は143位から開始され、1045位で終結する。転写物はまた、表27に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M85491_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターM85491は、上の表21に列挙した11個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターM85491_PEA_1_node_0は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表28は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_13は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T20。以下の表29は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_21は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表30は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_23は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表31は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_24は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表32は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_8は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表33は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表34に示す)。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_9は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表35は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターM85491_PEA_1_node_10は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表36は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_18は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表37は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_19は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16。以下の表38は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM85491_PEA_1_node_6は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M85491_PEA_1_T16およびM85491_PEA_1_T20。以下の表39は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/qfmsU9VtxS/DylcLC9j8v:EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P13 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 4726.00 Escore: 0
Matching length: 476 Total length: 476
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. . . . .
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCRGCPSGTFKANQGDEACTHCPINSRTTSEGA 300
. . . . .
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TNCVCRNGYYRADLDPLDMPCTTIPSAPQAVISSVNETSLMLEWTPPRDS 350
. . . . .
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 GGREDLVYNIICKSCGSGRGACTRCGDNVQYAPRQLGLTEPRIYISDLLA 400
. . . . .
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 HTQYTFEIQAVNGVTDQSPFSPQFASVNITTNQAAPSAVSIMHQVSRTVD 450
. .
451 SITLSWSQPDQPNGVILDYELQYYEK 476
||||||||||||||||||||||||||
451 SITLSWSQPDQPNGVILDYELQYYEK 476






Sequence name: /tmp/rmnzuDbot6/GiHbjeU8iR:EPB2_HUMAN

Sequence documentation:

Alignment of: M85491_PEA_1_P14 x EPB2_HUMAN ..

Alignment segment 1/1:

Quality: 2673.00 Escore: 0
Matching length: 270 Total length: 270
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALRRLGAALLLLPLLAAVEETLMDSTTATAELGWMVHPPSGWEEVSGYD 50
. . . . .
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 ENMNTIRTYQVCNVFESSQNNWLRTKFIRRRGAHRIHVEMKFSVRDCSSI 100
. . . . .
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PSVPGSCKETFNLYYYEADFDSATKTFPNWMENPWVKVDTIAADESFSQV 150
. . . . .
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 DLGGRVMKINTEVRSFGPVSRSGFYLAFQDYGGCMSLIAVRVFYRKCPRI 200
. . . . .
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IQNGAIFQETLSGAESTSLVAARGSCIANAEEVDVPIKLYCNGDGEWLVP 250
. .
251 IGRCMCKAGFEAVENGTVCR 270
||||||||||||||||||||
251 IGRCMCKAGFEAVENGTVCR 270


正常および癌性肺組織における配列名M85491seg24中に示すアンプリコンによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)M8549転写物の発現
seg24、M85491seg24アンプリコン(配列番号1639)、M85491seg24F(配列番号1637)、およびM85491seg24R(配列番号1638)プライマーによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
以下の図10は、正常サンプルと比較した癌性肺サンプルにおける上記のエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。試験した全サンプル数のうちの少なくとも3倍の過剰発現を示すサンプルの数および比率を下に示す。
図10から明らかなように、上記アンプリコン癌サンプルによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち9個および8個の小細胞癌サンプルのうち4個で少なくとも3倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析に適用した。
3倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で7.42E−03、小細胞癌で5.69E−02であった。上記値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:M85491seg24F順方向プライマーおよびM85491seg24R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:M85491seg24。
M85491seg24F(配列番号1637)−GGCGTCTTTCTCCCTCTGAAC
M85491seg24R(配列番号1638)−GTCCCATTCTGGGTGCTGTG
M85491seg24(配列番号1639)–GGCGTCTTTCTCCCTCTGAACCTCAGTTTCCACCTGTGTCGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAGAAAAGGCAGCACAGCACCCAGAATGGGAC
異なる正常組織における配列名M85491seg24中に示すアンプリコンによって検出可能なエフリンB型受容体2前駆体(EC2.7.1.112)(チロシン−タンパク質キナーゼ受容体EPH−3)M8549転写物の発現
M85491seg24アンプリコン(配列番号1639)、M85491seg24F(配列番号1637)、およびM85491seg24R(配列番号1638)によって検出可能なエフリンB型受容体2前駆体転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン,配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表2、「正常パネル中の組織サンプル」)の量の中央値で割って、肺サンプルに対する各サンプルの相対発現値を得た。
M85491seg24F(配列番号1637)−GGCGTCTTTCTCCCTCTGAAC
M85491seg24R(配列番号1638)−GTCCCATTCTGGGTGCTGTG
M85491seg24(配列番号1639)–GGCGTCTTTCTCCCTCTGAACCTCAGTTTCCACCTGTGTCGAGTGTGGGTGAGACCCCTCGCGGGGAGCTATGCAGGTTACGGAGAAAAGGCAGCACAGCACCCAGAATGGGAC
図11に示す結果は、異なる正常組織における配列名M85491seg24中に示された、アンプリコンによって検出可能なエフリンB型受容体2前駆体(チロシン−タンパク質キナーゼ受容体EPH−3)M85491転写物の発現を示す。
クラスターT39971の説明
クラスターT39971は、目的の4つの転写物および28個のセグメントを特徴とし、その名称を、それぞれ表40および41に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表42に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるビトロネクチン前駆体(SwissProtアクセッション識別子VTNC_HUMAN、同義語血清核酸因子;S−タンパク質;V75としても公知である)(配列番号1418)の変異型である。
タンパク質ビトロネクチン前駆体は、以下の機能を有することが公知であるか、そのように見なされている:ビトロネクチンは、血清および組織で見出される細胞接着および核酸因子である。ビトロネクチンは、グリコサミノグリカンおよびプロテオグリカンと相互作用する。インテグリンファミリーの一定のメンバーによって認識されて、細胞−基質接着分子としての機能を果たす。末端細胞溶解性補体経路の膜障害効果のインヒビター。タンパク質ビトロネクチン前駆体の配列を、「ビトロネクチン前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表4に示す。
Figure 2008507261
タンパク質ビトロネクチン前駆体の局在化は、細胞外と考えられる。
以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:癌、黒色腫。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:αβ3インテグリンアンタゴニスト、アポトーシスアゴニスト。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(抗癌薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである免疫応答、細胞接着、分子機能に関連する注釈付けであるタンパク質結合、ヘパリン結合、および細胞成分に関連する注釈付けである細胞外空間。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターT39971を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図12のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図12および表44中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肝臓癌、肺悪性腫瘍、および膵臓癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターT39971は、上の表40に列挙した4つの転写物を特徴とする。これらの転写物は、ビトロネクチン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質T39971_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T5によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T39971_P6とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜276に対応し、T39971_P6のアミノ酸1〜276にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGと少なくとも90%相同な第1のアミノ酸配列と、T39971_P6のアミノ酸277〜283に対応する配列TQGVVGDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P6をコードする単離キメラポリペプチド。
2.T39971_P6中の配列TQGVVGDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P6のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T39971_P6はまた、表46に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T39971_P6は、以下の転写物によってコードされる:T39971_T5(配列は出願書類の最後に示す)。転写物T39971_T5のコード部分を太字で示し、このコード部分は756位から開始され、1604位で終結する。転写物はまた、表47に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質T39971_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T10によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T39971_P9とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜325に対応し、T39971_P9のアミノ酸1〜325にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸357〜478に対応し、T39971_P9のアミノ酸326〜447にも対応するSGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRATWLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P9をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTSを含み、以下の構造:アミノ酸番号325−x〜325のいずれかから始まり、アミノ酸番号326+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P9の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T39971_P9はまた、表48に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T39971_P9は、以下の転写物によってコードされる:T39971_T10(配列は出願書類の最後に示す)。転写物T39971_T10のコード部分を太字で示し、このコード部分は756位から開始され、2096位で終結する。転写物はまた、表49に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質T39971_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T12によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T39971_P11とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、VTNC_HUMANのアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチド。
T39971_P11とQ9BSH7(配列番号1696)との間の比較の報告
1.Q9BSH7のアミノ酸1〜326に対応し、T39971_P11のアミノ酸1〜326にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGIPDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSAVFEHFAMMQRDSWEDIFELLFWGRTSと少なくとも90%相同な第1のアミノ酸配列と、Q9BSH7のアミノ酸442〜478に対応し、T39971_P11のアミノ酸327〜363にも対応するDKYYRVNLRTRRVDTVDPPYPRSIAQYWLGCPAPGHLと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P11をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がSDを含み、以下の構造:アミノ酸番号326−x〜326のいずれかから始まり、アミノ酸番号327+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、T39971_P11の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T39971_P11はまた、表50に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T39971_P11は、以下の転写物によってコードされる:T39971_T12(配列は出願書類の最後に示す)。転写物T39971_T12のコード部分を太字で示し、このコード部分は756位から開始され、1844位で終結する。転写物はまた、表51に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T39971_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物T39971_T16によってコードされる。公知のタンパク質(ビトロネクチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T39971_P12とVTNC_HUMANとの間の比較の報告
1.VTNC_HUMANのアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチド。
2.T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチド。
T39971_P12とQ9BSH7との間の比較の報告
1.Q9BSH7のアミノ酸1〜223に対応し、T39971_P12のアミノ酸1〜223にも対応するMAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSCCTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTSDLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPPAEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVWGIEGPIDAAFTRINCQGKTYLFKと少なくとも90%相同な第1のアミノ酸配列と、T39971_P12のアミノ酸224〜238に対応する配列VPGAVGQGRKHLGRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、T39971_P12をコードする単離キメラポリペプチド。
2.T39971_P12中の配列VPGAVGQGRKHLGRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T39971_P12のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T39971_P12はまた、表52に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T39971_P12は、以下の転写物によってコードされる:T39971_T16(配列は出願書類の最後に示す)。転写物T39971_T16のコード部分を太字で示し、このコード部分は756位から開始され、1469位で終結する。転写物はまた、表53に列挙した以下のSNPを有する(ヌクレオチド酸配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T39971_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターT39971は、上の表41に列挙した28個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターT39971_node_0は、76個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表54は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_18は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T16。以下の表55は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_21は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表56は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_22は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T5。以下の表57は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_23は、101個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表58は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_31は、94個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表59は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_33は、77個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表60は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_7は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表61は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターT39971_node_1を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表62は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_10は、77個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表63は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_11は、79個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表64は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_12を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表65は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_15は、79個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表66は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_16を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表67は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_17は、86個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表68は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_26は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T5。以下の表69は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_27は、90個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T5。以下の表70は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_28を、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表71は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_29は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表72は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_3は、78個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表73は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_30を、以下の転写物中に見出すことができる:T39971_T10およびT39971_T5。以下の表74は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_34を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表75は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_35を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表76は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_36は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、およびT39971_T5。以下の表77は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_4を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表78は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_5は、80個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表79は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_8を、以下の転写物中に見出すことができる:T39971_T10、T39971_T16、およびT39971_T5。以下の表80は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT39971_node_9を、以下の転写物中に見出すことができる:T39971_T10、T39971_T12、T39971_T16、およびT39971_T5。以下の表81は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/xkraCL2OcZ/43L7YcPH7x:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P6 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2774.00 Escore: 0
Matching length: 278 Total length: 278
Matching Percent Similarity: 99.64 Matching Percent Identity: 99.64
Total Percent Similarity: 99.64 Total Percent Identity: 99.64
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. .
251 PDNVDAALALPAHSYSGRERVYFFKGTQ 278
|||||||||||||||||||||||||| |
251 PDNVDAALALPAHSYSGRERVYFFKGKQ 278






Sequence name: /tmp/X4DeeuSlB4/yMubSR5FPs:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P9 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 4430.00 Escore: 0
Matching length: 447 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 93.51 Total Percent Identity: 93.51
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRT......................... 325
|||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 ......SGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 369
||||||||||||||||||||||||||||||||||||||||||||
351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
370 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 419
||||||||||||||||||||||||||||||||||||||||||||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
420 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 447
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: /tmp/jvp1VtnxNy/wxNSeFVZZw:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P11 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAT 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: /tmp/jvp1VtnxNy/wxNSeFVZZw:Q9BSH7

Sequence documentation:

Alignment of: T39971_P11 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 3576.00 Escore: 0
Matching length: 363 Total length: 478
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 75.94 Total Percent Identity: 75.94
Gaps: 1

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. . . . .
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFKGSQYWRFEDGVLDPDYPRNISDGFDGI 250
. . . . .
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 PDNVDAALALPAHSYSGRERVYFFKGKQYWEYQFQHQPSQEECEGSSLSA 300
. . . . .
301 VFEHFAMMQRDSWEDIFELLFWGRTS........................ 326
||||||||||||||||||||||||||
301 VFEHFAMMQRDSWEDIFELLFWGRTSAGTRQPQFISRDWHGVPGQVDAAM 350
. . . . .
326 .................................................. 326

351 AGRIYISGMAPRPSLAKKQRFRHRNRKGYRSQRGHSRGRNQNSRRPSRAM 400
. . . . .
327 .........................................DKYYRVNLR 335
|||||||||
401 WLSLFSSEESNLGANNYDDYRMDWLVPATCEPIQSVFFFSGDKYYRVNLR 450
. .
336 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 363
||||||||||||||||||||||||||||
451 TRRVDTVDPPYPRSIAQYWLGCPAPGHL 478






Sequence name: /tmp/fgebv7ir4i/48bTBMziJ0:VTNC_HUMAN

Sequence documentation:

Alignment of: T39971_P12 x VTNC_HUMAN ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223






Sequence name: /tmp/fgebv7ir4i/48bTBMziJ0:Q9BSH7

Sequence documentation:

Alignment of: T39971_P12 x Q9BSH7 ..

Alignment segment 1/1:

Quality: 2237.00 Escore: 0
Matching length: 223 Total length: 223
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPLRPLLILALLAWVALADQESCKGRCTEGFNVDKKCQCDELCSYYQSC 50
. . . . .
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CTDYTAECKPQVTRGDVFTMPEDEYTVYDDGEEKNNATVHEQVGGPSLTS 100
. . . . .
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 DLQAQSKGNPEQTPVLKPEEEAPAPEVGASKPEGIDSRPETLHPGRPQPP 150
. . . . .
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 AEEELCSGKPFDAFTDLKNGSLFAFRGQYCYELDEKAVRPGYPKLIRDVW 200
. .
201 GIEGPIDAAFTRINCQGKTYLFK 223
|||||||||||||||||||||||
201 GIEGPIDAAFTRINCQGKTYLFK 223



クラスターZ21368の説明
クラスターZ21368は、目的の7つの転写物および34個のセグメントを特徴とし、その名称を、それぞれ表82および83に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表84に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である細胞外スルファターゼSulf−1前駆体(SwissProtアクセッション識別子SUL1_HUMAN、同義語はEC3.1.6−、HSulf−1としても公知である)(配列番号1419)の変異型である。
タンパク質細胞外スルファターゼSulf−1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:アリールスルファターゼ活性および高度に特異的なエンドグルコサミン−6−スルファターゼ活性を示す。これは、インタクトなヘパリンの特定の小区域内のグルコサミンのC−6位から硫酸塩を除去することができる。HSPG(ヘパラン硫酸プロテオグリカン)硫酸化を減少させ、ヘパリン依存性成長因子によるシグナル伝達を阻害し、増殖を減少させ、外因性刺激に対する応答のアポトーシスを容易にする。細胞外スルファターゼSulf−1前駆体の配列を、「細胞外スルファターゼSulf−1前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表85に示す。
Figure 2008507261
タンパク質細胞外スルファターゼSulf−1前駆体の局在化は、小胞体およびゴルジ層板と考えられる。細胞表面上にも局在化している(類似性による)。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるアポトーシス、代謝、ヘパラン硫酸プロテオグリカン代謝、分子機能に関連する注釈付けであるアリールスルファターゼ、ヒドロラーゼ、および細胞成分に関連する注釈付けである細胞外空間、小胞体、ゴルジ層板。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターZ21368を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図13のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図13および表86中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターZ21368は、上の表1に列挙した7つの転写物を特徴とする。これらの転写物は、タンパク質細胞外スルファターゼSulf−1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質Z21368_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T5によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z21368_PEA_1_P2とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜761に対応し、Z21368_PEA_1_P2のアミノ酸1〜761にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P2のアミノ酸762〜790に対応する配列PHKYSAHGRTRHFESATRTTNGAQKLSRIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P2をコードする単離キメラポリペプチド。
2.Z21368_PEA_1_P2中の配列PHKYSAHGRTRHFESATRTTNGAQKLSRIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P2のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z21368_PEA_1_P2は、以下の転写物によってコードされる:Z21368_PEA_1_T5(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T5のコード部分を太字で示し、このコード部分は529位から開始され、2898位で終結する。
本発明の変異タンパク質Z21368_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T9によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z21368_PEA_1_P5とQ7Z2W2(配列番号1697)との比較の報告
1.Q7Z2W2のアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、Aを含む第2の架橋アミノ酸配列と、Q7Z2W2のアミノ酸139〜871に対応し、Z21368_PEA_1_P5のアミノ酸59〜791にも対応するFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAFを含み、以下の構造(Z21368_PEA_1_P5に対応する番号付け):アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号59+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z21368_PEA_1_P5の縁部分をコードする単離ポリペプチド。
Z21368_PEA_1_P5とAAH12997(配列番号1698)との比較の報告
1.Z21368_PEA_1_P5のアミノ酸1〜751に対応する配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH12997のアミノ酸1〜40に対応し、Z21368_PEA_1_P5のアミノ酸752〜791にも対応するLRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチド。
2.Z21368_PEA_1_P5の配列MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P5の先端をコードする単離ポリペプチド。
Z21368_PEA_1_P5とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜57に対応し、Z21368_PEA_1_P5のアミノ酸1〜57にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELと少なくとも90%相同な第1のアミノ酸配列と、SUL1_HUMANのアミノ酸138〜871に対応し、Z21368_PEA_1_P5のアミノ酸58〜791にも対応するAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARYQTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDKDKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEFEGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLADSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEIEALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLHPFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHDNNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEYFDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P5をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がLAを含み、以下の構造:アミノ酸番号57−x〜57のいずれかから始まり、アミノ酸番号58+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z21368_PEA_1_T5の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z21368_PEA_1_P5は、以下の転写物によってコードされる:Z21368_PEA_1_T9(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T9のコード部分を太字で示し、このコード部分は556位から開始され、2928位で終結する。
本発明の変異タンパク質Z21368_PEA_1_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T23によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z21368_PEA_1_P15とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜416に対応し、Z21368_PEA_1_P15のアミノ酸1〜416にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRTNKKAKIWRDTFLVERGと少なくとも90%相同な第1のアミノ酸配列を含む、Z21368_PEA_1_P15をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z21368_PEA_1_P15は、以下の転写物によってコードされる:Z21368_PEA_1_T23(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T23のコード部分を太字で示し、このコード部分は691位から開始され、1938位で終結する。
本発明の変異タンパク質Z21368_PEA_1_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T24によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z21368_PEA_1_P16とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜397に対応し、Z21368_PEA_1_P16のアミノ酸1〜397にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESINYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYNYAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNMLVETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVEPGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P16のアミノ酸398〜410に対応する配列CVIVPPLSQPQIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P16をコードする単離キメラポリペプチド。
2.Z21368_PEA_1_P16中の配列CVIVPPLSQPQIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P16のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z21368_PEA_1_P16は、以下の転写物によってコードされる:Z21368_PEA_1_T24(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T24のコード部分を太字で示し、このコード部分は691位から開始され、1920位で終結する。
本発明の変異タンパク質Z21368_PEA_1_P22は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T10によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z21368_PEA_1_P22とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜188に対応し、Z21368_PEA_1_P22のアミノ酸1〜188にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGSYIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P22のアミノ酸189〜210に対応する配列ARYDGDQPRCAPRPRGLSPTVFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P22をコードする単離キメラポリペプチド。
2.Z21368_PEA_1_P22中の配列ARYDGDQPRCAPRPRGLSPTVFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P22のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z21368_PEA_1_P22は、以下の転写物によってコードされる:Z21368_PEA_1_T10(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T10のコード部分を太字で示し、このコード部分は691位から開始され、1320位で終結する。
本発明の変異タンパク質Z21368_PEA_1_P23は、出願書類の最後に示すアミノ酸配列を有し、転写物Z21368_PEA_1_T11によってコードされる。公知のタンパク質(細胞外スルファターゼSulf−1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z21368_PEA_1_P23とQ7Z2W2との比較の報告
1.Q7Z2W2のアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチド。
2.Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチド。
Z21368_PEA_1_P23とSUL1_HUMANとの比較の報告
1.SUL1_HUMANのアミノ酸1〜137に対応し、Z21368_PEA_1_P23のアミノ酸1〜137にも対応するMKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLTDDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYVHNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTと少なくとも90%相同な第1のアミノ酸配列と、Z21368_PEA_1_P23のアミノ酸138〜145に対応する配列GLLHRLNHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z21368_PEA_1_P23をコードする単離キメラポリペプチド。
2.Z21368_PEA_1_P23中の配列GLLHRLNHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z21368_PEA_1_P23のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、分泌細胞に関して以下のように位置づけられると考えられる。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z21368_PEA_1_P23は、以下の転写物によってコードされる:Z21368_PEA_1_T11(配列は出願書類の最後に示す)。転写物Z21368_PEA_1_T11のコード部分を太字で示し、このコード部分は691位から開始され、1125位で終結する。
上記のように、クラスターZ21368は、上の表2に列挙した34個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターZ21368_PEA_1_node_0は、8個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:21368_PEA_1_T9。以下の表88は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_15は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表89は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_19は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、およびZ21368_PEA_1_T6。以下の表90は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_2は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、およびZ21368_PEA_1_T6。以下の表91は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_21は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表92は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_33は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表93は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_36は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表94は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_37は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T24。以下の表95は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_39は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T23およびZ21368_PEA_1_T24。以下の表96は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_4は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、およびZ21368_PEA_1_T24。以下の表97は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_41は、49個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表98は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_43は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表99は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_45は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表100は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_53は、60個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表101は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_56は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、およびZ21368_PEA_1_T9。以下の表102は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_58は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表103は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_66は、142個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表104は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_67は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表105は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_69は、150個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表106は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターZ21368_PEA_1_node_11は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表107は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_12は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表108は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_16を、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表109は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_17は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表110は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_23は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表111は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_24は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表112は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_30は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表113は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_31は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表114は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_38は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表115は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_47は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表116は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_49は、57個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表117は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_51は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表118は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_61は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表119は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_68は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表120は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ21368_PEA_1_node_7は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z21368_PEA_1_T10、Z21368_PEA_1_T11、Z21368_PEA_1_T23、Z21368_PEA_1_T24、Z21368_PEA_1_T5、Z21368_PEA_1_T6、およびZ21368_PEA_1_T9。以下の表121は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
このクラスターの少なくとも一部の過剰発現を、オリゴヌクレオチドおよび1つまたは複数のチップによって決定した。結果は以下であった。オリゴヌクレオチドZ21368_0_0_61857をTAAチップ上に供し、肺癌(全体)、肺腺癌、および扁平上皮細胞癌で過剰発現することが見出された。
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/5ER3vIMKE2/9L0Y7lDlTQ:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P2 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7664.00 Escore: 0
Matching length: 761 Total length: 761
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
.
751 NNHWQTAPFWN 761
|||||||||||
751 NNHWQTAPFWN 761






Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 7869.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 99.87 Matching Percent Identity: 99.87
Total Percent Similarity: 90.70 Total Percent Identity: 90.70
Gaps: 1

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELA.......................................... 58
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
59 ......................................FFGKYLNEYNGS 70
||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTVFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871






Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:AAH12997

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x AAH12997 ..

Alignment segment 1/1:

Quality: 420.00 Escore: 0
Matching length: 40 Total length: 40
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . .
752 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 791
||||||||||||||||||||||||||||||||||||||||
1 LRSCQGYKQCNPRPKNLDVGNKDGGSYDLHRGQLWDGWEG 40






Sequence name: /tmp/tt3yfXIUKV/YxSTFWr66h:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P5 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 7878.00 Escore: 0
Matching length: 791 Total length: 871
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 90.82 Total Percent Identity: 90.82
Gaps: 1

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVEL........................................... 57
|||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
58 .....................................AFFGKYLNEYNGS 70
|||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
71 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 120
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
121 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 170
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
171 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 220
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
221 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 270
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
271 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 320
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
. . . . .
321 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 370
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NKKAKIWRDTFLVERGKFLRKKEESSKNIQQSNHLPKYERVKELCQQARY 450
. . . . .
371 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 420
||||||||||||||||||||||||||||||||||||||||||||||||||
451 QTACEQPGQKWQCIEDTSGKLRIHKCKGPSDLLTVRQSTRNLYARGFHDK 500
. . . . .
421 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 470
||||||||||||||||||||||||||||||||||||||||||||||||||
501 DKECSCRESGYRASRSQRKSQRQFLRNQGTPKYKPRFVHTRQTRSLSVEF 550
. . . . .
471 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 520
||||||||||||||||||||||||||||||||||||||||||||||||||
551 EGEIYDINLEEEEELQVLQPRNIAKRHDEGHKGPRDLQASSGGNRGRMLA 600
. . . . .
521 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 570
||||||||||||||||||||||||||||||||||||||||||||||||||
601 DSSNAVGPPTTVRVTHKCFILPNDSIHCERELYQSARAWKDHKAYIDKEI 650
. . . . .
571 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 620
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EALQDKIKNLREVRGHLKRRKPEECSCSKQSYYNKEKGVKKQEKLKSHLH 700
. . . . .
621 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 670
||||||||||||||||||||||||||||||||||||||||||||||||||
701 PFKEAAQEVDSKLQLFKENNRRRKKERKEKRRQRKGEECSLPGLTCFTHD 750
. . . . .
671 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 720
||||||||||||||||||||||||||||||||||||||||||||||||||
751 NNHWQTAPFWNLGSFCACTSSNNNTYWCLRTVNETHNFLFCEFATGFLEY 800
. . . . .
721 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 770
||||||||||||||||||||||||||||||||||||||||||||||||||
801 FDMNTDPYQLTNTVHTVERGILNQLHVQLMELRSCQGYKQCNPRPKNLDV 850
. .
771 GNKDGGSYDLHRGQLWDGWEG 791
|||||||||||||||||||||
851 GNKDGGSYDLHRGQLWDGWEG 871






Sequence name: /tmp/AVAZGWHuF0/RzHFOnHIsT:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P15 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 4174.00 Escore: 0
Matching length: 416 Total length: 416
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNRFRT 400
.
401 NKKAKIWRDTFLVERG 416
||||||||||||||||
401 NKKAKIWRDTFLVERG 416






Sequence name: /tmp/JhwgRdKqmt/kqSmjxkWWk:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P16 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 3985.00 Escore: 0
Matching length: 397 Total length: 397
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . . . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAKDYFTDLITNESI 200
. . . . .
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NYFKMSKRMYPHRPVMMVISHAAPHGPEDSAPQFSKLYPNASQHITPSYN 250
. . . . .
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 YAPNMDKHWIMQYTGPMLPIHMEFTNILQRKRLQTLMSVDDSVERLYNML 300
. . . . .
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VETGELENTYIIYTADHGYHIGQFGLVKGKSMPYDFDIRVPFFIRGPSVE 350
. . . .
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397
|||||||||||||||||||||||||||||||||||||||||||||||
351 PGSIVPQIVLNIDLAPTILDIAGLDTPPDVDGKSVLKLLDPEKPGNR 397






Sequence name: /tmp/GPlnIw3BOg/zXFdxqG4ow:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P22 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1897.00 Escore: 0
Matching length: 188 Total length: 188
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . . . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRTAFFGKYLNEYNGS 150
. . .
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188
||||||||||||||||||||||||||||||||||||||
151 YIPPGWREWLGLIKNSRFYNYTVCRNGIKEKHGFDYAK 188


Sequence name: /tmp/oji5Fs74fB/8xeB9KrGjp:Q7Z2W2

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x Q7Z2W2 ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137






Sequence name: /tmp/oji5Fs74fB/8xeB9KrGjp:SUL1_HUMAN

Sequence documentation:

Alignment of: Z21368_PEA_1_P23 x SUL1_HUMAN ..

Alignment segment 1/1:

Quality: 1368.00 Escore: 0.000511
Matching length: 137 Total length: 137
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKYSCCALVLAVLGTELLGSLCSTVRSPRFRGRIQQERKNIRPNIILVLT 50
. . . . .
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 DDQDVELGSLQVMNKTRKIMEHGGATFINAFVTTPMCCPSRSSMLTGKYV 100
. . .
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137
|||||||||||||||||||||||||||||||||||||
101 HNHNVYTNNENCSSPSWQAMHEPRTFAVYLNNTGYRT 137



正常および癌性肺組織における配列名Z21368junc17−21中に示すアンプリコンによって検出可能なSUL1_HUMAN細胞外スルファターゼSulf−1Z21368転写物の発現
junc17−21セグメント、Z21368junc17−21アンプリコン (配列番号1642)、およびZ21368junc17−21F(配列番号1640)、Z21368junc17−21R(配列番号1641)プライマーによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」、上記)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図14は、正常サンプルと比較した癌性肺サンプルにおける上記SUL1_HUMAN−細胞外スルファターゼSulf−1転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。図14から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち10個、16個の扁平上皮細胞癌サンプルのうち16個、4個の大細胞癌サンプルのうち0個、8個の小細胞癌サンプルのうち0個で少なくとも5倍の過剰発現が見出された。
5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で3.56E−04、扁平上皮細胞癌で9.66E−03であった。上記値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z21368junc17−21F順方向プライマーおよびZ21368junc17−21R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z21368junc17−21。
順方向プライマー(配列番号1640):GGACGGATACAGCAGGAACG
逆方向アンプリコン(配列番号1641):TATTTTCCAAAAAAGGCCAGCTC
アンプリコン(配列番号1642):GGACGGATACAGCAGGAACGAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGGAAAATA
異なる正常組織における配列名Z21368junc17−21中に示すアンプリコンによって検出可能なSUL1_HUMAN細胞外スルファターゼSulf−1Z21368転写物の発現
Z21368junc17−21アンプリコン(配列番号1642)、Z21368junc17−21F(配列番号1640)、およびZ21368junc17−21R(配列番号1641)によって検出可能なSUL1_HUMAN細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168;アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、乳房サンプル(上記のサンプル番号33〜35、表3、「正常パネル中の組織サンプル」)の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。

順方向プライマー(配列番号1640):GGACGGATACAGCAGGAACG
逆方向アンプリコン(配列番号1641):TATTTTCCAAAAAAGGCCAGCTC
アンプリコン(配列番号1642):GGACGGATACAGCAGGAACGAAAAAACATCCGACCCAACATTATTCTTGTGCTTACCGATGATCAAGATGTGGAGCTGGCCTTTTTTGGAAAATA
結果を図15に示し、これは、異なる正常組織における配列名Z21368junc17−21中に示されたアンプリコンによって検出可能な細胞外スルファターゼSulf−1Z21368転写物の発現を示す。
正常および癌性肺組織における配列名Z21368seg39中に示すアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1Z21368転写物の発現
seg39、Z21368seg39アンプリコン(配列番号1645)、ならびにプライマーZ21368seg39F(配列番号1643)およびZ21368seg39R(配列番号1644)によって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図16は、正常サンプルと比較した癌性肺サンプルにおける上記SUL1_HUMAN−細胞外スルファターゼSulf−1転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。図16から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち8個、16個の扁平上皮細胞癌サンプルのうち5個、および4個の大細胞癌サンプルのうち1個で少なくとも5倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析に適用した。
肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現レベルの相違についてのP値を、T検定によって、腺癌で2.17E−04、扁平上皮細胞癌で9.94E−03、大細胞癌で2.17E−01と決定された。
5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、P値は、フィッシャーの正確確率検定によってチェックしたところ、腺癌で1.74E−02、扁平上皮細胞癌で1.58E−01であり、大細胞癌で4.33E−01であった。上記値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z21368seg39F順方向プライマーおよびZ21368seg39R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z21368seg39。

プライマー:
順方向プライマー Z21368seg39F(配列番号1643):GTTGCATTTCTCAGTGCTGGTTT
逆方向プライマー Z21368seg39R(配列番号1644):AGGGTGCCGGGTGAGG
アンプリコン Z21368seg39(配列番号1645):GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGATTGAGTTTCTCTACCATCCTCCCCACGTTCTTCTCTAAGCTGCCTCCAAGCCTCACCCGGCACCCT
異なる正常組織における配列名Z21368seg39中に示すアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1Z21368転写物の発現
Z21368seg39アンプリコン(配列番号1645)、Z21368seg39F(配列番号1643)、Z21368seg39R(配列番号1644)によって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−[RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン,配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、乳房サンプル(上記のサンプル番号33〜35、表3)の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。
順方向プライマー Z21368seg39F(配列番号1643):GTTGCATTTCTCAGTGCTGGTTT
逆方向プライマー Z21368seg39R(配列番号1644):AGGGTGCCGGGTGAGG
アンプリコンZ 21368seg39(配列番号1645):GTTGCATTTCTCAGTGCTGGTTTCTAATCAGACCAGTGGATTGAGTTTCTCTACCATCCTCCCCACGTTCTTCTCTAAGCTGCCTCCAAGCCTCACCCGGCACCCT
結果を図17に示し、これは、異なる正常組織における配列名Z21368seg39中に示すアンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1Z21368転写物の発現を示す。
PBGD−アンプリコン(配列番号334)、HPRT1−アンプリコン(配列番号1297)、ユビキチン−アンプリコン(配列番号328)、SDHA−アンプリコン(配列番号331)、PBGD−アンプリコン(配列番号334)、HPRT1−アンプリコン(配列番号1297)、ユビキチン−アンプリコン(配列番号328)、SDHA−アンプリコン(配列番号331)、RPL19アンプリコン(配列番号1630)、TATAアンプリコン(配列番号1633)、ユビキチン−アンプリコン(配列番号328)、SDHA−アンプリコン(配列番号331)
クラスターHUMGRP5Eの説明
クラスターHUMGRP5Eは、目的の2つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表160および161に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表162に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるガストリン放出ペプチド前駆体(SwissProtアクセッション識別子GRP_HUMAN、同義語はGRP、GRP−10)(配列番号1421)の変異型である。
ガストリン放出ペプチドは、以下の機能を有することが公知であるか、そのように見なされている:ガストリン放出および他の消化管ホルモンを刺激する。タンパク質ガストリン放出ペプチド前駆体の配列を、「ガストリン放出ペプチド前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表163に示す。
Figure 2008507261
タンパク質ガストリン放出ペプチドの局在化は、分泌と考えられる。
以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:II型糖尿病。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:ボンベシンアンタゴニスト、インスリノトロピンアゴニスト。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(食欲抑制剤/肥満抑制薬、ホルモンの放出、抗癌、呼吸器、抗糖尿病薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるシグナル伝達、神経ペプチドシグナル伝達、分子機能に関連する注釈付けである成長因子、および細胞成分に関連する注釈付けである分泌。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターHUMGRP5Eは、上の表160に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質ガストリン放出ペプチド前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMGRP5E_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMGRP5E_T4によってコードされる。公知のタンパク質(ガストリン放出ペプチド前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMGRP5E_P4とGRP_HUMANとの比較の報告
1.GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P4のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、GRP_HUMANのアミノ酸135〜148に対応し、HUMGRP5E_P4のアミノ酸128〜141にも対応するGSQREGRNPQLNQQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P4をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKGを含み、以下の構造:アミノ酸番号127−x〜127のいずれかから始まり、アミノ酸番号128+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMGRP5E_P4の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMGRP5E_P4はまた、表164に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質HUMGRP5E_P4は、以下の転写物によってコードされる:HUMGRP5E_T4(配列は出願書類の最後に示す)。転写物HUMGRP5E_T4のコード部分を太字で示し、このコード部分は622位から開始され、1044位で終結する。転写物はまた、表165に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMGRP5E_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMGRP5E_T5によってコードされる。公知のタンパク質(ガストリン放出ペプチド前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMGRP5E_P5とGRP_HUMANとの比較の報告
1.GRP_HUMANのアミノ酸1〜127に対応し、HUMGRP5E_P5のアミノ酸1〜127にも対応するMRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLMGKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQPKALGNQQPSWDSEDSSNFKDVGSKGKと少なくとも90%相同な第1のアミノ酸配列と、HUMGRP5E_P5のアミノ酸128〜142に対応する配列DSLLQVLNVKEGTPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMGRP5E_P5をコードする単離キメラポリペプチド。
2.HUMGRP5E_P5中の配列DSLLQVLNVKEGTPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMGRP5E_P5のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMGRP5E_P5はまた、表166に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質HUMGRP5E_P5は、以下の転写物によってコードされる:HUMGRP5E_T5(配列は出願書類の最後に示す)。転写物HUMGRP5E_T5のコード部分を太字で示し、このコード部分は622位から開始され、1047位で終結する。転写物はまた、表167に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMGRP5E_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHUMGRP5Eは、上の表161に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMGRP5E_node_0は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表168は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMGRP5E_node_2は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表169は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMGRP5E_node_8は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表170は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMGRP5E_node_3を、以下の転写物中に見出すことができる:HUMGRP5E_T4およびHUMGRP5E_T5。以下の表171は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMGRP5E_node_7を、以下の転写物中に見出すことができる:HUMGRP5E_T5。以下の表172は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、この遺伝子のマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表173に示す)。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/412zs2mwyT/B0wjOUAX0d:GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P4 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1291.00 Escore: 0
Matching length: 141 Total length: 148
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 95.27 Total Percent Identity: 95.27
Gaps: 1

Alignment:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. . . .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK.......GSQREGRNPQLNQQ 141
||||||||||||||||||||||||||| ||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGKVGRLSAPGSQREGRNPQLNQQ 148






Sequence name: /tmp/1me9ldnvfv/KbP5io8PtU:GRP_HUMAN

Sequence documentation:

Alignment of: HUMGRP5E_P5 x GRP_HUMAN ..

Alignment segment 1/1:

Quality: 1248.00 Escore: 0
Matching length: 127 Total length: 127
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRGSELPLVLLALVLCLAPRGRAVPLPAGGGTVLTKMYPRGNHWAVGHLM 50
. . . . .
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GKKSTGESSSVSERGSLKQQLREYIRWEEAARNLLGLIEAKENRNHQPPQ 100
. .
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127
|||||||||||||||||||||||||||
101 PKALGNQQPSWDSEDSSNFKDVGSKGK 127


正常および癌性肺組織における配列名HUMGRP5Ejunc3−7中に示すアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の発現
HUMGRP5Ejunc3−7アンプリコン(配列番号1648)、ならびにHUMGRP5Ejunc3−7F(配列番号1646)およびHUMGRP5Ejunc3−7R(配列番号1647)プライマーによって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験サンプル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図16は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記GRP_HUMAN−ガストリン放出ペプチド転写物の過剰発現を示すヒストグラムである。図19から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験サンプル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち7個で少なくとも10倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HUMGRP5Ejunc3−7F順方向プライマーおよびHUMGRP5Ejunc3−7R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HUMGRP5Ejunc3−7。

HUMGRP5Ejunc3−7F(配列番号1646)
ACCAGCCACCTCAACCCA
HUMGRP5Ejunc3−7R(配列番号1647)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5Ejunc3−7(配列番号1648)
ACCAGCCACCTCAACCCAAGGCCCTGGGCAATCAGCAGCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCTGCTCCAG
異なる正常組織における配列名HUMGRP5Ejunc3−7中に示すアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の発現
HUMGRP5Ejunc3−7アンプリコン(配列番号1648)、ならびにHUMGRP5Ejunc3−7F(配列番号1646)およびHUMGRP5Ejunc3−7R(配列番号1647)によって検出可能なGRP_HUMAN−ガストリン放出ペプチド転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、乳房サンプル(上記のサンプル番号33〜35、表3、「正常パネルにおける組織サンプル」)の量の中央値で割って、乳房サンプルの中央値に対する各サンプルの相対発現値を得た。

HUMGRP5Ejunc3−7F(配列番号1646)
ACCAGCCACCTCAACCCA
HUMGRP5Ejunc3−7R(配列番号1647)
CTGGAGCAGAGAGTCTTTGCCT
HUMGRP5Ejunc3−7(配列番号1648)
ACCAGCCACCTCAACCCAAGGCCCTGGGCAATCAGCAGCCTTCGTGGGATTCAGAGGATAGCAGCAACTTCAAAGATGTAGGTTCAAAAGGCAAAGACTCTCTGCTCCAG
結果を図20に示し、これは、異なる正常組織における配列名HUMGRP5Ejunc3−7中に示すアンプリコンによって検出可能なGRP_HUMAN−ガストリン放出ペプチド(HUMGRP5E)転写物の発現転写物の発現を示す。
クラスターD56406の説明
クラスターD56406は、目的の3つの転写物および10個のセグメントを特徴とし、その名称を、それぞれ表174および175に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表176に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるニューロテンシン/ニューロメジンN前駆体(以下を含む:大ニューロメジンN(Large neuromedin N)(NmN−125)、ニューロメジンN(NmN)(NN)、ニューロテンシン(NT)、テールペプチド)(SwissProtアクセッション識別子NEUT_HUMAN)(配列番号1422)の変異型である。
タンパク質ニューロテンシン/ニューロメジンN前駆体は、以下の機能を有することが公知であるか、そのように見なされている:ニューロテンシンは脂肪代謝の調節において内分泌または傍分泌の役割を果たし得る。これにより、平滑筋の収縮が起こる。タンパク質ニューロテンシン/ニューロメジンN前駆体の配列を、「ニューロテンシン/ニューロメジンN前駆体(以下を含む:大ニューロメジンN(NmN−125)、ニューロメジンN(NmN)(NN)、ニューロテンシン(NT)、テールペプチド)アミノ酸配列」として出願書類の最後に示す。タンパク質ニューロテンシン/ニューロメジンN前駆体の局在化は、分泌と考えられる(分泌小胞内へのパッケージング)。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるシグナル伝達、分子機能に関連する注釈付けである神経ペプチドホルモン、および細胞成分に関連する注釈付けである可溶性画分。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターD56406は、上の表174に列挙した3つの転写物を特徴とする。これらの転写物は、ニューロテンシン/ニューロメジンN前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質D56406_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物D56406_PEA_1_T3によってコードされる。公知のタンパク質(ニューロテンシン/ニューロメジンN前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
D56406_PEA_1_P2とNEUT_HUMANとの間の比較の報告
1.NEUT_HUMANのアミノ酸1〜120に対応し、D56406_PEA_1_P2のアミノ酸1〜120にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWEと少なくとも90%相同な第1のアミノ酸配列と、D56406_PEA_1_P2のアミノ酸121〜151に対応する配列ARWLTPVIPALWEAETGGSRGQEMETIPANTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P2のアミノ酸152〜201にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P2をコードする単離キメラポリペプチド。
2.D56406_PEA_1_P2に対応するARWLTPVIPALWEAETGGSRGQEMETIPANTをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、D56406_PEA_1_P2の縁部分をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質D56406_PEA_1_P2はまた、表177に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質D56406_PEA_1_P2は、以下の転写物によってコードされる:D56406_PEA_1_T3(配列は出願書類の最後に示す)。転写物D56406_PEA_1_T3のコード部分を太字で示し、このコード部分は106位から開始され、708位で終結する。転写物はまた、表178に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質D56406_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物D56406_PEA_1_T6によってコードされる。公知のタンパク質(ニューロテンシン/ニューロメジンN前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
D56406_PEA_1_P5とNEUT_HUMANとの間の比較の報告
1.NEUT_HUMANのアミノ酸1〜23に対応し、D56406_PEA_1_P5のアミノ酸1〜23にも対応するMMAGMKIQLVCMLLLAFSSWSLCと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸26〜170に対応し、D56406_PEA_1_P5のアミノ酸24〜168にも対応するSEEEMKALEADFLTNMHTSKISKAHVPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEAMLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P5をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がCSを含み、以下の構造:アミノ酸番号23−x〜23のいずれかから始まり、アミノ酸番号24+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P5の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質D56406_PEA_1_P5はまた、表179に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質D56406_PEA_1_P5は、以下の転写物によってコードされる:D56406_PEA_1_T6(配列は出願書類の最後に示す)。転写物D56406_PEA_1_T6のコード部分を太字で示し、このコード部分は106位から開始され、609位で終結する。転写物はまた、表180に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質D56406_PEA_1_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物D56406_PEA_1_T7によってコードされる。公知のタンパク質(ニューロテンシン/ニューロメジンN前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
D56406_PEA_1_P6とNEUT_HUMANとの間の比較の報告
1.NEUT_HUMANのアミノ酸1〜45に対応し、D56406_PEA_1_P6のアミノ酸1〜45にも対応するMMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKと少なくとも90%相同な第1のアミノ酸配列と、NEUT_HUMANのアミノ酸121〜170に対応し、D56406_PEA_1_P6のアミノ酸46〜95にも対応するLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYYYと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、D56406_PEA_1_P6をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKLを含み、以下の構造:アミノ酸番号45−x〜45のいずれかから始まり、アミノ酸番号46+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、D56406_PEA_1_P6の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質D56406_PEA_1_P6はまた、表181に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質D56406_PEA_1_P6は、以下の転写物によってコードされる:D56406_PEA_1_T7(配列は出願書類の最後に示す)。転写物D56406_PEA_1_T7のコード部分を太字で示し、このコード部分は106位から開始され、390位で終結する。転写物はまた、表182に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質D56406_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターD56406は、上の表2に列挙した10個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターD56406_PEA_1_node_0は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3、D56406_PEA_1_T6、およびD56406_PEA_1_T7。以下の表183は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表184に示す)。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_13は、43個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3、D56406_PEA_1_T6、およびD56406_PEA_1_T7。以下の表185は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターD56406_PEA_1_node_11は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3。以下の表186は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_2を、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T7。以下の表187は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_3は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3、D56406_PEA_1_T6、およびD56406_PEA_1_T7。以下の表188は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_5は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表189は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_6は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表190は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_7は、32個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表191は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_8を、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表192は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターD56406_PEA_1_node_9は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:D56406_PEA_1_T3およびD56406_PEA_1_T6。以下の表193は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/jU49325aMA/8F0XuN7La5:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P2 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1591.00 Escore: 0
Matching length: 170 Total length: 201
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 84.58 Total Percent Identity: 84.58
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
101 MLTIYQLHKICHSRAFQHWEARWLTPVIPALWEAETGGSRGQEMETIPAN 150
||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWE.............................. 120
. . . . .
151 TLIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 200
|||||||||||||||||||||||||||||||||||||||||||||||||
121 .LIQEDILDTGNDKNGKEEVIKRKIPYILKRQLYENKPRRPYILKRDSYY 169

201 Y 201
|
170 Y 170






Sequence name: /tmp/wWui8Kd4y9/zbf3ihRwnR:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P5 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 1572.00 Escore: 0
Matching length: 168 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.82 Total Percent Identity: 98.82
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLC..SEEEMKALEADFLTNMHTSKISKAH 48
||||||||||||||||||||||| |||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
49 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 98
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
99 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 148
||||||||||||||||||||||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 150
. .
149 QLYENKPRRPYILKRDSYYY 168
||||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170






Sequence name: /tmp/f5d07fF5D7/E4N5xjUIAN:NEUT_HUMAN

Sequence documentation:

Alignment of: D56406_PEA_1_P6 x NEUT_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 95 Total length: 170
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 55.88 Total Percent Identity: 55.88
Gaps: 1

Alignment:
. . . . .
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSK..... 45
|||||||||||||||||||||||||||||||||||||||||||||
1 MMAGMKIQLVCMLLLAFSSWSLCSDSEEEMKALEADFLTNMHTSKISKAH 50
. . . . .
45 .................................................. 45

51 VPSWKMTLLNVCSLVNNLNSPAEETGEVHEEELVARRKLPTALDGFSLEA 100
. . . . .
46 ....................LIQEDILDTGNDKNGKEEVIKRKIPYILKR 75
||||||||||||||||||||||||||||||
101 MLTIYQLHKICHSRAFQHWELIQEDILDTGNDKNGKEEVIKRKIPYILKR 150
. .
76 QLYENKPRRPYILKRDSYYY 95
||||||||||||||||||||
151 QLYENKPRRPYILKRDSYYY 170


クラスターF05068の説明
クラスターF05068は、目的の3つの転写物および12個のセグメントを特徴とし、その名称を、それぞれ表194および195に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表196に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるADM前駆体(以下を含む:アドレノメデュリン(AM)、プロアドレノメデュリンN−20末端ペプチド(ProAM−N20)(ProAMN−末端20ペプチド)(PAMP))(SwissProtアクセッション識別子ADML_HUMAN)(配列番号1423)の変異型である。
タンパク質ADM前駆体は、以下の機能を有することが公知であるか、そのように見なされている:AMおよびPAMPは、強力な降圧薬および血管拡張薬である。多数の作用が報告されており、流動物および電解質のホメオスタシスの生理学的調節について最も言及されている。腎臓では、AMは、利尿薬およびナトリウム利尿薬であり、AMおよびPAMPは共に直接的副腎作用によってアルドステロン分泌を阻害する。下垂体では、両ペプチドは、生理学的に関連する用量で、基本的ACTH分泌を阻害する。両ペプチドは、脳内および下垂体内で血漿体積の減少を促進するように作用するようである(血管内でのその血圧低下作用を補足する作用)。タンパク質ADM前駆体の配列を、「ADM前駆体(以下を含む:アドレノメデュリン(AM)、プロアドレノメデュリンN−20末端ペプチド(ProAM−N20)(ProAMN−末端20ペプチド)(PAMP)アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表197に示す。
Figure 2008507261
タンパク質ADM前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるcAMP生合成、プロゲステロン生合成、シグナル伝達、細胞−細胞シグナル伝達、妊娠、排泄、循環、創傷応答、分子機能に関連する注釈付けであるリガンド、ホルモン、および細胞成分に関連する注釈付けである鎖妨害空間、可溶性画分。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターF05068を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図21のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図21および表198中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):子宮悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターF05068は、上の表194に列挙した3つの転写物を特徴とする。これらの転写物は、ADM前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質F05068_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物F05068_PEA_1_T3およびF05068_PEA_1_T6によってコードされる。公知のタンパク質(ADM前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
F05068_PEA_1_P7とADML_HUMANとの間の比較の報告
1.ADML_HUMANのアミノ酸1〜33に対応し、F05068_PEA_1_P7のアミノ酸1〜33にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKと少なくとも90%相同な第1のアミノ酸配列を含む、F05068_PEA_1_P7をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質F05068_PEA_1_P7はまた、表200に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質F05068_PEA_1_P7は、以下の転写物によってコードされる:F05068_PEA_1_T3およびF05068_PEA_1_T6(配列は出願書類の最後に示す)。
転写物F05068_PEA_1_T3のコード部分を太字で示し、このコード部分は267位から開始され、365位で終結する。転写物はまた、表201に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
転写物F05068_PEA_1_T6のコード部分を太字で示し、このコード部分は267位から開始され、365位で終結する。転写物はまた、表202に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質F05068_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物F05068_PEA_1_T4によってコードされる。公知のタンパク質(ADM前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
F05068_PEA_1_P8とADML_HUMANとの間の比較の報告
1.ADML_HUMANのアミノ酸1〜82に対応し、F05068_PEA_1_P8のアミノ酸1〜82にも対応するMKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSSSYPTGLADVKAGPAQTLIRPQDMKGASRSPEDと少なくとも90%相同な第1のアミノ酸配列と、F05068_PEA_1_P8のアミノ酸83〜83に対応する配列Rを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、F05068_PEA_1_P8をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質F05068_PEA_1_P8はまた、表203に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質F05068_PEA_1_P8は、以下の転写物によってコードされる:F05068_PEA_1_T4(配列は出願書類の最後に示す)。転写物F05068_PEA_1_T4のコード部分を太字で示し、このコード部分は267位から開始され、515位で終結する。転写物はまた、表204に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質F05068_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
上記のように、クラスターF05068は、上の表2に列挙した12個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターF05068_PEA_1_node_0は、143個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表205は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_10は、127個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表206は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_12は、123個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表207は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_13は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表208は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_4は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3およびF05068_PEA_1_T6。以下の表209は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_8は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T4およびF05068_PEA_1_T6。以下の表210は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターF05068_PEA_1_node_11は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表211は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_3は、145個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表212は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_5は、124個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表213は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_6は、110個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表214は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_7は、109個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表215は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターF05068_PEA_1_node_9は、114個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:F05068_PEA_1_T3、F05068_PEA_1_T4、およびF05068_PEA_1_T6。以下の表216は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/kEsi3RWsCN/1svdhjfiNV:ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P7 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 304.00 Escore: 0
Matching length: 33 Total length: 33
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33
|||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKK 33






Sequence name: /tmp/tcrlWIx4kg/aghbr8Eh8n:ADML_HUMAN

Sequence documentation:

Alignment of: F05068_PEA_1_P8 x ADML_HUMAN ..

Alignment segment 1/1:

Quality: 791.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLVSVALMYLGSLAFLGADTARLDVASEFRKKWNKWALSRGKRELRMSS 50
. . .
51 SYPTGLADVKAGPAQTLIRPQDMKGASRSPED 82
||||||||||||||||||||||||||||||||
51 SYPTGLADVKAGPAQTLIRPQDMKGASRSPED 82

クラスターH14624の説明
クラスターH14624は、目的の1つの転写物および15個のセグメントを特徴とし、その名称を、それぞれ表217および218に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表219に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
クラスターH14624を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図22のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図22および表220中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):結腸直腸癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性脳腫瘍、および膵臓癌。
Figure 2008507261
Figure 2008507261
上記のように、コンティグH14624は、上の表217に列挙した1つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質H14624_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物H14624_T20によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
H14624_P15とQ9HAP5(配列番号1701)との間の比較の報告
1.Q9HAP5のアミノ酸1〜167に対応し、H14624_P15のアミノ酸1〜167にも対応するMLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLCHGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFAPVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDNDLCIPLASSDHLLPATEEと少なくとも90%相同な第1のアミノ酸配列と、H14624_P15のアミノ酸168〜180に対応する配列GKPSLLLPHSLLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H14624_P15をコードする単離キメラポリペプチド。
2.H14624_P15中の配列GKPSLLLPHSLLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H14624_P15のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質H14624_P15はまた、表222に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H14624_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質H14624_P15は、以下の転写物によってコードされる:H14624_T20(配列は出願書類の最後に示す)。転写物H14624_T20のコード部分を太字で示し、このコード部分は857位から開始され、1396位で終結する。転写物はまた、表223に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H14624_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターH14624は、上の表2に列挙した15個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターH14624_node_0は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表224は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_16は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表225は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_3は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表226は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターH14624_node_10を、以下の転写物中に見出すことができる:H14624_T20。以下の表227は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_11は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表228は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_12を、以下の転写物中に見出すことができる:H14624_T20。以下の表229は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_13は、124個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表230は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_14は、114個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表231は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_15は、124個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表232は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_4は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表233は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_5を、以下の転写物中に見出すことができる:H14624_T20。以下の表234は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_6を、以下の転写物中に見出すことができる:H14624_T20。以下の表235は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_7を、以下の転写物中に見出すことができる:H14624_T20。以下の表236は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_8は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表237は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH14624_node_9は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H14624_T20。以下の表238は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/Upb1SbFkrj/N4PrGQAB2V:Q9HAP5

Sequence documentation:

Alignment of: H14624_P15 x Q9HAP5 ..

Alignment segment 1/1:

Quality: 1702.00 Escore: 0
Matching length: 167 Total length: 167
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLQGPGSLLLLFLASHCCLGSARGLFLFGQPDFSYKRSNCKPIPANLQLC 50
. . . . .
51 HGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 HGIEYQNMRLPNLLGHETMKEVLEQAGAWIPLVMKQCHPDTKKFLCSLFA 100
. . . . .
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDND 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 PVCLDDLDETIQPCHSLCVQVKDRCAPVMSAFGFPWPDMLECDRFPQDND 150
.
151 LCIPLASSDHLLPATEE 167
|||||||||||||||||
151 LCIPLASSDHLLPATEE 167


クラスターH38804説明
クラスターH38804は、目的の2つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表239および240に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表241に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である有糸分裂チェックポイントタンパク質BUB3(SwissProtアクセッション識別子BUB3_HUMAN)(配列番号1424)の変異型である。
タンパク質有糸分裂チェックポイントタンパク質BUB3は、以下の機能を有することが公知であるか、そのように見なされている:BUB1の動原体局在化に必要である。タンパク質有糸分裂チェックポイントタンパク質BUB3の配列を、「有糸分裂チェックポイントタンパク質BUB3アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表242に示す。
Figure 2008507261
タンパク質有糸分裂チェックポイントタンパク質BUB3の局在化は、核と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである有糸分裂、有糸分裂チェックポイント、有糸分裂紡錘体チェックポイント、細胞増殖、および細胞成分に関連する注釈付けである核。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターH38804を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図23のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図23および表243中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):移行上皮癌、脳悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および胃癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターH38804は、上の表239に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質有糸分裂チェックポイントタンパク質BUB3の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質H38804_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物H38804_PEA_1_T8によってコードされる。公知のタンパク質(有糸分裂チェックポイントタンパク質BUB3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
H38804_PEA_1_P5とBUB3_HUMANとの間の比較の報告
1.H38804_PEA_1_P5のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜324に対応し、H38804_PEA_1_P5のアミノ酸58〜381にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P5をコードする単離キメラポリペプチド。
2.H38804_PEA_1_P5の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P5の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質H38804_PEA_1_P5はまた、表245に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質H38804_PEA_1_P5は、以下の転写物によってコードされる:H38804_PEA_1_T8(配列は出願書類の最後に示す)。転写物H38804_PEA_1_T8のコード部分を太字で示し、このコード部分は475位から開始され、1617位で終結する。転写物はまた、表246に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質H38804_PEA_1_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物H38804_PEA_1_T24によってコードされる。公知のタンパク質(有糸分裂チェックポイントタンパク質BUB3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
H38804_PEA_1_P17とBUB3_HUMANとの間の比較の報告
1.H38804_PEA_1_P17のアミノ酸1〜57に対応する配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BUB3_HUMANのアミノ酸1〜328に対応し、H38804_PEA_1_P17のアミノ酸58〜385にも対応するMTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMRLKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIRCVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRLIVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIEGRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFATGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYEMDDTEHPEDGIFIRQVTDAETKPKSPCTと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、H38804_PEA_1_P17をコードする単離キメラポリペプチド。
2.H38804_PEA_1_P17の配列MGRVRTLAGECSAQAQAQSLLAVVLSAPPSGGTPSARLSVRSPSPRDPWGLWAPVLQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H38804_PEA_1_P17の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質H38804_PEA_1_P17はまた、表247に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質H38804_PEA_1_P17は、以下の転写物によってコードされる:H38804_PEA_1_T24(配列は出願書類の最後に示す)。転写物H38804_PEA_1_T24のコード部分を太字で示し、このコード部分は475位から開始され、1629位で終結する。転写物はまた、表248に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H38804_PEA_1_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
上記のように、クラスターH38804は、上の表2に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターH38804_PEA_1_node_0は、125個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表249は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_1は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表250は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_16は、214個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表251は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_19は、198個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表252は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_24は、180個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表253は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_25は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T8。以下の表254は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_28は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T8。以下の表255は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_29は、259個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表256は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_30は、169個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表257は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターH38804_PEA_1_node_10は、179個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表258は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_12は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表259は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_13は、187個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表260は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_14は、179個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表261は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_2は、156個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表262は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_20は、162個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表263は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_23を、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表264は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_26は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T8。以下の表265は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_3は、162個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表266は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_4は、172個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表267は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH38804_PEA_1_node_5を、以下の転写物中に見出すことができる:H38804_PEA_1_T24およびH38804_PEA_1_T8。以下の表268は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/RR4oV8zYLg/QlORqeqpIp:BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P5 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3244.00 Escore: 0
Matching length: 324 Total length: 324
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
58 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
. . . . .
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 100
. . . . .
158 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
. . . . .
208 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
. . . . .
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 307
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 250
. . . . .
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
. .
358 MDDTEHPEDGIFIRQVTDAETKPK 381
||||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPK 324




Sequence name: /tmp/Db0dQEpSuo/Lr8HPXaeBg:BUB3_HUMAN

Sequence documentation:

Alignment of: H38804_PEA_1_P17 x BUB3_HUMAN ..

Alignment segment 1/1:

Quality: 3288.00 Escore: 0
Matching length: 328 Total length: 328
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
58 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 107
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGSNEFKLNQPPEDGISSVKFSPNTSQFLLVSSWDTSVRLYDVPANSMR 50
. . . . .
108 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 157
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LKYQHTGAVLDCAFYDPTHAWSGGLDHQLKMHDLNTDQENLVGTHDAPIR 100
. . . . .
158 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 207
||||||||||||||||||||||||||||||||||||||||||||||||||
101 CVEYCPEVNVMVTGSWDQTVKLWDPRTPCNAGTFSQPEKVYTLSVSGDRL 150
. . . . .
208 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 257
||||||||||||||||||||||||||||||||||||||||||||||||||
151 IVGTAGRRVLVWDLRNMGYVQQRRESSLKYQTRCIRAFPNKQGYVLSSIE 200
. . . . .
258 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 307
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GRVAVEYLDPSPEVQKKKYAFKCHRLKENNIEQIYPVNAISFHNIHNTFA 250
. . . . .
308 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 357
||||||||||||||||||||||||||||||||||||||||||||||||||
251 TGGSDGFVNIWDPFNKKRLCQFHRYPTSIASLAFSNDGTTLAIASSYMYE 300
. .
358 MDDTEHPEDGIFIRQVTDAETKPKSPCT 385
||||||||||||||||||||||||||||
301 MDDTEHPEDGIFIRQVTDAETKPKSPCT 328

クラスターHSENA78の説明
クラスターHSENA78は、目的の1つの転写物および7個のセグメントを特徴とし、その名称を、それぞれ表269および270に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表271に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である小誘導性サイトカイン(Small inducible cytokine)B5前駆体(SwissProtアクセッション識別子SZ05_HUMAN、同義語CXCL5、上皮由来好中球活性化タンパク質78、好中球活性化ペプチドENA−78としても公知である)(配列番号1425)の変異型である。
タンパク質小誘導性サイトカインB5前駆体は、以下の機能を有することが公知であるか、そのように見なされている:好中球活性化に関与する。タンパク質小誘導性サイトカインB5前駆体の配列を、「小誘導性サイトカインB5前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質小誘導性サイトカインB5前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである走化性、シグナル伝達、細胞−細胞シグナル伝達、細胞増殖のポジティブコントロール、分子機能に関連する注釈付けであるケモカイン。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHSENA78を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図24のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図24および表272中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍および肺悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHSENA78は、上の表269に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質小誘導性サイトカインB5前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HSENA78_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物HSENA78_T5によってコードされる。公知のタンパク質(小誘導性サイトカインB5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSENA78_P2とSZ05_HUMANとの間の比較の報告
1.SZ05_HUMANのアミノ酸1〜81に対応し、HSENA78_P2のアミノ酸1〜81にも対応するMSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCVCLQTTQGVHPKMISNLQVFAIGPQCSKVEVVと少なくとも90%相同な第1のアミノ酸配列を含む、HSENA78_P2をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSENA78_P2はまた、表274に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSENA78_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質HSENA78_P2は、以下の転写物によってコードされる:HSENA78_T5(配列は出願書類の最後に示す)。転写物HSENA78_T5のコード部分を太字で示し、このコード部分は149位から開始され、391位で終結する。転写物はまた、表275に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSENA78_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHSENA78は、上の表270に列挙した7個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHSENA78_node_0は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表276は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSENA78_node_2は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表277は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSENA78_node_6は、68個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表278は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSENA78_node_9は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表279は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHSENA78_node_3は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表280は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSENA78_node_4は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSENA78_T5。以下の表281は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSENA78_node_8を、以下の転写物中に見出すことができる:HSENA78_T5。以下の表282は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/5kiQY6MxWx/pLnTrxsCqk:SZ05_HUMAN

Sequence documentation:

Alignment of: HSENA78_P2 x SZ05_HUMAN ..

Alignment segment 1/1:

Quality: 767.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MSLLSSRAARVPGPSSSLCALLVLLLLLTQPGPIASAGPAAAVLRELRCV 50
. . .
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81
|||||||||||||||||||||||||||||||
51 CLQTTQGVHPKMISNLQVFAIGPQCSKVEVV 81

クラスターHUMODCAの説明
クラスターHUMODCAは、目的の1つの転写物および17個のセグメントを特徴とし、その名称を、それぞれ表283および284に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表285に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるオルニチンデカルボキシラーゼ(SwissProtアクセッション識別子DCOR_HUMAN、同義語はEC4.1.1.17、ODCとしても公知である)(配列番号1426)の変異型である。
タンパク質オルニチンデカルボキシラーゼは、以下の機能を有することが公知であるか、そのように見なされている:ポリアミン生合成、第1(律速)段階。タンパク質オルニチンデカルボキシラーゼの配列を、「オルニチンデカルボキシラーゼアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表286に示す。
Figure 2008507261
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるポリアミン生合成および分子機能に関連する注釈付けであるオルニチンデカルボキシラーゼ、リアーゼ。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHUMODCAを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図25のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図25および表287中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):脳悪性腫瘍、結腸直腸癌、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHUMODCAは、上の表283に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質オルニチンデカルボキシラーゼの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMODCA_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMODCA_T17によってコードされる。公知のタンパク質(オルニチンデカルボキシラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMODCA_P9とDCOR_HUMANとの間の比較の報告
1.HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、DCOR_HUMANのアミノ酸151〜461に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチド。
2.HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチド。
HUMODCA_P9とAAA59968(配列番号1702)との間の比較の報告
1.HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAA59968のアミノ酸40〜350に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチド。
2.HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチド。
HUMODCA_P9とAAH14562(配列番号1703)との間の比較の報告
1.HUMODCA_P9のアミノ酸1〜29に対応する配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、AAH14562のアミノ酸86〜396に対応し、HUMODCA_P9のアミノ酸30〜340にも対応するLVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGSGCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEEITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQTGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKYYSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGFQRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRHRAACASASINVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、HUMODCA_P9をコードする単離キメラポリペプチド。
2.HUMODCA_P9の配列MKSLTATSSMKVLLPRTFWTRKLMKFLLLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMODCA_P9の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMODCA_P9はまた、表289に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMODCA_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
変異タンパク質HUMODCA_P9は、以下の転写物によってコードされる:HUMODCA_T17(配列は出願書類の最後に示す)。転写物HUMODCA_T17のコード部分を太字で示し、このコード部分は528位から開始され、1547位で終結する。転写物はまた、表290に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMODCA_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHUMODCAは、上の表284に列挙した17個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMODCA_node_1は、76個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表291は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_25は、190個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表292は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_32は、249個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表293は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_36は、348
個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表294は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_39は、297個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表295は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_41は、230個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表296は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMODCA_node_0は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表297は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_10は、107個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表298は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_12は、132個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表299は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_13は、126個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表300は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_2は、81個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表301は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_27は、185個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表302は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_3は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表303は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_30は、196個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表304は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_34は、259個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表305は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_38は、272個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表306は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMODCA_node_40は、239個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMODCA_T17。以下の表307は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:DCOR_HUMAN

Sequence documentation:

Alignment of: HUMODCA_P9 x DCOR_HUMAN ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 200
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
201 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 250
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
251 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 300
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
301 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 350
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
351 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 400
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
401 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 450
.
330 RAACASASINV 340
|||||||||||
451 RAACASASINV 461






Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:AAA59968

Sequence documentation:

Alignment of: HUMODCA_P9 x AAA59968 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
40 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 89
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
90 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 139
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
140 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 189
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
190 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 239
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
240 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 289
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
290 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 339
.
330 RAACASASINV 340
|||||||||||
340 RAACASASINV 350






Sequence name: /tmp/y03EwE6i01/dRQ5l2K6e2:AAH14562

Sequence documentation:

Alignment of: HUMODCA_P9 x AAH14562 ..

Alignment segment 1/1:

Quality: 3056.00 Escore: 0
Matching length: 311 Total length: 311
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
30 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 79
||||||||||||||||||||||||||||||||||||||||||||||||||
86 LVLRIATDDSKAVCRLSVKFGATLRTSRLLLERAKELNIDVVGVSFHVGS 135
. . . . .
80 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 129
||||||||||||||||||||||||||||||||||||||||||||||||||
136 GCTDPETFVQAISDARCVFDMGAEVGFSMYLLDIGGGFPGSEDVKLKFEE 185
. . . . .
130 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 179
||||||||||||||||||||||||||||||||||||||||||||||||||
186 ITGVINPALDKYFPSDSGVRIIAEPGRYYVASAFTLAVNIIAKKIVLKEQ 235
. . . . .
180 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 229
||||||||||||||||||||||||||||||||||||||||||||||||||
236 TGSDDEDESSEQTFMYYVNDGVYGSFNCILYDHAHVKPLLQKRPKPDEKY 285
. . . . .
230 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 279
||||||||||||||||||||||||||||||||||||||||||||||||||
286 YSSSIWGPTCDGLDRIVERCDLPEMHVGDWMLFENMGAYTVAAASTFNGF 335
. . . . .
280 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 329
||||||||||||||||||||||||||||||||||||||||||||||||||
336 QRPTIYYVMSGPAWQLMQQFQNPDFPPEVEEQDASTLPVSCAWESGMKRH 385
.
330 RAACASASINV 340
|||||||||||
386 RAACASASINV 396

クラスターR00299の説明
クラスターR00299は、目的の1つの転写物および12個のセグメントを特徴とし、その名称を、それぞれ表308および309に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表310に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるテスカルシン(Tescalcin)(SwissProtアクセッション識別子TESC_HUMAN、同義語TSCとしても公知である)(配列番号1427)の変異型である。
タンパク質テスカルシンは、以下の機能を有することが公知であるか、そのように見なされている:カルシウムに結合する。タンパク質テスカルシンの配列を、「テスカルシンアミノ酸配列」として出願書類の最後に示す。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるカルシウム結合。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターR00299を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図26のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図26および表311中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肺悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターR00299は、上の表308に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質テスカルシンの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R00299_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物R00299_T2によってコードされる。公知のタンパク質(テスカルシン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R00299_P3とQ9NWT9(配列番号1704)との間の比較の報告
1.R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NWT9のアミノ酸74〜191に対応し、R00299_P3のアミノ酸45〜162にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVと少なくとも90%相同な第2のアミノ酸配列と、R00299_P3のアミノ酸163〜238に対応する配列VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチド。
2.R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチド。
3.R00299_P3中の配列VEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3のテールをコードする単離ポリペプチド。
R00299_P3とTESC_HUMANとの間の比較の報告
1.R00299_P3のアミノ酸1〜44に対応する配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TESC_HUMANのアミノ酸21〜214に対応し、R00299_P3のアミノ酸45〜238にも対応するSSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNRNLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFHMYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCMGQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCHと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R00299_P3をコードする単離キメラポリペプチド。
2.R00299_P3の配列MAEKALLCPSSAGLGTWPWVLNSAWPVLPLAVDQGVDWRPRGPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R00299_P3の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質R00299_P3はまた、表313に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R00299_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質R00299_P3は、以下の転写物によってコードされる:R00299_T2(配列は出願書類の最後に示す)。転写物R00299_T2のコード部分を太字で示し、このコード部分は142位から開始され、855位で終結する。転写物はまた、表314に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R00299_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターR00299は、上の表309に列挙した12個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR00299_node_2は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表315は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_30は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表316は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR00299_node_10は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表317は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_14は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表318は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_15を、以下の転写物中に見出すことができる:R00299_T2。以下の表319は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_20は、66個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表320は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_23は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表321は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_25は、62個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表322は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_28を、以下の転写物中に見出すことができる:R00299_T2。以下の表323は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_31は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表324は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_5は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R00299_T2。以下の表325は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR00299_node_9を、以下の転写物中に見出すことができる:R00299_T2。以下の表326は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、この遺伝子のマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表327に示す)。
Figure 2008507261
以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/OleVDhrKQ0/EjblgLomjM:Q9NWT9

Sequence documentation:

Alignment of: R00299_P3 x Q9NWT9 ..

Alignment segment 1/1:

Quality: 1162.00 Escore: 0
Matching length: 118 Total length: 118
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||||||||||||
74 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 123
. . . . .
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 144
||||||||||||||||||||||||||||||||||||||||||||||||||
124 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 173
.
145 MYDSDSDGRITLEEYRNV 162
||||||||||||||||||
174 MYDSDSDGRITLEEYRNV 191






Sequence name: /tmp/OleVDhrKQ0/EjblgLomjM:TESC_HUMAN

Sequence documentation:

Alignment of: R00299_P3 x TESC_HUMAN ..

Alignment segment 1/1:

Quality: 1920.00 Escore: 0
Matching length: 194 Total length: 194
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
45 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 94
||||||||||||||||||||||||||||||||||||||||||||||||||
21 SSDQIEQLHRRFKQLSGDQPTIRKENFNNVPDLELNPIRSKIVRAFFDNR 70
. . . . .
95 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 144
||||||||||||||||||||||||||||||||||||||||||||||||||
71 NLRKGPSGLADEINFEDFLTIMSYFRPIDTTMDEEQVELSRKEKLRFLFH 120
. . . . .
145 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 194
||||||||||||||||||||||||||||||||||||||||||||||||||
121 MYDSDSDGRITLEEYRNVVEELLSGNPHIEKESARSIADGAMMEAASVCM 170
. . . .
195 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 238
||||||||||||||||||||||||||||||||||||||||||||
171 GQMEPDQVYEGITFEDFLKIWQGIDIETKMHVRFLNMETMALCH 214

クラスターW60282の説明
クラスターW60282は、目的の1つの転写物および6個のセグメントを特徴とし、その名称を、それぞれ表328および329に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表330に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるカリクレイン11前駆体(SwissProtアクセッション識別子KLKB_HUMAN、同義語EC3.4.21.−、ヒッポスタシン(Hippostasin)、チロシン様プロテアーゼとしても公知である)(配列番号1428)の変異型である。
タンパク質カリクレイン11前駆体は、以下の機能を有することが公知であるか、そのように見なされている:多機能プロテアーゼの可能性がある。Phe−Arg−4−メチルクマリル−7−アミド(カリクレイン基質)を有効に切断し、カリクレインおよび
トリプシンの他の基質を弱く切断する。タンパク質カリクレイン11前駆体の配列を、「カリクレイン11前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質カリクレイン11前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるタンパク質分解およびペプチド分解、分子機能に関連する注釈付けであるキモトリプシン、トリプシン、セリン型ペプチダーゼ、ヒドロラーゼ。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターW60282は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質カリクレイン11前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質W60282_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物W60282_PEA_1_T11によってコードされる。公知のタンパク質(カリクレイン11前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
W60282_PEA_1_P14とQ8IXD7(配列番号1705)との間の比較の報告
1.Q8IXD7のアミノ酸1〜66に対応し、W60282_PEA_1_P14のアミノ酸1〜66にも対応するMRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGATLIAPRWLLTAAHCLKPと少なくとも90%相同な第1のアミノ酸配列と、W60282_PEA_1_P14のアミノ酸67〜80に対応する配列TPASHLAMRQHHHHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、W60282_PEA_1_P14をコードする単離キメラポリペプチド。
2.W60282_PEA_1_P14中の配列TPASHLAMRQHHHHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、W60282_PEA_1_P14のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質W60282_PEA_1_P14はまた、表331に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質W60282_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質W60282_PEA_1_P14は、以下の転写物によってコードされる:W60282_PEA_1_T11(配列は出願書類の最後に示す)。転写物W60282_PEA_1_T11のコード部分を太字で示し、このコード部分は705位から開始され、944位で終結する。転写物はまた、表332に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質W60282_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターW60282は、上の表329に列挙した6個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターW60282_PEA_1_node_10は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表333は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターW60282_PEA_1_node_18は、49個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表334は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターW60282_PEA_1_node_22は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表335は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターW60282_PEA_1_node_5は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表336は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターW60282_PEA_1_node_21は、48個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表337は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターW60282_PEA_1_node_8は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:W60282_PEA_1_T11。以下の表338は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/rL7Wdc5hYg/eLOAfKIgqD:KLKB_HUMAN

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x KLKB_HUMAN ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 72 Total length: 72
Matching Percent Similarity: 94.44 Matching Percent Identity: 94.44
Total Percent Similarity: 94.44 Total Percent Identity: 94.44
Gaps: 0

Alignment:
. . . . .
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
. .
51 LIAPRWLLTAAHCLKPTPASHL 72
|||||||||||||||| ||
51 LIAPRWLLTAAHCLKPRYIVHL 72






Sequence name: /tmp/rL7Wdc5hYg/eLOAfKIgqD:Q8IXD7

Sequence documentation:

Alignment of: W60282_PEA_1_P14 x Q8IXD7 ..

Alignment segment 1/1:

Quality: 642.00 Escore: 0
Matching length: 66 Total length: 66
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRILQLILLALATGLVGGETRIIKGFECKPHSQPWQAALFEKTRLLCGAT 50
.
51 LIAPRWLLTAAHCLKP 66
||||||||||||||||
51 LIAPRWLLTAAHCLKP 66


クラスターZ41644の説明
クラスターW60282は、目的の1つの転写物および21個のセグメントを特徴とし、その名称を、それぞれ表339および340に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表341に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である小誘導性サイトカインB14前駆体(SwissProtアクセッション識別子SZ14_HUMAN、同義語CXCL14、ケモカインBRAKとしても公知である)(配列番号1429)の変異型である。
タンパク質小誘導性サイトカインB14前駆体の配列を、「小誘導性サイトカインB14前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質小誘導性サイトカインB14前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである走化性、シグナル伝達、細胞−細胞シグナル伝達、分子機能に関連する注釈付けであるケモカイン。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターZ41644を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図27のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図27および表342中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肺悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターZ41644は、上の表339に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質小誘導性サイトカインB14前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質Z41644_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物41644_PEA_1_T5によってコードされる。公知のタンパク質(小誘導性サイトカインB14前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z41644_PEA_1_P10とSZ14_HUMANとの間の比較の報告
1.SZ14_HUMANのアミノ酸1〜95に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチド。
2.Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチド。
Z41644_PEA_1_P10とQ9NS21(配列番号1706)との間の比較の報告
1.Q9NS21のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチド。
2.Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチド
Z41644_PEA_1_P10とAAQ89265(配列番号781)との間の比較の報告
1.AAQ89265のアミノ酸13〜107に対応し、Z41644_PEA_1_P10のアミノ酸1〜95にも対応するMRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPHCEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRと少なくとも90%相同な第1のアミノ酸配列と、Z41644_PEA_1_P10のアミノ酸96〜123に対応する配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z41644_PEA_1_P10をコードする単離キメラポリペプチド。
2.Z41644_PEA_1_P10中の配列YAPPLLTFLPTRPSCGSQDGKGPPHQVIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z41644_PEA_1_P10のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z41644_PEA_1_P10はまた、表344に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z41644_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質Z41644_PEA_1_P10は、以下の転写物によってコードされる:Z41644_PEA_1_T5(配列は出願書類の最後に示す)。転写物Z41644_PEA_1_T5のコード部分を太字で示し、このコード部分は744位から開始され、1112位で終結する。転写物はまた、表345に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z41644_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターZ41644は、上の表340に列挙した21個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターZ41644_PEA_1_node_0は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表346は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_11は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表347は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_12は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表348は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_15は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表349は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_20は、260個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表350は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_24は、185個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表351は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターZ41644_PEA_1_node_1は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表352は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_10は、138個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表353は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_13を、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表354は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_16は、152個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表355は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_17を、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表356は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_19は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表357は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_2は、58個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表358は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_21を、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表359は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_22は、164個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表360は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_23は、169個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表361は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_25は、138個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表362は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_3は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表363は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_4は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表364は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_6は、101個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表365は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ41644_PEA_1_node_9は、134個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z41644_PEA_1_T5。以下の表366は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:SZ14_HUMAN

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x SZ14_HUMAN ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95






Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:Q9NS21

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x Q9NS21 ..

Alignment segment 1/1:

Quality: 957.00 Escore: 0
Matching length: 96 Total length: 96
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.96
Total Percent Similarity: 100.00 Total Percent Identity: 98.96
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRY 96
|||||||||||||||||||||||||||||||||||||||||||||:
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRRF 108






Sequence name: /tmp/p5SSvhT9Xp/HQeIMsUrfm:AAQ89265

Sequence documentation:

Alignment of: Z41644_PEA_1_P10 x AAQ89265 ..

Alignment segment 1/1:

Quality: 953.00 Escore: 0
Matching length: 95 Total length: 95
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MRLLAAALLLLLLALYTARVDGSKCKCSRKGPKIRYSDVKKLEMKPKYPH 62
. . . .
51 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 95
|||||||||||||||||||||||||||||||||||||||||||||
63 CEEKMVIITTKSVSRYRGQEHCLHPKLQSTKRFIKWYNAWNEKRR 107


クラスターZ44808の説明
クラスターZ44808は、目的の5つの転写物および21個のセグメントを特徴とし、その名称を、それぞれ表367および368に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表369に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるSPARC関連モジュラーカルシウム結合タンパク質2前駆体(SwissProtアクセッション識別子SMO2_HUMAN)、同義語分泌性モジュラーカルシウム結合タンパク質2、SMOC−2、平滑筋関連タンパク質2、SMAP−2、MSTP117としても公知である)(配列番号1430)の変異型である。
タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体は、以下の機能を有することが公知であるか、そのように見なされている:カルシウム結合。タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体の配列を、「SPARC関連モジュラーカルシウム結合タンパク質2前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表370に示す。
Figure 2008507261
タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体の局在化は、分泌と考えられる。
クラスターZ44808を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図28のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図28および表371中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):結腸直腸癌、肺癌、および膵臓癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターZ44808は、上の表367に列挙した5つの転写物を特徴とする。これらの転写物は、タンパク質SPARC関連モジュラーカルシウム結合タンパク質2前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質Z44808_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T4によってコードされる。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z44808_PEA_1_P5とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P5のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P5のアミノ酸442〜464に対応する配列DAMVVSSRPKATTHRKSRTLSRRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P5をコードする単離キメラポリペプチド。
2.Z44808_PEA_1_P5中の配列DAMVVSSRPKATTHRKSRTLSRRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P5のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z44808_PEA_1_P5は、以下の転写物によってコードされる:Z44808_PEA_1_T4(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T4のコード部分を太字で示し、このコード部分は586位から開始され、1977位で終結する。転写物はまた、表373に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質Z44808_PEA_1_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T5によってコードされる。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z44808_PEA_1_P6とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜428に対応し、Z44808_PEA_1_P6のアミノ酸1〜428にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P6のアミノ酸429〜434に対応する配列RSKRNLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P6をコードする単離キメラポリペプチド。
2.Z44808_PEA_1_P6中の配列RSKRNLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P6のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z44808_PEA_1_P6はまた、表374に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質Z44808_PEA_1_P6は、以下の転写物によってコードされる:Z44808_PEA_1_T5(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T5のコード部分を太字で示し、このコード部分は586位から開始され、1887位で終結する。転写物はまた、表375に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質Z44808_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T9によってコードされる。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z44808_PEA_1_P7とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜441に対応し、Z44808_PEA_1_P7のアミノ酸1〜441にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQと少なくとも90%相同な第1のアミノ酸配列と、Z44808_PEA_1_P7のアミノ酸442〜454に対応する配列LLWLRGKVSFYCFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P7をコードする単離キメラポリペプチド。
2.Z44808_PEA_1_P7中の配列LLWLRGKVSFYCFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z44808_PEA_1_P7のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z44808_PEA_1_P7はまた、表376に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質Z44808_PEA_1_P7は、以下の転写物によってコードされる:Z44808_PEA_1_T9(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T9のコード部分を太字で示し、このコード部分は586位から開始され、1947位で終結する。転写物はまた、表377に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質Z44808_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物Z44808_PEA_1_T11によってコードされる。この転写物の同定を、以下の引用文献に記載の非ESTベースの選択的スプライシングの同定方法を使用して行った:Sorek R et al.,Genome Res.(2004)14:1617−23。公知のタンパク質(SPARC関連モジュラーカルシウム結合タンパク質2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z44808_PEA_1_P11とSMO2_HUMANとの間の比較の報告
1.SMO2_HUMANのアミノ酸1〜170に対応し、Z44808_PEA_1_P11のアミノ酸1〜170にも対応するMLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQKPLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKTPRCPGSVNEKLPQREGTGKTと少なくとも90%相同な第1のアミノ酸配列と、SMO2_HUMANのアミノ酸188〜446に対応し、Z44808_PEA_1_P11のアミノ酸171〜429にも対応するDIASRYPTLWTEQVKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQCHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQLQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEERVVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNNDKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z44808_PEA_1_P11をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号170−x〜170のいずれかから始まり、アミノ酸番号171+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、Z44808_PEA_1_P11の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z44808_PEA_1_P11はまた、表378に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質Z44808_PEA_1_P11は、以下の転写物によってコードされる:Z44808_PEA_1_T11(配列は出願書類の最後に示す)。転写物Z44808_PEA_1_T11のコード部分を太字で示し、このコード部分は586位から開始され、1872位で終結する。転写物はまた、表379に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z44808_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターZ44808は、上の表368に列挙した21個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターZ44808_PEA_1_node_0は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表380は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_16は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表381は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_2は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表382は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_24は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表383は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_32は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T4およびZ44808_PEA_1_T8。以下の表384は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_33は、133個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表385は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_36は、117個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表386は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_37は、120個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表387は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_41は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T9。以下の表388は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターZ44808_PEA_1_node_11は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表389は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_13は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表390は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_18は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表391は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_22は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表392は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表393に示す)。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_26は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T5。以下の表394は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表395に示す)。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_30は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表396は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_34は、70個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表397は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_35を、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、およびZ44808_PEA_1_T5。以下の表398は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_39は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T9。以下の表399は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_4は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表400は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_6は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表401は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ44808_PEA_1_node_8は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z44808_PEA_1_T11、Z44808_PEA_1_T4、Z44808_PEA_1_T5、Z44808_PEA_1_T8、およびZ44808_PEA_1_T9。以下の表402は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/vUqLu6eAVZ/K3JDuPvaLo:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P5 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
|||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441






Sequence name: /tmp/QSUNfTsJ5y/kLOw5Vb6SD:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P6 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4310.00 Escore: 0
Matching length: 428 Total length: 428
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. .
401 DKSISVQELMGCLGVAKEDGKADTKKRH 428
||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRH 428






Sequence name: /tmp/MZVdR4PVdM/5uN8RwViJ1:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P7 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4440.00 Escore: 0
Matching length: 441 Total length: 441
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441
|||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQ 441






Sequence name: /tmp/3fGVxqLloe/J5mQduAd0F:SMO2_HUMAN

Sequence documentation:

Alignment of: Z44808_PEA_1_P11 x SMO2_HUMAN ..

Alignment segment 1/1:

Quality: 4228.00 Escore: 0
Matching length: 429 Total length: 446
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.19 Total Percent Identity: 96.19
Gaps: 1

Alignment:
. . . . .
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MLLPQLCWLPLLAGLLPPVPAQKFSALTFLRVDQDKDKDCSLDCAGSPQK 50
. . . . .
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PLCASDGRTFLSRCEFQRAKCKDPQLEIAYRGNCKDVSRCVAERKYTQEQ 100
. . . . .
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ARKEFQQVFIPECNDDGTYSQVQCHSYTGYCWCVTPNGRPISGTAVAHKT 150
. . . . .
151 PRCPGSVNEKLPQREGTGKT.................DIASRYPTLWTEQ 183
|||||||||||||||||||| |||||||||||||
151 PRCPGSVNEKLPQREGTGKTDDAAAPALETQPQGDEEDIASRYPTLWTEQ 200
. . . . .
184 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 233
||||||||||||||||||||||||||||||||||||||||||||||||||
201 VKSRQNKTNKNSVSSCDQEHQSALEEAKQPKNDNVVIPECAHGGLYKPVQ 250
. . . . .
234 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 283
||||||||||||||||||||||||||||||||||||||||||||||||||
251 CHPSTGYCWCVLVDTGRPIPGTSTRYEQPKCDNTARAHPAKARDLYKGRQ 300
. . . . .
284 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 333
||||||||||||||||||||||||||||||||||||||||||||||||||
301 LQGCPGAKKHEFLTSVLDALSTDMVHAASDPSSSSGRLSEPDPSHTLEER 350
. . . . .
334 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 383
||||||||||||||||||||||||||||||||||||||||||||||||||
351 VVHWYFKLLDKNSSGDIGKKEIKPFKRFLRKKSKPKKCVKKFVEYCDVNN 400
. . . .
384 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG 429
||||||||||||||||||||||||||||||||||||||||||||||
401 DKSISVQELMGCLGVAKEDGKADTKKRHTPRGHAESTSNRQPRKQG 446


正常および癌性肺組織における配列名Z44808junc8−11中に示すアンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体Z44808転写物の発現
junc8−11、Z44808junc8−11アンプリコン(配列番号1651)、ならびにZ44808junc8−11F(配列番号1649)およびZ44808junc8−11R(配列番号1650)プライマーによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図29は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記SMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体転写物の過剰発現を示すヒストグラムである。
図29から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち3個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z44808junc8−11F順方向プライマーおよびZ44808junc8−11 R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z44808junc8−11。

順方向プライマー(配列番号1649):GAAGGCACAGGAAAAACAGATATTG
逆方向プライマー(配列番号1650):TGGTGCTCTTGGTCACAGGAT
アンプリコン(配列番号1651):GAAGGCACAGGAAAAACAGATATTGCATCACGTTACCCTACCCTTTGGACTGAACAGGTTAAAAGTCGGCAGAACAAAACCAATAAGAATTCAGTGTCATCCTGTGACCAAGAGCACCA
異なる正常組織に配列名Z44808junc8−11中に示すアンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808転写物の発現
Z44808junc8−11アンプリコン(配列番号1651)ならびにプライマーZ44808junc8−11F(配列番号1649)およびZ44808junc8−11R (配列番号1650)によって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン,配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。

プライマー:
順方向プライマー(配列番号1649):GAAGGCACAGGAAAAACAGATATTG
逆方向プライマー(配列番号1650):TGGTGCTCTTGGTCACAGGAT
アンプリコン(配列番号1651):GAAGGCACAGGAAAAACAGATATTGCATCACGTTACCCTACCCTTTGGACTGAACAGGTTAAAAGTCGGCAGAACAAAACCAATAAGAATTCAGTGTCATCCTGTGACCAAGAGCACCA
結果を図18に示し、これは、異なる正常組織に配列名Z44808junc8−11中に示すアンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2前駆体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808の発現を示す。
クラスターAA161187の説明
クラスターAA161187は、目的の7つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表403および404に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表405に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるテスチシン(Testisin)前駆体(SwissProtアクセッション識別子TEST_HUMAN)、同義語EC3.4.21.−、好酸球セリンプロテアーゼ1、ESP−1、UNQ266/PRO303としても公知である)(配列番号1431)の変異型である。
タンパク質テスチシン前駆体は、以下の機能を有することが公知であるか、そのように見なされている:精巣生殖細胞成熟に関連するタンパク質分解事象を調節することができる。タンパク質テスチシン前駆体の配列を、「テスチシン前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質テスチシン前駆体の局在化は、GPI−アンカーによって膜に結合していると考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるセリン型ペプチダーゼおよび細胞成分に関連する注釈付けである膜画分、細胞質、原形質膜。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターAA161187を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図30のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図30および表406中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性脳腫瘍、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、クラスターAA161187は、上の表403に列挙した7つの転写物を特徴とする。これらの転写物は、タンパク質テスチシン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質AA161187_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T0によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質AA161187_P1はまた、表408に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質AA161187_P1は、以下の転写物によってコードされる:AA161187_T0(配列は出願書類の最後に示す)。転写物AA161187_T0のコード部分を太字で示し、このコード部分は107位から開始され、1048位で終結する。転写物はまた、表409に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質AA161187_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T7によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
AA161187_P6とTEST_HUMANとの間の比較の報告
1.AA161187_P6のアミノ酸1〜42に対応するHTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜314に対応し、AA161187_P6のアミノ酸43〜326にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEWIQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P6をコードする単離キメラポリペプチド。
2.AA161187_P6の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P6の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質AA161187_P6はまた、表410に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P6のグリコシル化部位を表411に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質AA161187_P6は、以下の転写物によってコードされる:AA161187_T7(配列は出願書類の最後に示す)。転写物AA161187_T7のコード部分を太字で示し、このコード部分は1位から開始され、979位で終結する。転写物はまた、表412に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質AA161187_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T15によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
AA161187_P13とTEST_HUMANとの間の比較の報告
1.TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P13のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P13のアミノ酸184〜213に対応する配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P13をコードする単離キメラポリペプチド。
2.AA161187_P13中の配列GSSGRHHKQLYVQPPLPQVQFPQGHLWRHGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P13のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質AA161187_P13はまた、表413に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P13のグリコシル化部位を表414に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質AA161187_P13は、以下の転写物によってコードされる:AA161187_T15(配列は出願書類の最後に示す)。転写物AA161187_T15のコード部分を太字で示し、このコード部分は107位から開始され、745位で終結する。転写物はまた、表415に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質AA161187_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T16によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
AA161187_P14とTEST_HUMANとの間の比較の報告
1.TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P14のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P14のアミノ酸184〜307に対応する配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P14をコードする単離キメラポリペプチド。
2.AA161187_P14中の配列GCCLSPSHYRPHSTAISPHPPGSSGRHHKQLYVQPPLPQVQFPQGHLWRHGLCWQCPRREGCLLRECPCHHSQPRKASCVPVPYLTLMPTPGGGDCCPTLQMQKRRLGCCQGEEEDVHPVYPAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P14のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質AA161187_P14はまた、表416に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P14のグリコシル化部位を表417に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質AA161187_P14は、以下の転写物によってコードされる:AA161187_T16(配列は出願書類の最後に示す)。転写物AA161187_T16のコード部分を太字で示し、このコード部分は107位から開始され、1027位で終結する。転写物はまた、表418に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質AA161187_P18は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T20によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
AA161187_P18とTEST_HUMANとの間の比較の報告
1.AA161187_P18のアミノ酸1〜42に対応する配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、TEST_HUMANのアミノ酸31〜86に対応し、AA161187_P18のアミノ酸43〜98にも対応するGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETと少なくとも90%相同な第2のアミノ酸配列と、TEST_HUMANのアミノ酸89〜235に対応し、AA161187_P18のアミノ酸99〜245にも対応するDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGGKDACFと少なくとも90%相同な第3のアミノ酸配列と、AA161187_P18のアミノ酸246〜265に対応する配列VSVPATTPSPGKHPVSLCLIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P18をコードする単離キメラポリペプチド。
2.AA161187_P18の配列HTREGTLGGQKRAFPDGVEGEKGRGRAWGAASRGSAVPLTIRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18の先端をコードする単離ポリペプチド。
3.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がTDを含み、以下の構造:アミノ酸番号98−x〜98のいずれかから始まり、アミノ酸番号99+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、AA161187_P18の縁部分をコードする単離キメラポリペプチド。
AA161187_P18中の配列VSVPATTPSPGKHPVSLCLIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P18のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質AA161187_P18はまた、表419に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P18のグリコシル化部位を表420に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質AA161187_P18は、以下の転写物によってコードされる:AA161187_T20(配列は出願書類の最後に示す)。転写物AA161187_T20のコード部分を太字で示し、このコード部分は1位から開始され、796位で終結する。転写物はまた、表421に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質AA161187_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物AA161187_T21によってコードされる。公知のタンパク質(テスチシン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
AA161187_P19とTEST_HUMANとの間の比較の報告
1.TEST_HUMANのアミノ酸1〜183に対応し、AA161187_P19のアミノ酸1〜183にも対応するMGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIKEDEと少なくとも90%相同な第1のアミノ酸配列と、AA161187_P19のアミノ酸184〜188に対応する配列DKRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、AA161187_P19をコードする単離キメラポリペプチド。
2.AA161187_P19中の配列DKRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、AA161187_P19のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質AA161187_P19はまた、表422に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質テスチシン前駆体と比較した変異タンパク質AA161187_P19のグリコシル化部位を表423に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質AA161187_P19は、以下の転写物によってコードされる:AA161187_T21(配列は出願書類の最後に示す)。転写物AA161187_T21のコード部分を太字で示し、このコード部分は107位から開始され、670位で終結する。転写物はまた、表424に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AA161187_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターAA161187は、上の表404に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターAA161187_node_0は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T15、AA161187_T16、AA161187_T21、およびAA161187_T22。以下の表425は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_6は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T7およびAA161187_T20。以下の表426は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_14は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表427は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_16は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T22。以下の表428は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_25は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T16およびAA161187_T20。以下の表429は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表430に示す)。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_26は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、およびAA161187_T20。以下の表431は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_28は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T21。以下の表432は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターAA161187_node_4は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T21、およびAA161187_T22。以下の表433は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_7を、以下の転写物中に見出すことができる:AA161187_T7およびAA161187_T20。以下の表434は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_8は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表435は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_9は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表436は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_10は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表437は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_12を、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T21、およびAA161187_T22。以下の表438は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_13は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、AA161187_T20、AA161187_T21、およびAA161187_T22。以下の表439は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_19は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T16。以下の表440は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_20は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T16、およびAA161187_T20。以下の表441は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_21は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、およびAA161187_T20。以下の表442は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_22は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T15、AA161187_T16、およびAA161187_T20。以下の表443は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_23は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T0、AA161187_T7、AA161187_T16、およびAA161187_T20。以下の表444は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAA161187_node_24は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AA161187_T16およびAA161187_T20。以下の表445は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P6 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 2894.00 Escore: 0
Matching length: 284 Total length: 284
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
43 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
. . . . .
93 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 142
||||||||||||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
. . . . .
143 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 192
||||||||||||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
. . . . .
193 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 242
||||||||||||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 230
. . . . .
243 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 292
||||||||||||||||||||||||||||||||||||||||||||||||||
231 KDACFGDSGGPLACNKNGLWYQIGVVSWGVGCGRPNRPGVYTNISHHFEW 280
. . .
293 IQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV 326
||||||||||||||||||||||||||||||||||
281 IQKLMAQSGMSQPDPSWPLLFFPLLWALPLLGPV 314






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P13 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P14 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P18 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1957.00 Escore: 0
Matching length: 203 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 99.02 Total Percent Identity: 99.02
Gaps: 1

Alignment:
. . . . .
43 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 92
||||||||||||||||||||||||||||||||||||||||||||||||||
31 GPCGRRVITSRIVGGEDAELGRWPWQGSLRLWDSHVCGVSLLSHRWALTA 80
. . . . .
93 AHCFET..DLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 140
|||||| ||||||||||||||||||||||||||||||||||||||||||
81 AHCFETYSDLSDPSGWMVQFGQLTSMPSFWSLQAYYTRYFVSNIYLSPRY 130
. . . . .
141 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 190
||||||||||||||||||||||||||||||||||||||||||||||||||
131 LGNSPYDIALVKLSAPVTYTKHIQPICLQASTFEFENRTDCWVTGWGYIK 180
. . . . .
191 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 240
||||||||||||||||||||||||||||||||||||||||||||||||||
181 EDEALPSPHTLQEVQVAIINNSMCNHLFLKYSFRKDIFGDMVCAGNAQGG 230

241 KDACF 245
|||||
231 KDACF 235






Sequence name: TEST_HUMAN

Sequence documentation:

Alignment of: AA161187_P19 x TEST_HUMAN ..

Alignment segment 1/1:

Quality: 1829.00 Escore: 0
Matching length: 183 Total length: 183
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGARGALLLALLLARAGLRKPESQEAAPLSGPCGRRVITSRIVGGEDAEL 50
. . . . .
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GRWPWQGSLRLWDSHVCGVSLLSHRWALTAAHCFETYSDLSDPSGWMVQF 100
. . . . .
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 GQLTSMPSFWSLQAYYTRYFVSNIYLSPRYLGNSPYDIALVKLSAPVTYT 150
. . .
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183
|||||||||||||||||||||||||||||||||
151 KHIQPICLQASTFEFENRTDCWVTGWGYIKEDE 183


正常および癌性肺組織における配列名AA161187seg25中に示すアンプリコンによって検出可能なホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)AA161187転写物の発現
seg25、AA161187seg25アンプリコン(配列番号1654)、ならびにプライマーAA161187seg17F2(配列番号1652)およびAA161187seg17R2(配列番号1653)によって検出可能なホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)AA161187転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図64は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記ホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)転写物の過剰発現を示すヒストグラムである。
図64から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスプロテアーゼ、セリン、21(テスチシン)(PRSS21)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち1個および16個の扁平上皮細胞癌サンプルのうち3個、4個の大細胞癌サンプルのうち1個で少なくとも6倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:AA161187seg17F2順方向プライマーおよびAA161187seg17R2逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:AA161187seg25。

プライマー:
順方向プライマーAA161187seg17F2(配列番号1652):CCCTGTGCCTTATTTGACCCT
逆方向プライマーAA161187seg17R2(配列番号1653):GCTGGGTAGACTGGGTGCA
アンプリコンAA161187seg25(配列番号1654):CCTGTGCCTTATTTGACCCTCATGCCAACCCCGGGAGGTGGAGACTGTTGCCCCACTCTGCAGATGCAGAAACGGAGGCTTGGCTGCTGCCAGGGGGAGGA
クラスターR66178の説明
クラスターR66178は、目的の3つの転写物および16個のセグメントを特徴とし、その名称を、それぞれ表446および447に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表448に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるポリオウイルス受容体関連タンパク質1前駆体(SwissProtアクセッション識別子PVR1_HUMAN)、同義語ヘルペスウイルス侵入メディエーターC、HveC、ネクチン1、ヘルペスウイルスIg様受容体、HIgR、CD111抗原としても公知である)(配列番号1432)の変異型である。
タンパク質ポリオウイルス受容体関連タンパク質1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:おそらく細胞接着に関与する、細胞へのαヘルペスウイルス(HSV−1、HSV−2、および仮性狂犬病ウイルス)侵入の受容体。タンパク質ポリオウイルス受容体関連タンパク質1前駆体の配列を、「ポリオウイルス受容体関連タンパク質1前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質ポリオウイルス受容体関連タンパク質1前駆体の局在化は、I型膜タンパク質(イソ型αおよびδ)、分泌(イソ型γ)と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである免疫応答、細胞−細胞接着、分子機能に関連する注釈付けである細胞接着受容体、タンパク質結合、共同受容体、細胞成分に関連する注釈付けである接着結合、内在性膜タンパク質。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターR66178は、上の表1に列挙した3つの転写物を特徴とする。これらの転写物は、タンパク質ポリオウイルス受容体関連タンパク質1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R66178_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物R66178_T2によってコードされる。公知のタンパク質(ポリオウイルス受容体関連タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R66178_P3とPVR1_HUMANとの間の比較の報告
1.PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P3のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P3のアミノ酸335〜354に対応する配列GEGHSLPISPGVLQTQNCGPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P3をコードする単離キメラポリペプチド。
2.R66178_P3中の配列GEGHSLPISPGVLQTQNCGPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P3のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R66178_P3はまた、表449に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質ポリオウイルス受容体関連タンパク質1前駆体と比較した変異タンパク質R66178_P3のグリコシル化部位を表450に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質R66178_P3は、以下の転写物によってコードされる:R66178_T2(配列は出願書類の最後に示す)。転写物R66178_T2のコード部分を太字で示し、このコード部分は634位から開始され、1695位で終結する。転写物はまた、表451に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R66178_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物R66178_T3によってコードされる。公知のタンパク質(ポリオウイルス受容体関連タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R66178_P4とPVR1_HUMANとの間の比較の報告
1.PVR1_HUMANのアミノ酸1〜334に対応し、R66178_P4のアミノ酸1〜334にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEVNITと少なくとも90%相同な第1のアミノ酸配列と、R66178_P4のアミノ酸335〜352に対応する配列AFCQLIYPGKGRTRARMFを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P4をコードする単離キメラポリペプチド。
2.R66178_P4中の配列AFCQLIYPGKGRTRARMFと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P4のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R66178_P4はまた、表452に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質ポリオウイルス受容体関連タンパク質1前駆体と比較した変異タンパク質R66178_P4のグリコシル化部位を表453に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質R66178_P4は、以下の転写物によってコードされる:R66178_T3(配列は出願書類の最後に示す)。転写物R66178_T3のコード部分を太字で示し、このコード部分は634位から開始され、1689位で終結する。転写物はまた、表454に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R66178_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物R66178_T7によってコードされる。公知のタンパク質(ポリオウイルス受容体関連タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R66178_P8とPVR1_HUMANとの間の比較の報告
1.PVR1_HUMANのアミノ酸1〜330に対応し、R66178_P8のアミノ酸1〜330にも対応するMARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLHCSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFLRPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWIEGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRNPNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVTIEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTLFFKGPINYSLAGTYICEATNPIGTRSGQVEと少なくとも90%相同な第1のアミノ酸配列と、R66178_P8のアミノ酸331〜363に対応する配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R66178_P8をコードする単離キメラポリペプチド。
2.R66178_P8中の配列NSPTPRLLPNMGGAPGRCPRPSLGAWRGASCWCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R66178_P8のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R66178_P8はまた、表455に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質ポリオウイルス受容体関連タンパク質1前駆体と比較した変異タンパク質R66178_P8のグリコシル化部位を表456に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質R66178_P8は、以下の転写物によってコードされる:R66178_T7(配列は出願書類の最後に示す)。転写物R66178_T7のコード部分を太字で示し、このコード部分は634位から開始され、1722位で終結する。転写物はまた、表457に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R66178_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターR66178は、上の表2に列挙した16個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR66178_node_0は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表458は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_6は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表459は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_8は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表460は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表461に示す)。
Figure 2008507261
本発明のセグメントクラスターR66178_node_15は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表462は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_24は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2。以下の表463は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_26は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T7。以下の表464は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_27は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T7。以下の表465は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR66178_node_4は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表466は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_5を、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表467は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_9は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表468は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_11は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T2、R66178_T3、およびR66178_T7。以下の表469は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_16を、以下の転写物中に見出すことができる:R66178_T2およびR66178_T3。以下の表470は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_18は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T3。以下の表471は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_19を、以下の転写物中に見出すことができる:R66178_T3。以下の表472は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_20は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T3。以下の表473は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR66178_node_21は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R66178_T3。以下の表474は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P3 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3286.00 Escore: 0
Matching length: 334 Total length: 334
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNIT 334
||||||||||||||||||||||||||||||||||
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNIT 334






Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P4 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 336 Total length: 336
Matching Percent Similarity: 99.70 Matching Percent Identity: 99.70
Total Percent Similarity: 99.70 Total Percent Identity: 99.70
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNITAF 336
|||||||||||||||||||||||||||||||||| |
301 FFKGPINYSLAGTYICEATNPIGTRSGQVEVNITEF 336






Sequence name: PVR1_HUMAN

Sequence documentation:

Alignment of: R66178_P8 x PVR1_HUMAN ..

Alignment segment 1/1:

Quality: 3250.00 Escore: 0
Matching length: 330 Total length: 330
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MARMGLAGAAGRWWGLALGLTAFFLPGVHSQVVQVNDSMYGFIGTDVVLH 50
. . . . .
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CSFANPLPSVKITQVTWQKSTNGSKQNVAIYNPSMGVSVLAPYRERVEFL 100
. . . . .
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 RPSFTDGTIRLSRLELEDEGVYICEFATFPTGNRESQLNLTVMAKPTNWI 150
. . . . .
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 EGTQAVLRAKKGQDDKVLVATCTSANGKPPSVVSWETRLKGEAEYQEIRN 200
. . . . .
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 PNGTVTVISRYRLVPSREAHQQSLACIVNYHMDRFKESLTLNVQYEPEVT 250
. . . . .
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 IEGFDGNWYLQRMDVKLTCKADANPPATEYHWTTLNGSLPKGVEAQNRTL 300
. . .
301 FFKGPINYSLAGTYICEATNPIGTRSGQVE 330
||||||||||||||||||||||||||||||
301 FFKGPINYSLAGTYICEATNPIGTRSGQVE 330


クラスターHUMPHOSLIPの説明
クラスターHUMPHOSLIPは、目的の7つの転写物および53個のセグメントを特徴とし、その名称を、それぞれ表475および476に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表477に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるリン脂質輸送タンパク質前駆体(SwissProtアクセッション識別子PLTP_HUMAN、同義語脂質輸送タンパク質IIとしても公知である)(配列番号1433)の変異型である。
タンパク質リン脂質輸送タンパク質前駆体は、以下の機能を有することが公知であるか、そのように見なされている:HDLをより大きい粒子およびより小さい粒子に変換する。細胞外リン脂質輸送およびHDL粒子の調整で重要な役割を果たし得る。タンパク質リン脂質輸送タンパク質前駆体の配列を、「リン脂質輸送タンパク質前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表478に示す。
Figure 2008507261
タンパク質リン脂質輸送タンパク質前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである脂質代謝、脂質輸送、分子機能に関連する注釈付けである脂質結合、細胞成分に関連する注釈付けである細胞外。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
このクラスターについて、少なくとも1つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも1つの転写物/セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、肺癌に関して、このセグメントに達するが、以下の他のセグメント/転写物は達しないことが見出された(表479に示す)。
Figure 2008507261
上記のように、クラスターHUMPHOSLIPは、上の表1に列挙した7つの転写物を特徴とする。これらの転写物は、タンパク質リン脂質輸送タンパク質前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T17によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMPHOSLIP_PEA_2_P10とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、PLTP_HUMANのアミノ酸163〜493に対応し、HUMPHOSLIP_PEA_2_P10のアミノ酸68〜398にも対応するKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVTNHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAVと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P10をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEKを含み、以下の構造:アミノ酸番号67−x〜67のいずれかから始まり、アミノ酸番号68+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P10の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P10はまた、表480に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P10のグリコシル化部位を表481に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P10は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T17(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T17のコード部分を太字で示し、このコード部分は276位から開始され、1469位で終結する。転写物はまた、表482に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T19によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMPHOSLIP_PEA_2_P12とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜427に対応し、HUMPHOSLIP_PEA_2_P12のアミノ酸1〜427にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPNRAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLDMLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASVTIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHSALESLALIPLQAPLKTMLQIGVMPMLNと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P12のアミノ酸428〜432に対応する配列GKAGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P12をコードする単離キメラポリペプチド。
2.HUMPHOSLIP_PEA_2_P12中の配列GKAGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P12のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P12はまた、表483に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P12のグリコシル化部位を表484に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P12は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T19(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T19のコード部分を太字で示し、このコード部分は276位から開始され、1571位で終結する。転写物はまた、表485に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P30は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T6によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P30はまた、表486に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P30は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T6(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T6のコード部分を太字で示し、このコード部分は276位から開始され、431位で終結する。転写物はまた、表487に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P31は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T7によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMPHOSLIP_PEA_2_P31とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜67に対応し、HUMPHOSLIP_PEA_2_P31のアミノ酸1〜67にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P31のアミノ酸68〜98に対応する配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P31をコードする単離キメラポリペプチド。
2.HUMPHOSLIP_PEA_2_P31中の配列PGLERGADKFPVVGGSSLFLALDLTLRPPVGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P31のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P31はまた、表488に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P31配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P31のグリコシル化部位を表489に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P31は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T7(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T7のコード部分を太字で示し、このコード部分は276位から開始され、569位で終結する。転写物はまた、表490に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P31配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P33は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T14によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMPHOSLIP_PEA_2_P33とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜183に対応し、HUMPHOSLIP_PEA_2_P33のアミノ酸1〜183にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P33のアミノ酸184〜200に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P33をコードする単離キメラポリペプチド。
2.HUMPHOSLIP_PEA_2_P33中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P33のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P33はまた、表491に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P33配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P33のグリコシル化部位を表492に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P33は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T14(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T14のコード部分を太字で示し、このコード部分は276位から開始され、875位で終結する。転写物はまた、表493に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P33配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P34は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T16によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMPHOSLIP_PEA_2_P34とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜205に対応し、HUMPHOSLIP_PEA_2_P34のアミノ酸1〜205にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASVSRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLLDTVPVと少なくとも90%相同な第1のアミノ酸配列と、HUMPHOSLIP_PEA_2_P34のアミノ酸206〜217に対応する配列LWTSLLALTIPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P34をコードする単離キメラポリペプチド。
2.HUMPHOSLIP_PEA_2_P34中の配列LWTSLLALTIPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P34のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P34はまた、表494に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P34配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P34のグリコシル化部位を表495に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P34は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T16(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T16のコード部分を太字で示し、このコード部分は276位から開始され、926位で終結する。転写物はまた、表496に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P34配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMPHOSLIP_PEA_2_P35は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMPHOSLIP_PEA_2_T18によってコードされる。公知のタンパク質(リン脂質輸送タンパク質前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMPHOSLIP_PEA_2_P35とPLTP_HUMANとの間の比較の報告
1.PLTP_HUMANのアミノ酸1〜109に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸1〜109にも対応するMALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETITIPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLRFRRQLLYWFと少なくとも90%相同な第1のアミノ酸配列と、Lを含むアミノ酸配列を架橋する第2のアミノ酸配列と、PLTP_HUMANのアミノ酸163〜183に対応し、HUMPHOSLIP_PEA_2_P35のアミノ酸111〜131にも対応するKVYDFLSTFITSGMRFLLNQQと少なくとも90%相同な第3のアミノ酸配列と、HUMPHOSLIP_PEA_2_P35のアミノ酸132〜148に対応する配列VWAATGRRVARVGMLSLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMPHOSLIP_PEA_2_P35をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がFLKを含み、以下の構造(HUMPHOSLIP_PEA_2_P35に対応する番号付け):アミノ酸番号109−x〜109のいずれかから始まり、アミノ酸番号111+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMPHOSLIP_PEA_2_P35の縁部分をコードする単離キメラポリペプチド。
3.HUMPHOSLIP_PEA_2_P35中の配列VWAATGRRVARVGMLSLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMPHOSLIP_PEA_2_P35のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMPHOSLIP_PEA_2_P35はまた、表497に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P35配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質リン脂質輸送タンパク質前駆体と比較した変異タンパク質HUMPHOSLIP_PEA_2_P35のグリコシル化部位を表498に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMPHOSLIP_PEA_2_P35は、以下の転写物によってコードされる:HUMPHOSLIP_PEA_2_T18(配列は出願書類の最後に示す)。転写物HUMPHOSLIP_PEA_2_T18のコード部分を太字で示し、このコード部分は276位から開始され、719位で終結する。転写物はまた、表499に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMPHOSLIP_PEA_2_P35配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHUMPHOSLIPは、上の表2に列挙した53個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_0は、150個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表500は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_19は、186個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、およびHUMPHOSLIP_PEA_2_T19。以下の表501は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_34は、191個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表502は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_68は、131個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表503は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_70は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表504は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_75は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表505は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_2は、159個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表506は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_3を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表507は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_4を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表508は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_6を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表509は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node7を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表510は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_08、171個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表511は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_9は、168個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表512は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_14は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T7。以下の表513は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_15を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表514は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_16は、179個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表515は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_17を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表516は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_23は、168個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表517は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_24を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表518は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_25は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T14およびHUMPHOSLIP_PEA_2_T18。以下の表519は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_26は、163個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表520は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_2を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表521は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_30は、181個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表522は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_33は、173個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表523は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_36は、163個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表524は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_37を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表525は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_39は、166個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表525は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_40は、199個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表526は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_41は、186個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表527は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_42を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表528は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_44は、185個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表529は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_45は、197個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表530は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_47は、223個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表531は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_51を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表532は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_52は、235個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表533は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_53は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T19。以下の表534は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_54は、236個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表535は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_55は、232個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表536は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_58を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表537は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_59は、230個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表538は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_60を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表539は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_61を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表540は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_62を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表541は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_63を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表542は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_64を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表543は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_65を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表544は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_66は、180個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表545は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_67を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表546は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_69を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表547は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_71を、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表548は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_72は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表549は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_73は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表550は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMPHOSLIP_PEA_2_node_74は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMPHOSLIP_PEA_2_T6、HUMPHOSLIP_PEA_2_T7、HUMPHOSLIP_PEA_2_T14、HUMPHOSLIP_PEA_2_T16、HUMPHOSLIP_PEA_2_T17、HUMPHOSLIP_PEA_2_T18、およびHUMPHOSLIP_PEA_2_T19。以下の表551は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P10 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 3716.00 Escore: 0
Matching length: 398 Total length: 493
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 80.73 Total Percent Identity: 80.73
Gaps: 1

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISE................................. 67
|||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
67 .................................................. 67

101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
68 ............KVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 105
||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
. . . . .
106 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 155
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
. . . . .
156 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 205
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
. . . . .
206 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 255
||||||||||||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
. . . . .
256 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 305
||||||||||||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
. . . . .
306 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 355
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLNERTWRGVQIPLPEGINFVHEVVT 450
. . . .
356 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 398
|||||||||||||||||||||||||||||||||||||||||||
451 NHAGFLTIGADLHFAKGLREVIEKNRPADVRASTAPTPSTAAV 493






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P12 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 4101.00 Escore: 0
Matching length: 427 Total length: 427
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
. . . . .
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 DTVPVRSSVDELVGIDYSLMKDPVASTSNLDMDFRGAFFPLTERNWSLPN 250
. . . . .
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RAVEPQLQEEERMVYVAFSEFFFDSAMESYFRAGALQLLLVGDKVPHDLD 300
. . . . .
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 MLLRATYFGSIVLLSPAVIDSPLKLELRVLAPPRCTIKPSGTTISVTASV 350
. . . . .
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 TIALVPPDQPEVQLSSMTMDARLSAKMALRGKALRTQLDLRRFRIYSNHS 400
. .
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427
|||||||||||||||||||||||||||
401 ALESLALIPLQAPLKTMLQIGVMPMLN 427






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P31 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 639.00 Escore: 0
Matching length: 67 Total length: 67
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
.
51 IPDLRGKEGHFYYNISE 67
|||||||||||||||||
51 IPDLRGKEGHFYYNISE 67






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P33 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1767.00 Escore: 0
Matching length: 184 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.46
Total Percent Similarity: 100.00 Total Percent Identity: 99.46
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQV 184
|||||||||||||||||||||||||||||||||:
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQI 184






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P34 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1971.00 Escore: 0
Matching length: 205 Total length: 205
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . . . .
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQICPVLYHAGTVLLNSLL 200

201 DTVPV 205
|||||
201 DTVPV 205






Sequence name: PLTP_HUMAN

Sequence documentation:

Alignment of: HUMPHOSLIP_PEA_2_P35 x PLTP_HUMAN ..

Alignment segment 1/1:

Quality: 1158.00 Escore: 0
Matching length: 132 Total length: 184
Matching Percent Similarity: 100.00 Matching Percent Identity: 98.48
Total Percent Similarity: 71.74 Total Percent Identity: 70.65
Gaps: 1

Alignment:
. . . . .
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MALFGALFLALLAGAHAEFPGCKIRVTSKALELVKQEGLRFLEQELETIT 50
. . . . .
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 IPDLRGKEGHFYYNISEVKVTELQLTSSELDFQPQQELMLQITNASLGLR 100
. . . . .
101 FRRQLLYWFL........................................ 110
|||||||||:
101 FRRQLLYWFFYDGGYINASAEGVSIRTGLELSRDPAGRMKVSNVSCQASV 150
. . .
111 ............KVYDFLSTFITSGMRFLLNQQV 132
|||||||||||||||||||||:
151 SRMHAAFGGTFKKVYDFLSTFITSGMRFLLNQQI 184





クラスターAI076020の説明
クラスターAI076020は、目的の1つの転写物および8個のセグメントを特徴とし、その名称を、それぞれ表552および553に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表554に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるC1q関連因子前駆体(SwissProtアクセッション識別子C1RF_HUMAN)(配列番号1434)の変異型である。
タンパク質C1q関連因子前駆体の配列を、「C1q関連因子前駆体アミノ酸配列」として出願書類の最後に示す。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである運動器官の挙動。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターAI076020を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図31のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図31および表555中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、クラスターAI076020は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質C1q関連因子前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質AI076020_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物AI076020_T0によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質AI076020_P1はまた、表557に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AI076020_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質AI076020_P1は、以下の転写物によってコードされる:AI076020_T0(配列は出願書類の最後に示す)。転写物AI076020_T0のコード部分を太字で示し、このコード部分は261位から開始され、1034位で終結する。転写物はまた、表558に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質AI076020_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターAI076020は、上の表2に列挙した8個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターAI076020_node_0は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表559は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表560に示す)。
Figure 2008507261
本発明のセグメントクラスターAI076020_node_3は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表561は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAI076020_node_8は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表562は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターAI076020_node_1は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表563は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAI076020_node_4は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表564は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAI076020_node_5は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表565は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAI076020_node_6は、32個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表566は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターAI076020_node_7は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:AI076020_T0。以下の表567は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
クラスターT23580の説明
クラスターT23580は、目的の1つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表568および569に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表570に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれており、以前のSwissProtアクセッション識別子がNP25_HUMANでもある公知のタンパク質である神経タンパク質NP25(SwissProtアクセッション識別子TAG3_HUMAN、同義語神経タンパク質22、NP22、トランスゲリン−3(Transgelin−3)としても公知である)(配列番号1433)の変異型である。
タンパク質神経タンパク質NP25の配列を、「神経タンパク質NP25アミノ酸配列」として出願書類の最後に示す。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである中枢神経系発達。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
このクラスターについて、少なくとも1つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも1つの転写物/セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、肺癌に関して、このクラスターに達するが、以下の他のセグメント/転写物は達しないことが見出された(表571に示す)。
Figure 2008507261
上記のように、クラスターT23580は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質神経タンパク質NP25の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質T23580_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物T23580_T10によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質T23580_P5はまた、表572に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T23580_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T23580_P5は、以下の転写物によってコードされる:T23580_T10(配列は出願書類の最後に示す)。転写物T23580_T10のコード部分を太字で示し、このコード部分は1066位から開始され、1485位で終結する。転写物はまた、表573に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T23580_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターT23580は、上の表2に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターT23580_node_17は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T23580_T10。以下の表574は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT23580_node_18は、102個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T23580_T10。以下の表575は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT23580_node_21は、79個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T23580_T10。以下の表576は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターT23580_node_19を、以下の転写物中に見出すことができる:T23580_T10。以下の表577は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT23580_node_20を、以下の転写物中に見出すことができる:T23580_T10。以下の表578は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
クラスターM79217の説明
クラスターM79217は、目的の6つの転写物および32個のセグメントを特徴とし、その名称を、それぞれ表579および580に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表581に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるエクソストシン(Exostosin)様3(SwissProtアクセッション識別子EXL3_HUMAN)、同義語EC2.4.1.223、グルクロニル−ガラクトシル−プロテオグリカン4−α−N−アセチルグルコサミニルトランスフェラーゼ、推定腫瘍抑制タンパク質EXTL3、多エクソストシン様タンパク質3、遺伝性多外骨腫症遺伝子イソログ(isolog)、EXT関連タンパク質1としても公知である)(配列番号1436)の変異型である。
タンパク質エクソストシン様3は、以下の機能を有することが公知であるか、そのように見なされている:グリコシルトランスフェラーゼの可能性がある(類似性による)。タンパク質エクソストシン様3の配列を、「エクソストシン様3アミノ酸配列」として出願書類の最後に示す。タンパク質エクソストシン様3の局在化は、II型膜タンパク質と考えられる。小胞体。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞の成長および/または維持、分子機能に関連する注釈付けであるトランスフェラーゼ、トランスフェリングリコシル基、および細胞成分に関連する注釈付けである小胞体、内在性膜タンパク質。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターM79217は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質エクソストシン様3の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質M79217_PEA_1_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T1によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M79217_PEA_1_P1とBAA25445(配列番号1437)との間の比較の報告
1.BAA25445のアミノ酸13〜931に対応し、M79217_PEA_1_P1のアミノ酸1〜919にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第1のアミノ酸配列を含む、M79217_PEA_1_P1をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、Signalp_hmmソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。
変異タンパク質M79217_PEA_1_P1は、以下の転写物によってコードされる:M79217_PEA_1_T1(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T1のコード部分を太字で示し、このコード部分は1074位から開始され、3830位で終結する。転写物はまた、表582に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M79217_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T8によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M79217_PEA_1_P2とEXL3_HUMANとの間の比較の報告
1.EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P2のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸820〜919に対応し、M79217_PEA_1_P2のアミノ酸808〜907にも対応するAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P2をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKAを含み、以下の構造:アミノ酸番号807−x〜807のいずれかから始まり、アミノ酸番号808+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M79217_PEA_1_P2の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、Signalp_hmmソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。
変異タンパク質M79217_PEA_1_P2はまた、表583に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質エクソストシン様3と比較した変異タンパク質M79217_PEA_1_P2のグリコシル化部位を表584に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M79217_PEA_1_P2は、以下の転写物によってコードされる:M79217_PEA_1_T8(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T8のコード部分を太字で示し、このコード部分は748位から開始され、3468位で終結する。転写物はまた、表585に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M79217_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T10によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M79217_PEA_1_P4とEXL3_HUMANとの間の比較の報告
1.M79217_PEA_1_P4のアミノ酸1〜51に対応する配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、EXL3_HUMANのアミノ酸759〜919に対応し、M79217_PEA_1_P4のアミノ酸52〜212にも対応するRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTRLPHDKTKCFKFIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P4をコードする単離キメラポリペプチド。
2.M79217_PEA_1_P4の配列PELRQPARLGLPECWDYRHEPRCPAQMGSHFIVQAGLKLLASSKPPKCWDYと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P4の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質M79217_PEA_1_P4はまた、表586に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質エクソストシン様3と比較した変異タンパク質M79217_PEA_1_P4のグリコシル化部位を表587に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M79217_PEA_1_P4は、以下の転写物によってコードされる:M79217_PEA_1_T10(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T10のコード部分を太字で示し、このコード部分は1位から開始され、637位で終結する。転写物はまた、表588に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M79217_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T15によってコードされる。公知のタンパク質(エクソストシン様3)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M79217_PEA_1_P8とEXL3_HUMANとの間の比較の報告
1.EXL3_HUMANのアミノ酸1〜807に対応し、M79217_PEA_1_P8のアミノ酸1〜807にも対応するMTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYYLTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKRQELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQPKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYDSDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVVLRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQSTFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKIESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTCKNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATRLFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSLSDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAAAEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDFYRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEFQAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPKLPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLRHDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHKと少なくとも90%相同な第1のアミノ酸配列と、M79217_PEA_1_P8のアミノ酸808〜812に対応する配列VRKSWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M79217_PEA_1_P8をコードする単離キメラポリペプチド。
2.M79217_PEA_1_P8中の配列VRKSWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M79217_PEA_1_P8のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、Signalp_hmmソフトウェアによってこのタンパク質がシグナルアンカー領域を有すると推定されるので、膜と考えられる。
変異タンパク質M79217_PEA_1_P8はまた、表589に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質エクソストシン様3と比較した変異タンパク質M79217_PEA_1_P8のグリコシル化部位を表590に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M79217_PEA_1_P8は、以下の転写物によってコードされる:M79217_PEA_1_T15(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T15のコード部分を太字で示し、このコード部分は748位から開始され、3183位で終結する。転写物はまた、表591に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M79217_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物M79217_PEA_1_T18によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Signal peptide,NN:NO)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質M79217_PEA_1_P11はまた、表592に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質M79217_PEA_1_P11は、以下の転写物によってコードされる:M79217_PEA_1_T18(配列は出願書類の最後に示す)。転写物M79217_PEA_1_T18のコード部分を太字で示し、このコード部分は1354位から開始され、1674位で終結する。転写物はまた、表593に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M79217_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターM79217は、上の表2に列挙した32個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターM79217_PEA_1_node_2は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T3。以下の表594は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_4は、8個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T8、M79217_PEA_1_T15、およびM79217_PEA_1_T18。以下の表595は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_9は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1。以下の表596は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_10は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T15、およびM79217_PEA_1_T18。以下の表597は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)表598に示す。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_11は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表599は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_13は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表600は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_14は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表601は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_16は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表602は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_23は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T15。以下の表603は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_24は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T15。以下の表604は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_31は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表605は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_33は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表606は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_34は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表607は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_35は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表608は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_37は、58個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表609は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_38は、62個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表610は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_41は、171個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表611は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_44は、89個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表612は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターM79217_PEA_1_node_0は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T3。以下の表613は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_7は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T15、およびM79217_PEA_1_T18。以下の表614は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_12を、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T15。以下の表615は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_19は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T10。以下の表616は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_21は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T10。以下の表617は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_26は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、およびM79217_PEA_1_T10。以下の表618は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_27は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表619は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_30は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表620は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_32は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表621は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_36は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表622は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_39は、57個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表623は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_40は、59個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、およびM79217_PEA_1_T10。以下の表624は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_42は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表625は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM79217_PEA_1_node_43は、90個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M79217_PEA_1_T1、M79217_PEA_1_T3、M79217_PEA_1_T8、M79217_PEA_1_T10、およびM79217_PEA_1_T18。以下の表626は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: BAA25445

Sequence documentation:

Alignment of: M79217_PEA_1_P1 x BAA25445 ..

Alignment segment 1/1:

Quality: 9101.00 Escore: 0
Matching length: 919 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
13 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 62
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
63 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 112
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
113 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 162
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
163 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 212
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
213 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 262
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
263 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 312
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
313 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 362
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
363 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 412
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
413 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 462
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
463 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 512
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
513 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 562
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
563 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 612
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
613 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 662
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
663 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 712
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
713 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 762
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
763 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 812
. . . . .
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 850
||||||||||||||||||||||||||||||||||||||||||||||||||
813 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 862
. . . . .
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
||||||||||||||||||||||||||||||||||||||||||||||||||
863 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 912
.
901 SVLFKTRLPHDKTKCFKFI 919
|||||||||||||||||||
913 SVLFKTRLPHDKTKCFKFI 931






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P2 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 8873.00 Escore: 0
Matching length: 907 Total length: 919
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 98.69 Total Percent Identity: 98.69
Gaps: 1

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
. . . . .
801 GAAFFHK............AIRDMVDEYINCEDIAMNFLVSHITRKPPIK 838
||||||| |||||||||||||||||||||||||||||||
801 GAAFFHKYYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIK 850
. . . . .
839 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 888
||||||||||||||||||||||||||||||||||||||||||||||||||
851 VTSRWTFRCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVD 900
.
889 SVLFKTRLPHDKTKCFKFI 907
|||||||||||||||||||
901 SVLFKTRLPHDKTKCFKFI 919






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P4 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 1668.00 Escore: 0
Matching length: 162 Total length: 162
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.38
Total Percent Similarity: 100.00 Total Percent Identity: 99.38
Gaps: 0

Alignment:
. . . . .
51 YRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 100
:|||||||||||||||||||||||||||||||||||||||||||||||||
758 FRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLTGAAFFHK 807
. . . . .
101 YYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTF 150
||||||||||||||||||||||||||||||||||||||||||||||||||
808 YYAYLYSYVMPQAIRDMVDEYINCEDIAMNFLVSHITRKPPIKVTSRWTF 857
. . . . .
151 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
858 RCPGCPQALSHDDSHFHERHKCINFFVKVYGYMPLLYTQFRVDSVLFKTR 907
.
201 LPHDKTKCFKFI 212
||||||||||||
908 LPHDKTKCFKFI 919






Sequence name: EXL3_HUMAN

Sequence documentation:

Alignment of: M79217_PEA_1_P8 x EXL3_HUMAN ..

Alignment segment 1/1:

Quality: 7947.00 Escore: 0
Matching length: 807 Total length: 807
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTGYTMLRNGGAGNGGQTCMLRWSNRIRLTWLSFTLFVILVFFPLIAHYY 50
. . . . .
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LTTLDEADEAGKRIFGPRVGNELCEVKHVLDLCRIRESVSEELLQLEAKR 100
. . . . .
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 QELNSEIAKLNLKIEACKKSIENAKQDLLQLKNVISQTEHSYKELMAQNQ 150
. . . . .
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 PKLSLPIRLLPEKDDAGLPPPKATRGCRLHNCFDYSRCPLTSGFPVYVYD 200
. . . . .
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 SDQFVFGSYLDPLVKQAFQATARANVYVTENADIACLYVILVGEMQEPVV 250
. . . . .
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 LRPAELEKQLYSLPHWRTDGHNHVIINLSRKSDTQNLLYNVSTGRAMVAQ 300
. . . . .
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 STFYTVQYRPGFDLVVSPLVHAMSEPNFMEIPPQVPVKRKYLFTFQGEKI 350
. . . . .
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 ESLRSSLQEARSFEEEMEGDPPADYDDRIIATLKAVQDSKLDQVLVEFTC 400
. . . . .
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 KNQPKPSLPTEWALCGEREDRLELLKLSTFALIITPGDPRLVISSGCATR 450
. . . . .
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 LFEALEVGAVPVVLGEQVQLPYQDMLQWNEAALVVPKPRVTEVHFLLRSL 500
. . . . .
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 SDSDLLAMRRQGRFLWETYFSTADSIFNTVLAMIRTRIQIPAAPIREEAA 550
. . . . .
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AEIPHRSGKAAGTDPNMADNGDLDLGPVETEPPYASPRYLRNFTLTVTDF 600
. . . . .
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 YRSWNCAPGPFHLFPHTPFDPVLPSEAKFLGSGTGFRPIGGGAGGSGKEF 650
. . . . .
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 QAALGGNVPREQFTVVMLTYEREEVLMNSLERLNGLPYLNKVVVVWNSPK 700
. . . . .
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPSEDLLWPDIGVPIMVVRTEKNSLNNRFLPWNEIETEAILSIDDDAHLR 750
. . . . .
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 HDEIMFGFRVWREARDRIVGFPGRYHAWDIPHQSWLYNSNYSCELSMVLT 800

801 GAAFFHK 807
|||||||
801 GAAFFHK 807

クラスターM62096の説明
クラスターM62096は、目的の9つの転写物および42個のセグメントを特徴とし、その名称を、それぞれ表627および628に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表629に示す。
Figure 2008507261

Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるキネシン重鎖イソ型5C(SwissProtアクセッション識別子KF5C_HUMAN)、同義語キネシン重鎖ニューロン特異的2としても公知である)(配列番号1438)の変異型である。
タンパク質キネシン重鎖イソ型5Cは、以下の機能を有することが公知であるか、そのように見なされている:キネシンは、オルガネラ輸送で役割を果たし得る微小間結合移動(force producing)タンパク質である。タンパク質キネシン重鎖イソ型5Cの配列を、「キネシン重鎖イソ型5Cアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表630に示す。
Figure 2008507261
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるオルガネラの組織化、および生合成、分子機能に関連する注釈付けである微小管モーター、ATP結合、および細胞成分に関連する注釈付けであるキネシン。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターM62096は、上の表1に列挙した9つの転写物を特徴とする。これらの転写物は、タンパク質キネシン重鎖イソ型5Cの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質M62096_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T6によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P4とKF5C_HUMANとの間の比較の報告
1.M62096_PEA_1_P4のアミノ酸1〜6に対応する配列MATYIHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸239〜957に対応し、M62096_PEA_1_P4のアミノ酸7〜725にも対応するVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P4をコードする単離キメラポリペプチド。
2.M62096_PEA_1_P4の配列MATYIHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P4の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P4は、以下の転写物によってコードされる:M62096_PEA_1_T6(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T6のコード部分を太字で示し、このコード部分は108位から開始され、2282位で終結する。転写物はまた、表631に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T7によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P5とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸284〜957に対応し、M62096_PEA_1_P5のアミノ酸1〜674にも対応するMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P5をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P5は、以下の転写物によってコードされる:M62096_PEA_1_T7(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T7のコード部分を太字で示し、このコード部分は283位から開始され、2304位で終結する。転写物はまた、表632に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T9によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P3とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸365〜957に対応し、M62096_PEA_1_P3のアミノ酸1〜593にも対応するMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第1のアミノ酸配列を含む、M62096_PEA_1_P3をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P3は、以下の転写物によってコードされる:M62096_PEA_1_T9(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T9のコード部分を太字で示し、このコード部分は565位から開始され、2343位で終結する。転写物はまた、表633に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T11によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P7とKF5C_HUMANとの間の比較の報告
1.M62096_PEA_1_P7のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜957に対応し、M62096_PEA_1_P7のアミノ酸20〜239にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P7をコードする単離キメラポリペプチド。
2.M62096_PEA_1_P7の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P7の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Non−secretory protein,NN:YES)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質M62096_PEA_1_P7は、以下の転写物によってコードされる:M62096_PEA_1_T11(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T11のコード部分を太字で示し、このコード部分は633位から開始され、1349位で終結する。転写物はまた、表634に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T13によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P8とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜736に対応し、M62096_PEA_1_P8のアミノ酸1〜736にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P8のアミノ酸737〜737に対応する配列Eを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P8をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P8はまた、表635に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質M62096_PEA_1_P8は、以下の転写物によってコードされる:M62096_PEA_1_T13(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T13のコード部分を太字で示し、このコード部分は396位から開始され、2606位で終結する。転写物はまた、表636に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T14によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P9とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜454に対応し、M62096_PEA_1_P9のアミノ酸1〜454にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDEと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P9のアミノ酸455〜514に対応する配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P9をコードする単離キメラポリペプチド。
2.M62096_PEA_1_P9中の配列VKNAIYFFFHKVLLLLFVVDVCSRNLIGIEAFHNYRIMWKFLGRCPFTASYKLIITEFRKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P9のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P9はまた、表637に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質M62096_PEA_1_P9は、以下の転写物によってコードされる:M62096_PEA_1_T14(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T14のコード部分を太字で示し、このコード部分は396位から開始され、1937位で終結する。転写物はまた、表638に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T15によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P10とKF5C_HUMANとの間の比較の報告
1.M62096_PEA_1_P10のアミノ酸1〜19に対応する配列MTQNFRLMWNILLFPLNFSを有するポリペプチドとと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、KF5C_HUMANのアミノ酸738〜815に対応し、M62096_PEA_1_P10のアミノ酸20〜97にも対応するLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVKKと少なくとも90%相同な第2のアミノ酸配列と、M62096_PEA_1_P10のアミノ酸98〜125に対応する配列VSSLCLNGTEKKIKDGREESFSVEISLAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P10をコードする単離キメラポリペプチド。
2.M62096_PEA_1_P10の配列MTQNFRLMWNILLFPLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10の先端をコードする単離ポリペプチド。
3.M62096_PEA_1_P10中の配列VSSLCLNGTEKKIKDGREESFSVEISLAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P10のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、2つのうちの1つのシグナルペプチド推定プログラム(HMM:Non−secretory protein,NN:YES)によってこのタンパク質がシグナルペプチドを有すると推定されるので、分泌されると考えられる。
変異タンパク質M62096_PEA_1_P10は、以下の転写物によってコードされる:M62096_PEA_1_T15(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T15のコード部分を太字で示し、このコード部分は633位から開始され、1007位で終結する。
本発明の変異タンパク質M62096_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T4によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P11とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜372に対応し、M62096_PEA_1_P11のアミノ酸1〜372にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P11のアミノ酸373〜385に対応する配列DFLAAHVFGKLLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P11をコードする単離キメラポリペプチド。
2.M62096_PEA_1_P11中の配列DFLAAHVFGKLLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M62096_PEA_1_P11のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P11はまた、表639に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質M62096_PEA_1_P11は、以下の転写物によってコードされる:M62096_PEA_1_T4(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T4のコード部分を太字で示し、このコード部分は396位から開始され、1550位で終結する。転写物はまた、表640に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M62096_PEA_1_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物M62096_PEA_1_T5によってコードされる。公知のタンパク質(キネシン重鎖イソ型5C)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M62096_PEA_1_P12とKF5C_HUMANとの間の比較の報告
1.KF5C_HUMANのアミノ酸1〜323に対応し、M62096_PEA_1_P12のアミノ酸1〜323にも対応するMADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFDRVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLHDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNEHSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRと少なくとも90%相同な第1のアミノ酸配列と、M62096_PEA_1_P12のアミノ酸324〜324に対応する配列Vを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M62096_PEA_1_P12をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質M62096_PEA_1_P12はまた、表641に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質M62096_PEA_1_P12は、以下の転写物によってコードされる:M62096_PEA_1_T5(配列は出願書類の最後に示す)。転写物M62096_PEA_1_T5のコード部分を太字で示し、このコード部分は378位から開始され、1349位で終結する。転写物はまた、表642に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M62096_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターM62096は、上の表2に列挙した42個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターM62096_PEA_1_node_0は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表643は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_2は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表644は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_15は、28個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表645は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_17は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T7。以下の表646は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_19は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T6およびM62096_PEA_1_T9。以下の表647は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_23は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表648は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_27は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表649は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_29は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4。以下の表650は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_31は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表651は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_34は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T14。以下の表652は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_36は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表653は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_38は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表654は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_40は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表655は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_48は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T13。以下の表656は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_50は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T11およびM62096_PEA_1_T15。以下の表657は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_56は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T15。以下の表658は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_60は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表659は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_65は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表660は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_69は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表661は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_71は、178個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表662は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターM62096_PEA_1_node_1を、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表663は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_4は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表664は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_6は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表665は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_7は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表666は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_9は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表667は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_11は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表668は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_13は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表669は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_21は、33個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表670は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_25は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T5およびM62096_PEA_1_T9。以下の表671は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_33は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T13、およびM62096_PEA_1_T14。以下の表672は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_42は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表673は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_44は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表674は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_47は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T13。以下の表675は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表676に示す)。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_51は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T11、およびM62096_PEA_1_T15。以下の表677は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_53は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T11、およびM62096_PEA_1_T15。以下の表678は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_55は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、M62096_PEA_1_T11、およびM62096_PEA_1_T15。以下の表679は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_58は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表680は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_62は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表681は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_66は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表682は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_67を、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表683は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_68を、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表684は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM62096_PEA_1_node_70は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M62096_PEA_1_T4、M62096_PEA_1_T5、M62096_PEA_1_T6、M62096_PEA_1_T7、M62096_PEA_1_T9、およびM62096_PEA_1_T11。以下の表685は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P4 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6936.00 Escore: 0
Matching length: 719 Total length: 719
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
7 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRIL 56
||||||||||||||||||||||||||||||||||||||||||||||||||
239 VSKTGAEGAVLDEAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRIL 288
. . . . .
57 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 106
||||||||||||||||||||||||||||||||||||||||||||||||||
289 QDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELT 338
. . . . .
107 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 156
||||||||||||||||||||||||||||||||||||||||||||||||||
339 AEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQK 388
. . . . .
157 NLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 206
||||||||||||||||||||||||||||||||||||||||||||||||||
389 NLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQ 438
. . . . .
207 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 256
||||||||||||||||||||||||||||||||||||||||||||||||||
439 SQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVL 488
. . . . .
257 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 306
||||||||||||||||||||||||||||||||||||||||||||||||||
489 QALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQE 538
. . . . .
307 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 356
||||||||||||||||||||||||||||||||||||||||||||||||||
539 LSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMAR 588
. . . . .
357 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 406
||||||||||||||||||||||||||||||||||||||||||||||||||
589 LYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEA 638
. . . . .
407 KIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKE 456
||||||||||||||||||||||||||||||||||||||||||||||||||
639 KIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKE 688
. . . . .
457 HLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDL 506
||||||||||||||||||||||||||||||||||||||||||||||||||
689 HLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRDL 738
. . . . .
507 NQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLE 556
||||||||||||||||||||||||||||||||||||||||||||||||||
739 NQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGLE 788
. . . . .
557 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 606
||||||||||||||||||||||||||||||||||||||||||||||||||
789 ETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFLE 838
. . . . .
607 NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKE 656
||||||||||||||||||||||||||||||||||||||||||||||||||
839 NNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAKE 888
. . . . .
657 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTA 706
||||||||||||||||||||||||||||||||||||||||||||||||||
889 NAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPTA 938
.
707 VHAIRGGGGSSSNSTHYQK 725
|||||||||||||||||||
939 VHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P5 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 6520.00 Escore: 0
Matching length: 674 Total length: 674
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
284 MTRILQDSLGGNCRTTIVICCSPSVFNEAETKSTLMFGQRAKTIKNTVSV 333
. . . . .
51 NLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQIS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
334 NLELTAEEWKKKYEKEKEKNKTLKNVIQHLEMELNRWRNGEAVPEDEQIS 383
. . . . .
101 AKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDD 150
||||||||||||||||||||||||||||||||||||||||||||||||||
384 AKDQKNLEPCDNTPIIDNIAPVVAGISTEEKEKYDEEISSLYRQLDDKDD 433
. . . . .
151 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
434 EINQQSQLAEKLKQQMLDQDELLASTRRDYEKIQEELTRLQIENEAAKDE 483
. . . . .
201 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 250
||||||||||||||||||||||||||||||||||||||||||||||||||
484 VKEVLQALEELAVNYDQKSQEVEDKTRANEQLTDELAQKTTTLTTTQREL 533
. . . . .
251 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 300
||||||||||||||||||||||||||||||||||||||||||||||||||
534 SQLQELSNHQKKRATEILNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEE 583
. . . . .
301 FTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLI 350
||||||||||||||||||||||||||||||||||||||||||||||||||
584 FTMARLYISKMKSEVKSLVNRSKQLESAQMDSNRKMNASERELAACQLLI 633
. . . . .
351 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
634 SQHEAKIKSLTDYMQNMEQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQ 683
. . . . .
401 DKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 450
||||||||||||||||||||||||||||||||||||||||||||||||||
684 DKEKEHLTRLQDAEEMKKALEQQMESHREAHQKQLSRLRDEIEEKQKIID 733
. . . . .
451 EIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQARED 500
||||||||||||||||||||||||||||||||||||||||||||||||||
734 EIRDLNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQARED 783
. . . . .
501 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 550
||||||||||||||||||||||||||||||||||||||||||||||||||
784 LKGLEETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQK 833
. . . . .
551 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESAL 600
||||||||||||||||||||||||||||||||||||||||||||||||||
834 ISFLENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESAL 883
. . . . .
601 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPA 650
||||||||||||||||||||||||||||||||||||||||||||||||||
884 KEAKENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPA 933
. .
651 SSPTAVHAIRGGGGSSSNSTHYQK 674
||||||||||||||||||||||||
934 SSPTAVHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P3 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 5726.00 Escore: 0
Matching length: 593 Total length: 593
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEK 50
||||||||||||||||||||||||||||||||||||||||||||||||||
365 MELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIIDNIAPVVAGISTEEK 414
. . . . .
51 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 100
||||||||||||||||||||||||||||||||||||||||||||||||||
415 EKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQMLDQDELLASTRRDYE 464
. . . . .
101 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
465 KIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQKSQEVEDKTRANEQ 514
. . . . .
151 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 200
||||||||||||||||||||||||||||||||||||||||||||||||||
515 LTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEILNLLLKDLGEIGGI 564
. . . . .
201 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
565 IGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKSLVNRSKQLESAQMD 614
. . . . .
251 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 300
||||||||||||||||||||||||||||||||||||||||||||||||||
615 SNRKMNASERELAACQLLISQHEAKIKSLTDYMQNMEQKRRQLEESQDSL 664
. . . . .
301 SEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAH 350
||||||||||||||||||||||||||||||||||||||||||||||||||
665 SEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMKKALEQQMESHREAH 714
. . . . .
351 QKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQERE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
715 QKQLSRLRDEIEEKQKIIDEIRDLNQKLQLEQEKLSSDYNKLKIEDQERE 764
. . . . .
401 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 450
||||||||||||||||||||||||||||||||||||||||||||||||||
765 MKLEKLLLLNDKREQAREDLKGLEETVSRELQTLHNLRKLFVQDLTTRVK 814
. . . . .
451 KSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPK 500
||||||||||||||||||||||||||||||||||||||||||||||||||
815 KSVELDNDDGGGSAAQKQKISFLENNLEQLTKVHKQLVRDNADLRCELPK 864
. . . . .
501 LEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 550
||||||||||||||||||||||||||||||||||||||||||||||||||
865 LEKRLRATAERVKALESALKEAKENAMRDRKRYQQEVDRIKEAVRAKNMA 914
. . . .
551 RRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK 593
|||||||||||||||||||||||||||||||||||||||||||
915 RRAHSAQIAKPIRPGHYPASSPTAVHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P7 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 2117.00 Escore: 0
Matching length: 220 Total length: 220
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
20 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 787
. . . . .
70 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 119
||||||||||||||||||||||||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKKSVELDNDDGGGSAAQKQKISFL 837
. . . . .
120 ENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAK 169
||||||||||||||||||||||||||||||||||||||||||||||||||
838 ENNLEQLTKVHKQLVRDNADLRCELPKLEKRLRATAERVKALESALKEAK 887
. . . . .
170 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPT 219
||||||||||||||||||||||||||||||||||||||||||||||||||
888 ENAMRDRKRYQQEVDRIKEAVRAKNMARRAHSAQIAKPIRPGHYPASSPT 937
. .
220 AVHAIRGGGGSSSNSTHYQK 239
||||||||||||||||||||
938 AVHAIRGGGGSSSNSTHYQK 957






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P8 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 7146.00 Escore: 0
Matching length: 737 Total length: 737
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.86
Total Percent Similarity: 100.00 Total Percent Identity: 99.86
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. . . . .
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
. . . . .
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
. . . . .
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 DQDELLASTRRDYEKIQEELTRLQIENEAAKDEVKEVLQALEELAVNYDQ 500
. . . . .
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 KSQEVEDKTRANEQLTDELAQKTTTLTTTQRELSQLQELSNHQKKRATEI 550
. . . . .
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 LNLLLKDLGEIGGIIGTNDVKTLADVNGVIEEEFTMARLYISKMKSEVKS 600
. . . . .
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LVNRSKQLESAQMDSNRKMNASERELAACQLLISQHEAKIKSLTDYMQNM 650
. . . . .
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 EQKRRQLEESQDSLSEELAKLRAQEKMHEVSFQDKEKEHLTRLQDAEEMK 700
. . .
701 KALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRE 737
||||||||||||||||||||||||||||||||||||:
701 KALEQQMESHREAHQKQLSRLRDEIEEKQKIIDEIRD 737






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P9 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 4434.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. . . . .
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRNGEAVPEDEQISAKDQKNLEPCDNTPIID 400
. . . . .
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 NIAPVVAGISTEEKEKYDEEISSLYRQLDDKDDEINQQSQLAEKLKQQML 450

451 DQDE 454
||||
451 DQDE 454






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P10 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 747.00 Escore: 0
Matching length: 78 Total length: 78
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
20 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 69
||||||||||||||||||||||||||||||||||||||||||||||||||
738 LNQKLQLEQEKLSSDYNKLKIEDQEREMKLEKLLLLNDKREQAREDLKGL 787
. .
70 EETVSRELQTLHNLRKLFVQDLTTRVKK 97
||||||||||||||||||||||||||||
788 EETVSRELQTLHNLRKLFVQDLTTRVKK 815






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P11 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3634.00 Escore: 0
Matching length: 372 Total length: 372
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. . . . .
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQRAKTIKNTVSVNLELTAEEWKKKYEKEK 350
. .
351 EKNKTLKNVIQHLEMELNRWRN 372
||||||||||||||||||||||
351 EKNKTLKNVIQHLEMELNRWRN 372






Sequence name: KF5C_HUMAN

Sequence documentation:

Alignment of: M62096_PEA_1_P12 x KF5C_HUMAN ..

Alignment segment 1/1:

Quality: 3145.00 Escore: 0
Matching length: 323 Total length: 323
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MADPAECSIKVMCRFRPLNEAEILRGDKFIPKFKGDETVVIGQGKPYVFD 50
. . . . .
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 RVLPPNTTQEQVYNACAKQIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKL 100
. . . . .
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 HDPQLMGIIPRIAHDIFDHIYSMDENLEFHIKVSYFEIYLDKIRDLLDVS 150
. . . . .
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 KTNLAVHEDKNRVPYVKGCTERFVSSPEEVMDVIDEGKANRHVAVTNMNE 200
. . . . .
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 HSSRSHSIFLINIKQENVETEKKLSGKLYLVDLAGSEKVSKTGAEGAVLD 250
. . . . .
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 EAKNINKSLSALGNVISALAEGTKTHVPYRDSKMTRILQDSLGGNCRTTI 300
. .
301 VICCSPSVFNEAETKSTLMFGQR 323
|||||||||||||||||||||||
301 VICCSPSVFNEAETKSTLMFGQR 323


正常および癌性肺組織における配列名M62069seg19中に示すアンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)M62069転写物の発現
seg19、M62069seg19アンプリコン(配列番号1657)、ならびにM62069seg19F(配列番号1655)およびM62069seg19R(配列番号1656)プライマーによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図65は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。
図65から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち8個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:M62069seg19F順方向プライマーおよびM62069seg19R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:M62069seg19。
順方向プライマー−M62069seg19F(配列番号1655):GCTGATTGTCCCCATGAAGG
逆方向プライマー−M62069seg19(配列番号1656):TGGCATACGGGAACTCAGTG
アンプリコン(配列番号1657):GCTGATTGTCCCCATGAAGGCCAGCCTTGAAGCTTGGTCAGTCTCCCTAACTGTATGATTGATCCCCACTTATTGCACTACATCACTGAGTTCCCGTATGC
正常および癌性肺組織における配列名M62069seg29中に示すアンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)M62069転写物の発現
seg29、M62069seg29アンプリコン(配列番号1660)、ならびにM62069seg29F(配列番号1658)およびM62069seg29R(配列番号1659)プライマーによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図66は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。
図66から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスタンパク質チロシンホスファターゼ受容体S型(PTPRS)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち2個および8個の小細胞癌サンプルのうち7個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:M62069seg29F順方向プライマーおよびM62069seg29R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:M62069seg29。

順方向プライマー−M62069seg29F:ATTGAATAATTCAGCACCTGAGGC
逆方向プライマー−M62069seg29R:TTCATATGGCTACTCCCCACCT
アンプリコン:ATTGAATAATTCAGCACCTGAGGCTGGTGGATGATTCTTTGCAATTTGGCAGGAATGGGAGAGTCGGGAGCAGTAGTTGGCAAGGTGGGGAGTAGCCATATGAA
クラスターM78076の説明
クラスターM78076は、目的の9つの転写物および35個のセグメントを特徴とし、その名称を、それぞれ表686および687に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表688に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアミロイド様タンパク質1前駆体(SwissProtアクセッション識別子APP1_HUMAN、同義語APLP、APLP−1としても公知である)(配列番号1439)の変異型である。
タンパク質アミロイド様タンパク質1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:シナプス後機能で役割を果たし得る。C末端γセクレターゼプロセシングフラグメント(ALID1)は、APBB1(Fe65)結合によって転写活性化を活性化する(類似性による)。C末端結合を介してJIPシグナル変換に関連する。細胞Gタンパク質シグナル伝達経路と相互作用し得る。ヘパリンおよびI型コラーゲンなどの細胞外基質成分への結合によって神経突起伸長を調節することができる。γ−CTFペプチドC30は、神経アポトーシスの強力なエンハンサーである(類似性による)。タンパク質アミロイド様タンパク質1前駆体の配列を、「アミロイド様タンパク質1前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表689に示す。
Figure 2008507261
タンパク質アミロイド様タンパク質1前駆体の局在化は、I型膜タンパク質と考えられる。ゴルジ複合体でのC末端プロセシング。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるエンドサイトーシス、アポトーシス、細胞接着、ニューロン新生、細胞死、分子機能に関連する注釈付けであるタンパク質結合、ヘパリン結合、および細胞成分に関連する注釈付けである基底膜、被覆小窩、内在性膜タンパク質。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターM78076は、上の表1に列挙した9つの転写物を特徴とする。これらの転写物は、タンパク質アミロイド様タンパク質1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質M78076_PEA_1_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T2によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P3とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜517に対応し、M78076_PEA_1_P3のアミノ酸1〜517にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P3のアミノ酸518〜519に対応する配列GEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P3をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M78076_PEA_1_P3はまた、表690に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P3のグリコシル化部位を表691に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P3は、以下の転写物によってコードされる:M78076_PEA_1_T2(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T2のコード部分を太字で示し、このコード部分は142位から開始され、1698位で終結する。転写物はまた、表692に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T3によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P4とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P4のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P4のアミノ酸527〜541に対応する配列ECLTVNPSLQIPLNPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P4をコードする単離キメラポリペプチド。
2.M78076_PEA_1_P4中の配列ECLTVNPSLQIPLNPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P4のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M78076_PEA_1_P4はまた、表693に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P4のグリコシル化部位を表694に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P4は、以下の転写物によってコードされる:M78076_PEA_1_T3(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T3のコード部分を太字で示し、このコード部分は142位から開始され、1764位で終結する。転写物はまた、表695に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T13によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P12とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜526に対応し、M78076_PEA_1_P12のアミノ酸1〜526にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P12のアミノ酸527〜544に対応する配列ECVCSKGFPFPLIGDSEGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P12をコードする単離キメラポリペプチド。
2.M78076_PEA_1_P12中の配列ECVCSKGFPFPLIGDSEGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P12のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M78076_PEA_1_P12はまた、表696に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P12のグリコシル化部位を表697に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P12は、以下の転写物によってコードされる:M78076_PEA_1_T13(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T13のコード部分を太字で示し、このコード部分は142位から開始され、1773位で終結する。転写物はまた、表698に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P12配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T15によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P14とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜570に対応し、M78076_PEA_1_P14のアミノ酸1〜570にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P14のアミノ酸571〜619に対応する配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P14をコードする単離キメラポリペプチド。
2.M78076_PEA_1_P14中の配列VRGGTAGYLGEETRGQRPGCDSQSHTGPSKKPSAPSPLPAGTSWDRGVPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P14のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M78076_PEA_1_P14はまた、表699に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P14のグリコシル化部位を表700に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P14は、以下の転写物によってコードされる:M78076_PEA_1_T15(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T15のコード部分を太字で示し、このコード部分は142位から開始され、1998位で終結する。転写物はまた、表701に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P21は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T23によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P21とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜352に対応し、M78076_PEA_1_P21のアミノ酸1〜352にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEと少なくとも90%相同な第1のアミノ酸配列と、APP1_HUMANのアミノ酸406〜650に対応し、M78076_PEA_1_P21のアミノ酸353〜597にも対応するAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAPGGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKVNASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSMLLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERPと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P21をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEAを含み、以下の構造:アミノ酸番号352−x〜352のいずれかから始まり、アミノ酸番号353+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、M78076_PEA_1_P21の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意され、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質M78076_PEA_1_P21はまた、表702に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P21のグリコシル化部位を表703に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P21は、以下の転写物によってコードされる:M78076_PEA_1_T23(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T23のコード部分を太字で示し、このコード部分は142位から開始され、1932位で終結する。転写物はまた、表704に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P24は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T26によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P24とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜481に対応し、M78076_PEA_1_P24のアミノ酸1〜481にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVHTHLQVIEERVNQSLGLLDQNPHLAQELRPQIと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P24のアミノ酸482〜498に対応する配列RECLLPWLPLQISEGRSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P24をコードする単離キメラポリペプチド。
2.M78076_PEA_1_P24中の配列RECLLPWLPLQISEGRSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P24のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M78076_PEA_1_P24はまた、表705に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P24のグリコシル化部位を表706に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P24は、以下の転写物によってコードされる:M78076_PEA_1_T26(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T26のコード部分を太字で示し、このコード部分は142位から開始され、1635位で終結する。転写物はまた、表707に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T27によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P2とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜449に対応し、M78076_PEA_1_P2のアミノ酸1〜449にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P2のアミノ酸450〜588に対応する配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P2をコードする単離キメラポリペプチド。
2.M78076_PEA_1_P2中の配列LTSFQLPNAPLFLRRPRLRLFSCPLDPLSVSWTPSYPLNTASLPLPSLSAQLPDPETWTLTCCVFDPCFLALGFLLPPPSILCSVPWIFTAFPRIVFFFFFFLRQVLALSPRQESSVRSWLIATSTSWVQAILLPQPLEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P2のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意され、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質M78076_PEA_1_P2はまた、表708に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P2のグリコシル化部位を表709に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P2は、以下の転写物によってコードされる:M78076_PEA_1_T27(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T27のコード部分を太字で示し、このコード部分は142位から開始され、1905位で終結する。転写物はまた、表710に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質M78076_PEA_1_P25は、出願書類の最後に示すアミノ酸配列を有し、転写物M78076_PEA_1_T28によってコードされる。公知のタンパク質(アミロイド様タンパク質1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
M78076_PEA_1_P25とAPP1_HUMANとの間の比較の報告
1.APP1_HUMANのアミノ酸1〜448に対応し、M78076_PEA_1_P25のアミノ酸1〜448にも対応するMGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEAPGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYPELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEALLVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSDRFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFPQPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGMPGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQALNEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQと少なくとも90%相同な第1のアミノ酸配列と、M78076_PEA_1_P25のアミノ酸449〜505に対応する配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、M78076_PEA_1_P25をコードする単離キメラポリペプチド。
2.M78076_PEA_1_P25中の配列PQNPNSQPRAAGSLEVIISHPFVRRLEILISPFQFQNSIPKNSQIVPAASPRGTSSPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、M78076_PEA_1_P25のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質M78076_PEA_1_P25はまた、表711に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質アミロイド様タンパク質1前駆体と比較した変異タンパク質M78076_PEA_1_P25のグリコシル化部位を表712に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質M78076_PEA_1_P25は、以下の転写物によってコードされる:M78076_PEA_1_T28(配列は出願書類の最後に示す)。転写物M78076_PEA_1_T28のコード部分を太字で示し、このコード部分は142位から開始され、1656位で終結する。転写物はまた、表713に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質M78076_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターM78076は、上の表2に列挙した35個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターM78076_PEA_1_node_0は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表714は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_10は、70個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表715は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_15は、74個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表716は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_18は、95個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表717は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_20は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表718は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_24は、105個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表719は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_26は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表720は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_29は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T27。以下の表721は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_32は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T26およびM78076_PEA_1_T27。以下の表722は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_35は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2およびM78076_PEA_1_T5。以下の表723は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_37は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T3およびM78076_PEA_1_T5。以下の表724は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_46は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T15。以下の表725は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_47は、155個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表726は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_54は、133個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、およびM78076_PEA_1_T28。以下の表727は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターM78076_PEA_1_node_1は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表728は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_2を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表729は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_3は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表730は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_6は、59個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表731は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_7は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表732は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_12は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表733は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_22は、92個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、M78076_PEA_1_T27、およびM78076_PEA_1_T28。以下の表734は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_27を、以下の転写物中に見出すことができる:M78076_PEA_1_T27。以下の表735は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_30は、90個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、およびM78076_PEA_1_T27。以下の表736は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_31は、89個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、M78076_PEA_1_T26、およびM78076_PEA_1_T27。以下の表737は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_34は、103個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表738は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_36を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表739は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_41を、以下の転写物中に見出すことができる:M78076_PEA_1_T3およびM78076_PEA_1_T5。以下の表740は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_42を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表741は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_43は、110個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表742は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表743に示す)。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_45は、132個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表744は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表745に示す)。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_49は、129個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表746は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_50は、125個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表747は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_51は、123個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表748は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_52を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、およびM78076_PEA_1_T23。以下の表749は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターM78076_PEA_1_node_53を、以下の転写物中に見出すことができる:M78076_PEA_1_T2、M78076_PEA_1_T3、M78076_PEA_1_T5、M78076_PEA_1_T13、M78076_PEA_1_T15、M78076_PEA_1_T23、およびM78076_PEA_1_T28。以下の表750は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P3 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5132.00 Escore: 0
Matching length: 517 Total length: 517
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
.
501 GGSSEDKGGLQPPDSKD 517
|||||||||||||||||
501 GGSSEDKGGLQPPDSKD 517






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P4 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P12 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5223.00 Escore: 0
Matching length: 526 Total length: 526
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. .
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526
||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKG 526






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P14 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5672.00 Escore: 0
Matching length: 575 Total length: 575
Matching Percent Similarity: 99.48 Matching Percent Identity: 99.48
Total Percent Similarity: 99.48 Total Percent Identity: 99.48
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. .
551 NASVPRGFPFHSSEIQRDELVRGGT 575
|||||||||||||||||||| ||
551 NASVPRGFPFHSSEIQRDELAPAGT 575






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P21 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 5822.00 Escore: 0
Matching length: 597 Total length: 650
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 91.85 Total Percent Identity: 91.85
Gaps: 1

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NE................................................ 352
||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
353 .....AERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 397
|||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . . . .
398 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 447
||||||||||||||||||||||||||||||||||||||||||||||||||
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELLHSEHLGPSELEAPAP 500
. . . . .
448 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 497
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GGSSEDKGGLQPPDSKDDTPMTLPKGSTEQDAASPEKEKMNPLEQYERKV 550
. . . . .
498 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 547
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NASVPRGFPFHSSEIQRDELAPAGTGVSREAVSGLLIMGAGGGSLIVLSM 600
. . . . .
548 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 597
||||||||||||||||||||||||||||||||||||||||||||||||||
601 LLLRRKKPYGAISHGVVEVDPMLTLEEQQLRELQRHGYENPTYRFLEERP 650






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P24 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4791.00 Escore: 0
Matching length: 485 Total length: 485
Matching Percent Similarity: 99.79 Matching Percent Identity: 99.59
Total Percent Similarity: 99.79 Total Percent Identity: 99.59
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450
. . .
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIRECL 485
|||||||||||||||||||||||||||||||:| |
451 THLQVIEERVNQSLGLLDQNPHLAQELRPQIQELL 485






Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P2 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4474.00 Escore: 0
Matching length: 454 Total length: 454
Matching Percent Similarity: 99.56 Matching Percent Identity: 99.34
Total Percent Similarity: 99.56 Total Percent Identity: 99.34
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVL 450
|||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQVH 450

451 TSFQ 454
| :|
451 THLQ 454







Sequence name: APP1_HUMAN

Sequence documentation:

Alignment of: M78076_PEA_1_P25 x APP1_HUMAN ..

Alignment segment 1/1:

Quality: 4455.00 Escore: 0
Matching length: 448 Total length: 448
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MGPASPAARGLSRRPGQPPLPLLLPLLLLLLRAQPAIGSLAGGSPGAAEA 50
. . . . .
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PGSAQVAGLCGRLTLHRDLRTGRWEPDPQRSRRCLRDPQRVLEYCRQMYP 100
. . . . .
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ELQIARVEQATQAIPMERWCGGSRSGSCAHPHHQVVPFRCLPGEFVSEAL 150
. . . . .
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LVPEGCRFLHQERMDQCESSTRRHQEAQEACSSQGLILHGSGMLLPCGSD 200
. . . . .
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 RFRGVEYVCCPPPGTPDPSGTAVGDPSTRSWPPGSRVEGAEDEEEEESFP 250
. . . . .
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 QPVDDYFVEPPQAEEEEETVPPPSSHTLAVVGKVTPTPRPTDGVDIYFGM 300
. . . . .
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 PGEISEHEGFLRAKMDLEERRMRQINEVMREWAMADNQSKNLPKADRQAL 350
. . . . .
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NEHFQSILQTLEEQVSGERQRLVETHATRVIALINDQRRAALEGFLAALQ 400
. . . .
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448
||||||||||||||||||||||||||||||||||||||||||||||||
401 ADPPQAERVLLALRRYLRAEQKEQRHTLRHYQHVAAVDPEKAQQMRFQ 448

クラスターT99080の説明
クラスターT99080は、目的の14個の転写物および11個のセグメントを特徴とし、その名称を、それぞれ表751および752に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表753に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアシルホスファターゼ器官共通型イソ酵素(SwissProtアクセッション識別子ACYO_HUMAN、同義語EC3.6.1.7、アシルホスファターゼホスホヒドロラーゼ、アシルホスファターゼ赤血球イソ酵素としても公知である)(配列番号1440)の変異型である。
タンパク質アシルホスファターゼ器官共通型イソ酵素の配列を、「アシルホスファターゼ器官共通型イソ酵素アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表754に示す。
Figure 2008507261
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるリン酸塩代謝、分子機能に関連する注釈付けであるアシルホスファターゼ。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターT99080は、上の表1に列挙した14個の転写物を特徴とする。これらの転写物は、タンパク質アシルホスファターゼ器官共通型イソ酵素の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質T99080_PEA_4_P1は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T0によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T99080_PEA_4_P1はまた、表755に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T99080_PEA_4_P1は、以下の転写物によってコードされる:T99080_PEA_4_T0(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T0のコード部分を太字で示し、このコード部分は226位から開始され、411位で終結する。転写物はまた、表756に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P1配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_4_T2によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質T99080_PEA_4_P2は、以下の転写物によってコードされる:T99080_PEA_4_T2(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T2のコード部分を太字で示し、このコード部分は1位から開始され、192位で終結する。転写物はまた、表757に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_4_T6によってコードされる。公知のタンパク質(アシルホスファターゼ器官共通型イソ酵素)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T99080_PEA_4_P5とACYO_HUMAN_V1(配列番号1441)との間の比較の報告
1.T99080_PEA_4_P5のアミノ酸1〜30に対応する配列MPASARLAGAGLLLAFLRALGCAGRAPGLSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸1〜99に対応し、T99080_PEA_4_P5のアミノ酸31〜129にも対応するMAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P5をコードする単離キメラポリペプチド。
2.T99080_PEA_4_P5の配列MPASARLAGAGLLLAFLRALGCAGRAPGLSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T99080_PEA_4_P5の先端をコードする単離ポリペプチド。
公知のタンパク質配列(ACYO_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をACYO_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T99080_PEA_4_P5はまた、表759に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T99080_PEA_4_P5は、以下の転写物によってコードされる:T99080_PEA_4_T6(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T6のコード部分を太字で示し、このコード部分は226位から開始され、612位で終結する。転写物はまた、表760に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_4_T9によってコードされる。公知のタンパク質(アシルホスファターゼ器官共通型イソ酵素)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T99080_PEA_4_P8とACYO_HUMAN_V1との間の比較の報告
1.T99080_PEA_4_P8のアミノ酸1〜1に対応する配列Mを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、ACYO_HUMAN_V1のアミノ酸28〜99に対応し、T99080_PEA_4_P8のアミノ酸2〜73にも対応するQAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVKと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T99080_PEA_4_P8をコードする単離キメラポリペプチド。
公知のタンパク質配列(ACYO_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をACYO_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質T99080_PEA_4_P8は、以下の転写物によってコードされる:T99080_PEA_4_T9(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T9のコード部分を太字で示し、このコード部分は162位から開始され、380位で終結する。転写物はまた、表762に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T10によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質T99080_PEA_4_P9は、以下の転写物によってコードされる:T99080_PEA_4_T10(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T10のコード部分を太字で示し、このコード部分は1位から開始され、261位で終結する。転写物はまた、表763に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T11によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質T99080_PEA_4_P10は、以下の転写物によってコードされる:T99080_PEA_4_T11(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T11のコード部分を太字で示し、このコード部分は1位から開始され、240位で終結する。転写物はまた、表764に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P12は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T14によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質T99080_PEA_4_P12は、以下の転写物によってコードされる:T99080_PEA_4_T14(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T14のコード部分を太字で示し、このコード部分は1位から開始され、282位で終結する。
本発明の変異タンパク質T99080_PEA_4_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T17によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、部分的タンパク質であるが、両膜貫通領域推定プログラムによってこのタンパク質が膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質T99080_PEA_4_P13は、以下の転写物によってコードされる:T99080_PEA_4_T17(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T17のコード部分を太字で示し、このコード部分は1位から開始され、207位で終結する。
本発明の変異タンパク質T99080_PEA_4_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T18によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T99080_PEA_4_P14はまた、表765に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T99080_PEA_4_P14は、以下の転写物によってコードされる:T99080_PEA_4_T18(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T18のコード部分を太字で示し、このコード部分は226位から開始され、480位で終結する。転写物はまた、表766に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T19によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T99080_PEA_4_P15はまた、表767に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T99080_PEA_4_P15は、以下の転写物によってコードされる:T99080_PEA_4_T19(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T19のコード部分を太字で示し、このコード部分は226位から開始され、459位で終結する。転写物はまた、表768に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T20によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T99080_PEA_4_P16はまた、表769に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T99080_PEA_4_P16は、以下の転写物によってコードされる:T99080_PEA_4_T20(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T20のコード部分を太字で示し、このコード部分は226位から開始され、501位で終結する。転写物はまた、表770に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T99080_PEA_4_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物T99080_PEA_1_T21によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T99080_PEA_4_P17はまた、表771に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T99080_PEA_4_P17は、以下の転写物によってコードされる:T99080_PEA_4_T21(配列は出願書類の最後に示す)。転写物T99080_PEA_4_T21のコード部分を太字で示し、このコード部分は226位から開始され、426位で終結する。転写物はまた、表772に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T99080_PEA_4_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターT99080は、上の表2に列挙した11個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターT99080_PEA_4_node_1は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T6、T99080_PEA_4_T13、T99080_PEA_4_T18、T99080_PEA_4_T19、T99080_PEA_4_T20、およびT99080_PEA_4_T21。以下の表773は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_6は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T17およびT99080_PEA_4_T21。以下の表774は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_11は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T14およびT99080_PEA_4_T20。以下の表775は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_19は、59個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T2、およびT99080_PEA_4_T4。以下の表776は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_20は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T2、T99080_PEA_4_T4、T99080_PEA_4_T6、T99080_PEA_4_T9、T99080_PEA_4_T10、T99080_PEA_4_T11、T99080_PEA_4_T13、T99080_PEA_4_T18、およびT99080_PEA_4_T19。以下の表777は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターT99080_PEA_4_node_3は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T2、T99080_PEA_4_T9、T99080_PEA_4_T10、T99080_PEA_4_T11、T99080_PEA_4_T14、およびT99080_PEA_4_T17。以下の表778は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_5は、57個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0、T99080_PEA_4_T2、T99080_PEA_4_T6、T99080_PEA_4_T10、T99080_PEA_4_T11、T99080_PEA_4_T14、T99080_PEA_4_T17、T99080_PEA_4_T18、T99080_PEA_4_T19、T99080_PEA_4_T20、およびT99080_PEA_4_T21。以下の表779は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_8は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T9、T99080_PEA_4_T10、T99080_PEA_4_T14、T99080_PEA_4_T18、およびT99080_PEA_4_T20。以下の表780は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表781に示す)。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_13は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T4。以下の表782は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_15は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T11およびT99080_PEA_4_T19。以下の表783は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT99080_PEA_4_node_18は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T99080_PEA_4_T0およびT99080_PEA_4_T2。以下の表784は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: ACYO_HUMAN_V1



Sequence documentation:



Alignment of: T99080_PEA_4_P5 x ACYO_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 973.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

31 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 80

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MAEGNTLISVDYEIFGKVQGVFFRKHTQAEGKKLGLVGWVQNTDRGTVQG 50

. . . .

81 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVK 129

|||||||||||||||||||||||||||||||||||||||||||||||||

51 QLQGPISKVRHMQEWLETRGSPKSHIDKANFNNEKVILKLDYSDFQIVK 99













Sequence name: ACYO_HUMAN_V1



Sequence documentation:



Alignment of: T99080_PEA_4_P8 x ACYO_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 711.00 Escore: 0

Matching length: 72 Total length: 72

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

2 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 51

||||||||||||||||||||||||||||||||||||||||||||||||||

28 QAEGKKLGLVGWVQNTDRGTVQGQLQGPISKVRHMQEWLETRGSPKSHID 77

. .

52 KANFNNEKVILKLDYSDFQIVK 73

||||||||||||||||||||||

78 KANFNNEKVILKLDYSDFQIVK 99






クラスターT08446の説明
クラスターT08446は、目的の2つの転写物および36個のセグメントを特徴とし、その名称を、それぞれ表785および786に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表787に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるソーティングネキシン26(Sorting nexin 26)(SwissProtアクセッション識別子SNXQ_HUMAN)(配列番号1442)の変異型である。
タンパク質ソーティングネキシン26は、以下の機能を有することが公知であるか、そのように見なされている:いくつかの細胞内輸送段階に関与し得る(類似性による)。タンパク質ソーティングネキシン26の配列を、「ソーティングネキシン26アミノ酸配列」として出願書類の最後に示す。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞内タンパク質輸送、分子機能に関連する注釈付けであるタンパク質輸送体。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
上記のように、クラスターT08446は、上の表1に列挙した2個の転写物を特徴とする。これらの転写物は、タンパク質ソーティングネキシン26の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質T08446_PEA_1_P18は、出願書類の最後に示すアミノ酸配列を有し、転写物T08446_PEA_1_T2によってコードされる。公知のタンパク質(ソーティングネキシン26)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T08446_PEA_1_P18とSNXQ_HUMANとの間の比較の報告
1.SNXQ_HUMANのアミノ酸1〜185に対応し、T08446_PEA_1_P18のアミノ酸1〜185にも対応するMLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMEと少なくとも90%相同な第1のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸186〜1305に対応する配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
2.T08446_PEA_1_P18中の配列LDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18のテールをコードする単離ポリペプチド。
T08446_PEA_1_P18とQ9NT23(配列番号1443)との間の比較の報告
1.T08446_PEA_1_P18のアミノ酸1〜443に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q9NT23のアミノ酸1〜674に対応し、T08446_PEA_1_P18のアミノ酸444〜1117にも対応するHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1118に対応する架橋アミノ酸Pと、Q9NT23のアミノ酸676〜862に対応し、T08446_PEA_1_P18のアミノ酸1119〜1305にも対応するTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
2.T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチド。
T08446_PEA_1_P18とQ96CP3(配列番号1444)との間の比較の報告
1.T08446_PEA_1_P18のアミノ酸1〜1010に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q96CP3のアミノ酸1〜295に対応し、T08446_PEA_1_P18のアミノ酸1011〜1305にも対応するLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
2.T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチド。
T08446_PEA_1_P18とBAC86902(配列番号1445)との間の比較の報告
1.T08446_PEA_1_P18のアミノ酸1〜154に対応する配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC86902のアミノ酸1〜861に対応し、T08446_PEA_1_P18のアミノ酸155〜1015にも対応するMLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIPAVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVGFFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLAGLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCSEFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVSSLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPMGTSRRGLRGPAと少なくとも90%相同な第2のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1016〜1043に対応する配列QVSAQLRAGGGGRDAPEAAAQSPCSVPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列と、BAC86902のアミノ酸862〜989に対応し、T08446_PEA_1_P18のアミノ酸1044〜1171にも対応するQVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAPSCFPPDHLGYSと少なくとも90%相同な第4のアミノ酸配列と、T08446_PEA_1_P18のアミノ酸1172〜1305に対応する配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第5のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、第3のアミノ酸配列、第4のアミノ酸配列、および第5のアミノ酸配列が、隣接し、且つ連続した順序にある、T08446_PEA_1_P18をコードする単離キメラポリペプチド。
2.T08446_PEA_1_P18の配列MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKPGKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELVFGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGARAAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18の先端をコードする単離ポリペプチド。
3.T08446_PEA_1_P18に対応するQVSAQLRAGGGGRDAPEAAAQSPCSVPSをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、T08446_PEA_1_P18の縁部分をコードする単離ポリペプチド。
4.T08446_PEA_1_P18中の配列APQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYCと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T08446_PEA_1_P18のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T08446_PEA_1_P18はまた、表788に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T08446_PEA_1_P18は、以下の転写物によってコードされる:T08446_PEA_1_T2(配列は出願書類の最後に示す)。転写物T08446_PEA_1_T2のコード部分を太字で示し、このコード部分は228位から開始され、4142位で終結する。転写物はまた、表789に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P18配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T08446_PEA_1_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物T08446_PEA_1_T22によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質T08446_PEA_1_P19はまた、表790に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T08446_PEA_1_P19は、以下の転写物によってコードされる:T08446_PEA_1_T22(配列は出願書類の最後に示す)。転写物T08446_PEA_1_T22のコード部分を太字で示し、このコード部分は228位から開始され、965位で終結する。転写物はまた、表791に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T08446_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターT08446は、上の表2に列挙した36個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターT08446_PEA_1_node_2は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表792は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_9は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表793は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_15は、0個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T22。以下の表794は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_17は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表794は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_25は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表12は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_29は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表795は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_38は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表796は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_43は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表797は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_51は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表798は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_52は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表799は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_55は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表800は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_57は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表801は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_59は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表802は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_62は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表803は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_63は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表804は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターT08446_PEA_1_node_3は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表805は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_5は、17個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表806は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表807に示す)。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_7は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表808は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表809に示す)。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_12は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2およびT08446_PEA_1_T22。以下の表810は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_13は、0個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T22。以下の表811は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_19は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表812は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_21は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表813は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_23は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表814は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_27は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表815は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_32は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表816は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_34は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表817は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_45は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表818は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_46は、18個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表819は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_48は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表820は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_54を、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表821は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_58は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表822は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_60は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表823は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_61は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表824は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_64を、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表825は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_65は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表826は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT08446_PEA_1_node_66は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T08446_PEA_1_T2。以下の表827は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: SNXQ_HUMAN



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x SNXQ_HUMAN ..



Alignment segment 1/1:



Quality: 1835.00 Escore: 0

Matching length: 185 Total length: 185

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKP 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MLSLSLCSHLWGPLILSALQARSTDSLDGPGEGSVQPLPTAGGPSVKGKP 50

. . . . .

51 GKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELV 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 GKRLSAPRGPFPRLADCAHFHYENVDFGHIQLLLSPDREGPSLSGENELV 100

. . . . .

101 FGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGA 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 FGVQVTCQGRSWPVLRSYDDFRSLDAHLHRCIFDRRFSCLPELPPPPEGA 150

. . .

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185

|||||||||||||||||||||||||||||||||||

151 RAAQMLVPLLLQYLETLSGLVDSNLNCGPVLTWME 185













Sequence name: Q9NT23



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x Q9NT23 ..



Alignment segment 1/1:



Quality: 8548.00 Escore: 0

Matching length: 862 Total length: 862

Matching Percent Similarity: 99.88 Matching Percent Identity: 99.88

Total Percent Similarity: 99.88 Total Percent Identity: 99.88

Gaps: 0



Alignment:

. . . . .

444 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRS 493

||||||||||||||||||||||||||||||||||||||||||||||||||

1 HDVIQQLPPPHYRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRS 50

. . . . .

494 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 543

||||||||||||||||||||||||||||||||||||||||||||||||||

51 MELESVGMGGAAAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRC 100

. . . . .

544 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERR 593

||||||||||||||||||||||||||||||||||||||||||||||||||

101 LLPRPKSLAGSCPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERR 150

. . . . .

594 KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSR 643

||||||||||||||||||||||||||||||||||||||||||||||||||

151 KGERGEKQRKPGGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSR 200

. . . . .

644 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 693

||||||||||||||||||||||||||||||||||||||||||||||||||

201 PDTVTLRSAKSEESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSC 250

. . . . .

694 ESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELD 743

||||||||||||||||||||||||||||||||||||||||||||||||||

251 ESLSSSSSSESSSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELD 300

. . . . .

744 FSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVT 793

||||||||||||||||||||||||||||||||||||||||||||||||||

301 FSPPRCLEGLRGLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVT 350

. . . . .

794 PQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPA 843

||||||||||||||||||||||||||||||||||||||||||||||||||

351 PQAISPRGPTSPASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPA 400

. . . . .

844 LSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPL 893

||||||||||||||||||||||||||||||||||||||||||||||||||

401 LSPGRSLRPHLIPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPL 450

. . . . .

894 PPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPP 943

||||||||||||||||||||||||||||||||||||||||||||||||||

451 PPPPLSLLRPGGAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPP 500

. . . . .

944 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 993

||||||||||||||||||||||||||||||||||||||||||||||||||

501 ASQSPFHRSLSLEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQS 550

. . . . .

994 DGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 1043

||||||||||||||||||||||||||||||||||||||||||||||||||

551 DGSLLRSQRPMGTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPS 600

. . . . .

1044 QVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGP 1093

||||||||||||||||||||||||||||||||||||||||||||||||||

601 QVPTPGFFSPAPRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGP 650

. . . . .

1094 PAPLDRGENLYYEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQS 1143

|||||||||||||||||||||||| |||||||||||||||||||||||||

651 PAPLDRGENLYYEIGASEGSPYSGLTRSWSPFRSMPPDRLNASYGMLGQS 700

. . . . .

1144 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 1193

||||||||||||||||||||||||||||||||||||||||||||||||||

701 PPLHRSPDFLLSYPPAPSCFPPDHLGYSAPQHPARRPTPPEPLYVNLALG 750

. . . . .

1194 PRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGP 1243

||||||||||||||||||||||||||||||||||||||||||||||||||

751 PRGPSPASSSSSSPPAHPRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGP 800

. . . . .

1244 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 1293

||||||||||||||||||||||||||||||||||||||||||||||||||

801 WGPPEPLLLYRAAPPAYGRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSW 850

.

1294 SLHSEGQTRSYC 1305

||||||||||||

851 SLHSEGQTRSYC 862













Sequence name: Q96CP3



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x Q96CP3 ..



Alignment segment 1/1:



Quality: 3019.00 Escore: 0

Matching length: 295 Total length: 295

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1011 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLP 1060

||||||||||||||||||||||||||||||||||||||||||||||||||

1 LRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPAPRECLP 50

. . . . .

1061 PFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGAS 1110

||||||||||||||||||||||||||||||||||||||||||||||||||

51 PFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLYYEIGAS 100

. . . . .

1111 EGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAP 1160

||||||||||||||||||||||||||||||||||||||||||||||||||

101 EGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLLSYPPAP 150

. . . . .

1161 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAH 1210

||||||||||||||||||||||||||||||||||||||||||||||||||

151 SCFPPDHLGYSAPQHPARRPTPPEPLYVNLALGPRGPSPASSSSSSPPAH 200

. . . . .

1211 PRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAY 1260

||||||||||||||||||||||||||||||||||||||||||||||||||

201 PRSRSDPGPPVPRLPQKQRAPWGPRTPHRVPGPWGPPEPLLLYRAAPPAY 250

. . . .

1261 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC 1305

|||||||||||||||||||||||||||||||||||||||||||||

251 GRGGELHRGSLYRNGGQRGEGAGPPPPYPTPSWSLHSEGQTRSYC 295













Sequence name: BAC86902



Sequence documentation:



Alignment of: T08446_PEA_1_P18 x BAC86902 ..



Alignment segment 1/1:



Quality: 9651.00 Escore: 0

Matching length: 991 Total length: 1019

Matching Percent Similarity: 99.90 Matching Percent Identity: 99.90

Total Percent Similarity: 97.15 Total Percent Identity: 97.15

Gaps: 1



Alignment:

. . . . .

155 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 204

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MLVPLLLQYLETLSGLVDSNLNCGPVLTWMELDNHGRRLLLSEEASLNIP 50

. . . . .

205 AVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVG 254

||||||||||||||||||||||||||||||||||||||||||||||||||

51 AVAAAHVIKRYTAQAPDELSFEVGDIVSVIDMPPTEDRSWWRGKRGFQVG 100

. . . . .

255 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 304

||||||||||||||||||||||||||||||||||||||||||||||||||

101 FFPSECVELFTERPGPGLKADADGPPCGIPAPQGISSLTSAVPRPRGKLA 150

. . . . .

305 GLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCS 354

||||||||||||||||||||||||||||||||||||||||||||||||||

151 GLLRTFMRSRPSRQRLRQRGILRQRVFGCDLGEHLSNSGQDVPQVLRCCS 200

. . . . .

355 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 404

||||||||||||||||||||||||||||||||||||||||||||||||||

201 EFIEAHGVVDGIYRLSGVSSNIQRLRHEFDSERIPELSGPAFLQDIHSVS 250

. . . . .

405 SLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPH 454

||||||||||||||||||||||||||||||||||||||||||||||||||

251 SLCKLYFRELPNPLLTYQLYGKFSEAMSVPGEEERLVRVHDVIQQLPPPH 300

. . . . .

455 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGA 504

||||||||||||||||||||||||||||||||||||||||||||||||||

301 YRTLEYLLRHLARMARHSANTSMHARNLAIVWAPNLLRSMELESVGMGGA 350

. . . . .

505 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 554

||||||||||||||||||||||||||||||||||||||||||||||||||

351 AAFREVRVQSVVVEFLLTHVDVLFSDTFTSAGLDPAGRCLLPRPKSLAGS 400

. . . . .

555 CPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKP 604

||||||||||||||||||||||||||||||||||||||||||||||||||

401 CPSTRLLTLEEAQARTQGRLGTPTEPTTPKAPASPAERRKGERGEKQRKP 450

. . . . .

605 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKS 654

||||||||||||||||||||||||||||||||||||||||||||||||||

451 GGSSWKTFFALGRGPSVPRKKPLPWLGGTRAPPQPSGSRPDTVTLRSAKS 500

. . . . .

655 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSES 704

||||||||||||||||||||||||||||||||||||||||||||||||||

501 EESLSSQASGAGLQRLHRLRRPHSSSDAFPVGPAPAGSCESLSSSSSSES 550

. . . . .

705 SSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLR 754

||||||||||||||||||||||||||||||||||||||||||||||||||

551 SSSESSSSSSESSAAGLGALSGSPSHRTSAWLDDGDELDFSPPRCLEGLR 600

. . . . .

755 GLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 804

||||||||||||||||||||||||||||||||||||||||||||||||||

601 GLDFDPLTFRCSSPTPGDPAPPASPAPPAPASAFPPRVTPQAISPRGPTS 650

. . . . .

805 PASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 854

||||||||||||||||||||||||||||||||||||||||||||||||||

651 PASPAALDISEPLAVSVPPAVLELLGAGGAPASATPTPALSPGRSLRPHL 700

. . . . .

855 IPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPG 904

||||||||||||||||||||||||||||||||||||||||||||||||||

701 IPLLLRGAEAPLTDACQQEMCSKLRGAQGPLGPDMESPLPPPPLSLLRPG 750

. . . . .

905 GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLS 954

||||||||||||||||||||||||||||||||||||||||||||||||||

751 GAPPPPPKNPARLMALALAERAQQVAEQQSQQECGGTPPASQSPFHRSLS 800

. . . . .

955 LEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPM 1004

||||||||||||||||||||||||||||||||||||||||||||||||||

801 LEVGGEPLGTSGSGPPPNSLAHPGAWVPGPPPYLPRQQSDGSLLRSQRPM 850

. . . . .

1005 GTSRRGLRGPAQVSAQLRAGGGGRDAPEAAAQSPCSVPSQVPTPGFFSPA 1054

||||||||||| |||||||||||

851 GTSRRGLRGPA............................QVPTPGFFSPA 872

. . . . .

1055 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLY 1104

||||||||||||||||||||||||||||||||||||||||||||||||||

873 PRECLPPFLGVPKPGLYPLGPPSFQPSSPAPVWRSSLGPPAPLDRGENLY 922

. . . . .

1105 YEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLL 1154

||||||||||||||||||||||||||||||||||||||||||||||||||

923 YEIGASEGSPYSGPTRSWSPFRSMPPDRLNASYGMLGQSPPLHRSPDFLL 972

.

1155 SYPPAPSCFPPDHLGYSAP 1173

||||||||||||||||| |

973 SYPPAPSCFPPDHLGYSPP 991



クラスターHUMCA1XIAの説明
クラスターHUMCA1XIAは、目的の4つの転写物および46個のセグメントを特徴とし、その名称を、それぞれ表828および829に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表830に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるコラーゲンα1(SwissProtアクセッション識別子CA1B_HUMAN)(配列番号1446)の変異型である。
タンパク質コラーゲンα1は、以下の機能を有することが公知であるか、そのように見なされている:コラーゲンII型原線維の外側(lateral)成長の調節による原線維発生で重要な役割を果たし得る。タンパク質コラーゲンα1の配列を、「コラーゲンα1アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表831に示す。
Figure 2008507261
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである軟骨の凝集(cartilage condensation)、視覚、聴覚、細胞−細胞接着、細胞外基質の組織化および生合成、分子機能に関連する注釈付けである細胞外基質構造タンパク質、細胞外基質構造タンパク質、接着、ならびに細胞成分に関連する注釈付けである細胞外基質、コラーゲン、コラーゲンXI型。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHUMCA1XIAを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図32のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図32および表832中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性骨腫瘍、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および肺悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHUMCA1XIAは、上の表1に列挙した4つの転写物を特徴とする。これらの転写物は、タンパク質コラーゲンα1の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMCA1XIA_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T16によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCA1XIA_P14とCA1B_HUMAN_V5(配列番号1447)との間の比較の報告
1.CA1B_HUMAN_V5のアミノ酸1〜1056に対応し、HUMCA1XIA_P14のアミノ酸1〜1056にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPPGPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGEVGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQGPKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKPGPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQRGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPGAAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQGPPGPVと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P14のアミノ酸1057〜1081に対応する配列VSMMIINSQTIMVVNYSSSFITLMLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P14をコードする単離キメラポリペプチド。
2.本発明の好ましい実施形態によれば、HUMCA1XIA_P14のテールをコードする単離ポリペプチドであって、HUMCA1XIA_P14中の配列VSMMIINSQTIMVVNYSSSFITLMLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P14のテールをコードする単離ポリペプチドを提供する。
公知のタンパク質配列(CA1B_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をCA1B_HUMAN_V5と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCA1XIA_P14はまた、表835に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質HUMCA1XIA_P14は、以下の転写物によってコードされる:HUMCA1XIA_T16(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T16のコード部分を太字で示し、このコード部分は319位から開始され、3561位で終結する。転写物はまた、表836に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCA1XIA_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T17によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCA1XIA_P15とCA1B_HUMANとの間の比較の報告
1.CA1B_HUMANのアミノ酸1〜714に対応し、HUMCA1XIA_P15のアミノ酸1〜714にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGPRGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P15のアミノ酸715〜729に対応する配列MCCNLSFGILIPLQKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P15をコードする単離キメラポリペプチド。
2.HUMCA1XIA_P15中の配列MCCNLSFGILIPLQKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P15のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCA1XIA_P15はまた、表837に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質コラーゲンα1と比較した変異タンパク質HUMCA1XIA_P15のグリコシル化部位を表838に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMCA1XIA_P15は、以下の転写物によってコードされる:HUMCA1XIA_T17(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T17のコード部分を太字で示し、このコード部分は319位から開始され、2505位で終結する。転写物はまた、表839に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCA1XIA_P16は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T19によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCA1XIA_P16とCA1B_HUMANとの間の比較の報告
1.CA1B_HUMANのアミノ酸1〜648に対応し、HUMCA1XIA_P16のアミノ酸1〜648にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEANIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDSQRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEEFGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPAGIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYGGDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSGAKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDRGFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAと少なくとも90%相同な第1のアミノ酸配列と、CA1B_HUMANのアミノ酸667〜714に対応し、HUMCA1XIA_P16のアミノ酸649〜696にも対応するGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQGLPGPQGPIGPPGEKと少なくとも90%相同な第2のアミノ酸配列と、HUMCA1XIA_P16のアミノ酸697〜739に対応する配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P16をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がAGを含み、以下の構造:アミノ酸番号648−x〜648のいずれかから始まり、アミノ酸番号649+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCA1XIA_P16の縁部分をコードする単離キメラポリペプチド。
3.HUMCA1XIA_P16中の配列VSFSFSLFYKKVIKFACDKRFVGRHDERKVVKLSLPLYLIYEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P16のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCA1XIA_P16はまた、表840に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質コラーゲンα1と比較した変異タンパク質HUMCA1XIA_P16のグリコシル化部位を表841に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMCA1XIA_P16は、以下の転写物によってコードされる:HUMCA1XIA_T19(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T19のコード部分を太字で示し、このコード部分は319位から開始され、2532位で終結する。転写物はまた、表842に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P16配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCA1XIA_P17は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCA1XIA_T20によってコードされる。公知のタンパク質(コラーゲンα1)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCA1XIA_P17とCA1B_HUMANとの間の比較の報告
1.CA1B_HUMANのアミノ酸1〜260に対応し、HUMCA1XIA_P17のアミノ酸1〜260にも対応するMEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNSPEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFSILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPEDYPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDTNGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKAAQAQEPQIDEと少なくとも90%相同な第1のアミノ酸配列と、HUMCA1XIA_P17のアミノ酸261〜273に対応する配列VRSTRPEKVFVFQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCA1XIA_P17をコードする単離キメラポリペプチド。
2.HUMCA1XIA_P17中の配列VRSTRPEKVFVFQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCA1XIA_P17のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCA1XIA_P17はまた、表843に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質コラーゲンα1と比較した変異タンパク質HUMCA1XIA_P17のグリコシル化部位を表844に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質HUMCA1XIA_P17は、以下の転写物によってコードされる:HUMCA1XIA_T20(配列は出願書類の最後に示す)。転写物HUMCA1XIA_T20のコード部分を太字で示し、このコード部分は319位から開始され、1137位で終結する。転写物はまた、表845に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCA1XIA_P17配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHUMCA1XIAは、上の表2に列挙した46個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMCA1XIA_node_0は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表846は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_2は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表847は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_4は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表848は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表849に示す)。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_6は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表850は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表851に示す)。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_8は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、HUMCA1XIA_T19、およびHUMCA1XIA_T20。以下の表852は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_9は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T20。以下の表853は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_18は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表854は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_54は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T19。以下の表855は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_55は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T17およびHUMCA1XIA_T19。以下の表856は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_92は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表857は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMCA1XIA_node_11は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表858は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_15は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表859は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_19は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表860は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_21は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表861は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_23は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表862は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_25は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表863は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_27は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表864は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_29は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表865は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_31は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表866は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_33は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表867は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_35は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表868は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_37は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表869は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_39は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表870は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_41は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表871は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_43は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表872は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_45は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16およびHUMCA1XIA_T17。以下の表873は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_47は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表874は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_49は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表875は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_51は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16、HUMCA1XIA_T17、およびHUMCA1XIA_T19。以下の表876は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_57は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表877は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_59は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表878は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_62は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表879は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_64は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表880は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_66は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表881は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_68は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表88は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_70は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表883は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_72は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表884は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_74は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表885は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_76は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表886は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_78は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表887は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_81は、8個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表888は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_83は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表889は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_85は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表890は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_87は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表891は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_89は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表892は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCA1XIA_node_91は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCA1XIA_T16。以下の表893は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CA1B_HUMAN_V5

Sequence documentation:

Alignment of: HUMCA1XIA_P14 x CA1B_HUMAN_V5 ..

Alignment segment 1/1:

Quality: 10456.00 Escore: 0
Matching length: 1058 Total length: 1058
Matching Percent Similarity: 99.91 Matching Percent Identity: 99.91
Total Percent Similarity: 99.91 Total Percent Identity: 99.91
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
. . . . .
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
||||||||||||||||||||||||||||||||||||||||||||||||||
701 LPGPQGPIGPPGEKGPQGKPGLAGLPGADGPPGHPGKEGQSGEKGALGPP 750
. . . . .
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
||||||||||||||||||||||||||||||||||||||||||||||||||
751 GPQGPIGYPGPRGVKGADGVRGLKGSKGEKGEDGFPGFKGDMGLKGDRGE 800
. . . . .
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
||||||||||||||||||||||||||||||||||||||||||||||||||
801 VGQIGPRGEDGPEGPKGRAGPTGDPGPSGQAGEKGKLGVPGLPGYPGRQG 850
. . . . .
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
||||||||||||||||||||||||||||||||||||||||||||||||||
851 PKGSTGFPGFPGANGEKGARGVAGKPGPRGQRGPTGPRGSRGARGPTGKP 900
. . . . .
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
||||||||||||||||||||||||||||||||||||||||||||||||||
901 GPKGTSGGDGPPGPPGERGPQGPQGPVGFPGPKGPPGPPGKDGLPGHPGQ 950
. . . . .
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
||||||||||||||||||||||||||||||||||||||||||||||||||
951 RGETGFQGKTGPPGPGGVVGPQGPTGETGPIGERGHPGPPGPPGEQGLPG 1000
. . . . .
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050
||||||||||||||||||||||||||||||||||||||||||||||||||
1001 AAGKEGAKGDPGPQGISGKDGPAGLRGFPGERGLPGAQGAPGLKGGEGPQ 1050

1051 GPPGPVVS 1058
|||||| |
1051 GPPGPVGS 1058






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P15 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 7073.00 Escore: 0
Matching length: 714 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
||||||||||||||||||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
701 LPGPQGPIGPPGEK 714
||||||||||||||
701 LPGPQGPIGPPGEK 714






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P16 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 6795.00 Escore: 0
Matching length: 696 Total length: 714
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 97.48 Total Percent Identity: 97.48
Gaps: 1

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
. . . . .
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AQAQEPQIDEYAPEDIIEYDYEYGEAEYKEAESVTEGPTVTEETIAQTEA 300
. . . . .
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 NIVDDFQEYNYGTMESYQTEAPRHVSGTNEPNPVEEIFTEEYLTGEDYDS 350
. . . . .
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QRKNSEDTLYENKEIDGRDSDLLVDGDLGEYDFYEYKEYEDKPTSPPNEE 400
. . . . .
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 FGPGVPAETDITETSINGHGAYGEKGQKGEPAVVEPGMLVEGPPGPAGPA 450
. . . . .
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GIMGPPGLQGPTGPPGDPGDRGPPGRPGLPGADGLPGPPGTMLMLPFRYG 500
. . . . .
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 GDGSKGPTISAQEAQAQAILQQARIALRGPPGPMGLTGRPGPVGGPGSSG 550
. . . . .
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 AKGESGDPGPQGPRGVQGPPGPTGKPGKRGRPGADGGRGMPGEPGAKGDR 600
. . . . .
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEA.. 648
||||||||||||||||||||||||||||||||||||||||||||||||
601 GFDGLPGLPGDKGHRGERGPQGPPGPPGDDGMRGEDGEIGPRGLPGEAGP 650
. . . . .
649 ................GMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 682
||||||||||||||||||||||||||||||||||
651 RGLLGPRGTPGAPGQPGMAGVDGPPGPKGNMGPQGEPGPPGQQGNPGPQG 700
.
683 LPGPQGPIGPPGEK 696
||||||||||||||
701 LPGPQGPIGPPGEK 714






Sequence name: CA1B_HUMAN

Sequence documentation:

Alignment of: HUMCA1XIA_P17 x CA1B_HUMAN ..

Alignment segment 1/1:

Quality: 2561.00 Escore: 0
Matching length: 260 Total length: 260
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MEPWSSRWKTKRWLWDFTVTTLALTFLFQAREVRGAAPVDVLKALDFHNS 50
. . . . .
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 PEGISKTTGFCTNRKNSKGSDTAYRVSKQAQLSAPTKQLFPGGTFPEDFS 100
. . . . .
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ILFTVKPKKGIQSFLLSIYNEHGIQQIGVEVGRSPVFLFEDHTGKPAPED 150
. . . . .
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 YPLFRTVNIADGKWHRVAISVEKKTVTMIVDCKKKTTKPLDRSERAIVDT 200
. . . . .
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 NGITVFGTRILDEEVFEGDIQQFLITGDPKAAYDYCEHYSPDCDSSAPKA 250
.
251 AQAQEPQIDE 260
||||||||||
251 AQAQEPQIDE 260



正常および癌性肺組織における配列名HUMCA1X1Aseg55中に示すアンプリコンによって検出可能なホモ・サピエンスコラーゲンXI型α1(COL11A1)HUMCA1XIA転写物の発現
seg55、HUMCA1X1Aseg55アンプリコン(配列番号1663)ならびにプライマーHUMCA1X1Aseg55F(配列番号1661)およびHUMCA1X1Aseg55R(配列番号1662)によって検出可能なホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図67は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。
図67から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうち11個、16個の扁平上皮細胞癌サンプルのうち11個、および4個の大細胞癌サンプルのうち2個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HUMCA1X1Aseg55F順方向プライマーおよびHUMCA1X1Aseg55R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HUMCA1X1Aseg55。

順方向プライマー−HUMCA1X1Aseg55F(配列番号1661):TTCTCATAGTATTCCATTGATTGGGTA
逆方向プライマー−HUMCA1X1Aseg55R(配列番号1662):CACCGGTATGGAGAATAGCGA
アンプリコン(配列番号1663):TTCTCATAGTATTCCATTGATTGGGTATACCAGGTTCTGTTTACTTTTACTTGGCAGTTGATAGAATAGGTGTAGTTTATACTTTTTCGCTATTCTCCATACCGGTG
クラスターT11628の説明
クラスターT11628は、目的の6つの転写物および25個のセグメントを特徴とし、その名称を、それぞれ表894および895に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表896に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるミオグロビン(SwissProtアクセッション識別子MYG_HUMAN)(配列番号1448)の変異型である。
タンパク質ミオグロビンは、以下の機能を有することが公知であるか、そのように見なされている:酸素の逆供給としての機能を果たし、筋肉内の酸素の移動を促進する。タンパク質ミオグロビンの配列を、「ミオグロビンアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表897に示す。
Figure 2008507261
上記のように、クラスターT11628は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質ミオグロビンの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質T11628_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T3によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T11628_PEA_1_P2とQ8WVH6(配列番号1450)との間の比較の報告
1.T11628_PEA_1_P2のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P2のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P2をコードする単離キメラポリペプチド。
2.T11628_PEA_1_P2の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P2の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質T11628_PEA_1_P2はまた、表898に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T11628_PEA_1_P2は、以下の転写物によってコードされる:T11628_PEA_1_T3(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T3のコード部分を太字で示し、このコード部分は220位から開始され、681位で終結する。転写物はまた、表899に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T11628_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T9によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T11628_PEA_1_P5とMYG_HUMAN_V1(配列番号1449)との間の比較の報告
1.MYG_HUMAN_V1のアミノ酸56〜154に対応し、T11628_PEA_1_P5のアミノ酸1〜99にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第1のアミノ酸配列を含む、T11628_PEA_1_P5をコードする単離キメラポリペプチド。
公知のタンパク質配列(MYG_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をMYG_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質T11628_PEA_1_P5はまた、表901に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T11628_PEA_1_P5は、以下の転写物によってコードされる:T11628_PEA_1_T9(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T9のコード部分を太字で示し、このコード部分は211位から開始され、507位で終結する。転写物はまた、表902に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T11628_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T11によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T11628_PEA_1_P7とMYG_HUMAN_V1との間の比較の報告
1.MYG_HUMAN_V1のアミノ酸1〜134に対応し、T11628_PEA_1_P7のアミノ酸1〜134にも対応するMGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKと少なくとも90%相同な第1のアミノ酸配列と、T11628_PEA_1_P7のアミノ酸135〜135に対応する配列Gを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P7をコードする単離キメラポリペプチド。
公知のタンパク質配列(MYG_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をMYG_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質T11628_PEA_1_P7はまた、表904に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T11628_PEA_1_P7は、以下の転写物によってコードされる:T11628_PEA_1_T11(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T11のコード部分を太字で示し、このコード部分は319位から開始され、723位で終結する。転写物はまた、表905に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質T11628_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物T11628_PEA_1_T4によってコードされる。公知のタンパク質(ミオグロビン)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
T11628_PEA_1_P10とQ8WVH6(配列番号1450)との間の比較の報告
1.T11628_PEA_1_P10のアミノ酸1〜55に対応する配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8WVH6のアミノ酸1〜99に対応し、T11628_PEA_1_P10のアミノ酸56〜154にも対応するMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYLEFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQGと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、T11628_PEA_1_P10をコードする単離キメラポリペプチド。
2.T11628_PEA_1_P10の配列MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHLKSEDEと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、T11628_PEA_1_P10の先端をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質T11628_PEA_1_P10はまた、表906に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質T11628_PEA_1_P10は、以下の転写物によってコードされる:T11628_PEA_1_T4(配列は出願書類の最後に示す)。転写物T11628_PEA_1_T4のコード部分を太字で示し、このコード部分は205位から開始され、666位で終結する。転写物はまた、表907に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質T11628_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターT11628は、上の表2に列挙した25個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターT11628_PEA_1_node_7は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3。以下の表908は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_11は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T5。以下の表909は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_16は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T11。以下の表910は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_22は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T9。以下の表911は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_25は、129個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表912は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表913に示す)。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_31は、137個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表914は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_37は、99個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表915は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターT11628_PEA_1_node_0は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T4。以下の表916は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_4は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T4。以下の表917は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_9は、16個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T5およびT11628_PEA_1_T7。以下の表918は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_13を、以下の転写物中に見出すことができる:T11628_PEA_1_T7。以下の表919は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_14は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T7。以下の表920は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_17は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T11。以下の表921は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_18は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T11。以下の表922は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_19を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T11。以下の表923は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_24は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表924は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

表924 - 転写物上のセグメントの位置
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_27は、119個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表925は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表926に示す)。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_28は、115個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T9。以下の表927は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_29は、113個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、およびT11628_PEA_1_T9。以下の表928は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_30を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表929は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_32を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表930は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_33を、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表931は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_34は、122個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表932は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_35は、126個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表933は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターT11628_PEA_1_node_36は、122個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:T11628_PEA_1_T3、T11628_PEA_1_T4、T11628_PEA_1_T5、T11628_PEA_1_T7、T11628_PEA_1_T9、およびT11628_PEA_1_T11。以下の表934は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: Q8WVH6



Sequence documentation:



Alignment of: T11628_PEA_1_P2 x Q8WVH6 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

. . . .

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

|||||||||||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99













Sequence name: MYG_HUMAN_V1



Sequence documentation:



Alignment of: T11628_PEA_1_P5 x MYG_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

||||||||||||||||||||||||||||||||||||||||||||||||||

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

. . . .

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99

|||||||||||||||||||||||||||||||||||||||||||||||||

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154













Sequence name: MYG_HUMAN_V1



Sequence documentation:



Alignment of: T11628_PEA_1_P7 x MYG_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 1315.00 Escore: 0

Matching length: 134 Total length: 134

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MGLSDGEWQLVLNVWGKVEADIPGHGQEVLIRLFKGHPETLEKFDKFKHL 50

. . . . .

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 KSEDEMKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKI 100

. . .

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134

||||||||||||||||||||||||||||||||||

101 PVKYLEFISECIIQVLQSKHPGDFGADAQGAMNK 134













Sequence name: Q8WVH6



Sequence documentation:



Alignment of: T11628_PEA_1_P10 x Q8WVH6 ..



Alignment segment 1/1:



Quality: 962.00 Escore: 0

Matching length: 99 Total length: 99

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

56 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 105

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MKASEDLKKHGATVLTALGGILKKKGHHEAEIKPLAQSHATKHKIPVKYL 50

. . . .

106 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 154

|||||||||||||||||||||||||||||||||||||||||||||||||

51 EFISECIIQVLQSKHPGDFGADAQGAMNKALELFRKDMASNYKELGFQG 99




クラスターHUMCEAの説明
クラスターHUMCEAは、目的の5つの転写物および42個のセグメントを特徴とし、その名称を、それぞれ表935および936に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表937に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である癌胎児性抗原関連細胞接着分子5前駆体(SwissProtアクセッション識別子CEA5_HUMAN、同義語癌胎児性抗原、CEA、胎便抗原100、CD66e抗原としても公知である)(配列番号1451)の変異型である。
タンパク質癌胎児性抗原関連細胞接着分子5前駆体の配列を、「癌胎児性抗原関連細胞接着分子5前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表938に示す。
Figure 2008507261
タンパク質癌胎児性抗原関連細胞接着分子5前駆体局在化は、GPI−アンカーによって膜に結合すると考えられる。
以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:癌。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:免疫賦活剤。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(造影剤、抗癌薬、免疫賦形剤、免疫複合体、モノクローナル抗体(マウス)、アンチセンス療法、抗体)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:細胞成分に関連する注釈付けである内在性原形質膜タンパク質、膜。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHUMCEAを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図33のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図33および表939中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。
Figure 2008507261
Figure 2008507261
このクラスターについて、少なくとも1つのオリゴヌクレオチドが、クラスターの過剰発現を証明することが見出されたが、以下に列挙した少なくとも1つの転写物/セグメントでは見出されなかった。以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。前記のように、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、(肺癌に関して)このクラスターに達するが、以下の他のセグメント/転写物は達しないことが見出された(表941に示す)。
Figure 2008507261
上記のように、クラスターHUMCEAは、上の表1に列挙した5つの転写物を特徴とする。これらの転写物は、タンパク質癌胎児性抗原関連細胞接着分子5前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMCEA_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T8によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCEA_PEA_1_P4とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜234に対応し、HUMCEA_PEA_1_P4のアミノ酸1〜234にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P4のアミノ酸235〜315に対応する配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P4をコードする単離キメラポリペプチド。
2.HUMCEA_PEA_1_P4中の配列CEYICSSLAQAASPNPQGQRQDFSVPLRFKYTDPQPWTSRLSVTFCPRKTWADQVLTKNRRGGAASVLGGSGSTPYDGRNRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P4のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCEA_PEA_1_P4はまた、表942に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P4のグリコシル化部位を表943に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
Figure 2008507261
変異タンパク質HUMCEA_PEA_1_P4は、以下の転写物によってコードされる:HUMCEA_PEA_1_T8(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T8のコード部分を太字で示し、このコード部分は115位から開始され、1059位で終結する。転写物はまた、表944に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCEA_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T9によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCEA_PEA_1_P5とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜675に対応し、HUMCEA_PEA_1_P5のアミノ酸1〜675にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYRSGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQAHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQNTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELSVDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWLIDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSと少なくとも90%相同な第1のアミノ酸配列と、HUMCEA_PEA_1_P5のアミノ酸676〜719に対応する配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P5をコードする単離キメラポリペプチド。
2.HUMCEA_PEA_1_P5中の配列GKWLPGASASYSGVESIWFSPKSQEDIFFPSLCSMGTRKSQILSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMCEA_PEA_1_P5のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCEA_PEA_1_P5はまた、表945に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P5のグリコシル化部位を表946に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
Figure 2008507261
変異タンパク質HUMCEA_PEA_1_P5は、以下の転写物によってコードされる:HUMCEA_PEA_1_T9(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T9のコード部分を太字で示し、このコード部分は115位から開始され、2271位で終結する。転写物はまた、表947に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCEA_PEA_1_P14は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T20によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMCEA_PEA_1_P14はまた、表948に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質HUMCEA_PEA_1_P14は、以下の転写物によってコードされる:HUMCEA_PEA_1_T20(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T20のコード部分を太字で示し、このコード部分は115位から開始され、1821位で終結する。転写物はまた、表949に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P14配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCEA_PEA_1_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T25によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCEA_PEA_1_P19とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜232に対応し、HUMCEA_PEA_1_P19のアミノ酸1〜232にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSISSNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTLTLFNVTRNDTASYKCETQNPVSARRSDSVILNと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸589〜702に対応し、HUMCEA_PEA_1_P19のアミノ酸233〜346にも対応するVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P19をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がNVを含み、以下の構造:アミノ酸番号232−x〜232のいずれかから始まり、アミノ酸番号233+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P19の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、公知のタンパク質局在化および/または遺伝子構造の手作業による調査によって、膜と考えられる。
変異タンパク質HUMCEA_PEA_1_P19はまた、表950に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P19のグリコシル化部位を表951に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
Figure 2008507261
変異タンパク質HUMCEA_PEA_1_P19は、以下の転写物によってコードされる:HUMCEA_PEA_1_T25(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T25のコード部分を太字で示し、このコード部分は115位から開始され、1152位で終結する。転写物はまた、表952に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMCEA_PEA_1_P20は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMCEA_PEA_1_T26によってコードされる。公知のタンパク質(癌胎児性抗原関連細胞接着分子5前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMCEA_PEA_1_P20とCEA5_HUMANとの間の比較の報告
1.CEA5_HUMANのアミノ酸1〜142に対応し、HUMCEA_PEA_1_P20のアミノ酸1〜142にも対応するMESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKEVLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREIIYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPと少なくとも90%相同な第1のアミノ酸配列と、CEA5_HUMANのアミノ酸499〜702に対応し、HUMCEA_PEA_1_P20のアミノ酸143〜346にも対応するELPKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLSNGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISPPDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNNGTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVALIと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMCEA_PEA_1_P20をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がPEを含み、以下の構造:アミノ酸番号142−x〜142のいずれかから始まり、アミノ酸番号143+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HUMCEA_PEA_1_P20の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、公知のタンパク質局在化および/または遺伝子構造の手作業による調査によって、膜と考えられる。
変異タンパク質HUMCEA_PEA_1_P20はまた、表953に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P20配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質癌胎児性抗原関連細胞接着分子5前駆体と比較した変異タンパク質HUMCEA_PEA_1_P20のグリコシル化部位を表954に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
Figure 2008507261
変異タンパク質HUMCEA_PEA_1_P20は、以下の転写物によってコードされる:HUMCEA_PEA_1_T26(配列は出願書類の最後に示す)。転写物HUMCEA_PEA_1_T26のコード部分を太字で示し、このコード部分は115位から開始され、1152位で終結する。転写物はまた、表955に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMCEA_PEA_1_P20配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHUMCEAは、上の表2に列挙した42個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMCEA_PEA_1_node_0は、56個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表956は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_2は、83個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表957は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_11は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8。以下の表958は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表959に示す)。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_12は、83個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9およびHUMCEA_PEA_1_T20。以下の表960は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_31は、87個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表961は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_36は、94個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表962は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_44は、112個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表963は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_46は、15個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T9。以下の表964は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_63は、68個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表965は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_65は、54個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表966は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_67は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T20。以下の表967は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMCEA_PEA_1_node_3は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表968は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_7は、73個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表969は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_8は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表970は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_9は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表971は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_10は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、HUMCEA_PEA_1_T20、およびHUMCEA_PEA_1_T25。以下の表972は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_15を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表973は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_16を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表974は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_17を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表975は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_18を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表976は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_19は、69個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表977は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_20を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表978は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_21を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表979は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_22は、77個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表980は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_23は、72個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表981は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_24を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表982は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_27を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表983は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_29を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表984は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_30は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T20。以下の表985は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_33を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表986は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_34は、80個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表987は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_35は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T9、およびHUMCEA_PEA_1_T26。以下の表988は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_45は、9個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T9。以下の表989は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_50は、64個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表990は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_51は、88個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表991は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_56は、75個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表992は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_57は、82個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表993は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_58は、63個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表994は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_60は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表995は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_61を、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表996は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_62は、60個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表997は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMCEA_PEA_1_node_64は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMCEA_PEA_1_T8、HUMCEA_PEA_1_T25、およびHUMCEA_PEA_1_T26。以下の表998は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P4 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 2320.00 Escore: 0
Matching length: 234 Total length: 234
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVL 234
||||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVL 234






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P5 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 6692.00 Escore: 0
Matching length: 675 Total length: 675
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
||||||||||||||||||||||||||||||||||||||||||||||||||
401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
||||||||||||||||||||||||||||||||||||||||||||||||||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
||||||||||||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. .
651 GTYACFVSNLATGRNNSIVKSITVS 675
|||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVS 675






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P19 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3298.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILN.................. 232
||||||||||||||||||||||||||||||||
201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
232 .................................................. 232

251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
232 .................................................. 232

301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
232 .................................................. 232

351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
232 .................................................. 232

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
232 .................................................. 232

451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
232 .................................................. 232

501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
233 ......................................VLYGPDTPIISP 244
||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
245 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 294
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. . . . .
295 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702






Sequence name: CEA5_HUMAN

Sequence documentation:

Alignment of: HUMCEA_PEA_1_P20 x CEA5_HUMAN ..

Alignment segment 1/1:

Quality: 3294.00 Escore: 0
Matching length: 346 Total length: 702
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 49.29 Total Percent Identity: 49.29
Gaps: 1

Alignment:
. . . . .
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MESPSAPPHRWCIPWQRLLLTASLLTFWNPPTTAKLTIESTPFNVAEGKE 50
. . . . .
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 VLLLVHNLPQHLFGYSWYKGERVDGNRQIIGYVIGTQQATPGPAYSGREI 100
. . . . .
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYP........ 142
||||||||||||||||||||||||||||||||||||||||||
101 IYPNASLLIQNIIQNDTGFYTLHVIKSDLVNEEATGQFRVYPELPKPSIS 150
. . . . .
142 .................................................. 142

151 SNNSKPVEDKDAVAFTCEPETQDATYLWWVNNQSLPVSPRLQLSNGNRTL 200
. . . . .
142 .................................................. 142

201 TLFNVTRNDTASYKCETQNPVSARRSDSVILNVLYGPDAPTISPLNTSYR 250
. . . . .
142 .................................................. 142

251 SGENLNLSCHAASNPPAQYSWFVNGTFQQSTQELFIPNITVNNSGSYTCQ 300
. . . . .
142 .................................................. 142

301 AHNSDTGLNRTTVTTITVYAEPPKPFITSNNSNPVEDEDAVALTCEPEIQ 350
. . . . .
142 .................................................. 142

351 NTTYLWWVNNQSLPVSPRLQLSNDNRTLTLLSVTRNDVGPYECGIQNELS 400
. . . . .
142 .................................................. 142

401 VDHSDPVILNVLYGPDDPTISPSYTYYRPGVNLSLSCHAASNPPAQYSWL 450
. . . . .
143 ................................................EL 144
||
451 IDGNIQQHTQELFISNITEKNSGLYTCQANNSASGHSRTTVKTITVSAEL 500
. . . . .
145 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 194
||||||||||||||||||||||||||||||||||||||||||||||||||
501 PKPSISSNNSKPVEDKDAVAFTCEPEAQNTTYLWWVNGQSLPVSPRLQLS 550
. . . . .
195 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 244
||||||||||||||||||||||||||||||||||||||||||||||||||
551 NGNRTLTLFNVTRNDARAYVCGIQNSVSANRSDPVTLDVLYGPDTPIISP 600
. . . . .
245 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 294
||||||||||||||||||||||||||||||||||||||||||||||||||
601 PDSSYLSGANLNLSCHSASNPSPQYSWRINGIPQQHTQVLFIAKITPNNN 650
. . . . .
295 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 344
||||||||||||||||||||||||||||||||||||||||||||||||||
651 GTYACFVSNLATGRNNSIVKSITVSASGTSPGLSAGATVGIMIGVLVGVA 700

345 LI 346
||
701 LI 702



クラスターR35137の説明
クラスターR35137は、目的の6つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表999および1000に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1001に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるアラニンアミノトランスフェラーゼ(SwissProtアクセッション識別子ALAT_HUMAN、同義語EC2.6.1.2、グルタミン酸−−ピルビン酸トランスアミナーゼ、GPT、グルタミン酸−−アラニントランスアミナーゼとしても公知である)(配列番号1452)の変異型である。
タンパク質アラニンアミノトランスフェラーゼは、以下の機能を有することが公知であるか、そのように見なされている:細胞窒素代謝および骨格筋から輸送された前駆体から開始される肝臓糖新生にも関与する。タンパク質アラニンアミノトランスフェラーゼの配列を、「アラニンアミノトランスフェラーゼアミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1002に示す。
Figure 2008507261
タンパク質アラニンアミノトランスフェラーゼの局在化は、原形質と考えられる。
クラスターR35137を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図34のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図34および表1003中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):肝細胞癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターR35137は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質アラニンアミノトランスフェラーゼの変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T10によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R35137_PEA_1_PEA_1_PEA_1_P9とALAT_HUMAN_V1(配列番号1453)との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P9のアミノ酸275〜385に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P9をコードする単離キメラポリペプチド。
2.R35137_PEA_1_PEA_1_PEA_1_P9中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRAYEAGGGSRAMARPSSPDGPPPPPHLTWPCAGAGSAAAMWRWと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P9のテールをコードする単離ポリペプチド。
公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P9は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T10(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T10のコード部分を太字で示し、このコード部分は271位から開始され、1425位で終結する。転写物はまた、表1006に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T11によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R35137_PEA_1_PEA_1_PEA_1_P8とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜320に対応し、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸1〜320にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P8のアミノ酸321〜346に対応する配列VRTRRVGARGPWPGPPRPMGHPLLRTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P8をコードする単離キメラポリペプチド。
2.R35137_PEA_1_PEA_1_PEA_1_P8中の配列VRTRRVGARGPWPGPPRPMGHPLLRTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P8のテールをコードする単離ポリペプチド。
公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P8はまた、表1008に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P8は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T11(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T11のコード部分を太字で示し、このコード部分は271位から開始され、1308位で終結する。転写物はまた、表1009に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P11は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T14によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R35137_PEA_1_PEA_1_PEA_1_P11とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜229に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸1〜229にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARと少なくとも90%相同な第1のアミノ酸配列と、ALAT_HUMAN_V1のアミノ酸455〜496に対応し、R35137_PEA_1_PEA_1_PEA_1_P11のアミノ酸230〜271にも対応するSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P11をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がRSを含み、以下の構造:アミノ酸番号229−x〜229のいずれかから始まり、アミノ酸番号230+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P11の縁部分をコードする単離キメラポリペプチド。
公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P11はまた、表1011に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P11は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T14(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T14のコード部分を太字で示し、このコード部分は271位から開始され、1083位で終結する。転写物はまた、表1012に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P11配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T3によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R35137_PEA_1_PEA_1_PEA_1_P2とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜274に対応し、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸1〜274にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P2のアミノ酸275〜399に対応する配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P2をコードする単離キメラポリペプチド。
2.R35137_PEA_1_PEA_1_PEA_1_P2中の配列RGAGEREAGQQSAPVTPCALPGVPGQRVRRGFAVPLIQEGAHGDGAALRRAAGACLLPLHLQGLHGRVRVPRRLCGGGEHGRCSAAADAEADECAAVPAGARTGPAGPGGQPARAHRPLLCAVPGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P2のテールをコードする単離ポリペプチド。
公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P2はまた、表1014に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P2は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T3(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T3のコード部分を太字で示し、このコード部分は271位から開始され、1467位で終結する。転写物はまた、表1015に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物R35137_PEA_1_PEA_1_PEA_1_T5によってコードされる。公知のタンパク質(アラニンアミノトランスフェラーゼ)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R35137_PEA_1_PEA_1_PEA_1_P4とALAT_HUMAN_V1との間の比較の報告
1.ALAT_HUMAN_V1のアミノ酸1〜494に対応し、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸1〜494にも対応するMASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNFPDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPADPNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELGAVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQTRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPYAGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCPPVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEAPGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGICVVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEと少なくとも90%相同な第1のアミノ酸配列と、R35137_PEA_1_PEA_1_PEA_1_P4のアミノ酸495〜555に対応する配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R35137_PEA_1_PEA_1_PEA_1_P4をコードする単離キメラポリペプチド。
2.R35137_PEA_1_PEA_1_PEA_1_P4中の配列SPGRLWSPLYLLLMPGGVGWGGCWAPASLQVPNKAVWQSDSKKEALAAAWPAPTCLPFLQAと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R35137_PEA_1_PEA_1_PEA_1_P4のテールをコードする単離ポリペプチド。
公知のタンパク質配列(ALAT_HUMAN)は、出願書類の最後に示す配列より1つまたは複数の変化があり、このアミノ酸配列をALAT_HUMAN_V1と命名することに留意すべきである。これらの変化が起こることは以前に公知であり、以下の表に列挙した。
Figure 2008507261
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:細胞内。タンパク質局在化は、いずれの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域であると推定されないので、細胞内と考えられる。さらに、両シグナルペプチド推定プログラムによって、このタンパク質は非分泌性タンパク質であると推定される。
変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P4はまた、表1017に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R35137_PEA_1_PEA_1_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P4は、以下の転写物によってコードされる:、R35137_PEA_1_PEA_1_PEA_1_T5(配列は出願書類の最後に示す)。転写物R35137_PEA_1_PEA_1_PEA_1_T5のコード部分を太字で示し、このコード部分は271位から開始され、1935位で終結する。転写物はまた、表1018に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質、R35137_PEA_1_PEA_1_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターR35137は、上の表2に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_2は、19個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1019は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_3は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1020は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_9は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1021は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_11は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1022は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_16は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1023は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_18は、24個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1024は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(肺癌に関して)(表1025に示す)。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_20は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1026は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_27は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1027は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_5は、20個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1028は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_7は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1029は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_12は、22個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1030は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_14は、23個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1031は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_15は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T10、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1032は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_17は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1033は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_21は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T11およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1034は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_22は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1035は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_23は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1036は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_24は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T11およびR35137_PEA_1_PEA_1_PEA_1_T12。以下の表1037は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_25は、30個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T5、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1038は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR35137_PEA_1_PEA_1_PEA_1_node_26は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R35137_PEA_1_PEA_1_PEA_1_T3、R35137_PEA_1_PEA_1_PEA_1_T10、R35137_PEA_1_PEA_1_PEA_1_T11、R35137_PEA_1_PEA_1_PEA_1_T12、およびR35137_PEA_1_PEA_1_PEA_1_T14。以下の表1039は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:

Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P9 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. .

251 TRECIEAVIRFAFEERLFLLADEV 274

||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEV 274













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P8 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 3088.00 Escore: 0

Matching length: 320 Total length: 320

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. .

301 AGQQELASFHSTSKGYMGEC 320

||||||||||||||||||||

301 AGQQELASFHSTSKGYMGEC 320













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P11 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2487.00 Escore: 0

Matching length: 271 Total length: 496

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 54.64 Total Percent Identity: 54.64

Gaps: 1



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQAR..................... 229

|||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

229 .................................................. 229



251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. . . . .

229 .................................................. 229



301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

. . . . .

229 .................................................. 229



351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

. . . . .

229 .................................................. 229



401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

. . . .

230 ....SGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYS 271

||||||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLEYS 496













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P2 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 2619.00 Escore: 0

Matching length: 274 Total length: 274

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. .

251 TRECIEAVIRFAFEERLFLLADEV 274

||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEV 274













Sequence name: ALAT_HUMAN_V1



Sequence documentation:



Alignment of: R35137_PEA_1_PEA_1_PEA_1_P4 x ALAT_HUMAN_V1 ..



Alignment segment 1/1:



Quality: 4785.00 Escore: 0

Matching length: 494 Total length: 494

Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00

Total Percent Similarity: 100.00 Total Percent Identity: 100.00

Gaps: 0



Alignment:

. . . . .

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

||||||||||||||||||||||||||||||||||||||||||||||||||

1 MASSTGDRSQAVRHGLRAKVLTLDGMNPRVRRVEYAVRGPIVQRALELEQ 50

. . . . .

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

||||||||||||||||||||||||||||||||||||||||||||||||||

51 ELRQGVKKPFTEVIRANIGDAQAMGQRPITFLRQVLALCVNPDLLSSPNF 100

. . . . .

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

||||||||||||||||||||||||||||||||||||||||||||||||||

101 PDDAKKRAERILQACGGHSLGAYSVSSGIQLIREDVARYIERRDGGIPAD 150

. . . . .

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

||||||||||||||||||||||||||||||||||||||||||||||||||

151 PNNVFLSTGASDAIVTVLKLLVAGEGHTRTGVLIPIPQYPLYSATLAELG 200

. . . . .

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

||||||||||||||||||||||||||||||||||||||||||||||||||

201 AVQVDYYLDEERAWALDVAELHRALGQARDHCRPRALCVINPGNPTGQVQ 250

. . . . .

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

||||||||||||||||||||||||||||||||||||||||||||||||||

251 TRECIEAVIRFAFEERLFLLADEVYQDNVYAAGSQFHSFKKVLMEMGPPY 300

. . . . .

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

||||||||||||||||||||||||||||||||||||||||||||||||||

301 AGQQELASFHSTSKGYMGECGFRGGYVEVVNMDAAVQQQMLKLMSVRLCP 350

. . . . .

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

||||||||||||||||||||||||||||||||||||||||||||||||||

351 PVPGQALLDLVVSPPAPTDPSFAQFQAEKQAVLAELAAKAKLTEQVFNEA 400

. . . . .

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

||||||||||||||||||||||||||||||||||||||||||||||||||

401 PGISCNPVQGAMYSFPRVQLPPRAVERAQELGLAPDMFFCLRLLEETGIC 450

. . . .

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE 494

||||||||||||||||||||||||||||||||||||||||||||

451 VVPGSGFGQREGTYHFRMTILPPLEKLRLLLEKLSRFHAKFTLE 494



クラスターZ25299の説明
クラスターZ25299は、目的の5つの転写物および11個のセグメントを特徴とし、その名称を、それぞれ表1040および1041に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1042に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である抗ロイコプロテイナーゼ(antileukoproteinase)1前駆体(SwissProtアクセッション識別子ALK1_HUMAN、同義語ALP、HUSI−1、精子プロテイナーゼインヒビター、分泌性白血球プロテイナーゼインヒビター、BLPI、粘液プロテイナーゼインヒビター、MPI、WAP4ジスルフィドコアドメインタンパク質4、プロテイナーゼインヒビターWAP4としても公知である)(配列番号1454)の変異型である。
タンパク質抗ロイコプロテイナーゼ1前駆体は、以下の機能を有することが公知であるか、そのように見なされている:トリプシン、キモトリプシン、エラスターゼ、およびカテプシンGに対して強い親和性を有する酸安定性プロテイナーゼインヒビター。口腔およびおそらく他の粘膜組織に対するエラスターゼ媒介性損傷を防止し得る。タンパク質抗ロイコプロテイナーゼ1前駆体の配列を、「抗ロイコプロテイナーゼ1前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質抗ロイコプロテイナーゼ1前駆体の局在化は、分泌と考えられる。
ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:エラスターゼインヒビター、トリプターゼインヒビター。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(抗炎症薬、抗喘息薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるプロテアーゼインヒビター、セリンプロテアーゼインヒビター。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターZ25299を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図35のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図35および表1043中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および卵巣癌において過剰発現。
Figure 2008507261
Figure 2008507261
上記のように、クラスターZ25299は、上の表1に列挙した5つの転写物を特徴とする。これらの転写物は、タンパク質抗ロイコプロテイナーゼ1前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質Z25299_PEA_2_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T1によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z25299_PEA_2_P2とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P2のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P2のアミノ酸132〜139に対応する配列GKQGMRAHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P2をコードする単離キメラポリペプチド。
2.Z25299_PEA_2_P2中の配列GKQGMRAHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P2のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z25299_PEA_2_P2はまた、表1045に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、Z25299_PEA_2_P2は、以下の転写物によってコードされる:Z25299_PEA_2_T1(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T1のコード部分を太字で示し、このコード部分は124位から開始され、540位で終結する。転写物はまた、表1046に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質Z25299_PEA_2_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T2によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z25299_PEA_2_P3とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜131に対応し、Z25299_PEA_2_P3のアミノ酸1〜131にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLNPPNFCEMDGQCKRDLKCCMGMCGKSCVSPVKと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P3のアミノ酸132〜156に対応する配列GEKRHHKQLRDQEVDPLEMRRHSAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P3をコードする単離キメラポリペプチド。
2.Z25299_PEA_2_P3中の配列GEKRHHKQLRDQEVDPLEMRRHSAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P3のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z25299_PEA_2_P3はまた、表1047に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、Z25299_PEA_2_P3は、以下の転写物によってコードされる:Z25299_PEA_2_T2(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T2のコード部分を太字で示し、このコード部分は124位から開始され、591位で終結する。転写物はまた、表1048に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質Z25299_PEA_2_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T6によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z25299_PEA_2_P7とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜81に対応し、Z25299_PEA_2_P7のアミノ酸1〜81にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPと少なくとも90%相同な第1のアミノ酸配列と、Z25299_PEA_2_P7のアミノ酸82〜89に対応する配列RGSLGSAQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、Z25299_PEA_2_P7をコードする単離キメラポリペプチド。
2.Z25299_PEA_2_P7中の配列RGSLGSAQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、Z25299_PEA_2_P7のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z25299_PEA_2_P7はまた、表1049に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、Z25299_PEA_2_P7は、以下の転写物によってコードされる:Z25299_PEA_2_T6(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T6のコード部分を太字で示し、このコード部分は124位から開始され、390位で終結する。転写物はまた、表1050に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質Z25299_PEA_2_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物Z25299_PEA_2_T9によってコードされる。公知のタンパク質(抗ロイコプロテイナーゼ1前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
Z25299_PEA_2_P10とALK1_HUMANとの間の比較の報告
1.ALK1_HUMANのアミノ酸1〜82に対応し、Z25299_PEA_2_P10のアミノ酸1〜82にも対応するMKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPECQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTと少なくとも90%相同な第1のアミノ酸配列を含む、Z25299_PEA_2_P10をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質Z25299_PEA_2_P10はまた、表1051に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、Z25299_PEA_2_P10は、以下の転写物によってコードされる:Z25299_PEA_2_T9(配列は出願書類の最後に示す)。転写物Z25299_PEA_2_T9のコード部分を太字で示し、このコード部分は124位から開始され、369位で終結する。転写物はまた、表1052に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質Z25299_PEA_2_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターZ25299は、上の表2に列挙した11個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターZ25299_PEA_2_node_20は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1。以下の表1053は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_21は、162個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1054は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_23は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T2。以下の表1055は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_24は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T2およびZ25299_PEA_2_T3。以下の表1056は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_8は、218個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1057は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターZ25299_PEA_2_node_12は、228個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1058は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_13は、246個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1059は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_14を、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、Z25299_PEA_2_T6、およびZ25299_PEA_2_T9。以下の表1060は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_17を、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、およびZ25299_PEA_2_T3。以下の表1061は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_18は、221個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、およびZ25299_PEA_2_T6。以下の表1062は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターZ25299_PEA_2_node_19は、197個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:Z25299_PEA_2_T1、Z25299_PEA_2_T2、Z25299_PEA_2_T3、およびZ25299_PEA_2_T6。以下の表1063は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/oXgeQ4MeyL/K6Vqb1MQu2:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P2 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . . . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
. . .
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131
|||||||||||||||||||||||||||||||
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131






Sequence name: /tmp/rbf314VLIm/yR43i4SbP4:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P3 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 1371.00 Escore: 0
Matching length: 131 Total length: 131
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . . . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPTRRKPGKCPVTYGQCLMLN 100
. . .
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131
|||||||||||||||||||||||||||||||
101 PPNFCEMDGQCKRDLKCCMGMCGKSCVSPVK 131






Sequence name: /tmp/KCtSXACZXe/rK4T6LKeRX:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P7 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 81 Total length: 81
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNP 81
|||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNP 81






Sequence name: /tmp/LcBlcAxB6c/NSI9pqfxoU:ALK1_HUMAN

Sequence documentation:

Alignment of: Z25299_PEA_2_P10 x ALK1_HUMAN ..

Alignment segment 1/1:

Quality: 844.00 Escore: 0
Matching length: 82 Total length: 82
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKSSGLFPFLVLLALGTLAPWAVEGSGKSFKAGVCPPKKSAQCLRYKKPE 50
. . .
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPT 82
||||||||||||||||||||||||||||||||
51 CQSDWQCPGKKRCCPDTCGIKCLDPVDTPNPT 82


正常および癌性肺組織における配列名Z25299junc13−14−21中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビターZ25299転写物の発現
junc13−14−21、Z25299junc13−14−21アンプリコン(配列番号1666)ならびにZ25299junc13−14−21F(配列番号1664)およびZ25299junc13−14−21R(配列番号1665)プライマーによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの差分発現の倍率を得た。
図36は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の下方制御を示すヒストグラムである。
図36から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に低かった。
下記のように、これらの結果の有意性を検証するために、統計分析に適用した。
肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現レベルの相違についてのP値を、T検定によって、1.98E−04と決定した。この値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z25299junc13−14−21F順方向プライマーおよびZ25299junc13−14−21R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z25299junc13−14−21。
順方向プライマー(配列番号1664):ACCCCAAACCCAACTTGATTC
逆方向プライマー(配列番号1665):TCAGTGGTGGAGCCAAGTCTC
アンプリコン(配列番号1666):ACCCCAAACCCAACTTGATTCCTGCCATATGGAGGAGGCTCTGGAGTCCTGCTCTGTGTGGTCCAGGTCCTTTCCACCCTGAGACTTGGCTCCACCACTGA
正常および癌性肺組織における配列名Z25299seg20中に示すアンプリコンによって検出可能なZ25299転写物
seg20、Z25299seg20アンプリコン(配列番号1669)ならびにZ25299seg20F(配列番号1667)およびZ25299seg20R(配列番号1668)プライマーによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割った。次いで、この比の逆数を計算して、正常なPMサンプルの中央値に対する各サンプルの下方制御の倍率を得た。
図37は、正常サンプルと比較したいくつかの癌性肺サンプルにおける上記分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の下方制御を示すヒストグラムである。総試験サンプル数のうちの少なくとも5倍の下方制御を示すサンプルの数および比率を、下に示す。
図37から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に低かった。明白には、15個の腺癌サンプルのうちの6個、16個の扁平上皮細胞癌サンプルのうちの9個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの8個で少なくとも5倍の下方制御が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常組織サンプルにおける上記アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテアーゼインヒビター転写物の発現レベルの相違についてのP値を、T検定によって、腺癌では9.43E−02、扁平上皮細胞癌では5.62E−02であり、大細胞癌では3.38E−01であり、小細胞癌で3.78E−02と決定された。
5倍下方制御の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で3.73E−02、扁平上皮細胞癌で1.10E−02、大細胞癌で2.64E−02、小細胞癌で7.14E−05であった。上記値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z25299seg20F順方向プライマーおよびZ25299seg20R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z25299seg20。

順方向プライマー(配列番号1667):CTCCTGAACCCTACTCCAAGCA
逆方向プライマー(配列番号1668):CAGGCGATCCTATGGAAATCC
アンプリコン(配列番号1669):CTCCTGAACCCTACTCCAAGCACAGCCTCTGTCTGACTCCCTTGTCCTTCAAGAGAACTGTTCTCCAGGTCTCAGGGCCAGGATTTCCATAGGATCGCCTG
正常および癌性肺組織における配列名Z25299seg23中に示すアンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)Z25299転写物の発現
seg23、Z25299seg23アンプリコン(配列番号1672)ならびにプライマーZ25299seg23F(配列番号1670)およびZ25299seg23R(配列番号1671)によって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割った。次いで、この比の逆数を計算して、正常なPMサンプルの中央値に対する各サンプルの下方制御の倍率を得た。
図68は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)転写物の下方制御を示すヒストグラムである。
図68から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に低かった。明白には、15個の腺癌サンプルのうちの7個、16個の扁平上皮細胞癌サンプルのうちの9個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの8個で少なくとも10倍の下方制御が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:Z25299seg23F順方向プライマーおよびZ25299seg23R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:Z25299seg23。

プライマー:
順方向プライマーZ25299seg23F(配列番号1670):CAAGCAATTGAGGGACCAGG
逆方向プライマーZ25299seg23R(配列番号1671):CAAAAAACATTGTTAATGAGAGAGATGAC
アンプリコンZ25299seg23F(配列番号1672):CAAGCAATTGAGGGACCAGGAAGTGGATCCTCTAGAGATGAGGAGGCATTCTGCTGGATGACTTTTAAAAATGTTTTCTCCAGAGTCATCTCTCTCATTAACAATGTTTTTTG
異なる正常組織における配列名Z25299seg20中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現
Z25299seg20アンプリコン(配列番号1669)ならびにプライマーZ25299seg23F(配列番号1667)およびZ25299seg20R(配列番号1668)によって検出可能な分泌性白血球プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。

プライマー:
順方向プライマー(配列番号1667):CTCCTGAACCCTACTCCAAGCA
逆方向プライマー(配列番号1668):CAGGCGATCCTATGGAAATCC
アンプリコン(配列番号1669):CTCCTGAACCCTACTCCAAGCACAGCCTCTGTCTGACTCCCTTGTCCTTCAAGAGAACTGTTCTCCAGGTCTCAGGGCCAGGATTTCCATAGGATCGCCTG
結果を図69に示し、これは、異なる正常組織における配列名Z25299seg20中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示す。
異なる正常組織における配列名Z25299seg23中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターZ25299転写物の発現
Z25299seg23アンプリコン(配列番号1672)ならびにプライマーZ25299seg23F(配列番号1670)およびZ25299seg23R(配列番号1671)によって検出可能な分泌性白血球プロテアーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン、配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(サンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現値を得た。

プライマー:
順方向プライマーZ25299seg23F(配列番号1670):CAAGCAATTGAGGGACCAGG
逆方向プライマーZ25299seg23R(配列番号1671):CAAAAAACATTGTTAATGAGAGAGATGAC
アンプリコンZ25299seg23F(配列番号1672):CAAGCAATTGAGGGACCAGGAAGTGGATCCTCTAGAGATGAGGAGGCATTCTGCTGGATGACTTTTAAAAATGTTTTCTCCAGAGTCATCTCTCTCATTAACAATGTTTTTTG
結果を図70に示し、これは、異なる正常組織における配列名Z25299seg23中に示すアンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示す。
クラスターHSSTROL3の説明
クラスターHSSTROL3は、目的の6つの転写物および16個のセグメントを特徴とし、その名称を、それぞれ表1064および1065に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1066に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるストロメリシン−3前駆体(SwissProtアクセッション識別子MM11_HUMAN、同義語EC3.4.24.−、マトリクス金属プロテイナーゼ−11、MMP−11、ST3、SL−3としても公知である)(配列番号1455)の変異型である。
タンパク質ストロメリシン−3前駆体は、以下の機能を有することが公知であるか、そのように見なされている:上皮悪性腫瘍の進行において重要な役割を果たし得る。タンパク質ストロメリシン−3前駆体の配列を、「ストロメリシン−3前駆体アミノ酸配列」として出願書類の最後に示す。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けであるタンパク質分解およびペプチド分解、発生過程、形態形成、分子機能に関連する注釈付けであるストロメリシン3、カルシウム結合、亜鉛結合、ヒドロラーゼ、ならびに細胞成分に関連する注釈付けである細胞外基質。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHSSTROL3を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図38のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図38および表1067中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):移行上皮癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHSSTROL3は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質ストロメリシン−3前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HSSTROL3_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T5によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSSTROL3_P4とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P4のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P4のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜445に対応し、HSSTROL3_P4のアミノ酸165〜445にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKIYFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P4のアミノ酸446〜496に対応する配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P4をコードする単離キメラポリペプチド。
2.HSSTROL3_P4中の配列ALGVRQLVGGGHSSRFSHLVVAGLPHACHRKSGSSSQVLCPEPSALLSVAGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P4のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSSTROL3_P4はまた、表1069に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HSSTROL3_P4は、以下の転写物によってコードされる:HSSTROL3_T5(配列は出願書類の最後に示す)。転写物HSSTROL3_T5のコード部分を太字で示し、このコード部分は24位から開始され、1511位で終結する。転写物はまた、表1070に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HSSTROL3_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T8およびHSSTROL3_T9によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSSTROL3_P5とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P5のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P5のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜358に対応し、HSSTROL3_P5のアミノ酸165〜358にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P5のアミノ酸359〜382に対応する配列ELGFPSSTGRDESLEHCRCQGLHKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P5をコードする単離キメラポリペプチド。
2.HSSTROL3_P5中の配列ELGFPSSTGRDESLEHCRCQGLHKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P5のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSSTROL3_P5はまた、表1071に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HSSTROL3_P5は、以下の転写物によってコードされる:HSSTROL3_T8およびHSSTROL3_T9(配列は出願書類の最後に示す)。
転写物HSSTROL3_T8のコード部分を太字で示し、このコード部分は24位から開始され、1569位で終結する。転写物はまた、表1072に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
転写物HSSTROL3_T9のコード部分を太字で示し、このコード部分は24位から開始され、1169位で終結する。転写物はまた、表1073に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HSSTROL3_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T10によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSSTROL3_P7とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P7のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P7のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P7のアミノ酸165〜359にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P7のアミノ酸360〜370に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P7をコードする単離キメラポリペプチド。
2.HSSTROL3_P7中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P7のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSSTROL3_P7はまた、表1074に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HSSTROL3_P7は、以下の転写物によってコードされる:HSSTROL3_T10(配列は出願書類の最後に示す)。転写物HSSTROL3_T10のコード部分を太字で示し、このコード部分は24位から開始され、1133位で終結する。転写物はまた、表1075に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HSSTROL3_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T11によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSSTROL3_P8とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜163に対応し、HSSTROL3_P8のアミノ酸1〜163にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVLSGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第1のアミノ酸配列と、HSSTROL3_P8のアミノ酸164に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜286に対応し、HSSTROL3_P8のアミノ酸165〜286にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P8のアミノ酸278〜301に対応する配列VRPCLPVPLLLCWPLを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P8をコードする単離キメラポリペプチド。
2.HSSTROL3_P8中の配列VRPCLPVPLLLCWPLと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P8のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSSTROL3_P8はまた、表1076に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HSSTROL3_P8は、以下の転写物によってコードされる:HSSTROL3_T11(配列は出願書類の最後に示す)。転写物HSSTROL3_T11のコード部分を太字で示し、このコード部分は24位から開始され、926位で終結する。転写物はまた、表1077に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HSSTROL3_P9は、出願書類の最後に示すアミノ酸配列を有し、転写物HSSTROL3_T12によってコードされる。公知のタンパク質(ストロメリシン−3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSSTROL3_P9とMM11_HUMANとの間の比較の報告
1.MM11_HUMANのアミノ酸1〜96に対応し、HSSTROL3_P9のアミノ酸1〜96にも対応するMAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQPWHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKと少なくとも90%相同な第1のアミノ酸配列と、MM11_HUMANのアミノ酸113〜163に対応し、HSSTROL3_P9のアミノ酸97〜147にも対応するRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHEGRADIMIDFARYWと少なくとも90%相同な第2のアミノ酸配列と、HSSTROL3_P9のアミノ酸148に対応する架橋アミノ酸Hと、MM11_HUMANのアミノ酸165〜359に対応し、HSSTROL3_P9のアミノ酸149〜343にも対応するGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWTIGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDCRGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDAVSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDAQGHIWFFQGと少なくとも90%相同な第3のアミノ酸配列と、HSSTROL3_P9のアミノ酸344〜354に対応する配列TTGVSTPAPGVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第4のアミノ酸配列とを含み、前記第1のアミノ酸配列、第2のアミノ酸配列、架橋アミノ酸、第3のアミノ酸配列、および第4のアミノ酸配列が、隣接し、且つ連続した順序にある、HSSTROL3_P9をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がKRを含み、以下の構造:アミノ酸番号96−x〜96のいずれかから始まり、アミノ酸番号97+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSSTROL3_P9の縁部分をコードする単離キメラポリペプチド。
3.HSSTROL3_P9中の配列TTGVSTPAPGVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HSSTROL3_P9のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSSTROL3_P9はまた、表1078に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HSSTROL3_P9は、以下の転写物によってコードされる:HSSTROL3_T12(配列は出願書類の最後に示す)。転写物HSSTROL3_T12のコード部分を太字で示し、このコード部分は24位から開始され、1085位で終結する。転写物はまた、表1079に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSSTROL3_P9配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHSSTROL3は、上の表2に列挙した16個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHSSTROL3_node_6は、14個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1080は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_10は、21個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1081は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_13は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1082は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_15は、47個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1083は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_19は、63個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1084は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_21は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1085は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_24は、7個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T8およびHSSTROL3_T9。以下の表1086は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_25は、13個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T8。以下の表1087は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_26は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、およびHSSTROL3_T11。以下の表1088は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_28は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T9、およびHSSTROL3_T10。以下の表1089は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_29は、109個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1090は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHSSTROL3_node_11は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、およびHSSTROL3_T11。以下の表1091は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_17は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1092は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_18を、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1093は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_20は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T11。以下の表1094は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSSTROL3_node_27は、50個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSSTROL3_T5、HSSTROL3_T8、HSSTROL3_T9、HSSTROL3_T10、HSSTROL3_T11、およびHSSTROL3_T12。以下の表1095は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P4 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 4444.00 Escore: 0
Matching length: 445 Total length: 445
Matching Percent Similarity: 99.78 Matching Percent Identity: 99.78
Total Percent Similarity: 99.78 Total Percent Identity: 99.78
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
. . . . .
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 QGHIWFFQGAQYWVYDGEKPVLGPAPLTELGLVRFPVHAALVWGPEKNKI 400
. . . .
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445
|||||||||||||||||||||||||||||||||||||||||||||
401 YFFRGRDYWRFHPSTRRVDSPVPRRATDWRGVPSEIDAAFQDADG 445






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P5 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3566.00 Escore: 0
Matching length: 358 Total length: 358
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQ 358
||||||||
351 QGHIWFFQ 358






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P7 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3575.00 Escore: 0
Matching length: 359 Total length: 359
Matching Percent Similarity: 99.72 Matching Percent Identity: 99.72
Total Percent Similarity: 99.72 Total Percent Identity: 99.72
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

351 QGHIWFFQG 359
|||||||||
351 QGHIWFFQG 359






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P8 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 2838.00 Escore: 0
Matching length: 286 Total length: 286
Matching Percent Similarity: 99.65 Matching Percent Identity: 99.65
Total Percent Similarity: 99.65 Total Percent Identity: 99.65
Gaps: 0

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
151 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . .
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286
||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLE 286






Sequence name: MM11_HUMAN

Sequence documentation:

Alignment of: HSSTROL3_P9 x MM11_HUMAN ..

Alignment segment 1/1:

Quality: 3316.00 Escore: 0
Matching length: 343 Total length: 359
Matching Percent Similarity: 99.71 Matching Percent Identity: 99.71
Total Percent Similarity: 95.26 Total Percent Identity: 95.26
Gaps: 1

Alignment:
. . . . .
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MAPAAWLRSAAARALLPPMLLLLLQPPPLLARALPPDVHHLHAERRGPQP 50
. . . . .
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQK.... 96
||||||||||||||||||||||||||||||||||||||||||||||
51 WHAALPSSPAPAPATQEAPRPASSLRPPRCGVPDPSDGLSARNRQKRFVL 100
. . . . .
97 ............RILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 134
||||||||||||||||||||||||||||||||||||||
101 SGGRWEKTDLTYRILRFPWQLVQEQVRQTMAEALKVWSDVTPLTFTEVHE 150
. . . . .
135 GRADIMIDFARYWHGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 184
||||||||||||| ||||||||||||||||||||||||||||||||||||
151 GRADIMIDFARYWDGDDLPFDGPGGILAHAFFPKTHREGDVHFDYDETWT 200
. . . . .
185 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 234
||||||||||||||||||||||||||||||||||||||||||||||||||
201 IGDDQGTDLLQVAAHEFGHVLGLQHTTAAKALMSAFYTFRYPLSLSPDDC 250
. . . . .
235 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 284
||||||||||||||||||||||||||||||||||||||||||||||||||
251 RGVQHLYGQPWPTVTSRTPALGPQAGIDTNEIAPLEPDAPPDACEASFDA 300
. . . . .
285 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 334
||||||||||||||||||||||||||||||||||||||||||||||||||
301 VSTIRGELFFFKAGFVWRLRGGQLQPGYPALASRHWQGLPSPVDAAFEDA 350

335 QGHIWFFQG 343
|||||||||
351 QGHIWFFQG 359


正常および癌性肺組織における配列名HSSTROL3seg24中に示すアンプリコンによって検出可能なストロメリシン−3前駆体HSSTROL3転写物の発現
seg24、HSSTROL3seg24アンプリコン(配列番号1675)、ならびにHSSTROL3seg24F(配列番号1673)およびHSSTROL3seg24R(配列番号1674)プライマーによって検出可能なストロメリシン−3前駆体(EC3.4.24.−)(マトリクス金属プロテイナーゼ−11)(MMP−11)(ST3)(SL−3)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図39は、正常サンプルと比較した癌性肺サンプルにおける上記ストロメリシン−3前駆体転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。
図39から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なストロメリシン−3前駆体転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの13個、16個の扁平上皮細胞癌サンプルのうちの8個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの7個で少なくとも5倍の過剰発現が見出された。
5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で4.04E−04、扁平上皮細胞癌で9.89E−02、大細胞癌で6.04E−02、小細胞癌で3.14E−03であった。上記値は、結果が統計的に有意であることを示す。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HSSTROL3seg24F順方向プライマーおよびHSSTROL3seg24R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HSSTROL3seg24。
順方向プライマー(配列番号1673):ATTTCCATCCTCAACTGGCAGA
逆方向プライマー(配列番号1674):TGCCCTGGAACCCACG
アンプリコン(配列番号1675):ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAAGGCACAGCATGGGAAACCTGCGTGGGTTCCAGGGCA
異なる正常組織における配列名HSSTROL3seg24中に示すアンプリコンによって検出可能なストロメリシン−3前駆体HSSTROL3転写物の発現
HSSTROL3seg24アンプリコン(配列番号1675)ならびにHSSTROL3seg24F(配列番号1673)およびHSSTROL3seg24R(配列番号1674)によって検出可能なストロメリシン−3前駆体転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表2、「正常パネル中の組織サンプル」)の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。
順方向プライマー(配列番号1673):ATTTCCATCCTCAACTGGCAGA
逆方向プライマー(配列番号1674):TGCCCTGGAACCCACG
アンプリコン(配列番号1675):ATTTCCATCCTCAACTGGCAGAGATGAGAGCCTGGAGCATTGCAGATGCCAGGGACTTCACAAATGAAGGCACAGCATGGGAAACCTGCGTGGGTTCCAGGGCA
結果を図40に示し、これは、異なる正常組織における配列名HSSTROL3seg24中に示すアンプリコンによって検出可能なストロメリシン−3HSSTROL3転写物の発現を示す。
正常および癌性肺組織における配列名HSSTROL3seg20−21中に示すアンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)HSSTROL3転写物の発現
seg20−21、HSSTROL3seg20−21アンプリコン(配列番号1678)ならびにプライマーHSSTROL3seg20−21F(配列番号1676)およびHSSTROL3seg20−21R(配列番号1677)によって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図71は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の過剰発現を示すヒストグラムである。
図71から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの11個、16個の扁平上皮細胞癌サンプルのうち6個、4個の大細胞癌サンプルのうちの1個、8個の小細胞癌サンプルのうちの6個で少なくとも6倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HSSTROL3seg20−21F順方向プライマーおよびHSSTROL3seg20−21R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HSSTROL3seg20−21。

プライマー:
順方向プライマーHSSTROL3seg20−21F(配列番号1676):TCTGCTGGCCACTGTGACTG
逆方向プライマーHSSTROL3seg20−21R(配列番号1677):GAAGAAAAAGAGCTCGCCTCG
アンプリコンHSSTROL3seg20−21(配列番号1678):TCTGCTGGCCACTGTGACTGCAGCATATGCCCTCAGCATGTGTCCCTCTCTCCCACCCCAGCCAGACGCCCCGCCAGATGCCTGTGAGGCCTCCTTTGACGCGGTCTCCACCATCCGAGGCGAGCTCTTTTTCTTC
正常および癌性肺組織における配列名HHSSTROL3junc21−27中に示すアンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)HSSTROL3転写物の発現
junc21−27、HSSTROL3junc21−27アンプリコン(配列番号1681)ならびにプライマーHSSTROL3junc21−27F(配列番号1679)およびHSSTROL3junc21−27R(配列番号1680)によって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ−11(ストロメリシン3)(MMP11)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図72は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の過剰発現を示すヒストグラムである。
図72から明らかなように、癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの15個、16個の扁平上皮細胞癌サンプルのうち13個、4個の大細胞癌サンプルのうちの3個、8個の小細胞癌サンプルのうちの5個で少なくとも10倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:HSSTROL3junc21−27F順方向プライマーおよびHSSTROL3junc21−27R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:HSSTROL3junc21−27。

プライマー:
順方向プライマーHSSTROL3junc21−27F(配列番号1679):ACATTTGGTTCTTCCAAGGGACTAC
逆方向プライマーHSSTROL3junc21−27R(配列番号1680):TCGATCTCAGAGGGCACCC
アンプリコンHSSTROL3junc21−27(配列番号1681):ACATTTGGTTCTTCCAAGGGACTACTGGCGTTTCCACCCCAGCACCCGGCGTGTAGACAGTCCCGTGCCCCGCAGGGCCACTGACTGGAGAGGGGTGCCCTCTGAGATCGA
クラスターHUMTREFACの説明
クラスターHUMTREFACは、目的の2つの転写物および7個のセグメントを特徴とし、その名称を、それぞれ表1096および1097に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1098に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるトレフォイル因子3(Trefoil factor 3)前駆体(SwissProtアクセッション識別子TFF3_HUMAN、同義語腸トレフォイル因子、hP1.Bとしても公知である)(配列番号1456)の変異型である。
タンパク質トレフォイル因子3前駆体は、以下の機能を有することが公知であるか、そのように見なされている:細胞移動の促進で役割を果たし得る(細胞遊走促進因子)。タンパク質トレフォイル因子3前駆体の配列を、「トレフォイル因子3前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1099に示す。
Figure 2008507261
タンパク質トレフォイル因子3前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである防御応答、消化、および細胞成分に関連する注釈付けである細胞外。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHUMTREFACを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図41のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図41および表1100中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):異なる組織由来の悪性腫瘍の混合物、悪性乳癌、膵臓癌、および前立腺癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHUMTREFACは、上の表1に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質トレフォイル因子3前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMTREFAC_PEA_2_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMTREFAC_PEA_2_T5によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMTREFAC_PEA_2_P7はまた、表1102に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HUMTREFAC_PEA_2_P7は、以下の転写物によってコードされる:HUMTREFAC_PEA_2_T5(配列は出願書類の最後に示す)。転写物HUMTREFAC_PEA_2_T5のコード部分を太字で示し、このコード部分は278位から開始され、688位で終結する。転写物はまた、表1103に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質HUMTREFAC_PEA_2_P8は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMTREFAC_PEA_2_T4によってコードされる。公知のタンパク質(トレフォイル因子3前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMTREFAC_PEA_2_P8とTFF3_HUMANとの間の比較の報告
1.TFF3_HUMANのアミノ酸1〜27に対応し、HUMTREFAC_PEA_2_P8のアミノ酸1〜27にも対応するMAARALCMLGLVLALLSSSSAEEYVGLと少なくとも90%相同な第1のアミノ酸配列と、HUMTREFAC_PEA_2_P8のアミノ酸28〜41に対応する配列WKVHLPKGEGFSSGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMTREFAC_PEA_2_P8をコードする単離キメラポリペプチド。
2.HUMTREFAC_PEA_2_P8中の配列WKVHLPKGEGFSSGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMTREFAC_PEA_2_P8のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMTREFAC_PEA_2_P8はまた、表1104に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HUMTREFAC_PEA_2_P8は、以下の転写物によってコードされる:HUMTREFAC_PEA_2_T4(配列は出願書類の最後に示す)。転写物HUMTREFAC_PEA_2_T4のコード部分を太字で示し、このコード部分は278位から開始され、400位で終結する。転写物はまた、表1105に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMTREFAC_PEA_2_P8配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHUMTREFACは、上の表2に列挙した7個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_0は、188個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1106は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_9は、150個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1107は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_2は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4。以下の表1108は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_3は、10個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1109は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_4は、197個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1110は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_5は、187個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1111は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMTREFAC_PEA_2_node_8を、以下の転写物中に見出すことができる:HUMTREFAC_PEA_2_T4およびHUMTREFAC_PEA_2_T5。以下の表1112は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: TFF3_HUMAN

Sequence documentation:

Alignment of: HUMTREFAC_PEA_2_P8 x TFF3_HUMAN ..

Alignment segment 1/1:

Quality: 246.00 Escore: 0
Matching length: 27 Total length: 27
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. .
1 MAARALCMLGLVLALLSSSSAEEYVGL 27
|||||||||||||||||||||||||||
1 MAARALCMLGLVLALLSSSSAEEYVGL 27


クラスターHSS100PCBの説明
クラスターHSS100PCBは、目的の1つの転写物および3個のセグメントを特徴とし、その名称を、それぞれ表1113および1114に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1115に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれ、2つのカルシウムイオンに結合する公知のタンパク質であるS−100Pタンパク質(SwissProtアクセッション識別子S10P_HUMAN)(配列番号1457)の変異型である。
タンパク質S−100Pタンパク質の配列を、「S−100Pタンパク質アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1116に示す。
Figure 2008507261
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるカルシウム結合、タンパク質結合。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHSS100PCBを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図42のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図42および表1117中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHSS100PCBは、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質S−100Pタンパク質の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HSS100PCB_P3は、出願書類の最後に示すアミノ酸配列を有し、転写物HSS100PCB_T1によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HSS100PCB_P3はまた、表1119に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSS100PCB_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、HSS100PCB_P3は、以下の転写物によってコードされる:HSS100PCB_T1(配列は出願書類の最後に示す)。転写物HSS100PCB_T1のコード部分を太字で示し、このコード部分は1057位から開始され、1533位で終結する。転写物はまた、表1120に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSS100PCB_P3配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHSS100PCBは、上の表2に列挙した3個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHSS100PCB_node_3は、16個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSS100PCB_T1。以下の表1121は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSS100PCB_node_4は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSS100PCB_T1。以下の表1122は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSS100PCB_node_5は、141個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSS100PCB_T1。以下の表1124は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
クラスターHSU33147の説明
クラスターHSU33147は、目的の2つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表1125および1126に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1127に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるマンマグロビンA前駆体(SwissProtアクセッション識別子MGBA_HUMAN、同義語マンマグロビン1、セクレトグロビンファミリー2Aメンバー2としても公知である)(配列番号1416)の変異型である。
タンパク質マンマグロビンA前駆体の配列を、「マンマグロビンA前駆体アミノ酸配列」として出願書類の最後に示す。
ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:免疫賦活剤。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(抗癌薬)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:分子機能に関連する注釈付けであるステロイド結合。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHSU33147を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の左側のカラム中の用語「数」および図43のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図43および表1128中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):異なる組織由来の悪性腫瘍の混合物。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHSU33147は、上の表1に列挙した2つの転写物を特徴とする。これらの転写物は、タンパク質マンマグロビンA前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HSU33147_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物HSU33147_PEA_1_T1によってコードされる。公知のタンパク質(マンマグロビンA前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HSU33147_PEA_1_P5とMGBA_HUMANとの間の比較の報告
1.MGBA_HUMANのアミノ酸1〜78に対応し、HSU33147_PEA_1_P5のアミノ酸1〜78にも対応するMKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFIDDNATTNAIDELKECFLNQTDETLSNVEと少なくとも90%相同な第1のアミノ酸配列と、MGBA_HUMANのアミノ酸82〜93に対応し、HSU33147_PEA_1_P5のアミノ酸79〜90にも対応するQLIYDSSLCDLFと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HSU33147_PEA_1_P5をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がEQを含み、以下の構造:アミノ酸番号78−x〜78のいずれかから始まり、アミノ酸番号79+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、HSU33147_PEA_1_P5の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
公知のタンパク質マンマグロビンA前駆体と比較した変異タンパク質HSU33147_PEA_1_P5のグリコシル化部位を表1130に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、HSU33147_PEA_1_P5は、以下の転写物によってコードされる:HSU33147_PEA_1_T1(配列は出願書類の最後に示す)。転写物HSU33147_PEA_1_T1のコード部分を太字で示し、このコード部分は72位から開始され、341位で終結する。転写物はまた、表1131に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HSU33147_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHSU33147は、上の表2に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHSU33147_PEA_1_node_0は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T1およびHSU33147_PEA_1_T2。以下の表1132は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSU33147_PEA_1_node_2は、44個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T1およびHSU33147_PEA_1_T2。以下の表1133は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSU33147_PEA_1_node_4は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T2。以下の表1134は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHSU33147_PEA_1_node_7は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HSU33147_PEA_1_T1。以下の表1135は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHSU33147_PEA_1_node_3を、以下の転写物中に見出すことができる:HSU33147_PEA_1_T2。以下の表1136は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: MGBA_HUMAN

Sequence documentation:

Alignment of: HSU33147_PEA_1_P5 x MGBA_HUMAN ..

Alignment segment 1/1:

Quality: 776.00 Escore: 0
Matching length: 90 Total length: 93
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 96.77 Total Percent Identity: 96.77
Gaps: 1

Alignment:
. . . . .
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MKLLMVLMLAALSQHCYAGSGCPLLENVISKTINPQVSKTEYKELLQEFI 50
. . . .
51 DDNATTNAIDELKECFLNQTDETLSNVE...QLIYDSSLCDLF 90
|||||||||||||||||||||||||||| ||||||||||||
51 DDNATTNAIDELKECFLNQTDETLSNVEVFMQLIYDSSLCDLF 93


クラスターR20779の説明
クラスターR20779は、目的の1つの転写物および24個のセグメントを特徴とし、その名称を、それぞれ表1137および1138に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1139に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるスタニオカルシン2前駆体(SwissProtアクセッション識別子STC2_HUMAN、同義語STC−2、スタニオカルシン関連タンパク質、CTCRP、STC関連タンパク質としても公知である)(配列番号1458)の変異型である。
タンパク質スタニオカルシン2前駆体は、以下の機能を有することが公知であるか、そのように見なされている:カルシウムおよびリン酸塩のホメオスタシスに対する抗低カルシウム作用を有する。タンパク質スタニオカルシン2前駆体の配列を、「スタニオカルシン2前駆体アミノ酸配列」として出願書類の最後に示す。タンパク質スタニオカルシン2前駆体の局在化は、分泌と考えられる(可能性)。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞表面受容体結合シグナル伝達、細胞−細胞シグナル伝達、栄養応答経路、分子機能に関連する注釈付けであるホルモン、細胞成分に関連する注釈付けである細胞外。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターR20779を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図44のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図44および表1140中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および悪性肺腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターR20779は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質スタニオカルシン2前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R20779_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物R20779_T7によってコードされる。公知のタンパク質(スタニオカルシン2前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R20779_P2とSTC2_HUMANとの間の比較の報告
1.STC2_HUMANのアミノ酸1〜169に対応し、R20779_P2のアミノ酸1〜169にも対応するMCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNTAEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGKSFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQENTRVIVEMIHFKDLLLHEと少なくとも90%相同な第1のアミノ酸配列と、R20779_P2のアミノ酸170〜187に対応する配列CYKIEITMPKRRKVKLRDを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R20779_P2をコードする単離キメラポリペプチド。
2.R20779_P2中の配列CYKIEITMPKRRKVKLRDと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R20779_P2のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R20779_P2はまた、表1142に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R20779_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質スタニオカルシン2前駆体と比較した変異タンパク質R20779_P2のグリコシル化部位を表1143に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R20779_P2は、以下の転写物によってコードされる:R20779_T7(配列は出願書類の最後に示す)。転写物R20779_T7のコード部分を太字で示し、このコード部分は1397位から開始され、1957位で終結する。転写物はまた、表1144に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R20779_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターR20779は、上の表2に列挙した24個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR20779_node_0は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1145は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_2は、55個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1146は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_7は、63個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1147は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_9は、66個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1148は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_18は、61個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1149は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_21は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1150は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_24は、100個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1151は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_27は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1152は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_28は、31個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1153は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_30は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1154は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_31は、46個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1155は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_32は、88個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1156は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR20779_node_1は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1157は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_3は、52個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1158は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_10を、以下の転写物中に見出すことができる:R20779_T7。以下の表1159は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_11は、58個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1160は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_14は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1161は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_17は、54個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1162は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_19を、以下の転写物中に見出すことができる:R20779_T7。以下の表1163は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_20は、53個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1164は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_22は、76個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1165は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_23は、81個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R20779_T7。以下の表1166は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_25を、以下の転写物中に見出すことができる:R20779_T7。以下の表1167は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR20779_node_29を、以下の転写物中に見出すことができる:R20779_T7。以下の表1168は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: STC2_HUMAN

Sequence documentation:

Alignment of: R20779_P2 x STC2_HUMAN ..

Alignment segment 1/1:

Quality: 1688.00 Escore: 0
Matching length: 171 Total length: 171
Matching Percent Similarity: 99.42 Matching Percent Identity: 99.42
Total Percent Similarity: 99.42 Total Percent Identity: 99.42
Gaps: 0

Alignment:
. . . . .
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MCAERLGQFMTLALVLATFDPARGTDATNPPEGPQDRSSQQKGRLSLQNT 50
. . . . .
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 AEIQHCLVNAGDVGCGVFECFENNSCEIRGLHGICMTFLHNAGKFDAQGK 100
. . . . .
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 SFIKDALKCKAHALRHRFGCISRKCPAIREMVSQLQRECYLKHDLCAAAQ 150
. .
151 ENTRVIVEMIHFKDLLLHECY 171
||||||||||||||||||| |
151 ENTRVIVEMIHFKDLLLHEPY 171


クラスターR38144の説明
クラスターR38144は、目的の6つの転写物および24個のセグメントを特徴とし、その名称を、それぞれ表1169および1170に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1171に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質である推定α−マンノシダーゼC20orf31前駆体(SwissProtアクセッション識別子CT31_HUMAN、同義語EC3.2.1としても公知である)(配列番号1459)の変異型である。
タンパク質推定α−マンノシダーゼC20orf31前駆体の配列を、「推定α−マンノシダーゼC20orf31前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1172に示す。
Figure 2008507261
タンパク質推定α−マンノシダーゼC20orf31前駆体の局在化は、分泌と考えられる(可能性)。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである炭水化物代謝、N結合グリコシル化、分子機能に関連する注釈付けであるグリコシル結合に対して作用するマンノシル−オリゴサッカリド1,2−α−マンノシダーゼ、カルシウム結合、ヒドロラーゼ、細胞成分に関連する注釈付けである膜。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターR38144を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図45のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図45および表1173中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、肺悪性腫瘍、皮膚悪性腫瘍、および胃癌。
Figure 2008507261
Figure 2008507261
上記のように、クラスターR38144は、上の表1に列挙した6つの転写物を特徴とする。これらの転写物は、タンパク質推定α−マンノシダーゼC20orf31前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R38144_PEA_2_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T6によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R38144_PEA_2_P6とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P6のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P6のアミノ酸413〜449に対応する配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P6をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P6中の配列LASFSHMSDQRSARPQAGQPHGVVLPGRDCEIPLPPVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P6のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R38144_PEA_2_P6はまた、表1175に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P6のグリコシル化部位を表1176に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R38144_PEA_2_P6は、以下の転写物によってコードされる:R38144_PEA_2_T6(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T6のコード部分を太字で示し、このコード部分は91位から開始され、1437位で終結する。転写物はまた、表1177に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質R38144_PEA_2_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T13によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R38144_PEA_2_P13とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜323に対応し、R38144_PEA_2_P13のアミノ酸1〜323にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P13のアミノ酸324〜341に対応する配列NLLKAQCTSTVPRGIPPSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P13をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P13中の配列NLLKAQCTSTVPRGIPPSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P13のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R38144_PEA_2_P13はまた、表1178に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P13のグリコシル化部位を表1179に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R38144_PEA_2_P13は、以下の転写物によってコードされる:R38144_PEA_2_T13(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T13のコード部分を太字で示し、このコード部分は91位から開始され、1113位で終結する。転写物はまた、表1180に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質R38144_PEA_2_P15は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T15によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R38144_PEA_2_P15とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜282に対応し、R38144_PEA_2_P15のアミノ酸1〜282にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P15のアミノ酸283〜287に対応する配列PHWRHを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P15をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P15中の配列PHWRHと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P15のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R38144_PEA_2_P15はまた、表1181に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P15のグリコシル化部位を表1182に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R38144_PEA_2_P15は、以下の転写物によってコードされる:R38144_PEA_2_T15(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T15のコード部分を太字で示し、このコード部分は91位から開始され、951位で終結する。転写物はまた、表1183に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P15配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質R38144_PEA_2_P19は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T19によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R38144_PEA_2_P19とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜412に対応し、R38144_PEA_2_P19のアミノ酸1〜412にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPLLRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIVEFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQDAGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P19のアミノ酸413〜433に対応する配列KRSRSVAQAGVQWCDHDSPQPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P19をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P19中の配列KRSRSVAQAGVQWCDHDSPQPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P19のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R38144_PEA_2_P19はまた、表1184に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P19のグリコシル化部位を表1185に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R38144_PEA_2_P19は、以下の転写物によってコードされる:R38144_PEA_2_T19(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T19のコード部分を太字で示し、このコード部分は91位から開始され、1389位で終結する。転写物はまた、表1186に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P19配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R38144_PEA_2_P24は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T27によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R38144_PEA_2_P24とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜121に対応し、R38144_PEA_2_P24のアミノ酸1〜121にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSYLENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEVLQDSVDFDIDVNASVFETNIRと少なくとも90%相同な第1のアミノ酸配列と、CT31_HUMANのアミノ酸282〜578に対応する配列EYNKAIRNYTRFDDWYLWVQMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLPEFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESIEKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNNGSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVEDLMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAKQKVPLLSCPSQPFTSKLALLGQVFLDSSと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P24をコードする単離キメラポリペプチド。
2.長さ「n」(式中、nは、少なくとも約10アミノ酸長、任意選択的に少なくとも約20アミノ酸長、好ましくは少なくとも約30アミノ酸長、より好ましくは少なくとも約40アミノ酸長、最も好ましくは少なくとも約50アミノ酸長である)を有し、少なくとも2つのアミノ酸がREを含み、以下の構造:アミノ酸番号121−x〜121のいずれかから始まり、アミノ酸番号122+((n−2)−x)(式中、xは0からn−2まで変化する)で終結する配列、を有する、ポリペプチドを含む、R38144_PEA_2_P24の縁部分をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R38144_PEA_2_P24はまた、表1187に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P24のグリコシル化部位を表1188に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R38144_PEA_2_P24は、以下の転写物によってコードされる:R38144_PEA_2_T27(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T27のコード部分を太字で示し、このコード部分は91位から開始され、1344位で終結する。転写物はまた、表1189に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P24配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R38144_PEA_2_P36は、出願書類の最後に示すアミノ酸配列を有し、転写物R38144_PEA_2_T10によってコードされる。公知のタンパク質(推定α−マンノシダーゼC20orf31前駆体、配列番号1459)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R38144_PEA_2_P36とAAH16184(配列番号1460)との間の比較の報告
1.AAH16184のアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチド。
R38144_PEA_2_P36とAAQ88943(配列番号1461)との間の比較の報告
1.AAQ88943のアミノ酸1〜35に対応し、R38144_PEA_2_P36のアミノ酸1〜35にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸36〜60に対応する配列RFWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P36中の配列RFWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチド。
R38144_PEA_2_P36とCT31_HUMANとの間の比較の報告
1.CT31_HUMANのアミノ酸1〜36に対応し、R38144_PEA_2_P36のアミノ酸1〜36にも対応するMPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRと少なくとも90%相同な第1のアミノ酸配列と、R38144_PEA_2_P36のアミノ酸37〜60に対応する配列FWGMSQNSKEWLKCSRTAWTLILMを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、R38144_PEA_2_P36をコードする単離キメラポリペプチド。
2.R38144_PEA_2_P36中の配列FWGMSQNSKEWLKCSRTAWTLILMと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R38144_PEA_2_P36のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R38144_PEA_2_P36はまた、表1190に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P36配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質推定α−マンノシダーゼC20orf31前駆体と比較した変異タンパク質R38144_PEA_2_P36のグリコシル化部位を表1191に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R38144_PEA_2_P36は、以下の転写物によってコードされる:R38144_PEA_2_T10(配列は出願書類の最後に示す)。転写物R38144_PEA_2_T10のコード部分を太字で示し、このコード部分は91位から開始され、270位で終結する。転写物はまた、表1192に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R38144_PEA_2_P36配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
上記のように、クラスターR38144は、上の表2に列挙した24個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR38144_PEA_2_node_21は、108個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1193は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_26は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1194は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_29は、98個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1195は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_31は、95個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1196は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_46は、147個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T27。以下の表1197は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_47は、147個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T27。以下の表1198は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_49は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T19。以下の表1199は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR38144_PEA_2_node_0は、101個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1200は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_1は、105個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1202は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_4は、107個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1203は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_5を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1204は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_7は、92個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1205は、各転写物上のこのセグメントの開始位置および終結位置を記載する。

Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_11は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1206は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_14を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1207は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_15は、105個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1208は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_16は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1209は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_19は、93個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1210は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_20を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T19。以下の表1211は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_36は、95個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1212は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_37は、97個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、R38144_PEA_2_T19、およびR38144_PEA_2_T27。以下の表1213は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_43を、以下の転写物中に見出すことができる:R38144_PEA_2_T6。以下の表1214は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_44を、以下の転写物中に見出すことができる:R38144_PEA_2_T6。以下の表1215は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_45を、以下の転写物中に見出すことができる:R38144_PEA_2_T6、R38144_PEA_2_T10、R38144_PEA_2_T13、R38144_PEA_2_T15、およびR38144_PEA_2_T27。以下の表1216は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR38144_PEA_2_node_51は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R38144_PEA_2_T19。以下の表1217は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P6 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4031.00 Escore: 0
Matching length: 413 Total length: 413
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.76
Total Percent Similarity: 100.00 Total Percent Identity: 99.76
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
.
401 EKISKVECGFATL 413
||||||||||||:
401 EKISKVECGFATI 413






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P13 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 3167.00 Escore: 0
Matching length: 326 Total length: 326
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.39
Total Percent Similarity: 100.00 Total Percent Identity: 99.39
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. .
301 QMYKGTVSMPVFQSLEAYWPGLQNLL 326
|||||||||||||||||||||||:|:
301 QMYKGTVSMPVFQSLEAYWPGLQSLI 326






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P15 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 2725.00 Escore: 0
Matching length: 282 Total length: 282
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282
||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLE 282






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P19 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4029.00 Escore: 0
Matching length: 412 Total length: 412
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
.
401 EKISKVECGFAT 412
||||||||||||
401 EKISKVECGFAT 412






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P24 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 4063.00 Escore: 0
Matching length: 418 Total length: 578
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 72.32 Total Percent Identity: 72.32
Gaps: 1

Alignment:
. . . . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRERVKAMFYHAYDSY 50
. . . . .
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 LENAFPFDELRPLTCDGHDTWGSFSLTLIDALDTLLILGNVSEFQRVVEV 100
. . . . .
101 LQDSVDFDIDVNASVFETNIR............................. 121
|||||||||||||||||||||
101 LQDSVDFDIDVNASVFETNIRVVGGLLSAHLLSKKAGVEVEAGWPCSGPL 150
. . . . .
121 .................................................. 121

151 LRMAEEAARKLLPAFQTPTGMPYGTVNLLHGVNPGETPVTCTAGIGTFIV 200
. . . . .
121 .................................................. 121

201 EFATLSSLTGDPVFEDVARVALMRLWESRSDIGLVGNHIDVLTGKWVAQD 250
. . . . .
122 ...............................EYNKAIRNYTRFDDWYLWV 140
|||||||||||||||||||
251 AGIGAGVDSYFEYLVKGAILLQDKKLMAMFLEYNKAIRNYTRFDDWYLWV 300
. . . . .
141 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 190
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QMYKGTVSMPVFQSLEAYWPGLQSLIGDIDNAMRTFLNYYTVWKQFGGLP 350
. . . . .
191 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 240
||||||||||||||||||||||||||||||||||||||||||||||||||
351 EFYNIPQGYTVEKREGYPLRPELIESAMYLYRATGDPTLLELGRDAVESI 400
. . . . .
241 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 290
||||||||||||||||||||||||||||||||||||||||||||||||||
401 EKISKVECGFATIKDLRDHKLDNRMESFFLAETVKYLYLLFDPTNFIHNN 450
. . . . .
291 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 340
||||||||||||||||||||||||||||||||||||||||||||||||||
451 GSTFDAVITPYGECILGAGGYIFNTEAHPIDPAALHCCQRLKEEQWEVED 500
. . . . .
341 LMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAK 390
||||||||||||||||||||||||||||||||||||||||||||||||||
501 LMREFYSLKRSRSKFQKNTVSSGPWEPPARPGTLFSPENHDQARERKPAK 550
. .
391 QKVPLLSCPSQPFTSKLALLGQVFLDSS 418
||||||||||||||||||||||||||||
551 QKVPLLSCPSQPFTSKLALLGQVFLDSS 578






Sequence name: AAH16184

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAH16184 ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36
||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36






Sequence name: AAQ88943

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x AAQ88943 ..

Alignment segment 1/1:

Quality: 362.00 Escore: 0
Matching length: 37 Total length: 37
Matching Percent Similarity: 97.30 Matching Percent Identity: 97.30
Total Percent Similarity: 97.30 Total Percent Identity: 97.30
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYRF 37
||||||||||||||||||||||||||||||||||| |
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYSF 37






Sequence name: CT31_HUMAN

Sequence documentation:

Alignment of: R38144_PEA_2_P36 x CT31_HUMAN ..

Alignment segment 1/1:

Quality: 364.00 Escore: 0
Matching length: 36 Total length: 36
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36
||||||||||||||||||||||||||||||||||||
1 MPFRLLIPLGLLCALLPQHHGAPGPDGSAPDPAHYR 36


クラスターHUMOSTROの説明
クラスターHUMOSTROは、目的の3つの転写物および30個のセグメントを特徴とし、その名称を、それぞれ表1218および1219に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1220に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるオステオポンチン前駆体(SwissProtアクセッション識別子OSTP_HUMAN、同義語骨シアロタンパク質1、尿結石タンパク質、分泌性リンタンパク質1、SPP−1、ネフロポンチン、ウロポンチンとしても公知である)(配列番号1462)の変異型である。
タンパク質オステオポンチン前駆体は、以下の機能を有することが公知であるか、そのように見なされている:石灰化基質の不可欠部分を形成するようである。おそらく、細胞−基質相互作用に重要である。インターフェロンγおよびインターロイキン−12の産生の増強ならびにインターロイキン−10産生の減少に関与するサイトカインとして作用し、I型免疫を生じる経路に不可欠である(類似性による)。タンパク質オステオポンチン前駆体の配列を、「オステオポンチン前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1221に示す。
Figure 2008507261
タンパク質オステオポンチン前駆体の局在化は、分泌と考えられる。
以前に公知のタンパク質はまた、以下の適応症および/または潜在的治療用途を有する:再生(骨)。ヒトにおける臨床/治療用途(例えば、抗体または小分子の標的として、および/または直接的な治療として)が調査されており、これらの調査に関連する利用可能な情報は以下である。以前に公知のタンパク質の潜在的な薬学的に関連するか治療に関連する活性は以下である:骨形成刺激薬。クラスターによって示されたタンパク質の治療における役割が予想されている。このタンパク質またはその一部を、潜在的治療に適用する(筋骨格)ために使用するか使用することができる薬物データベースまたは公的なデータベース(例えば、上記)に情報が存在するので、クラスターをこの分野に割り当てた。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである骨化、抗アポトーシス、炎症反応、細胞−基質接着、細胞−細胞シグナル伝達、分子機能に関連する注釈付けである防御/免疫タンパク質、サイトカイン、インテグリンリガンド、タンパク質結合、成長因子、アポトーシスインヒビター、および細胞成分に関連する注釈付けである細胞外基質。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターHUMOSTROを、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図46のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図46および表1222中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性腫瘍、悪性乳癌、卵巣癌、および皮膚悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターHUMOSTROは、上の表1に列挙した3つの転写物を特徴とする。これらの転写物は、タンパク質オステオポンチン前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMOSTRO_PEA_1_PEA_1_T14によってコードされる。公知のタンパク質(オステオポンチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMOSTRO_PEA_1_PEA_1_P21とOSTP_HUMANとの間の比較の報告
1.OSTP_HUMANのアミノ酸1〜58に対応し、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸1〜58にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQKQNLLAPQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P21のアミノ酸59〜64に対応する配列VFLNFSを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P21をコードする単離キメラポリペプチド。
2.HUMOSTRO_PEA_1_PEA_1_P21中の配列VFLNFSと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P21のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、公知のタンパク質局在化および/または遺伝子構造の手作業による調査によって、分泌と考えられる。
変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21はまた、表1224に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21のグリコシル化部位を表1225に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、HUMOSTRO_PEA_1_PEA_1_P21は、以下の転写物によってコードされる:HUMOSTRO_PEA_1_PEA_1_T14(配列は出願書類の最後に示す)。転写物HUMOSTRO_PEA_1_PEA_1_T14のコード部分を太字で示し、このコード部分は199位から開始され、390位で終結する。転写物はまた、表1226に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P21配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMOSTRO_PEA_1_PEA_1_T16によってコードされる。公知のタンパク質(オステオポンチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMOSTRO_PEA_1_PEA_1_P25とOSTP_HUMANとの間の比較の報告
1.OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P25のアミノ酸32〜32に対応する配列Hを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P25をコードする単離キメラポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25はまた、表1227に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25のグリコシル化部位を表1228に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、HUMOSTRO_PEA_1_PEA_1_P25は、以下の転写物によってコードされる:HUMOSTRO_PEA_1_PEA_1_T16(配列は出願書類の最後に示す)。転写物HUMOSTRO_PEA_1_PEA_1_T16のコード部分を太字で示し、このコード部分は199位から開始され、294位で終結する。転写物はまた、表1229に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P25配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
Figure 2008507261
Figure 2008507261
本発明の変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30は、出願書類の最後に示すアミノ酸配列を有し、転写物HUMOSTRO_PEA_1_PEA_1_T30によってコードされる。公知のタンパク質(オステオポンチン前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
HUMOSTRO_PEA_1_PEA_1_P30とOSTP_HUMANとの間の比較の報告
1.OSTP_HUMANのアミノ酸1〜31に対応し、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸1〜31にも対応するMRIAVICFCLLGITCAIPVKQADSGSSEEKQと少なくとも90%相同な第1のアミノ酸配列と、HUMOSTRO_PEA_1_PEA_1_P30のアミノ酸32〜39に対応する配列VSIFYVFIを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1のアミノ酸配列および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、HUMOSTRO_PEA_1_PEA_1_P30をコードする単離キメラポリペプチド。
2.HUMOSTRO_PEA_1_PEA_1_P30中の配列VSIFYVFIと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、HUMOSTRO_PEA_1_PEA_1_P30のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30はまた、表1230に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質オステオポンチン前駆体と比較した変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30のグリコシル化部位を表1231に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、HUMOSTRO_PEA_1_PEA_1_P30は、以下の転写物によってコードされる:HUMOSTRO_PEA_1_PEA_1_T30(配列は出願書類の最後に示す)。転写物HUMOSTRO_PEA_1_PEA_1_T30のコード部分を太字で示し、このコード部分は199位から開始され、315位で終結する。転写物はまた、表1232に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質HUMOSTRO_PEA_1_PEA_1_P30配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターHUMOSTROは、上の表2に列挙した30個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_0は、333個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1233は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_10は、4個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T16。以下の表1235は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_16は、6個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14。以下の表1236は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_23は、334個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1237は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_31は、350個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1238は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_43は、192個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1239は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_3は、353個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1240は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_5は、353個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1241は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_7は、357個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14、HUMOSTRO_PEA_1_PEA_1_T16、およびHUMOSTRO_PEA_1_PEA_1_T30。以下の表1242は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_8は、1個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T30。以下の表1243は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_15は、366個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1244は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_17は、261個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1245は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_20を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1246は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_21は、315個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1247は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_22は、322個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1248は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_24は、270個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1249は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_26を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1250は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_27は、260個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1251は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_28は、273個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1252は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_29は、272個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1253は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_30を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1254は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_32は、293個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1255は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_34は、301個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1256は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_36は、292個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1257は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_37は、295個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1258は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_38を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1259は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_39は、268個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1260は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_40を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1261は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_41を、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1262は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターHUMOSTRO_PEA_1_PEA_1_node_42は、224個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:HUMOSTRO_PEA_1_PEA_1_T14およびHUMOSTRO_PEA_1_PEA_1_T16。以下の表1263は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P21 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 578.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQLYNKYPDAVATWLNPDPSQ 50

51 KQNLLAPQ 58
||||||||
51 KQNLLAPQ 58






Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P25 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31






Sequence name: OSTP_HUMAN

Sequence documentation:

Alignment of: HUMOSTRO_PEA_1_PEA_1_P30 x OSTP_HUMAN ..

Alignment segment 1/1:

Quality: 301.00 Escore: 0
Matching length: 31 Total length: 31
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . .
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31
|||||||||||||||||||||||||||||||
1 MRIAVICFCLLGITCAIPVKQADSGSSEEKQ 31

クラスターR11723の説明
クラスターR11723は、目的の6つの転写物および26個のセグメントを特徴とし、その名称を、それぞれ表1264および1265に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1266に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
クラスターR11723を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図47のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図47および表1267中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および腎臓悪性腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、コンティグR11723は、上の表1に列挙した6つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R11723_PEA_1_P2は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T6によってコードされる。変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R11723_PEA_1_P2はまた、表1269に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R11723_PEA_1_P2は、以下の転写物によってコードされる:R11723_PEA_1_T6(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T6のコード部分を太字で示し、このコード部分は1716位から開始され、2051位で終結する。転写物はまた、表1270に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P2配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R11723_PEA_1_P6は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T15によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R11723_PEA_1_P6とQ8IXM0(配列番号1707)との間の比較の報告
1.R11723_PEA_1_P6のアミノ酸1〜110に対応する配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、Q8IXM0のアミノ酸1〜112に対応し、R11723_PEA_1_P6のアミノ酸111〜122にも対応するMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも90%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P6の配列MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGSPCRGLAPGREEQRALHKAGAVGGGVRと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6の先端をコードする単離ポリペプチド。
R11723_PEA_1_P6とQ96AC2(配列番号1708)との間の比較の報告
1.Q96AC2のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチド。
R11723_PEA_1_P6とQ8N2G4(配列番号1709)との間の比較の報告
1.Q8N2G4のアミノ酸1〜83に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチド。
R11723_PEA_1_P6とBAC85518(配列番号1710)との間の比較の報告
1.BAC85518のアミノ酸24〜106に対応し、R11723_PEA_1_P6のアミノ酸1〜83にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGIMYRKSCASSAACLIASAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P6のアミノ酸84〜222に対応する配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P6をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P6中の配列SPCRGLAPGREEQRALHKAGAVGGGVRMYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLREGEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRERQRKEKHSMRTQと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P6のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R11723_PEA_1_P6はまた、表1271に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R11723_PEA_1_P6は、以下の転写物によってコードされる:R11723_PEA_1_T15(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T15のコード部分を太字で示し、このコード部分は434位から開始され、1099位で終結する。転写物はまた、表1272に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P6配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R11723_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T17によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R11723_PEA_1_P7とQ96AC2との間の比較の報告
1.Q96AC2のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。
R11723_PEA_1_P7とQ8N2G4との間の比較の報告
1.Q8N2G4のアミノ酸1〜64に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。
R11723_PEA_1_P7とBAC85273との間の比較の報告
1.R11723_PEA_1_P7のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜80に対応し、R11723_PEA_1_P7のアミノ酸6〜64にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P7の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7の先端をコードする単離ポリペプチド。
3.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。
R11723_PEA_1_P7とBAC85518との間の比較の報告
1.BAC85518のアミノ酸24〜87に対応し、R11723_PEA_1_P7のアミノ酸1〜64にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAGと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P7のアミノ酸65〜93に対応する配列SHCVTRLECSGTISAHCNLCLPGSNDHPTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P7をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P7中の配列SHCVTRLECSGTISAHCNLCLPGSNDHPTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P7のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R11723_PEA_1_P7はまた、表1273に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R11723_PEA_1_P7は、以下の転写物によってコードされる:R11723_PEA_1_T17(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T17のコード部分を太字で示し、このコード部分は434位から開始され、712位で終結する。転写物はまた、表1274に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R11723_PEA_1_P13は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T19によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R11723_PEA_1_P13とQ96AC2との間の比較の報告
1.Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P13のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P13のアミノ酸64〜84に対応する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P13をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P13中の配列DTKRTNTLLFEMRHFAKQLTTと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P13のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質、R11723_PEA_1_P13は、以下の転写物によってコードされる:R11723_PEA_1_T19およびR11723_PEA_1_T5(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T19のコード部分を太字で示し、このコード部分は434位から開始され、685位で終結する。転写物はまた、表1275に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P13配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質R11723_PEA_1_P10は、出願書類の最後に示すアミノ酸配列を有し、転写物R11723_PEA_1_T20によってコードされる。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R11723_PEA_1_P10とQ96AC2との間の比較の報告
1.Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。
R11723_PEA_1_P10とQ8N2G4との間の比較の報告
1.Q8N2G4のアミノ酸1〜63に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。
R11723_PEA_1_P10とBAC85273との間の比較の報告
1.R11723_PEA_1_P10のアミノ酸1〜5に対応する配列MWVLGを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第1のアミノ酸配列と、BAC85273のアミノ酸22〜79に対応し、R11723_PEA_1_P10のアミノ酸6〜63にも対応するIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第2のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P10の配列MWVLGと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10の先端をコードする単離ポリペプチド。
3.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。
R11723_PEA_1_P10とBAC85518との間の比較の報告
1.BAC85518のアミノ酸24〜86に対応し、R11723_PEA_1_P10のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも90%相同な第1のアミノ酸配列と、R11723_PEA_1_P10のアミノ酸64〜90に対応する配列DRVSLCHEAGVQWNNFSTLQPLPPRLKを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配が、隣接し、且つ連続した順序にある、R11723_PEA_1_P10をコードする単離キメラポリペプチド。
2.R11723_PEA_1_P10中の配列DRVSLCHEAGVQWNNFSTLQPLPPRLKと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R11723_PEA_1_P10のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R11723_PEA_1_P10はまた、表1276に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、R11723_PEA_1_P10は、以下の転写物によってコードされる:R11723_PEA_1_T20(配列は出願書類の最後に示す)。転写物R11723_PEA_1_T20のコード部分を太字で示し、このコード部分は434位から開始され、703位で終結する。転写物はまた、表1277に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R11723_PEA_1_P10配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターR11723は、上の表2に列挙した26個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR11723_PEA_1_node_13は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T19、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1278は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_16は、3個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T17、R11723_PEA_1_T19、およびR11723_PEA_1_T20。以下の表1279は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_19は、45個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1280は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_2は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1281は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_22は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1282は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_31は、70個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1283は、各転写物上のこのセグメントの開始位置および終結位置を記載する(これらの転写物が別のポリアデニル化を示すことに留意すべきである)。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR11723_PEA_1_node_10は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1284は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_11は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1285は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_15を、以下の転写物中に見出すことができる:R11723_PEA_1_T20。以下の表1286は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_18は、40個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1287は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_20を、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1288は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_21は、36個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1289は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_23は、39個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T5およびR11723_PEA_1_T6。以下の表1290は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_24は、51個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1291は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_25は、54個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1292は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_26は、62個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1293は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_27は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1294は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_28を、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1295は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_29は、69個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1296は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_3を、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1297は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_30を、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1298は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_4は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1299は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_5は、26個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1300は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_6は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1301は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_7は、29個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T15、R11723_PEA_1_T17、R11723_PEA_1_T19、R11723_PEA_1_T20、R11723_PEA_1_T5、およびR11723_PEA_1_T6。以下の表1302は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR11723_PEA_1_node_8は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R11723_PEA_1_T6。以下の表1303は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8IXM0

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8IXM0 ..

Alignment segment 1/1:

Quality: 1128.00 Escore: 0
Matching length: 112 Total length: 112
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
111 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 160
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MYAQALLVVGVLQRQAAAQHLHEHPPKLLRGHRVQERVDDRAEVEKRLRE 50
. . . . .
161 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 210
||||||||||||||||||||||||||||||||||||||||||||||||||
51 GEEDHVRPEVGPRPVVLGFGRSHDPPNLVGHPAYGQCHNNQPWADTSRRE 100
.
211 RQRKEKHSMRTQ 222
||||||||||||
101 RQRKEKHSMRTQ 112






Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q96AC2 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83






Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83






Sequence name: /tmp/gp6eQTLWqk/mFtjUpUzhb:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P6 x BAC85518 ..

Alignment segment 1/1:

Quality: 835.00 Escore: 0
Matching length: 83 Total length: 83
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
. . .
51 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 83
|||||||||||||||||||||||||||||||||
74 QDMCQKEVMEQSAGIMYRKSCASSAACLIASAG 106






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q96AC2 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
51 QDMCQKEVMEQSAG 64






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85273 ..

Alignment segment 1/1:

Quality: 600.00 Escore: 0
Matching length: 59 Total length: 59
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSAG 64
|||||||||
72 KEVMEQSAG 80






Sequence name: /tmp/VXjdFlzdBX/bexTxTh0Th:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P7 x BAC85518 ..

Alignment segment 1/1:

Quality: 654.00 Escore: 0
Matching length: 64 Total length: 64
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSAG 64
||||||||||||||
74 QDMCQKEVMEQSAG 87






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q96AC2

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:Q8N2G4

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x Q8N2G4 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85273

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85273 ..

Alignment segment 1/1:

Quality: 591.00 Escore: 0
Matching length: 58 Total length: 58
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
6 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 55
||||||||||||||||||||||||||||||||||||||||||||||||||
22 IAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQ 71

56 KEVMEQSA 63
||||||||
72 KEVMEQSA 79






Sequence name: /tmp/OLMSexEmIh/pc7Z7Xm1YR:BAC85518

Sequence documentation:

Alignment of: R11723_PEA_1_P10 x BAC85518 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
24 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 73
.
51 QDMCQKEVMEQSA 63
|||||||||||||
74 QDMCQKEVMEQSA 86






Alignment of: R11723_PEA_1_P13 x Q96AC2 ..

Alignment segment 1/1:

Quality: 645.00 Escore: 0
Matching length: 63 Total length: 63
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNV 50
.
51 QDMCQKEVMEQSA 63
|||||||||||||
51 QDMCQKEVMEQSA 63


公知のタンパク質(PSEC、本明細書中で「野生型」またはWTタンパク質とも呼ばれる)のヌクレオチド転写物配列が少なくとも1つのSNPを特徴とし、これが、一定のサイレントSNPに加えて、コード領域に影響を与えるようであることに留意すべきである。このSNPは、R11723_PEA_1_T5スプライスバリアント配列(「G−>」)に影響を与えず、ヌクレオチドを失わせる(91位以降のアミノ酸に影響を与える)。失われたヌクレオチドによってフレームシフトが起こり、新規のタンパク質が産生される。このSNPは、以前に同定されておらず、このエクソン中の約70ESTのうちの5ESTによって支持される。
このクラスターの変異型は、仮説上のタンパク質PSEC0181の変異型(本明細書中で、「PSEC」と呼ばれる)であることに留意すべきである。さらに、肺癌検出のための単独またはこのクラスターおよび/または任意の他のクラスターおよび/または任意の公知のマーカーの1つまたは複数の変異型と組み合わせた公知のタンパク質(WTタンパク質)の使用は、本発明の実施形態を含む。
正常および癌性肺組織における配列名R11723seg13中に示すアンプリコンによって検出可能なR11723転写物の発現
R11723seg13、R11723seg13アンプリコン(配列番号1684)ならびにR11723seg13F(配列番号1682)およびR11723seg13R(配列番号1683)プライマーによって検出可能な転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、SDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、およびユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図48は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の過剰発現を示すヒストグラムである。総試験サンプル数のうちの少なくとも5倍の過剰発現を示すサンプルの数および比率を、下に示す。
図48から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも高かった。明白には、15個の腺癌サンプルのうちの10個および8個の小細胞癌サンプルのうちの4個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:R11723seg13F順方向プライマーおよびR11723seg13R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:R11723seg13。
R11723seg13F(配列番号1682)−ACACTAAAAGAACAAACACCTTGCTC
R11723seg13R(配列番号1683)−TCCTCAGAAGGCACATGAAAGA
R11723seg13–アンプリコン(配列番号1684):
ACACTAAAAGAACAAACACCTTGCTCTTCGAGATGAGACATTTTGCCAAGCAGTTGACCACTTAGTTCTCAAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA
異なる正常組織における配列名R11723seg13中に示すアンプリコンによって検出可能なR11723転写物の発現
R11723seg13アンプリコン(配列番号1684)ならびにR11723seg13F(配列番号1682)およびR11723seg13R(配列番号1683)によって検出可能なR11723転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(上記のサンプル番号18〜20、表2、「正常パネル中の組織サンプル」)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現の値を得た。
R11723seg13F(配列番号1682)−ACACTAAAAGAACAAACACCTTGCTC
R11723seg13R(配列番号1683)−TCCTCAGAAGGCACATGAAAGA
R11723seg13–アンプリコン(配列番号1684):
ACACTAAAAGAACAAACACCTTGCTCTTCGAGATGAGACATTTTGCCAAGCAGTTGACCACTTAGTTCTCAAGAAGCAACTATCTCTTTCATGTGCCTTCTGAGGA
結果を図49に示し、これは、異なる正常組織における配列名R11723seg13中に示されるアンプリコンによって検出可能なR11723転写物の発現を示す。
正常および癌性肺組織における配列名R11723junc11−18中に示すアンプリコンによって検出可能なR11723転写物の発現
junc11−18、R11723junc11−18アンプリコン(配列番号1687)ならびにR11723junc11−18F(配列番号1685)およびR11723junc11−18R(配列番号1686)プライマーによって検出可能な転写物の発現を、実時間PCRによって測定した(この連結点は、本明細書中でPSEC配列とも呼ばれる公知のタンパク質配列または「野生型」(WT)配列中に見出される)。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、SDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、およびユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「肺癌試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図50は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の過剰発現を示すヒストグラムである。値は、2連の実験の平均を示す。エラーバーは、得られた最小値および最大値を示す。
図50から明らかなように、癌サンプル中の上記アンプリコンによって検出可能な転写物の発現は、非癌性サンプル(サンプル番号47〜50、90〜93、96〜99、表2、「肺癌試験パネル中の組織サンプル」)よりも高かった。明白には、15個の腺癌サンプルのうちの11個、16個の扁平上皮細胞癌サンプルのうちの4個、4個の大細胞癌サンプルのうちの1個、8個の小細胞癌サンプルのうちの5個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:R11723junc11−18F順方向プライマーおよびR11723junc11−18R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:R11723junc11−18。
R11723junc11−18F(配列番号1685)–AGTGATGGAGCAAAGTGCCG
R11723junc11−18R(配列番号1686)−CAGCAGCTGATGCAAACTGAG
R11723junc11−18–アンプリコン(配列番号1687)
AGTGATGGAGCAAAGTGCCGGGATCATGTACCGCAAGTCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTCTGCCGGGTACCAGTCCTTCTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG
異なる正常組織における配列名R11723 junc11−18中に示すアンプリコンによって検出可能なR11723転写物の発現
R11723seg13アンプリコン(配列番号1687)ならびにR11723junc11−18F(配列番号1685)およびR11723junc11−18R(配列番号1686)によって検出可能なR11723転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、卵巣サンプル(上記のサンプル番号18〜20、表3)の量の中央値で割って、卵巣サンプルの中央値に対する各サンプルの相対発現の値を得た。
R11723junc11−18F(配列番号1685)–AGTGATGGAGCAAAGTGCCG
R11723junc11−18R(配列番号1686)−CAGCAGCTGATGCAAACTGAG
R11723junc11−18–アンプリコン(配列番号1687)

AGTGATGGAGCAAAGTGCCGGGATCATGTACCGCAAGTCCTGTGCATCATCAGCGGCCTGTCTCATCGCCTCTGCCGGGTACCAGTCCTTCTGCTCCCCAGGGAAACTGAACTCAGTTTGCATCAGCTGCTG
結果を図73に示し、これは、異なる正常組織における配列名R11723junc11−18中に示すアンプリコンによって検出可能なR11723転写物の発現を示す。
この変異型のクローニング
全長の検証
RNAの調製
ヒト成体乳頭腺癌卵巣RNAプール(ロット番号ILS1408)を、ABS(http://www.absbioreagents,Wilmington,DE19801,USA com)から得た。総RNAサンプルを、DNaseI(Ambionカタログ番号1906)を使用して処理した。
RT PCR
RTの調製
精製RNA(1μg)を、150ng Random Hexamerプライマー(Invitrogenカタログ番号48190−011)および500μM dNTP(Takara、カタログ番号B9501−1)と、全量が15.6μlのDEPC−HO(Beit Haemek、カタログ番号01−852−1A)中で混合した。混合物を、65℃で5分間インキュベートし、氷上で急速に冷却した。その後、5μlの5×Superscript II first strand緩衝液(Invitrogen、カタログ番号Y00146)、2.4μl 0.1M DTT(Invitrogen、カタログ番号Y00147)、および40単位のRNasin(Promega、カタログ番号N251A)を添加し、混合物を42℃で2分間インキュベートした。その後、1μl(200単位)のSuperscriptII(Invitrogen、カタログ番号18064−022)を添加し、反応物を42℃で50分間インキュベートし、その後、70℃で15分間インキュベートした。得られたcDNAを、TE緩衝液(10mM Tris(pH=8)、1mM EDTA(pH=8)で20倍に希釈した。
PCR増幅および分析
上記のように調製したcDNA(5μl)を、PCR反応のテンプレートとして使用した。以下のの条件下でAccuPower PCR PreMix (Bioneer,Korea、カタログ番号K2016)を使用して増幅を行った。1μlの以下ののプライマー(10μM):
PSECfor−TGCTGTCGCCTCCTCTGATG
PSECrev−CCTCAGAAGGCACATGAAAG
+13μl–HOを、AccuPower PCR PreMixチューブに添加し、以下の反応プログラムを使用した:94℃で5分間、(94℃で30秒間、52℃で30秒間、72℃で40秒間)を35サイクル、72℃で10分間。PCR増幅の完了後、産物を、臭化エチジウムで染色し、UV光で視覚化したアガロースゲルを分析した。PCR産物を、QiaQuick(商標)ゲル抽出キット(Qiagen(商標)、カタログ番号28706)を使用してゲルから抽出した。抽出したDNA産物(図79)を、上記の遺伝子特異的プライマー(Hy−Labs,Israel)を使用した直接的配列決定によって配列決定し、PSEC変異型R11723_PEA_1 T5の推定配列を得た(図80)。
図79に示すように、推定PSEC変異型R11723_PEA_1 T5が実際に成体乳頭腺腫卵巣ヒト組織中で天然に発現されたと結論づけた。
細菌発現ベクターでのPSEC変異型R11723_PEA_1 T5のクローニング
PSECスプライスバリアントR11723_PEA_1 T5コード配列を、以下の条件下でテンプレートとしての上記のフラグメントおよびPlatinum Pfx DNAポリメラーゼ(Invitrogenカタログ番号11708021)を使用したPCR増幅のために調製した:全反応量が50μlの5 μl–Amplification X10緩衝液(Invitrogenカタログ番号11708021);2μl–上記のPCR産物;1μl–dNTP(各10mM);1μl MgSO4(50mM)、5μlエンハンサー溶液(Invitrogenカタログ番号11708021);33μl–H2O;1μlの各プライマー(10μM)、および1.25単位のTaqポリメラーゼ(Platinum Pfx DNAポリメラーゼ(Invitrogenカタログ番号11708021))を、94℃で3分間、(94で30秒間、58℃で30秒間、68℃で40秒間)を29サイクル、68℃で7分間の反応プログラムに供する。下記のプライマーは、スプライスバリアントに対応するヌクレオチド配列の特異的配列およびNheIおよびHindIII制限部位を含む。
PSEC NheIfor− ATAGCTAGCATGTGGGTCCTAGGCATCGCGG
PSEC HindIIIrev− CCCAAGCTTCTAAGTGGTCAACTGCTTGGC
次いで、PCR産物を、NheIおよびHindIII(New England Biolabs(UK)LTD)で二重に消化し(図81)、N末端6Hisタグに対してインフレームで上記酵素で事前に消化したpRSET−A(Invitrogen、カタログ番号V351−20)に挿入して、HisPSEC T5 pRSETを得た(図82)。コード配列は、N末端に6His(6His残基はタンパク質の片端に連続している)タグを有し、pRSETベクターによってコードされる8つのさらなるアミノ酸を有するタンパク質をコードする。
最終プラスミド中のPSECインサートおよびその隣接領域の配列を、配列決定によって検証し、所望の配列と同一であることが見出された。配列決定された領域を含むHis PSEC T5 pRESTAの完全な配列を、図84に示す。
図83は、PSEC変異型R11723_PEA_1 T5の翻訳配列を示す。
細菌培養およびタンパク質発現の誘導
HisPSEC pRSETA DNAを、完全なDH5a細胞(Invitrogenカタログ番号18258−012)に形質転換した。アンピシリン耐性形質転換体をスクリーニングし、陽性クローンを、制限酵素消化および配列の検証によってさらに分析した。
組換えタンパク質を発現するために、HisPSEC pRSETA DNAを、コンピテントBL21Gold細胞(Stratageneカタログ番号230134)およびBL21star(Invitrogenカタログ番号 44−0054)にさらに形質転換した。アンピシリン耐性形質転換体をスクリーニングし、陽性クローンを選択した。
HisPSEC T5 pRSETベクターおよび空のpRSETベクター(負のコントロールとして)を含む細菌細胞を、アンピシリン(50μg/ml)およびクロラムフェニコール(34μg/ml)を補足したLB培地中で、O.D.600nmが0.55に達するまで成長させた。約3時間でこの値に達した。1mM IPTG(Roche、カタログ番号724815)を添加し、細胞を、37℃で一晩成長させた。ゲル分析のために、0時間、インキュベーション3時間後、および一晩インキュベーション後に1mlアリコートの各培養物を取り出した(それぞれ、T0、T3、およびTO/N)。
発現の結果
BL21Gold中のPSECの少量発現の経時変化を、図85に示す。適切な分子量(9.2kDa)の組換えタンパク質の発現を、抗His抗体(BD Clontech,Ref 631212、図85)を使用するが、クーマシー染色によらないウェスタンブロットによって視覚化した(データ示さず)。同様にBL21starを使用して類似の発現パターンが得られた(データ示さず)。
これらの結果は、PSEC変異型R11723_PEA_1 T5によってコードされるタンパク質が細菌細胞中で実際に発現されることを示す。
クラスターR16276の説明
クラスターR16276は、目的の1つの転写物および5個のセグメントを特徴とし、その名称を、それぞれ表1305および1306に示し、配列自体を、出願書類の最後に示す。選択されたタンパク質変異型を、表1307に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
これらの配列は、本明細書中で以前に公知のタンパク質と呼ばれる公知のタンパク質であるNOVタンパク質ホモログ前駆体(SwissProtアクセッション識別子NOV_HUMAN、同義語NovH、腎芽腫過剰発現遺伝子タンパク質ホモログとしても公知である)(配列番号1463)の変異型である。
タンパク質NOVタンパク質ホモログ前駆体は、以下の機能を有することが公知であるか、そのように見なされている:細胞成長の制御で役割を果たす可能性が高い即時型タンパク質(類似性による)。タンパク質NOVタンパク質ホモログ前駆体の配列を、「NOVタンパク質ホモログ前駆体アミノ酸配列」として出願書類の最後に示す。この配列の公知の多型を、表1308に示す。
Figure 2008507261
タンパク質NOVタンパク質ホモログ前駆体の局在化は、分泌と考えられる。
以下のGO注釈付けを、以前に公知のタンパク質に適用する。以下の注釈付けが見出された:生物学的過程に関連する注釈付けである細胞成長の制御、分子機能に関連する注釈付けであるインスリン様成長因子結合、成長因子、および細胞成分に関連する注釈付けである細胞外。
GO割り当ては、1つまたは複数のhttp://www.expasy.ch/sprot/から利用可能なSwissProt/TremBl Protein knowledgebaseまたはhttp://www.ncbi.nlm.nih.gov/projects/LocusLink/から利用可能なLocuslinkに依存する。
クラスターR16276を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および図51のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図51および表1309中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):悪性肺腫瘍。
Figure 2008507261
Figure 2008507261
上記のように、クラスターR16276は、上の表1に列挙した1つの転写物を特徴とする。これらの転写物は、タンパク質NOVタンパク質ホモログ前駆体の変異型であるタンパク質をコードする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質R16276_PEA_1_P7は、出願書類の最後に示すアミノ酸配列を有し、転写物R16276_PEA_1_T6によってコードされる。公知のタンパク質(NOVタンパク質ホモログ前駆体)に対するアラインメントを、出願書類の最後に示す。1つまたは複数の以前に公開したタンパク質配列に対する1つまたは複数のアラインメントを、出願書類の最後に示す。本発明の変異タンパク質とこのようなアラインメントした各タンパク質との関係の簡単な説明は以下である。
R16276_PEA_1_P7とNOV_HUMANとの間の比較の報告
1.NOV_HUMANのアミノ酸1〜41に対応し、R16276_PEA_1_P7のアミノ酸1〜41にも対応するMQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGと少なくとも90%相同な第1のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸42に対応する架橋アミノ酸Qと、NOV_HUMANのアミノ酸43〜103に対応し、R16276_PEA_1_P7のアミノ酸43〜103にも対応するCPATPPTCAPGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTGICTと少なくとも90%相同な第2のアミノ酸配列と、R16276_PEA_1_P7のアミノ酸104〜111に対応する配列GNPAPSAVを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第3のアミノ酸配列とを含み、前記第1のアミノ酸配列、架橋アミノ酸、第2のアミノ酸配列、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、R16276_PEA_1_P7をコードする単離キメラポリペプチド。
2.R16276_PEA_1_P7中の配列GNPAPSAVと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、R16276_PEA_1_P7のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質R16276_PEA_1_P7はまた、表1312に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R16276_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
公知のタンパク質NOVタンパク質ホモログ前駆体と比較した変異タンパク質R16276_PEA_1_P7のグリコシル化部位を表1314に示す(第1のカラム中にアミノ酸配列上のその位置を示し、第2のカラムは、グリコシル化部位が変異タンパク質中に存在するかどうかを示し、最後のカラムは、この位置が変異タンパク質上で異なるかどうかを示す)。
Figure 2008507261
変異タンパク質、R16276_PEA_1_P7は、以下の転写物によってコードされる:R16276_PEA_1_T6(配列は出願書類の最後に示す)。転写物R16276_PEA_1_T6のコード部分を太字で示し、このコード部分は445位から開始され、777位で終結する。転写物はまた、表1315に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質R16276_PEA_1_P7配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターR16276は、上の表2に列挙した5個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターR16276_PEA_1_node_0は、35個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1316は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR16276_PEA_1_node_6は、2個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1317は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターR16276_PEA_1_node_1は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1318は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR16276_PEA_1_node_4は、38個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1319は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターR16276_PEA_1_node_5は、37個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:R16276_PEA_1_T6。以下の表1320は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: NOV_HUMAN

Sequence documentation:

Alignment of: R16276_PEA_1_P7 x NOV_HUMAN ..

Alignment segment 1/1:

Quality: 1042.00 Escore: 0
Matching length: 103 Total length: 103
Matching Percent Similarity: 100.00 Matching Percent Identity: 99.03
Total Percent Similarity: 100.00 Total Percent Identity: 99.03
Gaps: 0

Alignment:
. . . . .
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGQCPATPPTC 50
|||||||||||||||||||||||||||||||||||||||||:||||||||
1 MQSVQSTSFCLRKQCLCLTFLLLHLLGQVAATQRCPPQCPGRCPATPPTC 50
. . . . .
51 APGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTG 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 APGVRAVLDGCSCCLVCARQRGESCSDLEPCDESSGLYCDRSADPSNQTG 100

101 ICT 103
|||
101 ICT 103

正常および癌性肺組織における6つの配列H61775seg8、HUMGRP5E junc3−7、M85491Seg24、Z21368junc17−21、HSSTROL3seg24、およびZ25299seg20の組み合わせ発現
H61775seg8(配列番号1636)、HUMGRP5Ejunc3−7(配列番号1648)、M85491Seg24(配列番号1639)、Z21368junc17−21(配列番号1642)、HSSTROL3seg24(配列番号1675)、およびZ25299seg20アンプリコン(配列番号1669)ならびにH61775seg8F2(配列番号1634)、H61775seg8R2(配列番号1635)、HUMGRP5Ejunc3−7F(配列番号1646)、HUMGRP5Ejunc3−7R(配列番号1647)、M85491Seg24F(配列番号1637)、M85491Seg24R(配列番号1638)、Z21368junc17−21F(配列番号1640)、Z21368junc17−21R(配列番号1641)、HSSTROL3seg24F(配列番号1673)、HSSTROL3seg24R(配列番号1674)、Z25299seg20F(配列番号1667)、Z25299seg20R(配列番号1668)プライマーによって検出可能な免疫グロブリンスーパーファミリーメンバー9、ガストリン放出ペプチド、EphrinB型受容体2前駆体、SUL1_HUMAN、ストロメリシン−3前駆体(EC3.4.24.−)(マトリクス金属プロテイナーゼ−11)(MMP−11)(ST3)(SL−3)、および分泌性白血球プロテイナーゼインヒビターである酸安定性プロテイナーゼインヒビター転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)、の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各アンプリコンの各RTサンプルの正規化した量を、同一アンプリコンについて検出された正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。Z25299seg20(配列番号1669)についてのこの比の逆数を計算して、正常なPMサンプルの中央値に対する各サンプルの下方制御の倍率を得た。
図52〜53は、正常サンプルと比較した癌性肺サンプルにおける上記転写物の差分発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも1つの配列の少なくとも5倍の差分発現を示すサンプルの数および比率を、下に示す。
図52〜53から明らかなように、15個の腺癌サンプルのうちの15個、16個の扁平上皮細胞癌サンプルのうちの14個、4個の大細胞癌サンプルのうちの4個、8個の小細胞癌サンプルのうちの8個の少なくとも1つの配列で少なくとも5倍の差分発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。少なくとも1つのアンプリコンの5倍差分制御の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、腺癌で7.82E−06、扁平上皮細胞癌で2.63E−04、大細胞癌で8.24E−03、小細胞癌で3.57E−04であった。
上記値は、結果が統計的に有意であることを示す。
クラスターH53626の説明
クラスターH53626は、目的の2つの転写物および20個のセグメントを特徴とし、その名称を、それぞれ表1321および1322に示し、配列自体を、出願書類の最後に示す。
Figure 2008507261
Figure 2008507261
Figure 2008507261
クラスターH53626を、癌中のこのクラスターの転写物の過剰発現による診断マーカーとして使用することができる。正常組織でのこのような転写物の発現も、以前に記載の方法によって示す。表の右側のカラム中の用語「数」および以下の図76のy軸上の数は、「ppm」として各カテゴリーにおけるESTの重みを付けた発現をいう(ppmによるこのカテゴリーにおける特定のクラスターのESTの発現と全ESTの発現との比)。
概して、図76および表1324中のヒストグラムに関して示すように、以下の結果を得た。このクラスターは、以下の病的状態で過剰発現した(少なくとも最小レベルで):上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および筋肉腫。
Figure 2008507261
Figure 2008507261
上記のように、コンティグH53626は、上の表1321に列挙した2つの転写物を特徴とする。本発明の各変異タンパク質の説明をここに記載する。
本発明の変異タンパク質H53626_PEA_1_P4は、出願書類の最後に示すアミノ酸配列を有し、転写物H53626_PEA_1_T15によってコードされる。野生型タンパク質に対するアラインメントを、出願書類の最後に示す。本発明の変異タンパク質と野生型タンパク質との関係の簡単な説明は以下である。
H53626_PEA_1_P4と野生型Q8N441(配列番号1699)との間の比較の報告
1.Q8N441のアミノ酸1〜357に対応し、H53626_PEA_1_P4のアミノ酸1〜357にも対応するMTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGGQKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRSAFLTVLPと少なくとも90%相同な第1のアミノ酸配列と、H53626_PEA_1_P4のアミノ酸358〜437に対応する配列GARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAEGGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALAを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列と、Q8N441のアミノ酸358〜504に対応し、H53626_PEA_1_P4のアミノ酸438〜584も対応するDPKPPGPPVASSSSATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPPGTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKLYPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQCと少なくとも90%相同な第3のアミノ酸配列とを含み、前記第1、第2、および第3のアミノ酸配列が、隣接し、且つ連続した順序にある、H53626_PEA_1_P4をコードする単離キメラポリペプチド。
2.H53626_PEA_1_P4に対応するGARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAEGGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALAをコードする配列と少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なアミノ酸配列を含む、H53626_PEA_1_P4の縁部分をコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:膜。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有することが同意されるが、両膜貫通領域推定プログラムによってこのタンパク質がこのシグナルペプチドの下流に膜貫通領域を有すると推定されるので、膜と考えられる。
変異タンパク質H53626_PEA_1_P4はまた、表1326に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、H53626_PEA_1_P4は、以下の転写物によってコードされる:H53626_PEA_1_T15(配列は出願書類の最後に示す)。転写物H53626_PEA_1_T15のコード部分を太字で示し、このコード部分は17位から開始され、1771位で終結する。転写物はまた、表1327に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P4配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
本発明の変異タンパク質H53626_PEA_1_P5は、出願書類の最後に示すアミノ酸配列を有し、転写物H53626_PEA_1_T16によってコードされる。野生型タンパク質に対するアラインメントを、出願書類の最後に示す。本発明の変異タンパク質と野生型タンパク質との関係の簡単な説明は以下である。
H53626_PEA_1_P5と野生型Q9H4D7(配列番号1700)との間の比較の報告
1.Q9H4D7のアミノ酸1〜269に対応し、H53626_PEA_1_P5のアミノ酸1〜269にも対応するMTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKと少なくとも90%相同な第1のアミノ酸配列と、H53626_PEA_1_P5のアミノ酸270〜490に対応する配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、H53626_PEA_1_P5をコードする単離キメラポリペプチド。
2.H53626_PEA_1_P5中の配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H53626_PEA_1_P5のテールをコードする単離ポリペプチド。
H53626_PEA_1_P5と野生型Q8N441との間の比較の報告
1.Q8N441のアミノ酸1〜269に対応し、H53626_PEA_1_P5のアミノ酸1〜269にも対応するMTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQCPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCKATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFTQPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPRKKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTGTHPVNTTVDFGGTTSFQCKと少なくとも90%相同な第1のアミノ酸配列と、H53626_PEA_1_P5のアミノ酸270〜490に対応する配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPを有するポリペプチドと少なくとも70%、任意選択的に少なくとも80%、好ましくは少なくとも85%、より好ましくは少なくとも90%、最も好ましくは少なくとも95%相同な第2のアミノ酸配列とを含み、前記第1および第2のアミノ酸配列が、隣接し、且つ連続した順序にある、H53626_PEA_1_P5をコードする単離キメラポリペプチド。
2.H53626_PEA_1_P5中の配列TQNRQGHLWPPRPRPLACRGPWSSASQPALSSSWAPCSCGFARPRRSRAPPRLPLPCLGTARRGRPATAAETRTFPRWPPSALALVWGCVRSMGLRQPPSTYWAQAQLLALSCTPNSTQTSTHTHTHTLTHTHTWRARSTSTSTISARRHRICSGHGGAGQTGRLGGWRTELQTKAGDPWRGGMASTPGSLCVRHSPWTHTHRHTHYLDACMHTHARTRAPと少なくとも70%、任意選択的に少なくとも約80%、好ましくは少なくとも約85%、より好ましくは少なくとも約90%、最も好ましくは少なくとも約95%相同なポリペプチドを含む、H53626_PEA_1_P5のテールをコードする単離ポリペプチド。
変異タンパク質の位置を、多数の異なるソフトウェアプログラムおよび分析(SignalPおよび他の専門プログラムによる分析が含まれる)由来の結果にしたがって決定した。変異タンパク質は、細胞に関して以下のように位置づけられると考えられる:分泌。タンパク質局在化は、両シグナルペプチド推定プログラムによってこのタンパク質がシグナルペプチドを有すると推定され、どちらの膜貫通領域推定プログラムによってもこのタンパク質が膜貫通領域を有さないと推定されるので、分泌されると考えられる。
変異タンパク質H53626_PEA_1_P5はまた、表1328に示すように、以下の非サイレントSNP(1塩基多型)を有する(アミノ酸配列上のその位置を示し、別のアミノ酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
変異タンパク質、H53626_PEA_1_P5は、以下の転写物によってコードされる:H53626_PEA_1_T16(配列は出願書類の最後に示す)。転写物H53626_PEA_1_T16のコード部分を太字で示し、このコード部分は17位から開始され、1489位で終結する。転写物はまた、表1329に列挙した以下のSNPを有する(ヌクレオチド配列上のその位置を示し、別の核酸を列挙し、最後のカラムは、SNPが公知であるかどうかを示し、変異タンパク質H53626_PEA_1_P5配列中の公知のSNPの存在は、本発明のこの変異タンパク質の推定配列を支持する)。
Figure 2008507261
上記のように、クラスターH53626は、上の表2に列挙した20個のセグメントを特徴とし、その配列を出願書類の最後に示す。これらのセグメントは、核酸配列の一部であり、これらは特に興味深いので本明細書中に個別に記載する。本発明の各セグメントの説明をここに記載する。
本発明のセグメントクラスターH53626_PEA_1_node_15は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1330は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_22は、42個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1332は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_25は、41個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15。以下の表1334は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_26は、5個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15。以下の表1336は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_27は、106個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1338は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_34は、121個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1340は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_35は、85個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1342は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(表1343に示す)。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_36は、69個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1344は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
以下のように、このセグメントのマイクロアレイ(チップ)データも利用可能である。上記のように、クラスター自体に関して、種々のオリゴヌクレオチドを、種々の病態(特に、癌)での差分発現について試験した。以下のオリゴヌクレオチドは、このセグメントに達することが見出された(表13455に示す)。
Figure 2008507261
本発明の任意選択的な実施形態によれば、上記のクラスターに関連する短いセグメントも提供する。これらのセグメントは、約120bp長までであり、それにより、個別の説明に含まれる。
本発明のセグメントクラスターH53626_PEA_1_node_11は、12個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1346は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_12は、11個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1347は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_16を、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1348は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_19は、25個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1349は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_20は、27個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1350は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_24は、34個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1351は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_28は、66個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1352は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_29は、73個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1353は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_30は、71個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1354は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_31は、67個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1355は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_32は、65個のライブラリーによって支持される。ライブラリー数を、前述のように決定した。このセグメントを、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1356は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261
本発明のセグメントクラスターH53626_PEA_1_node_33を、以下の転写物中に見出すことができる:H53626_PEA_1_T15およびH53626_PEA_1_T16。以下の表1357は、各転写物上のこのセグメントの開始位置および終結位置を記載する。
Figure 2008507261

以前に公知のタンパク質に対する変異タンパク質アラインメント:
Sequence name: /tmp/K1Mec2ReKO/eg1EUS2AXY:Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P4 x Q8N441 ..

Alignment segment 1/1:

Quality: 4882.00 Escore: 0
Matching length: 504 Total length: 584
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 86.30 Total Percent Identity: 86.30
Gaps: 1

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
. . . . .
251 THPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGG 300
||||||||||||||||||||||||||||||||||||||||||||||||||
251 THPVNTTVDFGGTTSFQCKVRSDVKPVIQWLKRVEYGAEGRHNSTIDVGG 300
. . . . .
301 QKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRS 350
||||||||||||||||||||||||||||||||||||||||||||||||||
301 QKFVVLPTGDVWSRPDGSYLNKLLITRARQDDAGMYICLGANTMGYSFRS 350
. . . . .
351 AFLTVLPGARLPRHATPCWCPDPPPGPGVPPTGWGPTLPSRAVLARSSAE 400
|||||||
351 AFLTVLP........................................... 357
. . . . .
401 GGQPRGTVSTAPGMGLGCSPGLCVGVPLPTSFPLALADPKPPGPPVASSS 450
|||||||||||||
358 .....................................DPKPPGPPVASSS 370
. . . . .
451 SATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPP 500
||||||||||||||||||||||||||||||||||||||||||||||||||
371 SATSLPWPVVIGIPAGAVFILGTLLLWLCQAQKKPCTPAPAPPLPGHRPP 420
. . . . .
501 GTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKL 550
||||||||||||||||||||||||||||||||||||||||||||||||||
421 GTARDRSGDKDLPSLAALSAGPGVGLCEEHGSPAAPQHLLGPGPVAGPKL 470
. . .
551 YPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQC 584
||||||||||||||||||||||||||||||||||
471 YPKLYTDIHTHTHTHSHTHSHVEGKVHQHIHYQC 504






Sequence name: /tmp/oSUZaRW3WK/oSh3fN5Zt0:Q9H4D7

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q9H4D7 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGTTSFQCK 269
|||||||||||||||||||
251 THPVNTTVDFGGTTSFQCK 269






Sequence name: /tmp/oSUZaRW3WK/oSh3fN5Zt0:Q8N441

Sequence documentation:

Alignment of: H53626_PEA_1_P5 x Q8N441 ..

Alignment segment 1/1:

Quality: 2644.00 Escore: 0
Matching length: 269 Total length: 269
Matching Percent Similarity: 100.00 Matching Percent Identity: 100.00
Total Percent Similarity: 100.00 Total Percent Identity: 100.00
Gaps: 0

Alignment:
. . . . .
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
||||||||||||||||||||||||||||||||||||||||||||||||||
1 MTPSPLLLLLLPPLLLGAFPPAAAARGPPKMADKVVPRQVARLGRTVRLQ 50
. . . . .
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
||||||||||||||||||||||||||||||||||||||||||||||||||
51 CPVEGDPPPLTMWTKDGRTIHSGWSRFRVLPQGLKVKQVEREDAGVYVCK 100
. . . . .
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
||||||||||||||||||||||||||||||||||||||||||||||||||
101 ATNGFGSLSVNYTLVVLDDISPGKESLGPDSSSGGQEDPASQQWARPRFT 150
. . . . .
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
||||||||||||||||||||||||||||||||||||||||||||||||||
151 QPSKMRRRVIARPVGSSVRLKCVASGHPRPDITWMKDDQALTRPEAAEPR 200
. . . . .
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
||||||||||||||||||||||||||||||||||||||||||||||||||
201 KKKWTLSLKNLRPEDSGKYTCRVSNRAGAINATYKVDVIQRTRSKPVLTG 250
.
251 THPVNTTVDFGGTTSFQCK 269
|||||||||||||||||||
251 THPVNTTVDFGGTTSFQCK 269


正常および癌性肺組織における配列名H53626junc24−27F1R3中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
junc24−27、H53626junc24−27F1R3アンプリコン(配列番号1690)ならびにH53626junc24−27F1(配列番号1688)およびH53626junc24−27R3(配列番号1689)プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図74は、正常サンプルと比較した癌性肺サンプルにおける上記ホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の過剰発現を示すヒストグラムである。
図74から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも高かった。明白には、15個の腺癌サンプルのうちの7個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:H53626junc24−27F1順方向プライマーおよびH53626junc24−27R3逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:H5326junc24−27F1R3。

順方向プライマー(配列番号1688):GTCCTTCCAGTGCAAGACCCA
逆方向プライマー(配列番号1689):TGGGCCTGGCAAAGCC
アンプリコン(配列番号1690):GTCCTTCCAGTGCAAGACCCAAAACCGCCAGGGCCACCTGTGGCCTCCTCGTCCTCGGCCACTAGCCTGCCGTGGCCCGTGGTCATCGGCATCCCAGCCGGCGCTGTCTTCATCCTGGGCACCCTGCTCCTGTGGCTTTGCCAGGCCCA
正常および癌性肺組織における配列名H53626seg25中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
seg25、H53626seg25アンプリコン(配列番号1693)、ならびにH53626seg25F(配列番号1691)およびH53626seg25R(配列番号1692)プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–PBGD−アンプリコン、配列番号334)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–HPRT1−アンプリコン、配列番号1297)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図75から明らかなように、いくつかの癌サンプル中の上記アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2)よりも高かった。明白には、15個の腺癌サンプルのうちの3個で少なくとも5倍の過剰発現が見出された。
プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:H53626seg25F順方向プライマーおよびH53626seg25R逆方向プライマー。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:H53626seg25。

順方向プライマー(配列番号1691);CCGACGGCTCCTACCTCAA
逆方向プライマー(配列番号1692):GGAAGCTGTAGCCCATGGTGT
逆方向プライマー(配列番号1693):CCGACGGCTCCTACCTCAATAAGCTGCTCATCACCCGTGCCCGCCAGGACGATGCGGGCATGTACATCTGCCTTGGCGCCAACACCATGGGCTACAGCTTCC
異なる正常組織における配列名H53626seg25中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
H53626seg25アンプリコン(配列番号1693)ならびにH53626seg25F(配列番号1691)およびH53626seg25R(配列番号1692)プライマーによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表3)の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。

順方向プライマー(配列番号1691);CCGACGGCTCCTACCTCAA
逆方向プライマー(配列番号1692):GGAAGCTGTAGCCCATGGTGT
逆方向プライマー(配列番号1693):CCGACGGCTCCTACCTCAATAAGCTGCTCATCACCCGTGCCCGCCAGGACGATGCGGGCATGTACATCTGCCTTGGCGCCAACACCATGGGCTACAGCTTCC
結果を図77に示し、これは、異なる正常組織における配列名H53626seg25中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示す。
異なる正常組織における配列名H53626junc24−27F1R3中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現
H53626junc24−27F1R3アンプリコン(配列番号1690)ならびにH53626junc24−27F1(配列番号1688)およびH53626junc24−27R3(配列番号1689)によって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)転写物の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−RPL19(GenBankアクセッション番号NM_000981、RPL19アンプリコン、配列番号1630)、TATAボックス(GenBankアクセッション番号NM_003194、TATAアンプリコン、配列番号1633、プライマー配列番号1631および1632)、UBC(GenBankアクセッション番号BC000449、アンプリコン–ユビキチン−アンプリコン、配列番号328)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–SDHA−アンプリコン配列番号331)の発現を同様に測定した。各RTサンプルのために、上記アンプリコンの発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、肺サンプル(上記のサンプル番号15〜17、表3)の量の中央値で割って、肺サンプルの中央値に対する各サンプルの相対発現の値を得た。

順方向プライマー(配列番号1688):GTCCTTCCAGTGCAAGACCCA
逆方向プライマー(配列番号1689):TGGGCCTGGCAAAGCC
逆方向プライマー(配列番号1690):GTCCTTCCAGTGCAAGACCCAAAACCGCCAGGGCCACCTGTGGCCTCCTCGTCCTCGGCCACTAGCCTGCCGTGGCCCGTGGTCATCGGCATCCCAGCCGGCGCTGTCTTCATCCTGGGCACCCTGCTCCTGTGGCTTTGCCAGGCCCA
結果を図78に示し、これは、異なる正常組織における配列名H53626juncc24−27F1R3中に示すアンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示す。
正常および癌性肺組織における配列番号1480中に示すアンプリコンによって検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物の発現
配列番号1480によって検出可能なトロフィニン関連タンパク質(タスチン)転写物(例えば、配列番号1485〜1488、1609、1610によって示される変異型番号23〜26、31、32)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1480の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図54aは、正常サンプルに対する癌性肺組織における上記トロフィニン関連タンパク質(タスチン)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも5倍の過剰発現を示すサンプルの数および比率を、下に示す。
図54aから明らかなように、癌サンプル中の配列番号1480によって検出可能なトロフィニン関連タンパク質(タスチン)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの6個、16個の扁平上皮細胞癌サンプルのうちの8個、4個の大細胞癌サンプルのうちの2個、8個の小細胞癌サンプルのうちの8個で少なくとも5倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1480によって検出可能なトロフィニン関連タンパク質(タスチン)転写物の発現レベルの相違についてのP値は、T検定によって、1.61E−04と決定された。
5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.49E−02であった。上記値は、結果が統計的に有意であることを示す。
本発明によれば、トロフィニン関連タンパク質(タスチン)は、肺癌診断用マーカーの非限定的な例である。本発明のトロフィニン関連タンパク質(タスチン)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、トロフィニン関連タンパク質(タスチン)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した:トロフィニン関連タンパク質(タスチン)−TAA−seg44−順方向プライマー(配列番号1478):AGACTCCAACCCACAGCCCトロフィニン関連タンパク質(タスチン)−TAA−seg44−逆方向プライマー(配列番号1479):CAGCTCAGCCAACCTTGCA。
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:トロフィニン関連タンパク質(タスチン)アンプリコン、配列番号1480:AGACTCCAACCCACAGCCCAGCTGTGGCTGCACAGTGAGCCTGATGGGAGGTGGGGAACAGGGACAGGGGGCCACCTGGGCTTCTTCACAGAGAGGTCAGCAGGAAGGCTTGGCTACAGTGCAAGGTTGGCTGAGCTG。
本発明の他の好ましい実施形態によれば、トロフィニン関連タンパク質(タスチン)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1485〜1488、1609、1610(例えば、変異型番号23〜26、31、32)に示すトロフィニン関連タンパク質(タスチン)スプライスバリアントまたはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、トロフィニン関連タンパク質(タスチン)のフラグメントは、セグメント_TAA−44−配列番号1507を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、トロフィニン関連タンパク質(タスチン)_セグメント_TAA−44−配列番号1507などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のトロフィニン関連タンパク質(タスチン)に対応する核酸配列によってコードされる任意のアミノ酸配列またはそのフラグメント(配列番号1492〜1501、1612が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1508〜1511、1613に記載のこれらのタンパク質の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に(さらにまたは二者択一的に)、バイオマーカーとして使用することができる。本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質(タスチン)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1512〜1514中に示すオリゴヌクレオチドによって検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物の発現
オリゴヌクレオチド配列番号1512〜1514によって検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物(例えば、配列番号1481〜1485、1488〜1491、1609、1611によって示される変異型番号8〜10、22、23、26、27、29〜31、33)の発現を、オリゴヌクレオチドベースのマイクロアレイによって測定した。配列番号1512〜1514に記載の上記オリゴヌクレオチドによって検出されたセグメントは、例えば、配列番号1503、1504、1506に記載のヌクレオチド配列である。
各フィーチャーの画像強度の結果を、チップ上の全フィーチャーの画像強度の90パーセンタイルにしたがって正規化した。次いで、チップ上の同一ヌクレオチドの複製物および同一サンプルの複製物のフィーチャー画像強度を平均化した。範囲外の結果を破棄した。
各オリゴヌクレオチド(配列番号1512〜1514)のために、各サンプルについて決定したの平均化強度を、全正常サンプル(上記のサンプル番号48、50、90〜92、96〜99、表2、「試験パネル中の組織サンプル」)の平均化した強度で割って、平均化した正常サンプルに対する各サンプルの上方制御の倍率を得た。これらのデータを、図54bのヒストグラムに示す。図54bから明らかなように、癌サンプル中の配列番号1512〜1514のオリゴヌクレオチドを使用して検出可能なトロフィニン関連タンパク質(タスチン)(T86235)転写物の発現は、正常サンプルよりも有意に高かった。
本発明によれば、トロフィニン関連タンパク質(タスチン)は、肺癌診断用マーカーの非限定的な例である。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、トロフィニン関連タンパク質(タスチン)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。オリゴヌクレオチドも、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なオリゴヌクレオチドの制限されない例示のみとして以下のオリゴヌクレオチドを使用した:配列番号1512〜1514。

配列番号1512:CATGGTAACACGGCCTCCATGGCTGAGTAGGGGACTAGGAAGGGTAAAAG
配列番号1513:TGTACATCTAGGGCCTCTCAGTTAGGGGCTTCAATCCATTCCTCATGAGG
配列番号1514:TGTGAACACAAGAGGTCCTCACCTCACTGTGAGCTGCACACCTGCCCTGC
本発明の他の好ましい実施形態によれば、トロフィニン関連タンパク質(タスチン)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1481〜1485、1488〜1491、1609、1611(例えば、変異型番号8〜10、22、23、26、27、29〜31、33)に示すトロフィニン関連タンパク質(タスチン)スプライスバリアントまたはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、トロフィニン関連タンパク質(タスチン)のフラグメントは、セグメント_TAA−14、35、および42−配列番号1503、1504、1506を含む。同様に、任意選択的およびより好ましくは、任意の好ましい方法を、例えば、トロフィニン関連タンパク質(タスチン)_セグメント_TAA−14、35、および42−配列番号1503、1504、1506などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
本発明の他の好ましい実施形態によれば、配列番号1502および1505に記載の固有のセグメントを含むトロフィニン関連タンパク質(タスチン)スプライスバリアント(例えば、変異型9および29に含まれるもの(それぞれ、配列番号1482および1490))は、肺癌検出用バイオマーカーとして有用である。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質(タスチン)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1517中に示すアンプリコンによって検出可能なホメオボックスC10(HOXC10)(N31842)転写物の発現
配列番号1517によって検出可能なホメオボックスC10(HOXC10)転写物(例えば、配列番号1519によって示される変異型番号3)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号3)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号9)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1517の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図55は、正常サンプルに対する癌性肺組織における上記ホメオボックスC10(HOXC10)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも20倍の過剰発現を示すサンプルの数および比率を、下に示す。
図55から明らかなように、癌サンプル中の配列番号1517によって検出可能なホメオボックスC10(HOXC10)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの6個、16個の扁平上皮細胞癌サンプルのうちの9個、および4個の大細胞癌サンプルのうちの3個で少なくとも20倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1517によって検出可能なホメオボックスC10(HOXC10)転写物の発現レベルの相違についてのP値は、T検定によって、4.43E−03と決定された。
20倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、2.88E−02であった。上記値は、結果が統計的に有意であることを示す。
本発明によれば、ホメオボックスC10(HOXC10)は、肺癌診断用マーカーの非限定的な例である。本発明のホメオボックスC10(HOXC10)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、ホメオボックスC10(HOXC10)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

ホメオボックスC10(HOXC10)−順方向プライマー(配列番号1515):GCGAAACGCGATTTGTTGTTおよびホメオボックスC10(HOXC10)−逆方向プライマー(配列番号1516):CATCTGGAGGAGGGAGGGA
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:ホメオボックスC10(HOXC10)アンプリコン(配列番号1517)。

GCGAAACGCGATTTGTTGTTTGTGGGTCTGATTTGTGCGTGCGGCTTGGGCTCCTGCGGCTTTTGGCTCGGCCGGGGGCCTTGGGCAGCGAGGCTGGAGCCGGAAGAGGTGGAGGTGAAGGGCTGCCCGCCACGTCCCTCCCTCCTCCAGATG
本発明の他の好ましい実施形態によれば、ホメオボックスC10(HOXC10)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号54に記載のホメオボックスC10(HOXC10)スプライスバリアント(例えば、変異型番号3)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、ホメオボックスC10(HOXC10)のフラグメントは、セグメント_TAA−seg6(配列番号1526)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、ホメオボックスC10(HOXC10)_セグメント_TAA−seg6(配列番号1526)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
本発明の他の好ましい実施形態によれば、配列番号1524および1525に記載の固有のセグメントを含むホメオボックスC10(HOXC10)スプライスバリアント(例えば、配列番号1515、1519、および1520に記載の転写物)は、肺癌検出用バイオマーカーを含む。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のトロフィニン関連タンパク質(タスチン)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1521および1522が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1523に記載のタンパク質(配列番号1522)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のトロフィニン関連タンパク質(タスチン)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1529中に示すアンプリコンによって検出可能な核タンパク質4(NOL4)−(T06014)転写物の発現
配列番号1529によって検出可能な核タンパク質4(NOL4)転写物(例えば、配列番号1533、1537、1538によって示される変異型番号3、11、および12)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1529の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図56aおよびbは、正常サンプルに対する癌性肺組織における上記核タンパク質4(NOL4)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも200倍または6倍の過剰発現を示すサンプルの数および比率を、以下の図56aおよび56bにそれぞれ示す。
図56aから明らかなように、肺小細胞癌由来のサンプル中の配列番号1529によって検出可能な核タンパク質4(NOL4)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、8個の小細胞癌サンプルのうちの8個で少なくとも200倍の過剰発現が認められた。図56bから明らかなように、15個の腺癌サンプルのうちの2個、16個の扁平上皮細胞癌サンプルのうちの3個で少なくとも6倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1529によって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、1.36E−02と決定された。
6倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、2.52E−02であった。
小細胞肺癌サンプル対正常肺サンプルにおける配列番号1529よって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、3.86E−03と決定された。
200倍過剰発現の閾値は、小細胞癌と正常肺サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、7.94E−06であった。上記値は、結果が統計的に有意であることを示す。
本発明によれば、核タンパク質4(NOL4)は、肺癌診断用マーカーの非限定的な例である。本発明の核タンパク質4(NOL4)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、核タンパク質4(NOL4)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

核タンパク質4(NOL4)−TAA−seg1−順方向プライマー(配列番号1527):CTCGCTCCCTTGCTCACACおよび核タンパク質4(NOL4)−TAA−seg1−逆方向プライマー(配列番号1528):AAAGGGAAAGCGGGATGTTT
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:核タンパク質4(NOL4)アンプリコン(配列番号1529)。

CTCGCTCCCTTGCTCACACACACGCACACACTCAGCCTGGCCGAGCAGGAGCCACTGACCATTTTGCAAGTGTCAGGACCAGCTACAGCGCGGTGGGCGCAAACATCCCGCTTTCCCTTT
本発明の他の好ましい実施形態によれば、核タンパク質4(NOL4)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1529に記載の核タンパク質4(NOL4)スプライスバリアント(例えば、変異型番号3、11、および12)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、核タンパク質4(NOL4)のフラグメントは、セグメント_TAA−seg−1(配列番号1552)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、核タンパク質4(NOL4)_セグメント_TAA−seg−1(配列番号1552)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
本発明の他の好ましい実施形態によれば、配列番号1554および1555に記載の固有のセグメントを含む核タンパク質4(NOL4)スプライスバリアント(例えば、配列番号1534〜1536および1539〜1541に記載の転写物)は、肺癌検出用バイオマーカーを含む。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記の核タンパク質4(NOL4)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1542、1547、および1543ならびに1548、1545、1546、および1549〜1551が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1544に記載のタンパク質(配列番号1543、1546、1549)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。
本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質4(NOL4)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1532中に示すアンプリコンによって検出可能な核タンパク質4(NOL4)−(T06014)転写物の発現
配列番号1532によって検出可能な核タンパク質4(NOL4)転写物(例えば、配列番号1533、1537、1538によって示される変異型番号3、11、および12)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1481)の発現を同様に測定した。各RTサンプルのために、配列番号1532の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図57aおよびbは、正常サンプルに対する癌性肺組織における上記核タンパク質4(NOL4)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも400倍または6倍の過剰発現を示すサンプルの数および比率を、以下の図57aおよび56bにそれぞれ示す。
図57aから明らかなように、肺小細胞癌由来のサンプル中の配列番号1532によって検出可能な核タンパク質4(NOL4)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、8個の小細胞癌サンプルのうちの8個で少なくとも400倍の過剰発現が認められた。図4bから明らかなように、15個の腺癌サンプルのうちの4個、16個の扁平上皮細胞癌サンプルのうちの3個で少なくとも6倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1532によって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、1.70E−02と決定された。
6倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.80E−02であった。
小細胞肺癌サンプル対正常肺サンプルにおける配列番号1532よって検出可能な核タンパク質4(NOL4)転写物の発現レベルの相違についてのP値は、T検定によって、7.08E−03と決定された。
400倍過剰発現の閾値は、小細胞癌と正常肺サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.03E−04であった。上記値は、結果が統計的に有意であることを示す。
本発明によれば、核タンパク質4(NOL4)は、肺癌診断用マーカーの非限定的な例である。本発明の核タンパク質4(NOL4)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、核タンパク質4(NOL4)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

核タンパク質4(NOL4)–TAA−seg3−順方向プライマー(配列番号1530):ACATCCCCCTGGAACGGATおよび核タンパク質4(NOL4)−TAA−seg3−逆方向プライマー(配列番号1531):CAGAAATTAGCAAAGCATTGATGG
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:核タンパク質4(NOL4)アンプリコン(配列番号1532)。

ACATCCCCCTGGAACGGATATCTGTTTGGGGCACTACAATCTATCCTGTAGAACTATGGCCAAATCTCCATCAATGCTTTGCTAATTTCTG
本発明の他の好ましい実施形態によれば、核タンパク質4(NOL4)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1533、1537、1538に記載の核タンパク質4(NOL4)スプライスバリアント(例えば、変異型番号3、11、12)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、核タンパク質4(NOL4)のフラグメントは、セグメント_TAA−seg−3(配列番号1553)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、核タンパク質4(NOL4)_セグメント_TAA−seg−3(配列番号1553)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記の核タンパク質4(NOL4)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1542、1547、および1548が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。
本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質4(NOL4)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1558中に示すアンプリコンによって検出可能なAA281370転写物の発現
肺癌中に過剰発現されたAA281370遺伝子を、上記の計算過程によって同定した。AA281370コードタンパク質(配列番号1563、1564)は、広範な種々の機能を対象とする多数の真核生物タンパク質中で見出されるいくつかのWD40ドメインを含む(シグナル伝達、プレmRNAプロセシング、および細胞骨格アセンブリにおけるアダプター分子および/または調節分子が含まれる)。図63に示すように、配列番号1564に示すAA281370コードタンパク質のWD43ドメイン領域はいくらか類似しており、シグナル伝達MAPK経路への関与が示唆され得る。例えば、40〜790位のアミノ酸の間に存在するAA281370ポリペプチド(配列番号1564)の領域は、マウスMapkbp1タンパク質(gi|47124622)のWDドメイン領域と75%相同であり(図63a)、AA281370ポリペプチド(配列番号1564)の40〜886位のアミノ酸は、ラットJNK結合タンパク質JNKBP1(gi|34856717)と70%相同である(図63b)。
配列番号1558によって検出可能なAA281370転写物(例えば、配列番号1559〜1562中に示される変異型番号0、1、4、および5)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1558の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図58は、正常サンプルに対する癌性肺組織における上記AA281370転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも6倍の過剰発現を示すサンプルの数および比率を、以下に示す。
図58から明らかなように、癌サンプル中の配列番号1558によって検出可能なAA281370転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、8個の小細胞癌サンプルのうちの8個、16個の扁平上皮細胞癌サンプルのうちの2個、4個の大細胞癌サンプルのうちの1個で少なくとも6倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1558によって検出可能なAA281370転写物の発現レベルの相違についてのP値は、T検定によって、8.58E−07と決定された。
6倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、4.81E−02であった。
上記値は、結果が統計的に有意であることを示す。
本発明によれば、AA281370転写物は、肺癌診断用マーカーの非限定的な例である。本発明のAA281370マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、AA281370と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

AA281370−順方向プライマー(配列番号1556):GGTTCGGATGGACTACACTTTGTC;およびAA281370−逆方向プライマー(配列番号1557): CCACGTACTTCTGGGTGATGTC
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:AA281370アンプリコン(配列番号1558)。

AA281370−アンプリコン(配列番号1558):GGTTCGGATGGACTACACTTTGTCCGTACCCACCACGTAGCAGAGAAAACCACCTTGTATGACATGGACATTGACATCACCCAGAAGTACGTGG
本発明の他の好ましい実施形態によれば、AA281370またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1558に記載のAA281370スプライスバリアント(例えば、変異型番号0、1、4、および5)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、AA281370のフラグメントは、セグメント_TAA−seg10(配列番号1567)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、AA281370_セグメント_TAA−seg10(配列番号1567)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
他の好ましい実施形態によれば、本発明はまた、任意選択的およびより好ましくは、配列番号1568に記載の固有のセグメントを含むAA281370スプライスバリアント(例えば、配列番号1561および1562に記載の転写物)は、肺癌検出用バイオマーカーを含む。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のAA281370に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1563〜1566が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(配列番号1569、1570、および1571に記載のタンパク質(配列番号1563〜1566)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。
本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のAA281370に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1574中に示すアンプリコンによって検出可能なスルファターゼ1(SULF1)−(Z21368)転写物の発現
SULF1は、細胞外基質中で見出される分泌タンパク質である。SULF1は、多数の上皮癌型で下方制御されることが公知である。
配列番号1574によって検出可能なスルファターゼ1(SULF1)転写物(例えば、配列番号1578、1579中に示される変異型番号13および14)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1574の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図59は、正常サンプルに対する癌性肺組織における上記スルファターゼ1(SULF1)転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも8倍の過剰発現を示すサンプルの数および比率を、以下に示す。
図59から明らかなように、非細胞癌由来の癌サンプル中の配列番号1574によって検出可能なスルファターゼ1(SULF1)転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの11個、16個の扁平上皮細胞癌サンプルのうちの11個、4個の大細胞癌サンプルのうちの4個で少なくとも8倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1574によって検出可能なスルファターゼ1(SULF1)転写物の発現レベルの相違についてのP値は、T検定によって、3.18E−07と決定された。
8倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、1.18E−04であった。
上記値は、結果が統計的に有意であることを示す。
本発明によれば、スルファターゼ1(SULF1)は、肺癌診断用マーカーの非限定的な例である。本発明のスルファターゼ1(SULF1)マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、スルファターゼ1(SULF1)と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。
スルファターゼ1(SULF1)−順方向プライマー(配列番号1572):ACTCACTCAGAGACTAACACAAAGGAAGおよびスルファターゼ1(SULF1)−逆方向プライマー(配列番号1573):AGTATGGGAAGAATTTACTGGTCACA
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:スルファターゼ1(SULF1)アンプリコン(配列番号1574)。
ACTCACTCAGAGACTAACACAAAGGAAGTAATTTCTTACCTGGTCATTATTTAGTCTACAATAAGTTCATCCTTCTTCAGTGTGACCAGTAAATTCTTCCCATACT
本発明の他の好ましい実施形態によれば、スルファターゼ1(SULF1)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1578、1579に記載のスルファターゼ1(SULF1)スプライスバリアント(例えば、変異型番号13および14)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、スルファターゼ1(SULF1)のフラグメントは、セグメント_TAA−seg5(配列番号1587)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、スルファターゼ1(SULF1)_セグメント_TAA−seg5(配列番号1857)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
本発明の他の好ましい実施形態によれば、配列番号1588、1591に記載の固有のセグメントを含むスルファターゼ1(SULF1)スプライスバリアント(例えば、配列番号1575〜1577に記載の転写物)は、肺癌検出用バイオマーカーを含む。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のスルファターゼ1(SULF1)に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1586、1580、1582、1584が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチド(それぞれ、配列番号1581、1583、および1585に記載のタンパク質(配列番号1580、1582、1584)の固有のアミノ酸配列が含まれるが、これらに限定されない)も、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。
本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記の核タンパク質4(NOL4)に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1594中に示すアンプリコンによって検出可能なSRY(性決定領域Y)−ボックス2(SOX2))−(HUMHMGBOX)転写物の発現
配列番号1594によって検出可能なSOX2転写物(例えば、配列番号1595によって示される変異型番号0)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1594の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図60は、正常サンプルに対する癌性肺組織における上記SOX2転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも5倍の過剰発現を示すサンプルの数および比率を、以下に示す。
図60から明らかなように、肺癌由来の癌サンプル中の配列番号1594によって検出可能なSOX2転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、15個の腺癌サンプルのうちの4個、16個の扁平上皮細胞癌サンプルのうちの10個、4個の大細胞癌サンプルのうちの2個、および8個の小細胞癌のうちの7個で少なくとも5倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1594によって検出可能なSOX2転写物の発現レベルの相違についてのP値は、T検定によって、4.38E−05と決定された。
5倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、8.09E−04であった。
上記値は、結果が統計的に有意であることを示す。
本発明によれば、SOX2は、肺癌診断用マーカーの非限定的な例である。本発明のSOX2マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、SOX2と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

SOX2−順方向プライマー(配列番号1592):GGCGGCGGCAGGATおよびSOX2−逆方向プライマー(配列番号1593):GTCGGGAGCGCAGGG
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:SOX2アンプリコン(配列番号1594)。
GGCGGCGGCAGGATCGGCCAGAGGAGGAGGGAAGCGCTTTTTTTGATCCTGATTCCAGTTTGCCTCTCTCTTTTTTTCCCCCAAATTATTCTTCGCCTGATTTTCCTCGCGGAGCCCTGCGCTCCCGAC
本発明の他の好ましい実施形態によれば、SOX2またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1595に記載のSOX2スプライスバリアント(例えば、変異型番号0)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、SOX2のフラグメントは、セグメント_TAA−seg2(配列番号1597)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、SOX2_セグメント_TAA−seg2(配列番号1597)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のSOX2に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1596が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。
本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のSOXに対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における配列番号1600中に示すアンプリコンによって検出可能なプラコフィリン1(外胚葉異形成/表皮水疱症候群)(PKP1)−(HSB6PR)転写物の発現
配列番号1600によって検出可能なPKP1転写物(例えば、配列番号1601〜1603によって示される変異型番号0、5、および6)の発現を、実時間PCRによって測定した。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1600の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図61は、正常サンプルに対する癌性肺組織における上記PKP1転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで少なくとも7倍の過剰発現を示すサンプルの数および比率を、以下に示す。
図61から明らかなように、肺癌由来の癌サンプル中の配列番号1600によって検出可能なPKP1転写物の発現は、非癌性サンプル(サンプル番号46〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)よりも有意に高かった。明白には、16個の扁平上皮細胞癌サンプルのうちの11個および4個の大細胞癌サンプルのうちの1個で少なくとも7倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。
肺癌サンプル対正常肺サンプルにおける配列番号1600によって検出可能なPKP1転写物の発現レベルの相違についてのP値は、T検定によって、3.18E−03と決定された。
7倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、3.50E−02であった。
上記値は、結果が統計的に有意であることを示す。
本発明によれば、PKP1は、肺癌診断用マーカーの非限定的な例である。本発明のPKP1マーカーを、単独または組み合わせて、種々の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)に使用することができる。このマーカーの過剰発現および/または差分発現を検出するために任意選択的に任意の方法を使用することができるが、好ましくは、NATベースのテクノロジーを使用する。したがって、任意選択的およびより好ましくは、前に定義するように、PKP1と選択的にハイブリッド形成することができる任意の核酸分子も本発明に含まれる。プライマー対も、任意選択的および好ましくは、本発明の範囲内に含まれ、例えば、上記実験では、適切なプライマー対の制限されない例示のみとして以下のプライマーを使用した。

PKP1−順方向プライマー(配列番号1598):CCCCAGACTCTGTGCACTTCAおよびPKP1−逆方向プライマー(配列番号1599):TGGGCTCTGCTCTGTCTTAGTGTA
本発明はまた、好ましくは、(例えば、上記実験に)適切な任意のプライマー対の使用によって得た任意のアンプリコンを含み、適切なアンプリコンの制限されない例示のみとして以下のアンプリコンを得た:PKP1アンプリコン(配列番号1600)。

PKP1–アンプリコン(配列番号1600):CCCCAGACTCTGTGCACTTCAGACCAGCAGCAGCAGGAGGGCTCCCGAGGGCCTTATGAGAAAACCTGTGTGGACATCCCTTGGTGTACACTAAGACAGAGCAGAGCCCA
本発明の他の好ましい実施形態によれば、PKP1またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、配列番号1601〜1603に記載のPKP1スプライスバリアント(例えば、変異型番号0、5、および6)またはそのフラグメントは、肺癌検出用バイオマーカーを含む。任意選択的およびより好ましくは、PKP1のフラグメントは、セグメント_TAA−seg34(配列番号1608)を含む。同様に、任意選択的およびより好ましくは、任意の適切な方法を、例えば、PKP1_セグメント_TAA−seg34(配列番号1608)などのフラグメントの検出のために使用することができる。最も好ましくは、フラグメントと特異的にハイブリッド形成することができる任意の核酸分子などのNATベースのテクノロジーを使用する。任意選択的および最も好ましくは、フラグメントを得るためにプライマー対を使用する。
本発明の他の好ましい実施形態によれば、配列番号1607に記載の固有のセグメントを含むPKP1スプライスバリアント(例えば、配列番号1603に記載の変異型6)は、肺癌検出用バイオマーカーとして適切である。
さらに他の好ましい実施形態によれば、本発明は、任意選択的および好ましくは、上記のPKP1に対応する核酸配列によってコードされる任意のアミノ酸配列またはフラグメント(配列番号1604〜1606が含まれるが、これらに限定されない)を含む。このようなアミノ酸配列またはそのフラグメントに対する任意のオリゴペプチドまたはペプチドも、任意選択的に、(さらにまたは二者択一的に)バイオマーカーとして使用することができる。
本発明はまた、任意選択的に、このようなオリゴペプチドまたはペプチドを認識することができ、そして/またはこれらによって誘発することができる抗体を含む。
本発明はまた、任意選択的および好ましくは、任意選択的な任意の適用のための上記のPKP1に対応する任意の核酸配列もしくはそのフラグメントまたはアミノ酸配列もしくはそのフラグメントを含む。
正常および癌性肺組織における12の配列(配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625)の組み合わせ発現
配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625によって検出可能ないくつかの転写物の発現を、実時間PCRによって測定した(各配列番号の発現を個別にチェックした)。並行して、4つのハウスキーピング遺伝子−PBGD(GenBankアクセッション番号BC019323、アンプリコン–配列番号1471)、HPRT1(GenBankアクセッション番号NM_000194、アンプリコン–配列番号1468)、ユビキチン(GenBankアクセッション番号BC000449、アンプリコン–配列番号1474)、およびSDHA(GenBankアクセッション番号NM_004168、アンプリコン–配列番号1477)の発現を同様に測定した。各RTサンプルのために、配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625の発現を、ハウスキーピング遺伝子量の相乗平均に正規化した。各RTサンプルの正規化した量を、正常な死後(PM)サンプル(上記のサンプル番号47〜50、90〜93、96〜99、表2、「試験パネル中の組織サンプル」)の量の中央値で割って、正常なPMサンプルの中央値に対する各サンプルの上方制御の倍率を得た。
図62は、正常サンプルに対する癌性肺組織における上記転写物の過剰発現を示すヒストグラムである。試験した全サンプル数のうちで上記配列番号の少なくとも1つにおいて少なくとも10倍の過剰発現を示すサンプルの数および比率を、以下に示す。
図62から明らかなように、上記配列番号の少なくとも1つにおいて、15個の腺癌サンプルのうちの15個、16個の扁平上皮細胞癌サンプルのうちの15個、4個の大細胞癌サンプルのうちの4個、および8個の小細胞癌サンプルのうちの8個で少なくとも10倍の過剰発現が見出された。
下記のように、これらの結果の有意性を検証するために、統計分析を適用した。配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625に記載のアンプリコンの少なくとも1つの10倍過剰発現の閾値は、癌と正常サンプルとの間で異なることが見出され、フィッシャーの正確確率検定によってチェックしたところ、P値は、2.37E−08であった。
上記値は、結果が統計的に有意であることを示す。
キットおよび診断アッセイおよび診断方法
上記実施例のいずれかに関して記載のマーカーを、肺癌診断を補助するために、単独、上記の他のマーカーおよび/または他の完全に異なるマーカー(UbcH10 (それぞれ2004年1月13日および3月19日出願の米国特許出願番号60/535,904号および同第60/572,122号(代理人整理番号27080および28045を参照のこと)、トロポニン(米国特許出願番号60/539,129号(代理人整理番号26940を参照のこと)、Sim2(PCT出願番号WO2004/012847号を参照のこと)、PE−10(SP−A)、TTF−1、サイトケラチン5/6が含まれるが、これらに限定されない)と組み合わせて使用することができる。これら全ての出願は、本明細書中に完全に記載されているかのように本明細書中で参考として援用される。これらのマーカーを、他のマーカーと組み合わせて、多数の用途(肺癌の予後、予想、スクリーニング、早期検診、治療の選択、および治療のモニタリングが含まれるが、これらに限定されない)(および、任意選択的に、疾患の病期分類も含まれる)に使用することができる。併用した場合、これらにより、1つのマーカーのみを使用して得られる結果と比較して、診断医がより多くの情報を得ることができ、真の陽性および真の陰性の診断の比率が増加し、偽陽性または偽陰性の診断の比率が減少する。
本発明のアッセイおよび方法には、上記のように、免疫アッセイ、ハイブリッド形成アッセイ、およびNATベースのアッセイが含まれるが、これらに限定されない。肺癌診断を補助するための本発明のマーカーと上記の他のマーカーおよび/または完全に異なるマーカーとの組合わせを、NATベースのアッセイ、免疫アッセイ、およびハイブリッド形成アッセイの組み合わせとして実施することができる。本発明の好ましい実施形態によれば、アッセイは、上記実施例に関する例として記載のNATベースのアッセイである。
さらに別の態様では、本発明は、肺癌診断を補助するためのキットであって、前記キットを使用して本発明のマーカーを検出することができる、キットを提供する。例えば、キットを使用して、肺癌患者および通常の患者のサンプル中で差分的に存在する上記のマーカーの任意の1つまたは組み合わせを検出することができる。本発明のキットは、広く適用される。例えば、キットを使用して、被験体が小細胞肺癌、非小細胞肺癌、腺癌、気管支肺胞癌、扁平上皮細胞癌、または大細胞癌を有するかどうかを識別するか、負の診断をすることにより肺癌診断を補助することができる。別の例では、キットを使用して、肺癌用のin vitroでの肺細胞またはin vivoでの動物モデルにおいてマーカーの発現を調整する化合物を同定することができる。
1つの実施形態では、キットは、(a)吸着剤を含む基質であって、前記吸着剤がマーカーの結合に適切である、基質と、(b)洗浄液または洗浄液作製のための説明書を含み、前記吸着剤と洗浄液との組み合わせにより、前述のマーカーが検出される。
任意選択的に、キットは、さらに、標識または別のインサートの形態の適切な操作パラメータのための説明者を含み得る。例えば、キットは、消費者/キット使用者に、精漿サンプルまたは他の組織サンプルがプローブに接触した後にどのようにしてプローブを洗浄するのかについての情報を与える標準的な説明書を有し得る。
別の実施形態では、キットは、(a)マーカーに特異的に結合する抗体および(b)検出試薬を含む。このようなキットを、上記の材料から調製することができる。
いずれかの実施形態では、キットは、任意選択的に、試験サンプルをコントロール情報標準および/またはコントロール量と比較して、サンプル中で検出されたマーカーの試験量が肺癌診断と一致する診断量であるかどうかを決定することができるような標準もしくはコントロールの情報および/またはコントロール量の材料をさらに含み得る。
本発明のスプライスバリアントの治療への適用
本明細書中に記載のスプライスバリアント(任意のポリヌクレオチド、オリゴヌクレオチド、ポリペプチド、ペプチド、またはこれらのフラグメントが含まれる)またはこれらに特異的に結合する抗体を、任意選択的に、例えば、その診断への適用に関して本明細書中に記載の疾患を治療するための治療への適用に使用することができる。「変異型治療可能な」疾患は、本発明の任意の治療タンパク質のスプライスバリアントの使用によって治療可能な任意の疾患をいう。「治療」はまた、疾患および/または病的状態の予防、改善、消失、および制御を含む。このような変異型が有用な治療薬であり得る疾患を、各変異型について以下により詳細に記載する。これらの変異型は公知のタンパク質のスプライスバリアントであるので、変異型自体を、「クラスター」または遺伝子と記載する。したがって、「クラスター関連疾患」または「変異型関連疾患」は、特定のタンパク質(このような疾患の記載に関して、本発明の治療タンパク質変異型)によって治療することができる疾患をいう。
本明細書中で使用される、用語「生物学的に活性な」は、天然に存在する分子の構造、調節、または生化学的機能を有するタンパク質をいう。同様に、「免疫学的に活性な」は、天然、組換え、または合成のリガンドまたはこれらの任意のオリゴペプチドが適切な動物または細胞における特異的免疫応答を誘導して特異的抗体と結合する能力をいう。
本明細書中で使用される、用語「調整する」は、少なくとも1つの受容体媒介活性の活性の変化をいう。例えば、調整により、タンパク質の活性、結合特性、またはリガンドの任意の他の生物学的、機能的、もしくは免疫学的性質が増加または減少し得る。
治療方法
上記のように、本発明の新規の治療タンパク質変異型およびこれに由来する組成物(すなわち、ペプチド、オリゴヌクレオチド)を使用して、クラスター関連疾患を治療することができる。
したがって、本発明のさらなる態様によれば、被験体におけるクラスター関連疾患の治療方法を提供する。
本発明の被験体は、上記のクラスター関連疾患の少なくとも1つの型を有する哺乳動物(好ましくは、ヒト)である。
上記のように、本発明の生体分子の配列を使用して、上記疾患を有する被験体を治療することができる。
本発明の被験体は、上記の疾患の1つを罹患していると診断されたか、上記の疾患の1つを罹患しやすい哺乳動物(好ましくは、ヒト)である。
本明細書中で使用される、用語「治療」は、上記疾患の治癒、逆転、軽減、緩和、最小化、抑制、または副作用の阻止をいう。
本発明によれば、被験体における本発明のポリペプチドの少なくとも1つの発現の特異的上方制御または下方制御によって治療することができる。
任意選択的に、被験体への本明細書中に記載の本発明のポリペプチド(例えば、組換えまたは合成)の少なくとも1つまたはその活性部分の投与によって上方制御することができる。しかし、巨大なポリペプチドの生物学的利用能は、分解率の高さおよび透過率の低さによって潜在的に比較的小さいので、ポリペプチドの投与を、小さなペプチドフラグメント(例えば、約100アミノ酸)に制限することが好ましい。ポリペプチドまたはペプチドを、任意選択的に、以下により詳細に記載する薬学的組成物中で投与することができる。
本発明の上記疾患の治療を当該分野で公知の他の治療方法と組み合わせることができる(すなわち、併用療法)ことが認識される。したがって、本発明の薬剤を使用した悪性腫瘍の治療を、例えば、放射線療法、抗体療法、および/または化学療法と組み合わせることができる。
あるいはまたはさらに、任意選択的に、本発明のポリペプチドの少なくとも1つまたはその活性部分の被験体中の量(任意選択的に発現)の特異的上方制御によって上方制御法を行うことができる。
上記および以下の実施例に記載のように、本発明のこの態様の生体分子配列を、野生型遺伝子産物の活性または発現の変化が疾患の発症または進行に寄与することが公知である疾患の治療のための有益な治療ツールとして使用することができる。例えば、疾患が膜結合受容体の過剰発現に起因する場合、その可溶性変異型を、受容体と結合を競合し、それにより受容体からのシグナル伝達が終了するアンタゴニストとして使用することができる。
このような疾患の例を、以下の実施例の部に列挙する。
本発明のポリペプチドはまた、作動特性を有し得ることが認識される。これらには、リガンド(例えば、IL−4)の安定性、タンパク質分解からの防御、およびリガンドの薬物動態学的性質の改変(すなわち、リガンドの半減期が増加する一方で、そのクリアランスが減少する)が含まれる。したがって、本発明のこの態様の生体分子配列を使用して、野生型遺伝子産物が好ましい役割を果たす容態または疾患(例えば、糖尿病または虚血における血管形成の増加)を治療することができる。
本発明の治療タンパク質変異型発現を、上記のように、真核細胞(例えば、哺乳動物細)中でのコード配列の発現のためにデザインされた核酸発現構築物にライゲーションされた本発明の外因性ポリヌクレオチド配列の少なくとも1つの投与を介して上方制御することができる。したがって、外因性ポリヌクレオチド配列は、本発明の変異型をコードするDNAもしくはRNAまたはその活性部分であり得る。
下記の任意の適切な投与様式(すなわち、in−vivo遺伝子療法)を使用して、核酸構築物を個体に投与することができることが認識される。あるいは、適切な遺伝子送達体/方法(トランスフェクション、形質導入、相同組換えなど)および必要に応じて発現系によって核酸構築物を適切な細胞に導入し、改変された細胞を培養で拡大し、個体に戻す(すなわち、ex−vivo遺伝子療法)。核酸構築物は、上により詳細に記載している。
本方法を、被験体における本発明の変異型の発現の特異的な内因性上方制御によって行うこともできることが認識される。所与の遺伝子の特異的スプライスバリアントの内因性発現の上方制御のための薬剤には、目的のスプライス部位に指向し、それにより遺伝子のスプライシングパターンが変化するアンチセンスオリゴヌクレオチドが含まれる。このアプローチは、Bcl−x(Taylor(1999)Nat.Biotechnol.17:1097−1100;and Mercatante(2001)J.Biol.Chem.276:16411−16417)、IL−5R(Karras(2000)Mol.Pharmacol.58:380−387)、およびc−myc(Giles(1999)Antisense Acid Drug Dev.9:213−220)の2つのイソ型の発現の均衡を変化させるために首尾よく使用されている。
例えば、インターロイキン5およびその受容体は、造血の調節因子ならびにアレルギーおよび喘息などのいくつかの炎症性疾患におけるメディエーターとして重要な役割を果たす。2つの選択的にスプライシングされたイソ型は、IL−5R遺伝子から生成され、それぞれ、エクソン9を含むか(すなわち、長鎖形態)排除されている(すなわち、短鎖形態)。長鎖形態はインタクトな膜結合受容体をコードし、より短い形態は分泌された可溶性非機能性受容体をコードする。エクソン9領域に特異的な2’−O−MOE−オリゴヌクレオチドを使用して、Karras and co−workers(上記)は、野生型受容体の発現を有意に減少させ、より短いイソ型の発現を増加させることができた。本発明に使用することができるオリゴヌクレオチドのデザインおよび合成を以下に記載し、これらは、Sazani and Kole(2003)Progress in Moleclular and Subcellular Biology 31:217−239による。
真核細胞(例えば、哺乳動物細胞)中でのコード配列の発現のためにデザインした核酸発現構築物にライゲーションした本発明の外因性ポリヌクレオチド配列(例えば、配列番号3、7、11、15、19、23、27、31、35、39、または43)の少なくとも1つの投与によって、被験体における本発明のポリペプチド発現を上方制御することがができる。したがって、外因性ポリヌクレオチド配列は、本発明の変異型をコードするDNAもしくはRNA配列またはその活性部分であり得る。
下記の任意の適切な投与様式(すなわち、in−vivo遺伝子療法)を使用して、核酸構築物を個体に投与することができることが認識される。あるいは、適切な遺伝子送達体/方法(トランスフェクション、形質導入、相同組換えなど)および必要に応じて発現系によって核酸構築物を適切な細胞に導入し、改変された細胞を培養で拡大し、個体に戻す(すなわち、ex−vivo遺伝子療法)。
好ましくは、本発明の核酸構築物によって利用されるプロモーターは、形質転換された特定の細胞集団で活性である。細胞型特異的および/または組織特異的プロモーターの例には、肝臓特異的であるアルブミン(Pinkert et al.,(1987)Genes Dev.1:268−277)、リンパ特異的プロモーター(Calame et al.,(1988)Adv.Immunol.43:235−275)、特に、T細胞受容体(Winoto et al.,(1989)EMBO J.8:729−733)および免疫グロブリン(Banerji et al.(1983)Cell 33729−740)のプロモーター、神経フィラメントプロモーター(Byrne et al.(1989)Proc.Natl.Acad.Sci.USA 86:5473−5477)などのニューロン特異的プロモーター、膵臓特異的プロモーター(Edlunch et al.(1985)Science 230:912−916)、または乳清プロモーター(米国特許第4,873,316号および欧州特許出願番号EP 264,166号)などの乳腺特異的プロモーターなどのプロモーターが含まれる。
適切な構築物の例には、pcDNA3、pcDNA3.1(+/−)、pGL3、PzeoSV2(+/−)、pDisplay、pEF/myc/cyto、pCMV/myc/cyto(それぞれInvitrogen Co.(www.invitrogen.com)から市販されている)が含まれるが、これらに限定されない。レトロウイルスベクターおよびパッケージング系の例は、Clontech,San Diego,Calif.で販売されており、複数のクローニング部位にクローニング可能であり、導入遺伝子がCMVプロモーターによって転写される、Retro−XベクターpLNCXおよびpLXSNが含まれる。導入遺伝子が5’LTRプロモーターから転写されるpBabeなどのMo−MuLV由来のベクターも含まれる。
現在好ましいin vivo核酸導入技術には、アデノウイルス、レンチウイルス、単純ヘルペスIウイルス、またはアデノ随伴ウイルス(AAV)および脂質ベースの系などのウイルス構築物または非ウイルス構築物でのトランスフェクションが含まれる。脂質媒介遺伝子導入に有用な脂質は、例えば、DOTMA、DOPE、およびDC−Cholである(Tonkinson et al.,Cancer Investigation,14(1):54−65(1996))。遺伝子療法で使用するための最も好まし構築物はウイルスであり、最も好ましくはアデノウイルス、AA、レンチウイルス、またはレトロウイルスである。レトロウイルス構築物などのウイルス構築物は、少なくとも1つの転写プロモーター/エンハンサーもしくは遺伝子座定義エレメント(locus−defining element(s))、または選択的スプライシング、核RNA輸送、もしくはメッセンジャーの翻訳後修飾などの他の手段によって遺伝子発現を調節する他のエレメントを含む。このようなベクター構築物はまた、ウイルス構築物中に既に存在しない場合、使用ウイルスに適切なパッケージングシグナル、長末端反復(LTRs)もしくはその一部、およびプラス鎖およびマイナス鎖プライマー結合部位を含む。さらに、このような構築物は、典型呈には、配置される宿主細胞からのペプチドの分泌のためのシグナル配列を含む。好ましくは、この目的のためのシグナル配列は、哺乳動物シグナル配列または本発明のポリペプチド変異型のシグナル配列である。任意選択的に、構築物はまた、ポリアデニル化を指示するシグナルならびに1つまたは複数の制限部位および翻訳終結配列を含み得る。例として、このような構築物は、典型的には、5’LTR、tRNA結合部位、パッケージングシグナル、二本鎖DNA合成起源、および3’LTRまたはその一部を含む。カチオン性脂質、ポリリジン、およびデンドリマーなどの非ウイルス性の他のベクターを使用することができる。
本方法を、被験体における本発明のスプライスバリアントの発現の特異的な内因性上方制御によって行うこともできることが認識される。所与の遺伝子の特異的スプライスバリアントの内因性発現の上方制御のための薬剤には、目的のスプライス部位に指向し、それにより遺伝子のスプライシングパターンが変化するアンチセンスオリゴヌクレオチドが含まれる。このアプローチは、Bcl−x(Taylor(1999)Nat.Biotechnol.17:1097−1100;and Mercatante(2001)J.Biol.Chem.276:16411−16417)、IL−5R(Karras(2000)Mol.Pharmacol.58:380−387)、およびc−myc(Giles(1999)Antisense Acid Drug Dev.9:213−220)の2つのイソ型の発現の均衡を変化させるために首尾よく使用されている。
例えば、インターロイキン5およびその受容体は、造血の調節因子ならびにアレルギーおよび喘息などのいくつかの炎症性疾患におけるメディエーターとして重要な役割を果たす。2つの選択的にスプライシングされたイソ型は、IL−5R遺伝子から生成され、それぞれ、エクソン9を含むか(すなわち、長鎖形態)排除されている(すなわち、短鎖形態)。長鎖形態はインタクトな膜結合受容体をコードし、より短い形態は分泌された可溶性非機能性受容体をコードする。エクソン9領域に特異的な2’−O−MOE−オリゴヌクレオチドを使用して、Karras and co−workers(上記)は、野生型受容体の発現を有意に減少させ、より短いイソ型の発現を増加させることができた。本発明に使用することができるオリゴヌクレオチドのデザインおよび合成を以下に記載し、これらは、Sazani and Kole(2003)Progress in Moleclular and Subcellular Biology 31:217−239による。
好ましくは、本発明のポリペプチド変異型の少なくとも1つの発現(または活性)を特異的に下方制御することができる薬剤によって治療することができる。
以下により詳細に記載のオリゴヌクレオチドなどのオリゴヌクレオチドを使用して、本発明の治療タンパク質変異型の発現を下方制御することができる。
siRNA分子−小干渉RNA(siRNA)分子を使用して、本発明の治療タンパク質変異型の発現を下方制御することができる。RNA干渉は、2工程プロセスである。初期工程と呼ばれる第1の工程では、入力(input)dsRNAを21〜23ヌクレオチド(nt)の小干渉RNA(siRNA)に消化し、これはおそらくダイサー(ATP依存性様式でdsRNA(直接か導入遺伝子またはウイルスによって導入される)をプロセシングする(切断する)dsRNA特異的リボヌクレアーゼのRNアーゼIIIファミリーのメンバー)の作用による。連続的切断により、RNAがそれぞれ2−ヌクレオチド3’オーバーハングを有する19〜21bpの二重鎖(siRNA)に分解される(Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002)およびBernstein Nature 409:363−366(2001))。
エフェクター工程では、siRNA二重鎖は、ヌクレアーゼ複合体と結合して、RNA誘導サイレンシング複合体(RISC)を形成する。RISCの活性化にはsiRNA二重鎖のATP依存性巻き戻しが必要である。次いで、活性RISCは、塩基対合相互作用によって相同転写物をターゲティングし、mRNAをsiRNAの3’末端由来の12ヌクレオチドフラグメントに切断する(Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002);Hammond et al.(2001)Nat.Rev.Gen.2:110−119(2001);and Sharp Genes.Dev.15:485−90(2001))。切断機構は以前として解明されていないが、研究により、各RISCが1つのsiRNAおよびRNアーゼを含むことが示されている(Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002))。
RNAiの顕著な能力により、RNAi経路内の増幅工程が示唆されている。より多数のsiRNAが生成されるであろう入力dsRNAのコピーまたは形成されたsiRNAの複製によって増幅が起こり得る。あるいはまたはさらに、RISCの複数の代謝回転事象によって複製され得る(Hammond et al.Nat.Rev.Gen.2:110−119(2001),Sharp Genes.Dev.15:485−90(2001);Hutvagner and Zamore Curr.Opin.Genetics and Development 12:225−232(2002))。RNAiに関するより多くの情報については、以下の概説を参照のこと:Tuschl ChemBiochem.2:239−245(2001);Cullen Nat.Immunol.3:597−599(2002);およびBrantl Biochem.Biophys.Act.1575:15−25(2002)。
本発明での使用に適切なRNAi分子を以下のように合成することができる。第1に、mRNA配列を、AAジヌクレオチド配列についてAUG開始コドンの下流をスキャンする。各AAおよび3’隣接19ヌクレオチドの発生を、潜在的siRNA標的部位として記録する。好ましくは、非翻訳領域(UTR)はより多くの調節タンパク質結合部位に富むので、siRNA標的部位を、読み取り枠から選択する。UTR結合タンパク質および/または翻訳開始複合体は、siRNAエンドヌクレアーゼ複合体の結合を阻害し得る(Tuschl ChemBiochem.2:239−245)。GAPDHについて示すように、5’UTRに指向するsiRNAは細胞GAPDH mRNAの約90%減少を媒介し、タンパク質レベルを完全に消失させる(www.ambion.com/techlib/tn/91/912.html)ので、非翻訳領域に指向するsiRNAも有効であり得ることが認識される。
第2に、NCBIサーバ(www.ncbi.nlm.nih.gov/BLAST/)から利用可能なBLASTソフトウェアなどの任意の配列アラインメントソフトウェアを使用して、潜在的標的部位を適切なゲノムデータベース(例えば、ヒト、マウス、ラットなど)と比較する。他のコード配列に有意な相同性を示す推定標的部位をフィルターにかけて除去する。
適した標的配列を、siRNA合成のテンプレートとして選択する。好ましい配列は、G/C含量が55%を超える配列と比較して遺伝子サイレンシングの効果がより高いことが証明されているので、G/C含量が低い配列である。好ましくは、評価のために、標的遺伝子の長さに沿っていくつかの標的部位を選択する。各ポリヌクレオチドが特異的に下方制御するように、標的部位を本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。選択されたsiRNAのより良好な評価のために、ネガティブコントロールを組み合わせて使用することが好ましい。ネガティブコントロールsiRNAは、好ましくは、siRNAと同一のヌクレオチド組成を含むが、ゲノムとの有意な相同性を欠く。したがって、任意の他の遺伝子に対して有意な相同性を示さない場合、siRNAのスクアランブルしたヌクレオチド配列を使用することが好ましい。
DNAzyme分子−本発明のポリペプチドの発現を下方制御することができる別の薬剤は、本発明のポリヌクレオチドのmRNA転写物またはDNA配列を特異的に切断することができるDNAzyme分子である。DNAzymeは、一本鎖および二本鎖の標的配列の両方を切断することができる一本鎖ポリヌクレオチドである(Breaker,R.R.and Joyce,G.Chemistry and Biology 1995;2:655;Santoro,S.W.& Joyce,G.F.Proc.Natl,Acad.Sci.USA 1997;943:4262)。DNAzymeの一般的モデル(「10−23」モデル)が提案されている。「10−23」DNAzymeは、7つ〜9つの各デオキシリボヌクレオチドの2つの基質認識ドメインに隣接した15個のデオキシリボヌクレオチドの触媒触媒ドメインを有する。このDNAzyme型は、プリン:ピリミジン連結点で基質RNAを有効に切断することができる(Santoro,S.W.& Joyce,G.F.Proc.Natl,Acad.Sci.USA 199、DNAzymeの概説については、Khachigian,LM [Curr Opin Mol Ther 4:119−21(2002)を参照のこと)。
DNAzymeの標的部位を、各ポリヌクレオチドが特異的に下方制御するように、本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。
合成された操作DNAzyme認識される一本鎖および二本鎖標的切断部位の構築および増幅の例は、Joyce et al.に付与された米国特許第6,326,174号に開示されている。ヒトウロキナーゼ受容体に指向する類似のデザインのDNAzymeは、最近、ウロキナーゼ受容体発現を阻害し、invivoで結腸癌細胞の転移を首尾よく阻害することが認められた(Itoh et al ,20002,Abstract 409,Ann Meeting Am Soc Gen Ther www.asgt.org)。別の適用では、bcr−ab1癌遺伝子に相補的なDNAzymeは、首尾の良く白血球中での癌遺伝子発現を阻害し、CMLおよびALLの場合に自己骨髄移植片中の再発率を減少させた。
アンチセンス分子−本発明のポリペプチド変異型をコードするmRNA転写物と特異的にハイブリッド形成する個とができるアンチセンスポリヌクレオチドの使用によって、本発明のポリヌクレオチドを下方制御することもできる。
本明細書中で使用される、用語「アンチセンス」は、特異的にDNAまたはRNA配列に相補的なヌクレオチド配列を含む任意の組成物をいう。
用語「アンチセンス鎖」は、「センス」鎖に相補的な核酸鎖に関して使用される。アンチセンス分子にはペプチド核酸も含まれ、合成または転写が含まれる任意の方法によって産生することができる。一旦細胞に移入されると、相補ヌクレオチドは、細胞によって産生された天然の配列と組み合わされて二重鎖を形成し、転写または翻訳のいずれかを遮断する。用語「ネガティブ」を、しばしばアンチセンス鎖に関して使用し、「ポジティブ」を、しばしばセンス鎖に関して使用する。アンチセンスオリゴヌクレオチドはまた、in vivoでの選択的スプライシングの改変およびin vivoおよびin vitroでの診断のために使用される(Khelifi C.et al.,2002,Current Pharmaceutical Design 8:451−1466;Sazani,P.,and Kole.R.Progress in Molecular and Cellular Biology,2003,31:217−239)。
アンチセンスアプローチに重要な以下の2つの態様を考慮しながら本発明のポリペプチドの発現を有効に下方制御するために使用することができるアンチセンス分子をデザインすることができる。第1の態様は、適切な細胞の細胞質へのオリゴヌクレオチドの送達であり、第2の態様は、デザインされたmRNAがその翻訳を阻害する方法で細胞内で特異的に結合するオリゴヌクレオチドのデザインである。
先行技術は、広範な種々の細胞型にオリゴヌクレオチドを有効に送達させるために使用することができる多数の送達ストラテジーを教示している(例えば、Luft J Mol Med 76:75−6(1998);Kronenwett et al.Blood 91:852−62(1998);Rajur et al.Bioconjug Chem 8:935−40(1997);Lavigne et al.Biochem Biophys Res Commun 237:566−71(1997)およびAoki et al.(1997)Biochem Biophys Res Commun 231:540−5(1997)を参照のこと)。
さらに、標的mRNAおよびオリゴヌクレオチドの両方の構造変化のエネルギーを明らかにする熱力学サイクルに基づいてその標的mRNAに対する最も高い推定結合親和性を有する配列を同定するためのアルゴリズムも利用可能である(例えば、Walton et al.Biotechnol Bioeng 65:1−9(1999)を参照のこと)。
このようなアルゴリズムは、細胞におけるアンチセンスアプローチを実施するために首尾よく使用されている。例えば、Walton et al.によって開発されたアルゴリズムにより、科学者は、ウサギβ−グロビン(RBG)およびマウス腫瘍壊死因子α(TNFα)転写物のアンチセンスオリゴヌクレオチドを首尾よくデザインすることができた。同一の研究グループは、最近、速度PCR技術によって評価したところ、細胞培養物中の3つのモデル標的mRNA(ヒト乳酸デヒドロゲナーゼAおよびBならびにラットgp130)に対して合理的に選択されたオリゴヌクレオチドのアンチセンス活性がほとんど全ての場合(ホスホジエステルおよびホスホロチオエートオリゴヌクレオチドの化学的性質を有する2つの細胞型における3つの異なる標的に体する試験が含まれる)で有効であることが証明されたことを報告している。
さらに、in vitro系を使用した特異的オリゴヌクレオチドの有効性のデザインおよび予想のためのいくつかのアプローチも公開されている(Matveeva et al.,Nature Biotechnology 16:1374 − 1375(1998))。
いくつかの臨床試験により、アンチセンスオリゴヌクレオチドの安全性、実現可能性、および活性が証明されている。例えば、癌治療に適切なアンチセンスオリゴヌクレオチドが首尾よく使用されており(Holmund et al.,Curr Opin Mol Ther 1:372−85(1999))、一方で、c−myb遺伝子、p53、およびBcl−2をターゲティングするアンチセンスオリゴヌクレオチドによる血液悪性疾患の治療は臨床試験に入っており、患者に許容されることが認められている(Gerwitz Curr Opin Mol Ther 1:297−306(1999))。
より最近では、ヘパラナーゼ遺伝子発現のアンチセンス媒介抑制は、マウスモデルにおいてヒト癌細胞の胸膜播種を阻害することが報告されている(Uno et al.,Cancer Res 61:7855−60(2001))。
したがって、上記のアンチセンステクノロジー分野の最近の開発により、高精度のアンチセンスデザインアルゴリズムおよび広範な種々のオリゴヌクレオチド送達系が得られ、当業者が過度な試験および誤った実験を用いることなく公知の配列の発現の下方制御に適切なアンチセンスアプローチをデザインして実施することができることが現在認められている。
各ポリヌクレオチドが特異的に下方制御されるように、アンチセンス分子の標的部位を本発明の各ポリヌクレオチドの固有のヌクレオチド配列から選択する。
リボザイム−本発明のポリペプチド発現を下方制御することができる別の薬剤は、本発明のポリペプチド変異型をコードするmRNA転写物を特異的に切断することができるリボザイム分子である。リボザイムは、目的のタンパク質をコードするmRNAの切断による遺伝子発現の配列特異的阻害での使用が増加している(Welch et al.,Curr Opin Biotechnol.9:486−96(1998))。任意の特異的標的RNAを切断するためのリボザイムをデザインする可能性により、リボザイムは基礎研究および治療への適用の両方における有益なツールとなる。治療領域では、リボザイムは、感染症におけるウイルスRNA、癌における優性癌遺伝子、および遺伝子障害における特異的体細胞変異をターゲティングするために使用されている(Welch et al.,Clin Diagn Virol.10:163−71(1998))。最も顕著には、HIV患者のためのいくつかのリボザイム遺伝子療法プロトコールは、既に第1相試験段階である。より最近には、トランスジェニック動物研究、遺伝子標的の検証、および経路の解明のためにリボザイムが使用されている。いくつかのリボザイムは、種々の臨床試験段階にある。ANGIOZYMEは、ヒト臨床試験で研究されるべき最初に合成されたリボザイムであった。ANGIOZYMEは、VEGF−r(血管内皮成長因子受容体の形成(血管形成経路における重要成分)を特異的に阻害する。Ribozyme Pharmaceuticals,Inc.および他の企業は、動物モデルにおける抗血管形成療法の重要性を証明している。HEPTAZYME(C型肝炎ウイルス(HCV)RNAを選択的に破壊するようにデザインされたリボザイムは、細胞培養アッセイにおけるC型肝炎ウイルスRNAの減少に有効であることが見出された(Ribozyme Pharmaceuticals,Incorporated − WEBホームページ)。
あるいは、本発明のポリペプチドに特異的に結合してその活性を阻害することができる抗体または抗体フラグメント(すなわち、中和抗体)などの下方制御薬を使用して、本発明のポリペプチド変異型をポリペプチドレベルで下方制御することができる。このような抗体は、例えば、変異型上のヘテロ二量体形成ドメインまたは推定リガンド結合ドメインに指向することができる。抗体および抗体の生成方法のさらなる説明を以下に示す。
薬学的組成物およびその送達
本発明は、治療有効量の本発明の治療薬(好ましくは、本明細書中に記載の治療タンパク質変異型である)を含む薬学的組成物を特徴とする。任意選択的およびあるいは、治療薬は、治療タンパク質変異型を特異的に認識して結合するが、対応する公知の全長タンパク質に対してはそうではない抗体またはオリゴヌクレオチドであり得る。
あるいは、本発明の薬学的組成物は、治療有効量の治療タンパク質変異ポリペプチドの少なくとも活性部分を含む。
本発明の薬学的組成物を、クラスター関連疾患の治療のために使用することが好ましい。
「治療」は、治療上の処置および予防手段または防止手段をいう。治療を必要とする者には、既に障害を罹患している者および障害を防止すべき者が含まれる。したがって、本明細書中で治療すべき哺乳動物は、障害を罹患していると診断され得るか、障害を罹患しやすいか障害が疑われ得る。治療を目的とする「哺乳動物」は、哺乳動物として分類される任意の動物(ヒト、家畜、動物園の動物、競技用の動物、またはペット(イヌ、ウマ、ネコ、ウシなど)が含まれる)をいう。好ましくは、哺乳動物はヒトである。
「障害」は、本発明の薬剤を使用した治療から利益を得るであろう任意の容態である。これには、慢性および急性障害または疾患(哺乳動物が問題の障害を罹患しやすい病的状態が含まれる)含まれる。本明細書中の治療すべき障害の非限定的な例を、本明細書中に記載の特定の例に関して記載する。
用語「治療有効量」は、哺乳動物の疾患または障害を有効に治療する本発明の薬剤の量をいう。癌の場合、治療有効量の薬剤により、癌細胞数が減少し、腫瘍サイズが減少し、癌細胞の周辺組織への浸潤を阻害し(すなわち、拡大が幾らか遅延し、好ましくは停止する)、腫瘍の転移を阻害し(すなわち、拡大が幾らか遅延し、好ましくは停止する)、腫瘍成長の拡大を幾らか阻害し、そして/または癌に関連する1つまたは複数の症状の拡大をいくらか緩和することができる。薬剤が既存の癌細胞の成長を防止し、そして/または死滅させることができる範囲で、細胞増殖抑制性および/または細胞傷害性を示し得る。癌療法のために、有効性を、例えば、疾患の進行(TTP)の評価および/または応答率(RR)の決定によって測定することができる。
本発明の治療薬を、被験体自体に投与することができるか、薬学的に許容可能なキャリアと混合した薬学的組成物の一部として投与することができる。
本明細書中で使用される、「薬学的組成物」は、生理学的に適切なキャリアおよび賦形剤などの他の化学成分を含む本明細書中に記載の1つまたは複数の有効成分の調製物をいう。薬学的組成物の目的は、生物への化合物の投与を容易にすることである。
本明細書中に記載の用語「有効成分」は、生物学的効果を担う調製物をいう。
以後、交換可能に使用することができる句「生理学的に許容可能なキャリア」および「薬学的に許容可能なキャリア」は、生物に有意な炎症を引き起こさず、且つ生物活性およびおよび投与した化合物の性質を無効にしないキャリアまたは希釈剤をいう。アジュバントは、これらの句に含まれる。薬学的に許容可能なキャリアに含まれる成分の1つは、例えば、ポリエチレングリコール(PEG)(有機媒体および水性媒体の両方に広範な溶解性を示す生体適合ポリマー)であり得る(Mutter et al.(1979)。
本明細書中の用語「賦形剤」は、有効成分の投与をさらに容易にするために薬学的組成物に添加される不活性物質をいう。制限されない賦形剤の例には、炭酸カルシウム、リン酸カルシウム、種々の糖およびデンプン型、セルロース誘導体、ゼラチン、植物油、ならびにポリエチレングリコールが含まれる。
薬物の処方および投与技術を、"Remington’s Pharmaceutical Sciences," Mack Publishing Co.,Easton,PA,latest edition(本明細書中で参考として援用される)に見出すことができる。
適切な投与経路には、例えば、経口、直腸、経粘膜(特に、経鼻、腸)、または非経口送達(筋肉内、皮下、および脊髄内が含まれる)、および髄腔内、直接脳室内、静脈内、腹腔内、鼻腔内、または眼内注射が含まれる。あるいは、全身様式よりもむしろ、例えば、患者の身体の特定の領域への直接的な調製物の注射によって局所的に調製物を投与することができる。
本発明の薬学的組成物を、当該分野で周知のプロセス(例えば、従来の混合、溶解、顆粒化、ドラジェ作製、粉末化、乳化、カプセル化、捕捉、または凍結乾燥プロセス)によって製造することができる。
本発明で使用される薬学的組成物を、有効成分の薬学的に使用することができる調製物への処理を容易にする賦形剤および助剤を含む1つまたは複数の生理学的に許容可能なキャリアを使用した従来の様式で処方することができる。適切な処方物は、選択した投与経路に依存する。
注射のために、本発明の有効成分を、水溶液、好ましくは、ハンクス液、リンゲル液、または生理食塩水等の生理学的に適合可能な緩衝液中に処方することができる。経粘膜投与のために、透過すべき障壁に適切な浸透剤を処方に使用する。このような浸透剤は、当該分野で公知である。
経口投与のために、化合物を、活性化合物と当該分野で周知の薬学的に許容可能なキャリアとの組み合わせによって容易に処方することができる。このようなキャリアにより、本発明の化合物を、患者が経口摂取するための錠剤、丸薬、ドラジェ、カプセル、液体、ゲル、シロップ、および懸濁液などとして処方することができる。固体賦形剤を使用して経口用の薬理学的調製物を作製することができ、任意選択的に、得られた混合物を摩砕し、所望ならばその後適切な助剤を添加して顆粒混合物を処理し、錠剤またはドラジェコアを得ることができる。適切な賦形剤は、特に、糖(ラクトース、スクロース、マンニトール、またはソルビトールが含まれる)などの充填剤、例えば、トウモロコシデンプン、コムギデンプン、コメデンプン、ジャガイモデンプン、ゼラチン、トラガカントガム、メチルセルロース、ヒドロキシプロピルメチルセルロース、カルボメチルセルロースナトリウムなどのセルロース調製物、および/またはポリビニルピロリドン(PVP)などの生理学的に許容可能なポリマーである。所望ならば、架橋ポリビニルピロリドン、寒天、またはアルギン酸もしくはアルギン酸ナトリウムなどのその塩などの崩壊剤を添加することができる。
適切なコーティングを使用してドラジェコアが得られる。この目的のために、任意選択的に、アラビアゴム、タルク、ポリビニルピロリドン、カルボポールゲル、ポリエチレングリコール、二酸化チタン、ラッカー液、および適切な有機溶媒または溶媒混合物を含み得る濃縮糖溶液を使用することができる。活性化合物の用量の異なる組み合せの識別または特徴づけのために、錠剤またはドラジェコーティングに染料または色素を添加することができる。
経口で使用することができる薬学的組成物には、ゼラチンおよび軟ゼラチン製の押し込み型カプセル、ゼラチンおよび可塑剤(グリセロールまたはソルビトールなど)から作製された密閉カプセルが含まれる。押し込み型カプセルは、ラクトースなどの充填剤、デンプンなどの結合剤、タルクまたはステアリン酸マグネシウムなどの潤滑剤、および任意選択的に安定剤との混合物中に有効成分を含み得る。軟カプセルでは、有効成分を、脂肪油、液体パラフィン、または液体ポリエチレングリコール等の適切な液体中に溶解または懸濁することができる。さらに、安定剤を添加することができる。経口投与用の全処方物は、選択された投与経路に適切な投薬量であるべきである。
口内投与のために、組成物は、従来の様式で処方された錠剤またはロゼンジの形態をとることができる。
鼻孔吸入による投与のために、本発明で使用される有効成分を、適切な噴射剤(例えば、ジクロロジフルオロメタン、トリクロロフルオロメタン、ジクロロ−テトラフルオロエタン、または二酸化炭素)を使用した加圧パックまたは噴霧器由来のエアゾールスプレー調製物の形態で都合よく送達される。加圧エアゾールの場合、一定量を送達するためのバルブを設置することによって、投薬単位を決定することができる。化合物とラクトースまたはデンプン等の適切な粉末基剤との粉末混合物を含む、例えば、投薬用のゼラチンのカプセルおよび薬包を処方することができる。
本明細書中に記載の調製物を、例えば、ボーラス注射または持続注入による非経口投与のために処方することができる。注射用処方物は、任意選択的に防腐剤を添加した単位投薬形態(例えば、アンプルまたは複数回投与容器)で存在し得る。組成物は、油性または水性媒体の懸濁液、溶液、または乳濁液であってよく、懸濁剤、安定剤、および/または分散剤などの処方薬(formulatory agent)を含み得る。
非経口投与用の薬学的組成物には、水溶性形態の活性調製物水溶液が含まれる。さらに、有効成分の懸濁液を、適切な油性または水ベースの懸濁液として調製することができる。適切な親油性溶媒または媒体には、ゴマ油などの脂肪油またはオレイン酸エチル、トリグリセリド、またはリポソーム等の合成脂肪酸エステルが含まれる。注射用水性懸濁液は、カルボキシメチルセルロースナトリウム、ソルビトール、またはデキストランなどの懸濁液の粘度を増加させる物質を含み得る。任意選択的に、懸濁液はまた、高度に濃縮された溶液を調製するために有効成分の溶解性を増加させる適切な安定剤または薬剤を含み得る。
あるいは、有効成分は、使用前に、適切な媒体(例えば、滅菌した無発熱物質ベースの溶液)で構成するための粉末形態であり得る。
本発明の調製物を、例えば、ココアバターまたは他のグリセリドなどの従来の座剤の基剤を使用した座剤または保留浣腸などの直腸組成物で処方することもできる。
本発明の状況での使用に適切な薬学的組成物には、意図する目的を達成するための有効量の有効成分を含む組成物が含まれる。より詳細には、治療有効量は、疾患の症状を予防、緩和、または改善するか、治療を受ける被験体の生存を延長するのに有効な有効成分の量を意味する。
治療有効量の決定は、十分に当業者の能力の範囲内である。
本発明の方法で使用された任意の調製物のために、治療有効量または用量を、最初にin vitroアッセイから評価することができる。例えば、用量を動物モデルで決定し、このような情報を使用してヒトで有用な用量をより正確に決定することができる。
本明細書中に記載の有効成分の毒性および治療有効性を、in vitroでの標準的な薬学的手順、細胞培養、または実験動物によって決定することができる。これらのin vitroアッセイおよび細胞培養アッセイならびに動物研究から得たデータを、ヒトで用いる投薬量範囲の決定で使用することができる。投薬量は、使用した投薬形態および使用した投与経路によって変化し得る。正確な処方物、投与経路、および投薬量を、患者の状態を考慮して各医師が選択することができる(例えば、Fingl,et al.,1975,in "The Pharmacological Basis of Therapeutics",Ch.1 p.1を参照のこと)。
治療すべき容態の重症度および応答性に依存して、投与は、単回投与または複数回投与であり、数日から数週間または治癒するか病態の軽減が達成されるまで治療が続けることができる。
組成物の投与量は、勿論、治療を受ける被験体、苦痛の重症度、投与様式、主治医の判断に依存する。
適合可能な薬学的キャリア中に処方された本発明の調製物を含む組成物を、適用される病態の治療のために調製し、適切なキャリア中に配置し、ラベルをつけることができる。
本発明の薬学的組成物を、所望ならば、有効成分を含む1つまたは複数の単位投薬形態を含み得るFDA承認キットなどのパックまたは分注デバイス中に入れることができる。パックは、例えば、金属箔またはプラスチック箔を含み得る(ブリスターパックなど)。パックまたは分注器を、政府機関による製造、医薬品の使用または販売に関する規制にしたがって処方された形態で容器に付随する通知に適合させることもでき、通知は、組成物の形態またはヒトもしくは動物への投与についての政府による承認を反映する。このような通知は、例えば、薬物の処方について米国食品医薬品局によって承認された表示または承認された製品の挿入物であり得る。
免疫原性組成物
本発明の治療薬は、任意選択的に、被験体における本発明のポリペプチドの少なくとも1つに対する特異的免疫原性応答を促進する分子であり得る。分子は、本発明のポリペプチド変異型、これに由来するフラグメント、またはこれをコードする核酸配列であり得る。このような分子を被験体自身に投与することができるが、薬剤を、免疫原性組成物中で免疫賦活剤と共に投与することが好ましい。免疫賦活剤は、外因性抗原に対する免疫応答(抗体および/または細胞媒介性)を増強または強化する任意の物質であり得る。免疫賦活剤の例には、化合物が組み込まれるアジュバント、生分解性ミクロスフィア(例えば、ポリ乳酸ガラクチド)、およびリポソームが含まれる(例えば、米国特許第4,235,877号を参照のこと)。ワクチン調製物は、一般に、例えば、M.F.Powell and M.J.Newman,eds.,"Vaccine Design(the subunit and adjuvant approach),"Plenum Press(NY,1995)に記載されている。
例示的免疫原性組成物は、ポリペプチドがin situで生成するように、1つまたは複数の上記のポリペプチドをコードするDNAを含み得る。DNAは、当業者に公知の任意の種々の送達系(核酸発現系(以下を参照のこと)、細菌およびウイルス発現系が含まれる)に存在し得る。多数の遺伝子送達技術(Rolland,Crit.Rev.Therap.Drug Carrier Systems 15:143−198,1998およびその参考文献に記載のものなど)が当該分野で周知である。適切な核酸発現系は、被験体中での発現に必要なDNA配列(適切なプロモーターおよび終結シグナルなど)を含む。細菌送達系は、その細胞表面上のポリペプチドの免疫原性部分を発現するか、このようなエピトープを分泌する細菌(カルメット・ゲラン菌など)の投与を含む。好ましい実施形態では、DNAを、ウイルス発現系(例えば、ワクシニアもしくは他のポックスウイルス、レトロウイルス、またはアデノウイルス)を使用して移入することができ、非病原性(欠損)複製コンピテントウイルスの使用を含み得る。適切な系は、例えば、Fisher−Hoch et al.,Proc.Natl.Acad.Sci.USA 86:317−321,1989;Flexner et al.,Ann.N.Y Acad.Sci.569:86−103,1989;Flexner et al.,Vaccine 8:17−21,1990;米国特許第4,603,112、同第4,769,330号、および同第5,017,487号、WO 89/01973;米国特許第4,777,127号;英国特許第2,200,651号;欧州特許第0,345,242号;WO91/02805;Berkner,Biotechniques 6:616−627,1988;Rosenfeld et al.,Science 252:431−434,1991;Kolls et al.,Proc.Natl.Acad.Sci.USA 91:215−219,1994;Kass−Eisler et al.,Proc.Natl.Acad.Sci.USA 90:11498−11502,1993;Guzman et al.,Circulation 88:2838−2848,1993;およびGuzman et al.,Cir.Res.73:1202−1207,1993に開示されている。DNAをこのような発現系に組み込む技術は、当業者に周知である。例えば、Ulmer et al.,Science 259:1745−1749,1993に記載され、Cohen,Science 259:1691−1692,1993に概説されるように、DNAを、「裸にする」こともできる。裸のDNAの取り込みを、生分解性ビーズにDNAをコーティングし、細胞に有効に輸送することによって増加させることができる。
免疫原性組成物がポリヌクレオチド成分およびポリペプチド成分の両方を含むことができることが認識される。このような免疫原性組成物は、免疫応答を増強することができる。
任意の種々の免疫賦活剤を、本発明の免疫原性組成物で使用することができる。例えば、アジュバントを含むことができる。ほとんどのアジュバントは、急速な代謝から抗原を保護するためにデザインされた物質(水酸化アルミニウムまたは鉱物油)および免疫応答の刺激物質(脂質A、百日咳菌または結核菌由来のタンパク質など)を含む。適切なアジュバントは、例えば、フロイントの不完全アジュバントおよび完全アジュバント(Difco Laboratories,Detroit,Mich.)、Merckアジュバント65(Merck and Company,Inc.,Rahway,N.J.)、AS−2(SmithKline Beecham,Philadelphia,Pa.)、水酸化アルミニウムゲル(ミョウバン)またはリン酸アルミニウムなどのアルミニウム塩、カルシウム塩、鉄、または亜鉛の塩、アシル化チロシンの不溶性懸濁液、アシル化糖、カチオン性またはアニオン性誘導多糖類、ポリホスファゼン、生分解性ミクロスフィア、モノホスホリル脂質AおよびquiAとして市販されている。GM−CSFまたはインターロイキン−2、−7、もしくは−12などのサイトカインもアジュバントとして使用することができる。
アジュバント組成物を、Th1型の免疫応答を支配的に誘導するようにデザインすることができる。高レベルのTh1型サイトカイン(例えば、IFN−γ、TNF−α、IL−2、およびIL−12)は、投与した抗原に対して細胞性免疫応答を誘導する傾向がある。対照的に、高レベルのTh2型サイトカイン(例えば、IL−4、IL−5、IL−6、およびIL−10)は体液性免疫を誘導する傾向がある。本明細書中に記載の免疫原性組成物の適用後、被験体は、Th1型応答およびTh2型応答を誘導する免疫応答を支持する。これらのサイトカインのレベルを、標準的なアッセイを使用して容易に評価することができる。サイトカインファミリーの概説については、Mosmann and Coffinan,Ann.Rev.Immunol.7:145−173,1989を参照のこと。
Th1型応答の支配的な誘発で用いる好ましいアジュバントには、例えば、モノホスホリル脂質A(好ましくは、3−de−Oアシル化モノホスホリル脂質A(3D−MPL))とアルミニウム塩との組み合わせが含まれる。MPLアジュバントは、Corixa Corporationから市販されている(Seattle,Wash.、米国特許第4,436,727号、同第4,877,611号、同第4,866,034号、および同第4,912,094号を参照のこと)。CpG含有オリゴヌクレオチド(CpGジヌクレオチドが非メチル化されている)もTh1応答を支配的に誘導する。このようなオリゴヌクレオチドは当該分野で周知であり、例えば、WO96/02555号、WO 99/33488号、ならびに米国特許第6,008,200号および同第5,856,462号に記載されている。免疫促進性DNA配列はまた、例えば、Sato et al.,Science 273:352,1996に記載されている。別の好ましいアジュバントはサポニン(好ましくは、QS21(Aquila Biopharmaceuticals Inc.,Framingham,Mass.))であり、これは、単独または他のアジュバントと組み合わせて使用することができる。例えば、増強された系は、モノホスホリル脂質Aとサポニン誘導体との組み合わせ(WO 94/00153に記載のQS21と3D−MPLとの組み合わせまたはWO 96/33739号に記載のQ21がコレステロールで抑制されたより反応性の低い組み合わせなど)を含む。他の好ましい処方物は、水中油滴型乳濁液およびトコフェロールを含む。QS21、3D−MPL、およびトコフェロールを含む水中油滴型乳濁液を含む特に強力なアジュバント処方物は、WO 95/17210号に記載されている。
他の好ましいアジュバントには、Montanide ISA 720(Seppic,France)、SAF(Chiron,Calif.,United States)、ISCOMS(CSL)、MF−59(Chiron)、SBASシリーズのアジュバント(例えば、SmithKline Beecham,Rixensart,Belgiumから市販されているSBAS−2またはSBAS−4)、Detox(Corixa,Hamilton,Mont.)、RC−529(Corixa,Hamilton,Mont.)、および他のアミノアルキルグルコサミニド四リン酸(AGP)(係属中の米国特許出願番号08/853,826号および同第09/074,720号に記載のものなど)が含まれる。
送達体(delivery vehicle)を本発明の免疫原性組成物内で使用して、腫瘍細胞をターゲティングする抗原特異的免疫応答を容易にすることができる。送達体には、抗原提示細胞(APC)(樹状細胞、マクロファージ、B細胞、単球など)およびAPCを効率的にするように操作することができる他の細胞が含まれる。このような細胞を、抗原提示能力を増加させ、活性化および/またはT細胞応答の維持を改良し、それ自体が抗腫瘍効果を有し、そして/またはレシーバと免疫学的に適合するように遺伝子操作することができる。APCを、一般に、任意の種々の生体液(腫瘍および腫瘍周辺組織が含まれる)から単離することができ、これらは、自系細胞、同種異型細胞、同系細胞、または異種細胞であり得る。
樹状細胞は、非常に強力なAPCであり(Banchereau and Steinman,Nature 392:245−251,1998)、予防的または治療的抗腫瘍免疫を誘発するための生理学的アジュバントとして有効であることが示されている(Timmernan and Levy,Ann.Rev.Med.50:507−529,1999を参照のこと)。一般に、樹状細胞を、その典型的な形状(in situで星形、in vitroで認められる際立った細胞質突起(樹状突起))、効率の良い抗原の取り込み、処理、および提示能力、ならびにナイーブT細胞応答を活性化する能力に基づいて同定することができる。樹状細胞を、勿論、in vivoまたはex vivoにて樹状細胞上で一般に見出されない特異的な細胞表面受容体またはリガンドを発現するように操作することができ、このような修飾樹状細胞は、本発明で意図される。樹状細胞の代わりとして、分泌性小胞である抗原負荷樹状細胞(エキソソームと呼ばれる)を、免疫原性組成物内で使用することができる(Zitvogel et al.,Nature Med.4:594−600,1998を参照のこと)。
樹状細胞および前駆体を、末梢血、骨髄、腫瘍浸潤細胞、腫瘍周辺組織浸潤細胞、リンパ節、脾臓、皮膚、臍帯血、または任意の他の適切な組織もしくは流動物から得ることができる。例えば、末梢血から採取した単球の培養物へのGM−CSF、IL−4、IL−13、および/またはTNFαなどのサイトカインの組み合わせの添加によって、樹状細胞をex vivoで分化させることができる。あるいは、末梢血、臍帯血、または骨髄から採取したCD34陽性細胞を、培養液へのGM−CSF、IL−13、TNFα、CD40リガンド、LPS、flt3リガンド、および/または樹状細胞の分化、成熟、および増殖を誘導する他の化合物の組み合わせの添加によって樹状細胞に分化させることができる。
樹状細胞を、「未熟」細胞および「成熟」細胞に分類し、これらは、簡単な方法によって2つの十分に特徴づけられた表現型に区別される。未熟樹状細胞は、高い抗原の取り込みおよび処理能力を有するAPCとして特徴づけられ、この能力は高いFcy受容体およびマンノース受容体発現と相関する。成熟表現型は、典型的には、これらのマーカーの発現はより低いが、クラスIおよびクラスII MHCなどのT細胞活性化を担う細胞表面分子、接着分子(例えば、CD54およびCD11)、ならびに共起刺激分子(例えば、CD40、CD80、CD86、および4−1BB)の発現は高いことを特徴とする。
APCを、一般に、変異型IIまたはその免疫原性部分が細胞表面上に発現するように、本発明のポリペプチドをコードする少なくとも1つのポリヌクレオチドでトランスフェクトすることができる。このようなトランスフェクションはex vivoで起こる可能性があり、本明細書中に記載のように、このようなトランスフェクトされた細胞を含む組成物を、治療目的のために使用することができる。あるいは、樹状細胞または他の抗原提示細胞をターゲティングする遺伝子送達体を被験体に投与し、in vivoでトランスフェクションを起こすことができる。例えば、樹状細胞のin vivoおよびex vivoトランスフェクションを、当該分野で公知の任意の方法(WO 97/24447号に記載の方法またはMahvi et al.,Immunology and cell Biology 75:456−460,1997に記載の遺伝子銃アプローチなど)を使用して行うことができる。樹状細胞または前駆細胞と本発明のポリペプチド、DNA(裸またはプラスミドベクター内)もしくはRNAまたは抗原発現組換え細菌もしくはウイルス(例えば、ワクシニア、鶏痘ウイルス、アデノウイルス、またはレンチウイルスのベクター)とのインキュベーションによって、樹状細胞の抗原負荷を行うことができる。負荷前に、ポリペプチドを、免疫学的パートナーに共有結合させて、上記などのT細胞ヘルプ(例えば、キャリア分子)を得ることができる。あるいは、樹状細胞を、個別またはポリペプチドの存在下で、非抱合免疫学的パートナーでパルスすることができる。
明確にするために個別の実施形態に記載した本発明の一定の特徴を1つの実施形態に組み合わせて提供することもできることが認識される。逆に、明確にするために1つの実施形態に記載した本発明の種々の特徴を、個別または任意の適切なサブコンビネーション中に提供することもできる。
本発明をその特定の実施形態と組み合わせて記載しているが、多数の変更形態、修正形態、および変形形態が当業者に自明であることが明白である。したがって、添付の特許請求の範囲の精神および範囲内に含まれるこのような全ての変更形態、修正形態、および変形形態が含まれることが意図される。本明細書中に記載の全ての刊行物、特許、および特許出願は、それぞれ刊行物、特許、および特許出願が具体的且つ個別に本明細書中で参考として援用されることが示されるのと同一の範囲でその全体が本明細書中で参考として援用される。さらに、本明細書中の任意の引例を引用および同定することにより、このような引例が本発明の先行技術として利用可能であると解釈されるべきではない。
癌バイオマーカー選択エンジンおよびウェットバリデーション(wet validation)段階の概要のまとめを示す図である。 固有の配列領域の有無に基づいた所与のコンティグの転写物の分類を示す略図である。 定量的実時間PCR分析の概要のまとめを示す図である。 オリゴヌクレオチドベースのマイクロアレイ作製についての略図である。 オリゴヌクレオチドベースのマイクロアレイ実験の流れの概要のまとめを示す図である。 脳悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターH61775についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常および癌性肺組織における配列名H61775seg8中に示された、アンプリコンによって検出可能な免疫グロブリンスーパーファミリーのメンバー9の変異型の転写物(H61775転写物)の発現を示すヒストグラムである。 異なる正常組織における配列名配列名H61775seg8中に示された、アンプリコンによって検出可能な免疫グロブリンスーパーファミリーのメンバー9のH61775転写物の発現を示すヒストグラムである。 上皮悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターM85491についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名M85491seg24中に示された、アンプリコンによって検出可能な上記EphrinB型受容体2前駆体M85491転写物の過剰発現を示すヒストグラムである。 異なる正常組織における配列名M85491seg24中に示された、アンプリコンによって検出可能なEphrinB型受容体2前駆体(チロシン−タンパク質キナーゼ受容体EPH−3)M85491転写物の発現を示すヒストグラムである。 肝臓癌、肺悪性腫瘍、および膵臓癌において過剰発現を示す、クラスターT39971についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターZ21368についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名Z21368junc17−21中に示された、アンプリコンによって検出可能な細胞外スルファターゼSulf−1Z21368転写物の過剰発現を示すヒストグラムである。 異なる正常組織における配列名Z21368junc17−21中に示された、アンプリコンによって検出可能な細胞外スルファターゼSulf−1Z21368転写物の発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名Z21368seg39中に示された、アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1(Z21368転写物)の過剰発現を示すヒストグラムである。 異なる正常組織における配列名Z21368seg39中に示された、アンプリコンによって検出可能なSUL1_HUMAN−細胞外スルファターゼSulf−1(Z21368転写物)の発現を示すヒストグラムである。 異なる正常組織における配列名Z44808junc8−11中に示された、アンプリコンによって検出可能なSMO2_HUMAN SPARC関連モジュラーカルシウム結合タンパク質2受容体(分泌性モジュラーカルシウム結合タンパク質2)(SMOC−2)(平滑筋関連タンパク質2)Z44808転写物の発現を示すヒストグラムである。 正常サンプルと比較したいくつかの癌性肺サンプルにおける配列名HUMGRP5Ejunc3−7中に示された、アンプリコンによって検出可能なガストリン放出ペプチド(HUMGRP5E)転写物の過剰発現を示すヒストグラムである。 異なる正常組織における配列名HUMGRP5Ejunc3−7中に示された、アンプリコンによって検出可能なガストリン放出ペプチド(HUMGRP5E)転写物の発現を示すヒストグラムである。 子宮悪性脳腫瘍において過剰発現を示す、クラスターF05068についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 結腸直腸癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性脳腫瘍、および膵臓癌において過剰発現を示す、クラスターH14624についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 移行上皮癌、脳悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および胃癌において過剰発現を示す、クラスターH38804についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性腫瘍および肺悪性腫瘍において過剰発現を示す、クラスターHSENA78についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 脳悪性腫瘍、結腸直腸癌、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターHUMODCAについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 肺悪性腫瘍において過剰発現を示す、クラスターR00299についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 肺悪性腫瘍、悪性乳癌、および膵臓癌において過剰発現を示す、クラスターZ41644についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 結腸直腸癌、肺癌、および膵臓癌において過剰発現を示す、クラスターZ44808についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名Z44808junc8−11中に示された、アンプリコンによって検出可能なSMO2_HUMANSPARC関連モジュラーカルシウム結合タンパク質2Z44808転写物の過剰発現を示すヒストグラムである。 悪性脳腫瘍、上皮悪性腫瘍、および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターAA161187についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 悪性脳腫瘍および異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターAA161187についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 悪性骨腫瘍、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および肺悪性腫瘍において過剰発現を示す、クラスターHUMCA1XIAについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターHUMCEAについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 肝細胞癌において過剰発現を示す、クラスターR35137についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 悪性脳腫瘍、異なる組織由来の悪性腫瘍の混合物、および卵巣癌において過剰発現を示す、クラスターZ25299についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名Z25299junc13−14−21中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の下方制御を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名Z25299seg20中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の下方制御を示すヒストグラムである。 移行上皮癌、上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および膵臓癌において過剰発現を示す、クラスターHSSTROL3についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名HSSTROL3seg24中に示された、アンプリコンによって検出可能なストロメリシン−3HSSTROL3転写物の過剰発現を示すヒストグラムである。 異なる正常組織における配列名HSSTROL3seg24中に示された、アンプリコンによって検出可能なストロメリシン−3HSSTROL3転写物の発現を示すヒストグラムである。 異なる組織由来の悪性腫瘍の混合物、悪性乳癌、膵臓癌、および前立腺癌において過剰発現を示す、クラスターHUMTREFACについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターHSS100PCBについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 異なる組織由来の悪性腫瘍の混合物において過剰発現を示す、クラスターHSU33147についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物および悪性肺腫瘍において過剰発現を示す、クラスターR20779についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性腫瘍、肺悪性腫瘍、皮膚悪性腫瘍、および胃癌において過剰発現を示す、クラスターR38144についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、肺悪性腫瘍、悪性乳癌、卵巣癌、および皮膚悪性腫瘍において過剰発現を示す、クラスターHUMOSTROについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および腎臓悪性腫瘍において過剰発現を示す、クラスターHUMOSTROについての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名R11723seg13中に示された、アンプリコンによって検出可能なR11723転写物の過剰発現を示すヒストグラムである。 異なる正常組織における配列名R11723seg13中に示された、アンプリコンによって検出可能なR11723転写物の発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名R11723junc11−18中に示された、アンプリコンによって検出可能なR11723転写物の過剰発現を示すヒストグラムである。 悪性肺腫瘍において過剰発現を示す、クラスターR16276についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける6つの配列H61775seg8、HUMGRP5Ejunc3−7、M85491Seg24、Z21368junc17−21、HSSTROL3seg24、およびZ25299seg20の異なる発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける6つの配列H61775seg8、HUMGRP5Ejunc3−7、M85491Seg24、Z21368junc17−21、HSSTROL3seg24、およびZ25299seg20の異なる発現を示すヒストグラムである。 配列番号1480のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるトロフィニン関連タンパク質(タスチン)[T86235]変異型(例えば、変異型番号23〜26、31、32)の相対発現を示すヒストグラムである。 配列番号1512〜1514に詳述のオリゴを使用したマイクロアレイ分析によって決定した、正常および腫瘍由来の肺サンプルにおけるトロフィニン関連タンパク質(タスチン)[T86235]変異型(例えば、変異型番号8〜10、22、23、26、27、29〜31、33)の相対発現を示すヒストグラムである。 配列番号1517のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるHomeoボックスC10(HOXC10)[N31842]変異型(例えば、変異型番号3)の相対発現を示すヒストグラムである。 配列番号1529のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおける核小体タンパク質4(NOL4)[T06014]変異型(例えば、変異型番号3、11、12)の相対発現を2つの異なる尺度で示すヒストグラムである。図56aは、尺度0〜1200での結果を示す。 図56bは、尺度0〜24での結果を示す。 配列番号1532のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおける核小体タンパク質4(NOL4)[T06014]変異型(例えば、変異型番号3、11、12)の相対発現を2つの異なる尺度で示すヒストグラムである。図57aは、尺度0〜2000での結果を示す。 図57bは、尺度0〜42での結果を示す。 配列番号1558のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるAA281370変異型(例えば、変異型番号0、1、4、および5)の相対発現を示すヒストグラムである。 配列番号1574のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるスルファターゼ1(SULF1)−[Z21368]変異型(例えば、変異型番号13および14)の相対発現を示すヒストグラムである。 配列番号1594のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるSRY(性決定領域Y)−ボックス2(SOX2))−[HUMHMGBOX]変異型(例えば、変異型番号0)の相対発現を示すヒストグラムである。 配列番号1600のプライマーを使用した実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおけるプラコフィリン1(外胚葉異形成/表皮水疱症候群)(PKP−1)−[HSB6PR]変異型(例えば、変異型番号0、5、および6)の相対発現を示すヒストグラムである。 実時間PCRによって決定した、正常および腫瘍由来の肺サンプルにおける配列番号1480、1517、1529、1532、1558、1574、1594、1600、1616、1619、1622、1625によって検出可能な転写物の相対発現を示すヒストグラムである。 本発明のAA281370肺癌バイオマーカーとMAPKシグナル伝達経路に関与する種々のタンパク質のWD40ドメインとの間の類似性を示す、NCBI BLASTデフォルトパラメーターを使用したアミノ酸配列アラインメントを示す図である。図63a:配列番号99のAA281370ポリペプチドの40〜790位のアミノ酸がマウスMapkbp1タンパク質(gi|47124622)と75%相同である。 本発明のAA281370肺癌バイオマーカーとMAPKシグナル伝達経路に関与する種々のタンパク質のWD40ドメインとの間の類似性を示す、NCBI BLASTデフォルトパラメーターを使用したアミノ酸配列アラインメントを示す図である。図63b:配列番号99のAA281370ポリペプチドの40〜886位のアミノ酸がJNK結合タンパク質JNKBP1(gi|34856717)と70%相同である。 正常サンプルと比較した癌性肺サンプルにおける配列名AA161187seg25中に示された、アンプリコンによって検出可能なホモ・サピエンスプロテアーゼセリン21(テスティシン(testisin))(PRSS21)AA161187転写物の過剰発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名M62069seg19中に示された、アンプリコンによって検出可能なタンパク質であるチロシンホスファターゼ受容体S型(PTPRS)M62069転写物の過剰発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名M62069seg29中に示された、アンプリコンによって検出可能なタンパク質であるチロシンホスファターゼ受容体S型(PTPRS)M62069転写物の過剰発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名HUMCA1X1Aseg55中に示された、アンプリコンによって検出可能な上記ホモ・サピエンスコラーゲンXI型α1(COL11A1)転写物の過剰発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名Z25299seg23中に示された、アンプリコンによって検出可能なホモ・サピエンス分泌性白血球プロテアーゼインヒビター(抗ロイコプロテイナーゼ)(SLPI)Z25299転写物の下方制御を示すヒストグラムである。 異なる正常組織における配列名Z25299seg20中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示すヒストグラムである。 異なる正常組織における配列名Z25299seg23中に示された、アンプリコンによって検出可能な分泌性白血球プロテアーゼインヒビターである酸安定性プロテイナーゼインヒビターZ25299転写物の発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名HSSTROL3seg20−2中に示された、アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)(HSSTROL3)転写物の過剰発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名HSSTROL3junc21−27中に示された、アンプリコンによって検出可能なホモ・サピエンスマトリクス金属プロテイナーゼ11(ストロメリシン3)(MMP11)(HSSTROL3)転写物の過剰発現を示すヒストグラムである。 異なる正常組織における配列名R11723junc11−28中に示された、アンプリコンによって検出可能なR11723転写物の発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名H53626junc24−27F1R3中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様(like)1(FGFRL1)H53626転写物の過剰発現を示すヒストグラムである。 正常サンプルと比較した癌性肺サンプルにおける配列名H53626seg25中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示すヒストグラムである。 上皮悪性腫瘍、異なる組織由来の悪性腫瘍の混合物、および筋肉腫において過剰発現を示す、クラスターH53626についての癌および細胞株の発現対正常組織発現を示すヒストグラムである。 異なる正常組織における配列名H53626seg25中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示すヒストグラムである。 異なる正常組織における配列名H53626juncc24−27F1R3中に示された、アンプリコンによって検出可能なホモ・サピエンス線維芽細胞成長因子受容体様1(FGFRL1)H53626転写物の発現を示すヒストグラムである。 PSEC R11723_PEA_1 T5 PCR産物を示す図である。レーン1:PCR産物、レーン2:Low DNA Mass Ladder MWマーカー(Invitrogen Cat# 10068−013)。 PSEC R11723_PEA_1 T5 PCR産物配列を示す図である。赤色−PSEC順方向プライマー、青色−PSEC逆相補配列、強調した配列−PSEC変異型R11723_PEA_1 T5 ORF。 NheIおよびHindIIIで消化したPRSEC PCR産物を示す図である。レーン1−PRSET PCR産物、レーン2−Fermentas GeneRuler 1Kb DNAラダー番号SM0313。 His PSEC T5 pRSETAのプラスミドマップを示す図である。 PSEC変異型R11723_PEA_1 T5のタンパク質配列を示す図である。赤色−6Hisタグ、青色−PSEC。 HisPSEC T5 pRSETAのDNA配列を示す図である。太字− HisPSEC T5読み取り枠、斜体−配列分析によって検証した隣接DNA配列。 組換えHisPSEC変異型R11723_PEA_1 T5のウェスタンブロット分析を示す図である。レーン1:分子量マーカー(ProSieve color,Cambrex,Cat #50550)、レーン2:HisPSEC T5 pRSETA T0、レーン3:His HisPSEC T5 pRSETA T3、レーン4:His HisPSEC T5 pRSETA To.n、レーン5:pRSET空ベクターT0(ネガティブコントロール)、レーン6:pRSET空ベクターT3(ネガティブコントロール)、レーン7:pRSET空ベクターTo.n(ネガティブコントロール)、レーン8:Hisポジティブコントロールタンパク質(HisTroponinT7 pRSETA T3)。

Claims (26)

  1. R11723_PEA_1_T5の配列を有するポリヌクレオチドを含む単離ポリヌクレオチド。
  2. R11723_PEA_1_node_13の配列を有するノードを含む、請求項1に記載の単離ポリヌクレオチド。
  3. R11723_PEA_1_P13の配列を有するポリペプチドを含む単離ポリペプチド。
  4. Q96AC2のアミノ酸1〜63に対応し、R11723_PEA_1_P13のアミノ酸1〜63にも対応するMWVLGIAATFCGLFLLPGFALQIQCYQCEEFQLNNDCSSPEFIVNCTVNVQDMCQKEVMEQSAと少なくとも95%相同である第1のアミノ酸配列と、R11723_PEA_1_P13のアミノ酸64〜84に対応する配列DTKRTNTLLFEMRHFAKQLTTを有するポリペプチドと少なくとも約95%相同である第2のアミノ酸配列とを含み、前記第1のアミノ酸配列及び前記第2のアミノ酸配列が隣接し、且つ配列順にある、R11723_PEA_1_P13をコードするキメラポリペプチドを含む、請求項3に記載の単離物。
  5. R11723_PEA_1_P13中の配列DTKRTNTLLFEMRHFAKQLTTと少なくとも約95%相同であるポリペプチドを含むR11723_PEA_1_P13のテールを含む、請求項4に記載の単離ポリペプチド。
  6. 配列番号1684のアンプリコンを含む、請求項1に記載の単離オリゴヌクレオチド。
  7. 請求項5のアンプリコンを増幅することができる単離オリゴヌクレオチド対を含む、プライマー対。
  8. 配列番号1682及び1683の単離オリゴヌクレオチド対を含む、請求項6に記載のプライマー対。
  9. 請求項3に記載のアミノ酸配列のエピトープに特異的に結合することができる抗体。
  10. 前記アミノ酸配列が請求項4に記載のテールを含む、請求項8に記載の抗体。
  11. 前記抗体が、前記エピトープを有するスプライス変異体と対応する公知のタンパク質PSECとを識別することができる、請求項8に記載の抗体。
  12. 請求項1に記載のスプライス変異体の過剰発現を検出する、肺癌検出用キット。
  13. 前記キットがNATベースのテクノロジーを含む、請求項11に記載のキット。
  14. 前記キットが、請求項1に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのプライマー対を更に含む、請求項11に記載のキット。
  15. 前記キットが、請求項1に記載の核酸配列に選択的にハイブリッド形成することができる少なくとも1つのオリゴヌクレオチドを更に含む、請求項11に記載のキット。
  16. 請求項3に記載のスプライス変異体の過剰発現を検出するキットを含み、前記キットが請求項8に記載の抗体を含む、肺癌検出用キット。
  17. 前記キットが、ELISA又はウェスタンブロットの実施のための少なくとも1つの試薬を更に含む、請求項12に記載のキット。
  18. 請求項1に記載のスプライス変異体の過剰発現を検出する工程を含む、肺癌の検出方法。
  19. 前記過剰発現の検出を、NATベースのテクノロジーを使用して実施する、請求項14に記載の方法。
  20. 請求項3に記載のスプライス変異体の過剰発現を検出する工程を含み、前記過剰発現の検出を、イムノアッセイを使用して実施する、肺癌の検出方法。
  21. 前記イムノアッセイが、請求項8に記載の抗体を含む、請求項16に記載の方法。
  22. 請求項1に記載の核酸配列若しくはそのフラグメント又は請求項3に記載のアミノ酸配列若しくはそのフラグメントを含む、肺癌を検出することができるバイオマーカー。
  23. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程を含む、肺癌のスクリーニング方法。
  24. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程を含む、肺癌の診断方法。
  25. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程を含む、疾患の進行及び/又は治療有効性及び/又は肺癌の再発をモニタリングする方法。
  26. 請求項18に記載のバイオマーカーで肺癌細胞を検出する工程と、前記検出によって治療を選択する工程とを含む、肺癌治療の選択方法。
JP2007519922A 2004-01-27 2005-01-27 肺癌診断のための新規のヌクレオチド配列およびアミノ酸配列、ならびにそのアッセイおよび使用方法 Pending JP2008507261A (ja)

Applications Claiming Priority (32)

Application Number Priority Date Filing Date Title
US53912804P 2004-01-27 2004-01-27
US53912904P 2004-01-27 2004-01-27
US58981504P 2004-07-22 2004-07-22
US60730704P 2004-09-07 2004-09-07
US62065604P 2004-10-22 2004-10-22
US62100404P 2004-10-22 2004-10-22
US62087404P 2004-10-22 2004-10-22
US62091804P 2004-10-22 2004-10-22
US62085304P 2004-10-22 2004-10-22
US62091704P 2004-10-22 2004-10-22
US62092404P 2004-10-22 2004-10-22
US62097404P 2004-10-22 2004-10-22
US62086804P 2004-10-22 2004-10-22
US62067704P 2004-10-22 2004-10-22
US62091604P 2004-10-22 2004-10-22
US62097504P 2004-10-22 2004-10-22
US62105304P 2004-10-25 2004-10-25
US62113104P 2004-10-25 2004-10-25
US62810104P 2004-11-17 2004-11-17
US62814504P 2004-11-17 2004-11-17
US62815604P 2004-11-17 2004-11-17
US62812304P 2004-11-17 2004-11-17
US62811104P 2004-11-17 2004-11-17
US62816704P 2004-11-17 2004-11-17
US62817804P 2004-11-17 2004-11-17
US62825104P 2004-11-17 2004-11-17
US62818904P 2004-11-17 2004-11-17
US62811204P 2004-11-17 2004-11-17
US62813404P 2004-11-17 2004-11-17
US63407504P 2004-12-08 2004-12-08
US11/051,720 US7569662B2 (en) 2004-01-27 2005-01-27 Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of lung cancer
PCT/IB2005/004037 WO2006131783A2 (en) 2004-01-27 2005-01-27 Polynucleotides, polypeptides, and diagnosing lung cancer

Publications (2)

Publication Number Publication Date
JP2008507261A true JP2008507261A (ja) 2008-03-13
JP2008507261A5 JP2008507261A5 (ja) 2008-04-24

Family

ID=37450522

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007519922A Pending JP2008507261A (ja) 2004-01-27 2005-01-27 肺癌診断のための新規のヌクレオチド配列およびアミノ酸配列、ならびにそのアッセイおよび使用方法

Country Status (5)

Country Link
EP (1) EP1774046A4 (ja)
JP (1) JP2008507261A (ja)
AU (1) AU2005320352A1 (ja)
CA (1) CA2555509A1 (ja)
WO (1) WO2006131783A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101403019B1 (ko) 2013-02-25 2014-06-03 서울대학교산학협력단 폐암 진단용 마커

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006063462A1 (en) 2004-12-13 2006-06-22 Alethia Biotherapeutics Inc. Polynucleotides and polypeptide sequences involved in the process of bone remodeling
BRPI0917592B1 (pt) 2008-12-09 2021-08-17 Genentech, Inc Anticorpo anti-pd-l1, composição, artigos manufaturados e usos de uma composição
CN114804550B (zh) * 2022-06-10 2023-06-02 安徽新宇环保科技股份有限公司 一种基于神经网络模型的污水处理调控系统
CN115894942B (zh) * 2022-11-07 2024-01-12 同济大学 聚己内酯修饰的超支化梳型聚赖氨酸及应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002004514A2 (en) * 2000-07-11 2002-01-17 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2002086443A2 (en) * 2001-04-18 2002-10-31 Protein Design Labs, Inc Methods of diagnosis of lung cancer, compositions and methods of screening for modulators of lung cancer
WO2003037267A2 (en) * 2001-10-29 2003-05-08 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2003097666A2 (en) * 2002-05-16 2003-11-27 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU8623198A (en) * 1997-08-14 1999-03-08 Novo Nordisk A/S Antimicrobial composition containing a haloperoxidase, a hydrogen peroxide source, a halide source and an ammonium source
AU2002322280A1 (en) * 2001-06-21 2003-01-21 Millennium Pharmaceuticals, Inc. Compositions, kits, and methods for identification, assessment, prevention, and therapy of breast cancer

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002004514A2 (en) * 2000-07-11 2002-01-17 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2002086443A2 (en) * 2001-04-18 2002-10-31 Protein Design Labs, Inc Methods of diagnosis of lung cancer, compositions and methods of screening for modulators of lung cancer
WO2003037267A2 (en) * 2001-10-29 2003-05-08 Corixa Corporation Compositions and methods for the therapy and diagnosis of lung cancer
WO2003097666A2 (en) * 2002-05-16 2003-11-27 Euro-Celtique, S.A. Use of gastrin releasing peptide (grp) and its receptor in cancer screening

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101403019B1 (ko) 2013-02-25 2014-06-03 서울대학교산학협력단 폐암 진단용 마커

Also Published As

Publication number Publication date
WO2006131783A3 (en) 2009-08-27
AU2005320352A1 (en) 2006-08-31
CA2555509A1 (en) 2005-07-27
WO2006131783A2 (en) 2006-12-14
AU2005320352A2 (en) 2006-08-31
AU2005320352A8 (en) 2009-04-30
EP1774046A2 (en) 2007-04-18
EP1774046A4 (en) 2010-09-15

Similar Documents

Publication Publication Date Title
US7368548B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
US7569662B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of lung cancer
US20060147946A1 (en) Novel calcium channel variants and methods of use thereof
JP2002500010A (ja) ヒト遺伝子および遺伝子発現産物i
JP2003518920A (ja) 新規なヒト遺伝子および遺伝子発現産物
AU2005207886A1 (en) Novel brain natriuretic peptide variants and methods of use thereof
EP1105474A2 (en) Human genes and gene expression products v
KR20080080525A (ko) 유전자 전사에 대한 fgfr3의 억제제의 효과
CA2840472A1 (en) Methods and compositions for the treatment and diagnosis of bladder cancer
JP2011254830A (ja) 結腸癌に関するポリヌクレオチド
US7332569B2 (en) Brain natriuretic peptide spliced variant
US20090215046A1 (en) Novel nucleotide and amino acid sequences, and assays methods of use thereof for diagnosis of colon cancer
US20060263786A1 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of colon cancer
US7528243B2 (en) Nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
JP2008507261A (ja) 肺癌診断のための新規のヌクレオチド配列およびアミノ酸配列、ならびにそのアッセイおよび使用方法
US20050186600A1 (en) Polynucleotides encoding novel UbcH10 polypeptides and kits and methods using same
EP1749025A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of colon cancer
WO2005116850A2 (en) Differential expression of markers in ovarian cancer
US20100124786A1 (en) Novel Nucleotide and Amino Acid Sequences, and Assays and Methods of use Thereof for Diagnosis of Ovarian Cancer
WO2005072050A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of breast cancer
WO2005107364A9 (en) Polynucleotide, polypeptides, and diagnostic methods
JP2007520217A (ja) 新規ヌクレオチドおよびアミノ酸配列、ならびにそれを用いた乳癌診断のためのアッセイおよび使用方法
EP1735468A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
WO2006021874A2 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer
AU2005276208A1 (en) Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis of prostate cancer

Legal Events

Date Code Title Description
RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080122

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100817

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20110208