JP2003521071A - Integrated access to biomedical resources - Google Patents
Integrated access to biomedical resourcesInfo
- Publication number
- JP2003521071A JP2003521071A JP2001555385A JP2001555385A JP2003521071A JP 2003521071 A JP2003521071 A JP 2003521071A JP 2001555385 A JP2001555385 A JP 2001555385A JP 2001555385 A JP2001555385 A JP 2001555385A JP 2003521071 A JP2003521071 A JP 2003521071A
- Authority
- JP
- Japan
- Prior art keywords
- genomic
- data
- data object
- database
- objects
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/20—Heterogeneous data integration
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/10—Ontologies; Annotations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioethics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】 ゲノム研究をゲノム・データ・オブジェクトのオンライン解析を介して実行するシステムおよび方法を提供する。新しい技術情報モデルおよび実施機構がゲノム視覚化および解析ツールを、ゲノム・データ・オブジェクトを複数のデータベースに渡って(かつそれらの内部で)リンクする能力と結合する。これにより、従来のインターネット・アクセス・プロセスを使用して可能ではなかったインタラクティブ性に備え、またゲノム研究の効果をさらに高めるデータ統合にも備える。ビジネス・プロセスがデータベースへのアクセス方法、特に商用有料データベースをコントロールし、本発明によるシステムを使用する研究者がアクセス制限の追跡に関与する必要がなくなる。 (57) Abstract A system and method are provided for performing genomic research via online analysis of genomic data objects. New technical information models and implementation mechanisms combine genomic visualization and analysis tools with the ability to link genomic data objects across (and within) multiple databases. This provides for interactivity that was not possible using traditional Internet access processes, and for data integration that further enhances the effectiveness of genomic research. The business process controls how the database is accessed, especially commercial paid databases, so that researchers using the system according to the invention do not have to be involved in tracking access restrictions.
Description
【発明の詳細な説明】
【0001】
(発明の背景)
1.発明の分野
本発明は、一般に、データ処理の分野に関する。より詳細には、本発明は、ゲ
ノム研究の効率を高める目的で、統合された手法で様々な生化学的データ・リソ
ースにアクセスするための、インターネットの使用法に関する。
【0002】
2.背景情報
全ての生物のほぼ全ての細胞は、その生存期間全体にわたってその生物を作り
出しかつその細胞構造および活性を調整するための、1組の完全な命令を含んで
いる。この命令の集合体をゲノムと呼ぶ。
【0003】
ゲノムは、クロモソームと呼ばれる明確に区別される顕微鏡的単位で構成され
ている。クロモソームは、デオキシリボ核酸(DNA)のコイル状の糸である。
DNAの各糸は、共に巻き付けられ対をなして二重らせんを形成する2本の長い
ヌクレオチドの鎖からなる。ヒト・ゲノムは、これら35億対のヌクレオチドで
構成される。
【0004】
所与のDNA鎖は、タンパク質を産生するための細胞命令を含んでいる。これ
らの命令は、DNA鎖内で、遺伝子と呼ばれるヌクレオチド塩基の特定の配列の
形をとる。科学者は、これら基本的な遺伝単位80,000〜100,000個
がヒト・ゲノム内に存在すると推定している。タンパク質は、広く様々な生理学
的な仕事をする。これらは、消化や呼吸、免疫応答、熱およびエネルギーの生成
、細胞内および細胞外での流体の移動などのプロセスを促進させる。
【0005】
ある種のほとんどのメンバーは、同じ遺伝子集合を有する。しかし、各個体独
自の特徴は、その個体の遺伝子を含むヌクレオチドの配列のわずかな変異から生
じる。個体の独自の特徴を定めるこれらのわずかな遺伝的変異は、多形性と呼ば
れる。平均すると、ある種の任意の2つの個体のDNAは、約0.1%だけ異な
ることになる。
【0006】
突然変異と呼ばれる別のクラスの変異も生じる。多形的変異と突然変異原的変
異の両方は、タンパク質の産生を阻害しまたはタンパク質の通常の機能を変化さ
せることにより個体に有害である可能性がある。ほとんどの疾病は、これらのタ
イプの遺伝的変異から生じる。
【0007】
ゲノミクスは、ゲノム内の核酸配列の研究である。ゲノム調査の目的は、ヌク
レオチドの配列を決定し、それらが含む全ての遺伝子の機能を理解し、個体性を
定め疾病を生み出す遺伝的変異を明確にすることである。
【0008】
ゲノミクスは、広範囲にわたり適用される。これらは、研究作業の最も基本的
な事項から、診断に有用であるという展望に至るまで適用される。
【0009】
新薬の開発を制限する重要な因子は、そのために新薬を開発することができる
既知の標的分子の数が限定されることである。疾病標的分子は、薬物によって影
響を受ける可能性があるものであり、体内で、後続の所望の生物学的反応を引き
起こす。歴史的に見ると、新しい標的分子を発見するプロセスは、試行錯誤的な
発見手法に頼っていたため極めて遅く、非常に費用がかかっていた。ゲノム研究
は、薬物設計者が問題の標的分子に直接進むことができるので、試行錯誤への依
存を減少させることになる。このため、薬物開発にゲノム研究を適用することに
よって、新しくより良い薬物が、より迅速にかつ少ないコストで生成される。
【0010】
ゲノム研究が医薬品産業を助けることができる別の方法は、薬理ゲノム学の新
興分野にある。薬理ゲノム学は、より個人に向けた薬物療法を開発するために、
薬物治療の効果−すなわちどのくらいうまく個体が特定の薬物を吸収し、特定の
薬物を代謝するか−に影響を与える可能性がある患者間での遺伝的変異の識別に
焦点を当てている。ほぼ全ての製薬会社は、所与の薬剤が全ての人々に同じ効果
を発揮しないという増加しつつある証拠に対する反動で、薬理ゲノム学的ユニッ
トを開発している。
【0011】
特に、薬理ゲノム学は、少なくとも3つの異なる有用な適用例を提供すると考
えられている。すなわち、
患者群の選択プロセスを改善することによって、臨床試験の成功率を高めるこ
と、
既存の薬物の新たな用法を明らかにすること、および
薬物の使用により適した集団を特定することによって、薬物試験に依然失敗し
たことがある薬物を救済することである。救済すべき薬物候補には、特定のサブ
集団で拒絶反応をもたらしたものが含まれる。
【0012】
分子中毒学は、ゲノム研究の恩恵を受けることができる別の技術領域である。
薬物による有害な副作用の結果、毎年約220万人の米国人が入院している。こ
のような有害な(かつしばしば予測できない作用により)、年間100,000
人を超える米国人が死亡している。例えば、一部では肝臓に損傷を引き起こし、
一部は腎臓に有害である。すでに利用可能な、薬物に関する臓器特異的な遺伝子
発現プロフィルによって、研究者は、新薬化合物の毒性をより確かに調査するこ
とが可能になる。
【0013】
さらに、代謝経路に関連する多形情報と組み合わせた遺伝子発現データにより
、個々の患者が様々な投薬レベルの薬物に反応するという方法の重要な指標が提
供され、それによって、治療による望ましくない副作用が著しく低減される。
【0014】
リスク・アセスメントは、ゲノミクスの恩恵を受ける診断の主要な領域である
。歴史的に見て、誰かが特定の疾病に特有の危険に曝されているかどうかの予測
は、血圧やコレステロール・レベルなど身体の一般的指標を測定することに焦点
を当てている。これらの測定値は一般的な生理現象を反映しているが、個々の患
者の疾病に関する具体的な遺伝的基礎事項を説明していない。その結果、これら
の診断検査法では疾病の根本的な原因が見分けられず、患者に対する医療を脅か
し、訴訟のリスクが増大する可能性がある。
【0015】
新たなゲノム・ベースの診断は、特定の遺伝子および疾病に関連する患者のあ
らゆる変化を見ることによって、特定の疾病にかかる個々のリスクを決定するこ
とに焦点を当てることになる。これらの新しい診断では、特定の疾病にかかると
いう患者の潜在的なリスクのより正確なアセスメントを提供することによって、
はるかに良い予防的ケアが可能になると考えられる。
【0016】
個人向けの医療は、ゲノミクスの恩恵を受ける診断の別の主要な領域である。
ゲノム情報は、個々の遺伝的構成を特定する分子診断検査法を開発するために、
入手可能である。これらの診断検査法は、医師が各患者ごとに療法を確立するこ
とができるため、医療に大きな変革をもたらし、すなわち個人向け医療が可能に
ある。
【0017】
例えば細胞レベルでそれぞれ明らかに異なる多くのタイプの癌は、それにもか
かわらず、同様の症状を示す。症状は、1つの遺伝的タイプの癌と別のタイプの
癌で類似する可能性があるので、効果的な治療を処方するには、癌遺伝子および
それらの相互作用について可能な限り全てを知ることが重要である。
【0018】
別の例として、医師は、副作用が最小限に抑えられた最も有効な薬物を選択す
るのを助けるため、分子/ゲノム試験を使用することができる。その結果、この
手法により、患者はオーダーメード医療を受けることができ、病気の期間を短縮
することができ、最終的には、より良くより長い人生を送ることができるように
なる。
【0019】
健康管理の他、農業の分野もゲノム研究の恩恵を受けると考えられる。植物お
よび動物の疾病を診断することができ、それらの疾病をターゲットにした治療を
開発することができることによって、より良い農産物が生産され、収量が増大す
する。例えば、耐病性または病虫害抵抗性の植物株からの遺伝情報と非耐性株を
比較し、好ましい形質に関する選択的育種プログラムを使用することにより、世
界中の様々な農業地域で利用可能な新種の株の数を著しく増大させ、かつそのよ
うな新種の株を非常にうまく成功させることができる。これは、食品の量を増加
させるだけではなく、食品の栄養の質も高めるという、重要な意味合いを持つ。
【0020】
ゲノム情報から重要な恩恵を受けると考えられるその他の分野には、法医学、
獣医学、繊維生産、廃棄物制御、環境改善が含まれる。
【0021】
ゲノム研究に関して予測された前述の有益な結果のいずれかを達成するのに著
しい障害は、全体がふるいにかけられて研究されるゲノム情報の量の全体の大き
さである。誇張ではなく、全体がふるいにかけられて研究される入手可能な生の
核酸配列データは、想像を絶するほど膨大である。さらに、新たに配列決定され
たDNA鎖は逐次記録されるので、データ本体は日々大きくなる(事実上)。ゲ
ノム・データが膨大であるので、これはコンピュータを介して記憶され、処理さ
れ、操作される。
【0022】
バイオインフォマティクスは、生物学的情報を検索し、処理し、分析するため
にコンピュータを使用することである。このデータ処理の分野は、現在、薬物の
発見および開発に重要と考えられている。科学者は、従来の「ウェットな(we
t)」生物学を、定量分析、データベースの比較、およびコンピュータ・アルゴ
リズムで補っている。このように生物学の研究は、少なくとも事前に仮想環境で
行われ、その後、科学者が実験室で実際に行う。バイオインフォマティクスのツ
ールおよびサービスは、遺伝子発見、疾病経路の理解、新しい疾病標的の特定、
および疾病に対する遺伝子配列の変異の発見および相関関係も含め、薬物の発見
および開発の全ての段階で、医薬品およびバイオテクノロジーの研究者を補助す
る。
【0023】
残念ながら、ゲノム情報にアクセスする従来の手段は、データを計算上透過的
な方法で解析あるいは研究することができる総合的かつ容易なアクセスには備え
ていない。ゲノム情報は幅広い種類のデータベースに蓄積されており、その一部
は公用(無料で使用可能)であり、一部は商用(有料で使用可能)であり、一部
はメーカ独自(外部の者とは共有されない「企業内」のリソース)である。
【0024】
図1を参照すると、公用102および専用104のゲノム・データベース、な
らびに探索ツール106がオンラインで使用可能である。ユーザ110がインタ
ーフェイス・デバイス112を使用してデータベース102、104および探索
ツール106にアクセスする。インターフェイス・デバイス112はデータ・ア
クセス・ポータル・サイト120と、インターネット接続130を介して通信す
る。ポータル120はデータベース102、104および探索ツール106への
接続を、インターネット140を介して行う。ユーザ110がゲノム研究リソー
ス102、104、106にアクセスするためのもう1つの動作モードは、直列
にインターネット接続を介して、ポータル120を使用しないものである。(こ
の簡素化された接続のモードは図示しない)。インターフェイス・デバイス11
2は通常、シン・クライアント・ブラウザ・アプリケーションの実施である。
【0025】
各データベースは、生物学的データを含むデータ・オブジェクトからなる。デ
ータ・オブジェクトはデータベース毎に、それらが含む生物学的データのタイプ
に関して、かつそれらのフォーマットに関して異なる。したがって、複数のデー
タベースからのデータの研究には、研究者が一意のデータ構造において提示され
たデータおよび各特定のデータベースのデータ内容を解釈する方法を学ぶことが
必要である。これは著しい不都合である。
【0026】
したがって、必要とされるものは、多様なゲノム・データベース(それぞれが
異なるフォーマットのゲノム・データ・オブジェクトを含む)からのデータを自
動的に解釈し、それがユーザに予測可能で容易に認識可能なフォーマットで提示
されるようにする、バイオインフォマティックス視覚化ツールである。
【0027】
加えて、多様な格納フォーマットが異なるデータベースによって使用されるの
で、自動解析ツールを使用して解析されるデータ・オブジェクトの多数を、それ
らの固有のフォーマットから、使用される自動解析ツールが認識可能であるフォ
ーマットに変換しなければならない。これはさらに不都合である。
【0028】
したがって、必要とされるものは、多様なゲノム・データベース(それぞれが
異なるフォーマットのゲノム・データ・オブジェクトを含む)からのデータを自
動的に翻訳し、それが一様なフォーマットによる解析機構に提示されるようにす
る、バイオインフォマティックス・ソフトウェア・ツールである。
【0029】
さらに、データ・オブジェクトのペアが互いに著しい関係を有することが発見
されたとき、それらの間のリンキング関係を確立するための従来のメカニズム(
手動で注記をそれ自体に書き込む以外のもの)はない。このようなメカニズムは
、データ・オブジェクトのペアが2つのまったく異なるデータベースにおいて発
見される場合、存在しないことがもっとも著しい。
【0030】
したがって、必要とされるものは、データ・オブジェクトが多様なデータベー
スから引き出され、かつ多様なフォーマットおよび内容のタイプを有するときで
さえ、ユーザがこれらのデータ・オブジェクトの間のリンキング関係を確立する
ことができるソフトウェア機構である。
【0031】
さらに、インターネット・データベース・ホストによって、あるいは中央イン
ターネット・ポータルによって提供されたハイパー・テキスト・マークアップ言
語(HTML)のゲノム・データ・ファイルにアクセスかつこれをナビゲートす
る既存の方法には、重大な制限がある。1つには、データの操作および/または
解析について可能なインタラクティブ性がない。このインタラクティブ性は、研
究効果に関して重大なものである。
【0032】
したがって、必要とされるものは、ユーザがゲノム・データ・ファイルに、イ
ンターネットを介して、これらのファイルがHTML(通常行われるもの)の形
式であるか、データを表示することができる他のフォーマットであるかに関わら
ず、インタラクティブにアクセスかつこれをナビゲートすることができるソフト
ウェア機構である。
【0033】
(発明の概要)
本発明の目的は、データを多様なゲノム・データベース(それぞれが異なるフ
ォーマットのゲノム・データ・オブジェクトを含む)からのデータを自動的に解
釈し、それがユーザに予測可能で容易に認識可能なフォーマットで提示されるよ
うにする、バイオインフォマティックス視覚化ツールを提供することである。
【0034】
本発明のもう1つの目的は、多様なゲノム・データベース(それぞれが異なる
フォーマットのゲノム・データ・オブジェクトを含む)からのデータを自動的に
翻訳し、それが一様なフォーマットによる解析機構に提示されるようにする、バ
イオインフォマティックス・ソフトウェア・プロセスおよびシステムを提供する
ことである。
【0035】
本発明のさらにもう1つの目的は、データ・オブジェクトが多様なデータベー
スから引き出され、かつ多様なフォーマットおよび内容のタイプを有するときで
さえ、ユーザがこれらのデータ・オブジェクトの間のリンキング関係を確立する
ことができるソフトウェア・プロセスおよびシステムを提供することである。
【0036】
本発明のさらにもう1つの目的は、ユーザがHTML(または他のフォーマッ
ト)のゲノム・データ・ファイルに、インターネットを介してインタラクティブ
にアクセスかつこれをナビゲートすることができるソフトウェア・プロセスおよ
びシステムを提供することである。
【0037】
本発明のさらなる目的は、複数のゲノム・データベースへのシームレスなアク
セスおよびインタラクティブ性を、それらのデータベースのうち1つまたは複数
が商用(すなわち、有料の)データベースである場合でさえ可能にするためのビ
ジネス・プロセスを提供することである。
【0038】
上記の目的のうちいくつかは、ローカル・ゲノム・データベースシステムと、
かつ1つまたは複数のリモート・ゲノム・データベース・システムと電子的に通
信するデータ処理システムによって可能とされる。このデータ処理システムは、
ユーザがゲノム・データ・オブジェクトをグラフィカルに表示することができる
グラフィカル・ユーザ・インターフェイスを含む。これはまた、ゲノム・データ
・オブジェクト・リンカ、および1つまたは複数のゲノム・データ・オブジェク
トを解決するリンカブル・データ・オブジェクト・リゾルバを含み、このオブジ
ェクトは、ローカル・ゲノム・データベース・システムおよび1つまたは複数の
リモート・ゲノム・データベース・システムにおいて発見されたデータ・オブジ
ェクトの中からの、対象ゲノム・データ・オブジェクトに関してリンカブルであ
る。リンカブル・データ・オブジェクト・リゾルバによって解決される解決済ゲ
ノム・データ・オブジェクトが、データ・オブジェクト・リンカによって対象ゲ
ノム・データ・オブジェクトにリンクされ、解決済ゲノム・データ・オブジェク
トおよび対象ゲノム・データ・オブジェクトがそれぞれグラフィカル・ユーザ・
インターフェイスに提供されるようになる。
【0039】
上記の目的のうちいくつかはまた、ローカル・ゲノム・データベース・システ
ムと、かつ1つまたは複数のリモート・ゲノム・データベース・システムと電子
的に通信する、ゲノム研究を実行するためのシステムによっても可能とされる。
このシステムは、ユーザにゲノム・データ・オブジェクトのグラフィカル・ビュ
ーを提示する手段、ならびに、ゲノム・データ・オブジェクトを互いにリンクす
る手段を含む。このシステムはさらに、ゲノム・データ・オブジェクトを、ロー
カル・ゲノム・データベース・システムおよび1つまたは複数のリモート・ゲノ
ム・データベース・システムにおいて発見されたゲノム・データ・オブジェクト
の中からの、対象ゲノム・データ・オブジェクトに関して解決する手段を含む。
解決する手段によって解決される解決済ゲノム・データ・オブジェクトが、リン
クする手段によって対象ゲノム・データ・オブジェクトにリンクされ、解決済ゲ
ノム・データ・オブジェクトおよび対象ゲノム・データ・オブジェクトがそれぞ
れ印刷する手段に提供されるようになる。
【0040】
上記の目的のうちいくつかが可能とされるもう1つの方法は、ゲノム研究を対
象ゲノム・データ・オブジェクトに関して、ローカル・ゲノム・データベースお
よび1つまたは複数のリモート・ゲノム・データベースをリソースとして使用し
て実行する方法によるものである。この方法は、リンカブル・ゲノム・データ・
オブジェクトを、ローカル・ゲノム・データベース・システムおよび1つまたは
複数のリモート・ゲノム・データベース・システムの中からの、対象ゲノム・デ
ータ・オブジェクトに関して、ゲノム・データ・オブジェクトのデータ・フォー
マットに関わらず、解決する動作を含む。加えて、この方法は、対象ゲノム・デ
ータ・オブジェクトを、リンカブル・ゲノム・データ・オブジェクトにリンクし
て、リンク済ゲノム・データ・オブジェクトのセットを形成する動作を含む。さ
らに、この方法は、リンク済ゲノム・データ・オブジェクトのセットをローカル
・ゲノム・データベースに格納する動作を含む。
【0041】
上記の目的のうちいくつかが可能とされるさらにもう1つの方法は、ゲノム研
究において使用するための、上記のような方法を実施するコンピュータ・システ
ムによるものである。
【0042】
上記の目的のうち1つは、新しい技術情報モデルおよび実施機構によって可能
とされる。これは、ゲノム視覚化および解析ツールを、ゲノム・データ・オブジ
ェクトを複数のデータベースに渡って(かつそれらの内部で)リンクする能力と
結合することによって実施される。
【0043】
上記の目的のうちもう1つは、複数のゲノム・データベースへのアクセスを管
理する方法によって可能とされ、このときゲノム・データベースはローカル・ゲ
ノム・データベース、公用ゲノム・データベースおよび商用ゲノム・データベー
スを含む。この方法は、リンカブル・データ・オブジェクトを対象データ・オブ
ジェクトに関して解決するステップ、および、さらに解決済データ・オブジェク
トを対象ゲノム・データ・オブジェクトにリンクするステップを含む。公用ゲノ
ム・データベースから解決されるリンカブル・データ・オブジェクトは、その中
に格納されたゲノム・データ・オブジェクトのデータ・フォーマットに関わらず
解決され、アクセス・コストについての制限がない。商用ゲノム・データベース
から解決されるリンカブル・データ・オブジェクトは、その中に格納されたゲノ
ム・データ・オブジェクトのデータ・フォーマットに関わらず解決され、商用ゲ
ノム・データベースについての適用可能な所定のアクセス取り決めを受けて解決
される。
【0044】
上記の目的のうちいくつかが可能とされるさらにもう1つの方法は、コンピュ
ータが複数のゲノム・データベースへのアクセスを管理することができる、コン
ピュータ・プログラム製品による。複数のゲノム・データベースは、ローカル・
ゲノム・データベース、公用ゲノム・データベースおよび商用ゲノム・データベ
ースを含む。コンピュータ・プログラム製品は、コンピュータが所定の動作を実
行できるようにするためのソフトウェア命令、およびソフトウェア命令を実施す
るコンピュータ可読媒体である。所定の動作には、上述の方法による動作が含ま
れる。
【0045】
本発明の一態様は、核酸配列、アミノ酸配列、オリゴヌクレオチド、Basi
c Local Aligned Search Tool(BLAST)探索
の結果、およびMEDLINEなどの医療データベースからのエントリなど、ゲ
ノム・データを格納するためのローカル・データベースである。
【0046】
本発明の別の態様は視覚化および解析機構である。視覚化および解析は好まし
くはダイアログ・ボックスを介して提供され、パラメータをBLAST探索用に
設定できるようにし、テキストベースの探索を配列データベースからなるように
することができ、かつ文献探索をデータベースで行うことができるようにする。
リンカは、核酸配列、アミノ酸配列、BLAST探索結果、MEDLINEエン
トリなどを共にリンクするために含まれる。すべてのタイプのゲノム/生物医学
情報は、ビューアおよびエディタ・コンポーネントを組み込むグラフィカル・イ
ンターフェイスを介して視覚化される。
【0047】
本発明のさらにもう1つの態様は、データベース・オブジェクトの間のリンク
を解決するプログラミング・モジュールを有するインターネット・コネクタであ
る。このコネクタは、ローカル・データベースまたはリモート・インターネット
・サーバを調べて、求められているデータ・オブジェクトを得る。
【0048】
本発明の追加の目的および利点は、以下の詳細な説明を添付の図面と共に読む
ことによって明らかになるであろう。
【0049】
(発明の詳細な説明)
本発明を考察する1つの方法は、シン・クライアント・ブラウザおよびシン・
ポータル(図1を参照)を使用して、研究者にゲノム研究リソースへのアクセス
を提供する従来の手法が断念されることである。その代わりに、出願人は、イン
タラクティブなインターフェイスをリソースと共に提供するシステムの効果が増
すことを発見した。このインタラクティブ性は、ゲノム研究の効果を増すために
重要である。本発明を考察するもう1つの方法は、技術情報モデルおよび実施機
構としてである。本発明のインタラクティブ性の態様は、データ・オブジェクト
のリンキングおよびその視覚化および解析の態様の組合せによって提供される。
【0050】
中間および最終結果を格納するためのローカル・データベースに加えて、本発
明は視覚化および解析の態様を有する。視覚化は高度な形式において提供され、
これは配列および他の分子を、人の知覚に直観的にアピールするグラフィカル・
プレゼンテーションにおいて示すものである。インタラクティブ性に加えて、ユ
ーザが容易にデータを統合(すなわち、リンク)し、統合されたデータをローカ
ル・データベースに格納するための機能がとても有用である。
【0051】
本発明の好ましい実施形態において提供される追加の機能性は、リモートでイ
ンターネットを介するのではなくユーザ・インターフェイスで直接使用可能なフ
ルスケール解析ツールおよびアルゴリズムである。フルスケール解析では、DN
Aをタンパク質、酵素およびオリゴ・データ・セット、BLAST結果、MED
LINE Entrezデータおよびアミノ酸に鑑みて評価することができる。
【0052】
本発明の視覚化および解析の態様を提供することができるソフトウェア製品の
一実施例は、North Bethesda、MarylandのInforM
ax,Inc.のVectorNTI(商標)製品である。
【0053】
本発明の好ましい実施形態によるもう1つの態様は、インターネットを介して
複数のデータベース(たとえば、NCBI、Entrez、PubMed、SR
S)に接触する解決システムを使用して、統合されたデータベース探索を提供す
ることである。
【0054】
図2を参照すると、公用202および専用204のデータベース、および様々
な研究ツール206がオンラインで使用可能である。また、研究リソースとして
使用可能なものは、ユーザ210がローカル・データベース・システム208に
格納する以前の研究結果および他のメーカ独自のデータである。従来技術のよう
に、インターネット220が、様々なリモートのリソース202、204、20
6にアクセスするための通信媒介として使用される。しかし、従来技術とは対照
的に、まったく異なるツールのセットが、研究を行うために使用される。
【0055】
ユーザ210がユーザ・インターフェイス230を利用し、これは視覚化シス
テム232およびデータ・セット・リンキング機構234(以下、短く「リンカ
」とする)を含む。リンカ234は、ユーザが、互いの関係においてさらに研究
するために互いに関連付ける価値があると見なすデータ・セットの統合に備える
。そのようにリンクされたデータ・セットは、解析ツールおよびアルゴリズム2
40を使用してより綿密に検査あるいは解析することができる。本発明と共に使
用するために含める有用な解析ツールおよびアルゴリズムの実施例は、BioP
lot(商標)、AlignX(商標)およびContigExpress(商
標)であり、これらはすべてNorth Bethesda、MDのInfor
Max,Inc.の製品である。BLASTなど、いくつかの他の使用可能な解
析ツールも有効に使用することができる。
【0056】
この検査および解析手順は、それら自体を、それらが導出された元のデータ・
セットにリンクすることができる結果となる。ローカル・データベース208が
使用されて、統合されたデータ・セットおよび後の研究についての結果がユーザ
210またはその同僚によって格納される。後の研究を、追加のコンピュータ解
析の形式にすることができ、あるいは、結果が十分に有望であると見なされた場
合、生物学研究所におけるものにすることができる。
【0057】
リンキングについての候補は、リンカブル・データ・オブジェクト解決システ
ム250によって識別される。リンカブル・データ・オブジェクト解決システム
250はインターネット220を介して、様々な探索ツール206およびデータ
ベース202、204のいずれにもアクセスして、ユーザ210が関心のあるも
のとして識別した対象データ・オブジェクトに関連するデータ・オブジェクトに
ついて探索する。解決システム250はリンクを確立しない。むしろ、解決シス
テム250は、インターネットを介して閲覧するために使用可能である莫大なデ
ータの集まりから、対象データ・オブジェクトに関連する妥当な確率を有するべ
きデータ・オブジェクトを識別する。
【0058】
解決システム250による探索を制限かつガイドするため、パーミッショニン
グおよびアカウンティング・モジュール260が解決システム250に、アクセ
ス取り決めが確立ている公用202またはこれらの商用データベース204であ
るデータベースのみにアクセスするように指示する。パーミッショニングおよび
アカウンティング・モジュール260のアカウンティングの態様は、商用データ
ベース204の使用に関するアクセス時間、持続時間および権限付与の記録を保
持する。
【0059】
本発明の装置の態様に加えて、方法も本発明のいくつかの態様を形成する。本
発明によるゲノム研究を実行するための方法は、最初にリンカブル・ゲノム・デ
ータ・オブジェクトを解決することによって、次いで、リンカブル・ゲノム・デ
ータ・オブジェクトを対象ゲノム・データ・オブジェクトとリンクして、リンク
済ゲノム・データ・オブジェクトのセットを形成することによって実施される。
解決の動作は対象ゲノム・データ・オブジェクトに関して、1つまたは複数のリ
モート・ゲノム・データベースをリソースとして使用して実行される。オプショ
ナルで、ローカル・ゲノム・データベースもリンカブル・ゲノム・データ・オブ
ジェクトの解決において使用される。解決の動作は、ゲノム・データ・オブジェ
クトのデータ・フォーマットに関わらず実行され、これは、ゲノム・データ・オ
ブジェクトが様々なデータベースにおいて発見される可能性があるからである。
ゲノム・データ・オブジェクトがリンクされた後、これらがリンク済ゲノム・デ
ータ・オブジェクトとしてローカル・ゲノム・データベースに格納されることが
好ましい。
【0060】
本発明のもう1つの態様は、ビジネス・プロセスを表すことであり、このとき
、商用データベースについての所定のアクセス取り決めが、研究ステップをガイ
ドするために使用され、これらのデータベースへのアクセスが、このプロセスを
使用する研究者/ユーザの観点からまったくシームレスとなる。この結果、公用
、商用ならびにローカル(場合によってはメーカ独自の)の複数のゲノム・デー
タベースへのアクセスを管理するプロセスとなる。このプロセスは、リンカブル
・データ・オブジェクトを、対象データ・オブジェクトに関して解決するステッ
プ、および、さらに解決済データ・オブジェクトを対象ゲノム・データ・オブジ
ェクトにリンクするステップを含む。公用ゲノム・データベースから解決された
リンカブル・データ・オブジェクトは、その中に格納されたゲノム・データ・オ
ブジェクトのデータ・フォーマットに関わらず解決され、アクセス・コストにつ
いての制限はない。商用ゲノム・データベースから解決されたリンカブル・デー
タ・オブジェクトは、その中に格納されたゲノム・データ・オブジェクトのデー
タ・フォーマットに関わらず解決され、商用ゲノム・データベースについての適
用可能な所定のアクセス取り決めを受けて解決される。
【0061】
本発明を好ましい実施形態に関して記載したが、様々な修正および改良を、記
載した実施形態に、本発明の範囲から逸脱することなく行うことができることは
理解されよう。本発明の範囲は、付属の特許請求の範囲によって限定される。
【図面の簡単な説明】
【図1】
ブラウザを使用して、ポータルを介してインターネット・データベース・リソ
ースにアクセスする従来の構成を例示する図である。
【図2】
本発明の一実施形態による、インターネット・データベース・リソースへの統
合されたアクセスを例示する図である。Description: BACKGROUND OF THE INVENTION FIELD OF THE INVENTION The present invention relates generally to the field of data processing. More specifically, the present invention provides
In order to increase the efficiency of nom research, a variety of biochemical data
The use of the Internet to access resources. [0002] 2. Background information Nearly every cell in every organism makes up that organism throughout its lifetime.
Including a complete set of instructions for issuing and regulating its cell structure and activity
I have. This set of instructions is called the genome. [0003] The genome is composed of distinct microscopic units called chromosomes.
ing. Chromosomes are coiled threads of deoxyribonucleic acid (DNA).
Each strand of DNA is wound together to form two long, double-helix pairs.
Consists of a chain of nucleotides. The human genome consists of these 3.5 billion pairs of nucleotides
Be composed. [0004] A given DNA strand contains cellular instructions for producing a protein. this
These instructions are based on the specific sequence of nucleotide bases, called genes, in the DNA strand.
Take shape. Scientists find that these 80,000 to 100,000 basic genetic units
Is presumed to be present in the human genome. Proteins have a wide variety of physiology
Work. These include digestion and respiration, immune response, heat and energy production
Facilitates processes such as the movement of fluids inside and outside the cell. [0005] Most members of some species have the same set of genes. However, each individual German
Its own characteristics arise from slight variations in the nucleotide sequence containing the gene of the individual.
I will. These slight genetic variations that define an individual's unique characteristics are called polymorphisms.
It is. On average, the DNA of any two individuals of a species differ by about 0.1%.
Will be. [0006] Another class of mutations, called mutations, also occur. Polymorphic and mutagenic mutations
Both differ, either inhibiting the production of the protein or altering the normal function of the protein
May be harmful to the individual. Most diseases are
Resulting from genetic variation in ip. [0007] Genomics is the study of nucleic acid sequences in the genome. The purpose of genome research is
Determine the sequence of leotides, understand the function of all the genes they contain, and
The purpose is to clarify the genetic variation that produces a defined disease. [0008] Genomics has a wide range of applications. These are the most basic of the research work
It applies from simple matters to prospects of being useful for diagnosis. An important factor limiting new drug development is that new drugs can be developed for it
The number of known target molecules is limited. Disease target molecules are affected by drugs
And may cause subsequent desired biological responses in the body.
Wake up. Historically, the process of discovering new target molecules has been a trial and error process.
It was extremely slow and very expensive because it relied on discovery techniques. Genome research
Relies on trial and error because drug designers can go directly to the target molecule in question.
Will be reduced. Therefore, genomic research should be applied to drug development.
Thus, new and better drugs are produced more quickly and at lower cost. [0010] Another way genomic research can help the pharmaceutical industry is to introduce new approaches to pharmacogenomics.
In the entertainment field. Pharmacogenomics is developing more personalized drug therapies.
Effect of drug treatment-i.e., how well an individual absorbs a particular drug and
Whether to metabolize the drug-to identify genetic variations among patients that may affect
Focused. Almost all pharmaceutical companies find that a given drug has the same effect on all people
In response to the growing evidence that it does not exert
Is developing. In particular, pharmacogenomics is considered to provide at least three different useful applications.
Has been obtained. In other words, improving the success of the trial by improving the patient selection process.
And to identify new uses for existing drugs, and to identify populations more suitable for drug use, still fail drug testing.
It is to rescue drugs that have been used. Drug candidates to be rescued
Includes those that have resulted in rejection in the population. [0012] Molecular toxicology is another area of technology that can benefit from genomic research.
About 2.2 million Americans are hospitalized each year as a result of the adverse side effects of drugs. This
Harmful (and often due to unpredictable effects) such as
More than one American has died. For example, some cause liver damage,
Some are harmful to the kidneys. Organ-specific genes for drugs already available
Expression profiles allow researchers to more reliably investigate the toxicity of new drug compounds.
And become possible. Furthermore, gene expression data combined with polymorphism information related to metabolic pathways
Key indicators of how individual patients respond to different dosage levels of the drug.
And thereby significantly reduce the undesirable side effects of the treatment. [0014] Risk assessment is a major area of diagnosis that benefits from genomics
. Historically, predicting whether someone is at particular risk for a particular disease
Focuses on measuring general physical indicators such as blood pressure and cholesterol levels
It is guessing. While these measurements reflect general physiological phenomena,
Does not provide specific genetic basis for the elderly's disease. As a result, these
Diagnostic Tests Could Not Identify Root Cause of Disease, Threatening Medical Care for Patients
And may increase the risk of litigation. [0015] New genome-based diagnostics will identify patients with specific genes and diseases.
By looking at every change, you can determine the individual risk of a particular disease.
And will focus on These new diagnoses suggest that certain diseases
By providing a more accurate assessment of the patient's potential risk,
It is likely that much better preventive care will be possible. [0016] Personalized medicine is another major area of diagnosis that benefits from genomics.
Genomic information is used to develop molecular diagnostic tests that identify individual genetic components.
Available. These diagnostic tests allow the physician to establish a therapy for each patient.
Can revolutionize healthcare, that is, enable personalized healthcare
is there. For example, many types of cancer, each distinctly different at the cellular level,
Nevertheless, they show similar symptoms. Symptoms include one genetic type of cancer and another
Because cancer may be similar, prescribing effective treatments involves cancer genes and
It is important to know as much as possible about those interactions. [0018] As another example, physicians select the most effective drugs with minimal side effects.
Molecular / genomic testing can be used to help. As a result, this
The technique allows patients to receive personalized medicine and shortens the duration of illness
So that you can ultimately live a better and longer life
Become. In addition to health care, the field of agriculture will also benefit from genomic research. Plants
And animal diseases, and provide treatments targeting those diseases.
Being able to develop will produce better produce and increase yields
I do. For example, genetic information from disease-resistant or pest-resistant plant strains and non-resistant strains
By using selective breeding programs for comparison and favorable traits,
Significantly increase the number of new strains available in various agricultural areas around the world, and
Such new strains can be very successful. This increases the amount of food
It has important implications, not only to increase the nutritional quality of the food, but also to increase it. Other areas that may benefit significantly from genomic information include forensic medicine,
Includes veterinary medicine, textile production, waste control and environmental improvement. In achieving any of the aforementioned beneficial results predicted for genomic studies,
A new obstacle is the overall magnitude of the amount of genomic information that is being screened and studied.
That's it. Available exotic, not exaggerated, whole screened and studied
Nucleic acid sequence data is unimaginably vast. In addition, newly sequenced
Since the DNA strands are sequentially recorded, the data itself becomes larger every day (virtually). Get
Due to the huge amount of nom data, this is stored and processed via a computer.
Is operated. Bioinformatics is a system for searching, processing, and analyzing biological information.
Is to use a computer. This field of data processing is currently
Considered important for discovery and development. Scientists call the traditional “wet”
t) "Biology, quantitative analysis, database comparison, and computer algorithm
Rhythm makes up. In this way, biological research can be done at least in advance in a virtual environment.
Done, and then the scientists actually do it in the lab. Bioinformatics tools
Tools and services include gene discovery, understanding of disease pathways, identification of new disease targets,
Drug discovery, including discovery and correlation of gene sequence mutations for disease and disease
Assist pharmaceutical and biotechnology researchers at all stages of development and development
You. Unfortunately, the traditional means of accessing genomic information has been to make the data computationally transparent
For comprehensive and easy access that can be analyzed or studied in a simple manner
Not. Genomic information is stored in a wide variety of databases, some of which are
Is public (available for free), some are commercial (available for a fee), some are
Is a manufacturer's own ("in-company" resources that are not shared with outsiders). Referring to FIG. 1, a public 102 and dedicated 104 genomic database, such as
A search tool 106 is available online. User 110
Databases 102, 104 and search using the interface device 112
Access the tool 106. The interface device 112
Access portal site 120 via an Internet connection 130
You. Portal 120 provides access to databases 102, 104 and search tool 106.
The connection is made via the Internet 140. User 110 is a genome research resource
Another mode of operation for accessing the
Does not use the portal 120 via the Internet connection. (This
The simplified connection mode is not shown). Interface device 11
2 is typically an implementation of a thin client browser application. Each database consists of data objects containing biological data. De
Data objects are the type of biological data they contain for each database.
And with regard to their format. Therefore, multiple data
For research on data from databases, researchers are presented in a unique data structure.
Learn how to interpret the data and the data content of each particular database
is necessary. This is a significant disadvantage. Therefore, what is needed is a variety of genomic databases (each of which is
Data (including genomic data objects in different formats)
Dynamically interpreted and presented to the user in a predictable and easily recognizable format
To be a bioinformatics visualization tool. In addition, various storage formats are used by different databases.
A large number of data objects that are analyzed using automated analysis tools.
From these proprietary formats, a format that allows the automated analysis tools used to be recognized.
Format. This is even more inconvenient. Therefore, what is needed is a diverse genomic database (each of which is
Data (including genomic data objects in different formats)
Translates dynamically so that it is presented to the parser in a uniform format
A bioinformatics software tool. Further, it has been discovered that pairs of data objects have a significant relationship to each other.
When done, conventional mechanisms for establishing linking relationships between them (
(Other than manually writing the note to itself). Such a mechanism is
, Pairs of data objects originate in two completely different databases
When seen, it is most not absent. Therefore, what is needed is a data object with a diverse database.
From a variety of formats and content types
Even the user establishes a linking relationship between these data objects
Is a software mechanism that can In addition, the Internet database host or central
Hyper text markup language provided by the Internet portal
Access and Navigate Word (HTML) Genome Data Files
Existing methods have significant limitations. For one thing, data manipulation and / or
There is no interactivity possible for analysis. This interactivity is
The consequences are significant. Therefore, what is needed is for the user to have the genomic data file
Via the Internet, these files are in the form of HTML (usually done)
Whether it is an expression or some other format that can display data
Software that can be accessed and navigated interactively
It is a wear mechanism. SUMMARY OF THE INVENTION [0033] It is an object of the present invention to convert data into a variety of genomic databases (each with a different
Data (including genomic data objects)
And present it to the user in a predictable and easily recognizable format.
To provide a bioinformatics visualization tool. Another object of the present invention is to provide a variety of genomic databases, each with a different
Format (including genomic data objects)
Translation, so that it is presented to the parser in a uniform format
Provide Io Informatics software processes and systems
That is. Still another object of the present invention is to provide a method for storing data objects in various databases.
From a variety of formats and content types
Even the user establishes a linking relationship between these data objects
To provide software processes and systems that can Yet another object of the present invention is to allow a user to use HTML (or other format).
G) Genome data files via the Internet
Software processes that can access and navigate
And provide systems. A further object of the present invention is to provide seamless access to multiple genomic databases.
Access and interactivity to one or more of their databases
To enable it even if it is a commercial (ie, paid) database
Business process. Some of the above objectives include a local genome database system,
And electronically communicate with one or more remote genome database systems.
Is enabled by the trusting data processing system. This data processing system
Allows users to graphically display genomic data objects
Includes graphical user interface. This is also genomic data
Object linker and one or more genomic data objects
Contains a linkable data object resolver that resolves
The project consists of a local genome database system and one or more
Data objects found in remote genome database system
Linkable for the target genomic data object from within the project
You. Resolved objects resolved by the Linkable Data Object Resolver
Nom data objects are processed by the data object linker
Resolved genomic data object linked to nom data object
And the target genomic data object are graphical user
Will be provided to the interface. Some of the above objectives also include a local genome database system.
And one or more remote genome database systems and electronics
It is also made possible by a system for performing genomic research, which communicates dynamically.
The system provides users with a graphical view of genomic data objects.
Means to present genomic data objects and link them to each other.
Means. The system also stores genomic data objects in raw
Cal Genome Database System and One or More Remote Geno
Genome Data Objects Discovered in the System Database System
Means for resolving a genomic data object of interest from within
The resolved genomic data object resolved by the resolving means
Linked to the target genomic data object by
Nom data object and target genome data object
And provided to the means for printing. [0040] Another method that enables some of the above objectives involves genomic research.
Local genome database and
And one or more remote genome databases as resources
Depending on the method of execution. This method uses linkable genomic data
Objects are stored in a local genome database system and one or more
Target genome data from multiple remote genome database systems
For data objects, the data format of the genomic data object
Including the operation to solve regardless of the mat. In addition, this method is
Data objects to linkable genomic data objects
And forming a set of linked genomic data objects. Sa
In addition, this method uses a local set of linked genomic data objects.
-Includes storing in the genome database. Yet another method that enables some of the above objectives is the Genome Lab.
Computer system implementing the method as described above for use in research.
It depends on the system. One of the above objectives is enabled by the new technical information model and enforcement mechanism
It is said. It provides genomic visualization and analysis tools to genomic data objects.
The ability to link projects across (and within) multiple databases
Implemented by combining. Another of the above objectives is to control access to multiple genomic databases.
In this case, the genomic database is
Nom database, public genomic database and commercial genomic database
Including This method links the linkable data object to the target data object.
Steps to resolve for the object, and further resolved data objects
Linking the data to the target genomic data object. Official Geno
Linkable data objects that are resolved from the
Regardless of the data format of the genomic data object stored in
Solved, no restrictions on access costs. Commercial Genome Database
Linkable data objects that are resolved from the
Is resolved regardless of the data format of the
Resolved by applying applicable prescribed access agreements for nom databases
Is done. Yet another way in which some of the above objects are enabled is a computer
Controllers that can control access to multiple genomic databases.
Depends on Pewter Program product. Multiple genomic databases are
Genome database, public genome database and commercial genome database
Including Computer program products allow computers to perform specified operations.
Software instructions to enable
Computer readable medium. The predetermined operation includes the operation according to the method described above.
It is. One aspect of the present invention is a nucleic acid sequence, amino acid sequence, oligonucleotide, Basi
c Local Aligned Search Tool (BLAST) search
Results, and entries from medical databases such as MEDLINE
A local database for storing nom data. Another aspect of the present invention is a visualization and analysis mechanism. Visualization and analysis are preferred
Or provided via a dialog box, to set parameters for BLAST search.
Configurable so that text-based searches consist of sequence databases
And search for documents can be performed in a database.
The linker uses nucleic acid sequences, amino acid sequences, BLAST search results,
Included to link birds and the like together. All types of genomic / biomedical
The information is displayed in a graphical interface that incorporates viewer and editor components.
Visualized through the interface. [0047] Yet another aspect of the invention is a link between database objects.
Internet connector having a programming module that solves
You. This connector can be a local database or a remote Internet
Check the server to get the required data object. [0048] Additional objects and advantages of the invention will be set forth in the following detailed description taken in conjunction with the accompanying drawings.
It will be clear from that. DETAILED DESCRIPTION OF THE INVENTION One way to consider the present invention is to use a thin client browser and a thin client browser.
Use the portal (see Figure 1) to give researchers access to genomic research resources
Is to be abandoned. Instead, the applicant
Increases the effectiveness of systems that provide a tactical interface with resources
I discovered that. This interactivity is needed to increase the effectiveness of genomic research
is important. Another method of considering the present invention is a technical information model and an implementation machine.
It is as a composition. An aspect of the interactivity of the present invention is the data object
And a combination of aspects of its visualization and analysis. In addition to the local database for storing intermediate and final results,
Ming has aspects of visualization and analysis. Visualizations are provided in an advanced format,
This is a graphical tool that intuitively appeals sequences and other molecules to human perception.
This is shown in the presentation. In addition to interactivity,
Users can easily integrate (ie, link) data and localize the integrated data.
The ability to store in a database is very useful. The additional functionality provided in the preferred embodiment of the present invention
A file that can be used directly in the user interface rather than through the Internet
A small scale analysis tool and algorithm. For full-scale analysis, DN
A for protein, enzyme and oligo data set, BLAST results, MED
It can be evaluated in view of LINE Entrez data and amino acids. A software product that can provide the visualization and analysis aspects of the present invention.
One embodiment is the InformM from North Bethesda, Maryland.
ax, Inc. Vector NTI ™ product. Another aspect according to a preferred embodiment of the present invention is via the Internet
Multiple databases (eg, NCBI, Entrez, PubMed, SR
Provide an integrated database search using a solution system that contacts S)
Is Rukoto. Referring to FIG. 2, the public 202 and dedicated 204 databases, and various
Various research tools 206 are available online. Also, as a research resource
What is available is that user 210 has access to local database system 208
These are the research results before storage and data unique to other manufacturers. Like the prior art
In addition, the Internet 220 has various remote resources 202, 204, 20
6 to be used as a communication medium for accessing. However, in contrast to the prior art
Typically, a completely different set of tools is used to conduct the research. A user 210 utilizes a user interface 230, which is a visualization system.
System 232 and the data set linking mechanism 234 (hereinafter referred to as “linker”).
"). Linker 234 allows users to further study in relation to each other
To consolidate data sets that you consider worth associating
. The data set so linked contains the analysis tools and algorithm 2
40 can be used to more closely inspect or analyze. Used with the present invention
Examples of useful analysis tools and algorithms to include for use are BioP
lot ™, AlignX ™, and ContigExpress ™ (trademarks).
All of these are North Bethesda, MD's Infor
Max, Inc. Products. Some other available solutions, such as BLAST
Analysis tools can also be used effectively. This inspection and analysis procedure describes itself as the source data from which they were derived.
The result is that you can link to the set. Local database 208
Used, integrated data sets and results for later studies
210 or its colleagues. Later research, additional computer solutions
Analysis can be in the form of an analysis or if the results are deemed promising enough
If so, it can be in a biological laboratory. Candidates for linking include linkable data object resolution systems.
Identified by the program 250. Linkable data object resolution system
250 provides various search tools 206 and data via the Internet 220
Accessing either of the bases 202, 204, the user 210 may be interested in
Data object associated with the target data object identified as
Explore about Resolution system 250 does not establish a link. Rather, the solution
System 250 is an enormous amount of data that can be used for browsing over the Internet.
Data collection should have reasonable probabilities associated with the data object of interest.
Identify data objects To limit and guide the search by the resolution system 250,
The accounting and accounting module 260 accesses the resolution system 250
Public 202 or commercial databases 204 with established agreements
To access only the database you want to access. Permission and
The accounting aspect of the accounting module 260 is based on commercial data.
Maintain access time, duration and authorization records for use of base 204
Carry. In addition to the apparatus aspects of the present invention, the methods also form some aspects of the present invention. Book
A method for performing genomic research according to the invention is first described in Linkable Genome Data.
By resolving the data objects, the linkable genomic data
Data object with the target genomic data object
This is performed by forming a set of pre-processed genomic data objects.
The resolution operation is performed on one or more resources with respect to the target genomic data object.
It is performed using the mote genome database as a resource. option
The Local Genome Database is Linkable Genome Data Object
Used in project resolution. The resolution operation is based on the genomic data object.
This is performed regardless of the data format of the genomic data.
This is because the object may be found in various databases.
After the genomic data objects are linked, they are linked to the genomic data.
Data objects stored in the local genome database.
preferable. Another aspect of the invention is to represent a business process, where
Predetermined access arrangements for commercial databases guide research steps
Access to these databases is used to
It is completely seamless from the point of view of the researcher / user using it. As a result,
, Multiple commercial and local (sometimes proprietary) genomic data
It is the process of managing access to the database. This process is linkable
Steps to resolve the data object with respect to the target data object
And the resolved data object to the target genome data object.
Linking the project. Resolved from public genome database
Linkable data objects are genomic data objects stored within them.
Resolves regardless of the object's data format and reduces access costs.
There are no restrictions. Linkable Day Resolved from Commercial Genome Database
Data object is the data of the genomic data object stored in it.
Data regardless of the data format, and
Resolved upon receipt of an available predetermined access agreement. Although the present invention has been described with reference to preferred embodiments, various modifications and improvements have been described.
What can be done in the embodiments described without departing from the scope of the invention
Will be understood. The scope of the present invention is limited by the appended claims. BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is an Internet database resource through a portal using a browser.
FIG. 2 is a diagram illustrating a conventional configuration for accessing a source. FIG. 2 illustrates the integration of Internet database resources according to one embodiment of the present invention.
It is a figure which illustrates combined access.
【手続補正書】
【提出日】平成14年8月26日(2002.8.26)
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】特許請求の範囲
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】 ローカル・データベース・システムと通信し、かつ1つまた
は複数のリモート・データベース・システムと通信するデータ処理システムであ
って、
ユーザがデータ・オブジェクトをグラフィカルに表示することができるグラフ
ィカル・ユーザ・インターフェイスと、
データ・オブジェクト・リンカと、
1つまたは複数のデータ・オブジェクトを解決するリンカブル・データ・オブ
ジェクト・リゾルバとを含み、このオブジェクトは、ローカル・データベース・
システムおよび1つまたは複数のリモート・データベース・システムにおいて発
見されたデータ・オブジェクトの中からの対象データ・オブジェクトに関してリ
ンカブルであり、
リンカブル・データ・オブジェクト・リゾルバによって解決された、解決済デ
ータ・オブジェクトが、データ・オブジェクト・リンカによって対象データ・オ
ブジェクトにリンクされ、解決済データ・オブジェクトおよび対象データ・オブ
ジェクトがそれぞれグラフィカル・ユーザ・インターフェイスに提供される、デ
ータ処理システム。
【請求項2】 ローカル・ゲノム・データベース・システムと電子的に通信
し、かつ1つまたは複数のリモート・ゲノム・データベース・システムと電子的
に通信するデータ処理システムであって、
ユーザがゲノム・データ・オブジェクトをグラフィカルに表示することができ
るグラフィカル・ユーザ・インターフェイスと、
ゲノム・データ・オブジェクト・リンカと、
1つまたは複数のゲノム・データ・オブジェクトを解決するリンカブル・デー
タ・オブジェクト・リゾルバとを含み、このオブジェクトは、ローカル・ゲノム
・データベース・システムおよび1つまたは複数のリモート・ゲノム・データベ
ース・システムにおいて発見されたデータ・オブジェクトの中からの対象ゲノム
・データ・オブジェクトに関してリンカブルであり、
リンカブル・データ・オブジェクト・リゾルバによって解決された、解決済ゲ
ノム・データ・オブジェクトが、データ・オブジェクト・リンカによって対象ゲ
ノム・データ・オブジェクトにリンクされ、解決済ゲノム・データ・オブジェク
トおよび対象ゲノム・データ・オブジェクトがそれぞれグラフィカル・ユーザ・
インターフェイスに提供される、データ処理システム。
【請求項3】 1つまたは複数のリモート・ゲノム・データベース・システ
ムと、ネットワークを介して通信する、請求項2に記載のデータ処理システム。
【請求項4】 1つまたは複数のリモート・ゲノム・データベース・システ
ムと、ネットワークのネットワークを介して通信する、請求項2に記載のデータ
処理システム。
【請求項5】 1つまたは複数のリモート・ゲノム・データベース・システ
ムと、インターネットを介して通信する、請求項2に記載のデータ処理システム
。
【請求項6】 解決済ゲノム・データ・オブジェクトおよび対象ゲノム・デ
ータ・オブジェクトがそれぞれ、核酸配列、アミノ酸配列、オリゴヌクレオチド
、BLAST探索の結果および医療データからなるグループから選択されたデー
タ・タイプのものである、請求項2に記載のデータ処理システム。
【請求項7】 解決済ゲノム・データ・オブジェクトおよび対象ゲノム・デ
ータ・オブジェクトが異なるデータ・タイプのものである、請求項6に記載のデ
ータ処理システム。
【請求項8】 ローカル・ゲノム・データベース・システムおよび1つまた
は複数のリモート・ゲノム・データベース・システムがそれぞれ、核酸配列、ア
ミノ酸配列、オリゴヌクレオチド、BLAST探索の結果および医療データから
なるグループから選択されるタイプのデータ・オブジェクトを含む、請求項2に
記載のデータ処理システム。
【請求項9】 グラフィカル・ユーザ・インターフェイスが、核酸配列、ア
ミノ酸配列、オリゴヌクレオチド、BLAST探索の結果および医療データをグ
ラフィカルに示す機能を有する、請求項2に記載のデータ処理システム。
【請求項10】 ゲノム・データ・オブジェクト・リンカが、異なるデータ
・タイプのものであるゲノム・データ・オブジェクトをリンクする、請求項2に
記載のデータ処理システム。
【請求項11】 ゲノム研究を実行するためのシステムであって、このシス
テムはローカル・ゲノム・データベース・システムと電子的に通信し、かつ1つ
または複数のリモート・ゲノム・データベース・システムと電子的に通信し、
ユーザにゲノム・データ・オブジェクトのグラフィカル・ビューを提示する手
段と、
ゲノム・データ・オブジェクトを互いにリンクする手段と、
ゲノム・データ・オブジェクトを、ローカル・ゲノム・データベース・システ
ムおよび1つまたは複数のリモート・ゲノム・データベース・システムにおいて
発見されたゲノム・データ・オブジェクトの中からの、対象ゲノム・データ・オ
ブジェクトに関して解決する手段とを含み、
解決する手段によって解決された解決済ゲノム・データ・オブジェクトが、リ
ンクする手段によって対象ゲノム・データ・オブジェクトにリンクされ、解決済
ゲノム・データ・オブジェクトおよび対象ゲノム・データ・オブジェクトがそれ
ぞれ提示する手段に提供される、ゲノム研究を実行するためのシステム。
【請求項12】 1つまたは複数のリモート・ゲノム・データベース・シス
テムと、インターネットを介して通信する、請求項11に記載のゲノム研究を実
行するためのシステム。
【請求項13】 解決済ゲノム・データ・オブジェクトおよび対象の解決済
ゲノム・データ・オブジェクトがそれぞれ、核酸配列、アミノ酸配列、オリゴヌ
クレオチド、BLAST探索の結果および医療データからなるグループから選択
されたデータ・タイプのものである、請求項11に記載のゲノム研究を実行する
ためのシステム。
【請求項14】 解決済ゲノム・データ・オブジェクトおよび対象の解決済
ゲノム・データ・オブジェクトが異なるデータ・タイプのものである、請求項1
3に記載のゲノム研究を実行するためのシステム。
【請求項15】 ローカル・ゲノム・データベース・システムおよび1つま
たは複数のリモート・ゲノム・データベース・システムがそれぞれ、核酸配列、
アミノ酸配列、オリゴヌクレオチド、BLAST探索の結果および医療データか
らなるグループから選択されるタイプのデータ・オブジェクトを含む、請求項1
1に記載のゲノム研究を実行するためのシステム。
【請求項16】 提示する手段が、核酸配列、アミノ酸配列、オリゴヌクレ
オチド、BLAST探索の結果および医療データをグラフィカルに示す機能を有
する、請求項11に記載のゲノム研究を実行するためのシステム。
【請求項17】 リンクする手段が、異なるデータ・タイプのものであるゲ
ノム・データ・オブジェクトをリンクする、請求項11に記載のゲノム研究を実
行するためのシステム。
【請求項18】 ローカル・ゲノム・データベースおよびリモート・ゲノム
・データベースをリソースとして使用した、対象ゲノム・データ・オブジェクト
に関するゲノム研究に適合されたコンピュータ・システムであって、
プロセッサと、
メモリとを含み、このメモリはプロセッサと電子的に通信し、
リンカブル・ゲノム・データ・オブジェクトを、ローカル・ゲノム・データベ
ースおよびリモート・ゲノム・データベースの中からの、対象ゲノム・データ・
オブジェクトに関して、ゲノム・データ・オブジェクトのデータ・フォーマット
に関わらず、解決するステップと、
対象ゲノム・データ・オブジェクトを、リンカブル・ゲノム・データ・オブジ
ェクトにリンクして、リンク済ゲノム・データ・オブジェクトのセットを形成す
るステップと、
リンク済ゲノム・データ・オブジェクトのセットをローカル・ゲノム・データ
ベースに格納するステップとをコンピュータ・システムが実行できるように適合
されたソフトウェア命令を含む、コンピュータ・システム。
【請求項19】 ローカル・ゲノム・データベースおよび1つまたは複数の
リモート・ゲノム・データベースをリソースとして使用して、対象ゲノム・デー
タ・オブジェクトに関してゲノム研究を実行する方法であって、
リンカブル・ゲノム・データ・オブジェクトを、ローカル・ゲノム・データベ
ースおよび1つまたは複数のリモート・ゲノム・データベースの中からの、対象
ゲノム・データ・オブジェクトに関して、ゲノム・データ・オブジェクトのデー
タ・フォーマットに関わらず、解決すること、
対象ゲノム・データ・オブジェクトを、リンカブル・ゲノム・データ・オブジ
ェクトにリンクして、リンク済ゲノム・データ・オブジェクトのセットを形成す
ること、および
リンク済ゲノム・データ・オブジェクトのセットをローカル・ゲノム・データ
ベースに格納することを含む、ゲノム研究を実行する方法。
【請求項20】 解決済ゲノム・データ・オブジェクトおよび対象ゲノム・
データ・オブジェクトがそれぞれ、核酸配列、アミノ酸配列、オリゴヌクレオチ
ド、BLAST探索の結果および医療データからなるグループから選択されたデ
ータ・タイプのものである、請求項19に記載のゲノム研究を実行する方法。
【請求項21】 解決済ゲノム・データ・オブジェクトおよび対象ゲノム・
データ・オブジェクトが異なるデータ・タイプのものである、請求項20に記載
のゲノム研究を実行する方法。
【請求項22】 ローカル・ゲノム・データベース・システムおよび1つま
たは複数のリモート・ゲノム・データベース・システムがそれぞれ、核酸配列、
アミノ酸配列、オリゴヌクレオチド、BLAST探索の結果および医療データか
らなるグループから選択されるタイプのデータ・オブジェクトを含む、請求項1
9に記載のゲノム研究を実行する方法。
【請求項23】 グラフィカル・ユーザ・インターフェイスを提供して、対
象ゲノム・データ・オブジェクトおよび解決済ゲノム・データ・オブジェクトを
、それらが核酸配列、アミノ酸配列、オリゴヌクレオチド、BLAST探索の結
果または医療データであるかに関わらず、グラフィカルに示すことをさらに含む
、請求項19に記載のゲノム研究を実行する方法。
【請求項24】 リンクする動作が、異なるデータ・タイプのものであるゲ
ノム・データ・オブジェクトをリンクする、請求項19に記載のゲノム研究を実
行する方法。
【請求項25】 複数のゲノム・データベースへのアクセスを管理する方法
であって、複数のゲノム・データベースはローカル・ゲノム・データベース、公
用ゲノム・データベースおよび商用ゲノム・データベースを含み、
1つまたは複数のリンカブル・データ・オブジェクトを対象データ・オブジェ
クトに関して解決すること、および、
1つまたは複数の解決済データ・オブジェクトを前記対象ゲノム・データ・オ
ブジェクトにリンクすることを含み、
1つまたは複数のリンカブル・データ・オブジェクトが公用ゲノム・データベ
ースから、その中に格納されたゲノム・データ・オブジェクトのデータ・フォー
マットに関わらず、アクセス・コストについての制限がなく解決され、
1つまたは複数のリンカブル・データ・オブジェクトが商用ゲノム・データベ
ースから、その中に格納されたゲノム・データ・オブジェクトのデータ・フォー
マットに関わらず、商用ゲノム・データベースについての所定のアクセス取り決
めを受けて解決される、複数のゲノム・データベースへのアクセスを管理する方
法。
【請求項26】 解決済ゲノム・データ・オブジェクトおよび対象ゲノム・
データ・オブジェクトがそれぞれ、核酸配列、アミノ酸配列、オリゴヌクレオチ
ド、BLAST探索の結果および医療データからなるグループから選択されたデ
ータ・タイプのものである、請求項25に記載の複数のゲノム・データベースへ
のアクセスを管理する方法。
【請求項27】 解決済ゲノム・データ・オブジェクトおよび対象ゲノム・
データ・オブジェクトが異なるデータ・タイプのものである、請求項26に記載
の複数のゲノム・データベースへのアクセスを管理する方法。
【請求項28】 ローカル・ゲノム・データベース・システムおよび1つま
たは複数のリモート・ゲノム・データベース・システムがそれぞれ、核酸配列、
アミノ酸配列、オリゴヌクレオチド、BLAST探索の結果および医療データか
らなるグループから選択されるタイプのデータ・オブジェクトを含む、請求項2
5に記載の複数のゲノム・データベースへのアクセスを管理する方法。
【請求項29】 グラフィカル・ユーザ・インターフェイスを提供して、対
象ゲノム・データ・オブジェクトおよび解決済ゲノム・データ・オブジェクトを
、それらが核酸配列、アミノ酸配列、オリゴヌクレオチド、BLAST探索の結
果または医療データであるかに関わらず、グラフィカルに示すことをさらに含む
、請求項25に記載の複数のゲノム・データベースへのアクセスを管理する方法
。
【請求項30】 リンクする動作が、異なるデータ・タイプのものであるゲ
ノム・データ・オブジェクトをリンクする、請求項25に記載の複数のゲノム・
データベースへのアクセスを管理する方法。
【請求項31】 コンピュータが、ローカル・ゲノム・データベースおよび
リモート・ゲノム・データベースをリソースとして使用して、対象ゲノム・デー
タ・オブジェクトに関してゲノム研究を実行できるようにするためのコンピュー
タ・プログラム製品であって、
コンピュータが所定の動作を実行できるようにするためのソフトウェア命令と
、
ソフトウェア命令を実施するコンピュータ可読媒体とを含み、
所定の動作は、
リンカブル・ゲノム・データ・オブジェクトを、ローカル・ゲノム・データベ
ースおよびリモート・ゲノム・データベースの中からの、対象ゲノム・データ・
オブジェクトに関して、ゲノム・データ・オブジェクトのデータ・フォーマット
に関わらず、解決する動作と、
対象ゲノム・データ・オブジェクトを、リンカブル・ゲノム・データ・オブジ
ェクトにリンクして、リンク済ゲノム・データ・オブジェクトのセットを形成す
る動作と、
リンク済ゲノム・データ・オブジェクトのセットをローカル・ゲノム・データ
ベースに格納する動作とを含む、コンピュータ・プログラム製品。
【請求項32】 コンピュータが複数のゲノム・データベースへのアクセス
を管理できるようにするためのコンピュータ・プログラム製品であって、複数の
ゲノム・データベースは、ローカル・ゲノム・データベース、公用ゲノム・デー
タベースおよび商用ゲノム・データベースを含み、
コンピュータが所定の動作を実行できるようにするためのソフトウェア命令と
、
ソフトウェア命令を実施するコンピュータ可読媒体とを含み、
所定の動作は、
1つまたは複数のリンカブル・データ・オブジェクトを対象データ・オブジェ
クトに関して解決する動作と、
1つまたは複数の解決済データ・オブジェクトを前記対象ゲノム・データ・オ
ブジェクトにリンクする動作とを含み、
1つまたは複数のリンカブル・データ・オブジェクトが公用ゲノム・データベ
ースから、その中に格納されたゲノム・データ・オブジェクトのデータ・フォー
マットに関わらず、アクセス・コストについての制限がなく解決され、
1つまたは複数のリンカブル・データ・オブジェクトが商用ゲノム・データベ
ースから、その中に格納されたゲノム・データ・オブジェクトのデータ・フォー
マットに関わらず、商用ゲノム・データベースについての所定のアクセス取り決
めを受けて解決される、コンピュータ・プログラム製品。
【請求項33】 ローカル・ゲノム・データベース・システムと電子的に通
信し、かつ1つまたは複数のリモート・ゲノム・データベース・システムと電子
的に通信するデータ処理システムであって、
ユーザがゲノム・データ・オブジェクトをグラフィカルに表示することができ
るグラフィカル・ユーザ・インターフェイスと、
ゲノム・データ・オブジェクト・リンカと、
1つまたは複数のゲノム・データ・オブジェクトを解決するリンカブル・デー
タ・オブジェクト・リゾルバとを含み、このオブジェクトは、ローカル・ゲノム
・データベース・システムおよび1つまたは複数のリモート・ゲノム・データベ
ース・システムにおいて発見されたデータ・オブジェクトの中からの対象ゲノム
・データ・オブジェクトに関してリンカブルであり、さらに、
グラフィカル・ユーザ・インターフェイスに統合された1つまたは複数のゲノ
ム解析ツールとを含み、
リンカブル・データ・オブジェクト・リゾルバによって解決された、解決済ゲ
ノム・データ・オブジェクトが、データ・オブジェクト・リンカによって対象ゲ
ノム・データ・オブジェクトにリンクされ、解決済ゲノム・データ・オブジェク
トおよび対象ゲノム・データ・オブジェクトがそれぞれグラフィカル・ユーザ・
インターフェイスに提供されて、1つまたは複数のゲノム解析ツールを介した解
析を受けるようにされる、データ処理システム。
[Procedure amendment] [Submission date] August 26, 2002 (2002.8.26) [Procedure amendment 1] [Document name to be amended] Description [Item name to be amended] Claims [Amendment method] A data processing system that communicates with a local database system and communicates with one or more remote database systems, wherein the user has data. A graphical user interface capable of graphically displaying objects, a data object linker, and a linkable data object resolver for resolving one or more data objects, the objects comprising: Local database
A resolved data object that is linkable with respect to a target data object from among the data objects found in the system and one or more remote database systems, and that is resolved by the linkable data object resolver. A data processing system linked to a target data object by a data object linker, wherein the resolved data object and the target data object are each provided to a graphical user interface. 2. A data processing system in electronic communication with a local genomic database system and electronically with one or more remote genomic database systems, wherein a user is provided with genomic data. A graphical user interface capable of graphically displaying objects, a genomic data object linker, and a linkable data object resolver for resolving one or more genomic data objects; The object is linkable with respect to the target genomic data object from among the data objects found in the local genomic database system and one or more remote genomic database systems, The resolved genomic data object resolved by the linkable data object resolver is linked to the target genomic data object by the data object linker, and the resolved genomic data object and the target genomic data object are resolved. Each object is a graphical user
Data processing system provided to the interface. 3. The data processing system according to claim 2, wherein the data processing system communicates with one or more remote genome database systems via a network. 4. The data processing system of claim 2, wherein the data processing system communicates with one or more remote genome database systems via a network of networks. 5. The data processing system according to claim 2, wherein the data processing system communicates with one or more remote genome database systems via the Internet. 6. The resolved genomic data object and the target genomic data object are each of a data type selected from the group consisting of nucleic acid sequences, amino acid sequences, oligonucleotides, BLAST search results, and medical data. The data processing system according to claim 2, wherein 7. The data processing system of claim 6, wherein the resolved genomic data object and the target genomic data object are of different data types. 8. The local genomic database system and one or more remote genomic database systems are each selected from the group consisting of nucleic acid sequences, amino acid sequences, oligonucleotides, BLAST search results, and medical data. 3. The data processing system of claim 2, wherein the data processing system includes data objects of different types. 9. The data processing system according to claim 2, wherein the graphical user interface has a function of graphically displaying a nucleic acid sequence, an amino acid sequence, an oligonucleotide, a BLAST search result, and medical data. 10. The data processing system of claim 2, wherein the genomic data object linker links genomic data objects of different data types. 11. A system for performing genomic research, the system electronically communicating with a local genomic database system and electronically communicating with one or more remote genomic database systems. Means for presenting a graphical view of genomic data objects to a user, means for linking genomic data objects to each other, genomic data objects to a local genomic database system and one Or a means for resolving the target genomic data object from among the genomic data objects found in the plurality of remote genomic database systems, and the resolved genomic data solved by the resolving means.・ If the object is System for linked to the target genomic data objects by click to means, resolved genomic data object and target genomic data object is provided to means for presenting each executes genomic research. 12. The system for performing genomic research according to claim 11, wherein the system is in communication with one or more remote genomic database systems via the Internet. 13. The resolved genomic data object and the resolved genomic data object of interest are data selected from the group consisting of a nucleic acid sequence, an amino acid sequence, an oligonucleotide, a BLAST search result, and medical data, respectively. 12. A system for performing genomic research according to claim 11, wherein the system is of the type. 14. The resolved genomic data object and the resolved genomic data object of interest are of different data types.
4. A system for performing a genomic study according to 3. 15. The local genomic database system and one or more remote genomic database systems each comprise a nucleic acid sequence,
2. A data object of a type selected from the group consisting of amino acid sequences, oligonucleotides, BLAST search results and medical data.
2. A system for performing a genomic study according to 1. 16. The system for performing a genomic study according to claim 11, wherein the means for presenting has a function of graphically displaying a nucleic acid sequence, an amino acid sequence, an oligonucleotide, a BLAST search result, and medical data. 17. The system for performing genomic research according to claim 11, wherein the linking means links genomic data objects that are of different data types. 18. A computer system adapted for genomic research on a subject genomic data object using a local genomic database and a remote genomic database as resources, comprising: a processor; and a memory; This memory communicates electronically with the processor to store the Linkable Genome Data Objects from the Local Genome Database and the Remote Genome Database from the target Genome Data.
Resolving the object, irrespective of the data format of the genomic data object, linking the target genomic data object to the linkable genomic data object, and setting the linked genomic data object And a software instruction adapted to enable the computer system to perform the steps of forming a set of linked genomic data objects in a local genomic database. 19. A method for performing a genomic study on a genomic data object of interest using a local genomic database and one or more remote genomic databases as a resource, comprising: linkable genomic data; Resolving the object with respect to the subject genomic data object from the local genomic database and one or more remote genomic databases, regardless of the data format of the genomic data object; Linking the target genomic data object to a linkable genomic data object to form a set of linked genomic data objects; and linking the set of linked genomic data objects to a local genomic data object. A method for performing genomic research, including storing in a genomic database. 20. The resolved genome data object and the target genome
20. The method of performing genomic studies according to claim 19, wherein the data objects are each of a data type selected from the group consisting of nucleic acid sequences, amino acid sequences, oligonucleotides, BLAST search results, and medical data. 21. The resolved genome data object and the target genome
21. The method of performing genomic research according to claim 20, wherein the data objects are of different data types. 22. The system of claim 1, wherein the local genome database system and the one or more remote genome database systems each comprise a nucleic acid sequence,
2. A data object of a type selected from the group consisting of amino acid sequences, oligonucleotides, BLAST search results and medical data.
10. A method for performing a genomic study according to 9. 23. A method for providing a graphical user interface to associate a genomic data object and a resolved genomic data object with nucleic acid sequences, amino acid sequences, oligonucleotides, BLAST search results or medical data. 20. The method of performing genomic research according to claim 19, further comprising graphically indicating whether or not there is. 24. The method of performing genomic research according to claim 19, wherein the linking operation links genomic data objects that are of different data types. 25. A method for managing access to a plurality of genomic databases, wherein the plurality of genomic databases includes a local genomic database, a public genomic database, and a commercial genomic database, Resolving a linkable data object with respect to a target data object; and linking one or more resolved data objects to said target genomic data object, comprising: one or more linkable data; Objects are resolved from a public genomic database, regardless of the data format of the genomic data objects stored therein, without restrictions on access costs, and one or more linkable data objects are Access to multiple genomic databases from a genomic database for use, irrespective of the data format of the genomic data objects stored in it, with a predetermined access agreement for a commercial genomic database How to manage. 26. The resolved genome data object and the target genome
26. The method according to claim 25, wherein the data objects are each of a data type selected from the group consisting of nucleic acid sequences, amino acid sequences, oligonucleotides, BLAST search results, and medical data. How to manage access. 27. The resolved genome data object and the target genome
27. The method of managing access to multiple genomic databases according to claim 26, wherein the data objects are of different data types. 28. The method according to claim 28, wherein the local genome database system and the one or more remote genome database systems each comprise a nucleic acid sequence,
3. A data object of a type selected from the group consisting of amino acid sequences, oligonucleotides, BLAST search results and medical data.
6. The method for managing access to a plurality of genome databases according to 5. 29. Providing a graphical user interface to associate a genomic data object and a resolved genomic data object with nucleic acid sequences, amino acid sequences, oligonucleotides, BLAST search results or medical data. 26. The method of managing access to a plurality of genomic databases according to claim 25, further comprising graphically indicating whether or not there is. 30. A method according to claim 25, wherein the linking operation links genomic data objects of different data types.
How to manage access to the database. 31. A computer program product for enabling a computer to perform a genomic study on a genomic data object of interest using a local genomic database and a remote genomic database as resources. , Including software instructions for enabling a computer to perform predetermined operations, and computer readable media for performing the software instructions, wherein the predetermined operations include linkable genomic data objects, local genomic databases and Target genomic data from remote genomic database
Regarding the object, regardless of the data format of the genomic data object, the operation to solve and link the target genomic data object to the linkable genomic data object, and set the linked genomic data object And storing the set of linked genomic data objects in a local genomic database. 32. A computer program product for enabling a computer to manage access to a plurality of genomic databases, the plurality of genomic databases comprising a local genomic database, a public genomic database, and a commercial genomic database. A software instruction for enabling a computer to perform a predetermined operation, including a genomic database; and a computer-readable medium for implementing the software instruction, wherein the predetermined operation comprises one or more linkable data objects. Solving for the target data object; and linking one or more resolved data objects to the target genome data object, wherein the one or more linkable data objects are From a database, regardless of the data format of the genomic data objects stored therein, without any restrictions on access costs; one or more linkable data objects can be retrieved from a commercial genomic database , A computer program product that is resolved with predetermined access arrangements for a commercial genomic database, regardless of the data format of the genomic data objects stored therein. 33. A data processing system in electronic communication with a local genomic database system and in electronic communication with one or more remote genomic database systems, wherein a user is provided with genomic data. A graphical user interface capable of graphically displaying objects, a genomic data object linker, and a linkable data object resolver for resolving one or more genomic data objects; The object is linkable with respect to the target genomic data object from among the data objects found in the local genomic database system and one or more remote genomic database systems. And one or more genomic analysis tools integrated into the graphical user interface, wherein the resolved genomic data objects resolved by the linkable data object resolver are combined with the data object linker. Linked to the target genomic data object, and the resolved genomic data object and the target genomic data object
A data processing system provided to the interface and adapted for analysis via one or more genomic analysis tools.
Claims (1)
は複数のリモート・データベース・システムと通信するデータ処理システムであ
って、 ユーザがデータ・オブジェクトをグラフィカルに表示することができるグラフ
ィカル・ユーザ・インターフェイスと、 データ・オブジェクト・リンカと、 1つまたは複数のデータ・オブジェクトを解決するリンカブル・データ・オブ
ジェクト・リゾルバとを含み、このオブジェクトは、ローカル・データベース・
システムおよび1つまたは複数のリモート・データベース・システムにおいて発
見されたデータ・オブジェクトの中からの対象データ・オブジェクトに関してリ
ンカブルであり、 リンカブル・データ・オブジェクト・リゾルバによって解決された、解決済デ
ータ・オブジェクトが、データ・オブジェクト・リンカによって対象データ・オ
ブジェクトにリンクされ、解決済データ・オブジェクトおよび対象データ・オブ
ジェクトがそれぞれグラフィカル・ユーザ・インターフェイスに提供される、デ
ータ処理システム。Claims 1. A data processing system in communication with a local database system and with one or more remote database systems, wherein a user graphically displays data objects. A graphical user interface, a data object linker, and a linkable data object resolver for resolving one or more data objects, the objects comprising a local database database.
A resolved data object that is linkable with respect to a target data object from among the data objects found in the system and one or more remote database systems, and that is resolved by the linkable data object resolver. A data processing system linked to a target data object by a data object linker, wherein the resolved data object and the target data object are each provided to a graphical user interface.
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US49192000A | 2000-01-27 | 2000-01-27 | |
| US09/491,920 | 2000-01-27 | ||
| PCT/US2001/002527 WO2001055911A1 (en) | 2000-01-27 | 2001-01-26 | Integrated access to biomedical resources |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003521071A true JP2003521071A (en) | 2003-07-08 |
Family
ID=23954214
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001555385A Withdrawn JP2003521071A (en) | 2000-01-27 | 2001-01-26 | Integrated access to biomedical resources |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP1264249A1 (en) |
| JP (1) | JP2003521071A (en) |
| WO (1) | WO2001055911A1 (en) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7577683B2 (en) | 2000-06-08 | 2009-08-18 | Ingenuity Systems, Inc. | Methods for the construction and maintenance of a knowledge representation system |
| JP4594622B2 (en) | 2002-02-04 | 2010-12-08 | インジェヌイティ システムズ インコーポレイテッド | Drug discovery method |
| US8793073B2 (en) | 2002-02-04 | 2014-07-29 | Ingenuity Systems, Inc. | Drug discovery methods |
| DE10206406A1 (en) * | 2002-02-15 | 2003-11-13 | Smartgene Gmbh Reinach | Device and method for carrying out and evaluating genetic analyzes |
| CN108629701B (en) * | 2018-05-07 | 2022-03-18 | 深圳供电局有限公司 | Power grid multistage scheduling data integration method |
| WO2020247752A1 (en) * | 2019-06-06 | 2020-12-10 | The Johns Hopkins University | Determining causes of diseases such as cancer, using machine learning analysis of genetic data |
| CN120373924B (en) * | 2024-12-02 | 2025-11-04 | 河北工业大学 | Big data processing method for development diagnosis of biological medicine industry |
-
2001
- 2001-01-26 EP EP01903329A patent/EP1264249A1/en not_active Withdrawn
- 2001-01-26 WO PCT/US2001/002527 patent/WO2001055911A1/en not_active Ceased
- 2001-01-26 JP JP2001555385A patent/JP2003521071A/en not_active Withdrawn
Also Published As
| Publication number | Publication date |
|---|---|
| WO2001055911A1 (en) | 2001-08-02 |
| EP1264249A1 (en) | 2002-12-11 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Rock | Artificial Intelligence (AI) in Arkansas (AR) | |
| McCue et al. | The scope of big data in one medicine: unprecedented opportunities and challenges | |
| Bassett et al. | Gene expression informatics—it's all in your mine | |
| Zhang et al. | GOTree Machine (GOTM): a web-based platform for interpreting sets of interesting genes using Gene Ontology hierarchies | |
| Shen et al. | BarleyBase—an expression profiling database for plant genomics | |
| Petricoin III et al. | Medical applications of microarray technologies: a regulatory science perspective | |
| Hocquette | Where are we in genomics? | |
| EP1222602B1 (en) | Artificial intelligence system for genetic analysis | |
| CA2420717E (en) | Artificial intelligence system for genetic analysis | |
| US20040249677A1 (en) | Comprehensive searchable medical record system supporting healthcare delivery and experiment | |
| Holzinger | Biomedical informatics: discovering knowledge in big data | |
| US20120177261A1 (en) | Artificial intelligence system for genetic analysis | |
| US20190130290A1 (en) | Object oriented system and method having semantic substructures for machine learning | |
| MacMullen et al. | Information problems in molecular biology and bioinformatics | |
| Molidor et al. | New trends in bioinformatics: from genome sequence to personalized medicine | |
| WO2003009210A1 (en) | Methods of providing customized gene annotation reports | |
| Pandey et al. | Issues and challenges in bioinformatics tools for clinical trials | |
| Jiang et al. | UKB-MDRMF: a multi-disease risk and multimorbidity framework based on UK biobank data | |
| Martin-Sanchez et al. | Biomedical informatics methods for personalized medicine and participatory health | |
| JP2003521071A (en) | Integrated access to biomedical resources | |
| Viti et al. | Ontology-based, Tissue MicroArray oriented, image centered tissue bank | |
| Töpel et al. | RAMEDIS: the rare metabolic diseases database | |
| Buckingham | Scientific software: seeing the SNPs between us | |
| Claros et al. | Computational tools for handling large databases of biological relevance | |
| Fielden et al. | Iconix Biosciences, Inc. |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080401 |