JP2005332080A - 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 - Google Patents
視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 Download PDFInfo
- Publication number
- JP2005332080A JP2005332080A JP2004148236A JP2004148236A JP2005332080A JP 2005332080 A JP2005332080 A JP 2005332080A JP 2004148236 A JP2004148236 A JP 2004148236A JP 2004148236 A JP2004148236 A JP 2004148236A JP 2005332080 A JP2005332080 A JP 2005332080A
- Authority
- JP
- Japan
- Prior art keywords
- information
- content
- keyword
- concept
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 本発明は、コンテンツが属する分類カテゴリとコンテンツが持つキーワードが属する分類カテゴリとを比較し、概念マップ上で、コンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離が遠いほど重み率は軽くなり、近いほど重くなるようなキーワードの重み率を算出し、コンテンツが持つキーワードそれぞれに対し、概念マップ上で当てはまるキーワードベクトルに重み率を掛けて、全てののキーワードの重心をとることで、コンテンツの配置座標を算出する。
【選択図】 図1
Description
James A. Wise, et. Al. Visualizing the non-visual: Spatial analysis and interaction with information from text documents Proc. Of IEEE Information Visualization ’95, pp. 51-58(1995) 熊本睦他、「概念ベースの情報検索への適用−概念ベースを用いた検索の特徴評価」、信学技報、AI98-63(1999) 笠原要他、「国語辞書を利用した日常語の類似性判別、情処論、Vol, 138,No7, pp. 1272-1283, (1997) 藤田悦郎他、「分類情報と言語情報の統合利用に基づくコンテンツ空間の可視化」、DEWS2003 1-P-03(2003,Mar.) http://www.ieice.org/iss/de/DEWS/proc/2003/program.html#1st-1-P
予め決められた特徴的な単語で表された分類カテゴリの単語情報によって分類されたコンテンツを、
同様の分類カテゴリによって分類された大量の語彙情報(概念ベクトル)によって作られた概念ベース(概念ベクトルの集まりで辞書のようなもの)で作られ、該概念ベースの持つ概念ベクトルが配置されている概念マップ上に、コンテンツの持つキーワード(語彙)を基に分類配置する際に、
概念マップ上へのコンテンツ登録要求が発行されると、コンテンツのキーワードと分類カテゴリ情報、該概念マップの持つ分類カテゴリ情報、及び、キーワード(語彙)情報を記憶手段から取得する情報取得ステップと(ステップ1)、
分類カテゴリ情報と、キーワード情報を比較し、概念マップ上でコンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離が遠いほど重み率は軽くなり、近いほど重くなるような重み率を算出する重み率算出ステップと(ステップ2)、
コンテンツが持つキーワードそれぞれに対し、概念マップ上で当てはまるキーワードベクトル(概念ベクトル)に重み率算出ステップで算出した重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、記憶手段に出力する配置座標算出ステップと(ステップ3)からなる。
予め決められた特徴的な単語で表された分類カテゴリの単語情報によって分類されたコンテンツを、
同様の分類カテゴリによって分類された大量の語彙情報(概念ベクトル)によって作られた概念ベース(概念ベクトルの集まりで辞書のようなもの)で作られ、該概念ベースの持つ概念ベクトルが配置されている概念マップ上に、コンテンツの持つキーワード(語彙)を基に分類配置する際に、
マップ上への配置対象となるコンテンツと、該コンテンツの内容を表すテキストやキーワード、分類カテゴリ情報が格納されているコンテンツデータベース20と、
分類カテゴリ情報が格納されているメタ情報データベース21と、
分類カテゴリによって分類されたキーワード(語彙)がキーワードベクトル(概念ベクトル)として格納されている概念ベクトルデータベース22と、
概念マップ上へのコンテンツ登録要求が発行されると、コンテンツデータベース20からコンテンツのキーワードと分類カテゴリ情報を、メタ情報データベース21から該概念マップの持つ分類カテゴリ情報を、概念ベクトルデータベース22から、分類カテゴリとキーワード(語彙)の関係情報とキーワード(語彙)のベクトル情報をそれぞれ取得し、該分類カテゴリ情報と該キーワード情報とを比較し、該概念マップ上でコンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離が遠いほど重み率は軽くなり、近いほど重くなるような重み率を算出する重み率算出手段300と、
コンテンツが持つキーワードそれぞれに対し、概念マップ上で当てはまるキーワードベクトル(概念ベクトル)に重み率算出手段300で算出した重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、座標配置データベースに出力する配置座標算出手段310と、を有する。
図7に、本発明の一実施の形態におけるキーワード重み算出処理のフローチャートを示す。
W(Kt,d)=(dの中でのKtの生起数)/(dのキーワードの出現総数)
といった式で算出できる。
・コンテンツの属さない分類カテゴリに含まれるキーワード(ステップ707)。
WD(Kt,Dij):上記で示した重心からの距離Dijを持つときのキーワードKtが分類カテゴリに含まれない場合にかかる重み率;
LD:概念マップ上でカテゴリ重心同士が最も遠くなる組み合わせの距離としたとき、
W(Kt)=W(Kt,d)×WD(Kt、Dij)
WD(Kt,Dij)=−(1/LD)×Dij+1 WD(Kt、Dij)≧0
として、Dij距離が遠くなるほど、キーワードにかかる重み率の値が小さくなるように決定する。
TD:キーワード算出対象範囲;
WP:計算対象範囲決定値 (0≦WP≦1)
としたとき、次のようにも設定することができる。
TD=LD×WP
このとき、WPは、事前に設定されており、概念マップ上で最も遠くなるカテゴリ重心同士の距離LDを基準として、コンテンツの属するカテゴリからどの程度の距離範囲に含まれるカテゴリのキーワードを重み算出対象にするかを決定する値である。WP=0であれば、コンテンツが属するカテゴリ以外に含まれるキーワードは、重み算出対象外であり、WP=1であれば、概念マップ上のすべてのキーワードを算出対象とするように設定できる。
以上のようにして、コンテンツに付属するキーワード全てに対して、重み率を決定する。
コンテンツが持つ各キーワードにキーワード重み率算出処理部300で算出した重み率を掛け、すべてのキーワードの重心をとることで、コンテンツの配置座標を算出することができる。式で表すと以下のようになる。
VKt:キーワードKtのベクトル座標
VC=Σ(W(Kt)×VKt)
このようにして、算出されたコンテンツ配置座標は、配置座標DB23に格納される。
11 表示部
12 指示入力部
20 コンテンツデータベース(DB)
21 メタ情報データベース(DB)
22 概念ベクトルデータベース(DB)
23 配置座標データベース(DB)
40 ネットワーク
300 キーワード重み率算出手段、キーワード重み率算出処理部
310 コンテンツ座標算出手段、コンテンツ座標算出処理部
Claims (4)
- 予め特徴的な単語で表された分類カテゴリ情報(単語情報)が付与された大量の情報において、該情報に付与されたキーワードを、各々の情報間の内容的類似性によって、該情報を視覚的に分類配置する視覚的情報分類方法であって、
予め決められた特徴的な単語で表された分類カテゴリの単語情報によって分類されたコンテンツを、
同様の分類カテゴリによって分類された大量の語彙情報(概念ベクトル)によって作られた概念ベース(概念ベクトルの集まりで辞書のようなもの)で作られ、該概念ベースの持つ概念ベクトルが配置されている概念マップ上に、コンテンツの持つキーワード(語彙)を基に分類配置する際に、
前記概念マップ上へのコンテンツ登録要求が発行されると、コンテンツのキーワードと分類カテゴリ情報、該概念マップの持つ分類カテゴリ情報、及び、キーワード(語彙)情報を記憶手段から取得する情報取得ステップと、
前記分類カテゴリ情報と、前記キーワード情報を比較し、前記概念マップ上でコンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離が遠いほど重み率は軽くなり、近いほど重くなるような重み率を算出する重み率算出ステップと、
前記コンテンツが持つキーワードそれぞれに対し、前記概念マップ上で当てはまるキーワードベクトル(概念ベクトル)に前記重み率算出ステップで算出した前記重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、記憶手段に出力する配置座標算出ステップと、
からなることを特徴とする視覚的情報分類方法。 - 予め特徴的な単語で表された分類カテゴリ情報(単語情報)が付与された大量の情報において、該情報に付与されたキーワードを、各々の情報間の内容的類似性によって、該情報を視覚的に分類配置する視覚的情報分類装置であって、
予め決められた特徴的な単語で表された分類カテゴリの単語情報によって分類されたコンテンツを、
同様の分類カテゴリによって分類された大量の語彙情報(概念ベクトル)によって作られた概念ベース(概念ベクトルの集まりで辞書のようなもの)で作られ、該概念ベースの持つ概念ベクトルが配置されている概念マップ上に、コンテンツの持つキーワード(語彙)を基に分類配置する際に、
前記マップ上への配置対象となるコンテンツと、該コンテンツの内容を表すテキストやキーワード、分類カテゴリ情報が格納されているコンテンツデータベースと、
分類カテゴリ情報が格納されているメタ情報データベースと、
分類カテゴリとそれによって分類されたキーワード(語彙)との関係情報や前記キーワードのベクトル(概念ベクトル)座標とが格納されている概念ベクトルデータベース、
前記概念マップ上へのコンテンツ登録要求が発行されると、前記コンテンツデータベースからコンテンツのキーワードと分類カテゴリ情報を、前記メタ情報データベースから該概念マップの持つ分類カテゴリ情報を、前記概念ベクトルデータベースからキーワード(語彙)情報をそれぞれ取得し、該分類カテゴリ情報と該キーワード情報とを比較し、該概念マップ上でコンテンツが属するカテゴリからキーワードが属するカテゴリまでの距離が遠いほど重み率は軽くなり、近いほど重くなるような重み率を算出する重み率算出手段と、
前記コンテンツが持つキーワードそれぞれに対し、前記概念マップ上で当てはまるキーワードベクトル(概念ベクトル)に前記重み率算出手段で算出した前記重み率を掛けて、全てのキーワードの重心をとることで、コンテンツの配置座標を算出し、座標配置データベースに出力する配置座標算出手段と、
を有することを特徴とする視覚的情報分類装置。 - 予め特徴的な単語で表された分類カテゴリ情報(単語情報)が付与された大量の情報において、該情報に付与されたキーワードを、各々の情報間の内容的類似性によって、該情報を視覚的に分類配置する視覚的情報分類プログラムであって、
請求項1に記載の視覚的情報分類方法の実現に用いられる処理をコンピュータに実現させるための視覚的情報分類プログラム。 - 予め特徴的な単語で表された分類カテゴリ情報(単語情報)が付与された大量の情報において、該情報に付与されたキーワードを、各々の情報間の内容的類似性によって、該情報を視覚的に分類配置する視覚的情報分類プログラムを記録した記憶媒体であって、
請求項1に記載の視覚的情報分類方法の実現に用いられる処理をコンピュータに実現させるための視覚的情報分類プログラムを記録した記憶媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004148236A JP4453440B2 (ja) | 2004-05-18 | 2004-05-18 | 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004148236A JP4453440B2 (ja) | 2004-05-18 | 2004-05-18 | 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2005332080A true JP2005332080A (ja) | 2005-12-02 |
| JP4453440B2 JP4453440B2 (ja) | 2010-04-21 |
Family
ID=35486723
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004148236A Expired - Fee Related JP4453440B2 (ja) | 2004-05-18 | 2004-05-18 | 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4453440B2 (ja) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007334871A (ja) * | 2006-05-15 | 2007-12-27 | Data Keekibeeka Kk | データ処理方法、データ処理装置、プログラムおよび記録媒体 |
| JP2007334865A (ja) * | 2006-05-15 | 2007-12-27 | Data Keekibeeka Kk | データ処理方法、データ処理装置およびプログラム |
| JP2008310811A (ja) * | 2007-05-16 | 2008-12-25 | Atelosoft Co Ltd | 情報検索システム、情報検索方法および情報検索サーバ |
| JP2010009254A (ja) * | 2008-06-25 | 2010-01-14 | Yahoo Japan Corp | 素性語選別装置、方法及びプログラム |
| JP2011141899A (ja) * | 2011-04-13 | 2011-07-21 | Toshiba Corp | 表示処理装置、表示処理方法及びプログラム |
| US8032505B2 (en) | 2008-03-11 | 2011-10-04 | Fuji Xerox Co., Ltd. | Relative document representing system, relative document representing method, and computer readable medium |
| US8099413B2 (en) | 2008-03-21 | 2012-01-17 | Fuji Xerox Co., Ltd. | Relative document presenting system, relative document presenting method, and computer readable medium |
| JP2013222388A (ja) * | 2012-04-18 | 2013-10-28 | Nippon Telegr & Teleph Corp <Ntt> | グラフ生成装置、方法、及びプログラム |
| CN114491192A (zh) * | 2022-02-14 | 2022-05-13 | 中国农业银行股份有限公司 | 一种数据可视化方法、装置、设备及存储介质 |
| JP2023027966A (ja) * | 2021-08-18 | 2023-03-03 | 学校法人常翔学園 | 情報処理装置、情報処理方法、およびプログラム |
-
2004
- 2004-05-18 JP JP2004148236A patent/JP4453440B2/ja not_active Expired - Fee Related
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007334871A (ja) * | 2006-05-15 | 2007-12-27 | Data Keekibeeka Kk | データ処理方法、データ処理装置、プログラムおよび記録媒体 |
| JP2007334865A (ja) * | 2006-05-15 | 2007-12-27 | Data Keekibeeka Kk | データ処理方法、データ処理装置およびプログラム |
| JP2008310811A (ja) * | 2007-05-16 | 2008-12-25 | Atelosoft Co Ltd | 情報検索システム、情報検索方法および情報検索サーバ |
| US8032505B2 (en) | 2008-03-11 | 2011-10-04 | Fuji Xerox Co., Ltd. | Relative document representing system, relative document representing method, and computer readable medium |
| US8099413B2 (en) | 2008-03-21 | 2012-01-17 | Fuji Xerox Co., Ltd. | Relative document presenting system, relative document presenting method, and computer readable medium |
| JP2010009254A (ja) * | 2008-06-25 | 2010-01-14 | Yahoo Japan Corp | 素性語選別装置、方法及びプログラム |
| JP2011141899A (ja) * | 2011-04-13 | 2011-07-21 | Toshiba Corp | 表示処理装置、表示処理方法及びプログラム |
| JP2013222388A (ja) * | 2012-04-18 | 2013-10-28 | Nippon Telegr & Teleph Corp <Ntt> | グラフ生成装置、方法、及びプログラム |
| JP2023027966A (ja) * | 2021-08-18 | 2023-03-03 | 学校法人常翔学園 | 情報処理装置、情報処理方法、およびプログラム |
| JP7745242B2 (ja) | 2021-08-18 | 2025-09-29 | 学校法人常翔学園 | 情報処理装置、情報処理方法、およびプログラム |
| CN114491192A (zh) * | 2022-02-14 | 2022-05-13 | 中国农业银行股份有限公司 | 一种数据可视化方法、装置、设备及存储介质 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4453440B2 (ja) | 2010-04-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3781696B2 (ja) | イメージ検索方法及び検索装置 | |
| US8345042B2 (en) | Mesh-based shape retrieval system | |
| JP4972358B2 (ja) | 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体。 | |
| JP2003167914A (ja) | マルチメディア情報検索方法、プログラム、記録媒体及びシステム | |
| JP2003345811A (ja) | 文書情報表示システム、文書情報表示方法及び文書検索方法 | |
| JP5458815B2 (ja) | マルチメディア検索システム | |
| WO2002054287A2 (en) | Multi-query data visualization | |
| JPWO2005038672A1 (ja) | 調査対象文書の索引語抽出装置、性格表現図、及び文書特徴分析装置 | |
| CN119669455A (zh) | 基于多模态知识图谱的船舶设计知识检索方法及系统 | |
| JP4453440B2 (ja) | 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 | |
| JP6529698B2 (ja) | データ分析装置およびデータ分析方法 | |
| JP2016018286A (ja) | 行動タイプ判定装置、行動タイプ判定方法及び行動タイプ判定プログラム | |
| JP2008243024A (ja) | 情報取得装置、そのプログラム及び方法 | |
| JP2002007433A (ja) | 情報分類装置、情報分類方法および情報分類プログラムを記録したコンピュータ読み取り可能な記録媒体、並びに情報分類プログラム | |
| JP6772478B2 (ja) | 情報検索プログラム及び情報検索装置 | |
| CN119066179B (zh) | 问答处理方法、计算机程序产品、设备及介质 | |
| JP5414334B2 (ja) | 擬似文書検索システム及び擬似文書検索方法 | |
| US8666898B2 (en) | Visual information retrieval system for applying self organizing maps/SOM using five distinct modules that merge the best maps | |
| JP2005316897A (ja) | 視覚的分類方法及び装置及びプログラム及び視覚的分類プログラムを格納した記憶媒体 | |
| JP2004086262A (ja) | 視覚的情報分類方法、視覚的情報分類装置、視覚的情報分類プログラムおよびそのプログラムを記録した記録媒体 | |
| JPH10111869A (ja) | 情報分類装置とその方法 | |
| JP6976537B1 (ja) | 情報検索装置、情報検索方法および情報検索用プログラム | |
| KR101078978B1 (ko) | 문서 분류 시스템 | |
| JP2017208047A (ja) | 情報検索方法、情報検索装置、及びプログラム | |
| JP2008197952A (ja) | テキストセグメンテーション方法,その装置,そのプログラムおよびコンピュータ読み取り可能な記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060720 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090724 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091006 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091116 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100112 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100125 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130212 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |