JP2018190017A - TECHNICAL MAP GENERATION DEVICE, TECHNICAL MAP GENERATION METHOD, AND PROGRAM - Google Patents
TECHNICAL MAP GENERATION DEVICE, TECHNICAL MAP GENERATION METHOD, AND PROGRAM Download PDFInfo
- Publication number
- JP2018190017A JP2018190017A JP2017089344A JP2017089344A JP2018190017A JP 2018190017 A JP2018190017 A JP 2018190017A JP 2017089344 A JP2017089344 A JP 2017089344A JP 2017089344 A JP2017089344 A JP 2017089344A JP 2018190017 A JP2018190017 A JP 2018190017A
- Authority
- JP
- Japan
- Prior art keywords
- item
- term
- terms
- unit
- document information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】「その他」等の項目の意味に依らないまとめあげによって生成される項目を生成できる技術マップ生成装置、技術マップ生成方法及びプログラムを提供する。【解決手段】技術マップ出力装置1は、文書を識別する文書識別子と文書情報が格納される文書情報格納部111と、2以上の各文書情報を解析し技術マップを構成する1以上の軸の項目となり得る用語である項目用語を取得する項目取得部12と、項目用語と文書情報の対応を決定する分類部13と、分類部の結果を用いて予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する項目集約部14とを具備する。項目集約部14が集約した項目用語に対応する文書情報を変更後項目用語に対応付ける。技術マップを構成する技術マップ構成部15と、技術マップを出力する技術マップ出力部16とをさらに具備する。【選択図】図1A technical map generation device, a technical map generation method, and a program capable of generating an item generated by collecting items other than the meaning of an item such as “others” are provided. A technology map output device 1 includes a document information storage unit 111 in which a document identifier for identifying a document and document information is stored, and one or more axes constituting a technology map by analyzing two or more pieces of document information. An item acquisition unit 12 that acquires an item term that is a term that can be an item, a classification unit 13 that determines the correspondence between the item term and document information, and two or more items that satisfy a predetermined condition using the result of the classification unit And an item aggregating unit 14 for changing the term into one changed item term. The document information corresponding to the item terms aggregated by the item aggregation unit 14 is associated with the changed item terms. It further includes a technology map configuration unit 15 that configures a technology map, and a technology map output unit 16 that outputs the technology map. [Selection] Figure 1
Description
本発明は、文書から技術マップを出力する技術マップ生成装置に関するものである。 The present invention relates to a technical map generation apparatus that outputs a technical map from a document.
特許や論文等の多数の技術文書を分析するために図15(a)のようなバブルチャートが利用されることがある。このような図を技術マップと呼ぶ。このバブルチャートは、2つの分析の観点を縦と横の2軸にとり、各軸に項目を並べ、各項目の交点にその項目に関する文書の数に基づいた大きさのバブルを配置した図である。例えば、分析対象を特許とし「課題」と「解決手段」を軸とした技術マップを作成することで、どのような技術開発が行われているかを俯瞰することができる。なお、技術マップは必ずしもバブルチャートである必要はなく、図15(a)のバブルの替わりに文書の数をプロットした図であっても良く、図15(b)のように項目の交点となるセルに具体的な文書名をプロットした表であっても良い。また、技術マップは、3つの分析の観点をX軸、Y軸、Z軸とした3次元のバブルチャートであっても良い。 In order to analyze many technical documents such as patents and papers, a bubble chart as shown in FIG. Such a diagram is called a technology map. This bubble chart is a diagram in which two analysis viewpoints are taken on two vertical and horizontal axes, items are arranged on each axis, and bubbles of a size based on the number of documents related to the items are arranged at the intersections of the items. . For example, it is possible to give an overview of what kind of technology is being developed by creating a technology map centered on “issues” and “solving means” with an analysis object as a patent. The technology map is not necessarily a bubble chart, and may be a diagram in which the number of documents is plotted instead of the bubble in FIG. 15A, and is an intersection of items as shown in FIG. It may be a table in which specific document names are plotted in cells. The technical map may be a three-dimensional bubble chart in which three analysis viewpoints are the X axis, the Y axis, and the Z axis.
従来、技術文書から「課題」や「解決手段」が記述されている部分(例えば、特許文書ならば[発明の効果]等)を指定し、複数の技術文書の指定された部分の内容に対してクラスタリングを行い、技術マップを自動的に生成するシステムがあった(例えば、特許文献1参照)。 Conventionally, a part in which “issue” or “solution” is described from a technical document (for example, [Effect of invention] for a patent document) is specified, and the contents of the specified part of a plurality of technical documents are specified. There is a system that performs clustering and automatically generates a technical map (see, for example, Patent Document 1).
一方、表形式の技術マップにおいて、機械的な文書分類方法にユーザが行った分類結果の修正を反映させて、インタラクティブに文書分類を行う装置等があった(例えば、特許文献2参照)。 On the other hand, there has been an apparatus that interactively classifies documents by reflecting correction of classification results performed by a user in a mechanical document classification method in a tabular technical map (see, for example, Patent Document 2).
しかしながら、特許文献1等のシステムや特許文献2等の装置においては、技術マップの分類結果を用いて、軸の項目をまとめるようなこと(例えば「その他」の項目にまとめる)ができない、という課題があった。
However, in the system such as
本第一の発明の技術マップ生成装置は、文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部と、2以上の各文書情報を解析し、技術マップを構成する1以上の軸の項目となり得る用語である項目用語を、軸ごとに取得する項目取得部と、2以上の各文書情報に対して、軸ごとに、対応する項目用語を決定する分類部と、1以上の軸について、分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する項目集約部とを具備し、分類部は、項目集約部が取得した変更後項目用語の元の2以上の項目用語のいずれかに対応する文書情報を変更後項目用語に対応付け、項目取得部が取得した軸ごとの項目用語から、集約された2以上の項目用語を除いた項目用語と、変更後項目用語とを有する項目用語集合を軸とする技術マップであり、2以上の各文書情報の各項目用語への対応を明示する技術マップを構成する技術マップ構成部と、技術マップを出力する技術マップ出力部とをさらに具備する技術マップ生成装置である。 According to the first aspect of the present invention, there is provided a technical map generation apparatus configured to construct a technical map by analyzing a document information storage unit storing two or more pieces of document information corresponding to a document identifier for identifying a document, and each of the two or more pieces of document information. An item acquisition unit that acquires an item term that can be an item of one or more axes for each axis, and a classification unit that determines a corresponding item term for each axis for two or more pieces of document information An item aggregation unit that changes two or more item terms satisfying a predetermined condition to one item term after change using the result in the classification unit for one or more axes, The document information corresponding to one of the two or more original item terms of the changed item term acquired by the aggregation unit is associated with the changed item term, and is aggregated from the item terms for each axis acquired by the item acquisition unit. Item terms excluding two or more item terms A technical map centered on a set of item terms having changed item terms, a technical map component that constitutes a technical map that clearly indicates the correspondence of each item information of two or more pieces of document information, and a technical map, A technical map generation apparatus further comprising a technical map output unit for outputting.
かかる構成により、分類結果を用いて、項目を集約した技術マップを生成することができる。 With this configuration, it is possible to generate a technical map in which items are aggregated using the classification result.
また、本第二の発明の技術マップ生成装置は、第一の発明に対して、2以上の各グループの用語群が格納される用語辞書をさらに具備し、項目取得部は、2以上の各文書情報を解析し、各文書情報から、予め決められた条件を満たす重要用語を軸ごとに取得する重要用語取得手段と、軸ごとに、重要用語取得手段が取得した2以上の重要用語を、用語辞書を参照し、グループを代表する用語に集約し、項目用語を取得する用語集約手段とを具備する技術マップ生成装置である。 Further, the technical map generation device of the second invention further includes a term dictionary in which term groups of two or more groups are stored with respect to the first invention, and the item acquisition unit includes each of two or more terms. Analyze document information, and from each document information, an important term acquisition unit that acquires important terms satisfying a predetermined condition for each axis, and two or more important terms acquired by the important term acquisition unit for each axis, It is a technical map generation device that includes term aggregating means for referring to a term dictionary, aggregating into terms representing groups, and acquiring item terms.
かかる構成により、技術文書から自動的に軸の項目を取得し、それらの項目をまとめた技術マップを生成することができる。 With this configuration, it is possible to automatically acquire axis items from a technical document and generate a technical map in which those items are collected.
また、本第三の発明の技術マップ生成装置は、第一または第二の発明に対して、項目集約部は、1以上の軸について、分類部における結果を用いて、予め決められた条件を満たすほど、対応する文書情報の数が少ない項目用語を、一つの変更後項目用語に変更する技術マップ生成装置である。 In the technical map generation device according to the third aspect of the present invention, in the first or second aspect, the item aggregating unit sets a predetermined condition for one or more axes using the result in the classification unit. This is a technical map generation device that changes an item term with a smaller number of corresponding document information to a single item term after change as it is satisfied.
かかる構成により、分類部における結果において、対応する文書情報の数が少ない項目をまとめた技術マップを生成することができる。 With this configuration, it is possible to generate a technical map in which items with a small number of corresponding document information are collected in the result of the classification unit.
また、本第四の発明の技術マップ生成装置は、第一から第三いずれか1つの発明に対して、項目取得部は、2以上の各文書情報を解析し、技術マップを構成する2つの軸のうちの各軸の項目となり得る用語である項目用語を、軸ごとに取得し、分類部は、2以上の各文書情報に対して、軸ごとに、属する項目用語を決定し、技術マップ構成部は、2次元の技術マップを構成する技術マップ生成装置である。 In addition, in the technical map generation device according to the fourth aspect of the present invention, for any one of the first to third aspects, the item acquisition unit analyzes two or more pieces of document information, and forms two technical maps. An item term that is a term that can be an item of each axis of the axis is acquired for each axis, and the classification unit determines the item term to which each axis belongs for each of two or more pieces of document information, and a technical map. The configuration unit is a technical map generation device that configures a two-dimensional technical map.
かかる構成により、2軸の技術マップにおいて、各軸ごとに分類結果を用いてまとめた技術マップを生成することができる。 With this configuration, it is possible to generate a technical map that is compiled using the classification result for each axis in the biaxial technical map.
また、本第五の発明の技術マップ生成装置は、第四の発明に対して、項目集約部は、2つの各軸について、分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する技術マップ生成装置である。 Further, in the technical map generation apparatus according to the fifth invention, in contrast to the fourth invention, the item aggregating unit uses two or more conditions that satisfy a predetermined condition using the result of the classification unit for each of the two axes. It is the technical map production | generation apparatus which changes the item term of 1 to the item term after a change.
かかる構成により、2次元の技術マップにおいて、2軸とも、2以上の項目をまとめた項目を生成することができる。 With this configuration, it is possible to generate an item in which two or more items are collected on both axes in a two-dimensional technical map.
また、本第六の発明の技術マップ生成装置は、第一から第五いずれか1つの発明に対して、変更後項目用語は、「その他」を意味する用語である技術マップ生成装置である。 Further, the technical map generation device of the sixth invention is a technical map generation device in which the changed item term is a term meaning “others” with respect to any one of the first to fifth inventions.
かかる構成により、項目をまとめ、項目「その他」を含む技術マップを生成することができる。 With this configuration, it is possible to collect items and generate a technical map including the item “others”.
本発明による技術マップ生成装置によれば、分類結果を用いて、項目を集約した技術マップを生成できる。 According to the technical map generation device of the present invention, it is possible to generate a technical map in which items are aggregated using the classification result.
以下、技術マップ生成装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。 Hereinafter, embodiments of a technical map generation device and the like will be described with reference to the drawings. In addition, since the component which attached | subjected the same code | symbol in embodiment performs the same operation | movement, description may be abbreviate | omitted again.
(実施の形態1)
本実施の形態において、文書情報の集合から自動的に技術マップの軸を構成する用語を軸ごとに取得し、当該各項目に属する文書情報を決定し、予め決められた条件を満たす項目を「その他」等の一つの項目にまとめる技術マップ生成装置1について説明する。
(Embodiment 1)
In the present embodiment, the terms constituting the axis of the technical map are automatically acquired for each axis from a set of document information, the document information belonging to each item is determined, and items satisfying a predetermined condition are The technical
本発明において、項目を構成する用語は、1以上の連続する語を表し、また、最初と最後の語は自立語である必要はないものとする。つまり、項目を構成する用語は、一単語でも良いし、句などでも良い。 In the present invention, the terms constituting an item represent one or more consecutive words, and the first and last words need not be independent words. That is, the terms constituting the item may be a single word or a phrase.
図1は、本実施の形態における技術マップ生成装置1のブロック図である。
FIG. 1 is a block diagram of a technical
技術マップ生成装置1は、格納部11、項目取得部12、分類部13、項目集約部14、技術マップ構成部15、および技術マップ出力部16を備える。
The technical
格納部11は、文書情報格納部111、および用語辞書112を備える。
The storage unit 11 includes a document
項目取得部12は、重要用語取得手段121、および用語集約手段122を備える。
The
文書情報格納部111は、文書を識別する文書識別子に対応する2以上の文書情報が格納される。
The document
ここで、文書とは、特許文書や論文といった技術マップ上で分類され得る文書ならば、何でも良い。特許文書とは、公開特許公報でも良く、特許掲載公報でも良く、また、特許出願時の書類でも良く、その形式は問わない。さらに、特許文書や論文以外にも、例えば、製品紹介のウェブページや、製品情報を含む新聞記事、企業のプレスリリースなどでも良い。 Here, the document may be anything as long as it can be classified on a technical map such as a patent document or a paper. The patent document may be an open patent gazette, a patent publication gazette, or a document at the time of filing a patent, and its format is not limited. In addition to patent documents and papers, for example, product introduction web pages, newspaper articles including product information, company press releases, and the like may be used.
また、文書識別子とは、文書を識別する記号列である。文書識別子は、文書情報格納部111において文書を一意に定めることができれば、どのような記号列であっても良い。例えば、文書が公開特許公報ならば特許出願番号や特許公開番号、特許掲載公報ならば特許番号を用いることは好適である。また、文書識別子に対応する文書情報の構造は問わない。通常、文書識別子に対応する文書情報は、テキストを含む。さらに、文書情報は、文書の構造に関する情報を含んでも良い。例えば、HTMLなどのマークアップ言語を用いてテキストとその構造を表しても良く、特許文書のように隅付き括弧で文書の構造を表しても良い。また、文書情報は、文書のメタ情報を含んでも良い。メタ情報とは、例えば、特許文書における、出願人、発明者、代理人、出願日、公開日、IPC、FI、Fターム等のテキスト以外の文書に関する情報である。
The document identifier is a symbol string that identifies a document. The document identifier may be any symbol string as long as the document can be uniquely determined in the document
用語辞書112は、1または2以上の用語群が格納される。ここで、用語群とは、2以上の用語の集合を表す。各用語群は、一のグループを形成する。グループを形成する用語群は、類似もしくは同一の意味を持つ用語の集合であっても良く、また同一の上位概念を持つ用語の集合であっても良い。
The
また、用語辞書112は、各グループについて、用語群に加え、当該グループを表す用語を格納することは好適である(以下、用語群を代表する用語を代表用語と呼ぶ)。この際、用語辞書112は、代表用語と用語群との関係を示す情報を格納することが好適である。ここで関係を示す情報とは、通常、同義または類義、もしくは上位と下位のいずれかである。
In addition, for each group, the
項目取得部12は、2以上の各文書情報を解析し、1または2以上の項目用語を、軸ごとに取得する。ここで、項目用語とは、軸の項目となり得る用語である。項目用語は、上述したように、一の単語でも良いし、句などでも良い。文書情報は文書情報格納部111に格納された文書情報である。また、軸とは、技術マップの分析の基準を意味する。軸とは、技術マップの縦軸や横軸に対応する「観点」と言っても良い。例えば、図15(a)の2次元の技術マップの場合、「課題」と「解決手段」が軸となる。軸は、「課題」または「目的」や「解決手段」とは限らず、例えば、「材料」「コンテンツ」「部品」「部位」などでも良い。
The
さらに、軸の項目とは、技術マップの軸に並ぶ文字列や記号や画像である。例えば、図15(a)の2次元の技術マップの場合、課題の軸の「強風対策」や「雷撃対策」、解決手段の軸の「ピッチ制御」や「可変速度制御」が項目である。 Further, the axis item is a character string, a symbol, or an image arranged on the axis of the technical map. For example, in the case of the two-dimensional technical map of FIG. 15A, the items are “strong wind countermeasures” and “thunderbolt countermeasures” on the problem axis, and “pitch control” and “variable speed control” on the solution means axis.
項目取得部12は、例えば、文書情報格納部111に格納された各文書情報に対して、後述する重要用語取得手段121を用いて、文書情報ごとに重要用語を抽出する。その後、文書情報ごとに抽出した重要用語を、後述する用語集約手段122によって集約し、項目用語を取得する。
For example, the
項目取得部12は、文書情報格納部111に格納された文書情報の総数より少ない数の項目用語を取得しても良い。すなわち、項目取得部12は、対応する項目用語が1つもない文書情報が存在するように項目用語を取得しても良い。この場合、対応する項目用語が1つもない文書情報は、通常、技術マップに表示されない。また、項目取得部12は、文書情報格納部111に格納された文書情報の総数より多くの項目用語を取得しても良い。すなわち、項目取得部12は、一の文書情報に対して、2以上の項目用語が対応するように項目用語を取得しても良い。
The
重要用語取得手段121は、各文書情報から予め決められた条件を満たす重要用語を軸ごとに取得する。重要用語は、単に用語と言っても良い。重要用語は、予め決められた条件を満たす用語である。ここでの用語は、一単語であることは好適であるが、2以上の用語を含む句などでも良い。
The important
ここで、予め決められた条件とは、文書情報から軸に対応する用語を取得可能ならばどのような条件でも良い。 Here, the predetermined condition may be any condition as long as the term corresponding to the axis can be acquired from the document information.
例えば、予め決めた条件とは、文書情報に含まれる用語辞書112に格納された全用語群のいずれかの用語を取得するといった条件であっても良い。
For example, the predetermined condition may be a condition that any term of all term groups stored in the
また、例えば、重要用語取得手段121は、文パターンに合致する文から用語を取得しても良い。より具体的に例えば、「課題」や「効果」といった軸ならば、『特許明細書の[発明の効果]中の文の「することができる」の直前に現れる語』を取得しても良い。なお、このとき、文パターンは複数あっても良い。また、文パターンの情報は、例えば、格納部11に格納されている、とする。
For example, the important
また、例えば、予め決めた条件とは、前記条件に文書情報中での出現回数についての条件を加えた条件でも良い。例えば、『特許明細書中の「することができる」の直前に現れる語のうち、2回以上出現するもの』といった条件や、『用語辞書112に格納された全用語群に含まれる用語のうち3回以上出現したもの』といった条件である。
For example, the predetermined condition may be a condition obtained by adding a condition for the number of appearances in the document information to the condition. For example, a condition such as “a word that appears more than once among the words that appear immediately before“ can be ”in the patent specification” or “a term that is included in all term groups stored in the
また、例えば、予め決められた条件とは、形態素解析や固有表現抽出に用いられる、系列を識別する機械学習を用いた条件でも良い。例えば、テキストと当該テキストから抽出される部分(重要用語)の組の情報を2以上予め準備し、隠れマルコフモデル(HMM)や条件付き確率場(CRF)やReccurent Neural Network(RNN)といったモデルを、当該2以上の情報を用いて学習し、学習したモデルを用いて文書情報から重要用語を抽出しても良い。なお、ここで、機械学習および形態素解析、固有表現抽出、HMM、CRF、RNNについては既存技術のため、説明を省略する。 Further, for example, the predetermined condition may be a condition using machine learning for identifying a sequence, which is used for morphological analysis or specific expression extraction. For example, two or more sets of information of a text and a part (important term) extracted from the text are prepared in advance, and a model such as a hidden Markov model (HMM), a conditional random field (CRF), or a recurrent neural network (RNN) is prepared. Further, learning may be performed using the two or more pieces of information, and important terms may be extracted from the document information using the learned model. Here, since machine learning and morphological analysis, specific expression extraction, HMM, CRF, and RNN are existing technologies, description thereof is omitted.
また、例えば、予め決められた条件とは、分類問題を解くための機械学習を用いた条件でも良い。例えば、テキストと当該テキストに対応する重要用語の組の情報を2以上予め準備し、Support Vector Machine(SVM)や、Random Forest、ニューラルネットワークといったモデルを、当該2以上の情報を用いて学習し、学習したモデルを用いて文書情報に対応する重要用語を求めても良い。なお、ここで、SVMやRandom Forest、ニューラルネットワークについては既存技術のため、説明を省略する。 Further, for example, the predetermined condition may be a condition using machine learning for solving a classification problem. For example, two or more sets of information on a text and a set of important terms corresponding to the text are prepared in advance, and models such as Support Vector Machine (SVM), Random Forest, and neural network are learned using the two or more information. An important term corresponding to the document information may be obtained using the learned model. In addition, about SVM, Random Forest, and a neural network, since it is an existing technique, description is abbreviate | omitted here.
また、重要用語取得手段121は、酒井の方法(酒井浩之, 野中尋史, 増山繁, 特許明細書からの技術課題情報の抽出, 人工知能学会論文誌, 第25巻6号I, pp.531-540, 2009.)等を用いて実現することができる。また、前記酒井の方法によって抽出された重要用語に対して、野中の方法(Hirofumi Nonaka, Akio Kobayashi, Hiroki Sakaji, Yusuke Suzuki, Hiroyuki Sakai, Shigeru Masuyama, Extraction of the effect and the technology terms from a patent document, Proc. of 40th International Conference on Computers and Industrial Engineering (CIE40), cie214jp-1, Awaji-shima, Japan, (2010).)のパターンを用いてその一部を抽出し、抽出されたものを重要用語としても良い。 The important term acquisition means 121 is the Sakai method (Hiroyuki Sakai, Hiroshi Nonaka, Shigeru Masuyama, extraction of technical problem information from patent specifications, Journal of the Japanese Society for Artificial Intelligence, Vol. 25 No. 6 I, pp.531 -540, 2009.) etc. In addition, for the important terms extracted by the Sakai method, the Nonaka method (Hirofumi Nonaka, Akio Kobayashi, Hiroki Sakaji, Yusuke Suzuki, Hiroyuki Sakai, Shigeru Masuyama, Extraction of the effect and the technology terms from a patent document , Proc. Of 40th International Conference on Computers and Industrial Engineering (CIE40), cie214jp-1, Awaji-shima, Japan, (2010).) It is also good.
なお、重要用語取得手段121は、軸に対応する重要用語が文書情報中に存在しない場合、重要用語を取得しなくても良い。例えば、ある文書情報について、軸「用途」に対応する重要用語が文書情報中に存在しない場合、重要用語取得手段121は、軸「用途」について重要用語を取得しなくても良い。重要用語を取得しない文書情報は、通常、技術マップに表示されない。また、重要用語取得手段121は、2以上の重要用語を取得しても良い。
The important
用語集約手段122は、軸ごとに、2以上の重要用語を1の用語に集約し、技術マップの軸の項目となる項目用語を取得する。ここで、集約とは、2以上の重要用語を同じ意味または類似した意味または上位の意味を持つ用語に置き換えることを表す。また、用語集約手段122は、2以上の重要用語を1の用語に集約する際、用語辞書112を参照する。
The
例えば、用語集約手段122は、はじめに重要用語取得手段121が取得した各重要用語を、用語辞書112の用語群から検索する。重要用語が用語辞書112の用語群に含まれる場合、用語集約手段122は、当該重要用語を、用語辞書112の当該重要用語を含む用語群に対応する代表用語に置き換える。ここで、用語集約手段122は、取得した項目用語を用語辞書112の用語群からさらに検索し、より上位の意味を持つ用語に集約しても良い。また、重要用語が用語辞書112の用語群に含まれない場合、項目取得部12は、重要用語がそのまま項目用語として取得する。
For example, the
なお、用語集約手段122は、用語辞書112を参照する際、重要用語の一部のみを用いても良い。例えば、用語集約手段122は、「消費資源削減」という重要用語の「資源削減」のみを用いて重要用語の集約を行っても良い。
Note that the
また、用語集約手段122は、野中の方法(Hirofumi Nonaka, Akio Kobayashi, Hiroki Sakaji, Yusuke Suzuki, Hiroyuki Sakai, Shigeru Masuyama, Extraction of the effect and the technology terms from a patent document, Proc. of 40th International Conference on Computers and Industrial Engineering (CIE40), cie214jp-1, Awaji-shima, Japan, (2010).)を用いて実現することもできる。 Also, the term aggregation means 122 is a method of Nonaka (Hirofumi Nonaka, Akio Kobayashi, Hiroki Sakaji, Yusuke Suzuki, Hiroyuki Sakai, Shigeru Masuyama, Extraction of the effect and the technology terms from a patent document, Proc. Of 40th International Conference on Computers and Industrial Engineering (CIE40), cie214jp-1, Awaji-shima, Japan, (2010).).
なお、項目取得部12は、重要用語取得手段121によって取得した重要用語をそのまま項目用語としても良い。
The
分類部13は、各文書情報を項目用語に対応付ける。通常、分類部13は、重要用語取得手段121が取得した重要用語に対応する項目用語へ文書情報を対応付ける。重要用語に対応する項目用語とは、重要用語そのままの項目用語、もしくは前記重要用語を用語集約手段122が集約した項目用語である。
The
なお、分類部13は、文書情報を、重要用語に対応する項目用語以外へ対応付けても良い。
The
例えば、ある文書情報(以下、文書情報1)について、重要用語取得手段121が、重要用語「消費資源削減」を取得し、別の文書情報(以下、文書情報2)について、重要用語取得手段121が重要用語「消費エネルギー削減」を取得したものとする。さらに、用語集約手段122によって「消費資源削減」と「消費エネルギー削減」は項目用語「エコ技術」に集約されたとする。また、別の文書情報(以下、文書情報3)に基づき重要用語取得手段121と用語集約手段122が項目用語「作業が容易」を取得したとする。さらに、文書情報1は「作業が容易」というテキストを含むものとする。
For example, with respect to certain document information (hereinafter, document information 1), the important
上記の場合、分類部13は、各文書情報に対して、項目取得部12が取得した各項目用語とそれ関連する用語が文書情報中に含まれるか否かを判定し、含まれる場合、当該項目用語へ文書情報を対応付ける。ここで、項目用語と関連する用語とは、用語辞書112において、代表用語が項目用語と一致する用語群中の用語である。
In the above case, the
さらに、分類部13は、後述する項目集約部14が取得した変更後項目用語の元の2以上の項目用語のいずれかに対応する文書情報を変更後項目用語に対応付ける。
Further, the
項目集約部14は、1以上の軸について、分類部13における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する。ここで、分類部13における結果とは、例えば、項目用語とそれに対応付けられた文書情報を含む。また、予め決められた条件とは、項目用語を集約する条件であり、例えば、『項目用語に対応付けられた文書情報の数がしきい値以下の場合』等の条件である。予め決められた条件については詳細を後述する。さらに、変更後項目用語とは、「その他」等の集約する2以上の項目用語を象徴する用語である。変更後項目用語は、集約する2以上の項目用語のうちの一の項目用語を用いても良く、また、集約する2以上の項目用語を区切り文字(例えば「・」)で連結した文字列であっても良く、また、「その他」といった集約する2以上の項目用語以外の用語を用いても良く、また、図示しない項目用語入力手段を用いてユーザが入力した用語を用いても良い。
The
ここで、予め決められた条件について詳細を述べる。 Here, details of the predetermined condition will be described.
例えば、項目集約部14は、項目用語に対応付いている文書情報の数に関する条件でも良い。具体的には、予め決めたしきい値以下の文書情報しか対応付けられていない2以上の項目用語を、変更後項目用語にしても良い(以下、項目用語に対応付けられている文書情報の数を「(項目用語の)文書数」と呼ぶ)。ここで、しきい値は、絶対的な項目用語の文書数でも良く、また、「項目用語の文書数/全文書情報数」で表される相対的な文書数であっても良い。
For example, the
また、例えば、項目集約部14は、項目数に関する条件でも良い。具体的には、項目取得部12が取得した項目用語数が予め決めたしきい値を超えた場合に、項目用語数がしきい値以下になるように文書数の少ない2以上の項目用語を集約しても良い。ここで、しきい値は、絶対的な項目用語数でも良く、また、「全文書情報数×定数(0〜1)」で表される、文書情報格納部111に格納される文書情報の数に依存する数でも良い。なお、後者の定数は、一種の「圧縮率」を意味する。
Further, for example, the
また、例えば、項目集約部14は、項目用語に対応付いている文書情報の数に関する条件と、項目数に関する条件とを含む条件でも良い。例えば、予め決められた条件は、項目数が10以下となるように、かつ項目用語に対応付いている文書情報の数が3以下の項目用語は「その他」とする、等である。
Further, for example, the
また、例えば、項目集約部14は、予め用意した過去の項目用語に関する情報を用いても良い。ここで、項目用語に関する情報(以下、項目用語集約情報)とは、過去に生成した技術マップについての、「分類部13の結果(項目用語と文書情報)」と「集約した項目用語と変更後項目用語」の情報を含む情報である。項目集約部14は、項目用語集約情報を用いて、分類部13の結果である項目用語が集約するべきか否かを判定する。例えば、項目用語集約情報から、各項目用語が集約される確率を導出し、集約される確率が予め決められた値を超える場合に、項目用語を集約する。ここで、項目用語が集約される確率とは、例えば、「項目用語集約情報において項目用語が変更後項目用語に変更された数/項目用語集約情報において項目用語が現れた数」によって計算できる。また、例えば、項目用語集約情報を用いて、集約するか否かの対象となる項目用語と全項目用語を入力とし、前記項目用語を集約した変更後項目用語を出力(集約しない場合はNULLを出力)とした機械学習を行い、学習したモデルを用いて項目用語を集約することもできる。この時、機械学習には、Support Vector Machine(SVM)や、Random Forest、ニューラルネットワークといったモデルを用いることができる。なお、SVMやRandom Forest、ニューラルネットワークについては既存技術のため、説明を省略する。なお、項目用語集約情報を用いる場合、技術マップ生成装置1は、格納部11に図示しない項目用語集約情報を格納する項目用語集約情報格納部を備える。
Further, for example, the
例えば、項目集約部14は、図示しない集約項目用語指定手段を用いて、ユーザが集約する項目用語を指定し、指定された項目用語を集約しても良い。
For example, the
また、さらに、項目集約部14は、上で述べた条件を組み合わせて項目の集約を行っても良い。例えば、項目集約部14は、『項目用語の文書数が3以下の場合、または、項目用語の文書数が3より大きくかつ項目用語の文書数が上位10位以下の場合』に「その他」へ変更するといった条件でも良い。
Furthermore, the
技術マップ構成部15は、各文書情報の各項目用語への対応を明示する技術マップを構成する。ここで、各文書情報と対応付けられる項目用語は、項目取得部12が取得した軸ごとの項目用語から項目集約部14が集約した2以上の項目用語を除いた項目用語と、変更後項目用語である。
The technical
ここで、技術マップを構成するとは、技術マップを出力するために必要な情報を生成することを意味する。例えば、図15(a)のような2軸の技術マップの場合、技術マップ構成部15は、バブルを構成するための情報を生成する。具体的には、上記の場合、例えば文書数に応じたバブルの半径を含む情報を生成する。ここで、通常、バブルの半径は文書数の大きさに比例して大きくなる。また、図15(b)のような技術マップの場合、各セルに記述する文献のリストを生成する。また、例えば、棒グラフのような1軸の技術マップの場合、技術マップ構成部15は、各項目用語に対応する文書情報の数に基づく棒の高さを求める。技術マップ構成部15は、出力する技術マップの形に適合した情報を生成する。
Here, composing a technology map means generating information necessary for outputting the technology map. For example, in the case of a biaxial technical map as shown in FIG. 15A, the technical
技術マップ出力部16は、技術マップ構成部15が構成した技術マップを出力する。
The technology
ここで、出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタでの印字、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。 Here, output refers to display on a display, projection using a projector, printing on a printer, transmission to an external device, storage in a recording medium, processing result to another processing device or other program, etc. It is a concept that includes delivery.
格納部11、文書情報格納部111、用語辞書112は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
The storage unit 11, the document
格納部11、文書情報格納部111、用語辞書112に情報が記憶される過程は問わない。例えば、記録媒体を介して情報が格納部11、文書情報格納部111、用語辞書112で記憶されるようになってもよく、通信回線等を介して送信された情報が格納部11、文書情報格納部111、用語辞書112で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された情報が格納部11、文書情報格納部111、用語辞書112で記憶されるようになってもよい。
The process in which information is stored in the storage unit 11, the document
項目取得部12、分類部13、項目集約部14、技術マップ構成部15は、通常、MPUやメモリ等から実現され得る。項目取得部12、分類部13、項目集約部14、技術マップ構成部15の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
The
技術マップ出力部16は、ディスプレイ等の出力デバイスを含むと考えても含まないと考えても良い。技術マップ出力部16は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
The technical
次に、技術マップ生成装置1の動作について図2のフローチャートを用いて説明する。なお、以下、所定の情報におけるi番目の情報は、「情報[i]」と記載するものとする。
Next, operation | movement of the technical map production |
(ステップS201)技術マップ生成装置1は、カウンタiに1を代入する。
(Step S201) The technical
(ステップS202)技術マップ生成装置1は、技術マップに出力するi番目の軸が存在する場合は、ステップS203へ進む。そうでない場合は、ステップS207へ進む。
(Step S202) If the i-th axis to be output to the technical map exists, the technical
(ステップS203)項目取得部12は、文書情報格納部111に格納された各文書情報から、技術マップの軸[i]の項目である項目用語を取得する。かかる処理を項目取得処理と呼ぶ。項目取得処理の詳細について、図3のフローチャートを用いて説明する。
(Step S203) The
(ステップS204)分類部13は、文書情報格納部111に格納された各文書情報をステップS203で取得した軸[i]の項目用語と対応付ける。かかる処理を分類処理と呼ぶ。分類処理の詳細について、図7のフローチャートを用いて説明する。
(Step S204) The
(ステップS205)項目集約部14および分類部13は、ステップS204の結果に対して、軸[i]の項目用語の集約を行い、集約した項目への文書情報の対応付けを行う。かかる処理を項目集約・再分類処理と呼ぶ。項目集約・再分類処理の詳細について、図8のフローチャートを用いて説明する。
(Step S205) The
(ステップS206)技術マップ生成装置1は、カウンタiを1だけ増加させ、ステップS202に戻る。
(Step S206) The technical
(ステップS207)技術マップ構成部15は、技術マップに出力する全ての軸の項目集約・再分類処理の結果に基づき技術マップを出力するために必要な情報を構成する。かかる処理を技術マップ構成処理と呼ぶ。技術マップ構成処理の詳細について、図9のフローチャートを用いて説明する。
(Step S207) The technology
(ステップS208)技術マップ出力部16は、技術マップ構成部15が構成した内容情報に基づいて技術マップを出力する。
(Step S208) The technical
次に、ステップS203の項目取得処理の詳細の具体例について、図3のフローチャートを用いて説明する。 Next, a specific example of details of the item acquisition process in step S203 will be described with reference to the flowchart of FIG.
(ステップS301)重要用語取得手段121は、文書情報格納部111に格納された文書情報のそれぞれから重要用語を取得する。かかる処理を重要用語取得処理と呼ぶ。重要用語取得処理の詳細について、図4のフローチャートを用いて説明する。
(Step S301) The important
(ステップS302)用語集約手段122は、ステップS301で取得した各文書情報の重要用語を集約するために、前記各重要用語について、集約先となる用語の候補を求める。かかる処理を集約用語候補取得処理と呼ぶ。集約用語候補取得処理の詳細について、図5のフローチャートを用いて説明する。
(Step S302) The
(ステップS303)用語集約手段122は、各重要用語について、ステップS303で求めた集約先となる用語の候補から一の用語を選択する。かかる処理を集約用語決定処理と呼ぶ。集約用語決定処理の詳細について、図6のフローチャートを用いて説明する。
(Step S303) The
次に、ステップS301の重要用語取得処理の詳細の具体例について、図4のフローチャートを用いて説明する。 Next, a specific example of the details of the important term acquisition process in step S301 will be described with reference to the flowchart of FIG.
(ステップS401)重要用語取得手段121は、カウンタiに1を代入する。
(Step S401) The important
(ステップS402)重要用語取得手段121は、文書情報格納部111に、i番目の文書情報(以下、文書情報[i])が存在する場合は、ステップS403へ進む。そうでない場合は、上位処理へリターンする。
(Step S402) If the i-th document information (hereinafter, document information [i]) is present in the document
(ステップS403)重要用語取得手段121は、文書情報[i]から重要用語を取得する。重要用語の取得方法については、先に述べたように、パターンによる方法、TF−IDFによる方法、機械学習を用いる方法のいずれであっても良い。
(Step S403) The important
(ステップS404)重要用語取得手段121は、カウンタiを1だけ増加させ、ステップS402に戻る。
(Step S404) The important
次に、ステップS302の集約用語候補取得処理の詳細の具体例について、図5のフローチャートを用いて説明する。 Next, a specific example of details of the aggregate term candidate acquisition process in step S302 will be described with reference to the flowchart of FIG.
(ステップS501)用語集約手段122は、カウンタiに1を代入する。
(Step S501) The
(ステップS502)用語集約手段122は、文書情報格納部111に、文書情報[i]が存在する場合は、ステップS503へ進む。そうでない場合は、上位処理へリターンする。
(Step S502) If the document information [i] exists in the document
(ステップS503)用語集約手段122は、カウンタjに1を代入する。
(Step S503) The
(ステップS504)用語集約手段122は、現在処理中の軸(図2のフローチャートのカウンタiで指定される軸)について、文書情報[i]にj番目の重要用語が存在する場合はステップS505へ進む。そうでない場合は、ステップS508へ進む。以下、文書情報[i]のj番目の重要用語を[i][j]と表記する。
(Step S504) If the j-th important term exists in the document information [i] for the axis currently being processed (the axis specified by the counter i in the flowchart of FIG. 2), the
(ステップS505)用語集約手段122は、重要用語[i][j]が用語辞書112に格納されたいずれかの用語群に含まれる場合は、ステップS506へ進む。そうでない場合は、ステップS507へ進む。
(Step S505) If the important term [i] [j] is included in any term group stored in the
(ステップS506)用語集約手段122は、重要用語[i][j]と、用語辞書112に格納された各用語群のうち重要用語[i][j]を含む用語群をすべて対応付ける。
(Step S506) The
(ステップS507)用語集約手段122は、カウンタjを1だけ増加させ、ステップS504へ戻る。
(Step S507) The
(ステップS508)用語集約手段122は、カウンタiを1だけ増加させ、ステップS502へ戻る。
(Step S508) The
次に、ステップS303の集約用語決定処理の詳細の具体例について、図6のフローチャートを用いて説明する。 Next, a specific example of the details of the aggregate term determination process in step S303 will be described using the flowchart of FIG.
本フローチャートでは、最も多くの重要用語と対応付いた用語群を項目用語とする。 In this flowchart, a term group associated with the most important terms is used as an item term.
(ステップS601)用語集約手段122は、カウンタiに1を代入する。
(Step S601) The
(ステップS602)用語集約手段122は、文書情報格納部111に、文書情報[i]が存在する場合は、ステップS603へ進む。そうでない場合は、上位処理へリターンする。
(Step S602) When the document information [i] exists in the document
(ステップS603)用語集約手段122は、カウンタjに1を代入する。
(Step S603) The
(ステップS604)用語集約手段122は、ステップS502と同様に、現在処理中の軸について、重要用語[i][j]が存在する場合はステップS605へ進む。そうでない場合は、ステップS607へ進む。
(Step S604) Similar to step S502, the
(ステップS605)用語集約手段122は、重要用語[i][j]について、ステップS506で対応付けた用語群が1以上存在する場合は、ステップS606へ進む。そうでない場合は、ステップS607へ進む。
(Step S605) If the term group associated with the important term [i] [j] in step S506 is one or more, the
(ステップS606)用語集約手段122は、重要用語[i][j]に対応付けられた用語群のうち、対応付けられた重要用語の最も多い用語群に対応する用語を、項目用語として取得する。
(Step S606) The
(ステップS607)用語集約手段122は、重要用語[i][j]を項目用語として取得する。
(Step S607) The
(ステップS608)用語集約手段122は、カウンタjを1だけ増加させ、ステップS604へ戻る。
(Step S608) The
(ステップS609)用語集約手段122は、カウンタiを1だけ増加させ、ステップS602へ戻る。
(Step S609) The
なお、本フローチャートにおいて、ステップS606は、ある重要用語について対応付けられた用語群が複数存在する場合、当該重要用語が用語群へ対応する数を「1/当該重要用語が対応する用語群の数」と計算しても良い。 In this flowchart, when there are a plurality of term groups associated with a certain important term, step S606 indicates the number of the important terms corresponding to the term group as “1 / number of term groups corresponding to the important term. May be calculated.
次に、ステップS204の分類処理の詳細の具体例について、図7のフローチャートを用いて説明する。 Next, a specific example of details of the classification process in step S204 will be described using the flowchart of FIG.
(ステップS701)分類部13は、カウンタiに1を代入する。
(Step S701) The
(ステップS702)分類部13は、文書情報格納部111に、文書情報[i]が存在する場合は、ステップS703へ進む。そうでない場合は、上位処理へリターンする。
(Step S702) If the document information [i] exists in the document
(ステップS703)分類部13は、カウンタjに1を代入する。
(Step S703) The
(ステップS704)分類部13は、ステップS502と同様に、現在処理中の軸について、重要用語[i][j]が存在する場合はステップS705へ進む。そうでない場合は、ステップS707へ進む。
(Step S704) Similar to step S502, the
(ステップS705)分類部13は、重要用語[i][j]に対応付けた用語群に対応する項目用語(ステップS606)、もしくは重要用語[i][j]そのものである項目用語(ステップS607)と、文書情報[i]を対応付ける。
(Step S705) The
(ステップS706)分類部13は、カウンタjを1だけ増加させ、ステップS704へ戻る。
(Step S706) The
(ステップS707)分類部13は、カウンタiを1だけ増加させ、ステップS702へ戻る。
(Step S707) The
次に、ステップS205の項目集約・再分類処理の詳細の具体例について、図8のフローチャートを用いて説明する。 Next, a specific example of details of the item aggregation / reclassification process in step S205 will be described with reference to the flowchart of FIG.
(ステップS801)項目集約部14は、カウンタiに1を代入する。
(Step S801) The
(ステップS802)項目集約部14は、現在処理中の軸(図2のフローチャートのカウンタiで指定される軸)について、i番目の項目用語(以下、項目用語[i])が存在する場合は、ステップS803へ進む。そうでない場合は上位処理へリターンする。
(Step S802) The
(ステップS803)項目集約部14は、項目用語[i]が予め決めた条件を満たす場合はステップS804へ進む。そうでない場合は、ステップS806へ進む。
(Step S803) The
(ステップS804)分類部13は、項目用語[i]と対応付けられた文書情報(ステップS705)を、変更後項目用語へ対応付ける。
(Step S804) The
(ステップS805)項目集約部14は、項目用語[i]を削除する。
(Step S805) The
(ステップS806)項目集約部14は、カウンタiを1だけ増加させ、ステップS802へ戻る。
(Step S806) The
次に、ステップS207の技術マップ構成処理の詳細の具体例について、図9のフローチャートを用いて説明する。 Next, a specific example of details of the technology map configuration processing in step S207 will be described using the flowchart of FIG.
(ステップS901)技術マップ構成部13は、カウンタiに1を代入する。
(Step S901) The technical
(ステップS902)技術マップ構成部13は、1番目の軸のi番目の項目(以下、項目[i])が存在する場合は、ステップS903へ進む。そうでない場合は、上位処理へリターンする。
(Step S902) If the i-th item (hereinafter, item [i]) on the first axis exists, the technology
(ステップS903)技術マップ構成部13は、カウンタjに1を代入する。
(Step S903) The technical
(ステップS904)技術マップ構成部13は、2番目の軸のj番目の項目(以下、項目[j])が存在する場合は、ステップS905へ、そうでない場合は、ステップS907へ進む。
(Step S904) If the j-th item (hereinafter, item [j]) of the second axis exists, the technology
(ステップS905)技術マップ構成部13は、項目[i]と項目「j」の両方に対応付けられている文書をすべて取得し、Dに代入する。
(Step S905) The technical
(ステップS906)技術マップ構成部13は、Dのサイズに基づいてバブルの半径を計算する。通常、バブルの面積がDのサイズと比例するように半径を決定する。具体的には、Dのサイズが1の場合の半径をIとした場合、Dのサイズがnの場合の半径はI×(nの平方根)となる。
(Step S906) The technical
(ステップS907)技術マップ構成部13は、iを1だけ増加させステップS902に戻る。
(Step S907) The technical
なお、図9のフローチャートは2次元の技術マップを出力するためのものであるが、3次元以上の技術マップを出力する場合も同様である。例えば、3次元の技術マップを出力する場合は、1番目の軸の項目[i]と2番目の軸の項目[j]と3番目の軸の項目[k](i,j,kはそれぞれ1〜各軸の最後の項目までのすべての組み合わせ)のすべてに対応付けられている文書をすべて取得しDに代入し、当該Dに基づきバブルの半径を算出する。 The flowchart in FIG. 9 is for outputting a two-dimensional technical map, but the same applies to outputting a three-dimensional or higher technical map. For example, when outputting a three-dimensional technical map, the first axis item [i], the second axis item [j], and the third axis item [k] (i, j, k are respectively 1 to all the combinations (all combinations up to the last item of each axis) are acquired and substituted for D, and the radius of the bubble is calculated based on the D.
以下、本実施の形態における技術マップ生成装置1の具体的な動作について説明する。
Hereinafter, a specific operation of the technical
本具体例において、文書情報格納部111は、図10に示す文書情報管理表を格納している。文書情報管理表は、2以上の文書に関する情報のレコードを保持している。各レコードは、「ID」、「文書識別子」、「文書情報」の属性を有する。ここで、文書識別子とは、各文書情報を識別するための識別子である。
In this specific example, the document
また、本具体例において、用語辞書112は、図11に示す用語群管理表を格納している。用語群管理表は、1以上の用語群に関するレコードを保持している。各レコードは、「ID」と「軸」と「代表用語」と「用語群」の属性を有する。ここで、代表用語とは、用語群の意味を表す用語であり、技術マップに出力される用語である。
In this specific example, the
本具体例では、図10の各文書情報をもとに、「課題」と「解決手段」を軸としてもつ、図15(a)のようなバブルチャート型の技術マップを出力する。 In this specific example, based on each document information of FIG. 10, a bubble chart type technical map as shown in FIG. 15A having “issue” and “solution” as axes is output.
また、本具体例では、重要用語の抽出は、図11の用語群管理表に含まれる用語群に1回以上現れる用語を抽出するものとする。 In this specific example, the extraction of important terms is performed by extracting terms that appear one or more times in the term group included in the term group management table of FIG.
また、本具体例では、変更後項目用語を「その他」と固定し、「1以下の文書情報しか対応付けられていない項目用語」を変更後項目用語への集約の条件とする。 In this specific example, the item term after change is fixed as “others”, and “item term associated with only one or less document information” is used as a condition for aggregation into the item term after change.
はじめに、技術マップ生成装置は、「課題」軸について、重要項目用語の取得(ステップS301)を行う。具体的には、重要用語取得手段121は、文書情報格納部111の文献1から文献7について、用語辞書112の課題軸の用語群(ID=1から4)のいずれかを含まれる用語を重要用語として取得する(ステップS403)。その結果、「文献1→消費電力」、「文献2→容易に操作」、文献3→低コストに製造」、「文献4→電力効率」、「文献5→効率的な動作」、「文献6→待機電力」、「文献7→無駄な電力」が取得される。
First, the technical map generation device acquires important item terms (step S301) for the “task” axis. Specifically, the important
次に、用語集約手段122は、取得した重要用語の集約を行う(ステップS302、S303)。重要用語の集約では、はじめに集約先の候補を探し、用語集約手段122は、取得した各重要用語と用語群の対応付けを行う(ステップS302)。各重要用語について、用語辞書112を走査し、結果「消費電力→消費電力」、「容易に操作→作業容易性」、「低コストに製造→製造コスト」、「電力効率→効率」、「効率的な動作→効率、最適化」、「待機電力→消費電力」、「無駄な電力→消費電力」と対応付けられる(それぞれ「重要用語→代表用語」)。
Next, the
次に、用語集約手段122は、重要用語を集約し項目用語を取得する。今回の場合、重要用語「効率的な動作」以外は、重要用語に対応する代表用語が1つのため、各重要用語はそのまま代表用語に集約される。また、重要用語「効率的な動作」は「効率」と「最適化」の2つの候補が存在するが、「最適化」に対応付けられた重要用語は「効率的な動作」ただ1つであるのに対し、「効率」に対応付けられた重要用語は「電力効率」と「効率的な動作」の2つであるため、最も対応付けられた重要用語の多い「効率」へ集約する(ステップS606)。
Next, the
以上の処理の結果、「課題」軸について「消費電力」、「作業容易性」、「製造コスト」、「効率」の4つの項目用語が取得される。 As a result of the above processing, four item terms “power consumption”, “workability”, “manufacturing cost”, and “efficiency” are acquired for the “task” axis.
次に、分類部13は、「課題」軸の各項目用語に文書情報を対応付ける。分類部13は、項目用語の元となった重要用語が取得された文書情報をそのまま対応付ける(ステップS705)。その結果、「消費電力→文献1、文献6、文献7」、「作業容易性→文献2」、「製造コスト→文献3」、「効率→文献4、文献5」と対応付けられる(それぞれ「項目用語→文書識別子」)。
Next, the
次に、項目集約部14は、集約した項目用語をさらに変更後項目用語へ集約する(ステップS205)。本具体例において、項目集約部14は、各項目用語について、「1以下の文書情報しか対応付けられていない」か否かを判定し(ステップS803)、条件を満たす場合、当該項目用語に対応付けられた文書情報を変更後項目用語「その他」に対応付ける(ステップS804)。さらに、項目集約部14は、条件を満たした項目用語を削除する(ステップS805)。この結果、項目用語とそれに対応付けられる文書情報は、「消費電力→文献1、文献6」、「効率→文献4、文献5」、「その他→文献2、文献3」となる。
Next, the
次に、技術マップ生成装置1は、「解決手段」軸についても、「課題」軸と同様の処理を行う(ステップS203〜S205)。この結果、「解決手段」軸では変更後項目用語への集約は行われず、「構成→文献1、文献2」、「素材→文献3、文献4」、「方法→文献5、文献6、文献7」と対応付けられる(それぞれ「項目用語→文書識別子」)。
Next, the technology
次に、技術マップ構成部15は、「課題」軸と「解決手段」軸の結果を用いて、技術マップを出力するための情報を構成する(ステップS207)。本具体例の場合、技術マップ構成部は、「課題」軸と「解決手段」軸の項目用語とそれに対応する文書情報の数から、技術マップのバブルの半径を算出する。例えば、「消費電力」と「構成」の交点に位置するバブルの場合、「消費電力」に対応付けられた文書情報群{文献1,文献6、文献7}と「構成」に対応付けられた文書情報群{文献1,文献2}の積集合{文献1}を求めることで、バブルの半径を算出する。同様の方法で、課題と解決手段のすべての組み合わせについて、積集合を求め、バブルの半径を算出する。
Next, the technology
次に、技術マップ出力部16は、技術マップ構成部15が構成した情報をもとに技術マップを出力する。この結果、図12(a)の技術マップが出力される。
Next, the technology
また、上記の具体例と同じ文書情報管理票と用語群管理表をのもと、変更後項目用語を「集約された項目用語を中黒(・)で連結した文字列」、変更後項目用語への集約の条件を「1以下の文書情報しか対応付けられていない項目用語」とした場合、図12(b)の技術マップが出力される。 In addition, based on the same document information management form and term group management table as the above specific example, the changed item term is “character string that concatenates the aggregated item terms with squares (•)”, the changed item terms When the condition of aggregation into “item terms associated with only 1 or less document information” is set, the technical map of FIG. 12B is output.
また、さらに、上記の具体例と同じ文書情報管理票と用語群管理表をのもと、変更後項目用語を「その他」で固定し、変更後項目用語への集約の条件を「2以下の文書情報しか対応付けられていない項目用語」とした場合、図12(c)の技術マップが出力される。図12(c)のように、「2以下の文書情報しか対応付けられていない項目用語」を集約する条件であっても、「その他」には2以下の文書情報しか対応付けられていないバブルが出力されることに注意する(課題「消費電力」×解決手段「その他」と課題「その他」×解決手段「方法」)。 Furthermore, based on the same document information management slip and term group management table as in the above specific example, the changed item term is fixed as “Other”, and the condition for aggregation into the changed item term is set to “2 or less”. In the case of “item term associated only with document information”, the technical map of FIG. 12C is output. As shown in FIG. 12 (c), even if the condition is that the “item terms associated with only two or less document information” are aggregated, “other” is associated with only two or less document information. (Problem “Power consumption” × Solution means “Other” and Problem “Other” × Solution means “Method”).
以上、本実施の形態によれば、分類結果を用いて、項目を集約した技術マップを生成できる。 As described above, according to the present embodiment, it is possible to generate a technical map in which items are aggregated using the classification result.
また、本実施の形態によれば、文書情報数(文書数)の少ない項目を「その他」等にまとめ上げることができるので、技術マップの一覧性を向上することができる。 Further, according to the present embodiment, items with a small number of document information (number of documents) can be collected into “others” and the like, and the listability of the technical map can be improved.
また、本実施の形態によれば、技術マップの一覧性を向上させることができる程度に、軸を構成する項目数を少なくすることができる。 Moreover, according to this Embodiment, the number of items which comprise an axis | shaft can be reduced to such an extent that the list property of a technical map can be improved.
なお、本実施の形態によれば、項目集約部14は、軸が階層化されている場合、深い階層から順番に項目集約処理を適用することで、階層内に「その他」等の項目を生成しても良い。例えば、メイン項目A、B、C、Dという項目用語が存在し、項目Bはサブ項目b1、b2、b3を持つ場合、項目集約部14は、はじめに、サブ項目であるb1、b2、b3を変更後項目用語へ集約し、その後、メイン項目であるA、B、C、Dを対象に変更後項目用語への集約を行う。このとき、サブ項目とメイン項目の集約で、異なる集約条件を設定しても良い。
According to the present embodiment, when the axes are hierarchized, the
さらに、本実施の形態における処理は、ソフトウェアで実現しても良い。そして、このソフトウェアをソフトウェアダウンロード等により配布しても良い。また、このソフトウェアをCD−ROMなどの記録媒体に記録して流布しても良い。 Furthermore, the processing in the present embodiment may be realized by software. Then, this software may be distributed by software download or the like. Further, this software may be recorded and distributed on a recording medium such as a CD-ROM.
なお、本実施の形態における技術マップ生成装置を実現するソフトウェアは、以下のようなプログラムである。つまり、コンピュータがアクセス可能な記録媒体は、
文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部を具備し、コンピュータを、前記2以上の各文書情報を解析し、技術マップを構成する1以上の軸の項目となり得る用語である項目用語を、軸ごとに取得する項目取得部と、前記2以上の各文書情報に対して、軸ごとに、対応する項目用語を決定する分類部と、1以上の軸について、前記分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する項目集約部とを具備し、前記分類部は、前記項目集約部が取得した変更後項目用語の元の2以上の項目用語のいずれかに対応する文書情報を前記変更後項目用語に対応付け、前記項目取得部が取得した軸ごとの項目用語から、集約された2以上の項目用語を除いた項目用語と、前記変更後項目用語とを有する項目用語集合を軸とする技術マップであり、前記2以上の各文書情報の各項目用語への対応を明示する技術マップを構成する技術マップ構成部と、前記技術マップを出力する技術マップ出力部として機能させるためのプログラム、である。
The software that realizes the technical map generation apparatus according to the present embodiment is the following program. In other words, the recording medium accessible by the computer is
A document information storage unit for storing two or more pieces of document information corresponding to a document identifier for identifying a document; and a computer that analyzes each of the two or more pieces of document information and includes one or more axes constituting a technical map. An item acquisition unit that acquires an item term that can be an item for each axis, a classification unit that determines a corresponding item term for each axis for each of the two or more pieces of document information, and one or more axes An item aggregating unit that changes two or more item terms that satisfy a predetermined condition to one changed item term using a result in the classification unit, and the classification unit includes the item aggregating unit The document information corresponding to any of the two or more original item terms of the changed item term acquired by is associated with the changed item term and is aggregated from the item terms for each axis acquired by the item acquisition unit Two or more terminology The technical map configuration is a technical map centered on a set of item terms having the item terms and the changed item terms, and constitutes a technical map that clearly shows the correspondence of the two or more pieces of document information to the item terms And a program for functioning as a technical map output unit for outputting the technical map.
図13は、上記プログラムを実行して、上記実施の形態による技術マップ生成装置1等を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
FIG. 13 is a schematic diagram showing an example of the external appearance of a computer that executes the program and realizes the technical
図13において、コンピュータシステム3000は、CD−ROMドライブ3005を含むコンピュータ3001と、キーボード3002と、マウス3003と、モニタ3004とを備える。
In FIG. 13, the
図14は、コンピュータシステム3000の内部構成を示す図である。図14において、コンピュータ3001は、CD−ROMドライブ3005に加えて、MPU(Micro Processing Unit)3011と、ブートアッププログラム等のプログラムを記憶するためのROM3012と、MPU3011に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM3013と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク3014と、MPU3011、ROM3012等を相互に接続するバス3015とを備える。なお、コンピュータ3001は、LANやWAN等への接続を提供する図示しないネットワークカードを含んでいてもよい。
FIG. 14 is a diagram showing an internal configuration of the
コンピュータシステム3000に、上記実施の形態による技術マップ生成装置1等の機能を実行させるプログラムは、CD−ROM3021に記憶されて、CD−ROMドライブ3005に挿入され、ハードディスク3014に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ3001に送信され、ハードディスク3014に記憶されてもよい。プログラムは実行の際にRAM3013にロードされる。なお、プログラムは、CD−ROM3021、またはネットワークから直接、ロードされてもよい。また、CD−ROM3021に代えて他の記録媒体(例えば、USBメモリ等)を介して、プログラムがコンピュータシステム3000に読み込まれてもよい。
A program that causes the
プログラムは、コンピュータ3001に、上記実施の形態による技術マップ生成装置1等の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能やモジュールを呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム3000がどのように動作するのかについては周知であり、詳細な説明は省略する。
The program does not necessarily include an operating system (OS) or a third-party program that causes the
なお、上記プログラムにおいて、情報を送信する送信ステップや、情報を受信する受信ステップなどでは、ハードウェアによって行われる処理、例えば、送信ステップにおけるモデムやインターフェースカードなどで行われる処理(ハードウェアでしか行われない処理)は含まれない。 In the above program, in a transmission step for transmitting information, a reception step for receiving information, etc., processing performed by hardware, for example, processing performed by a modem or an interface card in the transmission step (only performed by hardware). Not included) is not included.
また、上記プログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。 Further, the computer that executes the program may be singular or plural. That is, centralized processing may be performed, or distributed processing may be performed.
また、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。 In each of the above embodiments, each process (each function) may be realized by centralized processing by a single device (system), or by distributed processing by a plurality of devices. May be.
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。 The present invention is not limited to the above-described embodiments, and various modifications are possible, and it goes without saying that these are also included in the scope of the present invention.
以上のように、本発明にかかる技術マップ生成装置は、技術マップ全体の一覧性を向上させるという効果を有し、特許マップ生成装置等として有用である。 As described above, the technical map generation device according to the present invention has an effect of improving the listability of the entire technical map, and is useful as a patent map generation device or the like.
1 技術マップ生成装置
11 格納部
111 文書情報格納部
112 用語辞書
12 項目取得部
121 重要用語取得手段
122 用語集約手段
13 分類部
14 項目集約部
15 技術マップ構成部
16 技術マップ出力部
DESCRIPTION OF
Claims (8)
前記2以上の各文書情報を解析し、技術マップを構成する1以上の軸の項目となり得る用語である項目用語を、軸ごとに取得する項目取得部と、
前記2以上の各文書情報に対して、軸ごとに、対応する項目用語を決定する分類部と、
1以上の軸について、前記分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する項目集約部とを具備し、
前記分類部は、
前記項目集約部が取得した変更後項目用語の元の2以上の項目用語のいずれかに対応する文書情報を前記変更後項目用語に対応付け、
前記項目取得部が取得した軸ごとの項目用語から、集約された2以上の項目用語を除いた項目用語と、前記変更後項目用語とを有する項目用語集合を軸とする技術マップであり、前記2以上の各文書情報の各項目用語への対応を明示する技術マップを構成する技術マップ構成部と、
前記技術マップを出力する技術マップ出力部とをさらに具備する技術マップ生成装置。 A document information storage unit for storing two or more pieces of document information corresponding to a document identifier for identifying a document;
An item acquisition unit that analyzes each of the two or more pieces of document information and acquires, for each axis, an item term that is a term that can be an item of one or more axes constituting the technical map;
For each of the two or more pieces of document information, a classification unit that determines a corresponding item term for each axis;
An item aggregating unit that changes two or more item terms satisfying a predetermined condition into one changed item term using one or more axes and the result in the classification unit;
The classification unit includes:
Associating document information corresponding to one of the two or more original item terms of the changed item term acquired by the item aggregation unit with the changed item term;
From the item terms for each axis acquired by the item acquisition unit, is a technical map around the item term set having the item terms excluding two or more aggregated item terms and the changed item terms, A technical map component that constitutes a technical map that clearly indicates the correspondence of each item term of two or more pieces of document information;
The technical map production | generation apparatus further provided with the technical map output part which outputs the said technical map.
前記項目取得部は、
前記2以上の各文書情報を解析し、各文書情報から、予め決められた条件を満たす重要用語を軸ごとに取得する重要用語取得手段と、
軸ごとに、前記重要用語取得手段が取得した2以上の重要用語を、前記用語辞書を参照し、グループを代表する用語に集約し、項目用語を取得する用語集約手段とを具備する請求項1記載の技術マップ生成装置。 A term dictionary that stores term groups of two or more groups;
The item acquisition unit
An important term acquisition unit that analyzes each of the two or more pieces of document information and acquires, from each document information, an important term that satisfies a predetermined condition for each axis;
2. A term aggregating unit that aggregates two or more important terms acquired by the important term acquisition unit for each axis with reference to the term dictionary into terms representing groups and acquires item terms. The described technical map generator.
1以上の軸について、前記分類部における結果を用いて、予め決められた条件を満たすほど、対応する文書情報の数が少ない項目用語を、一つの変更後項目用語に変更する請求項1または請求項2記載の技術マップ生成装置。 The item aggregation unit includes:
The item term having a smaller number of corresponding document information is changed to one changed item term as the predetermined condition is satisfied by using the result in the classification unit for one or more axes. Item 3. The technical map generation device according to Item 2.
前記2以上の各文書情報を解析し、技術マップを構成する2つの軸のうちの各軸の項目となり得る用語である項目用語を、軸ごとに取得し、
前記分類部は、
前記2以上の各文書情報に対して、軸ごとに、属する項目用語を決定し、
前記技術マップ構成部は、
2次元の技術マップを構成する請求項1から請求項3いずれか一項に記載の技術マップ生成装置。 The item acquisition unit
Analyzing each of the two or more pieces of document information, obtaining an item term that is a term that can be an item of each axis of the two axes constituting the technical map, for each axis,
The classification unit includes:
For each of the two or more pieces of document information, determine an item term belonging to each axis,
The technical map component is
The technical map production | generation apparatus as described in any one of Claims 1-3 which comprises a two-dimensional technical map.
2つの各軸について、前記分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する請求項4記載の技術マップ生成装置。 The item aggregation unit includes:
The technical map generation device according to claim 4, wherein two or more item terms that satisfy a predetermined condition are changed into one changed item term for each of the two axes using the result in the classification unit.
文書を識別する文書識別子に対応する2以上の文書情報を格納しており、
項目取得部と分類部と項目集約部と技術マップ構成部と技術マップ出力部とを用いて処理される、技術マップ出力方法であって、
前記項目取得部が、
前記2以上の各文書情報を解析し、技術マップを構成する1以上の軸の項目となり得る用語である項目用語を、軸ごとに取得するステップと、
前記分類部が、
前記2以上の各文書情報に対して、軸ごとに、対応する項目用語を決定するステップと、
前記項目集約部が、
1以上の軸について、前記分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更するステップと、
さらに、前記分類部は、
前記項目集約部が取得した変更後項目用語の元の2以上の項目用語のいずれかに対応する文書情報を前記変更後項目用語に対応付けるステップと、
前記技術マップ構成部が、
前記項目取得部が取得した軸ごとの項目用語から、集約された2以上の項目用語を除いた項目用語と、前記変更後項目用語とを有する項目用語集合を軸とする技術マップであり、前記2以上の各文書情報の各項目用語への対応を明示する技術マップを構成するステップと、
前記技術マップ出力部が、
前記技術マップを出力するステップとを具備する技術マップ生成方法。 On the recording medium,
Storing two or more pieces of document information corresponding to a document identifier for identifying a document;
A technology map output method that is processed using an item acquisition unit, a classification unit, an item aggregation unit, a technology map configuration unit, and a technology map output unit,
The item acquisition unit
Analyzing each of the two or more pieces of document information and obtaining, for each axis, an item term that is a term that can be an item of one or more axes constituting the technical map;
The classification unit is
Determining corresponding item terms for each axis for each of the two or more pieces of document information;
The item aggregation unit
For one or more axes, using the result in the classification unit, changing two or more item terms that satisfy a predetermined condition to one changed item term;
Furthermore, the classification unit
Associating document information corresponding to any of the two or more original item terms of the changed item terms acquired by the item aggregation unit with the changed item terms;
The technical map component is
From the item terms for each axis acquired by the item acquisition unit, is a technical map around the item term set having the item terms excluding two or more aggregated item terms and the changed item terms, Constructing a technical map that clearly indicates the correspondence of each item term of two or more pieces of document information;
The technical map output unit
A technical map generating method comprising: outputting the technical map.
文書を識別する文書識別子に対応する2以上の文書情報が格納される文書情報格納部を具備し、
コンピュータを、
前記2以上の各文書情報を解析し、技術マップを構成する1以上の軸の項目となり得る用語である項目用語を、軸ごとに取得する項目取得部と、
前記2以上の各文書情報に対して、軸ごとに、対応する項目用語を決定する分類部と、
1以上の軸について、前記分類部における結果を用いて、予め決められた条件を満たす2以上の項目用語を一つの変更後項目用語に変更する項目集約部とを具備し、
前記分類部は、
前記項目集約部が取得した変更後項目用語の元の2以上の項目用語のいずれかに対応する文書情報を前記変更後項目用語に対応付け、
前記項目取得部が取得した軸ごとの項目用語から、集約された2以上の項目用語を除いた項目用語と、前記変更後項目用語とを有する項目用語集合を軸とする技術マップであり、前記2以上の各文書情報の各項目用語への対応を明示する技術マップを構成する技術マップ構成部と、
前記技術マップを出力する技術マップ出力部
として機能させるためのプログラム。 Computer-accessible recording media
A document information storage unit for storing two or more pieces of document information corresponding to a document identifier for identifying a document;
Computer
An item acquisition unit that analyzes each of the two or more pieces of document information and acquires, for each axis, an item term that is a term that can be an item of one or more axes constituting the technical map;
For each of the two or more pieces of document information, a classification unit that determines a corresponding item term for each axis;
An item aggregating unit that changes two or more item terms satisfying a predetermined condition into one changed item term using one or more axes and the result in the classification unit;
The classification unit includes:
Associating document information corresponding to one of the two or more original item terms of the changed item term acquired by the item aggregation unit with the changed item term;
From the item terms for each axis acquired by the item acquisition unit, is a technical map around the item term set having the item terms excluding two or more aggregated item terms and the changed item terms, A technical map component that constitutes a technical map that clearly indicates the correspondence of each item term of two or more pieces of document information;
A program for functioning as a technical map output unit for outputting the technical map.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017089344A JP2018190017A (en) | 2017-04-28 | 2017-04-28 | TECHNICAL MAP GENERATION DEVICE, TECHNICAL MAP GENERATION METHOD, AND PROGRAM |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017089344A JP2018190017A (en) | 2017-04-28 | 2017-04-28 | TECHNICAL MAP GENERATION DEVICE, TECHNICAL MAP GENERATION METHOD, AND PROGRAM |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2018190017A true JP2018190017A (en) | 2018-11-29 |
Family
ID=64478636
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017089344A Pending JP2018190017A (en) | 2017-04-28 | 2017-04-28 | TECHNICAL MAP GENERATION DEVICE, TECHNICAL MAP GENERATION METHOD, AND PROGRAM |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2018190017A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020135838A (en) * | 2019-02-22 | 2020-08-31 | 成年 川上 | Patent map generating program and method thereof |
| WO2022130635A1 (en) * | 2020-12-18 | 2022-06-23 | 三菱電機株式会社 | Graph display device, graph display method, and graph display program |
| CN116257635A (en) * | 2023-01-03 | 2023-06-13 | 中国电信股份有限公司 | Cloud computing technical map construction method, device, system, equipment and medium |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10226468A (en) * | 1997-02-18 | 1998-08-25 | Hitachi Building Syst Co Ltd | Elevator operation status display device |
| JP2001092825A (en) * | 1999-09-17 | 2001-04-06 | Nec Corp | Device and method for processing information |
| JP2004220456A (en) * | 2003-01-17 | 2004-08-05 | Michiyoshi Suwa | Technical map generation method, technical map generation program and recording medium having its program recorded thereon |
| JP2007011651A (en) * | 2005-06-30 | 2007-01-18 | Nomura Research Institute Ltd | Document processing device |
-
2017
- 2017-04-28 JP JP2017089344A patent/JP2018190017A/en active Pending
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH10226468A (en) * | 1997-02-18 | 1998-08-25 | Hitachi Building Syst Co Ltd | Elevator operation status display device |
| JP2001092825A (en) * | 1999-09-17 | 2001-04-06 | Nec Corp | Device and method for processing information |
| JP2004220456A (en) * | 2003-01-17 | 2004-08-05 | Michiyoshi Suwa | Technical map generation method, technical map generation program and recording medium having its program recorded thereon |
| JP2007011651A (en) * | 2005-06-30 | 2007-01-18 | Nomura Research Institute Ltd | Document processing device |
Non-Patent Citations (1)
| Title |
|---|
| 早川 ルミ: "日本語解析技術を活用した業務支援ソリューション開発への取組み", 東芝レビュー, vol. 第64巻 第2号, JPN6021009704, 1 February 2009 (2009-02-01), pages 30 - 34, ISSN: 0004866452 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020135838A (en) * | 2019-02-22 | 2020-08-31 | 成年 川上 | Patent map generating program and method thereof |
| WO2022130635A1 (en) * | 2020-12-18 | 2022-06-23 | 三菱電機株式会社 | Graph display device, graph display method, and graph display program |
| JPWO2022130635A1 (en) * | 2020-12-18 | 2022-06-23 | ||
| JP7258251B2 (en) | 2020-12-18 | 2023-04-14 | 三菱電機株式会社 | Graph display device, graph display method, and graph display program |
| CN116257635A (en) * | 2023-01-03 | 2023-06-13 | 中国电信股份有限公司 | Cloud computing technical map construction method, device, system, equipment and medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111753060B (en) | Information retrieval method, apparatus, device and computer readable storage medium | |
| CN113762028B (en) | Data-driven structure extraction from text documents | |
| US20200026913A1 (en) | Blockwise extraction of document metadata | |
| US9542477B2 (en) | Method of automated discovery of topics relatedness | |
| KR20210038860A (en) | Intent recommendation method, apparatus, device and storage medium | |
| CN109685056A (en) | Obtain the method and device of document information | |
| CN109918506A (en) | text classification method and device | |
| EP4336379A1 (en) | Tracking concepts within content in content management systems and adaptive learning systems | |
| CN109710845A (en) | Information recommended method, device, computer equipment and readable storage medium storing program for executing | |
| CN112231554A (en) | Search recommendation word generation method and device, storage medium and computer equipment | |
| JP2018190017A (en) | TECHNICAL MAP GENERATION DEVICE, TECHNICAL MAP GENERATION METHOD, AND PROGRAM | |
| CN103412878A (en) | Document theme partitioning method based on domain knowledge map community structure | |
| JP2014106719A (en) | Influence relation analyzer | |
| Bai et al. | SR-LDA: Mining effective representations for generating service ecosystem knowledge maps | |
| EP4246343A1 (en) | Information extraction method and apparatus for text with layout | |
| JP2018147283A (en) | Technical map output device, technical map output method, and program | |
| Yan | Mapreduce and semantics enabled event detection using social media | |
| CN103218420A (en) | Method and device for extracting page titles | |
| CN119066179B (en) | Question and answer processing method, computer program product, device and medium | |
| JP2009252185A (en) | Information searching device, information searching method, control program, and recording medium | |
| CN119782526A (en) | A topic clustering method and storage medium driven by a large language model | |
| CN116932736B (en) | A patent recommendation method based on user needs and inverse list | |
| JP2025063806A (en) | Program, patent information processing device, and patent information processing method | |
| Peddarapu et al. | Document Summarizer: A Machine Learning approach to PDF summarization | |
| JP6871642B2 (en) | Dictionary construction device, map creation device, search device, dictionary construction method, map creation method, search method, and program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200318 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210319 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210323 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20210524 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210719 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220307 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220426 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220906 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221104 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230307 |