JP2022176511A - Document processing program, information processing device and document processing method - Google Patents
Document processing program, information processing device and document processing method Download PDFInfo
- Publication number
- JP2022176511A JP2022176511A JP2021082985A JP2021082985A JP2022176511A JP 2022176511 A JP2022176511 A JP 2022176511A JP 2021082985 A JP2021082985 A JP 2021082985A JP 2021082985 A JP2021082985 A JP 2021082985A JP 2022176511 A JP2022176511 A JP 2022176511A
- Authority
- JP
- Japan
- Prior art keywords
- information
- document
- extracting
- table portion
- contract
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Document Processing Apparatus (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【課題】構造化されていない表を含む場合であっても文書情報から情報を抽出して抽出箇所を提示する文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【解決手段】文書処理サーバ装置1は、文書情報111内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報113として抽出する表情報抽出手段101と、当該表情報113中の情報を参照するための参照情報114を生成する参照情報生成手段102と、文書情報111に含まれるテキスト部分及び表部分から少なくとも表部分中の情報を、予め定めた条件に基づいて、参照情報114を用いて抽出する情報抽出手段103として機能させる。
【選択図】図2
A document processing program, an information processing apparatus, and a document processing method are provided for extracting information from document information and presenting an extracted part even if the document information includes an unstructured table.
A document processing server apparatus (1) includes table information extraction means (101) for structuring information included in a table part in document information (111) based on the configuration of the table part and extracting the table information (113), and the table information (113). Reference information generating means 102 for generating reference information 114 for referring to the information in the document information 111, and referring to at least the information in the table portion from the text portion and the table portion included in the document information 111 based on a predetermined condition. It functions as information extracting means 103 that extracts using information 114 .
[Selection drawing] Fig. 2
Description
本開示は、文書処理プログラム、情報処理装置及び文書処理方法に関する。 The present disclosure relates to a document processing program, an information processing apparatus, and a document processing method.
従来の技術として、紙文書のイメージデータから、あらかじめ決められた規則性に基づいて項目名とそれに対応する文字データを抽出する情報処理装置が提案されている(例えば、特許文献1参照)。 2. Description of the Related Art As a conventional technique, an information processing apparatus has been proposed that extracts item names and corresponding character data from image data of paper documents based on predetermined regularity (see, for example, Japanese Unexamined Patent Application Publication No. 2002-100003).
特許文献1に開示された情報処理装置は、文書等に記載された表の縦罫の長さや、各枠の横幅、面積等を計算しこれらを比較して、項目枠が縦罫の右側であるとか、幅が狭く面積も小さいといった規則性に基づき、項目枠を抽出し、該項目枠内の文字パターンに認識処理を実施することで項目名を取得する。さらに、項目枠の右側または下側よりデータ枠を抽出することで、項目名とデータとの対応付けを行う。
The information processing apparatus disclosed in
しかし、上記した特許文献1に開示された情報処理装置によると、データ枠に文字が記入されていても表の中から項目枠とデータ枠とを区別し、表データを読み取るものの、表画像と表データとの対応を行うものではなく、また、表データから特定の情報を抽出するものでもないため、文書の内容に応じた種類の情報が記載されている表画像上の位置又は範囲を示すことができない、という問題がある。
However, according to the information processing apparatus disclosed in the above-mentioned
本開示の目的は、上記従来技術を踏まえ、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することにある。 An object of the present disclosure is to provide a document processing program, an information processing apparatus, and a document processing method that are more convenient to use, based on the conventional technology described above.
本開示に係る発明の一態様は、上記目的を達成するため、以下の文書処理プログラム、情報処理装置及び文書処理方法を提供する。 One aspect of the invention according to the present disclosure provides the following document processing program, information processing apparatus, and document processing method in order to achieve the above object.
[1]コンピュータにより実行されることにより、
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、ように前記コンピュータを機能させるための文書処理プログラム。
[2]文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出する表情報抽出手段と、
当該表情報中の情報を参照するための参照情報を生成する参照情報生成手段と、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する情報抽出手段として機能させる情報処理装置。
[3]所定の指示命令に加えて、文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
[4]文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出するステップと、
当該表情報中の情報を参照するための参照情報を生成するステップと、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出するステップとを有する文書処理方法。
[1] By being executed by a computer,
Structuring the information contained in the table part in the document information based on the structure of the table part and extracting it as table information,
generating reference information for referring to information in the table information;
Document processing for causing the computer to function so as to extract information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information. program.
[2] table information extracting means for structuring information contained in a table portion in document information based on the configuration of the table portion and extracting it as table information;
reference information generating means for generating reference information for referring to information in the table information;
An information processing apparatus functioning as information extracting means for extracting information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information.
[3] a memory configured to store document information in addition to predetermined instructions;
Based on instructions stored in the memory,
structuring information contained in the table portion in the document information stored in the memory based on the structure of the table portion and extracting it as table information;
generating reference information for referring to information in the table information;
Extracting information in at least the table portion of a text portion and a table portion included in the document information using the reference information based on a predetermined condition;
a processor configured to perform processing for
Information processing equipment including.
[4] a step of structuring information contained in a table portion in the document information based on the configuration of the table portion and extracting it as table information;
generating reference information for referencing information in the tabular information;
and extracting information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information.
本開示の様々な実施形態によれば、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することが可能となる。 According to various embodiments of the present disclosure, it is possible to provide a more convenient document processing program, information processing apparatus, and document processing method.
[実施の形態]
(文書処理システムの構成)
図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。
[Embodiment]
(Configuration of document processing system)
FIG. 1 is a schematic diagram showing an example configuration of a document processing system according to an embodiment.
この文書処理システム5は、文書処理サーバ装置1と、端末2と、端末3とをネットワーク4によって互いに通信可能に接続することで構成される。端末2は、例えば、文書作成、文書内容確認及び/又は文書レビューを希望する利用者によって操作され、端末3は文書作成、文書内容確認及び/又は文書レビューを希望する他の利用者によって操作されるが、これに限られるものではない。端末2の利用者と、端末3の利用者とは文書情報として、例えば、契約書を互いに合意できる内容になるまで、利用者間で修正とその承認を繰り返すものであり、主に、一方の利用者が作成した文書情報に記載された内容を把握するために文書処理システム5を利用する。または、一方の利用者の作成した文書情報に記載された内容をレビューしてもらうために文書処理システム5を利用してもよいし、任意の2つの文書情報を対比する際にも文書処理システム5を利用してもよい。
The
文書処理サーバ装置1は、サーバ型の情報処理装置であり、端末2及び端末3の要求に応じて動作するものであって、本体内に情報を処理するための機能を有するCPU(Central Processing Unit)やHDD(Hard Disk Drive)、フラッシュメモリ等の電子部品を備える。なお、文書処理サーバ装置1は、必ずしも単体の情報処理装置で構成される必要はなく、複数の情報処理装置が協働して動作するものであってもよいし、任意のクラウドサービスによって動作するものであってもよい。また、文書処理サーバ装置1の機能を端末2及び/又は端末3内で実現するものであってもよい
The document
端末2及び端末3は、PC(Personal Computer)やタブレット端末等の情報処理装置であって、本体内に情報を処理するための機能を有するCPUやフラッシュメモリ等の電子部品を備える。
The
ネットワーク4は、高速通信が可能な通信ネットワークであり、例えば、インターネット、イントラネットやLAN(Local Area Network)等の有線又は無線の通信網である。
The
上記構成において、一例として、文書処理サーバ装置1が処理する文書は契約書等の法律分野の文書であり、利用者の一方又は双方は法律の専門家ではないが契約書の作成を必要とする人物、又は弁護士等の法律の専門家であって契約書の作成の知識を有する人物である。また、例えば、一方又は双方の利用者は社内の営業部の社員、又は社内法務部の社員である。
In the above configuration, as an example, the document processed by the document
端末2又は端末3から文書情報を文書処理サーバ装置1にアップロードした後、契約書を作成する際に利用者の作業負担を減らすべく、又は利用者単独での契約書の作成を支援するべく、文書処理サーバ装置1は、文書情報から契約書に重要な項目の抽出を行い、またさらに抽出した項目を利用して契約書のレビューを行う。また、さらに端末2又は端末3から文書処理サーバ装置1を介して又はメール等の他の手段を用いて端末3又は端末2へ依頼要求を送信することで契約書のレビューを依頼し、端末2及び端末3から文書処理サーバ装置1上の文書情報を編集することで、双方の利用者の意見とレビュー結果を反映した契約書を作成する等の作業を行うことができるように構成されているものであってもよい。
After uploading the document information from the terminal 2 or
本実施の形態では特に、文書処理サーバ装置1は、表を含む文書情報の表部分及び本文部分からそれぞれ重要な項目の抽出を行い、またさらに抽出した項目を利用して契約書のレビューを行う。実施の形態を以下で説明する。
Particularly in this embodiment, the document
また、端末2及び端末3はそれぞれ単数を図示しているが、複数台がネットワーク4に接続されるものであってもよく、同様にこれらを操作する利用者は複数人であってもよい。
Although a single terminal 2 and a
(文書処理サーバ装置の構成)
図2は、実施の形態に係る文書処理サーバ装置1の構成例を示すブロック図である。
(Configuration of document processing server device)
FIG. 2 is a block diagram showing a configuration example of the document
文書処理サーバ装置1は、CPU等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワーク4を介して外部と通信するための通信インターフェイスとして機能する通信部12とを備える。
The document
制御部10は、CPU等のプロセッサから構成され、メモリから構成される記憶部11及び通信インターフェイスとして機能する通信部12に電気的に接続される。当該制御部10は、後述する文書処理プログラム110を実行することで、契約書受付手段100、表情報抽出手段101、参照情報生成手段102、情報抽出手段103、契約書レビュー手段104及び表示制御手段105等として機能する。
The
契約書受付手段100は、端末2又は端末3から契約書を文書情報111として受け付けて記憶部11に格納する。なお、以降の説明において契約書受付手段100が受け付ける文書情報111は、表を含む契約書等の文書情報であって、少なくとも表部分は行や列等の情報の配置、並びを定義する構造上の情報を有しないものを前提とするが、予め構造上の情報が付与されたものを受け付けてもよい。
The contract receiving means 100 receives the contract as the
表情報抽出手段101は、文書情報111の表部分から表抽出条件情報112に基づいて表の構成に応じて情報を抽出し、抽出した情報を構造化して表情報113として記憶部11に格納する。
The table information extraction means 101 extracts information according to the structure of the table from the table portion of the
参照情報生成手段102は、構造化された表情報113上の情報を文書情報111上にて参照する場合に用いられる参照情報114を生成して記憶部11に格納する。
The reference information generating means 102 generates
情報抽出手段103は、文書情報111の表部分及び表部分以外のテキスト部分から、契約書にとって重要な情報(記載すべき情報、記載すべきでない情報、記載したほうがよい情報等)を定めたレビュー条件情報116に基づいて抽出して抽出情報115として記憶部11に格納する。また、情報抽出手段103は、抽出した情報を予め定めた方法で修正して記載を統一するものであってもよい。
The
契約書レビュー手段104は、レビュー条件情報116に基づいて抽出情報115の内容をレビューしてレビュー結果情報117を生成し、記憶部11に格納する。
The contract review means 104 reviews the content of the extracted
表示制御手段105は、記憶部11の文書情報111、表情報113、抽出情報115並びに各手段100‐104の出力結果を予め定めた方法で端末2及び端末3の表示部に表示制御する。なお、表示方法の詳細は後述する。
The display control means 105 controls display of the
記憶部11は、フラッシュメモリ等のメモリから構成され、プロセッサ等から構成される制御部10及通信インターフェイスとして機能する通信部12に電気的に接続される。当該記憶部11は、制御部10を上述した各手段100‐105として動作させる文書処理プログラム110、文書情報111、表抽出条件情報112、表情報113、参照情報114、抽出情報115、レビュー条件情報116及びレビュー結果情報117等を記憶する。
The
図3は、文書情報111の構成例を示す概略図である。
FIG. 3 is a schematic diagram showing a configuration example of the
文書情報111は、一例として、契約書であり、契約書のタイトル111a1と、序文111a2と、契約要項をまとめた表部分111a3と、これらに続く条項112a4…とを有する。
The
図4は、表抽出条件情報112の構成例を示す概略図である。
FIG. 4 is a schematic diagram showing a configuration example of the table
表抽出条件情報112は、表情報を抽出するための条件を定めた情報であり、条件を識別するための条件IDと、条件の内容を示す条件と、条件を満たした場合の動作を示す結果とを有する。例えば、条件ID「001」に示すように、表の構成として、表の左端の同一列の項目は構造の同一階層の項目とすることで、図3の表部分111a3の左端同一列の項目「建物の表示」、「賃貸借の目的物」、「賃貸借条件」が項目名となる。また、条件ID「002」に示すように、表の構成として、同一列の複数項目が左列の一項目の枠に属する場合は左列一項目の項目名の従属項目とすることで、図3の表部分111a3の左から2番目の同一列の項目、例えば、「目的物の位置及び範囲」、「目的物の床面積(壁心計算)」が項目名の「賃貸借の目的物」の従属項目となる。条件ID「003」に示すように、表の構成として、項目名が「委託者」、「受託者」である場合は構造の同一階層の項目名とする。
The table
図5は、表情報113の構成例を示す概略図である。
FIG. 5 is a schematic diagram showing a configuration example of the
表情報113aは、一例として、図5に示すような構造を有し、表中の項目名、従属項目名、記述内容を有する。図4で説明したように、「建物の表示」、「賃貸借の目的物」、「賃貸借条件」が構造の項目名となり、これら各項目の従属項目名と、さらに各従属項目名の記述内容とを有する。なお、表情報113aは、項目名、従属項目名、記述内容に限らず、表の構造に合わせた構造名を有するようにする。
The
(文書処理システムの動作)
次に、実施の形態の作用を、(1)基本動作、(2)表情報抽出動作、(3)契約書レビュー動作に分けて説明する。以降、端末2を操作対象として動作を説明するが、端末3に置き換えた場合も同様の動作となる場合は説明を省略する。
(Operation of document processing system)
Next, the operation of the embodiment will be described separately for (1) basic operation, (2) table information extraction operation, and (3) contract review operation. Hereinafter, the operation will be described with the terminal 2 as the operation target, but if the operation is the same when the
(1)基本動作
まず、利用者は、文書処理サーバ装置1の提供するサービスへログインを行うため端末2を操作する。端末2は、利用者から利用者ID及びパスワード等の情報の入力を受け付けると、当該情報とともに認証要求を文書処理サーバ装置1に送信する。
(1) Basic Operation First, the user operates the terminal 2 to log in to the service provided by the document
文書処理サーバ装置1は、端末2から利用者ID及びパスワード等の情報とともに認証要求を受信すると、予め登録された利用者ID及びパスワード等を含む図示しない利用者情報を参照し、利用者としての依頼者の認証を行う。
When the document
次に、利用者は、サービスへのログインが完了すると、契約書の文書情報を文書処理サーバ装置1へアップロードするため端末2を操作する。端末2は、当該文書情報を文書処理サーバ装置1へアップロードする。
Next, when the user completes logging in to the service, the user operates the terminal 2 to upload the document information of the contract to the document
文書処理サーバ装置1は、依頼者の操作する端末2から文書情報111を受け付けて記憶部11に格納する。
The document
文書処理サーバ装置1は、端末2から文書情報を受け付けると(図13、S1)、以下に示す表情報抽出動作を開始する。なお、文書処理サーバ装置1は、契約書の種類と契約書の立場とともに比較要求を受け付けてもよく、当該契約書の種類と契約書の立場に基づいて抽出する情報を変更し、後述する「(3)契約書レビュー動作」においてレビュー内容を変更する。
When the document
(2)表情報抽出動作
図13は、文書処理サーバ装置1の検査動作を示すフローチャートである。
(2) Table Information Extraction Operation FIG. 13 is a flow chart showing the inspection operation of the document
まず、表情報抽出手段101は、図3に示すように、文書情報111の表部分111a3部分から情報を抽出し、表抽出条件情報112に基づいて抽出した情報を構造化して表情報113として記憶部11に格納する(S2)。
First, as shown in FIG. 3, the table
表情報抽出手段101が文書情報111から表部分111a3を認識する方法としては、例えば、罫線等から表中の項目の配置を認識する方法、及び表部分111a3中のテキストを認識する方法としてはOCR(Optical Character Recognition)等の技術が挙げられるが、これに限られるものではない。
As a method for the table information extracting means 101 to recognize the table portion 111a3 from the
また、表情報抽出手段101が抽出した表部分111a3の構造及びテキストの内容を表情報113に構造化する方法は、図4において説明したものであって、表抽出条件情報112の条件に合致する項目について結果で指示された内容で行う。なお、表情報抽出手段101は、表情報113の構造の各項目名、従属項目名、記述内容に対して表部分111a3中の該当するテキストの位置情報(座標等)及び範囲情報(幅及び高さ等)を関連付けて記憶する。
The method of structuring the structure of the table portion 111a3 and the contents of the text extracted by the table information extraction means 101 into the
次に、参照情報生成手段102は、構造化された表情報113上の情報を文書情報111上にて参照する場合に用いられる参照情報114を生成して記憶部11に格納する(S3)。
Next, the reference information generation means 102 generates
図6(a)~(c)は、表情報抽出動作における文書情報111の処理の一例を説明するための概略図である。
FIGS. 6A to 6C are schematic diagrams for explaining an example of processing of
図6(a)は、参照情報114の一例を示す参照情報114aであり、「契約期間」を有する表中のセルを参照することを示すものである。
FIG. 6(a) is
参照情報114aにより、次に説明する情報抽出手段103は、図6(b)に示すように、表情報113aの構造中の「契約期間」に該当するノードを特定し、当該ノードに関連付けられた位置情報及び範囲情報から、図6(c)に示すように、表部分111a3中の位置及び範囲115a2を特定する。
Based on the
次に、情報抽出手段103は、文書情報111の表部分及び表部分以外のテキスト部分から、レビュー条件情報116に基づいて、契約書にとって重要な情報(記載すべき情報、記載すべきでない情報、記載したほうがよい情報等)を抽出して抽出情報115として記憶部11に格納する(S4)。表部分からの抽出は、上述したように契約書の種類と立場に基づいて定められた単数又は複数の語句からそれぞれ参照情報114を生成して行う。また、テキスト部分からの抽出は、契約書の種類と立場に基づいて定められた単数又は複数の語句をテキスト部分から抽出する。なお、上記した「抽出」には記載された内容を抽出する場合だけでなく、記載されていないことを検知することも含むものとする。また、情報抽出手段103は、抽出した情報を予め定めた方法で修正して記載を統一するものであってもよい。例えば、表情報113aにおいて「契約期間」は、「平成30年1月1日から令和3年12月31日までの4年間」であるが、抽出情報115としては、「締結日」が「平成30年1月1日」、「終了日」が「令和3年12月31日」、「有効期限」が「4年間」と修正して抽出する。また、日付を西暦に統一する等してもよい。
Next, based on the
次に、利用者は、アップロードした文書情報から抽出された情報を確認したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の選択要求を送信する。
Next, the user operates the terminal 2 in order to select the document information that the user wants to check the information extracted from the uploaded document information. The terminal 2 transmits a document information selection request to the document
文書処理サーバ装置1の表示制御手段105は、文書情報の選択要求を受信し、文書情報選択のための画面を端末2の表示部に表示処理する(図示せず。)。
The display control means 105 of the document
利用者は、上記した文書情報選択のための画面を参照しつつ、文書情報を選択し、抽出情報とともに文書情報の表示を要求する。端末2は、選択した文書情報の識別子とともに表示要求を文書処理サーバ装置1に送信する。
The user selects the document information while referring to the screen for selecting the document information described above, and requests the display of the document information together with the extracted information. The terminal 2 transmits a display request to the document
文書処理サーバ装置1の表示制御手段105は、端末2から表示要求を受け付けて文書情報111、表情報113、参照情報114及び抽出情報115に基づいて、例えば以下の図8に示すように、端末2の表示部に画面を表示制御する。
The display control means 105 of the document
図8は、表情報抽出動作の結果、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
FIG. 8 is a schematic diagram showing a configuration example of a screen displayed on the display section of the
画面104eは、文書情報111の内容を表示する表示欄104e1と、抽出情報115の内容を表示する表示欄104e2とを有する。表示欄104e2には抽出情報115の内容が表示され、具体的には、タイトルとして「定期建物賃貸借契約書」、締結日として「平成30年1月1日」、終了日として「令和3年12月31日」、有効期限として「4年間」のように表示され、利用者によって選択された項目が他の項目と表示差をつけることで選択表示104e21となる。また、選択表示104e21となった項目に対応する文書情報111中の位置及び範囲が、参照情報114によって参照されて、強調表示104e11となる。
The
利用者は、上記した抽出情報115を参照するための画面104eを参照し、抽出情報115の内容から契約の詳細と、当該詳細が記載された契約書上の位置及び範囲を確認する。
The user refers to the
また、ここまで項目名が列に並んでいる表について説明してきたが、表の変形例として、項目名が行と列に設けられ、項目名の組み合わせによって項目の内容が定まる表の場合について以下説明する。 Up to this point, we have discussed a table in which item names are arranged in columns, but as a modification of the table, the following is a table in which item names are provided in rows and columns, and the contents of items are determined by the combination of item names. explain.
図7(a)~(f)は、表情報抽出動作における文書情報111の処理の他の例を説明するための概略図である。
FIGS. 7A to 7F are schematic diagrams for explaining another example of processing the
図7(a)に示すように、表部分111bは、例えば、「A社」の「期間」が「○○~○○」といったように、項目の内容が行と列の項目名の組み合わせによって定まる表である。
As shown in FIG. 7(a), in the
また、図7(b)は、表部分111bから抽出された表情報113bであり、一例として、行及び列にそれぞれ項目名を有する構造であって、表部分111bの第1行の「項目」、「A社」、「B社」が行項目名となり、これに対応して列項目名1が「期間」、「○○~○○」、「●●~●●」、列項目名2が「値段」、「100円」、「999円」という構造を有する。
FIG. 7(b) shows
図7(c)は、参照情報114の一例を示す参照情報114bであり、「値段」と「B社」により特定される表中のセルを参照することを示すものである。
FIG. 7(c) is
参照情報114bにより、情報抽出手段103は、図7(d)に示すように、表情報113bの構造中の列項目名2「値段」と行項目名「B社」に該当するノード115b1を特定し、当該ノード115b1に関連付けられたセル(位置情報及び範囲情報)から、図7(e)に示すように、表部分111b中のセル115b2を特定し、図7(f)に示すように、抽出結果115b3として「999円」を得る。
Based on the
(3)契約書レビュー動作
次に、利用者は、アップロードした文書情報から抽出された情報に基づいてレビューを要求したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の選択要求を送信する。
(3) Contract Review Operation Next, the user operates the terminal 2 to select document information for which review is requested based on the information extracted from the uploaded document information. The terminal 2 transmits a document information selection request to the document
文書処理サーバ装置1の表示制御手段105は、文書情報の選択要求を受信し、文書情報選択のための画面を端末2の表示部に表示処理する(図示せず。)。
The display control means 105 of the document
利用者は、上記した文書情報選択のための画面を参照しつつ、文書情報を選択し、文書情報のレビュー結果の表示を要求する。端末2は、選択した文書情報の識別子とともに表示要求を文書処理サーバ装置1に送信する。
The user selects the document information while referring to the screen for selecting the document information described above, and requests the display of the review result of the document information. The terminal 2 transmits a display request to the document
文書処理サーバ装置1の契約書レビュー手段104は、端末2から表示要求を受け付けて、選択された文書情報について、レビュー条件情報116に基づいて抽出情報115の内容をレビューして、レビュー結果情報117を生成し、記憶部11に格納する(S5)。なお、契約書レビュー手段104は、レビュー条件情報116のうち、契約書の類型、作成者の立場等に応じて使用する条件を選択してレビューを行う。
The contract review means 104 of the document
次に、表示制御手段105は、文書情報111、表情報113、参照情報114、抽出情報115及びレビュー結果情報117に基づいて、例えば以下の図9に示すように、端末2の表示部に画面を表示制御する。 Next, the display control means 105 displays a screen on the display unit of the terminal 2 as shown in FIG. to control the display.
図9は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
FIG. 9 is a schematic diagram showing a configuration example of a screen displayed on the display section of the
画面104aは、文書情報111の内容を表示する表示欄104a1と、レビュー結果情報117の内容を表示する表示欄104a2とを有する。表示欄104a2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104a21、104a22、104a23に示され、具体的には、表示ボックス104a21であれば、指摘内容「委託料が税込みか税別か、が定められていません」、修正方針「税込・税別の区別、を追加」、修正文例「(代金)(1)消費税別とする場合 委託者は、受託者に対し、本業務の対価として金●●円及び…」のように表示される。また、表示ボックス104a21、104a22、104a23に対応する文書情報111中の位置及び範囲104a11、104a12、104a13が、参照情報114に基づいて強調表示されて参照される。また、表示ボックス104a21、104a22、104a23にさらに修正内容の解説を表示してもよい。
The
利用者は、上記したレビュー結果情報117を参照するための画面104aを参照し、レビュー結果情報117の内容から契約の問題点と、当該問題点に関連するキーワード又は文が記載された契約書上の位置及び範囲を確認し、必要に応じて編集を行う。
The user refers to the
レビュー結果情報117は、契約書中の表部分とテキスト部分との対応や、契約書の類型、作成者の立場等によってレビューの内容が変わるため、以降その他の例について説明する。なお、図9は、表部分のみから情報が抽出された場合を示し、図10は、表部分及びテキスト部分から情報が抽出された場合を示している。また、図9、図10は、複数の立場において共通のレビューがなされ、図11、図12において立場に応じたレビューがなされている。
Since the contents of the review result
図10は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
FIG. 10 is a schematic diagram showing a configuration example of a screen displayed on the display section of the
画面104bは、文書情報111の内容を表示する表示欄104b1と、レビュー結果情報117の内容を表示する表示欄104b2とを有する。表示欄104b2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104b21、104b22に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104b23に示される。また、表示ボックス104b21、104b22、104b23に対応する文書情報111中の位置及び範囲104b11、104b12、104b13が、参照情報114に基づいて強調表示されて参照される。
The
なお、例えば、表示ボックス104b21では、指摘内容「賃料の支払期日、が定められていません」、修正方針「上記を追加」、修正文例「(賃料)1.賃料は月額金●●円とし、賃借人は、賃貸人に対し、毎月●●日までに…」のように表示されており、レビュー結果情報117において、当該指摘内容に関わる「賃料の支払期日」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104b21、104b22、104b23にさらに修正内容の解説を表示してもよい。
In addition, for example, in the
図11は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
FIG. 11 is a schematic diagram showing a configuration example of a screen displayed on the display section of the
画面104cは、文書情報111の内容を表示する表示欄104c1と、レビュー結果情報117の内容を表示する表示欄104c2とを有する。表示欄104c2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104c21、104c22、104c23に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104c24に示される。また、表示ボックス104c21、104c22、104c23、104c24に対応する文書情報111中の位置及び範囲104c11、104c12、104c13、104c14が、参照情報114に基づいて強調表示されて参照される。
The
なお、例えば、表示ボックス104c21では、指摘内容「履行割合に応じた委託料の金額、が定められていません」、修正方針「上記を追加」、修正文例「(代金)1.委託者は、受託者に対し、本業務の対価として●●円(税込)を、20●●年●月●日までに、…」のように受託者の立場で表示されており、レビュー結果情報117において、当該指摘内容に関わる「委託料の金」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104c21、104c22、104c23にさらに修正内容の解説を表示してもよい。
In addition, for example, in the display box 104c21 , the content of the indication "the amount of the consignment fee corresponding to the fulfillment rate is not specified", the correction policy "add the above", the correction sentence "(price) 1. Consignor is , to the trustee, as consideration for this work, XX yen (including tax) will be paid by 20YYYYYMMDD..." from the perspective of the trustee, and in the review result
図12は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。
FIG. 12 is a schematic diagram showing a configuration example of a screen displayed on the display section of the
画面104dは、文書情報111の内容を表示する表示欄104d1と、レビュー結果情報117の内容を表示する表示欄104d2とを有する。表示欄104d2には、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104d21、104d22に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104d23に示される。また、表示ボックス104d21、104d22、104d23に対応する文書情報111中の位置及び範囲104d11、104d12、104d13が、参照情報114に基づいて強調表示されて参照される。
The
なお、例えば、表示ボックス104d21では、指摘内容「委託業務に付随する業務も、業務内容に含まれる旨が、定められていません」、修正方針「業務内容に、「具体的な委託業務に付随する一切の業務」を追加」、修正文例「(委託内容)委託者は、受託者に対し、以下の業務(以下「本業務」という。)を委託し、…」のように委託者の立場で表示されており、レビュー結果情報117において、当該指摘内容に関わる「委託業務に付随する業務」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104d21、104d22、104d23にさらに修正内容の解説を表示してもよい。
In addition, for example, in the display box 104d21 , the content of indication "It is not defined that the work incidental to the outsourced work is also included in the work content", the correction policy "work content" Add "all incidental work", amended sentence "(Consignment) The consignor entrusts the following work (hereinafter referred to as "this work") to the consignor, and the consignor's In the review result
(実施の形態の効果)
上記した実施の形態によれば、文書情報111に表を含む場合に、表抽出条件情報112に基づいて当該表を構造化して表情報113として抽出するとともに、当該表情報113中の情報と対応する文書情報111中の位置を対応付けて、これらの情報を参照するための参照情報114を生成するようにしたため、構造化されていない表を含む場合であっても文書情報111から抽出情報115を抽出して抽出箇所を提示することができる
(Effect of Embodiment)
According to the above embodiment, when a table is included in the
また、さらに文書情報111の表部分及びテキスト部分から情報を抽出して抽出情報115を生成し、抽出情報115を対象として契約書レビュー手段104によってレビューを行うようにしたため、テキスト部分に限らず表部分も含めて契約書をレビューすることができる。
Further, information is extracted from the table portion and the text portion of the
[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
[Other embodiments]
The present invention is not limited to the above-described embodiments, and various modifications are possible without departing from the scope of the present invention.
例えば、文書情報111は契約書に限らず、構成要素で分割できるものであれば、法律そのものの文書や取り扱い説明書等であってよいし、同様に本発明を適用可能である。また、構成要素は、条文、項、号に限らず、単語や文字・記号であってもよいし、段落、文章であってもよい。
For example, the
上記実施の形態では制御部10の各手段100‐105の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD‐ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。
Although the functions of the
1 :文書処理サーバ装置
2、3 :端末
4 :ネットワーク
5 :文書処理システム
10 :制御部
11 :記憶部
12 :通信部
100 :契約書受付手段
101 :表情報抽出手段
102 :参照情報生成手段
103 :情報抽出手段
104 :契約書レビュー手段
105 :表示制御手段
110 :文書処理プログラム
111 :文書情報
112 :表抽出条件情報
113 :表情報
114 :参照情報
115 :抽出情報
116 :レビュー条件情報
117 :レビュー結果情報
1: document processing server devices 2, 3: terminal 4: network 5: document processing system 10: control unit 11: storage unit 12: communication unit 100: contract receiving means 101: table information extracting means 102: reference information generating means 103 : Information extraction means 104 : Contract review means 105 : Display control means 110 : Document processing program 111 : Document information 112 : Table extraction condition information 113 : Table information 114 : Reference information 115 : Extraction information 116 : Review condition information 117 : Review Result information
Claims (7)
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ように前記コンピュータを機能させるための文書処理プログラム。 by being executed by a computer,
Structuring the information contained in the table part in the document information based on the structure of the table part and extracting it as table information,
generating reference information for referring to information in the table information;
Extracting information in at least the table portion of a text portion and a table portion included in the document information using the reference information based on a predetermined condition;
A word processing program for causing said computer to function as a computer.
当該表情報中の情報を参照するための参照情報を生成する参照情報生成手段と、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する情報抽出手段として機能させる情報処理装置。 table information extracting means for structuring information contained in a table portion in document information based on the structure of the table portion and extracting it as table information;
reference information generating means for generating reference information for referring to information in the table information;
An information processing apparatus functioning as information extracting means for extracting at least the information of the table portion out of the text portion and the table portion included in the document information using the reference information based on a predetermined condition.
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。 a memory configured to store document information in addition to predetermined instructions;
Based on instructions stored in the memory,
structuring information contained in the table portion in the document information stored in the memory based on the structure of the table portion and extracting it as table information;
generating reference information for referring to information in the table information;
Extracting information in at least the table portion of a text portion and a table portion included in the document information using the reference information based on a predetermined condition;
a processor configured to perform processing for
Information processing equipment including.
当該表情報中の情報を参照するための参照情報を生成するステップと、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出するステップとを有する文書処理方法。
a step of structuring information contained in a table portion in the document information based on the configuration of the table portion and extracting it as table information;
generating reference information for referencing information in the tabular information;
and extracting information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021082985A JP2022176511A (en) | 2021-05-17 | 2021-05-17 | Document processing program, information processing device and document processing method |
JP2025124452A JP2025137773A (en) | 2021-05-17 | 2025-07-25 | Document processing program, information processing device, and document processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021082985A JP2022176511A (en) | 2021-05-17 | 2021-05-17 | Document processing program, information processing device and document processing method |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2025124452A Division JP2025137773A (en) | 2021-05-17 | 2025-07-25 | Document processing program, information processing device, and document processing method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022176511A true JP2022176511A (en) | 2022-11-30 |
JP2022176511A5 JP2022176511A5 (en) | 2024-04-03 |
Family
ID=84233943
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021082985A Pending JP2022176511A (en) | 2021-05-17 | 2021-05-17 | Document processing program, information processing device and document processing method |
JP2025124452A Pending JP2025137773A (en) | 2021-05-17 | 2025-07-25 | Document processing program, information processing device, and document processing method |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2025124452A Pending JP2025137773A (en) | 2021-05-17 | 2025-07-25 | Document processing program, information processing device, and document processing method |
Country Status (1)
Country | Link |
---|---|
JP (2) | JP2022176511A (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0378892A (en) * | 1989-08-23 | 1991-04-04 | Fuji Electric Co Ltd | Recognizing device for tabular document |
JPH08147329A (en) * | 1994-11-18 | 1996-06-07 | Casio Comput Co Ltd | Read image processor |
JPH09288714A (en) * | 1996-04-19 | 1997-11-04 | Hitachi Ltd | Table recognition method and device |
JP2008071316A (en) * | 2006-09-15 | 2008-03-27 | Ricoh Co Ltd | Print information monitoring apparatus, print information monitoring method, and program |
US20160371321A1 (en) * | 2011-06-10 | 2016-12-22 | Linkedin Corporation | Fact checking search results |
JP2019114264A (en) * | 2017-12-24 | 2019-07-11 | Gva Tech株式会社 | Legal document review program, legal document review method, and legal document review system |
-
2021
- 2021-05-17 JP JP2021082985A patent/JP2022176511A/en active Pending
-
2025
- 2025-07-25 JP JP2025124452A patent/JP2025137773A/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0378892A (en) * | 1989-08-23 | 1991-04-04 | Fuji Electric Co Ltd | Recognizing device for tabular document |
JPH08147329A (en) * | 1994-11-18 | 1996-06-07 | Casio Comput Co Ltd | Read image processor |
JPH09288714A (en) * | 1996-04-19 | 1997-11-04 | Hitachi Ltd | Table recognition method and device |
JP2008071316A (en) * | 2006-09-15 | 2008-03-27 | Ricoh Co Ltd | Print information monitoring apparatus, print information monitoring method, and program |
US20160371321A1 (en) * | 2011-06-10 | 2016-12-22 | Linkedin Corporation | Fact checking search results |
JP2019114264A (en) * | 2017-12-24 | 2019-07-11 | Gva Tech株式会社 | Legal document review program, legal document review method, and legal document review system |
Also Published As
Publication number | Publication date |
---|---|
JP2025137773A (en) | 2025-09-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9372858B1 (en) | Systems and methods to present automated suggestions in a document | |
US20060259524A1 (en) | Systems and methods for document project management, conversion, and filing | |
JP6307745B2 (en) | Accounting system | |
US20110173529A1 (en) | Template processing engine for business systems | |
US20040162895A1 (en) | Web site management with electronic storefront and page categorization | |
US20070136255A1 (en) | System and method for generating, maintaining, and rendering landing and web pages | |
JP6594801B2 (en) | Supply and demand adjustment device, supply and demand adjustment system, and supply and demand adjustment method | |
US20220237257A1 (en) | System and method for browser-based target data extraction | |
CN113076731A (en) | Report file generation method and device, computer equipment and storage medium | |
JP2007183796A (en) | Business evaluation value calculation system | |
US8429149B2 (en) | System, method and computer program products for determining O*NET codes from job descriptions | |
JP2025089559A (en) | Document processing program, information processing device, and document processing method | |
KR102362836B1 (en) | Webzine production and management system and its method | |
US20190188762A1 (en) | Information processing apparatus and information processing method | |
CN117693729A (en) | Systems and methods for managing database storage terms | |
JP5400496B2 (en) | System for creating articles based on the results of financial statement analysis | |
US20110054972A1 (en) | Calculation/determination of budget and employee allocation targets using a model | |
JP2022176511A (en) | Document processing program, information processing device and document processing method | |
US20190139108A1 (en) | Information processing apparatus and display method | |
JP7094515B1 (en) | Matching system, matching method and program | |
JP6187633B2 (en) | Generating mobile documents from a print workflow | |
US20190080305A1 (en) | Information processing apparatus and display method | |
JP2001076045A (en) | Business flow diagram creation support device and its recording medium | |
JP7440979B1 (en) | File sorting system, file sorting method, and file sorting program | |
US20060036459A1 (en) | User configurable one click punchout tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20220722 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20220726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240326 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240326 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250131 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20250428 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250725 |