[go: up one dir, main page]

JP2022176511A - Document processing program, information processing device and document processing method - Google Patents

Document processing program, information processing device and document processing method Download PDF

Info

Publication number
JP2022176511A
JP2022176511A JP2021082985A JP2021082985A JP2022176511A JP 2022176511 A JP2022176511 A JP 2022176511A JP 2021082985 A JP2021082985 A JP 2021082985A JP 2021082985 A JP2021082985 A JP 2021082985A JP 2022176511 A JP2022176511 A JP 2022176511A
Authority
JP
Japan
Prior art keywords
information
document
extracting
table portion
contract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2021082985A
Other languages
Japanese (ja)
Other versions
JP2022176511A5 (en
Inventor
恵太 岩本
Keita Iwamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Legalforce
LegalForce Inc Japan
Original Assignee
Legalforce
LegalForce Inc Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Legalforce, LegalForce Inc Japan filed Critical Legalforce
Priority to JP2021082985A priority Critical patent/JP2022176511A/en
Publication of JP2022176511A publication Critical patent/JP2022176511A/en
Publication of JP2022176511A5 publication Critical patent/JP2022176511A5/ja
Priority to JP2025124452A priority patent/JP2025137773A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

Figure 2022176511000001

【課題】構造化されていない表を含む場合であっても文書情報から情報を抽出して抽出箇所を提示する文書処理プログラム、情報処理装置及び文書処理方法を提供する。
【解決手段】文書処理サーバ装置1は、文書情報111内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報113として抽出する表情報抽出手段101と、当該表情報113中の情報を参照するための参照情報114を生成する参照情報生成手段102と、文書情報111に含まれるテキスト部分及び表部分から少なくとも表部分中の情報を、予め定めた条件に基づいて、参照情報114を用いて抽出する情報抽出手段103として機能させる。
【選択図】図2

Figure 2022176511000001

A document processing program, an information processing apparatus, and a document processing method are provided for extracting information from document information and presenting an extracted part even if the document information includes an unstructured table.
A document processing server apparatus (1) includes table information extraction means (101) for structuring information included in a table part in document information (111) based on the configuration of the table part and extracting the table information (113), and the table information (113). Reference information generating means 102 for generating reference information 114 for referring to the information in the document information 111, and referring to at least the information in the table portion from the text portion and the table portion included in the document information 111 based on a predetermined condition. It functions as information extracting means 103 that extracts using information 114 .
[Selection drawing] Fig. 2

Description

本開示は、文書処理プログラム、情報処理装置及び文書処理方法に関する。 The present disclosure relates to a document processing program, an information processing apparatus, and a document processing method.

従来の技術として、紙文書のイメージデータから、あらかじめ決められた規則性に基づいて項目名とそれに対応する文字データを抽出する情報処理装置が提案されている(例えば、特許文献1参照)。 2. Description of the Related Art As a conventional technique, an information processing apparatus has been proposed that extracts item names and corresponding character data from image data of paper documents based on predetermined regularity (see, for example, Japanese Unexamined Patent Application Publication No. 2002-100003).

特許文献1に開示された情報処理装置は、文書等に記載された表の縦罫の長さや、各枠の横幅、面積等を計算しこれらを比較して、項目枠が縦罫の右側であるとか、幅が狭く面積も小さいといった規則性に基づき、項目枠を抽出し、該項目枠内の文字パターンに認識処理を実施することで項目名を取得する。さらに、項目枠の右側または下側よりデータ枠を抽出することで、項目名とデータとの対応付けを行う。 The information processing apparatus disclosed in Patent Document 1 calculates the length of a vertical ruled line, the width of each frame, the area, etc. of a table described in a document or the like, compares them, and determines that the item frame is on the right side of the vertical ruled line. The item name is obtained by extracting the item frame based on the regularity such as the width being narrow and the area being small, and performing recognition processing on the character pattern within the item frame. Furthermore, by extracting the data frame from the right side or the lower side of the item frame, the item name and the data are associated with each other.

特開平10‐116314号公報JP-A-10-116314

しかし、上記した特許文献1に開示された情報処理装置によると、データ枠に文字が記入されていても表の中から項目枠とデータ枠とを区別し、表データを読み取るものの、表画像と表データとの対応を行うものではなく、また、表データから特定の情報を抽出するものでもないため、文書の内容に応じた種類の情報が記載されている表画像上の位置又は範囲を示すことができない、という問題がある。 However, according to the information processing apparatus disclosed in the above-mentioned Patent Document 1, even if characters are entered in the data frame, the item frame and the data frame are distinguished from the table, and although the table data is read, the table image and the table image are read. Indicates the position or range on the table image where the type of information according to the content of the document is described, as it does not correspond to the table data and does not extract specific information from the table data. I have a problem that I can't.

本開示の目的は、上記従来技術を踏まえ、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することにある。 An object of the present disclosure is to provide a document processing program, an information processing apparatus, and a document processing method that are more convenient to use, based on the conventional technology described above.

本開示に係る発明の一態様は、上記目的を達成するため、以下の文書処理プログラム、情報処理装置及び文書処理方法を提供する。 One aspect of the invention according to the present disclosure provides the following document processing program, information processing apparatus, and document processing method in order to achieve the above object.

[1]コンピュータにより実行されることにより、
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、ように前記コンピュータを機能させるための文書処理プログラム。
[2]文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出する表情報抽出手段と、
当該表情報中の情報を参照するための参照情報を生成する参照情報生成手段と、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する情報抽出手段として機能させる情報処理装置。
[3]所定の指示命令に加えて、文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
[4]文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出するステップと、
当該表情報中の情報を参照するための参照情報を生成するステップと、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出するステップとを有する文書処理方法。
[1] By being executed by a computer,
Structuring the information contained in the table part in the document information based on the structure of the table part and extracting it as table information,
generating reference information for referring to information in the table information;
Document processing for causing the computer to function so as to extract information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information. program.
[2] table information extracting means for structuring information contained in a table portion in document information based on the configuration of the table portion and extracting it as table information;
reference information generating means for generating reference information for referring to information in the table information;
An information processing apparatus functioning as information extracting means for extracting information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information.
[3] a memory configured to store document information in addition to predetermined instructions;
Based on instructions stored in the memory,
structuring information contained in the table portion in the document information stored in the memory based on the structure of the table portion and extracting it as table information;
generating reference information for referring to information in the table information;
Extracting information in at least the table portion of a text portion and a table portion included in the document information using the reference information based on a predetermined condition;
a processor configured to perform processing for
Information processing equipment including.
[4] a step of structuring information contained in a table portion in the document information based on the configuration of the table portion and extracting it as table information;
generating reference information for referencing information in the tabular information;
and extracting information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information.

本開示の様々な実施形態によれば、より使い勝手のよい文書処理プログラム、情報処理装置及び文書処理方法を提供することが可能となる。 According to various embodiments of the present disclosure, it is possible to provide a more convenient document processing program, information processing apparatus, and document processing method.

図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。FIG. 1 is a schematic diagram showing an example configuration of a document processing system according to an embodiment. 図2は、実施の形態に係る文書処理サーバ装置の構成例を示すブロック図である。FIG. 2 is a block diagram showing a configuration example of the document processing server device according to the embodiment. 図3は、文書情報の構成例を示す概略図である。FIG. 3 is a schematic diagram showing a configuration example of document information. 図4は、表抽出条件の構成例を示す概略図である。FIG. 4 is a schematic diagram showing a configuration example of table extraction conditions. 図5は、表情報の構成例を示す概略図である。FIG. 5 is a schematic diagram showing a configuration example of table information. 図6(a)~(c)は、表情報抽出動作における文書情報の処理の一例を説明するための概略図である。FIGS. 6A to 6C are schematic diagrams for explaining an example of document information processing in table information extraction operation. 図7(a)~(f)は、表情報抽出動作における文書情報の処理の他の例を説明するための概略図である。FIGS. 7A to 7F are schematic diagrams for explaining another example of document information processing in table information extraction operation. 図8は、表情報抽出動作の結果、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。FIG. 8 is a schematic diagram showing a configuration example of a screen displayed on the display unit of the terminal by the display control means as a result of the table information extraction operation. 図9は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。FIG. 9 is a schematic diagram showing a configuration example of a screen displayed on the display unit of the terminal by the display control means in the contract review operation. 図10は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。FIG. 10 is a schematic diagram showing a configuration example of a screen displayed on the display unit of the terminal by the display control means in the contract review operation. 図11は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。FIG. 11 is a schematic diagram showing a configuration example of a screen displayed on the display unit of the terminal by the display control means in the contract review operation. 図12は、契約書レビュー動作において、表示制御手段により端末の表示部に表示される画面の構成例を示す概略図である。FIG. 12 is a schematic diagram showing a configuration example of a screen displayed on the display unit of the terminal by the display control means in the contract review operation. 図13は、文書処理サーバ装置の検査動作を示すフローチャートである。FIG. 13 is a flow chart showing the inspection operation of the document processing server device.

[実施の形態]
(文書処理システムの構成)
図1は、実施の形態に係る文書処理システムの構成の一例を示す概略図である。
[Embodiment]
(Configuration of document processing system)
FIG. 1 is a schematic diagram showing an example configuration of a document processing system according to an embodiment.

この文書処理システム5は、文書処理サーバ装置1と、端末2と、端末3とをネットワーク4によって互いに通信可能に接続することで構成される。端末2は、例えば、文書作成、文書内容確認及び/又は文書レビューを希望する利用者によって操作され、端末3は文書作成、文書内容確認及び/又は文書レビューを希望する他の利用者によって操作されるが、これに限られるものではない。端末2の利用者と、端末3の利用者とは文書情報として、例えば、契約書を互いに合意できる内容になるまで、利用者間で修正とその承認を繰り返すものであり、主に、一方の利用者が作成した文書情報に記載された内容を把握するために文書処理システム5を利用する。または、一方の利用者の作成した文書情報に記載された内容をレビューしてもらうために文書処理システム5を利用してもよいし、任意の2つの文書情報を対比する際にも文書処理システム5を利用してもよい。 The document processing system 5 is configured by connecting a document processing server device 1, a terminal 2, and a terminal 3 through a network 4 so as to be able to communicate with each other. Terminal 2 is operated, for example, by a user who desires document creation, document content confirmation and/or document review, and terminal 3 is operated by another user who desires document creation, document content confirmation and/or document review. However, it is not limited to this. The user of the terminal 2 and the user of the terminal 3 repeatedly modify and approve the contract as document information until, for example, the contents of the contract are mutually agreed upon. The document processing system 5 is used to grasp the contents described in the document information created by the user. Alternatively, the document processing system 5 may be used to have the contents described in the document information created by one user reviewed, and the document processing system 5 may be used when comparing any two pieces of document information. 5 may be used.

文書処理サーバ装置1は、サーバ型の情報処理装置であり、端末2及び端末3の要求に応じて動作するものであって、本体内に情報を処理するための機能を有するCPU(Central Processing Unit)やHDD(Hard Disk Drive)、フラッシュメモリ等の電子部品を備える。なお、文書処理サーバ装置1は、必ずしも単体の情報処理装置で構成される必要はなく、複数の情報処理装置が協働して動作するものであってもよいし、任意のクラウドサービスによって動作するものであってもよい。また、文書処理サーバ装置1の機能を端末2及び/又は端末3内で実現するものであってもよい The document processing server device 1 is a server-type information processing device that operates in response to requests from the terminals 2 and 3. The document processing server device 1 includes a CPU (Central Processing Unit) having a function for processing information. ), HDD (Hard Disk Drive), and flash memory. Note that the document processing server device 1 does not necessarily have to consist of a single information processing device. can be anything. Also, the function of the document processing server device 1 may be realized within the terminal 2 and/or the terminal 3.

端末2及び端末3は、PC(Personal Computer)やタブレット端末等の情報処理装置であって、本体内に情報を処理するための機能を有するCPUやフラッシュメモリ等の電子部品を備える。 The terminals 2 and 3 are information processing apparatuses such as PCs (Personal Computers) and tablet terminals, and include electronic components such as CPUs and flash memories having functions for processing information in their main bodies.

ネットワーク4は、高速通信が可能な通信ネットワークであり、例えば、インターネット、イントラネットやLAN(Local Area Network)等の有線又は無線の通信網である。 The network 4 is a communication network capable of high-speed communication, and is, for example, a wired or wireless communication network such as the Internet, an intranet, or a LAN (Local Area Network).

上記構成において、一例として、文書処理サーバ装置1が処理する文書は契約書等の法律分野の文書であり、利用者の一方又は双方は法律の専門家ではないが契約書の作成を必要とする人物、又は弁護士等の法律の専門家であって契約書の作成の知識を有する人物である。また、例えば、一方又は双方の利用者は社内の営業部の社員、又は社内法務部の社員である。 In the above configuration, as an example, the document processed by the document processing server device 1 is a document in the legal field such as a contract, and one or both of the users are not legal experts but need to prepare the contract. A person, or a person who is a legal expert such as a lawyer and has knowledge of drafting a contract. Also, for example, one or both of the users are employees of the company's sales department or employees of the company's legal department.

端末2又は端末3から文書情報を文書処理サーバ装置1にアップロードした後、契約書を作成する際に利用者の作業負担を減らすべく、又は利用者単独での契約書の作成を支援するべく、文書処理サーバ装置1は、文書情報から契約書に重要な項目の抽出を行い、またさらに抽出した項目を利用して契約書のレビューを行う。また、さらに端末2又は端末3から文書処理サーバ装置1を介して又はメール等の他の手段を用いて端末3又は端末2へ依頼要求を送信することで契約書のレビューを依頼し、端末2及び端末3から文書処理サーバ装置1上の文書情報を編集することで、双方の利用者の意見とレビュー結果を反映した契約書を作成する等の作業を行うことができるように構成されているものであってもよい。 After uploading the document information from the terminal 2 or terminal 3 to the document processing server device 1, in order to reduce the work burden on the user when creating the contract, or to support the creation of the contract by the user alone, The document processing server device 1 extracts important items of the contract from the document information, and uses the extracted items to review the contract. Further, the terminal 2 or the terminal 3 sends a request request to the terminal 3 or the terminal 2 via the document processing server device 1 or using other means such as e-mail to request the review of the contract. And by editing the document information on the document processing server device 1 from the terminal 3, it is possible to perform work such as creating a contract that reflects the opinions and review results of both users. can be anything.

本実施の形態では特に、文書処理サーバ装置1は、表を含む文書情報の表部分及び本文部分からそれぞれ重要な項目の抽出を行い、またさらに抽出した項目を利用して契約書のレビューを行う。実施の形態を以下で説明する。 Particularly in this embodiment, the document processing server device 1 extracts important items from the table portion and text portion of the document information including tables, and furthermore, uses the extracted items to review the contract. . Embodiments are described below.

また、端末2及び端末3はそれぞれ単数を図示しているが、複数台がネットワーク4に接続されるものであってもよく、同様にこれらを操作する利用者は複数人であってもよい。 Although a single terminal 2 and a single terminal 3 are illustrated, a plurality of terminals may be connected to the network 4, and similarly, a plurality of users may operate these terminals.

(文書処理サーバ装置の構成)
図2は、実施の形態に係る文書処理サーバ装置1の構成例を示すブロック図である。
(Configuration of document processing server device)
FIG. 2 is a block diagram showing a configuration example of the document processing server device 1 according to the embodiment.

文書処理サーバ装置1は、CPU等から構成され、各部を制御するとともに、各種のプログラムを実行する制御部10と、フラッシュメモリ等の記憶媒体から構成され情報を記憶する記憶部11と、ネットワーク4を介して外部と通信するための通信インターフェイスとして機能する通信部12とを備える。 The document processing server device 1 is composed of a CPU and the like, and includes a control section 10 for controlling each section and executing various programs, a storage section 11 configured by a storage medium such as a flash memory for storing information, and a network 4. and a communication unit 12 functioning as a communication interface for communicating with the outside via the.

制御部10は、CPU等のプロセッサから構成され、メモリから構成される記憶部11及び通信インターフェイスとして機能する通信部12に電気的に接続される。当該制御部10は、後述する文書処理プログラム110を実行することで、契約書受付手段100、表情報抽出手段101、参照情報生成手段102、情報抽出手段103、契約書レビュー手段104及び表示制御手段105等として機能する。 The control unit 10 includes a processor such as a CPU, and is electrically connected to a storage unit 11 including a memory and a communication unit 12 functioning as a communication interface. By executing a document processing program 110, which will be described later, the control unit 10 executes a contract reception unit 100, a table information extraction unit 101, a reference information generation unit 102, an information extraction unit 103, a contract review unit 104, and a display control unit. 105 and the like.

契約書受付手段100は、端末2又は端末3から契約書を文書情報111として受け付けて記憶部11に格納する。なお、以降の説明において契約書受付手段100が受け付ける文書情報111は、表を含む契約書等の文書情報であって、少なくとも表部分は行や列等の情報の配置、並びを定義する構造上の情報を有しないものを前提とするが、予め構造上の情報が付与されたものを受け付けてもよい。 The contract receiving means 100 receives the contract as the document information 111 from the terminal 2 or the terminal 3 and stores it in the storage unit 11 . In the following description, the document information 111 received by the contract receiving means 100 is document information such as a contract including a table. Although it is premised that the information does not have the information of the structure, it may be accepted that the information on the structure is added in advance.

表情報抽出手段101は、文書情報111の表部分から表抽出条件情報112に基づいて表の構成に応じて情報を抽出し、抽出した情報を構造化して表情報113として記憶部11に格納する。 The table information extraction means 101 extracts information according to the structure of the table from the table portion of the document information 111 based on the table extraction condition information 112 , structures the extracted information, and stores it in the storage unit 11 as table information 113 . .

参照情報生成手段102は、構造化された表情報113上の情報を文書情報111上にて参照する場合に用いられる参照情報114を生成して記憶部11に格納する。 The reference information generating means 102 generates reference information 114 used when referring to the information on the structured table information 113 on the document information 111 and stores it in the storage unit 11 .

情報抽出手段103は、文書情報111の表部分及び表部分以外のテキスト部分から、契約書にとって重要な情報(記載すべき情報、記載すべきでない情報、記載したほうがよい情報等)を定めたレビュー条件情報116に基づいて抽出して抽出情報115として記憶部11に格納する。また、情報抽出手段103は、抽出した情報を予め定めた方法で修正して記載を統一するものであってもよい。 The information extracting means 103 performs a review that determines important information for the contract (information that should be written, information that should not be written, information that should be written, etc.) from the table part of the document information 111 and the text part other than the table part. It is extracted based on the condition information 116 and stored in the storage unit 11 as extraction information 115 . Further, the information extracting means 103 may modify the extracted information by a predetermined method to unify the description.

契約書レビュー手段104は、レビュー条件情報116に基づいて抽出情報115の内容をレビューしてレビュー結果情報117を生成し、記憶部11に格納する。 The contract review means 104 reviews the content of the extracted information 115 based on the review condition information 116 to generate review result information 117 and stores it in the storage unit 11 .

表示制御手段105は、記憶部11の文書情報111、表情報113、抽出情報115並びに各手段100‐104の出力結果を予め定めた方法で端末2及び端末3の表示部に表示制御する。なお、表示方法の詳細は後述する。 The display control means 105 controls display of the document information 111, the table information 113, the extraction information 115 and the output results of the means 100 to 104 in the storage section 11 on the display sections of the terminals 2 and 3 by a predetermined method. Details of the display method will be described later.

記憶部11は、フラッシュメモリ等のメモリから構成され、プロセッサ等から構成される制御部10及通信インターフェイスとして機能する通信部12に電気的に接続される。当該記憶部11は、制御部10を上述した各手段100‐105として動作させる文書処理プログラム110、文書情報111、表抽出条件情報112、表情報113、参照情報114、抽出情報115、レビュー条件情報116及びレビュー結果情報117等を記憶する。 The storage unit 11 is composed of a memory such as a flash memory, and is electrically connected to a control unit 10 composed of a processor or the like and a communication unit 12 functioning as a communication interface. The storage unit 11 stores a document processing program 110, document information 111, table extraction condition information 112, table information 113, reference information 114, extraction information 115, review condition information, which causes the control unit 10 to operate as each of the means 100 to 105 described above. 116, review result information 117, and the like.

図3は、文書情報111の構成例を示す概略図である。 FIG. 3 is a schematic diagram showing a configuration example of the document information 111. As shown in FIG.

文書情報111は、一例として、契約書であり、契約書のタイトル111aと、序文111aと、契約要項をまとめた表部分111aと、これらに続く条項112a…とを有する。 The document information 111 is, for example, a contract, and has a title 111a 1 of the contract, a preface 111a 2 , a table portion 111a 3 summarizing contract requirements, and clauses 112a 4 . . . following these.

図4は、表抽出条件情報112の構成例を示す概略図である。 FIG. 4 is a schematic diagram showing a configuration example of the table extraction condition information 112. As shown in FIG.

表抽出条件情報112は、表情報を抽出するための条件を定めた情報であり、条件を識別するための条件IDと、条件の内容を示す条件と、条件を満たした場合の動作を示す結果とを有する。例えば、条件ID「001」に示すように、表の構成として、表の左端の同一列の項目は構造の同一階層の項目とすることで、図3の表部分111aの左端同一列の項目「建物の表示」、「賃貸借の目的物」、「賃貸借条件」が項目名となる。また、条件ID「002」に示すように、表の構成として、同一列の複数項目が左列の一項目の枠に属する場合は左列一項目の項目名の従属項目とすることで、図3の表部分111aの左から2番目の同一列の項目、例えば、「目的物の位置及び範囲」、「目的物の床面積(壁心計算)」が項目名の「賃貸借の目的物」の従属項目となる。条件ID「003」に示すように、表の構成として、項目名が「委託者」、「受託者」である場合は構造の同一階層の項目名とする。 The table extraction condition information 112 is information that defines conditions for extracting table information, and includes a condition ID for identifying the condition, a condition indicating the content of the condition, and a result indicating the operation when the condition is satisfied. and For example, as indicated by the condition ID "001", the items in the same column at the left end of the table are arranged in the same hierarchical structure. "Indication of building", "Object of lease", and "Terms of lease" are the item names. Also, as shown in the condition ID "002", the structure of the table is such that when multiple items in the same column belong to the frame of one item in the left column, they are subordinate to the item name in the left column. Table part 111a of 3 Items in the same column second from the left of 3 , for example, "position and range of object" and "floor area of object (wall center calculation)" are the item names "object for lease" is a subordinate item of As shown in the condition ID "003", if the item names are "entrustor" and "trustee" in the structure of the table, the item names are in the same hierarchical level of the structure.

図5は、表情報113の構成例を示す概略図である。 FIG. 5 is a schematic diagram showing a configuration example of the table information 113. As shown in FIG.

表情報113aは、一例として、図5に示すような構造を有し、表中の項目名、従属項目名、記述内容を有する。図4で説明したように、「建物の表示」、「賃貸借の目的物」、「賃貸借条件」が構造の項目名となり、これら各項目の従属項目名と、さらに各従属項目名の記述内容とを有する。なお、表情報113aは、項目名、従属項目名、記述内容に限らず、表の構造に合わせた構造名を有するようにする。 The table information 113a has a structure as shown in FIG. 5 as an example, and has item names, subordinate item names, and description contents in the table. As explained in FIG. 4, "display of building", "object of lease", and "lease terms" are the item names of the structure. have Note that the table information 113a is not limited to item names, subordinate item names, and description contents, and should have structure names that match the structure of the table.

(文書処理システムの動作)
次に、実施の形態の作用を、(1)基本動作、(2)表情報抽出動作、(3)契約書レビュー動作に分けて説明する。以降、端末2を操作対象として動作を説明するが、端末3に置き換えた場合も同様の動作となる場合は説明を省略する。
(Operation of document processing system)
Next, the operation of the embodiment will be described separately for (1) basic operation, (2) table information extraction operation, and (3) contract review operation. Hereinafter, the operation will be described with the terminal 2 as the operation target, but if the operation is the same when the terminal 3 is substituted, the description will be omitted.

(1)基本動作
まず、利用者は、文書処理サーバ装置1の提供するサービスへログインを行うため端末2を操作する。端末2は、利用者から利用者ID及びパスワード等の情報の入力を受け付けると、当該情報とともに認証要求を文書処理サーバ装置1に送信する。
(1) Basic Operation First, the user operates the terminal 2 to log in to the service provided by the document processing server device 1 . When the terminal 2 accepts input of information such as a user ID and a password from the user, the terminal 2 transmits an authentication request to the document processing server device 1 together with the information.

文書処理サーバ装置1は、端末2から利用者ID及びパスワード等の情報とともに認証要求を受信すると、予め登録された利用者ID及びパスワード等を含む図示しない利用者情報を参照し、利用者としての依頼者の認証を行う。 When the document processing server device 1 receives an authentication request together with information such as a user ID and password from the terminal 2, the document processing server device 1 refers to user information (not shown) including a pre-registered user ID and password, etc. Authenticate the requester.

次に、利用者は、サービスへのログインが完了すると、契約書の文書情報を文書処理サーバ装置1へアップロードするため端末2を操作する。端末2は、当該文書情報を文書処理サーバ装置1へアップロードする。 Next, when the user completes logging in to the service, the user operates the terminal 2 to upload the document information of the contract to the document processing server device 1 . The terminal 2 uploads the document information to the document processing server device 1 .

文書処理サーバ装置1は、依頼者の操作する端末2から文書情報111を受け付けて記憶部11に格納する。 The document processing server device 1 receives document information 111 from the terminal 2 operated by the client and stores it in the storage unit 11 .

文書処理サーバ装置1は、端末2から文書情報を受け付けると(図13、S1)、以下に示す表情報抽出動作を開始する。なお、文書処理サーバ装置1は、契約書の種類と契約書の立場とともに比較要求を受け付けてもよく、当該契約書の種類と契約書の立場に基づいて抽出する情報を変更し、後述する「(3)契約書レビュー動作」においてレビュー内容を変更する。 When the document processing server device 1 receives the document information from the terminal 2 (FIG. 13, S1), it starts the table information extraction operation described below. Note that the document processing server device 1 may receive a comparison request together with the type of contract and the status of the contract, change the information to be extracted based on the type of contract and the status of the contract, (3) Contract review operation" to change the review contents.

(2)表情報抽出動作
図13は、文書処理サーバ装置1の検査動作を示すフローチャートである。
(2) Table Information Extraction Operation FIG. 13 is a flow chart showing the inspection operation of the document processing server device 1 .

まず、表情報抽出手段101は、図3に示すように、文書情報111の表部分111a部分から情報を抽出し、表抽出条件情報112に基づいて抽出した情報を構造化して表情報113として記憶部11に格納する(S2)。 First, as shown in FIG. 3, the table information extracting means 101 extracts information from the table portion 111a3 of the document information 111, and structures the extracted information based on the table extraction condition information 112 as table information 113. Store in the storage unit 11 (S2).

表情報抽出手段101が文書情報111から表部分111aを認識する方法としては、例えば、罫線等から表中の項目の配置を認識する方法、及び表部分111a中のテキストを認識する方法としてはOCR(Optical Character Recognition)等の技術が挙げられるが、これに限られるものではない。 As a method for the table information extracting means 101 to recognize the table portion 111a3 from the document information 111, for example, a method of recognizing the arrangement of items in the table from ruled lines and the like, and a method of recognizing the text in the table portion 111a3 . includes a technique such as OCR (Optical Character Recognition), but is not limited to this.

また、表情報抽出手段101が抽出した表部分111aの構造及びテキストの内容を表情報113に構造化する方法は、図4において説明したものであって、表抽出条件情報112の条件に合致する項目について結果で指示された内容で行う。なお、表情報抽出手段101は、表情報113の構造の各項目名、従属項目名、記述内容に対して表部分111a中の該当するテキストの位置情報(座標等)及び範囲情報(幅及び高さ等)を関連付けて記憶する。 The method of structuring the structure of the table portion 111a3 and the contents of the text extracted by the table information extraction means 101 into the table information 113 is the same as that described with reference to FIG. Do what is indicated in the results for the items to be done. Note that the table information extraction means 101 extracts position information (coordinates, etc. ) and range information (width and height, etc.) are associated with each other and stored.

次に、参照情報生成手段102は、構造化された表情報113上の情報を文書情報111上にて参照する場合に用いられる参照情報114を生成して記憶部11に格納する(S3)。 Next, the reference information generation means 102 generates reference information 114 used when referring to the information on the structured table information 113 on the document information 111, and stores it in the storage section 11 (S3).

図6(a)~(c)は、表情報抽出動作における文書情報111の処理の一例を説明するための概略図である。 FIGS. 6A to 6C are schematic diagrams for explaining an example of processing of document information 111 in table information extraction operation.

図6(a)は、参照情報114の一例を示す参照情報114aであり、「契約期間」を有する表中のセルを参照することを示すものである。 FIG. 6(a) is reference information 114a showing an example of the reference information 114, which indicates to refer to a cell in a table having "contract period".

参照情報114aにより、次に説明する情報抽出手段103は、図6(b)に示すように、表情報113aの構造中の「契約期間」に該当するノードを特定し、当該ノードに関連付けられた位置情報及び範囲情報から、図6(c)に示すように、表部分111a中の位置及び範囲115aを特定する。 Based on the reference information 114a, the information extraction means 103 described below identifies the node corresponding to the "contract period" in the structure of the table information 113a as shown in FIG. From the position information and the range information, as shown in FIG. 6(c), the position and range 115a- 2 in the table portion 111a- 3 are identified.

次に、情報抽出手段103は、文書情報111の表部分及び表部分以外のテキスト部分から、レビュー条件情報116に基づいて、契約書にとって重要な情報(記載すべき情報、記載すべきでない情報、記載したほうがよい情報等)を抽出して抽出情報115として記憶部11に格納する(S4)。表部分からの抽出は、上述したように契約書の種類と立場に基づいて定められた単数又は複数の語句からそれぞれ参照情報114を生成して行う。また、テキスト部分からの抽出は、契約書の種類と立場に基づいて定められた単数又は複数の語句をテキスト部分から抽出する。なお、上記した「抽出」には記載された内容を抽出する場合だけでなく、記載されていないことを検知することも含むものとする。また、情報抽出手段103は、抽出した情報を予め定めた方法で修正して記載を統一するものであってもよい。例えば、表情報113aにおいて「契約期間」は、「平成30年1月1日から令和3年12月31日までの4年間」であるが、抽出情報115としては、「締結日」が「平成30年1月1日」、「終了日」が「令和3年12月31日」、「有効期限」が「4年間」と修正して抽出する。また、日付を西暦に統一する等してもよい。 Next, based on the review condition information 116, the information extracting means 103 extracts information important to the contract (information to be written, information not to be written, information not to be written, information that should be described) is extracted and stored as extracted information 115 in the storage unit 11 (S4). Extraction from the table portion is performed by generating the reference information 114 from a single or plural words and phrases determined based on the type of contract and the standpoint as described above. In addition, extraction from the text portion extracts from the text portion one or more words defined based on the type of contract and the standpoint. It should be noted that the above-mentioned "extraction" includes not only the case of extracting the described content, but also the detection of the absence of the description. Further, the information extracting means 103 may modify the extracted information by a predetermined method to unify the description. For example, in the table information 113a, the "contract period" is "four years from January 1, 2018 to December 31, 2021", but as the extracted information 115, the "conclusion date" is " January 1, 2018”, the “end date” is “December 31, 2021”, and the “expiration date” is “4 years”. In addition, the date may be standardized to the Western calendar.

次に、利用者は、アップロードした文書情報から抽出された情報を確認したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の選択要求を送信する。 Next, the user operates the terminal 2 in order to select the document information that the user wants to check the information extracted from the uploaded document information. The terminal 2 transmits a document information selection request to the document processing server device 1 .

文書処理サーバ装置1の表示制御手段105は、文書情報の選択要求を受信し、文書情報選択のための画面を端末2の表示部に表示処理する(図示せず。)。 The display control means 105 of the document processing server device 1 receives the document information selection request and displays a screen for document information selection on the display unit of the terminal 2 (not shown).

利用者は、上記した文書情報選択のための画面を参照しつつ、文書情報を選択し、抽出情報とともに文書情報の表示を要求する。端末2は、選択した文書情報の識別子とともに表示要求を文書処理サーバ装置1に送信する。 The user selects the document information while referring to the screen for selecting the document information described above, and requests the display of the document information together with the extracted information. The terminal 2 transmits a display request to the document processing server device 1 together with the identifier of the selected document information.

文書処理サーバ装置1の表示制御手段105は、端末2から表示要求を受け付けて文書情報111、表情報113、参照情報114及び抽出情報115に基づいて、例えば以下の図8に示すように、端末2の表示部に画面を表示制御する。 The display control means 105 of the document processing server device 1 receives a display request from the terminal 2, and based on the document information 111, the table information 113, the reference information 114 and the extraction information 115, for example, as shown in FIG. The screen is displayed and controlled on the display unit 2.

図8は、表情報抽出動作の結果、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。 FIG. 8 is a schematic diagram showing a configuration example of a screen displayed on the display section of the terminal 2 or 3 by the display control means 105 as a result of the table information extraction operation.

画面104eは、文書情報111の内容を表示する表示欄104eと、抽出情報115の内容を表示する表示欄104eとを有する。表示欄104eには抽出情報115の内容が表示され、具体的には、タイトルとして「定期建物賃貸借契約書」、締結日として「平成30年1月1日」、終了日として「令和3年12月31日」、有効期限として「4年間」のように表示され、利用者によって選択された項目が他の項目と表示差をつけることで選択表示104e21となる。また、選択表示104e21となった項目に対応する文書情報111中の位置及び範囲が、参照情報114によって参照されて、強調表示104e11となる。 The screen 104 e has a display field 104 e 1 for displaying the contents of the document information 111 and a display field 104 e 2 for displaying the contents of the extracted information 115 . The contents of the extracted information 115 are displayed in the display column 104e2 . "December 31, 2009" and "4 years" as the expiration date are displayed, and the item selected by the user is displayed as a selection display 104e21 by making a display difference from the other items. Also, the position and range in the document information 111 corresponding to the item that is selected and displayed 104e21 are referred to by the reference information 114 and are highlighted 104e11 .

利用者は、上記した抽出情報115を参照するための画面104eを参照し、抽出情報115の内容から契約の詳細と、当該詳細が記載された契約書上の位置及び範囲を確認する。 The user refers to the screen 104e for referring to the extracted information 115 described above, and confirms the details of the contract from the contents of the extracted information 115 and the position and range of the contract on which the details are described.

また、ここまで項目名が列に並んでいる表について説明してきたが、表の変形例として、項目名が行と列に設けられ、項目名の組み合わせによって項目の内容が定まる表の場合について以下説明する。 Up to this point, we have discussed a table in which item names are arranged in columns, but as a modification of the table, the following is a table in which item names are provided in rows and columns, and the contents of items are determined by the combination of item names. explain.

図7(a)~(f)は、表情報抽出動作における文書情報111の処理の他の例を説明するための概略図である。 FIGS. 7A to 7F are schematic diagrams for explaining another example of processing the document information 111 in the table information extraction operation.

図7(a)に示すように、表部分111bは、例えば、「A社」の「期間」が「○○~○○」といったように、項目の内容が行と列の項目名の組み合わせによって定まる表である。 As shown in FIG. 7(a), in the table portion 111b, for example, the "period" of "Company A" is "○○~○○". It is a fixed table.

また、図7(b)は、表部分111bから抽出された表情報113bであり、一例として、行及び列にそれぞれ項目名を有する構造であって、表部分111bの第1行の「項目」、「A社」、「B社」が行項目名となり、これに対応して列項目名1が「期間」、「○○~○○」、「●●~●●」、列項目名2が「値段」、「100円」、「999円」という構造を有する。 FIG. 7(b) shows table information 113b extracted from the table portion 111b. As an example, it has a structure having item names in rows and columns, and "item" in the first row of the table portion 111b. , "Company A" and "Company B" are row item names, and correspondingly column item name 1 is "Period", "○○~○○", "●●~●●", column item name 2 has a structure of "price", "100 yen", and "999 yen".

図7(c)は、参照情報114の一例を示す参照情報114bであり、「値段」と「B社」により特定される表中のセルを参照することを示すものである。 FIG. 7(c) is reference information 114b showing an example of the reference information 114, which indicates that a cell in a table specified by "price" and "B company" is referred to.

参照情報114bにより、情報抽出手段103は、図7(d)に示すように、表情報113bの構造中の列項目名2「値段」と行項目名「B社」に該当するノード115bを特定し、当該ノード115bに関連付けられたセル(位置情報及び範囲情報)から、図7(e)に示すように、表部分111b中のセル115bを特定し、図7(f)に示すように、抽出結果115bとして「999円」を得る。 Based on the reference information 114b, the information extracting means 103 extracts a node 115b1 corresponding to the column item name 2 "Price" and the row item name "Company B" in the structure of the table information 113b, as shown in FIG. 7(d). From the cell (location information and range information) associated with the identified node 115b 1 , the cell 115b 2 in the table portion 111b is identified as shown in FIG. Thus, "999 yen" is obtained as the extraction result 115b3 .

(3)契約書レビュー動作
次に、利用者は、アップロードした文書情報から抽出された情報に基づいてレビューを要求したい文書情報を選択するため端末2を操作する。端末2は、文書処理サーバ装置1へ文書情報の選択要求を送信する。
(3) Contract Review Operation Next, the user operates the terminal 2 to select document information for which review is requested based on the information extracted from the uploaded document information. The terminal 2 transmits a document information selection request to the document processing server device 1 .

文書処理サーバ装置1の表示制御手段105は、文書情報の選択要求を受信し、文書情報選択のための画面を端末2の表示部に表示処理する(図示せず。)。 The display control means 105 of the document processing server device 1 receives the document information selection request and displays a screen for document information selection on the display unit of the terminal 2 (not shown).

利用者は、上記した文書情報選択のための画面を参照しつつ、文書情報を選択し、文書情報のレビュー結果の表示を要求する。端末2は、選択した文書情報の識別子とともに表示要求を文書処理サーバ装置1に送信する。 The user selects the document information while referring to the screen for selecting the document information described above, and requests the display of the review result of the document information. The terminal 2 transmits a display request to the document processing server device 1 together with the identifier of the selected document information.

文書処理サーバ装置1の契約書レビュー手段104は、端末2から表示要求を受け付けて、選択された文書情報について、レビュー条件情報116に基づいて抽出情報115の内容をレビューして、レビュー結果情報117を生成し、記憶部11に格納する(S5)。なお、契約書レビュー手段104は、レビュー条件情報116のうち、契約書の類型、作成者の立場等に応じて使用する条件を選択してレビューを行う。 The contract review means 104 of the document processing server device 1 receives a display request from the terminal 2, reviews the content of the extracted information 115 for the selected document information based on the review condition information 116, and produces review result information 117. is generated and stored in the storage unit 11 (S5). The contract review means 104 selects conditions to be used from the review condition information 116 according to the type of contract, the standpoint of the creator, etc., and performs the review.

次に、表示制御手段105は、文書情報111、表情報113、参照情報114、抽出情報115及びレビュー結果情報117に基づいて、例えば以下の図9に示すように、端末2の表示部に画面を表示制御する。 Next, the display control means 105 displays a screen on the display unit of the terminal 2 as shown in FIG. to control the display.

図9は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。 FIG. 9 is a schematic diagram showing a configuration example of a screen displayed on the display section of the terminal 2 or 3 by the display control means 105 in the contract review operation.

画面104aは、文書情報111の内容を表示する表示欄104aと、レビュー結果情報117の内容を表示する表示欄104aとを有する。表示欄104aには、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104a21、104a22、104a23に示され、具体的には、表示ボックス104a21であれば、指摘内容「委託料が税込みか税別か、が定められていません」、修正方針「税込・税別の区別、を追加」、修正文例「(代金)(1)消費税別とする場合 委託者は、受託者に対し、本業務の対価として金●●円及び…」のように表示される。また、表示ボックス104a21、104a22、104a23に対応する文書情報111中の位置及び範囲104a11、104a12、104a13が、参照情報114に基づいて強調表示されて参照される。また、表示ボックス104a21、104a22、104a23にさらに修正内容の解説を表示してもよい。 The screen 104 a has a display field 104 a 1 for displaying the contents of the document information 111 and a display field 104 a 2 for displaying the contents of the review result information 117 . In the display column 104a2 , the contents of the review result information 117 reviewed for the extracted items of the table portion of the document information 111 are displayed in display boxes 104a21 , 104a22 , and 104a23 . In the case of box 104a 21 , the content of the indication "whether the consignment fee includes or excludes tax is not specified", the correction policy "addition of distinction between tax included and tax excluded", the correction sentence example "(price) (1) consumption tax excluded" In the case of , the consignor will be indicated to the consignee as compensation for this work, such as gold ●● yen and …”. Also, the positions and ranges 104a 11 , 104a 12 , 104a 13 in the document information 111 corresponding to the display boxes 104a 21 , 104a 22 , 104a 23 are highlighted based on the reference information 114 and referenced. In addition, the display boxes 104a 21 , 104a 22 , 104a 23 may further display explanations of the correction contents.

利用者は、上記したレビュー結果情報117を参照するための画面104aを参照し、レビュー結果情報117の内容から契約の問題点と、当該問題点に関連するキーワード又は文が記載された契約書上の位置及び範囲を確認し、必要に応じて編集を行う。 The user refers to the screen 104a for referring to the review result information 117 described above, and from the contents of the review result information 117, the problem of the contract and the keyword or sentence related to the problem on the contract Check the position and range of and edit if necessary.

レビュー結果情報117は、契約書中の表部分とテキスト部分との対応や、契約書の類型、作成者の立場等によってレビューの内容が変わるため、以降その他の例について説明する。なお、図9は、表部分のみから情報が抽出された場合を示し、図10は、表部分及びテキスト部分から情報が抽出された場合を示している。また、図9、図10は、複数の立場において共通のレビューがなされ、図11、図12において立場に応じたレビューがなされている。 Since the contents of the review result information 117 change depending on the correspondence between the table part and the text part in the contract, the type of the contract, the standpoint of the creator, etc., other examples will be explained below. 9 shows the case where information is extracted only from the table portion, and FIG. 10 shows the case where information is extracted from the table portion and the text portion. Also, FIGS. 9 and 10 are reviewed in common from a plurality of standpoints, and FIGS. 11 and 12 are reviewed according to standpoints.

図10は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。 FIG. 10 is a schematic diagram showing a configuration example of a screen displayed on the display section of the terminal 2 or 3 by the display control means 105 in the contract review operation.

画面104bは、文書情報111の内容を表示する表示欄104bと、レビュー結果情報117の内容を表示する表示欄104bとを有する。表示欄104bには、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104b21、104b22に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104b23に示される。また、表示ボックス104b21、104b22、104b23に対応する文書情報111中の位置及び範囲104b11、104b12、104b13が、参照情報114に基づいて強調表示されて参照される。 The screen 104b has a display column 104b- 1 for displaying the contents of the document information 111 and a display column 104b- 2 for displaying the contents of the review result information 117. FIG. In the display column 104b2 , the contents of the review result information 117 reviewed for the extracted items of the table portion of the document information 111 are displayed in the display boxes 104b21 and 104b22 , respectively, where the extracted items of the text portion are reviewed. The content of the review result information 117 is shown in the display box 104b23 . Also, the positions and ranges 104b 11 , 104b 12 , 104b 13 in the document information 111 corresponding to the display boxes 104b 21 , 104b 22 , 104b 23 are highlighted based on the reference information 114 and referenced.

なお、例えば、表示ボックス104b21では、指摘内容「賃料の支払期日、が定められていません」、修正方針「上記を追加」、修正文例「(賃料)1.賃料は月額金●●円とし、賃借人は、賃貸人に対し、毎月●●日までに…」のように表示されており、レビュー結果情報117において、当該指摘内容に関わる「賃料の支払期日」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104b21、104b22、104b23にさらに修正内容の解説を表示してもよい。 In addition, for example, in the display box 104b 21 , the pointed out content "The rent payment date is not set", the correction policy "Add the above", and the corrected sentence example "(Rent) 1. The rent is a monthly amount of Yen. , the lessee is displayed to the lessor by XX day of every month...", and in the review result information 117, the text part other than the table part is It is also pointed out in consideration of whether or not it is stipulated in In addition, the display boxes 104b 21 , 104b 22 , 104b 23 may further display explanations of the correction contents.

図11は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。 FIG. 11 is a schematic diagram showing a configuration example of a screen displayed on the display section of the terminal 2 or 3 by the display control means 105 in the contract review operation.

画面104cは、文書情報111の内容を表示する表示欄104cと、レビュー結果情報117の内容を表示する表示欄104cとを有する。表示欄104cには、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104c21、104c22、104c23に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104c24に示される。また、表示ボックス104c21、104c22、104c23、104c24に対応する文書情報111中の位置及び範囲104c11、104c12、104c13、104c14が、参照情報114に基づいて強調表示されて参照される。 The screen 104c has a display field 104c- 1 for displaying the contents of the document information 111 and a display field 104c- 2 for displaying the contents of the review result information 117. FIG. In the display column 104c2 , the contents of the review result information 117 reviewed for the extracted items of the table portion of the document information 111 are displayed in display boxes 104c21 , 104c22 , and 104c23, respectively, for the extracted items of the text portion. The content of the reviewed review result information 117 is shown in display box 104c24 . Also, the positions and ranges 104c 11 , 104c 12 , 104c 13 and 104c 14 in the document information 111 corresponding to the display boxes 104c 21 , 104c 22 , 104c 23 and 104c 24 are highlighted based on the reference information 114 for reference. be done.

なお、例えば、表示ボックス104c21では、指摘内容「履行割合に応じた委託料の金額、が定められていません」、修正方針「上記を追加」、修正文例「(代金)1.委託者は、受託者に対し、本業務の対価として●●円(税込)を、20●●年●月●日までに、…」のように受託者の立場で表示されており、レビュー結果情報117において、当該指摘内容に関わる「委託料の金」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104c21、104c22、104c23にさらに修正内容の解説を表示してもよい。 In addition, for example, in the display box 104c21 , the content of the indication "the amount of the consignment fee corresponding to the fulfillment rate is not specified", the correction policy "add the above", the correction sentence "(price) 1. Consignor is , to the trustee, as consideration for this work, XX yen (including tax) will be paid by 20YYYYYMMDD..." from the perspective of the trustee, and in the review result information 117 In addition, consideration is also given to whether or not the "consignment fee money" related to the content of the indication is stipulated in the text part other than the table part. In addition, the display boxes 104c 21 , 104c 22 , 104c 23 may further display explanations of the correction contents.

図12は、契約書レビュー動作において、表示制御手段105により端末2又は3の表示部に表示される画面の構成例を示す概略図である。 FIG. 12 is a schematic diagram showing a configuration example of a screen displayed on the display section of the terminal 2 or 3 by the display control means 105 in the contract review operation.

画面104dは、文書情報111の内容を表示する表示欄104dと、レビュー結果情報117の内容を表示する表示欄104dとを有する。表示欄104dには、文書情報111の表部分の抽出項目に対してレビューされたレビュー結果情報117の内容がそれぞれ表示ボックス104d21、104d22に、テキスト部分の抽出項目に対してレビューされたレビュー結果情報117の内容が表示ボックス104d23に示される。また、表示ボックス104d21、104d22、104d23に対応する文書情報111中の位置及び範囲104d11、104d12、104d13が、参照情報114に基づいて強調表示されて参照される。 The screen 104 d has a display field 104 d 1 for displaying the contents of the document information 111 and a display field 104 d 2 for displaying the contents of the review result information 117 . In the display column 104d2 , the contents of the review result information 117 reviewed for the extracted items of the table portion of the document information 111 are displayed in the display boxes 104d21 and 104d22 , respectively, where the extracted items of the text portion are reviewed. The content of the review result information 117 is shown in the display box 104d23 . Also, the positions and ranges 104d 11 , 104d 12 , 104d 13 in the document information 111 corresponding to the display boxes 104d 21 , 104d 22 , 104d 23 are highlighted based on the reference information 114 and referenced.

なお、例えば、表示ボックス104d21では、指摘内容「委託業務に付随する業務も、業務内容に含まれる旨が、定められていません」、修正方針「業務内容に、「具体的な委託業務に付随する一切の業務」を追加」、修正文例「(委託内容)委託者は、受託者に対し、以下の業務(以下「本業務」という。)を委託し、…」のように委託者の立場で表示されており、レビュー結果情報117において、当該指摘内容に関わる「委託業務に付随する業務」が表部分以外のテキスト部分に定められているか否かについても考慮して指摘がなされる。また、表示ボックス104d21、104d22、104d23にさらに修正内容の解説を表示してもよい。 In addition, for example, in the display box 104d21 , the content of indication "It is not defined that the work incidental to the outsourced work is also included in the work content", the correction policy "work content" Add "all incidental work", amended sentence "(Consignment) The consignor entrusts the following work (hereinafter referred to as "this work") to the consignor, and the consignor's In the review result information 117, it is also pointed out by considering whether or not the "work incidental to the commissioned work" related to the pointed out content is specified in the text part other than the table part. In addition, the display boxes 104d 21 , 104d 22 , 104d 23 may further display explanations of the correction contents.

(実施の形態の効果)
上記した実施の形態によれば、文書情報111に表を含む場合に、表抽出条件情報112に基づいて当該表を構造化して表情報113として抽出するとともに、当該表情報113中の情報と対応する文書情報111中の位置を対応付けて、これらの情報を参照するための参照情報114を生成するようにしたため、構造化されていない表を含む場合であっても文書情報111から抽出情報115を抽出して抽出箇所を提示することができる
(Effect of Embodiment)
According to the above embodiment, when a table is included in the document information 111, the table is structured based on the table extraction condition information 112 and extracted as the table information 113. Since the reference information 114 for referring to this information is generated by associating the positions in the document information 111 where the can be extracted and the extracted parts can be presented

また、さらに文書情報111の表部分及びテキスト部分から情報を抽出して抽出情報115を生成し、抽出情報115を対象として契約書レビュー手段104によってレビューを行うようにしたため、テキスト部分に限らず表部分も含めて契約書をレビューすることができる。 Further, information is extracted from the table portion and the text portion of the document information 111 to generate the extracted information 115, and the extracted information 115 is reviewed by the contract review means 104. Therefore, not only the text portion but also the text portion Able to review contracts including parts.

[他の実施の形態]
なお、本発明は、上記実施の形態に限定されず、本発明の趣旨を逸脱しない範囲で種々な変形が可能である。
[Other embodiments]
The present invention is not limited to the above-described embodiments, and various modifications are possible without departing from the scope of the present invention.

例えば、文書情報111は契約書に限らず、構成要素で分割できるものであれば、法律そのものの文書や取り扱い説明書等であってよいし、同様に本発明を適用可能である。また、構成要素は、条文、項、号に限らず、単語や文字・記号であってもよいし、段落、文章であってもよい。 For example, the document information 111 is not limited to a contract, but may be a legal document, an instruction manual, or the like as long as it can be divided into components, and the present invention can be similarly applied. Further, the constituent elements are not limited to articles, paragraphs, and items, but may be words, characters/symbols, paragraphs, or sentences.

上記実施の形態では制御部10の各手段100‐105の機能をプログラムで実現したが、各手段の全て又は一部をASIC等のハードウエアによって実現してもよい。また、上記実施の形態で用いたプログラムをCD‐ROM等の記録媒体に記憶して提供することもできる。また、上記実施の形態で説明した上記ステップの入れ替え、削除、追加等は本発明の要旨を変更しない範囲内で可能である。 Although the functions of the means 100 to 105 of the control unit 10 are implemented by programs in the above embodiment, all or part of the means may be implemented by hardware such as ASIC. Also, the program used in the above embodiment can be stored in a recording medium such as a CD-ROM and provided. In addition, replacement, deletion, addition, etc., of the steps described in the above embodiment are possible without changing the gist of the present invention.

1 :文書処理サーバ装置
2、3 :端末
4 :ネットワーク
5 :文書処理システム
10 :制御部
11 :記憶部
12 :通信部
100 :契約書受付手段
101 :表情報抽出手段
102 :参照情報生成手段
103 :情報抽出手段
104 :契約書レビュー手段
105 :表示制御手段
110 :文書処理プログラム
111 :文書情報
112 :表抽出条件情報
113 :表情報
114 :参照情報
115 :抽出情報
116 :レビュー条件情報
117 :レビュー結果情報


1: document processing server devices 2, 3: terminal 4: network 5: document processing system 10: control unit 11: storage unit 12: communication unit 100: contract receiving means 101: table information extracting means 102: reference information generating means 103 : Information extraction means 104 : Contract review means 105 : Display control means 110 : Document processing program 111 : Document information 112 : Table extraction condition information 113 : Table information 114 : Reference information 115 : Extraction information 116 : Review condition information 117 : Review Result information


Claims (7)

コンピュータにより実行されることにより、
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ように前記コンピュータを機能させるための文書処理プログラム。
by being executed by a computer,
Structuring the information contained in the table part in the document information based on the structure of the table part and extracting it as table information,
generating reference information for referring to information in the table information;
Extracting information in at least the table portion of a text portion and a table portion included in the document information using the reference information based on a predetermined condition;
A word processing program for causing said computer to function as a computer.
前記表情報を抽出する方法は、予め定めた条件に基づいて前記表部分に含まれる情報を参照し、前記表部分の構造を認識する請求項1に記載の文書処理プログラム。 2. The document processing program according to claim 1, wherein the method for extracting the table information refers to information included in the table portion based on a predetermined condition and recognizes the structure of the table portion. 前記情報抽出手段が抽出した情報を、予め定めたレビュー条件に基づいてレビューするようにさらに機能させる請求項1又は2に記載の文書処理プログラム。 3. The document processing program according to claim 1, wherein the information extracted by said information extraction means is further functioned to be reviewed based on predetermined review conditions. 前記文書情報の前記表は予め構造化されていない請求項1から3のいずれか1項に記載の文書処理プログラム。 4. A document processing program according to any one of claims 1 to 3, wherein said table of said document information is not pre-structured. 文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出する表情報抽出手段と、
当該表情報中の情報を参照するための参照情報を生成する参照情報生成手段と、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する情報抽出手段として機能させる情報処理装置。
table information extracting means for structuring information contained in a table portion in document information based on the structure of the table portion and extracting it as table information;
reference information generating means for generating reference information for referring to information in the table information;
An information processing apparatus functioning as information extracting means for extracting at least the information of the table portion out of the text portion and the table portion included in the document information using the reference information based on a predetermined condition.
所定の指示命令に加えて、文書情報を記憶するように構成されたメモリと、
前記メモリに記憶された指示命令に基づいて、
前記メモリに記憶された文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出し、
当該表情報中の情報を参照するための参照情報を生成し、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出する、
ための処理を実行するように構成されたプロセッサと、
を含む情報処理装置。
a memory configured to store document information in addition to predetermined instructions;
Based on instructions stored in the memory,
structuring information contained in the table portion in the document information stored in the memory based on the structure of the table portion and extracting it as table information;
generating reference information for referring to information in the table information;
Extracting information in at least the table portion of a text portion and a table portion included in the document information using the reference information based on a predetermined condition;
a processor configured to perform processing for
Information processing equipment including.
文書情報内の表部分に含まれる情報を表部分の構成に基づいて構造化して表情報として抽出するステップと、
当該表情報中の情報を参照するための参照情報を生成するステップと、
前記文書情報に含まれるテキスト部分及び表部分のうち少なくとも前記表部分中の情報を、予め定めた条件に基づいて、前記参照情報を用いて抽出するステップとを有する文書処理方法。

a step of structuring information contained in a table portion in the document information based on the configuration of the table portion and extracting it as table information;
generating reference information for referencing information in the tabular information;
and extracting information in at least the table portion of the text portion and the table portion included in the document information based on a predetermined condition using the reference information.

JP2021082985A 2021-05-17 2021-05-17 Document processing program, information processing device and document processing method Pending JP2022176511A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2021082985A JP2022176511A (en) 2021-05-17 2021-05-17 Document processing program, information processing device and document processing method
JP2025124452A JP2025137773A (en) 2021-05-17 2025-07-25 Document processing program, information processing device, and document processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021082985A JP2022176511A (en) 2021-05-17 2021-05-17 Document processing program, information processing device and document processing method

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2025124452A Division JP2025137773A (en) 2021-05-17 2025-07-25 Document processing program, information processing device, and document processing method

Publications (2)

Publication Number Publication Date
JP2022176511A true JP2022176511A (en) 2022-11-30
JP2022176511A5 JP2022176511A5 (en) 2024-04-03

Family

ID=84233943

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2021082985A Pending JP2022176511A (en) 2021-05-17 2021-05-17 Document processing program, information processing device and document processing method
JP2025124452A Pending JP2025137773A (en) 2021-05-17 2025-07-25 Document processing program, information processing device, and document processing method

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2025124452A Pending JP2025137773A (en) 2021-05-17 2025-07-25 Document processing program, information processing device, and document processing method

Country Status (1)

Country Link
JP (2) JP2022176511A (en)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0378892A (en) * 1989-08-23 1991-04-04 Fuji Electric Co Ltd Recognizing device for tabular document
JPH08147329A (en) * 1994-11-18 1996-06-07 Casio Comput Co Ltd Read image processor
JPH09288714A (en) * 1996-04-19 1997-11-04 Hitachi Ltd Table recognition method and device
JP2008071316A (en) * 2006-09-15 2008-03-27 Ricoh Co Ltd Print information monitoring apparatus, print information monitoring method, and program
US20160371321A1 (en) * 2011-06-10 2016-12-22 Linkedin Corporation Fact checking search results
JP2019114264A (en) * 2017-12-24 2019-07-11 Gva Tech株式会社 Legal document review program, legal document review method, and legal document review system

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0378892A (en) * 1989-08-23 1991-04-04 Fuji Electric Co Ltd Recognizing device for tabular document
JPH08147329A (en) * 1994-11-18 1996-06-07 Casio Comput Co Ltd Read image processor
JPH09288714A (en) * 1996-04-19 1997-11-04 Hitachi Ltd Table recognition method and device
JP2008071316A (en) * 2006-09-15 2008-03-27 Ricoh Co Ltd Print information monitoring apparatus, print information monitoring method, and program
US20160371321A1 (en) * 2011-06-10 2016-12-22 Linkedin Corporation Fact checking search results
JP2019114264A (en) * 2017-12-24 2019-07-11 Gva Tech株式会社 Legal document review program, legal document review method, and legal document review system

Also Published As

Publication number Publication date
JP2025137773A (en) 2025-09-19

Similar Documents

Publication Publication Date Title
US9372858B1 (en) Systems and methods to present automated suggestions in a document
US20060259524A1 (en) Systems and methods for document project management, conversion, and filing
JP6307745B2 (en) Accounting system
US20110173529A1 (en) Template processing engine for business systems
US20040162895A1 (en) Web site management with electronic storefront and page categorization
US20070136255A1 (en) System and method for generating, maintaining, and rendering landing and web pages
JP6594801B2 (en) Supply and demand adjustment device, supply and demand adjustment system, and supply and demand adjustment method
US20220237257A1 (en) System and method for browser-based target data extraction
CN113076731A (en) Report file generation method and device, computer equipment and storage medium
JP2007183796A (en) Business evaluation value calculation system
US8429149B2 (en) System, method and computer program products for determining O*NET codes from job descriptions
JP2025089559A (en) Document processing program, information processing device, and document processing method
KR102362836B1 (en) Webzine production and management system and its method
US20190188762A1 (en) Information processing apparatus and information processing method
CN117693729A (en) Systems and methods for managing database storage terms
JP5400496B2 (en) System for creating articles based on the results of financial statement analysis
US20110054972A1 (en) Calculation/determination of budget and employee allocation targets using a model
JP2022176511A (en) Document processing program, information processing device and document processing method
US20190139108A1 (en) Information processing apparatus and display method
JP7094515B1 (en) Matching system, matching method and program
JP6187633B2 (en) Generating mobile documents from a print workflow
US20190080305A1 (en) Information processing apparatus and display method
JP2001076045A (en) Business flow diagram creation support device and its recording medium
JP7440979B1 (en) File sorting system, file sorting method, and file sorting program
US20060036459A1 (en) User configurable one click punchout tracking

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20220722

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240326

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240326

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20241115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20241203

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20250428

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250725