JP7664611B2 - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP7664611B2 JP7664611B2 JP2021087351A JP2021087351A JP7664611B2 JP 7664611 B2 JP7664611 B2 JP 7664611B2 JP 2021087351 A JP2021087351 A JP 2021087351A JP 2021087351 A JP2021087351 A JP 2021087351A JP 7664611 B2 JP7664611 B2 JP 7664611B2
- Authority
- JP
- Japan
- Prior art keywords
- character strings
- unit
- information processing
- rights
- obligations
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
法律文書をはじめとする契約書等の文書は、商取引等に重大な影響がある。このため作成された文書のレビューを行うのが一般的であるが、士業者や企業の法務担当者のように専門知識をもつ人々以外の人間にとっては難解な表現が多く、レビューの負担が重いという問題がある。そこで、従来には、契約書の作成段階において、改変された契約条件に係るリスクの認識、改変された契約条件が妥当であるか否かの意思決定、リスクに対する対応策の提示など、文書のレビューを支援するものがある(例えば、特許文献1参照)。 Documents such as legal documents and contracts have a significant impact on business transactions. For this reason, it is common for documents to be reviewed when they are created, but there is a problem that many of the expressions used are difficult for people other than those with specialized knowledge, such as professionals and corporate legal personnel, to understand, making reviewing them a heavy burden. In the past, there were systems that supported document reviews during the contract creation stage, such as by recognizing risks associated with modified contract terms, making decisions about whether modified contract terms are appropriate, and presenting countermeasures to risks (see, for example, Patent Document 1).
しかしながら従来のレビューを支援する技術は、一般的に、取引形態や、など文書の類型ごとに、契約条件やリスクなどを判断している。このため、類型ごとに有利不利をラベリングしたり、パターンマッチングを行う必要があり、システム構築のために大量のデータと作業が必要となり、費用負担が重くなる。また、細かくレビューするあまりユーザの目線で適切でない指摘が多く含まれる虞もある。 However, conventional review support technologies generally judge contract terms and risks for each document type, such as transaction form. This requires labeling the advantages and disadvantages of each type and performing pattern matching, which requires large amounts of data and work to build a system, resulting in heavy financial burdens. Also, there is a risk that the review will be so detailed that it will include many comments that are inappropriate from the user's perspective.
本発明は、上記課題に鑑みてなされたものであり、より効果的なレビューが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present invention has been made in consideration of the above problems, and aims to provide an information processing device, an information processing method, and an information processing program that enable more effective reviews.
上記課題を解決するため、本発明の情報処理装置は、文書データの入力を受け付ける受付部と、文書データを解析し、文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部と、抽出部が抽出した文字列を、文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する出力部と、を備える。 In order to solve the above problem, the information processing device of the present invention includes a receiving unit that receives input of document data, an extraction unit that analyzes the document data and extracts a character string that is characteristic of a predetermined expression contained in the document data, and an output unit that outputs information that displays the character string extracted by the extraction unit in a manner different from other character strings contained in the document data.
本発明によれば、より効果的なレビューが可能な情報処理装置、情報処理方法及び情報処理プログラムを提供することができる。 The present invention provides an information processing device, an information processing method, and an information processing program that enable more effective reviews.
以下、本発明の実施形態を図面に基づいて説明する。
なお、下記実施形態では、文書として契約書を例に実施形態を説明するが文書は契約書に限られない。例えば、規程文書、条例や条約、有価証券報告書、決算短信、特許明細書、申請書、種々の様式などであってもよい。
Hereinafter, an embodiment of the present invention will be described with reference to the drawings.
In the following embodiment, a contract is used as an example of the document, but the document is not limited to a contract. For example, the document may be a regulation document, an ordinance or treaty, a securities report, a financial statement summary, a patent specification, an application form, or various other formats.
[実施形態]
図1は、実施形態に係る情報処理システム1の概略構成の一例を示す図である。初めに、図1を参照して情報処理システム1の構成について説明する。情報処理システム1は、サーバ2(情報処理装置)と、このサーバ2とネットワーク4を介して接続されたユーザ端末3とを備える。なお、情報処理システム1が備えるサーバ2及びユーザ端末3の数はそれぞれ任意である。なお、サーバ2及びユーザ端末3間の通信は無線通信であるか有線通信であるか問わない。
[Embodiment]
Fig. 1 is a diagram showing an example of a schematic configuration of an
(サーバ2)
図2は、サーバ2(情報処理装置)のハード構成の一例を示す図である。図2に示すように、サーバ2は、通信IF200A、記憶装置200B、CPU200Cなどを備える。なお、サーバ2に入力装置(例えば、キーボード、タッチパネルなど)及び表示装置(例えば、液晶モニタや有機ELモニタなど)を備えるようにしてもよい。
(Server 2)
Fig. 2 is a diagram showing an example of a hardware configuration of the server 2 (information processing device). As shown in Fig. 2, the
通信IF200Aは、外部端末(実施形態では、ユーザ端末3)と通信するためのインターフェースである。 Communication IF200A is an interface for communicating with an external terminal (in this embodiment, user terminal 3).
記憶装置200Bは、例えば、HDDや半導体記憶装置である。記憶装置200Bには、サーバ2で利用する情報処理プログラム及び各種データなどが記憶されている。なお、実施形態では、情報処理プログラム及び各種データは、サーバ2の記憶装置200Bに記憶されているが、USBメモリなどの外部記憶装置やネットワークを介して接続された外部サーバに記憶し、必要に応じて参照やダウンロード可能に構成されていてもよい。
The
例えば、各種データには、後述の解析部205が、形態素解析を行うための形態素解析用データやラベル(分類)を付与するためのラベル付与用データ(分類用データ)が含まれる。形態素解析を行うためのデータには、例えば、慣用句テーブル、ひらがな部分の単語切り分け用テーブル、付属語テーブル、ひらがな自立語テーブル、活用語尾テーブル、ひらがな語幹テーブル、特殊動詞テーブル、副詞テーブル、情報テーブル(テーブル内の各項目に対応した辞書的情報)、接続テーブル(形態素間の相互接続関係を記述したテーブルであり、接続カテゴリ(品詞)毎に、その前に出現可能な形態素のカテゴリや活用形が記されたデータ)や規則などのデータが含まれる。なお、解析部205による形態素解析には、既知のアルゴリズムを利用することができる。
For example, the various data includes morpheme analysis data used by the analysis unit 205 (described below) to perform morpheme analysis and labeling data (classification data) for labeling (classification). Data for morpheme analysis includes, for example, an idiom table, a table for splitting hiragana parts into words, a dependent word table, a hiragana independent word table, a conjugated ending table, a hiragana stem table, a special verb table, an adverb table, an information table (dictionary information corresponding to each item in the table), a connection table (a table that describes the interconnection relationships between morphemes, and data that lists, for each connection category (part of speech), the category and conjugation form of the morpheme that can appear before it), and data such as rules. Note that a known algorithm can be used for the morpheme analysis by the
ラベルを付与するためのデータには、ラベルを付与するための辞書が含まれる。該辞書は、権利及び義務、当事者、権利/義務に付された条件、原則及び例外、注意、権利/義務の対象、法令、被引用関係などの所定の表現ごとに特徴的な文字列が関連付けられたデータである。以下、権利及び義務、当事者、権利/義務に付された条件、原則及び例外、注意、権利/義務の対象、法令、被引用関係などの所定の表現ごとに特徴的な文字列の一例について説明する。なお、下記はあくまで一例であり、どのような文字列を所定の表現ごとに特徴的な文字列とするかは任意である。 The data for assigning labels includes a dictionary for assigning labels. This dictionary is data in which characteristic character strings are associated with each of predetermined expressions, such as rights and obligations, parties, conditions attached to rights/obligations, principles and exceptions, cautions, subjects of rights/obligations, laws and regulations, and cited relationships. Below, we will explain examples of characteristic character strings for each of predetermined expressions, such as rights and obligations, parties, conditions attached to rights/obligations, principles and exceptions, cautions, subjects of rights/obligations, laws and regulations, and cited relationships. Note that the following is merely an example, and it is up to the user to decide what character strings are characteristic of each of the predetermined expressions.
(1)権利/義務
権利/義務は、権利/義務の有無及び強度を表す表現であり、例えば、以下の文章において、「」内の文字列は義務を表す表現として特徴的なものであり、<義務:支払うものとする>などとラベリングすることができる。なお、<義務種類:支払う>、<義務強度:とする>などのように、義務をその種別と強度(義務の強さ)にわけてラベリングしてもよい。この場合、種別と強度の表現を予め辞書に登録しておく。また、さらに期間についても抽出対象としてもよい。この場合、<義務期限:支払期日の翌日から弁済に至るまで>などとラベリングすることができる。なお、権利/義務以外の他のラベルについても同様に種別と強度に細分化してラベリングするようにしてもよい。
(遅延損害金)
第1条 買主が代金の支払を怠ったときは、「支払期日の翌日から弁済に至るまで」年○%の割合による遅延損害金を売主に「支払うものとする」。
(1) Rights/Obligations Rights/obligations are expressions that indicate the presence or absence and the strength of rights/obligations. For example, in the following sentence, the character string in "" is a characteristic expression that indicates an obligation, and can be labeled as <Obligation: shall pay>. Note that obligations may be labeled by their type and strength (strength of obligation), such as <Obligation type: pay> and <Obligation strength: shall>. In this case, expressions of type and strength are registered in a dictionary in advance. Furthermore, periods may also be extracted. In this case, labels can be labeled as <Obligation deadline: from the day after the payment due date until repayment>. Note that labels other than rights/obligations may also be similarly subdivided and labeled by type and strength.
(Late payment charges)
(2)当事者
当事者は、契約の当事者を表す表現であり、例えば、以下の文章において、「」内の文字列は義務を表す表現として特徴的なものであり、<当事者:甲:自分>、<当事者:乙:相手方>などとラベリングすることができる。
(遅延損害金)
第7条 「甲」が、第3条記載の代金の支払を怠ったときは、「乙」に対し、支払期日の翌日から完済の日まで、日歩5銭の割合による遅延損害金を付加して支払わなければならない。
(2) Parties The term parties is used to refer to the parties to a contract. For example, in the following sentence, the characters in "" are characteristic of expressions expressing obligations, and can be labeled as <Party A: Myself>, <Party B: Other Party>, etc.
(Late payment charges)
Article 7 If Party A fails to pay the price specified in
(3)権利/義務に付された条件
権利/義務に付された条件は、権利/義務の行使条件を表す表現であり、例えば、以下の文章において、「」内の文字列は権利/義務の行使対象を表す表現として特徴的なものであり、<権利:売却 留置,条件:支払担保 全額の支払いを得られない>などとラベリングすることができる。
(貨物の留置)
第14条 乙は、甲に対する運賃その他の請求権について貨物を留置し、かつ、「その支払を受けるために」貨物を、競売することができる。ただし、「貨物を競売してもなお全額の支払を得ることができない場合には」、その残額につき甲に対して請求することを妨げるものではない。
(3) Conditions attached to rights/obligations Conditions attached to rights/obligations are expressions that express the conditions for exercising the right/obligation. For example, in the following sentence, the characters in "" are characteristic expressions that express the subject of the right/obligation to be exercised, and can be labeled as <Right: Sale Retention, Condition: Payment Security, Full payment not obtained>.
(Detention of Cargo)
Article 14 Party B may retain the goods for the freight and other claims against Party A, and auction the goods "in order to receive payment therefor." However, this does not prevent Party B from claiming the remaining amount against Party A "if Party B is still unable to obtain payment in full even after auctioning the goods."
(4)原則/例外
権利/義務について複数の持つ意味をどのように解釈すべきか指針となるのが原則・例外表現である。例えば、以下の文章において「」内の文字列は例外表現である。但し書きと呼ばれる原則例外関係については、法律文書特有のものであり、原則を本文に、但し書きに例外処理を記載するものである。なお、上記権利/義務に付された条件の「ただし」は例外処理を表したものではなく、「但し~限りではない。」など特徴的な表現を正しく認識する必要がある。
(秘密保持)
第21条 発行会社及び経営株主は、前条に従った公表を除き、本契約の内容を、全投資者の書面による事前の承諾なしに第三者に提供、開示又は漏洩しないものとする。「但し、法令等又は裁判所若しくは行政機関の命令に基づき開示する場合はこの限りではない」。
(4) Principle/Exception Principle/Exception expressions serve as guidelines for how to interpret the multiple meanings of rights/obligations. For example, in the following sentence, the characters in "" are exception expressions. Principle/Exception relationships, known as proviso, are unique to legal documents, with the principle stated in the main text and exceptions stated in the proviso. Note that the "however" in the conditions attached to the above rights/obligations does not express exceptions, so it is necessary to correctly recognize characteristic expressions such as "However, not limited to...".
(Confidentiality)
Article 21 The issuing company and the management shareholders shall not provide, disclose or leak the contents of this Agreement to any third party without the prior written consent of all investors, except for the public announcement pursuant to the previous article. "However, this shall not apply when disclosure is required by law, or under the order of a court or administrative agency."
(5)注意
注意は、権利/義務について上記の各種表現に当てはまらないか、当てはまるとしても特徴的であるがゆえにそれ単体で固有の意味をもたせることが適切な表現である。例えば、上記原則/例外の「事前(の)承諾」といった用語は、一般に用いられる条件表現であるが、一般的な評価として限定的な条件であるという法的な評価が存在するため、正規化してアラートの対象とすることが考えられる。
(5) Caution Caution is an appropriate expression to have a unique meaning on its own because it does not fall under the various expressions above regarding rights/obligations, or even if it does, it is distinctive. For example, the term "prior consent" in the above principle/exception is a commonly used condition expression, but since there is a legal evaluation that it is a limited condition in general evaluation, it can be considered to be normalized and made the target of an alert.
(6)権利/義務の対象
権利/義務の対象は、権利/義務の対象を表す表現を指す。例えば、以下の文章において、「」内の表現は権利/義務の行使対象を表す表現として特徴的なものであり、<権利:売却 留置,対象:貨物>などとラベリングすることができる。また、権利/義務の目的物の金額等の数量表現は、権利/義務の強さを意味付けるものになることが多い為、金額等の数量表現についても評価できるように後述の抽出部206の抽出対象とすることが好ましい。この場合、<対象数量:○○○>といったようにラベリングすることができる。権利/義務の対象以外の他のラベルについても同様に数量表現を評価できるように後述の抽出部206の抽出対象としてラベリングするようにしてもよい。
(貨物の留置)
第14条 乙は、甲に対する「運賃その他の請求権について貨物を」留置し、かつ、「その支払を受けるために貨物」を、競売することができる。ただし、貨物を競売してもなお全額の支払を得ることができない場合には、その残額につき甲に対して請求することを妨げるものではない。
(6) Subject of Right/Obligation The subject of a right/obligation refers to an expression that represents the subject of the right/obligation. For example, in the following sentence, the expression in "" is characteristic as an expression that represents the subject of the right/obligation, and can be labeled as <Right: Sale Retention, Subject: Cargo>. In addition, since a quantitative expression such as the amount of the object of the right/obligation often gives meaning to the strength of the right/obligation, it is preferable to make it an extraction subject of the
(Detention of Cargo)
Article 14 Party B may retain "the goods for the freight and other claims" against Party A and auction "the goods to receive payment thereof." However, if Party B is still unable to obtain full payment even after auctioning the goods, this shall not prevent Party B from making a claim for the remaining amount against Party A.
(7)法令
契約書は権利/義務の記述を中心としてなされるが、義務とも権利とも言い難いような特徴的な表現が存在する場合がある。しかしながら、このような義務とも権利とも言い難い特徴的な表現については、数が限られるため、類型化して辞書として登録する(記憶装置200Bに記憶しておく)ことでラベル付を行うことができる。
(紛争処理)
第10条 本契約に定めのない事項及び本契約に定める条項の解釈に疑義が生じた場合は、甲及び乙は、信義に従い誠実に協議してその解決にあたる。
2 甲及び乙は、前項の協議で解決できない場合、本契約に関する一切の紛争についての第一審の専属的管轄裁判所を○○地方裁判所とすることに合意する。
(7) Laws and Regulations Contracts are primarily written to describe rights and obligations, but there may be characteristic expressions that are difficult to describe as either obligations or rights. However, since the number of such characteristic expressions that are difficult to describe as either obligations or rights is limited, they can be labeled by categorizing them and registering them as a dictionary (stored in the
(Dispute Resolution)
Article 10 If any doubt arises regarding any matter not specified in this Agreement or the interpretation of any provision specified in this Agreement, Party A and Party B shall attempt to resolve the matter through good faith negotiations.
2. If a dispute cannot be resolved through the discussions set forth in the preceding paragraph, Party A and Party B agree that the exclusive court of first instance for all disputes relating to this Agreement shall be the XX District Court.
(8)被引用関係
被引用関係は、他の箇所(例えば、他の所定単位など)から引用されている表現(被引用表現)のことである。例えば、「第○条の規定に違反した場合は、…」、「第○条に従い、…」と他の条項を引用するような表現である。
(8) Cited Relationships Cited relationships are expressions (cited expressions) that are quoted from other places (e.g., other specified units, etc.). For example, expressions that cite other clauses, such as "In the event of a violation of the provisions of Article X, ..." or "In accordance with Article X, ..."
また、ラベルを付与するための辞書には、文書データに含まれる文字列の表現を正規化するための正規化用データが含まれる。正規化用データは、例えば、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とを関連付けたデータである。
以下の表1は、正規化用データの一例である。
Table 1 below is an example of normalization data.
表1に示すように、正規化用データは、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とを関連付けたデータである。このような正規化用データを用意することで、異なる表現であるが前記所定の表現と意味が同じである表現の文字列についてもラベルを付与することができる。 As shown in Table 1, normalization data is data that associates character strings that are characteristic of a specific expression with different expressions that have the same meaning as the specific expression. By preparing such normalization data, it is possible to assign labels to character strings that are different expressions but have the same meaning as the specific expression.
CPU200Cは、サーバ2を制御し、図示しないROM(Read Only Memory)及びRAM(Random Access Memory)を備えている。
The
図3は、実施形態に係るサーバ2の機能構成の一例を示す図である。図3に示すように、サーバ2は、受信部201(受付部)、送信部202(出力部)、記憶装置制御部203、分割部204、解析部205、抽出部206、評価部207などの機能を有する。なお、図3に示す機能は、サーバ2のROM(不図示)に記憶された情報処理プログラムをCPU200Cが実行することにより実現される。
Fig. 3 is a diagram showing an example of the functional configuration of the
受信部201は、ネットワーク4を介してユーザ端末3から送信されるデータを受信する。例えば、受信部201は、レビューしたい文書データなどを受信する(受け付ける)。
The receiving
送信部202は、ネットワーク4を介してユーザ端末3へデータを送信(出力)する。例えば、送信部202は、評価部207による評価結果などを送信する。
The
記憶装置制御部203は、記憶装置200Bを制御する。記憶装置制御部203は、例えば、記憶装置200Bへのデータの書き込みや読み出しを行う。
The storage
分割部204は、ユーザにベース契約書を所定単位に分割する。実施形態では、分割部204は、契約書を条項ごとに分割する。具体的には、分割部204は、契約書から「条」の階層を表す番号ルール「第n条」や「第n」(nは任意の数字(主に整数))が行頭に出現する行を特定し、その行もしくはその行の一つ前の行の「条の見出し」を表す行を境目とみなし、条項毎に契約書を分割する。なお、所定単位をどのような単位とするかは任意である。例えば、項又は号を所定単位として対象の契約書を分割するようにしてもよい。この場合、分割部204は、対象の契約書から「項」又は「号」の階層を表す番号ルール「n.」又は「(n)」や「第n」(nは任意の数字(主に整数))が行頭に出現する行を特定し、その行もしくはその行の一つ前の行の「項の見出し」又は「号の見出し」を表す行を境目とみなし、項毎又は号毎に契約書を分割する。また、単に「条」、「項」又は「号」という単語を抽出し、この「条」、「項」又は「号」を境目とみなして条項毎に契約書を分割するようにしてもよい。更に、「条」「項」又は「号」という単語を抽出して分割するのではなく、条段落、項段落又は号段落であることを連続する行の中のテキストデータから判断して分割するようにしてもよい。
The
解析部205は、記憶装置200Bに記憶されている辞書(形態素解析用データ及びラベル付与用データ)に基づいて、所定単位ごとに形態素解析を行い、各所定単位に含まれる文字列に対してラベルを付与する。具体的には、解析部205は、形態素解析による品詞解析、固有表現抽出による権利及び義務、当事者(例えば、組織名、人名など)、権利/義務に付された条件(例えば、日付表現、時間表現など)、原則及び例外、注意、権利/義務の対象(例えば、金額表現、割合表現など)、法令、被引用関係など所定の表現の文字列にラベルを付与する。
The
解析部205は、文字列にラベルを付与する際に、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とが関連付けられた正規化用データを参照し、異なる表現であるが前記所定の表現と意味が同じである表現の文字列についてもラベルを付与する。
When assigning a label to a character string, the
なお、実施形態では、解析部205は、形態素解析により文書データに含まれる文字列を形態素(言語で意味を持つ最小単位)に分割しているが、例えば、Sentencepiece、n-gramといった他の手法により、文書データに含まれる文字列を任意の単位に分割するようにしてもよい。
また、解析部205による上記ラベルの付与には、種々の手法を利用することができる。例えば、当事者、権利、義務、条件、法令、原則/例外、注意の文字列に対するラベルを付与した正解データを用意し、機械学習もしくはディープラーニングを用いた自動ラベルリングのAIモデルを作成し、このAIモデルにより上記文字列に対してラベルを付与してもよい。もちろん、AIモデルによる上記ラベルの付与は、一例であり、他の手法により上記文字列に対してラベルを付与するようにしてもよい。
In the embodiment, the
In addition, various methods can be used for the labeling by the
抽出部206は、文書データに含まれる文字列から所定の表現に関する文字列を抽出する。具体的には、抽出部206は、解析部205により付与されたラベルに基づいて、文書データに含まれる文字列から下記(a1)~(a8)の文字列を抽出する。
(a1)権利及び義務の少なくとも一方(権利/義務)に関する文字列
(a2)当事者に関する文字列
(a3)権利/義務に付された条件に関する文字列
(a4)原則及び例外の少なくとも一方(原則/例外)に関する文字列
(a5)注意に関する文字列
(a6)権利/義務の対象に関する文字列
(a7)法令に関する文字列
(a8)被引用関係に関する文字列
The
(a1) Character strings related to at least one of rights and obligations (rights/obligations) (a2) Character strings related to the parties involved (a3) Character strings related to conditions attached to rights/obligations (a4) Character strings related to at least one of principles and exceptions (principles/exceptions) (a5) Character strings related to cautions (a6) Character strings related to the subject of rights/obligations (a7) Character strings related to laws and regulations (a8) Character strings related to cited relationships
なお、実施形態では、解析部205が分割した単位にラベルを付与し、この付与されたラベルに基づいて、文書データに含まれる文字列から上記(a1)~(a8)の文字列を抽出しているが、例えば、ラベルを付与せずに文字列の位置情報(offset情報)に基づいて文字列を抽出したり、文字列自体を抽出して(ラベルは付与せずに)抽出した文字列を可視化情報として利用する構成としてもよい。
In the embodiment, the
評価部207は、抽出された文字列及び評価ルールに基づいて、契約書を所定単位で評価する。
例えば、評価部207は、以下(b1)~(b4)のルールに基づいて、契約書を所定単位で評点する。なお、下記(b1)~(b4)のルールはあくまで一例であり、他のルールにより契約書を評点するようにしてもよい。
(b1)権利/義務に対して評点を付与する。なお、権利/義務をその種別と強度(義務の強さ)にわけてラベリングしている場合、種別と強度の表現に応じて評点を付与する。例えば、自己の権利の強度が強いほど評点を高くし、義務の権利の強度が強いほど評点を低くしてもよい。また権利/義務の期限をラベリングしている場合、権利の支払期日が長いほど評点を高くし、義務の期限が長いほど評点を低くしてもよい。
(b2)権利/義務の範囲(いくつの目的物に対して権利/義務があるかや、目的物の数量表現に応じて点数の重み付けが変わる。例えば、権利の当事者が本人である場合は、目的物の数や数量が多いほど有利な度合いが高くなると考えられるため、目的物の数や数量が多いほど評点が高くなる。また、権利の当事者が相手方である場合は、目的物の数や数量が多いほど有利な度合いが低くなると考えられるため、目的物の数や数量が多いほど評点が低くなる)
(b3)権利/義務が条件付きの場合、条件の大きさ(いくつの条件があるのか)に応じて点数の重み付けが変わる(権利の当事者が本人である場合は、条件付きの権利は、条件なしの権利に比べて、有利な度合いが低くなると考えられるため、条件が多いほど評点が低くなる。一方、権利の当事者が相手方である場合は、条件付きの権利は、条件なしの権利に比べて、有利な度合いが高くなると考えられるため、条件が多いほど評点が高くなる。)。
(b4)他の箇所から引用されている箇所(被引用箇所)については、影響度が大きいため、点数の重み付けを調整する。被引用箇所は、例えば、他の条項から引用されている条項などである。他の条項から引用されている場合、引用先の条項の内容にも関係するためより重要度が高い、と判定することができる。このため、評価部207は、被引用箇所が存在する場合、被引用箇所先の重み付けを重くする(評価を高くする)。
例えば、以下のような文書データの場合、第10条は「第14条」を引用しているため(「」を参照)、評価部207は、第10条は第14条の条項の重み付けを重くする(評価を高くする)。なお、他の箇所から引用されている数(被引用数)が多いほど重み付けを重くするようにしてもよい。
第10条(権利侵害等の責任)
成果物又は技術的成果が第三者の権利を侵害するとして何らかの請求、異議申立がなされ、又は訴訟が提起される等の紛争が生じたときは、甲は直ちにその旨を乙に通知するものとし、乙は自己の責任と費用においてこれを処理するか、若しくはこれによって甲に生じた損害を「第14条」に従い甲に賠償するものとする。ただし、当該権利の利用が甲の指示に基づく場合はこの限りではない。
また、評価部207は、評点に基づいて契約書を所定単位で判定する(評点及び評価の例については、図6を参照)。
The
For example, the
(b1) A score is assigned to the right/obligation. When the rights/obligations are labeled according to their type and strength (strength of the obligation), a score is assigned according to the expression of the type and strength. For example, the stronger the strength of one's own right, the higher the score may be, and the stronger the strength of the obligation, the lower the score may be. In addition, when the deadline for the right/obligation is labeled, the longer the payment date of the right, the higher the score may be, and the longer the deadline for the obligation, the lower the score may be.
(b2) Scope of rights/obligations (the weighting of the score changes depending on how many objects the rights/obligations apply to and the quantitative expression of the objects. For example, if the party to the rights is the principal, the greater the number or quantity of objects, the higher the score will be, since it is considered that the degree of advantage will be higher. Also, if the party to the rights is the other party, the greater the number or quantity of objects, the lower the score will be, since it is considered that the greater the number or quantity of objects, the lower the score will be.)
(b3) If the right/obligation is conditional, the weighting of the score will change depending on the size of the conditions (how many conditions there are). (If the party to the right is the principal, a conditional right is considered to be less advantageous than a right without conditions, so the more conditions there are, the lower the score. On the other hand, if the party to the right is the other party, a conditional right is considered to be more advantageous than a right without conditions, so the more conditions there are, the higher the score.)
(b4) For passages quoted from other passages (quoted passages), the weighting of the score is adjusted because of the large influence. A quoted passage is, for example, a clause quoted from another clause. If a passage is quoted from another clause, it can be determined to be more important because it is related to the contents of the quoted clause. For this reason, the
For example, in the case of the following document data, since Article 10 cites Article 14 (see ""), the
Article 10 (Liability for infringement, etc.)
In the event that a claim, objection, or lawsuit is filed on the grounds that the Deliverables or technical results infringe the rights of a third party, Party A shall immediately notify Party B, and Party B shall either settle the matter at its own responsibility and expense, or compensate Party A for any damages incurred thereby in accordance with "Article 14." However, this shall not apply if the use of the right in question is based on instructions from Party A.
Furthermore, the
なお、実施形態では、評価部207は、上記に例示した評価ルールに基づいて契約書を評価しているが、例えば、標準となる契約書(標準契約書)を予め評価しておき、この標準契約書の評価を基準として相対的に評価対象である契約書を評価してもよい。例えば、標準契約との抽出した文字列の表現の違いによって、評価対象である契約書の評価を標準契約書の評価よりも高くしたり、低くしたりするようにしてもよい。
In the embodiment, the
(ユーザ端末3)
図4は、実施形態に係るユーザ端末3のハード構成及び機能構成の一例を示す図である。図4(a)は、ユーザ端末3のハード構成の一例を示す図、図4(b)は、ユーザ端末3の機能構成の一例を示す図である。ユーザ端末3は、PC(Personal Computer)や携帯端末(例えば、タブレット端末)などである。図4(a)に示すように、ユーザ端末3は、通信IF300A、記憶装置300B、入力装置300C、表示装置300D、CPU300Eなどを備える。
(User terminal 3)
Fig. 4 is a diagram showing an example of a hardware configuration and a functional configuration of a
通信IF300Aは、他の装置(実施形態では、サーバ2)と通信するためのインターフェースである。 Communication IF300A is an interface for communicating with other devices (in this embodiment, server 2).
記憶装置300Bは、例えば、HDD(Hard Disk Drive)や半導体記憶装置(SSD(Solid State Drive))である。記憶装置300Bには、ユーザ端末3の識別子(ID)及び情報処理プログラムなどが記憶されている。なお、識別子は、サーバ2がユーザ端末3に対して新たに付与してもよいし、IP(Internet Protocol)アドレス、MAC(Media Access Control)アドレスなどを利用してもよい。
The
入力装置300Cは、例えば、キーボード、タッチパネルなどであり、ユーザは、入力装置300Cを操作して、情報処理システム1の利用に必要なデータを入力することができる。
The
表示装置300Dは、例えば、液晶モニタや有機ELモニタなどである。表示装置300Dは、情報処理システム1の利用に必要な画面を表示する。
The
CPU300Eは、ユーザ端末3を制御するものであり、図示しないROM及びRAMを備えている。
The
図4(b)に示すように、ユーザ端末3は、受信部301、送信部302、記憶装置制御部303、操作受付部304、表示装置制御部305などの機能を有する。なお、図4(b)に示す機能は、CPU300Eが、記憶装置300Bに記憶されている情報処理プログラムを実行することで実現される。
As shown in FIG. 4(b), the
受信部301は、サーバ2から送信されるデータを受信する。
The receiving
送信部302は、入力装置300Cを利用して入力されたデータに識別子を付与してサーバ2へ送信する。ユーザ端末3から送信されるデータに識別子を付与することでサーバ2は、受信したデータがどのユーザ端末3から送信されたものであるかを認識できる。
The
記憶装置制御部303は、記憶装置300Bを制御する。具体的には、記憶装置制御部303は、記憶装置300Bを制御してデータの書き込みや読み出しを行う。
The storage
操作受付部304は、入力装置300Cでの入力操作を受け付ける。
The
表示装置制御部305は、表示装置300Dを制御する。具体的には、表示装置制御部305は、表示装置300Dを制御して実施形態に係る情報処理システム1の利用に必要な画面を表示させる。
The display
なお、ユーザ端末3は、例えば、WEBブラウザを用いて、サーバ2から送信されるデータを表示するようにしてもよいし、ユーザ端末3にアプリケーションソフトウェアがインストールされており、このアプリケーション上でサーバ2から送信されるデータを表示してもよい。
The
(表示画面例)
図5~図6は、実施形態に係るユーザ端末3の表示装置300Dに表示される画面の一例を示す図である。以下、図5~図6を参照して、実施形態に係るユーザ端末3の表示装置300Dに表示される画面の一例について説明する。なお、図5~図6に示す画面はあくまで一例であり、他の表示態様としてもよい。
(Display screen example)
5 and 6 are diagrams showing an example of a screen displayed on the
(表示画面G11)
図5は、契約書の解析結果を提示する画面G1の一例である。図5に示すように、契約書の解析結果を提示する画面G1には、抽出部206により抽出された文字列が、文字列に付与されたラベルに応じて異なる態様で表示される。具体的には、以下(a1)~(a8)に関する文字列が互いに異なる表示態様(例えば、文字の色、背景色、文字の大きさ、フォントなどの違い)で表示される。また、その他、抽出部206により抽出された文字列に文章内にマークをつけたり、表で表現したり、文章の木構造やグラフ表現で表現したりなどして、抽出部206により抽出された文字列とその他の文字列とを識別可能性に表示させるようにしてもよい。
(a1)権利及び義務の少なくとも一方(権利/義務)に関する文字列
(a2)当事者に関する文字列
(a3)権利/義務に付された条件に関する文字列
(a4)原則及び例外の少なくとも一方(原則/例外)に関する文字列
(a5)注意に関する文字列
(a6)権利/義務の対象に関する文字列
(a7)法令に関する文字列
(a8)被引用関係に関する文字列
(Display screen G11)
5 is an example of a screen G1 presenting the analysis result of the contract. As shown in FIG. 5, the screen G1 presenting the analysis result of the contract displays the character strings extracted by the
(a1) Character strings related to at least one of rights and obligations (rights/obligations) (a2) Character strings related to the parties involved (a3) Character strings related to conditions attached to rights/obligations (a4) Character strings related to at least one of principles and exceptions (principles/exceptions) (a5) Character strings related to cautions (a6) Character strings related to the subject of rights/obligations (a7) Character strings related to laws and regulations (a8) Character strings related to cited relationships
(表示画面G2)
図6は、契約書の評価結果を提示する画面G2の一例である。図6に示すように、契約書の評価結果を提示する画面G1には、所定単位である条項、権利及び義務の少なくとも一方(権利/義務)に関する文字列、当事者に関する文字列、権利/義務に付された条件に関する文字列、原則及び例外の少なくとも一方(原則/例外)に関する文字列、注意に関する文字列、権利/義務の対象に関する文字列、法令に関する文字列、被引用関係に関する文字列、条項の評価である評点及び判定が所定単位である条項ごとに関連付けた情報が一覧できる形態で表示される。
このため、契約書に記載されている各条項の権利及び義務、当事者、権利/義務に付された条件、原則及び例外、注意、権利/義務の対象、法令、被引用関係、評点及び判定を一目で把握することができ視認性に優れる。
(Display screen G2)
Fig. 6 is an example of a screen G2 presenting the evaluation results of a contract. As shown in Fig. 6, the screen G1 presenting the evaluation results of a contract displays information associated with each clause, which is a predetermined unit, such as clauses, character strings related to at least one of rights and obligations (rights/obligations), character strings related to the parties, character strings related to conditions attached to the rights/obligations, character strings related to at least one of principles and exceptions (principles/exceptions), character strings related to cautions, character strings related to targets of rights/obligations, character strings related to laws and regulations, character strings related to citation relationships, and scores and judgments which are evaluations of clauses, which are predetermined units, in a form that allows a list of information associated with each clause, which is a predetermined unit.
This provides excellent visibility by allowing users to grasp at a glance the rights and obligations of each clause in the contract, the parties, the conditions attached to the rights/obligations, principles and exceptions, cautions, the subjects of the rights/obligations, laws and regulations, citation relationships, scores and judgments.
(情報処理システム1で実行される処理)
図7は、情報処理システム1で実行される処理の一例を示すフローチャートである。以下、図7を参照して、情報処理システム1で実行される処理について説明するが、図1~図6を参照して説明した構成と同一の構成には同一の符号を付して重複する説明を省略する。
(Processing Executed in Information Processing System 1)
Fig. 7 is a flowchart showing an example of processing executed in the
(ステップS101)
ユーザは、入力装置300Cを操作して、レビューしたい契約書をドラッグアンドドロップする。なお、契約書のファイルを選択操作するようにしてもよい。
(Step S101)
The user operates the
(ステップS102)
ユーザ端末3の送信部202は、ドラッグアンドドロップ又は選択操作された契約書のデータをサーバ2へ送信する。
(Step S102)
The
(ステップS103)
サーバ2の受信部201がユーザ端末3から送信された契約書のデータを受信すると、分割部204は、ユーザにベース契約書を所定単位に分割する。
(Step S103)
When the receiving
(ステップS104)
サーバ2の解析部205は、所定単位ごとに形態素解析を行い、各所定単位に含まれる文字列に対してラベルを付与する。なお、上述したように、解析部205は、正規化用データを参照し、異なる表現であるが前記所定の表現と意味が同じである表現の文字列についてもラベルを付与する。
(Step S104)
The
(ステップS105)
サーバ2の抽出部206は、解析部205による解析結果(ラベル)に基づいて、文書データに含まれる文字列から所定の表現に関する文字列を抽出する。
(Step S105)
The
(ステップS106)
サーバ2の評価部207は、抽出された文字列及び評価ルールに基づいて、契約書を所定単位で評価(評点及び判定)する。
(Step S106)
The
(ステップS107)
サーバ2の送信部202は、抽出部206で抽出された文字列のデータや評価部207での評価結果に基づいて、図5及び図6にそれぞれ示す画面G1及び画面G2を表示させるためのデータをユーザ端末3へ送信する。
ユーザ端末3の受信部301は、サーバ2から送信されたデータを受信する。ユーザ端末3の表示装置制御部305は、受信部201が受信したデータに基づいて、表示装置300Dに図5及び図6にそれぞれ示す画面G1及び画面G2を表示させる。
(Step S107)
The
The receiving
以上のように、実施形態に係るサーバ2(情報処理装置)は、文書データの入力を受け付ける受信部201(受付部)と、文書データを解析し、文書データに含まれる所定の表現に特徴的な文字列を抽出する抽出部206と、抽出部206が抽出した文字列を、文書データに含まれる他の文字列とは異なる態様で表示させる情報を送信(出力)する送信部202(出力部)とを備える。
このように、類型ごとに有利不利をラベリングしたり、パターンマッチングを行うのではなく、文書に含まれる文字列を抽出して、この抽出された文字列を他の文字列とは異なる態様で表示させるシンプルな構成であるため、種々の文書の利用することができ汎用性が高い。
As described above, server 2 (information processing device) according to the embodiment includes a receiving unit 201 (receiving unit) that receives input of document data, an
In this way, rather than labeling advantages and disadvantages for each type or performing pattern matching, the system has a simple configuration in which character strings contained in a document are extracted and the extracted character strings are displayed in a manner different from other character strings, making it possible to use the system on a variety of documents and highly versatile.
また、実施形態に係るサーバ2(情報処理装置)は、文書データに含まれる文字列を解析し、解析した文字列に分類を付与する解析部205を備える。そして、サーバ2の抽出部206は、文書に含まれる文字列から分類が付与された文字列を抽出し、サーバ2の送信部202(出力部)は、分類に応じて、異なる態様で表示させる情報を出力する。
このように、文字列に対して付与された分類に応じて異なる態様で表示させるので、文字列がどのような分類の文字列なのかを識別することが可能となる。
Moreover, the server 2 (information processing device) according to the embodiment includes an
In this way, since the character string is displayed in a different manner depending on the classification assigned to the character string, it becomes possible to identify the classification of the character string.
また、実施形態に係るサーバ2(情報処理装置)は、所定の表現に特徴的な文字列と、該文字列の分類とが関連付けられた辞書を備える。そして、サーバ2の解析部205は、辞書を参照して、文字列に前記分類を付与する。
このため、異なる表現であるが所定の表現と意味が同じである表現の文字列についてもラベルを付与することができる。
Moreover, the server 2 (information processing device) according to the embodiment includes a dictionary in which character strings characteristic of a predetermined expression are associated with classifications of the character strings. The
Therefore, it is possible to label strings of expressions that are different but have the same meaning as a given expression.
また、実施形態に係る辞書には、少なくとも、
(1)権利及び義務
(2)当事者
(3)権利/義務に付された条件
(4)原則及び例外
(5)注意
(6)権利/義務の対象
(7)法令
(8)被引用関係
のいずれかに特徴的な文字列と、該文字列の分類とが関連付けて記憶されている。
このように、辞書とマッチングによりラベルを付与することができる。
In addition, the dictionary according to the embodiment includes at least
Character strings that are characteristic of any of the following relationships are stored in association with the classification of the character string: (1) rights and obligations; (2) parties; (3) conditions attached to the rights/obligations; (4) principles and exceptions; (5) cautions; (6) subjects of the rights/obligations; (7) laws and regulations; and (8) cited relationships.
In this way, a label can be assigned by matching with a dictionary.
また、実施形態に係る辞書には、所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とが関連付けて記憶されている。
このため、異なる表現であるが所定の表現と意味が同じである表現の文字列についてもラベルを付与することができる。
In addition, in the dictionary according to the embodiment, character strings characteristic of a predetermined expression are stored in association with expressions that are different from the predetermined expression but have the same meaning as the predetermined expression.
Therefore, it is possible to label strings of expressions that are different but have the same meaning as a given expression.
また、実施形態に係るサーバ2(情報処理装置)は、抽出された文字列に対し、付与された分類に応じて評価を付与する評価部を備える。
このように、付与された分類に応じて評価を付与するシンプルな構成であるため、種々の文書の利用することができ汎用性が高い。また、システム構築のために大量のデータと作業を必要としないため、費用負担が重くなる虞が少ない。また、細かくレビューするあまりユーザの目線で適切でない指摘が多く含まれる虞も抑制できる。
Moreover, the server 2 (information processing device) according to the embodiment includes an evaluation unit that gives an evaluation to the extracted character string according to the assigned classification.
In this way, the system has a simple structure that assigns evaluations according to the assigned classification, so it can be used for a variety of documents and is highly versatile. In addition, since it does not require a large amount of data and work to build the system, there is little risk of the cost burden becoming heavy. In addition, it is possible to reduce the risk of the review being too detailed and including many inappropriate comments from the user's perspective.
また、実施形態に係るサーバ2(情報処理装置)の評価部207は、権利/義務の対象及び金額の少なくとも一方に応じて、付与する評価を変化させる。
このように、権利/義務の対象及び金額の少なくとも一方に応じて柔軟に評価することができ利便性が向上する。
Moreover, the
In this way, the rights/obligations can be flexibly evaluated according to at least one of the subject matter and amount of the rights/obligations, improving convenience.
また、実施形態に係るサーバ2(情報処理装置)の評価部207は、権利/義務の対象数及び権利/義務に付された条件の少なくとも一方に応じて、付与する評価を変化させる。
このように、権利/義務の対象数及び権利/義務に付された条件の少なくとも一方に応じて柔軟に評価することができ利便性が向上する。
Moreover, the
In this way, the rights/obligations can be flexibly evaluated depending on at least one of the number of objects of the rights/obligations and the conditions attached to the rights/obligations, thereby improving convenience.
また、実施形態に係るサーバ2(情報処理装置)は、文書を所定単位に分割する分割部204を備える。そして、サーバ2の解析部205は、所定単位ごとに文書データに含まれる文字列に分類を付与する。
このように、所定単位で、文書データに含まれる文字列に分類を付与するので、文書全体ではなく、所定単位ごとに契約内容等を評価することができ、利便性が向上する。
The server 2 (information processing device) according to the embodiment includes a
In this way, since a classification is assigned to character strings contained in document data in predetermined units, it is possible to evaluate the contract contents, etc. in predetermined units rather than the entire document, thereby improving convenience.
また、実施形態に係るサーバ2(情報処理装置)の送信部202(出力部)は、所定単位ごとに抽出された文字列の組み合わせ及び評価を関連付けて表示する情報を出力する。
このように、所定単位ごとに抽出された文字列の組み合わせ及び評価を関連付けて表示する情報を出力するので、一覧性があり識別性が向上する(一目で文字列の組み合わせと評価との関係を把握することができる)。
Moreover, the transmission unit 202 (output unit) of the server 2 (information processing device) according to the embodiment outputs information that displays the combination of character strings extracted for each predetermined unit in association with the evaluation.
In this way, information is output that correlates and displays the extracted character string combinations and evaluations for each specified unit, improving listability and identifiability (the relationship between the character string combinations and the evaluations can be understood at a glance).
[実施形態の変形例]
また、実施形態に係るサーバ2(情報処理装置)は、ユーザ(利用者)に対し、定額又は評価部207が評価した契約書量(文書量)に応じた課金額を算出する算出部を備えるようにしてもよい。ユーザに対して柔軟に課金することができ利便性が向上する。
[Modification of the embodiment]
Furthermore, the server 2 (information processing device) according to the embodiment may include a calculation unit that calculates a fixed amount or a billing amount according to the contract volume (document volume) evaluated by the
その他、上記実施形態及び変形例は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。 The above-mentioned embodiments and modifications are merely examples of the implementation of the present invention, and the technical scope of the present invention should not be interpreted in a limiting manner. In other words, the present invention can be implemented in various forms without departing from its gist or main characteristics.
1 情報処理システム
2 サーバ(情報処理装置)
200A 通信IF
200B 記憶装置
200C CPU
201 受信部(受信部)
202 送信部(出力部)
203 記憶装置制御部
204 分割部
205 解析部
206 抽出部
207 評価部
3 ユーザ端末
300A 通信IF
300B 記憶装置
300C 入力装置
300D 表示装置
300E CPU
301 受信部
302 送信部
303 記憶装置制御部
304 操作受付部
305 表示装置制御部
4 ネットワーク
1
200A Communication IF
201 Receiving unit (receiving unit)
202 Transmission unit (output unit)
203 Storage
300B:
301
Claims (9)
所定の表現に特徴的な文字列と、該文字列の分類とが関連付けられた辞書を参照し、前記文書データに含まれる文字列を解析して前記文字列に分類を付与する解析部と、
前記文書データに含まれる文字列から前記分類が付与された文字列を抽出する抽出部と、
前記抽出部が抽出した文字列を、前記文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する出力部と、を備え、
前記辞書には、少なくとも、
(1)権利及び義務
(2)当事者
(3)権利/義務に付された条件
(4)原則及び例外
(5)注意
(6)権利/義務の対象
(7)法令
(8)被引用関係
のいずれかに特徴的な文字列と、該文字列の分類とが関連付けて記憶され、
前記出力部は、
前記分類に応じて、異なる態様で表示させる情報を出力する、
ことを特徴とする情報処理装置。 a reception unit for receiving input of document data;
an analysis unit that refers to a dictionary in which character strings characteristic of a predetermined expression are associated with classifications of the character strings, analyzes character strings included in the document data, and assigns a classification to the character strings;
an extraction unit that extracts a character string to which the classification has been assigned from a character string included in the document data ;
an output unit that outputs information for displaying the character string extracted by the extraction unit in a form different from other character strings included in the document data ,
The dictionary includes at least:
(1) Rights and Obligations
(2) The parties
(3) Conditions attached to rights/obligations
(4) Principles and exceptions
(5) Caution
(6) Subject of rights/obligations
(7) Laws and regulations
(8) Citation relationships
A character string that is characteristic of any one of the above is stored in association with a classification of the character string,
The output unit is
outputting information to be displayed in different manners according to the classification;
23. An information processing apparatus comprising:
所定の表現に特徴的な文字列と、異なる表現であるが前記所定の表現と意味が同じである表現とが関連付けて記憶されている、
ことを特徴とする請求項1に記載の情報処理装置。 The dictionary states:
A character string characteristic of a predetermined expression is stored in association with an expression that is different from the predetermined expression but has the same meaning as the predetermined expression;
2. The information processing apparatus according to claim 1 ,
を備えることを特徴とする請求項1又は請求項2に記載の情報処理装置。 an evaluation unit that evaluates the extracted character string according to the classification;
3. The information processing device according to claim 1, further comprising:
前記権利/義務の対象及び金額の少なくとも一方に応じて、付与する評価を変化させることを特徴とする請求項3に記載の情報処理装置。 The evaluation unit is
4. The information processing apparatus according to claim 3 , wherein the evaluation to be given is changed depending on at least one of the subject and the amount of the right/obligation.
前記権利/義務の対象数及び前記権利/義務に付された条件の少なくとも一方に応じて、付与する評価を変化させることを特徴とする請求項3又は請求項4に記載の情報処理装置。 The evaluation unit is
5. The information processing apparatus according to claim 3 , wherein the evaluation to be given is changed depending on at least one of the number of objects of the right/obligation and a condition attached to the right/obligation.
前記解析部は、
前記所定単位ごとに前記文書データに含まれる文字列に前記分類を付与する、
ことを特徴とする請求項1又は請求項2に記載の情報処理装置。 A division unit for dividing a document into predetermined units,
The analysis unit is
assigning the classification to character strings included in the document data for each of the predetermined units;
3. The information processing apparatus according to claim 1, wherein the information processing apparatus is a computer .
前記所定単位ごとに抽出された文字列の組み合わせ及び評価を関連付けて表示させる情報を出力する、
ことを特徴とする請求項6に記載の情報処理装置。 The output unit is
outputting information for displaying the combination of character strings extracted for each predetermined unit in association with an evaluation;
7. The information processing apparatus according to claim 6 ,
解析部が、所定の表現に特徴的な文字列と、該文字列の分類とが関連付けられた辞書を参照し、前記文書データに含まれる文字列を解析して前記文字列に分類を付与する工程と、
抽出部が、前記文書データに含まれる文字列から前記分類が付与された文字列を抽出する工程と、
出力部が、前記抽出部が抽出した文字列を、前記文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する工程と、を有し、
前記辞書には、少なくとも、
(1)権利及び義務
(2)当事者
(3)権利/義務に付された条件
(4)原則及び例外
(5)注意
(6)権利/義務の対象
(7)法令
(8)被引用関係
のいずれかに特徴的な文字列と、該文字列の分類とが関連付けて記憶され、
前記出力部は、
前記分類に応じて、異なる態様で表示させる情報を出力する、
ことを特徴とする情報処理方法。 a step of a receiving unit receiving input of document data;
an analysis unit referring to a dictionary in which character strings characteristic of a predetermined expression are associated with classifications of the character strings, analyzing character strings included in the document data, and assigning a classification to the character strings;
an extraction unit extracting character strings to which the classification has been assigned from character strings included in the document data ;
and outputting information for displaying the character string extracted by the extraction unit in a form different from other character strings included in the document data ,
The dictionary includes at least:
(1) Rights and Obligations
(2) The parties
(3) Conditions attached to rights/obligations
(4) Principles and exceptions
(5) Caution
(6) Subject of rights/obligations
(7) Laws and regulations
(8) Citation relationships
A character string that is characteristic of any one of the above is stored in association with a classification of the character string,
The output unit is
outputting information to be displayed in different manners according to the classification;
23. An information processing method comprising:
文書データの入力を受け付ける受付部、
所定の表現に特徴的な文字列と、該文字列の分類とが関連付けられた辞書を参照し、前記文書データに含まれる文字列を解析して前記文字列に分類を付与する解析部、
前記文書データに含まれる文字列から前記分類が付与された文字列を抽出する抽出部、
前記抽出部が抽出した文字列を、前記文書データに含まれる他の文字列とは異なる態様で表示させる情報を出力する出力部、として機能させ、
前記辞書には、少なくとも、
(1)権利及び義務
(2)当事者
(3)権利/義務に付された条件
(4)原則及び例外
(5)注意
(6)権利/義務の対象
(7)法令
(8)被引用関係
のいずれかに特徴的な文字列と、該文字列の分類とが関連付けて記憶され、
前記出力部は、
前記分類に応じて、異なる態様で表示させる情報を出力する、
ことを特徴とする情報処理プログラム。 Computer,
a reception unit for receiving input of document data;
an analysis unit that refers to a dictionary in which character strings characteristic of a predetermined expression are associated with classifications of the character strings, analyzes character strings included in the document data, and assigns classifications to the character strings;
an extraction unit that extracts character strings to which the classification has been assigned from character strings included in the document data ;
an output unit that outputs information for displaying the character string extracted by the extraction unit in a form different from other character strings included in the document data ;
The dictionary includes at least:
(1) Rights and Obligations
(2) The parties
(3) Conditions attached to rights/obligations
(4) Principles and exceptions
(5) Caution
(6) Subject of rights/obligations
(7) Laws and regulations
(8) Citation relationships
A character string that is characteristic of any one of the above is stored in association with a classification of the character string,
The output unit is
outputting information to be displayed in different manners according to the classification;
2. An information processing program comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021087351A JP7664611B2 (en) | 2021-05-25 | 2021-05-25 | Information processing device, information processing method, and information processing program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021087351A JP7664611B2 (en) | 2021-05-25 | 2021-05-25 | Information processing device, information processing method, and information processing program |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2022180714A JP2022180714A (en) | 2022-12-07 |
| JP2022180714A5 JP2022180714A5 (en) | 2024-03-08 |
| JP7664611B2 true JP7664611B2 (en) | 2025-04-18 |
Family
ID=84327513
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021087351A Active JP7664611B2 (en) | 2021-05-25 | 2021-05-25 | Information processing device, information processing method, and information processing program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7664611B2 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2025180839A (en) * | 2024-05-30 | 2025-12-11 | 株式会社調和技研 | Information processing device, information processing method, and program |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014238628A (en) | 2013-06-06 | 2014-12-18 | 株式会社野村総合研究所 | Legal document analysis system and program |
| JP2019114264A (en) | 2017-12-24 | 2019-07-11 | Gva Tech株式会社 | Legal document review program, legal document review method, and legal document review system |
| WO2021049485A1 (en) | 2019-09-10 | 2021-03-18 | 株式会社日立製作所 | Legal analyzer and legal analysis method |
-
2021
- 2021-05-25 JP JP2021087351A patent/JP7664611B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014238628A (en) | 2013-06-06 | 2014-12-18 | 株式会社野村総合研究所 | Legal document analysis system and program |
| JP2019114264A (en) | 2017-12-24 | 2019-07-11 | Gva Tech株式会社 | Legal document review program, legal document review method, and legal document review system |
| WO2021049485A1 (en) | 2019-09-10 | 2021-03-18 | 株式会社日立製作所 | Legal analyzer and legal analysis method |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022180714A (en) | 2022-12-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR102289935B1 (en) | System and method for analysing legal documents based on artificial intelligence | |
| US10699349B2 (en) | Computerized system and method for data field pre-filling and pre-filling prevention | |
| Oliveras et al. | Reporting intellectual capital in Spain | |
| Gallery et al. | Corporate disclosure quality: lessons from Australian companies on the impact of adopting International Financial Reporting Standards | |
| US20220164397A1 (en) | Systems and methods for analyzing media feeds | |
| US9830663B2 (en) | System and method for determination of insurance classification and underwriting determination for entities | |
| Ofoegbu et al. | International financial reporting standards (IFRS) disclosure and performance of Nigeria listed companies | |
| Uzma | Cost-benefit analysis of IFRS adoption: developed and emerging countries | |
| WO2004061714A1 (en) | Technique evaluating device, technique evaluating program, and technique evaluating method | |
| KR20170032327A (en) | Account processing device, account processing method, and account processing program | |
| Hesarzadeh et al. | Corporate reporting readability and regulatory review risk | |
| JP7037530B2 (en) | Document review support device, document review support method and computer program | |
| Antônio et al. | Use of Derivatives and Analysts’ Forecasts: New Evidence from Non‐financial Brazilian Companies | |
| JP6576728B2 (en) | Accounting system, accounting method, program and guidance report | |
| Fedorova et al. | Impact of R&D, patents and innovations disclosure on market capitalization: Russian evidence | |
| JP2025188162A (en) | Contract review program, contract review device, and contract review method | |
| de Castro Neves | IFRS 18 implementation in Brazilian enterprises: Challenges and opportunities | |
| JP7664611B2 (en) | Information processing device, information processing method, and information processing program | |
| Gandía et al. | Differences in audit pricing between voluntary and mandatory audits | |
| CN114303140A (en) | Analysis of intellectual property data related to products and services | |
| Kellner et al. | ‘We are very focused on the muffins’: Regulation of and compliance with industrial relations in franchises | |
| Alajmi et al. | Corporate governance impact on risk disclosure in Shariah-compliant financial firms of Kuwait | |
| Lu et al. | Does lifting the objective-price constraint in revenue recognition increase the value relevance of earnings and revenue? | |
| CN112270224A (en) | Insurance responsibility analysis method and device and computer readable storage medium | |
| CN114549177A (en) | Insurance letter examination method, device, system and computer readable storage medium |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240229 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240229 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241023 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241129 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241224 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250325 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250401 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7664611 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |