[go: up one dir, main page]

JP7551203B1 - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP7551203B1
JP7551203B1 JP2024539757A JP2024539757A JP7551203B1 JP 7551203 B1 JP7551203 B1 JP 7551203B1 JP 2024539757 A JP2024539757 A JP 2024539757A JP 2024539757 A JP2024539757 A JP 2024539757A JP 7551203 B1 JP7551203 B1 JP 7551203B1
Authority
JP
Japan
Prior art keywords
script
information
file data
prompt
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2024539757A
Other languages
Japanese (ja)
Inventor
尚紀 北村
フランシス ニルス ハミルトン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Techtom Ltd
Original Assignee
Techtom Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Techtom Ltd filed Critical Techtom Ltd
Application granted granted Critical
Publication of JP7551203B1 publication Critical patent/JP7551203B1/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Devices For Executing Special Programs (AREA)
  • Stored Programmes (AREA)

Abstract

【課題】従来技術では、情報収集の処理のたびにLLMを呼び出すことになるので、時間とコストがかかってしまうという問題があった。
【解決手段】上記課題を解決するために、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定部と、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定部と、前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、前記指定した所望情報を取得するためのスクリプトを生成するスクリプト生成部と、前記生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する所望情報取得部と、を有する情報処理装置を提供する。
In the conventional technology, the LLM must be called up every time information collection processing is performed, which is time-consuming and costly.
[Solution] In order to solve the above problem, an information processing device is provided that has a prompt setting unit that sets a prompt for specifying desired information, which is information about a desired item, from multiple file data including multiple target items, a sample setting unit that sets sample file data to be input into a trained language model together with the set prompt, a script generation unit that inputs the set prompt and the set sample file data into the trained language model to generate a script for acquiring the specified desired information, and a desired information acquisition unit that acquires the specified desired information from the target file data using the generated script.

Description

本発明は、様々な情報を含むファイルデータ群から所望の情報を取得する情報処理装置に関する。 The present invention relates to an information processing device that obtains desired information from a file data group containing various information.

近年、ファイルデータ群から所定の情報を取得するために大規模言語モデル(LLM。以下、省略して使用する場合がある。)を利用することが広がりつつある。例えば、特許文献1には、広告のチラシなどのように形式の定まっていない多様な印刷物から所定の項目に関する文字情報を収集するためにLLMを利用した技術が開示されている。In recent years, the use of large-scale language models (LLMs, hereafter sometimes abbreviated as LLMs) to obtain specific information from file data groups has become widespread. For example, Patent Literature 1 discloses a technology that uses LLMs to collect character information related to specific items from a variety of printed materials with no set format, such as advertising flyers.

特許第7430437号公報Patent No. 7430437

特許文献1の技術は、収集する項目を特定する指示をはじめ、収集に関する諸々の指示を含むプロンプトをLLMに与えることで、OCRにより読み取ったチラシに印刷されていた一群の文字列から1以上の所定の項目に関する1以上の文字情報を収集する。このような技術の場合、情報収集の処理のたびにLLMを呼び出すことになるので、時間とコストがかかってしまうという問題が生じる。また、処理の度にLLMを呼び出すことから、抽出精度が一定でないという問題がある。The technology of Patent Document 1 collects one or more pieces of character information relating to one or more specific items from a group of character strings printed on a flyer read by OCR by providing the LLM with prompts including instructions for specifying the items to be collected and various other instructions related to the collection. With this type of technology, the LLM must be called up each time information collection is processed, which creates the problem of taking time and cost. In addition, because the LLM must be called up each time processing is performed, there is the problem of inconsistent extraction accuracy.

そこで、上記課題を解決するために本発明において、以下の情報処理装置などを提供する。すなわち、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定部と、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定部と、前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、前記指定した所望情報を取得するためのスクリプトを生成するスクリプト生成部と、前記生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する所望情報取得部と、を有する情報処理装置を提供する。Therefore, in order to solve the above problem, the present invention provides the following information processing device etc. That is, an information processing device is provided that has a prompt setting unit that sets a prompt for specifying desired information, which is information related to a desired item, from a plurality of file data including a plurality of target items, a sample setting unit that sets sample file data to be input to a trained language model together with the set prompt, a script generation unit that inputs the set prompt and the set sample file data to the trained language model to generate a script for acquiring the specified desired information, and a desired information acquisition unit that acquires the specified desired information from the target file data by the generated script.

また、前記特徴に加え、前記生成したスクリプトを蓄積するスクリプト蓄積部を、さらに有する情報処理装置を提供する。 In addition to the above features, an information processing device is provided that further has a script storage unit that stores the generated script.

また、前記特徴に加え、前記スクリプト生成部は、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理装置を提供する。 In addition to the above features, an information processing device is provided in which the script generation unit further inputs correct answer information, which is information on the correct answer of the specified desired information for the sample file data, to generate the script.

また、前記特徴に加え、前記生成したスクリプトにより前記サンプルファイルデータに対して前記指定した所望情報を取得した結果を前記正解情報と対比して評価するスクリプト評価部を、さらに有する情報処理装置を提供する。In addition to the above features, the information processing device further includes a script evaluation unit that evaluates the result of obtaining the specified desired information from the sample file data using the generated script in comparison with the correct answer information.

また、前記特徴に加え、前記スクリプト生成部は、前記スクリプト評価部による評価結果をさらに入力して前記スクリプトを生成する情報処理装置を提供する。 In addition to the above features, an information processing device is provided in which the script generation unit further inputs the evaluation results by the script evaluation unit to generate the script.

また、前記特徴に加え、前記生成したスクリプトと、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記生成したスクリプトを前記対象となるファイルデータに適応するよう修正するスクリプト修正部を、さらに有する情報処理装置を提供する。In addition to the above features, the present invention also provides an information processing device further having a script correction unit that inputs the generated script and some or all of the target file data into the trained language model and corrects the generated script to adapt it to the target file data.

また、前記特徴に加え、前記スクリプト修正部は、さらに前記生成したスクリプトの元となるプロンプトを前記学習済み言語モデルに入力して修正する情報処理装置を提供する。 In addition to the above features, the script correction unit also provides an information processing device that inputs the prompt that is the basis of the generated script into the trained language model to correct it.

また、前記特徴に加え、前記スクリプト修正部は、前記スクリプト蓄積部が蓄積するスクリプトについても修正する情報処理装置を提供する。 In addition to the above features, an information processing device is provided in which the script correction unit also corrects the scripts stored in the script storage unit.

また、前記特徴に加え、前記設定したプロンプトにより指定される所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する情報処理装置を提供する。In addition to the above features, an information processing device is provided that further has a detailed prompt setting unit that sets a detailed prompt, which is a detailed prompt for obtaining desired information specified by the set prompt.

また、前記特徴に加え、前記所望情報取得部により取得した取得結果を検証する検証部を、さらに有する情報処理装置を提供する。 In addition to the above features, an information processing device is provided that further has a verification unit that verifies the acquisition results acquired by the desired information acquisition unit.

また、前記特徴に加え、前記スクリプト修正部は、前記検証部による検証結果を反映させてスクリプトを修正する情報処理装置を提供する。 In addition to the above features, an information processing device is provided in which the script correction unit corrects the script by reflecting the verification results by the verification unit.

また、情報処理装置が実行する情報処理方法であって、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、前記設定したプロンプトとサンプルファイルデータを前記学習済み言語モデルに入力して、前記所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、前記生成したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する所望情報取得ステップと、を有する情報処理方法を提供する。 Also provided is an information processing method executed by an information processing device, comprising: a prompt setting step for setting a prompt for specifying desired information, which is information relating to a desired item, from a plurality of file data including a plurality of target items; a sample setting step for setting sample file data to be input to a trained language model together with the set prompt; a script generation step for inputting the set prompt and the sample file data into the trained language model to generate a script for acquiring the desired information; and a desired information acquisition step for acquiring the desired information from the plurality of target file data using the generated script.

また、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、前記設定したプロンプトとサンプルファイルデータを前記学習済み言語モデルに入力して、前記所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、前記生成したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する所望情報取得ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。 Also provided is an information processing program that causes an information processing device to execute the following steps: a prompt setting step for setting a prompt to specify desired information, which is information relating to a desired item, from a plurality of file data including a plurality of target items; a sample setting step for setting sample file data to be input to a trained language model together with the set prompt; a script generation step for inputting the set prompt and sample file data into the trained language model to generate a script for acquiring the desired information; and a desired information acquisition step for acquiring the desired information from the plurality of target file data using the generated script.

また、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持するスクリプト保持部と、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する保持スクリプト修正部と、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する第2所望情報取得部と、を有する情報処理装置を提供する。 Also provided is an information processing device having a script holding unit that holds a script for acquiring desired information, which is information relating to a desired item, from a plurality of file data including a plurality of target items, a held script modification unit that inputs a part or all of the target file data into the trained language model and modifies the held script to adapt it to the target file data, and a second desired information acquisition unit that acquires the desired information from the plurality of target file data using the modified script.

また、前記特徴に加え、前記保持スクリプト修正部は、前記保持しているスクリプトを修正するためのプロンプトを、さらに前記事前学習済み言語モデルに入力して修正する情報処理装置を提供する。 In addition to the above features, an information processing device is provided in which the retained script correction unit further inputs a prompt for correcting the retained script into the pre-trained language model to correct it.

また、情報処理装置が実行する情報処理方法であって、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持するスクリプト保持ステップと、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する保持スクリプト修正ステップと、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する第2所望情報取得ステップと、を有する情報処理方法を提供する。 Also provided is an information processing method executed by an information processing device, comprising: a script retaining step of retaining a script for acquiring desired information, which is information relating to a desired item, from a plurality of file data including a plurality of target items; a retained script modification step of inputting a part or all of the target file data into the trained language model and modifying the retained script to adapt it to the target file data; and a second desired information acquisition step of acquiring the desired information from the plurality of target file data using the modified script.

また、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持するスクリプト保持ステップと、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する保持スクリプト修正ステップと、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する第2所望情報取得ステップと、を情報処理装置に実行させる情報処理プログラムを提供する。 Also provided is an information processing program that causes an information processing device to execute a script retaining step of retaining a script for acquiring desired information, which is information relating to a desired item, from a plurality of file data including a plurality of target items; a retained script modification step of inputting a part or all of the target file data into the trained language model and modifying the retained script to adapt it to the target file data; and a second desired information acquisition step of acquiring the desired information from the plurality of target file data using the modified script.

本発明により、様々な情報を含むファイルデータ群から所望の情報の取得を、要する時間とコストを抑えて行うことができ、また一定の抽出精度で再現性のある情報の抽出ができる。 The present invention makes it possible to obtain desired information from a group of file data containing various information while reducing the time and cost required, and also enables reproducible extraction of information with a certain degree of extraction accuracy.

実施例1の情報処理装置の機能的構成の一例を示すブロック図FIG. 1 is a block diagram showing an example of a functional configuration of an information processing apparatus according to a first embodiment; スクリプト生成部の機能を説明する概念図Conceptual diagram explaining the functions of the script generation part 実施例1の情報処理装置を実現するハードウエアの構成例を示す概念図FIG. 1 is a conceptual diagram showing an example of a hardware configuration for implementing an information processing apparatus according to a first embodiment of the present invention; 実施例1の情報処理装置の処理の流れの一例を簡略に示すフロー図FIG. 1 is a flow chart showing an example of a process flow of an information processing apparatus according to a first embodiment of the present invention; 実施例2の情報処理装置の機能的構成の一例を示すブロック図FIG. 11 is a block diagram showing an example of a functional configuration of an information processing apparatus according to a second embodiment of the present invention; 詳細プロンプトの設定項目と設定例を示す図A diagram showing the detailed prompt settings and examples 詳細プロンプトの各設定項目が適用される方法を示す図A diagram showing how each setting in the Advanced prompt is applied 詳細プロンプトを設定するときの入力画面の一例を示す概念図Conceptual diagram showing an example of an input screen when setting detailed prompts 検証を行う際の種々の設定を例示する図A diagram showing various settings for performing verification. PDF形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図A conceptual diagram showing an example of converting PDF file data into a text file with location information added. ファイルデータの形式を変換する他の例を示す概念図Conceptual diagram showing another example of converting file data formats データ削減の他の態様について示す概念図FIG. 13 is a conceptual diagram showing another aspect of data reduction. 根拠として画像上の位置を表示する例を示す概念図Conceptual diagram showing an example of displaying the location on the image as evidence 実施例3の情報処理装置の機能的構成の一例を示すブロック図FIG. 11 is a block diagram showing an example of a functional configuration of an information processing apparatus according to a third embodiment. 実施例3の情報処理装置の処理の流れの一例を示すフロー図FIG. 11 is a flow diagram showing an example of a process flow of an information processing apparatus according to a third embodiment.

以下、本発明の実施の形態について、添付図面を用いて説明する。なお、本発明は、これら実施形態に何ら限定されるべきものではなく、その要旨を逸脱しない範囲において、種々なる態様で実施し得る。Hereinafter, the embodiments of the present invention will be described with reference to the accompanying drawings. Note that the present invention should not be limited to these embodiments, and may be implemented in various forms without departing from the spirit of the present invention.

<実施例1>
<概要>
本発明は、様々なファイルデータ群を対象として、スクリプト(簡易的なプログラム)の実行により所望の情報を取得するにあたり、大規模言語モデルを典型とする学習済み言語モデル(LLM。以下、省略して使用する場合がある。)にサンプルとなるファイルデータとプロンプトを入力することにより、このスクリプトを生成するものである。ここで、入力したサンプルの範囲においてロバスト性(どれだけ多様なフォーマットから正確に抽出できるかの度合い)を担保した静的なスクリプトを生成することができる。またLLMを呼び出すのは、スクリプトを生成するときの一度だけであるので、従来技術が要していた時間とコストを削減することができる。また、静的なスクリプトにより処理を行うので、抽出結果が一意に定まる。
Example 1
<Overview>
The present invention is directed to obtaining desired information by executing a script (simple program) from various file data groups, and generates the script by inputting sample file data and a prompt into a learned language model (LLM, hereinafter sometimes abbreviated as LLM), which is typically a large-scale language model. Here, a static script can be generated that ensures robustness (the degree to which extraction can be performed accurately from a variety of formats) within the range of the input samples. In addition, the LLM is called only once when generating the script, which reduces the time and cost required by the conventional technology. In addition, since processing is performed using a static script, the extraction result is uniquely determined.

以下では、情報処理装置の機能及び処理の流れ、並びにハードウエアの内容について説明する。なお、以下に記載する本システムの機能ブロックは、ハードウエア及びソフトウェアの組み合わせとして実現され得る。具体的には、コンピュータを利用するものであれば、CPU(中央演算装置)や主メモリ、バス、あるいは二次記憶装置(ハードディスクドライブや不揮発性メモリ、CDやDVDなどの記憶メディアとそれらメディアの読取ドライブなど)、情報入力に利用される入力デバイス、印刷機器や表示装置、その他の外部周辺装置などのハードウエア構成部、またその外部周辺装置用のインタフェース、通信用インタフェース、それらハードウエアを制御するためのドライバプログラムやその他アプリケーションプログラム、ユーザ・インターフェース用アプリケーションなどが挙げられる。そして主メモリ上に展開したプログラムに従ったCPUの演算処理によって、入力デバイスやその他インタフェースなどから入力され、メモリやハードディスク上に保持されているデータなどが加工、蓄積されたり、上記各ハードウエアやソフトウェアを制御するための命令が生成されたりする。あるいは本システムの機能ブロックは専用ハードウエアによって実現されてもよい。The following describes the functions and processing flow of the information processing device, as well as the contents of the hardware. The functional blocks of the system described below can be realized as a combination of hardware and software. Specifically, if a computer is used, the hardware components include a CPU (central processing unit), main memory, bus, or secondary storage device (hard disk drive, non-volatile memory, storage media such as CDs and DVDs, and read drives for these media, etc.), input devices used for inputting information, printing devices, display devices, and other external peripheral devices, as well as interfaces for these external peripheral devices, communication interfaces, driver programs and other application programs for controlling these hardware, and user interface applications. Then, by the arithmetic processing of the CPU according to the program deployed on the main memory, data input from input devices and other interfaces and stored in memory or hard disk is processed and stored, and commands for controlling the above hardware and software are generated. Alternatively, the functional blocks of the system may be realized by dedicated hardware.

また、この発明はシステムとして実現できるのみでなく、方法としても実現可能である。また、このような発明の一部をソフトウェアとして構成することができる。さらに、そのようなソフトウェアをコンピュータに実行させるために用いるプログラム、及びプログラムを固定した記録媒体も、当然にこの発明の技術的な範囲に含まれる(本明細書の全体を通じて同様である)。 This invention can be realized not only as a system, but also as a method. Furthermore, a part of such an invention can be configured as software. Furthermore, the program used to cause a computer to execute such software, and the recording medium on which the program is fixed, are naturally included in the technical scope of this invention (the same applies throughout this specification).

<機能的構成>
図1は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図1に示すように、情報処理装置100は、プロンプト設定部101と、サンプル設定部102と、スクリプト生成部103と、スクリプト蓄積部104と、所望情報取得部105を有する。
<Functional configuration>
1 is a block diagram showing an example of the functional configuration of an information processing apparatus according to the present embodiment. As shown in FIG. 1, the information processing apparatus 100 includes a prompt setting unit 101, a sample setting unit 102, a script generating unit 103, a script storage unit 104, and a desired information acquiring unit 105.

<プロンプト設定部>
プロンプト設定部101は、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定する機能を有する。対象となるファイルデータは、本情報処理装置が備えるストレージにて蓄積したものでもよいし、本情報処理装置と通信回線等を介して接続するストレージにて蓄積されているものでもよい。また、ファイルデータのファイル形式は多種存在し限定するものではないが、例えば、ワードファイル、PDF(Portable Document Format)ファイル、エクセルファイル、画像ファイル、CSV(Comma Separated Values)ファイル、テキストファイル、BIM(Building Information Modeling)ファイル、2DCAD(Computer Aided Design)ファイル、3Dモデルファイルなどがある。
<Prompt setting section>
The prompt setting unit 101 has a function of setting a prompt for specifying desired information, which is information on a desired item, from a plurality of file data including a plurality of target items. The target file data may be stored in a storage provided in the information processing device, or may be stored in a storage connected to the information processing device via a communication line or the like. In addition, there are many types of file formats for the file data, and the file formats are not limited to these, but include, for example, Word files, Portable Document Format (PDF) files, Excel files, image files, Comma Separated Values (CSV) files, text files, Building Information Modeling (BIM) files, Computer Aided Design (2D CAD) files, and 3D model files.

また、「所望情報」は、所望の項目の情報や、その項目の情報を何らかの演算・加工して得られる情報(総数、平均情報、最大情報、距離や衝突などの空間的関係性、3次元モデル情報、3次元図形情報、画像、文字情報など)を意味する。例えば、複数の建築物の設備に関するCSVファイルを対象として、そのファイルデータ群から「エレベーターの総数」を所望する場合は、ファイルごとに含まれる建築物のエレベーターの数を抽出し、それらの数を合算した情報が所望情報となる。また、数情報の計算のみならず、3次元空間処理や3次元図形処理などの処理結果を所望情報として設定してもよい。例えば、複数の建築物の3次元モデルファイルを対象として、「柱と梁の衝突箇所」を所望する場合は、ファイルごとに含まれている柱と梁のモデルをすべて抽出し、それらの衝突の有無を計算し、衝突のある箇所を抽出した3次元空間の情報が所望情報となる。 In addition, "desired information" refers to information on a desired item or information obtained by performing some kind of calculation or processing on the information on that item (total number, average information, maximum information, spatial relationships such as distance and collision, three-dimensional model information, three-dimensional graphic information, images, text information, etc.). For example, if the "total number of elevators" is desired from a group of file data of CSV files related to the facilities of multiple buildings, the number of elevators in the buildings included in each file is extracted and the total number of these numbers becomes the desired information. In addition to calculating numerical information, the results of processing such as three-dimensional space processing and three-dimensional graphic processing may also be set as the desired information. For example, if the "collision points between columns and beams" are desired for three-dimensional model files of multiple buildings, the three-dimensional space information obtained by extracting all the models of columns and beams included in each file, calculating whether they collide, and extracting the collision points becomes the desired information.

さらに例えば、複数の建築物の3次元図面ファイルを対象として、「立面図と平面図の不整合箇所」を所望する場合は、ファイルごとに含まれている立面と平面の建築設計情報をすべて抽出し、それらを3次元立体として再構成した際の整合性の有無を確認し、その不整合箇所を文章化したテキストが所望情報となる。このような3次元空間や3次元空間の処理においては、一定の処理を静的に行う本発明の方が所望情報を正確に取得できる場合が多い。このような所望情報を指定するプロンプトを設定する。このプロンプトの設定はユーザが行うものであってもよいし、本装置をユーザに提供する者などにより予め設定されるものであってもよい。 Furthermore, for example, if the target is 3D drawing files of multiple buildings and the "inconsistencies between the elevations and floor plans" are desired, all architectural design information for the elevations and floor plans contained in each file is extracted, and the presence or absence of consistency when reconstructed into a 3D solid is checked, and the text that documents the inconsistencies becomes the desired information. In such 3D spaces or processing of 3D spaces, the present invention, which performs a certain amount of processing statically, is often able to obtain the desired information more accurately. A prompt is set to specify such desired information. This prompt may be set by the user, or may be set in advance by the person who provides the device to the user.

なお、後述するスクリプト生成部において設定されたプロンプトにより指定された所望情報を取得するためのスクリプトが生成されるが、プロンプト設定部において、スクリプトの生成についても指示するプロンプトを設定してもよい。例えば、上記の例のように「エレベーターの総数」が所望情報である場合、“与えられた複数のCSVファイルからエレベーターの総数を求めてください”といったような、所望情報を指定する指示内容のプロンプトを設定してもよいし、“与えられた複数のCSVファイルからエレベーターの総数を求めるスクリプトを作ってください”といったように、指定した所望情報を取得するためのスクリプトを作成する指示内容のプロンプトを設定してもよい。 Note that a script is generated to obtain the desired information specified by a prompt set in the script generation unit described below, but a prompt that also instructs the generation of the script may be set in the prompt setting unit. For example, if the desired information is "total number of elevators" as in the above example, a prompt may be set with instructions specifying the desired information, such as "Please find the total number of elevators from multiple given CSV files," or a prompt may be set with instructions to create a script to obtain the specified desired information, such as "Please create a script that finds the total number of elevators from multiple given CSV files."

また、スクリプトの処理が複雑になる場合には、複数ステップに分けてスクリプトを生成するプロンプトを設定してもよい。例えば、前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、(1)ファイルごとに含まれている柱と梁のモデルを抽出するスクリプトを生成するプロンプト、(2)それらの衝突の有無を確認するスクリプトを生成するプロンプト、(3)衝突のある箇所を抽出した3次元空間の情報を取得するスクリプトを生成するプロンプトなどに分割し、それぞれのスクリプトを生成するプロンプトを指定してもよい。 In addition, when the script processing becomes complicated, a prompt for generating the script may be set in multiple steps. For example, in the example of extracting "collision points between pillars and beams" from the aforementioned 3D model, the prompt may be divided into (1) a prompt for generating a script for extracting the models of pillars and beams contained in each file, (2) a prompt for generating a script for checking whether there is a collision between them, and (3) a prompt for generating a script for acquiring information on the 3D space where the collision points have been extracted, and each prompt for generating a script may be specified.

<サンプル設定部>
サンプル設定部102は、前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定する機能を有する。サンプルファイルデータは、対象となる複数のファイルデータから所望情報を取得する際の見本となるファイルデータであり、例えば、上述した例のように「エレベーターの総数」を所望情報として設定した場合では、エレベーターの台数についての情報を含む複数の「建築物の設備」についてのCSVファイルをサンプルファイルデータとして設定し、「柱と梁の衝突箇所」を所望情報として設定した場合では、柱と梁の情報を含む複数の建築構造についての3次元モデルファイルをサンプルファイルデータとして設定し、「立面図と平面図の整合性の有無」を所望情報として設定した場合では、立面図と平面図の情報を含む複数の「建築設計」についての2次元図面ファイルをサンプルファイルデータとして設定する。
<Sample setting section>
The sample setting unit 102 has a function of setting sample file data to be input to the trained language model together with the set prompt. The sample file data is a model file data when desired information is acquired from a plurality of target file data. For example, when "total number of elevators" is set as the desired information as in the above example, a CSV file for a plurality of "building facilities" including information on the number of elevators is set as the sample file data. When "collision points between columns and beams" is set as the desired information, a three-dimensional model file for a plurality of building structures including information on columns and beams is set as the sample file data. When "consistency between elevations and floor plans" is set as the desired information, a two-dimensional drawing file for a plurality of "building designs" including information on elevations and floor plans is set as the sample file data.

また、所望する情報を含むファイルデータであって、それぞれにフォーマットが異なる複数のファイルデータをサンプルファイルデータとして設定することが好ましい。様々なフォーマットのファイルデータに対しても汎用的に所望情報を取得することができるスクリプトの生成に寄与するからである。 It is also preferable to set multiple file data containing the desired information, each of which has a different format, as sample file data. This is because it contributes to the generation of a script that can generically obtain the desired information from file data of various formats.

なお、このサンプルファイルデータは、取得の対象となる複数のファイルデータに対して当然少数となるケースが多いが、その逆の場合も有りうる。また、サンプルファイルデータは、取得の対象となる複数のファイルデータの一部であってもよいし、別のファイルデータであってもよい。サンプルファイルデータの設定はユーザが行うものであってもよいし、本装置をユーザに提供する者などにより予め設定されるものであってもよい。 Note that in many cases, this sample file data will naturally be a small amount compared to the multiple file data to be acquired, but the opposite is also possible. Also, the sample file data may be a part of the multiple file data to be acquired, or it may be separate file data. The sample file data may be set by the user, or may be set in advance by the person who provides the device to the user.

なお、便宜のためプロンプトの設定とサンプルファイルデータの設定を個別の構成として説明してきたが、プロンプトとサンプルファイルデータを一体的に設定するように構成してもよい。すなわち、所望情報を指定するとともにサンプルとなるファイルデータへのリンク情報なども含むプロンプトを設定することで、上記のようなプロンプト設定部とサンプル設定部とによる機能が同じように実現する。For convenience, the prompt setting and the sample file data setting have been described as separate configurations, but the prompt and sample file data may be configured to be set together. In other words, by setting a prompt that specifies the desired information and also includes link information to the sample file data, the functions of the prompt setting unit and sample setting unit described above can be realized in the same way.

<スクリプト生成部>
スクリプト生成部103は、前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、前記指定した所望情報を取得するためのスクリプトを生成する機能を有する。
<Script generation part>
The script generation unit 103 has a function of inputting the set prompt and the set sample file data into the trained language model, and generating a script for acquiring the specified desired information.

図2は、スクリプト生成部の機能を説明する概念図である。例示しているのは、サンプルファイルデータ201、202である。サンプルファイルデータは、建築物ごとの設備(エレベーター、消火設備、衛生設備)とその数を示すリストであって、一方のサンプルファイルデータ201は日本語で記述されており、他方のサンプルファイルデータ202は主に英語で記述されている。 Figure 2 is a conceptual diagram explaining the function of the script generation unit. The examples shown are sample file data 201 and 202. The sample file data is a list showing the equipment (elevators, fire extinguishing equipment, sanitary equipment) and their numbers for each building, with sample file data 201 being written in Japanese and sample file data 202 being written mainly in English.

これらのサンプルファイルデータをプロンプトとともにLLMに入力する。以下では、学習済み言語モデルの典型であるLLMを用いて説明する。なお、学習済み言語モデルは、LLMだけでなく自然言語処理タスクを行い得るものであれば、小規模な言語モデルや画像やその他のフォーマットを扱えるマルチモーダルな言語モデルなどのように異なるものであってもよい。These sample file data are input into the LLM along with the prompts. In the following, we will use the LLM, which is a typical example of a trained language model, for explanation. Note that the trained language model may be anything other than the LLM, such as a small language model or a multimodal language model that can handle images and other formats, as long as it can perform natural language processing tasks.

そして、図示するプロンプト203は、
「建築物の設備リストの複数のCSVファイルを今からサンプルとして与えます。これらの行は複数の建築物の設備の種類と数を示しています。これらのCSVファイルから、エレベーターの台数を抽出し、その総数を求めるスクリプトを作ってください。」
というもので、所望情報であるエレベーターの総数を算出するスクリプトの生成を指示するものとなっている。
And the prompt 203 shown is:
"I will now provide several CSV files of building equipment lists as samples. These lines show the types and quantities of equipment in several buildings. Please create a script that extracts the number of elevators from these CSV files and calculates the total number."
This instructs the generation of a script that calculates the total number of elevators, which is the desired information.

LLM204は、このようなプロンプト203とサンプルファイルデータ201、202の入力に対してスクリプトを生成する。日本語表記のリストだけでなく英字表記のリストもサンプルファイルデータとすることで、生成したスクリプト205は、「設備」列が「エレベーター」の行であって「数」の列の欄の情報の総数と、「Equipment」列が「Elevator」の行であって「Number」の列の欄の情報の総数とを合算する処理を実行させるものとなっている。様々な表記のサンプルを入力することにより、いわゆる「表記のゆれ」に対応できるスクリプトの作成が可能となる。 The LLM 204 generates a script in response to the input of such a prompt 203 and sample file data 201, 202. By using a list of English characters as well as a list of Japanese characters as sample file data, the generated script 205 executes a process of adding up the total number of pieces of information in the "Number" column in the row where the "Equipment" column is "Elevator" and the total number of pieces of information in the "Number" column in the row where the "Elevator" column is "Equipment". By inputting various samples of notation, it is possible to create a script that can handle so-called "variations in notation."

また、前述のようにスクリプトの処理が複雑になる場合には、複数ステップに分けて設定されたプロンプトそれぞれについてスクリプトを生成してもよい。また、生成されたスクリプトについて、ユーザが自ら修正を加えることも考えられる。 In addition, if the script processing is complicated as mentioned above, a script may be generated for each of the set prompts in multiple steps. It is also possible for the user to make their own modifications to the generated script.

また、様々なフォーマットのサンプルファイルデータを入力することで、それらの各フォーマットでのファイルデータからも適切に情報の取得を行うことができるスクリプトの生成が可能となる。前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、複数の異なる形式の3次元モデルをサンプルデータとして入力することで、多様なモデルのフォーマットに対応する汎用的なスクリプトを生成することができる。 In addition, by inputting sample file data in various formats, it is possible to generate a script that can appropriately extract information from file data in each of those formats. In the example of extracting "collision points between columns and beams" from the 3D model mentioned above, by inputting multiple 3D models in different formats as sample data, a general-purpose script that can handle a variety of model formats can be generated.

また、スクリプト生成部は、サンプルファイルデータに対する指定した所望情報の正解の情報である正解情報をさらに入力してスクリプトを生成するように構成することもできる。例えば、上記の例において、設定したサンプルファイルデータから抽出したエレベーター台数の総数が「241台」である場合には、この「241」が正解情報となる。この正解情報をもLLMに入力することで、より正確に所望情報を取得することができるスクリプトの生成に寄与する。 The script generation unit can also be configured to generate a script by further inputting correct answer information, which is information on the correct answer of the specified desired information for the sample file data. For example, in the above example, if the total number of elevators extracted from the set sample file data is "241," this "241" becomes the correct answer information. Inputting this correct answer information into the LLM also contributes to the generation of a script that can more accurately obtain desired information.

ここで指定する正解情報は、数情報のみならず、スクリプトの処理結果となる3次元空間モデル、2次元図形、画像、文章など、どのようなフォーマットでもよい。また、正解情報はスクリプトの最終結果の情報のみならず、その処理過程における正解情報を与えてもよい。例えば、前述の3次元モデルから「柱と梁の衝突箇所」を抽出する例においては、(1)ファイルごとに含まれている柱と梁のモデル、(2)それらの衝突の有無、(3)衝突のある箇所を抽出した3次元空間の情報などを、処理過程における正解情報として与えてもよい。さらに、正解情報となる3次元モデルをユーザが指定することは操作上専門性を要するため、正解情報となる3次元モデルや3次元空間を簡易に指定できるような3次元ビューワーや表示部を搭載することも望ましい。The correct answer information specified here may be in any format, such as not only numerical information but also a three-dimensional space model resulting from the processing of the script, a two-dimensional figure, an image, or text. In addition, the correct answer information may be not only information on the final result of the script, but also information on the correct answer in the processing process. For example, in the example of extracting "collision points between pillars and beams" from the above-mentioned three-dimensional model, (1) the pillar and beam models included in each file, (2) the presence or absence of collisions between them, and (3) information on the three-dimensional space from which the collision points are extracted may be given as correct answer information in the processing process. Furthermore, since it requires expertise in operation for the user to specify the three-dimensional model that is the correct answer information, it is also desirable to install a three-dimensional viewer or display unit that allows the user to easily specify the three-dimensional model or three-dimensional space that is the correct answer information.

<スクリプト蓄積部>
スクリプト蓄積部104は、前記生成したスクリプトを蓄積する機能を有する。スクリプト蓄積部を持つことで、一度設定されたスクリプトを再利用することができ、大量の対象となるファイルデータから再現性を持って値を取得することが可能となる。また、生成したスクリプトを用いて後述する所望情報取得部により取得した取得結果や、ともに入力した元のプロンプト及びサンプルファイルデータと関連付けて蓄積してもよい。
<Script storage section>
The script storage unit 104 has a function of storing the generated script. By having the script storage unit, it is possible to reuse a script that has been set once, and to obtain values with reproducibility from a large amount of target file data. In addition, the generated script may be used to store the results of acquisition obtained by a desired information acquisition unit (described later) in association with the original prompt and sample file data that were input together.

<所望情報取得部>
所望情報取得部105は、前記生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する機能を有する。上述した対象となるファイルデータに対して生成したスクリプトを実行して、指定した所望情報を取得する処理を行う。取得した結果は保存することが好ましい。これは、後述するように、取得結果を検証したり、再整形したりするなどの後処理に取得結果を供するためである。
<Desired Information Acquisition Unit>
The desired information acquisition unit 105 has a function of acquiring the specified desired information from the target file data by the generated script. The generated script is executed on the target file data to perform processing to acquire the specified desired information. It is preferable to save the acquired results. This is to provide the acquired results for post-processing, such as verifying and reformatting the acquired results, as will be described later.

また、所望情報取得部で取得された取得情報を、新たな対象となるファイルデータとして、別のスクリプトへ渡してもよい。つまり、本発明におけるスクリプトの生成と対象ファイルからの所望情報の取得は連結させることができ、より複雑な処理を構成することも可能である。 The information acquired by the desired information acquisition unit may be passed to another script as new target file data. In other words, the generation of the script and the acquisition of desired information from the target file in this invention can be linked, making it possible to configure more complex processing.

以上のように、スクリプトの実行により所望情報を取得する処理を行うので、LLMを都度呼び出して、所望の情報を取得しようとする場合に対して、要する時間とコストを抑えることができ、また一定の抽出精度で再現性のある情報の抽出ができる。 As described above, the process of obtaining the desired information is performed by executing a script, which reduces the time and cost required compared to calling the LLM each time to obtain the desired information, and also enables reproducible information to be extracted with a certain degree of extraction accuracy.

さらに、「その課題を解決するために静的なスクリプトを用意しようとしても、専門的な知識のあるエンジニアでしか自分でスクリプトを作れない」という問題があったが、LLMでスクリプトを生成することで、誰でも自らスクリプトを作成することができるという効果を得ることができる。 Furthermore, there was a problem in that "even if we tried to prepare a static script to solve this problem, only engineers with specialized knowledge could create the script themselves." However, by generating scripts with LLM, the effect is that anyone can create the script themselves.

<ハードウエア構成>
図3は、実施例1の情報処理装置を実現するハードウエアの構成例を示す概念図である。図示するように、情報処理装置300は、各種演算処理を行うCPU301と、揮発性記録媒体であるRAM302と、不揮発性の記憶媒体であるフラッシュメモリやHDDなどのストレージ303と、通信インタフェース304と、入出力インタフェース305と、を有している。RAM302は、各種演算処理を行うプログラムをCPU301に実行させるために読み出すとともに、そのプログラムのワーク領域(作業領域)を提供する。また、RAM302には、複数のアドレスが割り当てられており、CPU301で実行されるプログラムは、そのアドレスを特定しアクセスすることで相互にデータのやり取りを行い、処理を行うことが可能となっている(本明細書を通じて同様である)。
<Hardware configuration>
3 is a conceptual diagram showing an example of the configuration of hardware that realizes the information processing device of the first embodiment. As shown in the figure, the information processing device 300 has a CPU 301 that performs various arithmetic processing, a RAM 302 that is a volatile recording medium, a storage 303 such as a flash memory or HDD that is a non-volatile storage medium, a communication interface 304, and an input/output interface 305. The RAM 302 reads out a program that performs various arithmetic processing to cause the CPU 301 to execute it, and provides a work area (working area) for the program. In addition, a plurality of addresses are assigned to the RAM 302, and the program executed by the CPU 301 can exchange data with each other and perform processing by identifying and accessing the address (the same applies throughout this specification).

ここで、図1の情報処理装置100のプロンプト設定部101、サンプル設定部102、スクリプト生成部103及び所望情報取得部105の各機能は、主に図3のCPU301、RAM302により実現される。また、スクリプト蓄積部105の機能は、主に図3のストレージ303により実現される。また、ファイルデータを蓄積するデータベースが外部に存在したり、抽出部が外部に存在するLLMなどの学習済み言語モデルを用いたりする場合には、通信インタフェース304や入出力インタフェース305を介して相互に信号や情報の授受を行うことで各機能が実現される。Here, the functions of the prompt setting unit 101, sample setting unit 102, script generation unit 103 and desired information acquisition unit 105 of the information processing device 100 in Figure 1 are mainly realized by the CPU 301 and RAM 302 in Figure 3. Also, the function of the script accumulation unit 105 is mainly realized by the storage 303 in Figure 3. Also, when a database that accumulates file data is external, or when a learned language model such as an LLM in which the extraction unit is external is used, each function is realized by sending and receiving signals and information to and from each other via the communication interface 304 and the input/output interface 305.

<処理の流れ>
図4は、実施例1の情報処理装置の処理の流れの一例を簡略に示すフロー図である。まず、対象となる 複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を指定するためのプロンプトを設定する(S401:プロンプト設定ステップ)。そして、設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定する(S402:サンプル設定ステップ)。そして、設定したプロンプトと設定したサンプルファイルデータを学習済み言語モデルに入力して、指定した所望情報を取得するためのスクリプトを生成する(S403:スクリプト生成ステップ)。そして、生成したスクリプトを蓄積する(S404:スクリプト蓄積ステップ)。そして、生成したスクリプトにより前記対象となるファイルデータから前記指定した所望情報を取得する(S405:所望情報取得ステップ)。なお、サンプル設定ステップを、プロンプト設定ステップの先に行ってもよいし、両ステップを一体的に行ってもよい。また、スクリプト蓄積ステップは、所望情報取得ステップの後に行ってもよい。
<Processing flow>
FIG. 4 is a flow diagram showing an example of a process flow of the information processing apparatus according to the first embodiment. First, a prompt is set for specifying desired information, which is information on a desired item, from a plurality of file data including a plurality of target items (S401: prompt setting step). Then, sample file data to be input to the trained language model together with the set prompt is set (S402: sample setting step). Then, the set prompt and the set sample file data are input to the trained language model to generate a script for acquiring the specified desired information (S403: script generation step). Then, the generated script is accumulated (S404: script accumulation step). Then, the specified desired information is acquired from the target file data by the generated script (S405: desired information acquisition step). The sample setting step may be performed before the prompt setting step, or both steps may be performed integrally. Also, the script accumulation step may be performed after the desired information acquisition step.

<効果>
本実施例の情報処理装置によれば、様々な情報を含むファイルデータ群から所望の情報の取得を、要する時間とコストを抑えて行うことができ、また一定の抽出精度で再現性のある情報の抽出ができる。
<Effects>
According to the information processing device of this embodiment, it is possible to obtain desired information from a group of file data containing various information while reducing the time and cost required, and it is also possible to extract reproducible information with a certain degree of extraction accuracy.

<実施例2>
<概要>
本実施例は、実施例1を基本として、生成したスクリプトを評価したり修正したりする構成や、より詳細なプロンプトを設定する構成や、取得結果を検証する構成を、さらに含む情報処理装置である。
Example 2
<Overview>
The present embodiment is an information processing apparatus based on the first embodiment, and further includes a configuration for evaluating and modifying a generated script, a configuration for setting more detailed prompts, and a configuration for verifying acquired results.

<機能的構成>
図5は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図5に示すように、情報処理装置500は、実施例1と同様に、第プロンプト設定部501と、サンプル設定部502と、スクリプト生成部503と、スクリプト蓄積部504と、所望情報取得部505を有し、さらに、スクリプト評価部506と、スクリプト修正部507と、詳細プロンプト設定部508と、検証部509を有する。実施例1と同様の構成についての説明は省略し、スクリプト評価部506、スクリプト修正部507、詳細プロンプト設定部508及び検証部509について、以下に説明する。
<Functional configuration>
Fig. 5 is a block diagram showing an example of the functional configuration of the information processing apparatus of this embodiment. As shown in Fig. 5, the information processing apparatus 500 has a prompt setting unit 501, a sample setting unit 502, a script generating unit 503, a script storing unit 504, and a desired information acquiring unit 505, similar to the first embodiment, and further has a script evaluating unit 506, a script correcting unit 507, a detailed prompt setting unit 508, and a verifying unit 509. A description of the same configuration as the first embodiment will be omitted, and the script evaluating unit 506, the script correcting unit 507, the detailed prompt setting unit 508, and the verifying unit 509 will be described below.

<スクリプト評価部>
スクリプト評価部506は、前記生成したスクリプトにより前記サンプルファイルデータに対して前記指定した所望情報を取得した結果を前記正解情報と対比して評価する機能を有する。この正解情報は、実施例1のスクリプト生成部で述べた通りである。生成したスクリプトにより、サンプルファイルデータから実際に所望情報を取得して、その結果と正解情報を比較することで、どの程度正確なスクリプトであるかを評価することがきる。すなわち、取得した結果と正解情報とが合致すれば正確であると評価することができる。
<Script Evaluation Section>
The script evaluation unit 506 has a function of evaluating the result of acquiring the specified desired information from the sample file data by the generated script, by comparing it with the correct answer information. This correct answer information is as described in the script generation unit of the first embodiment. By actually acquiring the desired information from the sample file data by the generated script and comparing the result with the correct answer information, it is possible to evaluate how accurate the script is. In other words, if the acquired result matches the correct answer information, it can be evaluated as accurate.

また、スクリプト生成部において、この評価結果をさらにLLMに入力するように構成することで、評価結果を踏まえたスクリプトを生成することができ、より正確なスクリプトの生成に役立たせることができる。例えば、取得した情報と正解情報が合致するまでスクリプトの再生成を続けるように構成することもできる。なお、スクリプトの評価は、スクリプト蓄積部に蓄積しているスクリプトに対して行ってもよい。 In addition, by configuring the script generation unit to further input the evaluation results into the LLM, a script can be generated based on the evaluation results, which can be useful for generating more accurate scripts. For example, it can be configured to continue regenerating the script until the acquired information matches the correct answer information. Note that the script evaluation may be performed on the scripts stored in the script storage unit.

<スクリプト修正部>
スクリプト修正部507は、前記生成したスクリプトと、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記生成したスクリプトを前記対象となるファイルデータに適応するよう修正する機能を有する。なお、修正に用いられる学習済み言語モデルは、上述したスクリプト生成部で用いられる学習済み言語モデルと同じものであってもよいし、別のものであってもよい。
<Script Modification Section>
The script correction unit 507 has a function of inputting the generated script and a part or all of the target file data into the trained language model, and correcting the generated script so as to adapt it to the target file data. Note that the trained language model used for the correction may be the same as the trained language model used in the script generation unit described above, or may be a different one.

例えば、スクリプト作成の際に入力したサンプルファイルデータになかったファイル形式のファイルデータや取得すべき項目名などが対象となるファイルデータに含まれている場合には、所望情報を正確に取得できない場合が生じる。このような事態を防止するために、生成したスクリプトを対象となるファイルデータとともに学習済み言語モデルに入力する。For example, if the target file data contains file data in a file format that was not included in the sample file data entered when creating the script, or contains item names to be obtained, the desired information may not be obtained accurately. To prevent such situations, the generated script is input into the trained language model along with the target file data.

そして、以下の例のようなプロンプトを与えることで、スクリプトを修正する。
「このスクリプトは、“CSVファイルから、建築物の設備の一覧のうちエレベーターを示す行を選択し、その総を示す列の情報を抽出して、その総数を求めよ”という目的に沿って作られたスクリプトです。
ただし、この処理対象のファイルデータでは正常に動作しない可能性があります。正常に動作しない箇所を見つけ出し、スクリプトを修正してください。」
例えば、「エレベーターの総数」を取得するために作成したスクリプトが、「設備」列が「エレベーター」の行であって「数」の列の欄の情報の総数と、「Equipment」列が「Elevator」の行であって「Number」の列の欄の情報の総数とを合算する処理を実行させるものである場合、対象となるファイルデータに、「設備」列が「昇降機」の行であって「数」の列の欄を有するファイルデータが含まれている場合には、このファイルデータの情報は取得の対象から漏れてしまい、正確な所望情報を得ることはできない。そこで、上記のようなプロンプトとともに作成済みのスクリプトと対象となるファイルデータとを学習済み言語モデルに入力することにより、対象となるファイルデータに適応したスクリプトの生成を行うことできる。
Then modify the script by providing a prompt like the example below:
This script was written with the following objective in mind: "Select the row that shows elevators from the list of facilities in the building from the CSV file, extract the information from the column showing the total number, and find the total number."
However, it may not work properly with the file data you are processing. Please find out what is not working properly and fix the script."
For example, if a script created to obtain the "total number of elevators" executes a process of adding up the total number of pieces of information in the "Number" column in a row where the "Equipment" column is "Elevator" and the total number of pieces of information in the "Number" column in a row where the "Equipment" column is "Elevator", if the target file data includes file data in a row where the "Equipment" column is "Elevator" and has a "Number" column, the information of this file data will not be obtained, and accurate desired information cannot be obtained. Therefore, by inputting the created script and the target file data into the trained language model along with the above-mentioned prompt, a script adapted to the target file data can be generated.

ファイルデータに適応させるための修正は、対象となるファイルデータからファイルデータを一つずつLLMに入力して行ってもよいし、すべてのファイルデータをLLMに入力して行ってもよい。また、修正するスクリプトを作成する元となったプロンプトをさらに入力してもよい。 The modifications to accommodate the file data may be done by inputting the file data into the LLM one by one from the target file data, or by inputting all the file data into the LLM. Also, the prompt that was the basis for creating the script to be modified may be input further.

また、上述したスクリプト蓄積部により蓄積されているスクリプトについても、生成したスクリプトに対する修正と同じように修正するように構成することもできる。対象となるファイルデータが増減したり変わったりすることにより、蓄積したスクリプトについて修正が必要になることもあるので、これについて修正可能に構成することは好ましい。 The scripts stored by the script storage unit described above can also be configured to be modified in the same way as generated scripts. Since the stored scripts may need to be modified if the target file data increases, decreases, or changes, it is preferable to configure it so that this can be modified.

<詳細プロンプト設定部>
詳細プロンプト設定部508は、前記設定したプロンプトにより指定される所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する機能を有する。以下に説明する詳細プロンプトの設定項目は、スクリプト生成において適用する項目や、対象となるファイルデータに対して適用する項目や、生成したスクリプトの実行により対象ファイルデータから所望情報を取得する場面で適用する項目もあるし、さらにはスクリプトの実行の後にLLMを用いた後処理において適用する項目であってもよい。詳細プロントが適用される態様は、様々に設定することができる。
<Detailed prompt settings section>
The detailed prompt setting unit 508 has a function of setting a detailed prompt, which is a detailed prompt for acquiring desired information designated by the set prompt. The setting items of the detailed prompt described below include items to be applied in script generation, items to be applied to target file data, items to be applied when acquiring desired information from target file data by executing the generated script, and items to be applied in post-processing using LLM after the execution of the script. The manner in which the detailed prompt is applied can be set in various ways.

図6は、詳細プロンプトの設定項目(名称、説明、必要性)と、設定例(例)を例示する図であり、本例では、所望情報を指定するために設定されたプロンプトが、「柱と梁の衝突箇所を出力してください」というものである。 Figure 6 is a diagram illustrating the detailed prompt setting items (name, description, necessity) and a setting example (example). In this example, the prompt set to specify the desired information is "Please output the collision points between the columns and beams."

例えば設定項目1は、「複数の所望情報名の付与」という名称であり、「文字の定義への正確な理解」のための設定項目であることが示されている。また、その説明として「抽出する所望情報を複数明示的に付与する」と示され、その例として「[“柱”,“Pillar”]」が示されている。この詳細プロンプトを設定することで、「柱と梁の衝突箇所を出力してください。」という指示について「柱」だけでなく、「Pillar」と記されたものも抽出の対象にする指示が付加される。 For example, setting item 1 is called "Assign multiple desired information names," and is indicated as a setting item for "accurate understanding of character definitions." The explanation for this is "explicitly assign multiple desired pieces of information to be extracted," with "["pillar,""Pillar"]" given as an example. By setting this detailed prompt, an instruction is added to the instruction "Output the collision points between the pillar and beam," to include not only "pillar," but also anything marked as "Pillar" as a target for extraction.

他にも詳細プロンプトの設定項目として、文字の定義への正確な理解のために、抽出する所望情報の説明を付与する「所望情報の説明の付与」、誤抽出の抑制と出力結果のフォーマット統一のために、ユーザは抽出したいフォーマットを指定できる「フォーマット指定」、例外における処理や正確性の向上のために、特定の条件によって、抽出内容を変更する「条件設定」及び、LLMでのスクリプト生成の精度向上のために、LLMがスクリプトを生成する際に参考とするスクリプトを事前に設定する「サンプルスクリプトの提示」がある。もちろん、これらに限らずユーザが自ら種々の設定項目を設けて詳細プロンプトの設定を行うことができる。 Other detailed prompt settings include "Add description of desired information," which adds an explanation of the desired information to be extracted to ensure an accurate understanding of the character definition, "Format specification," which allows the user to specify the format they want to extract in order to prevent erroneous extractions and standardize the format of output results, "Condition setting," which changes the extracted content according to specific conditions in order to improve accuracy and handle exceptions, and "Show sample script," which sets in advance a script that LLM will use as a reference when generating scripts in order to improve the accuracy of script generation in LLM. Of course, users can set various settings themselves to configure detailed prompts.

ここで、上述した各設定項目の適用方法であるが、大別すると、方法1の「ファイル内容を絞る」、方法2の「プロンプトを繋げる」及び方法3の「検出結果を確認し、再整形する」の3つ分けることができる。方法1は、LLMに入力する前に入力の対象となるファイルデータを絞り込むことを意味し、方法2は、設定した詳細プロンプトをメインプロンプトに繋げることを意味する。方法3は、抽出結果を、指定されたフォーマットなどに応じて再整形することを意味する。 Methods for applying each of the settings items mentioned above can be broadly divided into three: Method 1, "narrowing down file contents," Method 2, "connecting prompts," and Method 3, "checking and reformatting detection results." Method 1 involves narrowing down the file data to be input before inputting it into the LLM, and Method 2 involves connecting the configured detailed prompt to the main prompt. Method 3 involves reformatting the extraction results according to a specified format, etc.

図7は、詳細プロンプトの各設定項目が適用される方法を示す図である。図示するように、「複数所望情報名の付与」、「所望情報の説明の付与」、「条件設定」及び「サンプルスクリプトの提示」の各項目は、方法2の「プロンプトを繋げる」が適用される。また、「フォーマット指定」は、方法1~方法3のすべてが適用される。適用例については後述する。 Figure 7 shows how each setting item of the detailed prompt is applied. As shown in the figure, the items "Assigning multiple desired information names," "Assigning description of desired information," "Condition setting," and "Show sample script" are applied using method 2 "Connecting prompts." Additionally, for "Format specification," all of methods 1 to 3 are applied. Examples of application will be described later.

図8は、詳細プロンプトを設定するときの入力画面の一例を示す概念図である。図示するように、画面801の上部左側には既に設定されているプロンプト「柱と梁の衝突箇所を出力してください」が表示されている。そして、画面の左側に「所望情報名」、「フォーマット指定」、「条件設定」及び「サンプルスクリプト」の各設定項目の入力欄802が表示されている。また、ユーザの操作によって、さらに別の設定項目の入力欄が表示される。これらの各入力欄に対するユーザの記入操作を受け付けることで、詳細プロンプトが設定される。そして、スクリプト生成部は、設定された詳細プロンプトを適用してスクリプトを生成し、あるいは所望情報取得部は、設定された詳細プロンプトを適用して所望情報の取得を行う。このように詳細プロンプトを設定することで、所望情報の取得精度向上を図ることができる。 Figure 8 is a conceptual diagram showing an example of an input screen when setting a detailed prompt. As shown in the figure, the already set prompt "Please output the collision point between the column and the beam" is displayed in the upper left part of the screen 801. Then, input fields 802 for each setting item of "desired information name", "format specification", "condition setting", and "sample script" are displayed on the left side of the screen. In addition, input fields for further setting items are displayed by the user's operation. The detailed prompt is set by accepting the user's input operation in each of these input fields. Then, the script generation unit applies the set detailed prompt to generate a script, or the desired information acquisition unit applies the set detailed prompt to acquire the desired information. By setting the detailed prompt in this way, the accuracy of acquiring the desired information can be improved.

以上のような詳細プロンプトを適用した例を示す。例えば、「所望情報名」の項目において「“Pillar”も“柱”を指しています」と設定し、「条件設定」の項目において「柱が抽出できない場合は空白を出力してください」と設定した場合、この詳細プロンプトがメインプロンプトに繋げられて入力される。そして、「所望情報名」の適用により、「Pillar」と記された3次元モデルも柱として抽出されたうえで柱と梁の衝突箇所が出力される。また、対象となるファイルデータから柱が抽出できなかった場合には、空白が出力される。 Here is an example of applying the above detailed prompt. For example, if you set "'Pillar' also refers to 'column'" in the "Desired information name" field and set "If pillar cannot be extracted, output blank" in the "Condition setting" field, this detailed prompt will be connected to the main prompt and input. Then, by applying the "Desired information name", the 3D model marked "Pillar" will also be extracted as a pillar, and the collision point between the pillar and beam will be output. Also, if a pillar cannot be extracted from the target file data, a blank will be output.

また、詳細プロンプト設定部は、詳細プロンプトを設定するにあたり、設定されたプロンプトに応じて自動的に各設定項目を設定するように構成することができる。あるいは、ユーザによる設定を受け入れつつ、設定されていない項目について、何らかの設定をお薦めするように構成してもよい。詳細プロンプトの設定をユーザから受け付けることで、ユーザの意向に柔軟かつ好適に抽出を行うことができるが、最適なプロンプトの設定を行うことがユーザにとって難しい場合もある。そこで、このように、詳細プロンプトの自動記入やサジェストの機能が有効である。これらの機能により、簡易化・操作性向上を図ることができる。 In addition, when setting the detailed prompt, the detailed prompt setting unit can be configured to automatically set each setting item according to the set prompt. Alternatively, it may be configured to accept the settings made by the user while recommending some settings for items that have not been set. By accepting the detailed prompt settings from the user, extraction can be performed flexibly and appropriately in accordance with the user's wishes, but it may be difficult for the user to set the optimal prompt. Therefore, functions such as automatic entry and suggestion of detailed prompts are effective. These functions can simplify the process and improve operability.

また、簡易化・操作性向上を図るため、所望情報取得部は、対象となるファイルデータのすべてに対するスクリプトの実行処理の前に、設定したプロンプトと詳細プロンプトとを適用したテストを行うよう構成することも好ましい。このテストは、対象となるファイルデータのうちの一部に対してスクリプトの実行を行うことである。このテストの結果により、ユーザは設定したプロンプトや詳細プロンプトが自ら所望する結果をもたらすものか否かの判断をすることができ、より望ましい取得結果を得るためのプロンプト等の再設定を行うことができる。 In addition, for simplification and improved operability, it is also preferable to configure the desired information acquisition unit to perform a test applying the set prompt and detailed prompt before executing the script on all of the target file data. This test involves executing the script on a portion of the target file data. Based on the results of this test, the user can determine whether the set prompt and detailed prompt will bring about the results he or she desires, and can reconfigure the prompts, etc., to obtain more desirable acquisition results.

図8に示すように、画面801の左側であって、詳細プロンプトの入力欄802とプロンプトの表示欄803の下に「テスト」ボタン804が表示され、このボタンによりテストが行われる。そして、テストの結果が、図中において説明のために記した点線枠805の中に表示されている。ユーザは、このテストによる抽出結果に基づき、プロンプトの再設定や、テストの結果が得られたスクリプトによる実際の取得の処理を行うことができる。As shown in FIG. 8, a "Test" button 804 is displayed on the left side of screen 801 below the detailed prompt input field 802 and the prompt display field 803, and a test is performed by pressing this button. The test results are then displayed in a dotted frame 805, which is shown for explanatory purposes in the figure. Based on the results extracted from this test, the user can reset the prompt or perform actual retrieval processing using the script that obtained the test results.

なお、本例では、詳細プロンプトの設定を、所望情報を指定するプロンプトの設定と別個に行う構成を用いたが、プロンプトと詳細プロンプトとを連続的・一体的に設定するように構成してもよい。 In this example, the detailed prompt is set separately from the prompt that specifies the desired information, but the prompt and the detailed prompt may be configured to be set continuously and integrally.

<検証部>
検証部509は、前記所望情報取得部により取得した取得結果を検証する機能を有する。検証部による検証の具体的な態様は種々ある。以下に説明する検証は、LLMにプロンプトを入力して行うものでもいし、コーディングしたスクリプトの実行によるものでもよい。
<Verification Department>
The verification unit 509 has a function of verifying the results obtained by the desired information acquisition unit. There are various specific aspects of the verification by the verification unit. The verification described below may be performed by inputting a prompt to the LLM, or by executing a coded script.

図9は、検証を行う際の種々の設定を例示する図である。図示するように、4種の設定を行うことができ、それぞれ「詳細プロンプト利用」、「検証プロンプト」、「検証スクリプト」及び「ファイル間比較」である。 Figure 9 is a diagram illustrating various settings when performing verification. As shown in the figure, four types of settings can be made: "Use detailed prompts," "Verification prompts," "Verification script," and "Compare files."

「詳細プロンプト利用」は、詳細プロンプトで設定した抽出の設定を検証に利用する。例えば、詳細プロンプトの設定項目である「フォーマット指定」において、フォーマットの指定を行っていた場合、その指定されたフォーマットと抽出結果を比較して、“抽出結果は指定フォーマットと所定の類似範囲にあるか?”という検証を行う。また、「条件設定」での設定を利用して“抽出できなかった場合に、空白が出力されているか?“という検証を行う。 "Use detailed prompt" uses the extraction settings set in the detailed prompt for validation. For example, if a format is specified in the "Format specification" setting item of the detailed prompt, the specified format is compared with the extraction results to validate whether "the extraction results are within a specified similarity range with the specified format." In addition, the settings in "Condition settings" are used to validate whether "if extraction is not possible, are blanks output?"

また、「検証プロンプト」は、検証用のプロンプトを独自に設定するものであり、例えば、“この情報が、エレベーターの扉の素材を示しているかどうかチェックしてください”といったプロンプトを設定して入力する。また、「検証スクリプト」は、検証用のスクリプトを独自に設定するものであり、例えば、図示するように、検出結果が「1」未満の場合に「Error」を返し、それ以外は「OK」を返す、といった命令を入力して検証する。 The "verification prompt" allows you to set your own verification prompt; for example, you can set and input a prompt such as "Please check whether this information indicates the material the elevator doors are made of." The "verification script" allows you to set your own verification script; for example, as shown in the figure, you can input a command to return "Error" if the detection result is less than "1," and "OK" otherwise.

また、「ファイル間比較」は、複数のファイルから抽出する際には、抽出結果を他ファイルと比較して妥当性を確認する。例示するように、抽出されたファイルA~ファイルDを比較すると、ファイルA、ファイルC、ファイルDはいずれも数字と記号のみの表記であるのに対して、ファイルBは漢字主体の表記となっている。このような場合に、「ファイルBは、他と比べて妥当ではない」という検証結果を得る。 In addition, when extracting from multiple files, "file comparison" compares the extracted results with other files to confirm validity. As an example, when comparing extracted files A to D, file A, file C, and file D are all written using numbers and symbols only, while file B is written mainly in kanji. In such a case, the verification result is that "file B is not valid compared to the others."

ここで、検証部により取得結果の検証をした場合、上述したスクリプト修正部は、その検証結果を反映させてスクリプトを修正するように構成することもできる。例えば、上述したように抽出結果の情報がエラーである場合、“前回の抽出では〇〇〇という情報を抽出していましたが、エラーの検証結果がでました。このエラー結果を考慮し、スクリプトを修正してください。”といった指示をLLMに入力してスクリプトの修正を行う。Here, when the verification unit verifies the obtained results, the script modification unit described above can be configured to modify the script to reflect the verification results. For example, if the information in the extraction result is an error as described above, an instruction such as "In the previous extraction, information XXX was extracted, but the verification result was an error. Please modify the script taking this error result into consideration" is input to the LLM to modify the script.

<ハードウエア構成>
本実施例の情報処理装置は、実施例1に準じ図3に示したハードウエア構成により実現することができる。図5に示した実施例2の情報処理装置に特有の構成であるスクリプト評価部506、スクリプト修正部507、詳細プロンプト設定部508及び検証部509の機能は、主に図3のCPU301、RAM302により実現される。
<Hardware configuration>
The information processing apparatus of this embodiment can be realized by the hardware configuration shown in Fig. 3 according to the embodiment 1. The functions of a script evaluation unit 506, a script correction unit 507, a detailed prompt setting unit 508, and a verification unit 509, which are components specific to the information processing apparatus of the embodiment 2 shown in Fig. 5, are mainly realized by the CPU 301 and the RAM 302 in Fig. 3.

<処理の流れ>
本実施例の情報処理装置の処理の流れは、実施例1の情報処理装置の処理の流れと基本的に同様である。そして、本実施例の情報処理装置においては、生成したスクリプトによりサンプルファイルデータに対して所望情報を取得した結果を正解情報と対比して評価するスクリプト評価ステップと、生成したスクリプトと、対象となるファイルデータの一部または全部を学習済み言語モデルに入力し、生成したスクリプトを対象となるファイルデータに適応するよう修正するスクリプト修正ステップと、設定したプロンプトによる所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定ステップと、所望情報取得ステップにて取得した取得結果を検証する検証ステップと、をさらに含む。
<Processing flow>
The process flow of the information processing device of this embodiment is basically the same as the process flow of the information processing device of embodiment 1. The information processing device of this embodiment further includes a script evaluation step of evaluating a result of obtaining desired information from sample file data by the generated script in comparison with correct answer information, a script correction step of inputting the generated script and a part or all of the target file data into a trained language model and correcting the generated script to adapt it to the target file data, a detailed prompt setting step of setting a detailed prompt that is a detailed prompt for obtaining desired information by the set prompt, and a verification step of verifying the acquisition result obtained in the desired information acquisition step.

<効果>
本実施例の情報処理装置によれば、所望情報取得の精度向上とロバスト性向上を図った情報処理装置を提供することができる。
<Effects>
According to the information processing apparatus of this embodiment, it is possible to provide an information processing apparatus which aims to improve the accuracy and robustness of desired information acquisition.

<付加機能>
実施例1または実施例2を基本として、さらに以下の機能的構成を付加した情報処理装置として構成することもできる。
<Additional features>
Based on the first or second embodiment, the information processing device may be configured with the following functional configuration added thereto.

<フィルタリング部>
フィルタリング部は、対象となるファイルデータのうち所定のファイルデータを所望情報取得部による取得の対象から除去する機能を有する。フィルタリングする手法は種々存在する。例えば、ファイルの属性(拡張子、サイズ、ファイル名、ファイルに付随するデータ項目など)に基づきフィルタリングする。また、個別のキーワードを設定し、このキーワードに基づきフィルタリングする。具体的には、セマンティックサーチ、クラスタリング、文字検索などを行いフィルタリングするためのスクリプトを生成し、そのスクリプトを実行することによりフィルタリングがなされる。また、LLMに指示を与えてフィルタリングするようにしてもよい。例えば、“このファイルはエレベーターの内容を含んでいる?”という指示を入力することで、エレベーターの内容を含むか否かによりフィルタリングすることができる。
<Filtering section>
The filtering unit has a function of removing predetermined file data from the target file data to be acquired by the desired information acquisition unit. There are various filtering methods. For example, filtering is performed based on file attributes (extension, size, file name, data items associated with the file, etc.). Also, individual keywords are set and filtering is performed based on these keywords. Specifically, filtering is performed by generating a script for filtering by performing semantic search, clustering, character search, etc., and executing the script. Filtering may also be performed by giving instructions to the LLM. For example, by inputting an instruction such as "Does this file contain elevator contents?", filtering can be performed based on whether or not the file contains elevator contents.

このようなフィルタリング部の機能により、例えば、対象となる500個のファイルデータのうち、建築概要書からは面積を取得したいが、立面図は対象としてスキップしたいといったユーザの要望に応えることができる。 This filtering function can meet the needs of users who, for example, want to obtain the area from the architectural summary of 500 target file data, but want to skip the elevation drawings.

<変換部>
変換部は、ファイルデータの特性に応じて対象となるファイルデータの形式を変換する機能を有する。なお、本情報処理装置が変換部を有する場合、所望情報取得部は、変換部により変換したファイルデータから取得を行う。例えば、ファイルデータがPDF形式である場合には、テキストファイルの形式に変換する。また、画像データの場合には、OCRにより文字認識をしてテキストファイルの形式に変換する。また3次元データの場合には2次元データや画像に変換してもよい。このような変換を行うことでロバスト性向上に寄与する。
<Conversion section>
The conversion unit has a function of converting the format of the target file data according to the characteristics of the file data. If the information processing device has a conversion unit, the desired information acquisition unit acquires the desired information from the file data converted by the conversion unit. For example, if the file data is in PDF format, it is converted into a text file format. In addition, in the case of image data, character recognition is performed by OCR to convert the data into a text file format. In addition, in the case of three-dimensional data, it may be converted into two-dimensional data or an image. Such conversion contributes to improving robustness.

さらに、テキストファイルに変換する際に、テキストの位置情報を付与するように変換することも好ましい。図10は、PDF形式のファイルデータについて、位置情報を付与したテキストファイルに変換する例を示す概念図である。図10(a)は、住宅の建築面積表を示すPDF形式のファイルの一部を示している。図10(b)は、「形状」、「計算式」、「面積」の各テキストを、それらの位置情報とともに記述したJSON形式に変換した例を示している。また、図10(c)は、同様にテキストを位置情報とともに記述したArray形式に変換した例を示している。このように、位置情報を付与することで、テキスト間の関係性を考慮した抽出が行われ、ロバスト性向上に寄与する。また、図10(d)は、元のファイルにおいて「洋室1」、「洋室2」、「洋室3」のそれぞれの「面積」と「帖」を示した表を示していたテキストを、位置情報ではなくテーブル情報を持つテキスト(図中の点線枠内)に変換する例を示している。このように変換することで、テーブル構造を保持したまま取得の対象とすることができる。 Furthermore, when converting to a text file, it is also preferable to convert so that the location information of the text is added. FIG. 10 is a conceptual diagram showing an example of converting PDF format file data into a text file with location information added. FIG. 10(a) shows a part of a PDF format file showing a building area table of a house. FIG. 10(b) shows an example of converting each text of "shape", "formula", and "area" into a JSON format in which the text is described together with their location information. FIG. 10(c) shows an example of converting text into an Array format in which the text is similarly described together with location information. In this way, by adding location information, extraction is performed taking into account the relationship between the texts, which contributes to improving robustness. FIG. 10(d) shows an example of converting text showing a table showing the "area" and "tatami" of each of "Western-style room 1", "Western-style room 2", and "Western-style room 3" in the original file into text with table information instead of location information (within the dotted line frame in the figure). By converting in this way, it is possible to obtain the target while maintaining the table structure.

図11は、ファイルデータの形式を変換する他の例を示す概念図である。図11に示すように、図形を含むファイル(キッチン平面図)の場合は、SVG形式に変換し図形情報を持つテキストにしておくことで、スクリプトによる取得を行いやすくなる。また、逆に2次元のベクター情報をラスター画像のように変換してもよいし、3次元から2次元へのデータ変換などを行ってもよい。 Figure 11 is a conceptual diagram showing another example of converting the format of file data. As shown in Figure 11, in the case of a file containing graphics (a kitchen floor plan), converting it to SVG format and making it text with graphic information makes it easier to retrieve using a script. Conversely, two-dimensional vector information may be converted into a raster image, or data may be converted from three-dimensional to two-dimensional.

<データ削減部>
データ削減部は、対象となるファイルデータのデータ削減をする機能を有する。データ削減は様々な態様で行うことができる。例えば、対象となるファイルデータから特定の空間、プロパティ、エリア、特定のページやセクション、パラグラフ、テーブルなどに絞ることでデータ削減する。また、ファイルの属性(ページ番号、位置など)でフィルタリングしたり、個別のキーワードでフィルタリングしたり(セマンティックサーチ、クラスタリング、文字検索)、空間の位置(x,y,z,座標)でフィルタリングしたりすることができる。また、LLMに指示を入力してフィルタリングすることもできる(“このファイルはエレベーターの内容を含んでいる?)。
<Data Reduction Department>
The data reduction unit has a function to reduce the target file data. Data reduction can be performed in various ways. For example, data reduction can be performed by narrowing down the target file data to a specific space, property, area, specific page or section, paragraph, table, etc. In addition, filtering can be performed by file attributes (page number, position, etc.), individual keywords (semantic search, clustering, character search), or spatial position (x, y, z, coordinates). Filtering can also be performed by inputting instructions to the LLM ("Does this file contain elevator contents?").

図12は、データ削減の他の態様について示す概念図である。図12(a)に示すように、一のファイルデータ1201において特定の箇所1202を切り取って、その中に目的のデータが含まれているかをチェックする。その結果、目的のデータが含まれていれば、その箇所を所望情報取得の取得処理に供する。含まれなかった場合には、先の箇所からずらした箇所1203を切り取って、同様にチェックを行う。このように取得する前のチェックで目的のデータを含まないものを取得の対象から除外することで処理効率の向上を図ることができる。なお、このチェックは、スクリプトの実行により行ってもよいし、LLMを用いて行ってもよいし、その他の手法によってもよい。また、このような処理は3次元空間上で実施してもよい。 Figure 12 is a conceptual diagram showing another aspect of data reduction. As shown in Figure 12 (a), a specific portion 1202 is cut out from one file data 1201, and it is checked whether the target data is included therein. If the target data is included as a result, that portion is used for the acquisition process to acquire the desired information. If the target data is not included, a portion 1203 shifted from the previous portion is cut out and checked in the same manner. In this way, by excluding from the acquisition target those that do not contain the target data in the check before acquisition, it is possible to improve processing efficiency. Note that this check may be performed by executing a script, using LLM, or by other methods. Also, such processing may be performed in a three-dimensional space.

また、図12(b)に示すように、特定の箇所をずらしながら上述のチェックを行い、目的のデータを含む箇所をメモリ1204に一時保管する。そして、処理メモリ1204が目的のデータを取得するために必要な要素をすべて含んでいるかチェックし、すべて含んでいる場合は、メモリに保持されている箇所を所望情報取得部での取得処理に供する。一方、すべて含んでいない場合には、特定の箇所をさらにずらして上述のチェックからの一連の処理を繰り返す。 As shown in FIG. 12(b), the above-mentioned check is performed while shifting the specific location, and the location containing the desired data is temporarily stored in memory 1204. Then, it is checked whether processing memory 1204 contains all the elements necessary to acquire the desired data, and if it does, the location held in the memory is provided for acquisition processing by the desired information acquisition unit. On the other hand, if it does not contain all the elements, the specific location is shifted further and the series of processes starting from the above-mentioned check are repeated.

<根拠表示部>
根拠表示部は、所望情報取得部により取得した取得結果について、その取得結果が取得された根拠を表示する機能を有する。
<Basis display section>
The reason display unit has a function of displaying the reason why the result obtained by the desired information obtaining unit was obtained.

本情報処理方法は、所望情報を指定するためのプロンプトを設定し、サンプルファイルデータとともにLLMに入力することで生成したスクリプトの実行により所望情報を取得するこができる。一方で、所望情報を得るのに最適なスクリプトを生成するためのプロンプトの設定が難しい場合も有る。そこで、取得結果に至った根拠(途中プロセスなど)を表示することで、ユーザに対して「何をどうすれば取得結果を改善できるか」ということを示すことができる。 This information processing method allows the user to set a prompt to specify the desired information, input it into the LLM along with sample file data, and execute the generated script to obtain the desired information. However, it can be difficult to set a prompt to generate an optimal script to obtain the desired information. Therefore, by displaying the reasons (intermediate processes, etc.) that led to the obtained results, the user can be shown "what can be done to improve the obtained results."

図13は、根拠として画像上の位置を表示する例を示す概念図である。図示しているのは、住宅の建築面積表を示すPDF形式のファイルであり、このファイルから取得された情報(文字)の位置を画像上で太点線の枠1301で囲んで強調表示している。これにより、ユーザは取得結果がどこから取得されたかが分かる。また、3次元モデルを処理するスクリプトなどでは、そのスクリプトの処理過程の表示や、その際に利用された情報の強調表示などをすることも根拠の確認に有用である。 Figure 13 is a conceptual diagram showing an example of displaying a position on an image as evidence. The figure shows a PDF file showing a building area table of a house, and the position of the information (text) obtained from this file is highlighted on the image by being surrounded by a thick dotted frame 1301. This allows the user to understand where the results were obtained from. Also, for scripts that process 3D models, displaying the process of the script and highlighting the information used at that time are useful for confirming the evidence.

また、取得した理由を説明する表示をしてもよい。例えば、事前処理として取得前にLLMに「この情報を取得結果として出力した理由を、詳細のプロセスごとに出力してください」という指示を入力しておく。すると、取得した後に取得結果を示すとともに、例えば「Z-01301は、”図面番号”というテキストの140px右に位置しており、また、指定された正規表現と合致するため、Z-01301を図面番号として抽出しました。」という根拠が表示される。このように、自ら設定したプロンプトと、それにより生成されたスクリプトが取得結果に及ぼす作用が示されることで、ユーザは種々の設定について省みることができ所望情報取得の最適化に資することができる。 It is also possible to display an explanation of the reason for the acquisition. For example, as a pre-processing step, an instruction such as "Please output the reason why this information was output as the acquisition result for each detailed process" can be input to the LLM before acquisition. Then, after acquisition, the acquisition result is displayed, and the reason is displayed, for example, "Z-01301 is located 140px to the right of the text "Drawing number" and matches the specified regular expression, so Z-01301 was extracted as the drawing number." In this way, the user can reflect on various settings by being shown the effect of the prompt that he or she set and the script generated by it on the acquisition result, which can contribute to optimizing the acquisition of desired information.

<実施例3>
<概要>
本実施例は、実施例1または実施例2の情報処理装置に準じる情報処理装置である。
Example 3
<Overview>
The present embodiment is an information processing apparatus similar to the information processing apparatus of the first or second embodiment.

<機能的構成>
図14は、本実施例の情報処理装置の機能的構成の一例を示すブロック図である。図14に示すように、情報処理装置1400は、スクリプト保持部1401と、保持スクリプト修正部1402と、第2所望情報取得部1403と、を有する。
<Functional configuration>
14 is a block diagram showing an example of the functional configuration of an information processing apparatus according to the present embodiment. As shown in FIG. 14, the information processing apparatus 1400 includes a script storage unit 1401, a stored script correction unit 1402, and a second desired information acquisition unit 1403.

<スクリプト保持部>
スクリプト保持部1401は、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持する機能を有する。実施例1においては、スクリプト生成部により生成したスクリプトがスクリプト修正部による修正の対象であったが、本実施例では、事前に作成・設定されたスクリプトがスクリプト保持部に保持されている。保持されているスクリプトの内容は、実施例1や実施例2におけるスクリプトと同様であるので、重ねての説明は省略する。
<Script storage section>
The script storage unit 1401 has a function of storing a script for acquiring desired information, which is information on a desired item, from a plurality of file data including a plurality of target items. In the first embodiment, the script generated by the script generation unit was the subject of modification by the script modification unit, but in this embodiment, a script created and set in advance is stored in the script storage unit. The contents of the stored script are the same as those in the first and second embodiments, so a repeated description will be omitted.

<保持スクリプト修正部>
保持スクリプト修正部1402は、前記保持しているスクリプトを、前記対象となるファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記保持しているスクリプトを前記対象となるファイルデータに適応するよう修正する機能を有する。
<Retention script modification part>
The retained script correction unit 1402 has a function of inputting part or all of the target file data into the trained language model, and correcting the retained script to adapt it to the target file data.

保持スクリプト修正部の機能は、修正の対象をスクリプト保持部が保持しているスクリプトとなることの他は、実施例1や実施例2におけるスクリプト修正部の機能と同じである。そのため、ここで重ねて説明することは省略する。The function of the stored script correction unit is the same as that of the script correction unit in the first and second embodiments, except that the scripts stored in the script storage unit are the targets of correction. Therefore, a redundant explanation will be omitted here.

また、保持しているスクリプトを修正するためのプロンプトをさらに学習済み言語モデルに入力してスクリプトの修正を行うように構成することもできる。このプロンプトは、どのように修正すべきかを指示するものであり、例えば、取得の対象として適応すべきファイル形式やフォーマットなどを指定したり、除去すべきデータを指定したりするといったものである。 It can also be configured to provide prompts to modify the stored scripts by inputting them into the trained language model. The prompts instruct the script on how to modify it, such as specifying the file type or format that should be applied to the acquisition target, or specifying data that should be removed.

<第2所望情報取得部>
第2所望情報取得部1403は、前記修正したスクリプトにより前記対象となる複数のファイルデータから前記所望情報を取得する機能を有する。第2所望情報取得部の機能は、所望情報の取得が保持スクリプト修正部により修正されたスクリプトであることの他は、実施例1や実施例2における所望情報取得部の機能と同じである。そのため、ここで重ねて説明することは省略する。
<Second desired information acquisition unit>
The second desired information acquisition unit 1403 has a function of acquiring the desired information from the target multiple file data by the modified script. Other than being a script modified by the modifying unit, the function of the desired information acquiring unit is the same as that of the desired information acquiring unit in the first and second embodiments, so a redundant description will be omitted here.

<ハードウエア構成>
本実施例の情報処理装置は、実施例1または実施例2に準じ図3に示したハードウエア構成により実現することができる。図14に示した実施例3の情報処理装置の保持スクリプト修正部1402と第2所望情報取得部1403の機能は、主に図3のCPU301、RAM302により実現される。また、スクリプト保持部1401の機能は、主に図3のストレージ303により実現される。
<Hardware configuration>
The information processing device of this embodiment can be realized by the hardware configuration shown in Fig. 3 according to the embodiment 1 or 2. The functions of the stored script correction unit 1402 and the second desired information acquisition unit 1403 of the information processing device of the embodiment 3 shown in Fig. 14 are mainly realized by the CPU 301 and the RAM 302 in Fig. 3. Also, the function of the script storage unit 1401 is mainly realized by the storage 303 in Fig. 3.

<処理の流れ>
図15は、本実施例の情報処理装置の処理の流れの一例を示すフロー図である。まず、対象となる複数の項目を含む複数のファイルデータから所望する項目に関する情報である所望情報を取得するためのスクリプトを保持する(S1501:スクリプト保持ステップ)。そして、保持しているスクリプトを、対象となるファイルデータの一部または全部を学習済み言語モデルに入力し、保持しているスクリプトを対象となるファイルデータに適応するよう修正する(S1502:保持スクリプト修正ステップ)。そして、修正したスクリプトにより対象となる複数のファイルデータから所望情報を取得する(S1503:変換ステップ)。
<Processing flow>
15 is a flow diagram showing an example of the process flow of the information processing device of this embodiment. First, a script for acquiring desired information, which is information on a desired item, from a plurality of file data including a plurality of target items is stored (S1501: script storage step). Then, a part or all of the target file data is input to a trained language model, and the stored script is modified to adapt to the target file data (S1502: stored script modification step). Then, the modified script is used to acquire the desired information from the plurality of target file data (S1503: conversion step).

<効果>
本実施例の情報処理装置によれば、事前に設定され保持されているスクリプトを修正可能にすることで、対象となるファイルデータに適応したスクリプトにより所望情報の取得を行うことができる。
<Effects>
According to the information processing apparatus of this embodiment, by making it possible to modify a script that has been set up and stored in advance, it is possible to obtain desired information using a script that is adapted to the target file data.

100、500:情報処理装置
101、501:プロンプト設定部
102、502:サンプル設定部
103、503:スクリプト生成部
104、504:スクリプト蓄積部
105、505:所望情報取得部
506:スクリプト評価部
507:スクリプト修正部
508:詳細プロンプト設定部
509:検証部
301:CPU
302:RAM
303:ストレージ
304:通信インタフェース
305:入出力インタフェース
1400:情報処理装置
1401:スクリプト保持部
1402:保持スクリプト修正部
1403:第2所望情報取得部

100, 500: Information processing device 101, 501: Prompt setting unit 102, 502: Sample setting unit 103, 503: Script generating unit 104, 504: Script storing unit 105, 505: Desired information acquiring unit 506: Script evaluating unit 507: Script correcting unit 508: Detailed prompt setting unit 509: Verification unit 301: CPU
302: RAM
303: Storage 304: Communication interface 305: Input/output interface 1400: Information processing device 1401: Script holding unit 1402: Hold script correction unit 1403: Second desired information acquisition unit

Claims (13)

所望する情報である所望情報を含むファイルデータから所望情報を指定するためのプロンプトを設定するプロンプト設定部と、
前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定部と、
前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、指定された所望情報を取得するためのスクリプトを生成するスクリプト生成部と、を有し、
前記スクリプト生成部は、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理装置。
a prompt setting unit for setting a prompt for designating desired information from file data including the desired information;
a sample setting unit that sets sample file data to be input to a trained language model together with the set prompt;
a script generation unit that inputs the set prompt and the set sample file data into the trained language model to generate a script for acquiring specified desired information;
The script generation unit is an information processing device that further inputs correct answer information that is correct answer information of the specified desired information for the sample file data to generate the script.
前記生成したスクリプトを蓄積するスクリプト蓄積部を、さらに有する請求項1に記載の情報処理装置。 The information processing device according to claim 1, further comprising a script storage unit that stores the generated script. 前記生成したスクリプトにより前記ファイルデータから前記指定した所望情報を取得する所望情報取得部を、さらに有する請求項1または2に記載の情報処理装置。 The information processing device according to claim 1 or 2, further comprising a desired information acquisition unit that acquires the specified desired information from the file data using the generated script. 前記生成したスクリプトにより前記サンプルファイルデータに対して前記指定した所望情報を取得した結果を前記正解情報と対比して評価するスクリプト評価部を、さらに有する請求項3に記載の情報処理装置。 The information processing device according to claim 3, further comprising a script evaluation unit that evaluates the result of obtaining the specified desired information from the sample file data using the generated script in comparison with the correct answer information. 前記スクリプト生成部は、前記スクリプト評価部による評価結果をさらに入力して前記スクリプトを生成する請求項4に記載の情報処理装置。 The information processing device according to claim 4, wherein the script generation unit further inputs the evaluation result by the script evaluation unit to generate the script. 前記生成したスクリプトと、前記ファイルデータの一部または全部を前記学習済み言語モデルに入力し、前記生成したスクリプトを前記ファイルデータに適応するよう修正するスクリプト修正部を、さらに有する請求項に記載の情報処理装置。 The information processing device according to claim 3 , further comprising a script correction unit that inputs the generated script and a part or all of the file data into the trained language model and corrects the generated script to adapt it to the file data. 前記スクリプト修正部は、さらに前記生成したスクリプトの元となるプロンプトを前記学習済み言語モデルに入力して修正する請求項6に記載の情報処理装置。 The information processing device according to claim 6, wherein the script correction unit further inputs a prompt that is the basis of the generated script into the trained language model to correct it. 前記スクリプト修正部は、前記スクリプト蓄積部が蓄積するスクリプトについても修正する請求項2を引用する請求項6または請求項2を引用する請求項7に記載の情報処理装置。 8. The information processing apparatus according to claim 6 , which refers to claim 2 , or claim 7 , which refers to claim 2, wherein the script correction unit also corrects the script stored in the script storage unit. 前記設定したプロンプトにより指定される所望情報を取得するための詳細なプロンプトである詳細プロンプトを設定する詳細プロンプト設定部を、さらに有する請求項1または2に記載の情報処理装置。 The information processing device according to claim 1 or 2, further comprising a detailed prompt setting unit that sets a detailed prompt, which is a detailed prompt for acquiring desired information specified by the set prompt. 前記所望情報取得部により取得した取得結果を検証する検証部を、さらに有する請求項に記載の情報処理装置。 The information processing apparatus according to claim 6 , further comprising a verification unit that verifies the acquisition result acquired by the desired information acquisition unit. 前記スクリプト修正部は、前記検証部による検証結果を反映させてスクリプトを修正する請求項10に記載の情報処理装置。 The information processing apparatus according to claim 10 , wherein the script correction unit corrects the script by reflecting a result of the verification by the verification unit. 情報処理装置が実行する情報処理方法であって、
所望する情報である所望情報を含むファイルデータから所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、
前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、
前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、指定された所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、を有し、
前記スクリプト生成ステップは、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理方法。
An information processing method executed by an information processing device,
a prompt setting step of setting a prompt for designating desired information from file data including the desired information;
a sample setting step of setting sample file data to be input to the trained language model together with the set prompt;
and a script generating step of inputting the set prompt and the set sample file data into the trained language model to generate a script for acquiring specified desired information,
The script generating step is an information processing method in which answer information that is an answer to the specified desired information for the sample file data is further input to generate the script.
所望する情報である所望情報を含むファイルデータから所望情報を指定するためのプロンプトを設定するプロンプト設定ステップと、
前記設定したプロンプトとともに学習済み言語モデルに入力されるサンプルファイルデータを設定するサンプル設定ステップと、
前記設定したプロンプトと前記設定したサンプルファイルデータを前記学習済み言語モデルに入力して、指定された所望情報を取得するためのスクリプトを生成するスクリプト生成ステップと、
を情報処理装置に実行させる情報処理プログラムであって、
前記スクリプト生成ステップは、前記サンプルファイルデータに対する前記指定した所望情報の正解の情報である正解情報をさらに入力して前記スクリプトを生成する情報処理プログラム。
a prompt setting step of setting a prompt for designating desired information from file data including the desired information;
a sample setting step of setting sample file data to be input to the trained language model together with the set prompt;
a script generation step of inputting the set prompt and the set sample file data into the trained language model to generate a script for acquiring specified desired information;
An information processing program for causing an information processing device to execute the
The script generating step is an information processing program that generates the script by further inputting correct answer information that is correct answer information of the specified desired information for the sample file data.
JP2024539757A 2024-04-11 2024-04-11 Information processing device, information processing method, and information processing program Active JP7551203B1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2024014619 2024-04-11

Publications (1)

Publication Number Publication Date
JP7551203B1 true JP7551203B1 (en) 2024-09-17

Family

ID=92753615

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024539757A Active JP7551203B1 (en) 2024-04-11 2024-04-11 Information processing device, information processing method, and information processing program

Country Status (2)

Country Link
JP (1) JP7551203B1 (en)
GB (1) GB202415090D0 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7737581B1 (en) * 2025-04-17 2025-09-10 株式会社Arent Design support equipment
JP7747915B1 (en) 2025-01-07 2025-10-01 ソフトバンクグループ株式会社 system

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Graham J,Advanced Data Analysis (ChatGPT Enterprise version) [online],help.openai.com,2023年12月09日,[検索日2024.06.13], retrieved from the Internet: <URL: https://web.archive.org/web/20231209112753/https://help.openai.com/ en/articles/8437071-advanced-dataanalysis-chatgpt-enterprise- version>
インターテックリサーチ株式会社,ChatGPT Advanced Data Analysis-その2(Webスクレーピング),インターテックリサーチブログ [online],2023年09月04日,[検索日2024.06.13], retrieved from the Internet: <URL: https://www.itrco.jp/wordpress/2023/09/chatgpt%e3%81%ab%e8%a8% 8a%e3%81%84%e3%81%a6%e3%81%bf%e3%81%9f%e3%83%bc%e3%81 %9d%e3%81%ae29%ef%bc%88%e7%b6%9aadvanced-data- analysis%ef%bc%89/>
福田 和宏,ChatGPTにオフィス文書作りを任せる AI時代の丸投げ仕事術,日経パソコン,2023年10月09日,第923号,pp.30-41

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7747915B1 (en) 2025-01-07 2025-10-01 ソフトバンクグループ株式会社 system
JP7737581B1 (en) * 2025-04-17 2025-09-10 株式会社Arent Design support equipment

Also Published As

Publication number Publication date
GB202415090D0 (en) 2024-11-27

Similar Documents

Publication Publication Date Title
US9430455B2 (en) Methods and systems for intelligent form-filling and electronic document generation
JP4588037B2 (en) Document consistency check support system and method, and program thereof
JP7551203B1 (en) Information processing device, information processing method, and information processing program
WO2019173342A1 (en) A language model, method and apparatus for interpreting zoning legal text
JPH0683598A (en) Job flow specification automatic creation method
JP7569130B1 (en) Information processing device, information processing method, and information processing program
JP3828379B2 (en) Test specification generation support apparatus, method, program, and recording medium
JPH0540616A (en) Program specification generation method
WO2013154055A1 (en) Structure analysis device and program
JP2002014845A (en) Method and apparatus for automatically generating test script components
JP3085383B2 (en) Document processing method
JP2007128520A (en) Method and system for generating manual
JP5322872B2 (en) Payroll formula creation system
CN115268907A (en) Method for generating software system control interaction logic by using json data
JP7468960B1 (en) Information processing device, information processing method, and information processing program
JP7736359B1 (en) Information processing device, information processing method, and information processing program
JP2001188673A (en) Software reuse support device
JPH06110733A (en) Program test case generator
US20240184985A1 (en) Information representation structure analysis device, and information representation structure analysis method
CN115203057B (en) Low code test automation method, device, equipment and storage medium
US20250306869A1 (en) Generating ai-based collaboration method and system
JP5683209B2 (en) Client computer with automatic document generation function
JP3988900B2 (en) Document processing apparatus and program storage medium thereof
JP2762934B2 (en) Test item design support system
CN120688486A (en) Text detection method, device, electronic device, computer-readable storage medium, and computer program product

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240701

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20240701

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240813

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240815

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240827

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240828

R150 Certificate of patent or registration of utility model

Ref document number: 7551203

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150