[go: up one dir, main page]

JP7694095B2 - 情報処理システム及び情報処理方法 - Google Patents

情報処理システム及び情報処理方法 Download PDF

Info

Publication number
JP7694095B2
JP7694095B2 JP2021052812A JP2021052812A JP7694095B2 JP 7694095 B2 JP7694095 B2 JP 7694095B2 JP 2021052812 A JP2021052812 A JP 2021052812A JP 2021052812 A JP2021052812 A JP 2021052812A JP 7694095 B2 JP7694095 B2 JP 7694095B2
Authority
JP
Japan
Prior art keywords
marker
character
image data
data
information processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021052812A
Other languages
English (en)
Other versions
JP2022150273A (ja
Inventor
康佑 ▲浜▼▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Document Solutions Inc
Original Assignee
Kyocera Document Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Document Solutions Inc filed Critical Kyocera Document Solutions Inc
Priority to JP2021052812A priority Critical patent/JP7694095B2/ja
Priority to US17/696,124 priority patent/US20220309812A1/en
Priority to CN202210294587.6A priority patent/CN115131790A/zh
Publication of JP2022150273A publication Critical patent/JP2022150273A/ja
Application granted granted Critical
Publication of JP7694095B2 publication Critical patent/JP7694095B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • G06V30/1448Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • G06T7/73Determining position or orientation of objects or cameras using feature-based methods
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30204Marker

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)

Description

本開示は、定型文書の画像データからオブジェクトを認識するのに用いられるテンプレートファイルを生成する情報処理装置、情報処理プログラム及び情報処理方法に関する。本開示は、この情報処理装置を有する情報処理システムに関する。
帳票やチェックシート等の定型文書の画像データから可変のオブジェクト(例えば、帳票なら金額を示す文字、チェックシートならチェックボックス内のチェックマーク)を抽出する方法として、テンプレートファイルを用いた光学文字認識(OCR:Optical Character Recognition)処理が知られている。
情報処理装置がこのテンプレートファイルを実行すると、指定された領域をOCR処理し、この領域に記入された可変のオブジェクト(例えば、帳票なら金額を示す文字、チェックシートならチェックボックス内のチェックマーク)を抽出する。このように、テンプレートファイルを用いたOCR処理は、定型文書から可変のオブジェクト(例えば、文字、チェックマーク)を抽出するのに有効である。
特開2007-141159号公報 特許第5604814号公報
テンプレートファイルを用いたOCR処理では、事前にユーザがマニュアルで指定した領域を含むテンプレートファイルを作成しておく。例えば、特許文献1は、OCR処理などの認識処理を行う領域の設定を自動的に行うが、ユーザが事前に用意した領域指定用文書データを入力する必要がある。特許文献2は、帳票フォームデータを作成する時点でオブジェクトごとに、OCR処理などの認識処理を適用するか否かを設定している。
テンプレートファイルを用いたOCR処理では、多数のチェック項目が記載されたチェックシート中の多数のチェックボックスに記入されたオブジェクト(チェックマーク)を抽出するケースもある。チェックシートは、チェック項目が増減される等、帳票と比べて頻繁に文書内容やレイアウトが変更されやすいと考えられる。この様な文書の場合、文書内容やレイアウトが変更される都度、ユーザがマニュアルでテンプレートファイルを作成するのは大きな手間になり得る。
以上のような事情に鑑み、本開示の目的は、定型文書の画像データからオブジェクトを認識するのに用いられるテンプレートファイルを、ユーザのマニュアル操作を必要とせずに生成することにある。
本開示の一形態に係る情報処理装置は、
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部と、
を具備する。
本実施形態によれば、情報処理装置は、画像データからマーカ及び文字データを抽出し、マーカ及び文字データの相対的な位置関係に基づき文字データをマーカの属性として設定し、マーカ位置、文字データ及び認識対象領域を含むテンプレートファイルを生成する。これにより、ユーザがマニュアルで認識対象領域を指定する必要なく、自動的に、画像データからテンプレートファイルを生成することができる。
前記テンプレートファイルは、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するのに用いられてもよい。
これにより、定型文書から可変のオブジェクトを自動的に抽出することができる。
前記マーカはチェックボックスであり、
前記認識対象領域は前記チェックボックスを含んでもよい。
テンプレートファイルを用いたOCR処理では、多数のチェック項目が記載されたチェックシート中の多数のチェックボックスに記入されたオブジェクト(チェックマーク)を抽出するケースもある。チェックシートは、チェック項目が増減される等、頻繁に文書内容やレイアウトが変更されやすいと考えられる。この様な文書の場合、文書内容やレイアウトが変更される都度、ユーザがマニュアルでテンプレートファイルを作成する必要が無く、自動的に、画像データからテンプレートファイルを生成することができる。
前記属性データ設定部は、
前記文字データの前記文字位置に対して所定の関係にあるマーカ位置を有するマーカが複数ある場合、前記複数のマーカのマーカ位置の関係に基づいて、前記文字データを属性として設定すべきマーカを決定してもよい。
文字位置に対して所定の相対位置関係にあるマーカ位置を有するマーカが複数あることが考えられる。例えば、1行目にマーカ、2行目に文字列、3行目にマーカ、4行目に文字列と並び、各行間が等間隔とする。この場合、2行目の文字列に対して、1行目のマーカ及び3行目のマーカが同じ位置関係にある。この場合、1行目のマーカのマーカ位置及び3行目のマーカのマーカ位置の関係に基づいて、2行目の文字列の文字データを属性として設定すべきマーカを決定する。例えば、先行する行にあるマーカ(1行目のマーカ)を、2行目の文字列の文字データを属性として設定すると決定することができる。
前記画像データは定型文書の画像データでもよい。
テンプレートファイルを用いて、定型文書から可変のオブジェクトを抽出することができる。
前記テンプレートファイルは、XMLで記述されてもよい。
本開示の一形態に係る情報処理システムは、
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部と、
を有する情報処理装置と、
前記テンプレートファイルを実行して、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するテンプレートファイル実行部を有するテンプレートファイル実行装置と、
を具備する。
本開示の一形態に係る情報処理プログラムは、
情報処理装置のプロセッサを、
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部
として動作させる。
本開示の一形態に係る情報処理方法は、
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断し、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断し、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定し、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する。
本開示によれば、定型文書の画像データからオブジェクトを認識するのに用いられるテンプレートファイルを、ユーザのマニュアル操作を必要とせずに生成することを図れる。
なお、ここに記載された効果は必ずしも限定されるものではなく、本開示中に記載されたいずれかの効果であってもよい。
本開示の一実施形態に係る情報処理システムを示す。 情報処理装置の構成を示す。 情報処理装置の動作フローを示す。 定型文書の画像データの一例を示す。 属性データ設定部の動作フローを示す。
以下、図面を参照しながら、本開示の実施形態を説明する。
1.情報処理システム
図1は、本開示の一実施形態に係る情報処理システムを示す。
情報処理システム10は、情報処理装置100、テンプレートファイル実行装置200、画像形成装置300及びファイルサーバ装置400を有する。情報処理装置100、テンプレートファイル実行装置200、画像形成装置300及びファイルサーバ装置400は、ネットワークNを介して送後に通信可能に接続される。ネットワークNは、インターネット、LAN(Local Area Network)等を含む。
情報処理装置100及びテンプレートファイル実行装置200は、CPUやGPU等のプロセッサがROMに記録された情報処理プログラムをRAMにロードして実行するコンピュータである。情報処理装置100は、テンプレートファイルを生成する。テンプレートファイル実行装置200は、情報処理装置100が生成したテンプレートファイルを実行する。
画像形成装置300は、例えば、MFP(Multifunction Peripheral)である。画像形成装置300は、帳票やチェックシート等の定型文書をスキャンして画像データを生成し、情報処理装置100に送信する。
ファイルサーバ装置400は、HDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量の不揮発性の記憶装置を有する。ファイルサーバ装置400は、帳票やチェックシート等の定型文書の画像データや、情報処理装置100が生成したテンプレートファイルを記憶する。
2.情報処理装置の構成
図2は、情報処理装置の構成を示す。
情報処理装置100は、CPUやGPU等のプロセッサがROMに記録された情報処理プログラムをRAMにロードして実行することにより、画像入力部101、マーカ抽出部102、文字データ抽出部104、属性データ設定部106及びテンプレート生成部107として動作する。マーカデータ格納部103及び文字データ格納部105は、記憶装置の格納領域に設定される。
3.情報処理装置の動作フロー
図3は、情報処理装置の動作フローを示す。
画像入力部101は、画像形成装置300が生成した画像データ又はファイルサーバ装置400が記憶する画像データを取得する(ステップS101)。画像データは、帳票やチェックシート等の定型文書の画像データである。画像データは、物理的な定型文書を光学的に読み取り生成したスキャンデータや、電子的な定型文書の印刷イメージを保存したPDFデータである。
図4は、定型文書の画像データの一例を示す。
定型文書の画像データの一例として、チェックシートの画像データ500を示す。チェックシートの画像データ500は、複数のチェックボックスB1,B2,B3と、複数の文字列T1,T2,T3を含む。
マーカ抽出部102は、画像データ500からマーカを抽出する(ステップS102)。マーカ抽出部102は、抽出対象となるマーカの画像を学習済みである。マーカは、オブジェクト認識の対象となる領域(認識対象領域)を設定するための基準である。本例で、マーカは、チェックボックスである。即ち、マーカ抽出部102は、画像データ500からマーカとして、複数のチェックボックスB1,B2,B3を抽出する。マーカ抽出部102は、マーカの位置(マーカ位置)を判断する。マーカ位置は、画像データ500の全体領域に対する座標で示される。即ち、マーカ抽出部102は、複数のチェックボックスB1,B2,B3それぞれの、画像データ500の全体領域に対する座標を、マーカ位置として判断する。マーカ抽出部102は、マーカデータ格納部103に、複数のチェックボックスB1,B2,B3それぞれのマーカ位置を格納する(ステップS103)。
文字データ抽出部104は、画像データ500からOCR処理により文字データを抽出する(ステップS104)。文字データ抽出部104は、画像データ500に含まれる全ての文字列をOCR処理して文字データを抽出する。本例では、文字データ抽出部104は、画像データ500から全ての文字データT1,T2,T3を抽出する。文字データ抽出部104は、タイトルや本文等、マーカ(チェックボックス)の付近以外の位置にある文字列も全て抽出する。文字データ抽出部104は、抽出した文字データの位置(文字位置)を判断する。文字位置は、画像データ500の全体領域に対する座標で示される。即ち、文字データ抽出部104は、複数の文字データT1,T2,T3それぞれの、画像データ500の全体領域に対する座標を、文字位置として判断する。文字データ抽出部104は、文字データ格納部105に、複数の文字データT1,T2,T3それぞれの文字位置と、OCR処理により抽出した文字データT1,T2,T3自体とを、互いに関連付けて格納する(ステップS105)。
属性データ設定部106は、マーカ位置と文字位置とが所定の相対位置関係にある文字データを、マーカの属性として設定する(ステップS106)。属性データ設定部106は、複数のマーカ1個ずつに対してそれぞれ属性を設定する。具体的な方法は以下の通りである。
図5は、属性データ設定部の動作フローを示す。
属性データ設定部106は、マーカ(チェックボックスB1,B2,B3)のマーカ位置(座標)を、マーカデータ格納部103から読み出す(ステップS201)。属性データ設定部106は、複数の文字データT1,T2,T3及びそれらの文字位置を、文字データ格納部105から読み出す(ステップS202)。属性データ設定部106は、複数のマーカ(チェックボックスB1,B2,B3)のマーカ位置に基づき、複数のマーカそれぞれについて、マーカ位置と文字位置とが所定の相対位置関係にある文字データを判断する(ステップS203)。図4の例の場合、例えば、属性データ設定部106は、チェックボックスB1について、マーカ位置に対して文字位置が最も近い関係にある文字データT1を判断する。
ところで、別の例(不図示)として、文字データの文字位置に対して所定の相対位置関係にあるマーカ位置を有するマーカが複数あることが考えられる。例えば、1行目にマーカ、2行目に文字列、3行目にマーカ、4行目に文字列と並び、各行間が等間隔とする。この場合、2行目の文字列に対して、1行目のマーカ及び3行目のマーカが同じ位置関係にある。この場合、属性データ設定部106は、複数のマーカのマーカ位置の関係に基づいて、文字データを属性として設定すべきマーカを決定する。即ち、属性データ設定部106は、1行目のマーカのマーカ位置及び3行目のマーカのマーカ位置の関係に基づいて、2行目の文字列の文字データを属性として設定すべきマーカを決定する。例えば、属性データ設定部106は、先行する行にあるマーカ(1行目のマーカ)を、2行目の文字列の文字データを属性として設定すると決定する。
属性データ設定部106は、全てのマーカ(チェックボックスB1,B2,B3)それぞれについて、マーカ位置と文字位置とが所定の相対位置関係にある文字データ(文字データT1,T2,T3)を判断する(ステップS204)。本例では、属性データ設定部106は、チェックボックスB1について文字データT1を判断し、チェックボックスB2について文字データT2を判断し、チェックボックスB3について文字データT3を判断する。属性データ設定部106は、文字位置が何れのマーカ位置とも所定関係に無い文字データは、何れのマーカの属性としても設定しない(ステップS205、no)。例えば、属性データ設定部106は、例えば、タイトルや本文等、マーカ(チェックボックス)の付近以外の位置にある文字データは、何れのマーカの属性としても設定しない。
属性データ設定部106は、判断した文字データをマーカの属性として設定する(ステップS206)。本例では、属性データ設定部106は、文字データT1をマーカB1の属性として設定し、文字データT2をマーカB2の属性として設定し、文字データT3をマーカB3の属性として設定する。
テンプレート生成部107は、マーカ位置に基づき、OCR処理によるオブジェクト認識の対象となる領域(認識対象領域)を設定する。具体的には、認識対象領域は、画像データ500の全体領域に対する座標で示される。認識対象領域とは、可変のオブジェクトが記入されるべき領域である。マーカがチェックボックスの場合、可変のオブジェクト(即ち、チェックマーク)が記入されるべき領域、即ち、チェックボックスを含む領域(即ち、チェックボックス内の領域)が、認識対象領域である。本例では、テンプレート生成部107は、チェックボックスB1のマーカ位置(座標)に基づき、認識対象領域としてチェックボックスB1を含む領域の座標を設定する。テンプレート生成部107は、チェックボックスB1のマーカ位置と、チェックボックスB1(マーカ)の属性として設定された文字データT1と、認識対象領域(チェックボックスB1内部)とを関連付ける。テンプレート生成部107は、チェックボックスB2のマーカ位置と、チェックボックスB2(マーカ)の属性として設定された文字データT2と、認識対象領域(チェックボックスB2内部)とを関連付ける。テンプレート生成部107は、チェックボックスB3のマーカ位置と、チェックボックスB3(マーカ)の属性として設定された文字データT3と、認識対象領域(チェックボックスB3内部)とを関連付ける。
テンプレート生成部107は、これらマーカ位置(座標)と、マーカの属性として設定された文字データと、認識対象領域(座標)とを含むテンプレートファイルを生成する(ステップS107)。テンプレートファイルは、例えば、XML(Extensible Markup Language)で記述される。テンプレート生成部107は、生成したテンプレートファイルをファイルサーバ装置400に格納する。テンプレートファイルは、チェックシートの画像データ500と同じレイアウトの別の画像データから、認識対象領域(チェックボックス内)に含まれる可変のオブジェクト(即ち、チェックマーク)をOCR処理により認識するのに用いられる。
その後、テンプレートファイル実行装置200は、ファイルサーバ装置400からテンプレートファイルを取得し、実行する。テンプレートファイル実行装置200は、テンプレートファイルを実行することにより、チェックシートの画像データ500と同じレイアウトの別の画像データから、認識対象領域(チェックボックス内)に含まれる可変のオブジェクト(即ち、チェックマーク)をOCR処理により認識する。
4.結語
定型文書の画像データから可変のオブジェクトを抽出する方法として、テンプレートファイルを用いたOCR処理が知られている。テンプレートファイルを用いたOCR処理では、事前にユーザがマニュアルで指定した領域を含むテンプレートファイルを作成しておく。
テンプレートファイルを用いたOCR処理では、多数のチェック項目が記載されたチェックシート中の多数のチェックボックスに記入されたオブジェクト(チェックマーク)を抽出するケースもある。チェックシートは、チェック項目が増減される等、帳票と比べて頻繁に文書内容やレイアウトが変更されやすいと考えられる。例えば、教育現場のようなチェックシートを頻繁に利用する現場では、その都度内容の異なるチェックシートを制作しているし、不動産情報の収集チェックシートでは、風呂の設備からアンテナや回線など、様々な物件に応じた大量のチェック項目をチェックする必要がある。この様な文書の場合、文書内容やレイアウトが変更される都度、ユーザがマニュアルでテンプレートファイルを作成するのは大きな手間になり得る。
これに対して、本実施形態によれば、情報処理装置100は、画像データからマーカ及び文字データを抽出し、マーカ及び文字データの相対的な位置関係に基づき文字データをマーカの属性として設定し、マーカ位置、文字データ及び認識対象領域を含むテンプレートファイルを生成する。これにより、ユーザがマニュアルで認識対象領域を指定する必要なく、自動的に、画像データからテンプレートファイルを生成することができる。
本技術の各実施形態及び各変形例について上に説明したが、本技術は上述の実施形態にのみ限定されるものではなく、本技術の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
10 情報処理システム
100 情報処理装置
101 画像入力部
102 マーカ抽出部
103 マーカデータ格納部
104 文字データ抽出部
105 文字データ格納部
106 属性データ設定部
107 テンプレート生成部
200 テンプレートファイル実行装置
300 画像形成装置
400 ファイルサーバ装置
500 画像データ

Claims (6)

  1. 定型文書の画像データである画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
    前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
    前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
    前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
    前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
    テンプレート生成部と、
    有する情報処理装置と、
    前記テンプレートファイルを実行して、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するテンプレートファイル実行部を有するテンプレートファイル実行装置と、
    を具備する情報処理システム。
  2. 請求項1に記載の情報処理システムであって
    前記テンプレートファイルは、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するのに用いられる
    情報処理システム。
  3. 請求項1又は2に記載の情報処理システムであって
    前記マーカはチェックボックスであり、
    前記認識対象領域は前記チェックボックスを含む
    情報処理システム。
  4. 請求項1乃至3の何れか一項に記載の情報処理システムであって
    前記属性データ設定部は、
    前記文字データの前記文字位置に対して所定の関係にあるマーカ位置を有するマーカが複数ある場合、前記複数のマーカのマーカ位置の関係に基づいて、前記文字データを属性として設定すべきマーカを決定する
    情報処理システム。
  5. 請求項1乃至の何れか一項に記載の情報処理システムであって
    前記テンプレートファイルは、XMLで記述される
    情報処理システム。
  6. 定型文書の画像データである画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断し、
    前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断し、
    前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定し、
    前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
    前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成し、
    テンプレートファイル実行装置が、前記テンプレートファイルを実行して、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識する
    情報処理方法。
JP2021052812A 2021-03-26 2021-03-26 情報処理システム及び情報処理方法 Active JP7694095B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2021052812A JP7694095B2 (ja) 2021-03-26 2021-03-26 情報処理システム及び情報処理方法
US17/696,124 US20220309812A1 (en) 2021-03-26 2022-03-16 Information processing apparatus, information processing system, computer-readable non-transitory recording medium storing information processing program, and information processing method
CN202210294587.6A CN115131790A (zh) 2021-03-26 2022-03-24 信息处理装置、信息处理系统、记录介质及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021052812A JP7694095B2 (ja) 2021-03-26 2021-03-26 情報処理システム及び情報処理方法

Publications (2)

Publication Number Publication Date
JP2022150273A JP2022150273A (ja) 2022-10-07
JP7694095B2 true JP7694095B2 (ja) 2025-06-18

Family

ID=83363938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021052812A Active JP7694095B2 (ja) 2021-03-26 2021-03-26 情報処理システム及び情報処理方法

Country Status (3)

Country Link
US (1) US20220309812A1 (ja)
JP (1) JP7694095B2 (ja)
CN (1) CN115131790A (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090074303A1 (en) 2007-09-14 2009-03-19 Irina Filimonova Method and System for Creating a Form Template for a Form
US10114800B1 (en) 2013-12-05 2018-10-30 Intuit Inc. Layout reconstruction using spatial and grammatical constraints
JP2021039429A (ja) 2019-08-30 2021-03-11 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7082436B1 (en) * 2000-01-05 2006-07-25 Nugenesis Technologies Corporation Storing and retrieving the visual form of data
US7916972B2 (en) * 2006-07-31 2011-03-29 Xerox Corporation Landmark-based form reading with declarative language
JP2008192032A (ja) * 2007-02-07 2008-08-21 Fuji Xerox Co Ltd 文書処理装置、文書処理方法、プログラム
US20130297353A1 (en) * 2008-01-18 2013-11-07 Mitek Systems Systems and methods for filing insurance claims using mobile imaging
US10685223B2 (en) * 2008-01-18 2020-06-16 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US9672510B2 (en) * 2008-01-18 2017-06-06 Mitek Systems, Inc. Systems and methods for automatic image capture and processing of documents on a mobile device
JP4623169B2 (ja) * 2008-08-28 2011-02-02 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5820142B2 (ja) * 2011-04-27 2015-11-24 キヤノン株式会社 情報処理装置およびその制御方法、並びにプログラム
US9977788B2 (en) * 2012-09-14 2018-05-22 Salesforce.Com, Inc. Methods and systems for managing files in an on-demand system
US9372916B2 (en) * 2012-12-14 2016-06-21 Athenahealth, Inc. Document template auto discovery
US20140215301A1 (en) * 2013-01-25 2014-07-31 Athenahealth, Inc. Document template auto discovery
US9256795B1 (en) * 2013-03-15 2016-02-09 A9.Com, Inc. Text entity recognition
US9213893B2 (en) * 2013-05-23 2015-12-15 Intuit Inc. Extracting data from semi-structured electronic documents
US9588661B1 (en) * 2014-05-21 2017-03-07 EMC IP Holding Company LLC Graphical user interface widget to select multiple items from a fixed domain
US10133813B2 (en) * 2015-08-12 2018-11-20 Adobe Systems Incorporated Form value prediction utilizing synonymous field recognition
US10235585B2 (en) * 2016-04-11 2019-03-19 The Nielsen Company (US) Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks
US10303938B2 (en) * 2016-12-29 2019-05-28 Factset Research Systems Inc Identifying a structure presented in portable document format (PDF)
US10599761B2 (en) * 2017-09-07 2020-03-24 Qualtrics, Llc Digitally converting physical document forms to electronic surveys
US10747794B2 (en) * 2018-01-08 2020-08-18 Microsoft Technology Licensing, Llc Smart search for annotations and inking
US10878195B2 (en) * 2018-05-03 2020-12-29 Microsoft Technology Licensing, Llc Automated extraction of unstructured tables and semantic information from arbitrary documents
US10643065B2 (en) * 2018-06-21 2020-05-05 Atlassian Pty Ltd Techniques for document creation based on image sections
JP7351159B2 (ja) * 2019-09-19 2023-09-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021157375A (ja) * 2020-03-26 2021-10-07 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11361532B1 (en) * 2020-04-30 2022-06-14 Idemia Identity & Security USA LLC System and method for OCR based object registration
CN111709339B (zh) * 2020-06-09 2023-09-19 北京百度网讯科技有限公司 一种票据图像识别方法、装置、设备及存储介质
US12374141B2 (en) * 2020-06-12 2025-07-29 Microsoft Technology Licensing, Llc Semantic representation of text in document

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090074303A1 (en) 2007-09-14 2009-03-19 Irina Filimonova Method and System for Creating a Form Template for a Form
US10114800B1 (en) 2013-12-05 2018-10-30 Intuit Inc. Layout reconstruction using spatial and grammatical constraints
JP2021039429A (ja) 2019-08-30 2021-03-11 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Also Published As

Publication number Publication date
US20220309812A1 (en) 2022-09-29
CN115131790A (zh) 2022-09-30
JP2022150273A (ja) 2022-10-07

Similar Documents

Publication Publication Date Title
CN105930159B (zh) 一种基于图像的界面代码生成的方法及系统
JP4926004B2 (ja) 文書処理装置、文書処理方法及び文書処理プログラム
US7992087B1 (en) Document mapped-object placement upon background change
JP5271667B2 (ja) メタデータ抽出装置およびその方法
US8325367B2 (en) System and method for a design with intent metadata
US20120102388A1 (en) Text segmentation of a document
JP2007080263A (ja) ページレイアウト属性に基づく文書クラスタリングの方法
JP2011065621A (ja) 情報処理装置及び情報処理プログラム
KR20120051419A (ko) 종속형 스타일 시트 규칙 추출 장치 및 방법
US20070234204A1 (en) Information processing apparatus and method
JP7290391B2 (ja) 情報処理装置及びプログラム
JP2011070558A (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US20150169510A1 (en) Method and system of extracting structured data from a document
JP6262708B2 (ja) 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP7694095B2 (ja) 情報処理システム及び情報処理方法
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP7272037B2 (ja) 情報処理装置及びプログラム
JP4934181B2 (ja) 付加画像処理システム、画像形成装置及び付加画像追加方法
JP4043431B2 (ja) スタンプ処理装置、プログラム、及び記録媒体
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
KR100955077B1 (ko) 전자문서 변환 시스템 및 방법
JP2013037419A (ja) 手書き情報反映システム、手書き情報反映方法、およびプログラム
JP7377565B2 (ja) 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム
JP2009223391A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20241121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250107

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250225

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20250225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250507

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250520

R150 Certificate of patent or registration of utility model

Ref document number: 7694095

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150