JP7694095B2 - 情報処理システム及び情報処理方法 - Google Patents
情報処理システム及び情報処理方法 Download PDFInfo
- Publication number
- JP7694095B2 JP7694095B2 JP2021052812A JP2021052812A JP7694095B2 JP 7694095 B2 JP7694095 B2 JP 7694095B2 JP 2021052812 A JP2021052812 A JP 2021052812A JP 2021052812 A JP2021052812 A JP 2021052812A JP 7694095 B2 JP7694095 B2 JP 7694095B2
- Authority
- JP
- Japan
- Prior art keywords
- marker
- character
- image data
- data
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/70—Determining position or orientation of objects or cameras
- G06T7/73—Determining position or orientation of objects or cameras using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30204—Marker
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
Description
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部と、
を具備する。
前記認識対象領域は前記チェックボックスを含んでもよい。
前記文字データの前記文字位置に対して所定の関係にあるマーカ位置を有するマーカが複数ある場合、前記複数のマーカのマーカ位置の関係に基づいて、前記文字データを属性として設定すべきマーカを決定してもよい。
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部と、
を有する情報処理装置と、
前記テンプレートファイルを実行して、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するテンプレートファイル実行部を有するテンプレートファイル実行装置と、
を具備する。
情報処理装置のプロセッサを、
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部
として動作させる。
画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断し、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断し、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定し、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する。
100 情報処理装置
101 画像入力部
102 マーカ抽出部
103 マーカデータ格納部
104 文字データ抽出部
105 文字データ格納部
106 属性データ設定部
107 テンプレート生成部
200 テンプレートファイル実行装置
300 画像形成装置
400 ファイルサーバ装置
500 画像データ
Claims (6)
- 定型文書の画像データである画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断するマーカ抽出部と、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断する文字データ抽出部と、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定する属性データ設定部と、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成する
テンプレート生成部と、
を有する情報処理装置と、
前記テンプレートファイルを実行して、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するテンプレートファイル実行部を有するテンプレートファイル実行装置と、
を具備する情報処理システム。 - 請求項1に記載の情報処理システムであって、
前記テンプレートファイルは、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識するのに用いられる
情報処理システム。 - 請求項1又は2に記載の情報処理システムであって、
前記マーカはチェックボックスであり、
前記認識対象領域は前記チェックボックスを含む
情報処理システム。 - 請求項1乃至3の何れか一項に記載の情報処理システムであって、
前記属性データ設定部は、
前記文字データの前記文字位置に対して所定の関係にあるマーカ位置を有するマーカが複数ある場合、前記複数のマーカのマーカ位置の関係に基づいて、前記文字データを属性として設定すべきマーカを決定する
情報処理システム。 - 請求項1乃至4の何れか一項に記載の情報処理システムであって、
前記テンプレートファイルは、XMLで記述される
情報処理システム。 - 定型文書の画像データである画像データからマーカを抽出し、前記マーカの位置を示すマーカ位置を判断し、
前記画像データから文字データを抽出し、前記文字データの位置を示す文字位置を判断し、
前記マーカ位置と前記文字位置とが所定の関係にある文字データを、前記マーカの属性として設定し、
前記マーカ位置に基づきオブジェクト認識の対象となる領域である認識対象領域を設定し、
前記マーカ位置と、前記マーカの属性として設定された前記文字データと、前記認識対象領域とを含むテンプレートファイルを生成し、
テンプレートファイル実行装置が、前記テンプレートファイルを実行して、前記画像データと同じレイアウトの別の画像データから前記認識対象領域に含まれるオブジェクトを認識する
情報処理方法。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021052812A JP7694095B2 (ja) | 2021-03-26 | 2021-03-26 | 情報処理システム及び情報処理方法 |
| US17/696,124 US20220309812A1 (en) | 2021-03-26 | 2022-03-16 | Information processing apparatus, information processing system, computer-readable non-transitory recording medium storing information processing program, and information processing method |
| CN202210294587.6A CN115131790A (zh) | 2021-03-26 | 2022-03-24 | 信息处理装置、信息处理系统、记录介质及信息处理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021052812A JP7694095B2 (ja) | 2021-03-26 | 2021-03-26 | 情報処理システム及び情報処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2022150273A JP2022150273A (ja) | 2022-10-07 |
| JP7694095B2 true JP7694095B2 (ja) | 2025-06-18 |
Family
ID=83363938
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021052812A Active JP7694095B2 (ja) | 2021-03-26 | 2021-03-26 | 情報処理システム及び情報処理方法 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20220309812A1 (ja) |
| JP (1) | JP7694095B2 (ja) |
| CN (1) | CN115131790A (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20090074303A1 (en) | 2007-09-14 | 2009-03-19 | Irina Filimonova | Method and System for Creating a Form Template for a Form |
| US10114800B1 (en) | 2013-12-05 | 2018-10-30 | Intuit Inc. | Layout reconstruction using spatial and grammatical constraints |
| JP2021039429A (ja) | 2019-08-30 | 2021-03-11 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Family Cites Families (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7082436B1 (en) * | 2000-01-05 | 2006-07-25 | Nugenesis Technologies Corporation | Storing and retrieving the visual form of data |
| US7916972B2 (en) * | 2006-07-31 | 2011-03-29 | Xerox Corporation | Landmark-based form reading with declarative language |
| JP2008192032A (ja) * | 2007-02-07 | 2008-08-21 | Fuji Xerox Co Ltd | 文書処理装置、文書処理方法、プログラム |
| US20130297353A1 (en) * | 2008-01-18 | 2013-11-07 | Mitek Systems | Systems and methods for filing insurance claims using mobile imaging |
| US10685223B2 (en) * | 2008-01-18 | 2020-06-16 | Mitek Systems, Inc. | Systems and methods for mobile image capture and content processing of driver's licenses |
| US9672510B2 (en) * | 2008-01-18 | 2017-06-06 | Mitek Systems, Inc. | Systems and methods for automatic image capture and processing of documents on a mobile device |
| JP4623169B2 (ja) * | 2008-08-28 | 2011-02-02 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
| JP5820142B2 (ja) * | 2011-04-27 | 2015-11-24 | キヤノン株式会社 | 情報処理装置およびその制御方法、並びにプログラム |
| US9977788B2 (en) * | 2012-09-14 | 2018-05-22 | Salesforce.Com, Inc. | Methods and systems for managing files in an on-demand system |
| US9372916B2 (en) * | 2012-12-14 | 2016-06-21 | Athenahealth, Inc. | Document template auto discovery |
| US20140215301A1 (en) * | 2013-01-25 | 2014-07-31 | Athenahealth, Inc. | Document template auto discovery |
| US9256795B1 (en) * | 2013-03-15 | 2016-02-09 | A9.Com, Inc. | Text entity recognition |
| US9213893B2 (en) * | 2013-05-23 | 2015-12-15 | Intuit Inc. | Extracting data from semi-structured electronic documents |
| US9588661B1 (en) * | 2014-05-21 | 2017-03-07 | EMC IP Holding Company LLC | Graphical user interface widget to select multiple items from a fixed domain |
| US10133813B2 (en) * | 2015-08-12 | 2018-11-20 | Adobe Systems Incorporated | Form value prediction utilizing synonymous field recognition |
| US10235585B2 (en) * | 2016-04-11 | 2019-03-19 | The Nielsen Company (US) | Methods and apparatus to determine the dimensions of a region of interest of a target object from an image using target object landmarks |
| US10303938B2 (en) * | 2016-12-29 | 2019-05-28 | Factset Research Systems Inc | Identifying a structure presented in portable document format (PDF) |
| US10599761B2 (en) * | 2017-09-07 | 2020-03-24 | Qualtrics, Llc | Digitally converting physical document forms to electronic surveys |
| US10747794B2 (en) * | 2018-01-08 | 2020-08-18 | Microsoft Technology Licensing, Llc | Smart search for annotations and inking |
| US10878195B2 (en) * | 2018-05-03 | 2020-12-29 | Microsoft Technology Licensing, Llc | Automated extraction of unstructured tables and semantic information from arbitrary documents |
| US10643065B2 (en) * | 2018-06-21 | 2020-05-05 | Atlassian Pty Ltd | Techniques for document creation based on image sections |
| JP7351159B2 (ja) * | 2019-09-19 | 2023-09-27 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
| JP2021157375A (ja) * | 2020-03-26 | 2021-10-07 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
| US11361532B1 (en) * | 2020-04-30 | 2022-06-14 | Idemia Identity & Security USA LLC | System and method for OCR based object registration |
| CN111709339B (zh) * | 2020-06-09 | 2023-09-19 | 北京百度网讯科技有限公司 | 一种票据图像识别方法、装置、设备及存储介质 |
| US12374141B2 (en) * | 2020-06-12 | 2025-07-29 | Microsoft Technology Licensing, Llc | Semantic representation of text in document |
-
2021
- 2021-03-26 JP JP2021052812A patent/JP7694095B2/ja active Active
-
2022
- 2022-03-16 US US17/696,124 patent/US20220309812A1/en not_active Abandoned
- 2022-03-24 CN CN202210294587.6A patent/CN115131790A/zh not_active Withdrawn
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20090074303A1 (en) | 2007-09-14 | 2009-03-19 | Irina Filimonova | Method and System for Creating a Form Template for a Form |
| US10114800B1 (en) | 2013-12-05 | 2018-10-30 | Intuit Inc. | Layout reconstruction using spatial and grammatical constraints |
| JP2021039429A (ja) | 2019-08-30 | 2021-03-11 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| US20220309812A1 (en) | 2022-09-29 |
| CN115131790A (zh) | 2022-09-30 |
| JP2022150273A (ja) | 2022-10-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN105930159B (zh) | 一种基于图像的界面代码生成的方法及系统 | |
| JP4926004B2 (ja) | 文書処理装置、文書処理方法及び文書処理プログラム | |
| US7992087B1 (en) | Document mapped-object placement upon background change | |
| JP5271667B2 (ja) | メタデータ抽出装置およびその方法 | |
| US8325367B2 (en) | System and method for a design with intent metadata | |
| US20120102388A1 (en) | Text segmentation of a document | |
| JP2007080263A (ja) | ページレイアウト属性に基づく文書クラスタリングの方法 | |
| JP2011065621A (ja) | 情報処理装置及び情報処理プログラム | |
| KR20120051419A (ko) | 종속형 스타일 시트 규칙 추출 장치 및 방법 | |
| US20070234204A1 (en) | Information processing apparatus and method | |
| JP7290391B2 (ja) | 情報処理装置及びプログラム | |
| JP2011070558A (ja) | 文書画像処理装置、文書画像処理方法および文書画像処理プログラム | |
| US20150169510A1 (en) | Method and system of extracting structured data from a document | |
| JP6262708B2 (ja) | 深い検索性を有するオブジェクト化及びハードコピーからオリジナルの電子ファイルを検出するドキュメント検出方法 | |
| JP2006025129A (ja) | 画像処理システム及び画像処理方法 | |
| JP7694095B2 (ja) | 情報処理システム及び情報処理方法 | |
| JP4179977B2 (ja) | スタンプ処理装置、電子承認システム、プログラム、及び記録媒体 | |
| JP7272037B2 (ja) | 情報処理装置及びプログラム | |
| JP4934181B2 (ja) | 付加画像処理システム、画像形成装置及び付加画像追加方法 | |
| JP4043431B2 (ja) | スタンプ処理装置、プログラム、及び記録媒体 | |
| JP6303742B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
| KR100955077B1 (ko) | 전자문서 변환 시스템 및 방법 | |
| JP2013037419A (ja) | 手書き情報反映システム、手書き情報反映方法、およびプログラム | |
| JP7377565B2 (ja) | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム | |
| JP2009223391A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240226 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241121 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250107 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250225 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20250225 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250507 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250520 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7694095 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |