[go: up one dir, main page]

JP2001312691A - Image processing method and apparatus, and storage medium - Google Patents

Image processing method and apparatus, and storage medium

Info

Publication number
JP2001312691A
JP2001312691A JP2000132734A JP2000132734A JP2001312691A JP 2001312691 A JP2001312691 A JP 2001312691A JP 2000132734 A JP2000132734 A JP 2000132734A JP 2000132734 A JP2000132734 A JP 2000132734A JP 2001312691 A JP2001312691 A JP 2001312691A
Authority
JP
Japan
Prior art keywords
cell
character
image processing
image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000132734A
Other languages
Japanese (ja)
Other versions
JP4143245B2 (en
Inventor
Hiroaki Ikeda
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000132734A priority Critical patent/JP4143245B2/en
Publication of JP2001312691A publication Critical patent/JP2001312691A/en
Application granted granted Critical
Publication of JP4143245B2 publication Critical patent/JP4143245B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】テンプレートが存在しなくても、帳票上の特定
の領域を自動的に取り出すことが可能な画像処理装置お
よび画像処理方法を提供する。 【解決手段】原稿画像を読み込み、原稿上の罫線で囲ま
れた領域をセル領域として抽出し(S201、S20
2)、抽出したセル領域内においてタグ文字領域を抽出
し(S204)、その領域にあるタグ文字の認識を行う
(S204)。そして、認識されたタグ文字でキーワー
ド検索を行い、該当するタグ文字列を有するセル領域を
抽出する(S206)。そして、抽出されたセル領域の
画像情報が保存される(S207)。
(57) [Problem] To provide an image processing apparatus and an image processing method capable of automatically extracting a specific area on a form even if a template does not exist. A document image is read, and an area surrounded by ruled lines on the document is extracted as a cell area (S201, S20).
2) A tag character area is extracted from the extracted cell area (S204), and tag characters in the area are recognized (S204). Then, a keyword search is performed using the recognized tag character, and a cell region having the corresponding tag character string is extracted (S206). Then, the image information of the extracted cell area is stored (S207).

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、テンプレートを用
いることなく、帳票内の特定の領域を取り出すことが可
能な画像処理装置および画像処理方法、およびコンピュ
ータが読み出し可能なプログラムを格納した記憶媒体に
関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an image processing apparatus and an image processing method capable of extracting a specific area in a form without using a template, and a storage medium storing a computer-readable program. Things.

【0002】[0002]

【従来の技術】従来、例えば帳票上の特定の領域に存在
する情報を取り出す場合、あらかじめその領域の位置や
大きさなどの情報を持つテンプレートを用意し、イメー
ジスキャナなど光電変換装置で読み取られた画像にテン
プレートを当てはめ、領域内の画像を取り出す方法およ
び装置が知られている。
2. Description of the Related Art Conventionally, for example, when extracting information existing in a specific area on a form, a template having information such as the position and size of the area is prepared in advance and read by a photoelectric conversion device such as an image scanner. Methods and apparatuses for applying a template to an image and extracting the image within the region are known.

【0003】例えば、登録されている印影と照合するた
めに帳票上の印影を取り出す場合、まず、その帳票に対
応するテンプレート情報を取り出し、テンプレートに格
納された印影領域の位置・大きさ情報を用いて、帳票画
像の印影領域を特定することで印影の画像を得ることが
できる。
For example, when an imprint on a form is taken out for comparison with a registered imprint, first, template information corresponding to the form is taken out, and the position / size information of the imprint area stored in the template is used. By specifying the imprint area of the form image, an imprint image can be obtained.

【0004】この場合、帳票に対応するテンプレートを
選択するため、帳票上のあらかじめ定められた位置に記
録されている帳票IDを最初に読み込み、その結果を用
いてテンプレートを特定するように構成されている。帳
票IDとは、帳票の種類を特定する個別に定められた番
号であり、帳票IDには、文字やマーク、バーコードな
どが用いられる。
In this case, in order to select a template corresponding to a form, a form ID recorded at a predetermined position on the form is first read, and the template is specified using the result. I have. The form ID is an individually determined number that specifies the type of form, and characters, marks, bar codes, and the like are used as the form ID.

【0005】また、入力した帳票画像を通信により遠隔
地へ送り、送り先の装置で画像を表示しながら入力作業
を行う場合、通信量を減らすため、帳票画像全体ではな
く、必要な領域のみを取り出して画像データを送るよう
に構成されているものもある。しかし、この場合でも上
記公知の技術と同様に、テンプレートを用いて送信すべ
き領域を特定している。
When the input form image is sent to a remote place by communication and the input operation is performed while displaying the image on the destination device, only the necessary area is taken out instead of the entire form image in order to reduce the communication amount. Some are configured to transmit image data. However, in this case as well, the area to be transmitted is specified using a template, as in the above-described known technique.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上述の
従来の技術では、テンプレートが既に存在する帳票しか
読み込ませることができず、新規の帳票が入力された場
合は、手動で領域を指定するか、新たにテンプレートを
作成しなければならないという問題があった。
However, according to the above-mentioned conventional technology, only a form in which a template already exists can be read, and when a new form is input, an area must be manually designated or There was a problem that a new template had to be created.

【0007】本発明は上記の問題点を解消するためにな
されたもので、テンプレートが存在しなくても、帳票上
の特定の領域を自動的に取り出すことを可能にすること
を目的とする。
SUMMARY OF THE INVENTION The present invention has been made to solve the above-described problem, and has as its object to enable a specific area on a form to be automatically extracted even if no template exists.

【0008】[0008]

【課題を解決するための手段】上記の目的を達成するた
めの本発明の一態様による画像処理装置は例えば以下の
構成を備える。すなわち、原稿上の所定の線図で囲まれ
た領域をセル領域として抽出するセル領域抽出手段と、
前記セル領域内の文字画像を抽出する文字画像抽出手段
と、前記抽出された文字画像について文字認識する文字
認識手段と、前記文字認識手段による文字認識結果から
指定キーワードに対応する文字列を検索する検索手段
と、前記検索手段によって検索された文字列を含むセル
領域に基づいて指定されたセルを決定する決定手段とを
備える。
An image processing apparatus according to an embodiment of the present invention for achieving the above object has, for example, the following arrangement. That is, a cell region extracting means for extracting a region surrounded by a predetermined diagram on the document as a cell region,
A character image extracting means for extracting a character image in the cell area; a character recognizing means for recognizing a character in the extracted character image; and a character string corresponding to a designated keyword from a character recognition result by the character recognizing means. A search unit; and a determination unit that determines a designated cell based on a cell area including the character string searched by the search unit.

【0009】また、上記の目的を達成するための本発明
の一態様による画像処理方法は例えば以下の構成を備え
る。すなわち、原稿上の所定の線図で囲まれた領域をセ
ル領域として抽出するセル領域抽出工程と、前記セル領
域内の文字画像を抽出する文字画像抽出工程と、前記抽
出された文字画像について文字認識する文字認識工程
と、前記文字認識工程による文字認識結果から指定キー
ワードに対応する文字列を検索する検索工程と、前記検
索工程によって検索された文字列を含むセル領域に基づ
いて指定されたセルを決定する決定工程とを備える。
Further, an image processing method according to an aspect of the present invention for achieving the above object has, for example, the following configuration. That is, a cell region extracting step of extracting a region surrounded by a predetermined diagram on the document as a cell region, a character image extracting step of extracting a character image in the cell region, A character recognition step of recognizing, a search step of searching for a character string corresponding to a specified keyword from the character recognition result of the character recognition step, and a cell designated based on a cell area including the character string searched by the search step And a determining step of determining

【0010】[0010]

【発明の実施の形態】以下、添付の図面を参照して本発
明の好適な実施形態を説明する。
Preferred embodiments of the present invention will be described below with reference to the accompanying drawings.

【0011】[第1の実施の形態]図1は、本発明の第
1の実施の形態に係る画像処理装置の構成を示すブロッ
ク図である。101はCPUで、ROM102に格納さ
れている制御プログラムに従って本装置全体の制御を行
う。103はRAMで、CPU101の主記憶として機
能する。104は磁気ディスク等の外部記憶装置であ
り、テキストファイルやイメージファイルなどのファイ
ルが記憶される。また、105はディスプレイ、106
はキーボード、107はマウス等のポインティングデバ
イスである。108はイメージスキャナなどの光電変換
装置であり、この装置により帳票が読み取られ、RAM
103または外部記憶装置104に記憶される。109
はネットワークインタフェースで、不図示のネットワー
クを介して他の外部記憶装置にファイルの読み書きをす
ることも可能である。なお、汎用コンピュータなどで本
発明を実施する場合は、本発明に係る処理をプログラム
コード化し、このプログラムを、コンピュータ読み出し
可能な記録媒体により供給し、前記の汎用コンピュータ
などのCPU101で実施されるように構成される。
[First Embodiment] FIG. 1 is a block diagram showing a configuration of an image processing apparatus according to a first embodiment of the present invention. A CPU 101 controls the entire apparatus according to a control program stored in a ROM 102. A RAM 103 functions as a main memory of the CPU 101. Reference numeral 104 denotes an external storage device such as a magnetic disk, which stores files such as text files and image files. 105 is a display, 106
Is a keyboard, and 107 is a pointing device such as a mouse. Reference numeral 108 denotes a photoelectric conversion device such as an image scanner, which reads a form by using the
103 or the external storage device 104. 109
Is a network interface, which can read and write files from and to another external storage device via a network (not shown). When the present invention is implemented by a general-purpose computer or the like, the processing according to the present invention is converted into a program code, the program is supplied by a computer-readable recording medium, and is executed by the CPU 101 of the general-purpose computer or the like. It is composed of

【0012】図4は、本発明を実施する装置の処理対象
となる帳票401の一例を示す図である。帳票は通常、
罫線でフィールドが分割されていて、その中に記述する
内容を示すタグ文字、例えば、住所、氏名などが書かれ
ている。図4では、402は住所フィールド、403は
電話番号フィールド、404は氏名のふりがなフィール
ド、405は氏名フィールド、406は印鑑フィールド
であり、それぞれタグ文字として「住所」、「電話番
号」、「フリガナ」、「氏名」、「印鑑」を有する。そ
して、例えば記入者は、それぞれのフィールドに必要事
項を記入し、印鑑フィールド406に押印する。
FIG. 4 is a diagram showing an example of a form 401 to be processed by the apparatus embodying the present invention. Reports are usually
The field is divided by ruled lines, and tag characters indicating contents to be described therein, such as an address and a name, are written therein. In FIG. 4, reference numeral 402 denotes an address field, 403 denotes a telephone number field, 404 denotes a name field, 405 denotes a name field, and 406 denotes a seal field. , "Name" and "seal". Then, for example, the entry person fills in the necessary items in the respective fields, and seals the seal field 406.

【0013】本実施の形態に係る処理の概略を図2のフ
ローチャートを用いて説明する。
The outline of the processing according to the present embodiment will be described with reference to the flowchart of FIG.

【0014】ステップS201では、光電変換装置10
8、あるいは、外部記憶装置104に記憶されたファイ
ルから対象となる帳票画像を読み込む。
In step S201, the photoelectric conversion device 10
8, or reads a target form image from a file stored in the external storage device 104.

【0015】ステップS202では、読み込まれた画像
からセルを抽出する。ここでのセルとは、罫線で囲まれ
た矩形領域のこととする。ステップS203では、抽出
されたセルに対し、その中に含まれるタグ文字領域(ま
たは、タグ文字画像)を抽出する。セルの抽出は、画素
の連続性から罫線を抽出し、この罫線の形状や結合状態
を基に行う。文字領域(または、文字画像)は、近隣画
素との結合状態から抽出する。なお、具体的なセルの抽
出あるいは文字領域(または、文字画像)の抽出につい
ては、例えば、特開平10−83431公報に記載の方
法などを用いることで実現可能である。タグ文字は、記
入文字に比べ小さく、セルの領域内の左上にあるなどの
大きさや位置情報を用いることで、タグ文字と記入文字
を区別することが可能である。
In step S202, cells are extracted from the read image. The cell here is a rectangular area surrounded by ruled lines. In step S203, a tag character area (or tag character image) included in the extracted cell is extracted. The cell is extracted by extracting a ruled line from the continuity of pixels, and based on the shape and the connection state of the ruled line. The character area (or character image) is extracted from the state of connection with neighboring pixels. Note that specific cell extraction or character area (or character image) extraction can be realized by using, for example, a method described in Japanese Patent Application Laid-Open No. H10-83431. The tag character is smaller than the entry character, and it is possible to distinguish the tag character from the entry character by using size and position information such as being at the upper left in the cell area.

【0016】タグ文字の抽出ができたら、ステップS2
04では、タグ文字の文字認識を行う。認識終了後、ス
テップS205では、事前に決定しているキーワードを
用いて文字認識されたタグ文字の中からキーワードで指
定されるものを検索する。キーワードは、抽出する領域
を特定するためのもので、例えば、印影部分を抽出した
い場合は、”印鑑”などをキーワードとする。ここ
で、”印鑑”と“ご捺印”や、”住所”と”おところ”
など、同一対象の異なる表現は同一視し、それら複数の
文字列で検索するように構成しておく。例えば、”印
鑑”というキーワードが指定されると、セル406のタ
グ文字は、”印鑑”、“ご捺印”などの実質上同義の文
字で検索される。
If the tag characters can be extracted, step S2
In step 04, tag character recognition is performed. After the recognition is completed, in step S205, a tag character specified by the keyword is searched for from the tag characters that have been character-recognized using the keyword determined in advance. The keyword is used to specify an area to be extracted. For example, when it is desired to extract an imprint portion, “seal” or the like is used as the keyword. Where "seal" and "seal" or "address" and "place"
For example, different expressions of the same object are regarded as the same, and a search is performed using the plurality of character strings. For example, when the keyword “seal” is designated, the tag character of the cell 406 is searched for a substantially synonymous character such as “seal” or “seal”.

【0017】ステップS206では、この検索されたキ
ーワードを含むセルを特定し、そのセルを抽出する。更
に、ステップS207では、抽出された領域内の画像を
外部記憶装置104に保存する。なお、抽出された画像
が文字画像の場合は、ステップS207で文字認識を行
って、文字コード列にした後、外部記憶装置104に保
存するようにしてもよい。
In step S206, a cell containing the searched keyword is specified, and the cell is extracted. Further, in step S207, the image in the extracted area is stored in the external storage device 104. If the extracted image is a character image, character recognition may be performed in step S207 to form a character code string, and then the character code string may be stored in the external storage device 104.

【0018】以上説明したように、本実施の形態によれ
ば、罫線で囲まれた形式の帳票から、特定のタグ文字を
含むセルを特定することができ、複数の表現がある同一
の意味を持つ情報に対しても、正しく読み取りができる
効果がある。
As described above, according to the present embodiment, a cell including a specific tag character can be specified from a form enclosed by ruled lines, and a plurality of expressions have the same meaning. This has the effect of correctly reading the information held.

【0019】なお、本実施の形態および以下に示す第2
の実施の形態に係る装置は、ネットワークインタフェー
ス109を介し、通信手段を用いて遠隔地にある記憶装
置等にあるイメージファイルやプログラムを使用するも
のでも良い。また、文字認識の処理または手段は、認識
精度を向上するための処理または手段を含むものであっ
ても良い。
It should be noted that the present embodiment and the second
The apparatus according to the embodiment may use an image file or a program in a remote storage device or the like using a communication unit via the network interface 109. The character recognition processing or means may include processing or means for improving recognition accuracy.

【0020】以上説明したように、第1の実施形態によ
れば、フィールドを特定する文字(タグ)を認識し、そ
の認識結果を検索することにより所望のセルを抽出でき
る。このため、テンプレートがあらかじめ用意されてい
なくても、帳票上の特定の領域を自動的に取り出すこと
が可能となる効果がある。
As described above, according to the first embodiment, a desired cell can be extracted by recognizing a character (tag) for specifying a field and searching the recognition result. For this reason, even if a template is not prepared in advance, there is an effect that a specific area on a form can be automatically extracted.

【0021】また、本実施形態によれば、テンプレート
を特定する必要性がなくなり、帳票のフォーマットの制
限を無くすことができる効果がある。
Further, according to the present embodiment, there is no need to specify a template, and there is an effect that restrictions on the format of a form can be eliminated.

【0022】更に、本実施形態によれば、帳票全体を扱
うことなく、必要な一部分だけの画像を扱うことになる
ため、これを保存する場合は保存領域が少なくてすみ、
送信する場合は、送信量が少なくてすむ効果がある。
Further, according to the present embodiment, since only a required part of the image is handled without handling the entire form, when saving the image, the saving area is small,
When transmitting, there is an effect that the amount of transmission is small.

【0023】[第2の実施の形態]本発明の第2の実施
の形態について説明する。本実施の形態に係る画像処理
装置の構成は、図1に示す上記第1の実施の形態にかか
る装置の構成と同じであることから、この画像処理装置
の構成についての説明は省略する。
[Second Embodiment] A second embodiment of the present invention will be described. Since the configuration of the image processing apparatus according to the present embodiment is the same as the configuration of the apparatus according to the first embodiment shown in FIG. 1, the description of the configuration of the image processing apparatus is omitted.

【0024】図5は、本実施の形態に係る装置の処理対
象となる帳票501の一例を示す図である。図5の帳票
では、502は住所タグ、503は住所フィールド、5
04は電話番号タグ、505は電話番号フィールド、5
06は氏名タグ、507は氏名フィールド、508は印
鑑タグ、509は印鑑フィールドというように、タグ文
字がそれぞれセルになっていて、文字記入するフィール
ドとは別のセルになっている。
FIG. 5 is a diagram showing an example of a form 501 to be processed by the apparatus according to the present embodiment. In the form of FIG. 5, 502 is an address tag, 503 is an address field,
04 is a telephone number tag, 505 is a telephone number field, 5
Tag characters are cells, such as 06, a name tag, 507, a name field, 508, a seal tag, and 509, a seal field.

【0025】本発明の第2の実施の形態に係る処理の概
略を図3のフローチャートを用いて説明する。
The outline of the processing according to the second embodiment of the present invention will be described with reference to the flowchart of FIG.

【0026】第1の実施の形態を説明する際に用いた図
2に示した処理と同様に、ステップS301では帳票画
像を読み込み、ステップS302では読み込まれた画像
からセルを抽出する。ステップS303ではセルに含ま
れるタグ文字領域(または、タグ文字画像)を抽出し、
ステップS304ではタグ文字の文字認識を行う。ステ
ップS305では認識結果の文字からキーワードを検索
し、キーワードを含むセルを特定する。
As in the processing shown in FIG. 2 used in describing the first embodiment, a form image is read in step S301, and cells are extracted from the read image in step S302. In step S303, a tag character area (or tag character image) included in the cell is extracted,
In step S304, character recognition of tag characters is performed. In step S305, a keyword is searched from the character of the recognition result, and a cell including the keyword is specified.

【0027】ステップS306では、特定したセルがタ
グ文字のみかどうかを判定する。タグ文字の領域がセル
の大きさに比べ十分大きく、他の情報が記入される余地
がない場合は、セル内にはタグ文字のみであると判定す
る。また、ステップS303でタグ文字領域(または、
タグ文字画像)の抽出の際、同一セル内にタグ以外の画
像領域(または、文字画像)が存在した場合、ステップ
S306では、そのセルはタグ文字のみではないと判定
する。
In step S306, it is determined whether the specified cell is only a tag character. If the area of the tag character is sufficiently larger than the size of the cell and there is no room to enter other information, it is determined that the cell contains only the tag character. In step S303, the tag character area (or
If an image area (or a character image) other than a tag exists in the same cell when extracting the tag character image), it is determined in step S306 that the cell is not only a tag character.

【0028】ステップS306で、セル内にタグ文字の
みが存在すると判定した場合、ステップS307に進
み、ステップS307では近傍のセルを、抽出するセル
と特定する。横書きの場合、求めるセルは一般的にタグ
を含んだセルの右隣、または下に存在する。セルの高さ
が同一で右に接しているセルがあれば右のセルを、セル
の幅が同一で下に接しているセルがあれば下のセルを、
それを特定セルとする。
If it is determined in step S306 that only a tag character exists in the cell, the process proceeds to step S307, and in step S307, a nearby cell is specified as a cell to be extracted. In the case of horizontal writing, the desired cell generally exists to the right of or below the cell containing the tag. If there is a cell that has the same height and touches the right, there is a right cell.If there is a cell that has the same width and touches the bottom, the lower cell.
Let it be a specific cell.

【0029】ステップS306でセルがタグ文字のみで
ないと判定された場合は、ステップS306からステッ
プS308に進み、ステップS307では、図2に示す
上記第1の実施の形態に係る処理であるステップS20
6と同様、タグ文字を含むセルを特定セルとする。
If it is determined in step S306 that the cell is not only a tag character, the flow advances from step S306 to step S308. In step S307, step S20 shown in FIG. 2 according to the first embodiment is executed.
Similarly to 6, the cell including the tag character is set as the specific cell.

【0030】ステップS309では、ネットワークイン
タフェース109を介して、抽出された領域内の画像を
送信する。
In step S309, the image in the extracted area is transmitted via the network interface 109.

【0031】以上説明したように、第2の実施形態によ
れば、第1の実施形態の効果に加え、セル内にタグとな
る文字がなくても、近隣の対応するセルを特定し、必要
とするタグが存在する領域を抽出することができる効果
がある。
As described above, according to the second embodiment, in addition to the effect of the first embodiment, even if there is no character serving as a tag in a cell, a corresponding cell in the vicinity is specified and necessary. There is an effect that an area in which a tag exists can be extracted.

【0032】なお、上記実施形態では、処理対象の文書
として帳票を例に挙げたが、これに限られるものではな
く、種々の文書フォーマットに適用可能であることはい
うまでもない。
In the above embodiment, a form is taken as an example of a document to be processed. However, the present invention is not limited to this, and it goes without saying that the present invention can be applied to various document formats.

【0033】なお、本発明は、複数の機器(例えばホス
トコンピュータ、インタフェース機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機、ファクシミリ装置
など)に適用してもよい。
Although the present invention is applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), a device including one device (for example, a copying machine, a facsimile machine) Etc.).

【0034】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
Further, an object of the present invention is to supply a storage medium (or a recording medium) storing a program code of software for realizing the functions of the above-described embodiments to a system or an apparatus, and to provide a computer (or a computer) of the system or apparatus. It is needless to say that the present invention can also be achieved by a CPU or an MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention. Also,
When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also the operating system (OS) running on the computer based on the instructions of the program code.
It goes without saying that a case where the functions of the above-described embodiments are implemented by performing some or all of the actual processing, and the processing performs the functions of the above-described embodiments.

【0035】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the program code is read based on the instruction of the program code. Needless to say, the CPU included in the function expansion card or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0036】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した(図2および/または図
3に示す)フローチャートに対応するプログラムコード
が格納されることになる。
When the present invention is applied to the storage medium, the storage medium stores program codes corresponding to the above-described flowcharts (shown in FIG. 2 and / or FIG. 3).

【0037】[0037]

【発明の効果】以上説明したように、本発明によれば、
テンプレートが存在しなくても、帳票上の特定の領域を
自動的に取り出すことが可能になる。
As described above, according to the present invention,
Even if a template does not exist, a specific area on a form can be automatically extracted.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の実施の形態全体に係る画像処理装置の
ブロック図である。
FIG. 1 is a block diagram of an image processing apparatus according to an embodiment of the present invention.

【図2】第1の実施の形態に係る画像処理装置が行う、
処理ステップの一例を示すフローチャートである。
FIG. 2 is performed by the image processing apparatus according to the first embodiment;
It is a flowchart which shows an example of a processing step.

【図3】第2の実施の形態に係る画像処理装置が行う、
処理ステップの一例を示すフローチャートである。
FIG. 3 is performed by an image processing apparatus according to a second embodiment;
It is a flowchart which shows an example of a processing step.

【図4】第1の実施の形態に係る画像処理装置の処理の
対象となる帳票画像を説明する図である。
FIG. 4 is a diagram illustrating a form image to be processed by the image processing apparatus according to the first embodiment.

【図5】第2の実施の形態に係る画像処理装置の処理の
対象となる帳票画像を説明する図である。
FIG. 5 is a diagram illustrating a form image to be processed by an image processing apparatus according to a second embodiment.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) // G06F 17/30 170 G06F 17/30 170B ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) // G06F 17/30 170 G06F 17/30 170B

Claims (19)

【特許請求の範囲】[Claims] 【請求項1】 原稿上の所定の線図で囲まれた領域をセ
ル領域として抽出するセル領域抽出手段と、 前記セル領域内の文字画像を抽出する文字画像抽出手段
と、 前記抽出された文字画像について文字認識する文字認識
手段と、 前記文字認識手段による文字認識結果から指定キーワー
ドに対応する文字列を検索する検索手段と、 前記検索手段によって検索された文字列を含むセル領域
に基づいて指定されたセルを決定する決定手段とを備え
ることを特徴とする画像処理装置。
1. A cell area extracting means for extracting an area surrounded by a predetermined diagram on a document as a cell area; a character image extracting means for extracting a character image in the cell area; Character recognition means for character recognition of an image; search means for searching a character string corresponding to a specified keyword from character recognition results by the character recognition means; and designation based on a cell area including the character string searched by the search means Determining means for determining a selected cell.
【請求項2】 前記検索手段は、同一の対象を表わす異
なる文字列を同一の文字列として扱うことを特徴とする
請求項1に記載の画像処理装置。
2. The image processing apparatus according to claim 1, wherein the search unit treats different character strings representing the same object as the same character string.
【請求項3】 前記文字画像抽出手段は、抽出された前
記セル領域内の所定の領域に存在する文字を抽出するこ
とを特徴とする請求項1に記載の画像処理装置。
3. The image processing apparatus according to claim 1, wherein the character image extracting unit extracts a character existing in a predetermined area in the extracted cell area.
【請求項4】 前記文字画像抽出手段は、抽出された前
記セル領域内において、所定サイズよりも小さい文字を
抽出することを特徴とする請求項1に記載の画像処理装
置。
4. The image processing apparatus according to claim 1, wherein the character image extracting unit extracts a character smaller than a predetermined size in the extracted cell area.
【請求項5】 前記決定手段は、前記検索された文字列
を含むセル領域を前記指定されたセルとして決定するこ
とを特徴とする請求項1に記載の画像処理装置。
5. The image processing apparatus according to claim 1, wherein the determining unit determines a cell area including the searched character string as the specified cell.
【請求項6】 前記検索手段によって検索された文字列
の領域の、該文字列を含むセル領域中に占める割合が所
定値を越えるか否かを判定する判定手段を更に備え、 前記決定手段は、前記判定手段により前記割合が所定値
を越えると判定された場合に、該セル領域に隣接する別
のセル領域を指定されたセルとして決定することを特徴
とする請求項1に記載の画像処理装置。
6. A determination unit for determining whether a ratio of a character string area searched by the search unit in a cell area including the character string exceeds a predetermined value, wherein the determination unit includes: 2. The image processing apparatus according to claim 1, wherein when the determination unit determines that the ratio exceeds a predetermined value, another cell area adjacent to the cell area is determined as a designated cell. apparatus.
【請求項7】 前記決定手段は、前記判定手段により前
記割合が所定値を越えないと判定された場合は、該セル
領域を指定されたセルとして決定することを特徴とする
請求項6に記載の画像処理装置。
7. The method according to claim 6, wherein the determining unit determines the cell area as a designated cell when the determining unit determines that the ratio does not exceed a predetermined value. Image processing device.
【請求項8】 前記決定手段によって指定されたセルに
決定されたセルの画像情報を保存する保存手段を更に備
えることを特徴とする請求項1に記載の画像処理装置。
8. The image processing apparatus according to claim 1, further comprising a storage unit configured to store image information of a cell determined in the cell designated by the determination unit.
【請求項9】 前記決定手段によって指定されたセルに
決定されたセルの画像情報を外部装置に送信する送信手
段を更に備えることを特徴とする請求項1に記載の画像
処理装置。
9. The image processing apparatus according to claim 1, further comprising a transmission unit configured to transmit image information of a cell determined to the cell specified by the determination unit to an external device.
【請求項10】 原稿上の所定の線図で囲まれた領域を
セル領域として抽出するセル領域抽出工程と、 前記セル領域内の文字画像を抽出する文字画像抽出工程
と、 前記抽出された文字画像について文字認識する文字認識
工程と、 前記文字認識工程による文字認識結果から指定キーワー
ドに対応する文字列を検索する検索工程と、 前記検索工程によって検索された文字列を含むセル領域
に基づいて指定されたセルを決定する決定工程とを備え
ることを特徴とする画像処理方法。
10. A cell region extracting step of extracting a region surrounded by a predetermined diagram on a document as a cell region, a character image extracting step of extracting a character image in the cell region, and the extracted character A character recognition step of recognizing characters in an image, a search step of searching for a character string corresponding to a specified keyword from a character recognition result of the character recognition step, and a designation based on a cell region including the character string searched in the search step And a determining step of determining the selected cell.
【請求項11】 前記検索工程は、同一の対象を表わす
異なる文字列を同一の文字列として扱うことを特徴とす
る請求項10に記載の画像処理方法。
11. The image processing method according to claim 10, wherein in the search step, different character strings representing the same object are treated as the same character string.
【請求項12】 前記文字画像抽出工程は、抽出された
前記セル領域内の所定の領域に存在する文字を抽出する
ことを特徴とする請求項10に記載の画像処理方法。
12. The image processing method according to claim 10, wherein the character image extracting step extracts characters existing in a predetermined area in the extracted cell area.
【請求項13】 前記文字画像抽出工程は、抽出された
前記セル領域内において、所定サイズよりも小さい文字
を抽出することを特徴とする請求項10に記載の画像処
理方法。
13. The image processing method according to claim 10, wherein the character image extracting step extracts a character smaller than a predetermined size in the extracted cell region.
【請求項14】 前記決定工程は、前記検索された文字
列を含むセル領域を前記指定されたセルとして決定する
ことを特徴とする請求項10に記載の画像処理方法。
14. The image processing method according to claim 10, wherein the determining step determines a cell area including the searched character string as the specified cell.
【請求項15】 前記検索工程によって検索された文字
列の領域の、該文字列を含むセル領域中に占める割合が
所定値を越えるか否かを判定する判定工程を更に備え、 前記決定工程は、前記判定工程により前記割合が所定値
を越えると判定された場合に、該セル領域に隣接する別
のセル領域を指定されたセルとして決定することを特徴
とする請求項10に記載の画像処理方法。
15. The method according to claim 15, further comprising: determining whether a ratio of an area of the character string searched in the search step to a cell area including the character string exceeds a predetermined value. 11. The image processing apparatus according to claim 10, wherein when the determination step determines that the ratio exceeds a predetermined value, another cell area adjacent to the cell area is determined as a designated cell. Method.
【請求項16】 前記決定工程は、前記判定工程により
前記割合が所定値を越えないと判定された場合は、該セ
ル領域を指定されたセルとして決定することを特徴とす
る請求項15に記載の画像処理方法。
16. The method according to claim 15, wherein the determining step determines the cell area as a designated cell when the determining step determines that the ratio does not exceed a predetermined value. Image processing method.
【請求項17】 前記決定工程によって指定されたセル
に決定されたセルの画像情報を保存する保存工程を更に
備えることを特徴とする請求項10に記載の画像処理方
法。
17. The image processing method according to claim 10, further comprising a storage step of storing image information of the cell determined in the cell specified in the determination step.
【請求項18】 前記決定工程によって指定されたセル
に決定されたセルの画像情報を外部装置に送信する送信
工程を更に備えることを特徴とする請求項10に記載の
画像処理方法。
18. The image processing method according to claim 10, further comprising a transmission step of transmitting image information of the cell determined to the cell designated in the determination step to an external device.
【請求項19】 請求項10乃至18のいずれかに記載
の画像処理方法をコンピュータによって実行させるため
の制御プログラムを格納する記憶媒体。
19. A storage medium for storing a control program for causing a computer to execute the image processing method according to claim 10.
JP2000132734A 2000-05-01 2000-05-01 Image processing method and apparatus, and storage medium Expired - Fee Related JP4143245B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000132734A JP4143245B2 (en) 2000-05-01 2000-05-01 Image processing method and apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000132734A JP4143245B2 (en) 2000-05-01 2000-05-01 Image processing method and apparatus, and storage medium

Publications (2)

Publication Number Publication Date
JP2001312691A true JP2001312691A (en) 2001-11-09
JP4143245B2 JP4143245B2 (en) 2008-09-03

Family

ID=18641370

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000132734A Expired - Fee Related JP4143245B2 (en) 2000-05-01 2000-05-01 Image processing method and apparatus, and storage medium

Country Status (1)

Country Link
JP (1) JP4143245B2 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080642A1 (en) * 2006-01-13 2007-07-19 Fujitsu Limited Sheet slip processing program and sheet slip program device
JP2008042259A (en) * 2006-08-01 2008-02-21 Canon Inc Image processing system, image processing method, and program
JP2009301272A (en) * 2008-06-12 2009-12-24 Pfu Ltd Voucher management device and voucher management method
US8004728B2 (en) 2006-11-29 2011-08-23 Brother Kogyo Kabushiki Kaisha Image scanning device
JP2012048524A (en) * 2010-08-27 2012-03-08 Oki Electric Ind Co Ltd Seal collation device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007080642A1 (en) * 2006-01-13 2007-07-19 Fujitsu Limited Sheet slip processing program and sheet slip program device
JP4750802B2 (en) * 2006-01-13 2011-08-17 富士通株式会社 Form processing program and form processing apparatus
US8131087B2 (en) 2006-01-13 2012-03-06 Fujitsu Limited Program and apparatus for forms processing
CN101356541B (en) * 2006-01-13 2012-05-30 富士通株式会社 Method and apparatus for processing account ticket
JP2008042259A (en) * 2006-08-01 2008-02-21 Canon Inc Image processing system, image processing method, and program
US8004728B2 (en) 2006-11-29 2011-08-23 Brother Kogyo Kabushiki Kaisha Image scanning device
JP2009301272A (en) * 2008-06-12 2009-12-24 Pfu Ltd Voucher management device and voucher management method
JP2012048524A (en) * 2010-08-27 2012-03-08 Oki Electric Ind Co Ltd Seal collation device

Also Published As

Publication number Publication date
JP4143245B2 (en) 2008-09-03

Similar Documents

Publication Publication Date Title
JP4590433B2 (en) Image processing apparatus, image processing method, and computer program
JP4402138B2 (en) Image processing apparatus, image processing method, and computer program
JP5376795B2 (en) Image processing apparatus, image processing method, program thereof, and storage medium
JP2010009509A (en) Image processor, image processing method, program thereof, and storage medium
JPH11306197A (en) Image processing apparatus and method, computer readable memory
CN116110051B (en) File information processing method and device, computer equipment and storage medium
JP5042562B2 (en) Image processing apparatus, handwritten information recognition method, handwritten information recognition program
CN102708365A (en) Information processing apparatus to acquire character information
US20020054706A1 (en) Image retrieval apparatus and method, and computer-readable memory therefor
JP2008145611A (en) Information processor and program
JP4136282B2 (en) Image processing apparatus, image processing method, and storage medium
JP4143245B2 (en) Image processing method and apparatus, and storage medium
JP2000322417A (en) Image filing apparatus and method, and storage medium
JP5197694B2 (en) Image processing apparatus, image processing method, and computer program
CN112149679A (en) Method and device for extracting document elements based on OCR character recognition
JPH11187231A (en) Image retrieval apparatus and image retrieval method
JP2000029987A (en) Image reading apparatus control method, image reading apparatus, and image reading system
JP4651407B2 (en) Image processing apparatus, computer program, and storage medium
JP4892600B2 (en) Image processing device
JP7497620B2 (en) Document data generation device, image forming device, and document data generation program
JP3412998B2 (en) Image processing apparatus and method
CN117252155A (en) Method and device for converting PDF document into WORD document and computer equipment
JP2022104498A (en) Information processing system, information processing method and program
JP2002222195A (en) Document sorting device and document sorting method
JP2021105911A (en) Information processing device, control method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041210

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20041210

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041210

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080225

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080606

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080616

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110620

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120620

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130620

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees