JP2010072850A - Image processor - Google Patents
Image processor Download PDFInfo
- Publication number
- JP2010072850A JP2010072850A JP2008238354A JP2008238354A JP2010072850A JP 2010072850 A JP2010072850 A JP 2010072850A JP 2008238354 A JP2008238354 A JP 2008238354A JP 2008238354 A JP2008238354 A JP 2008238354A JP 2010072850 A JP2010072850 A JP 2010072850A
- Authority
- JP
- Japan
- Prior art keywords
- character information
- address
- character
- document
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000001514 detection method Methods 0.000 claims description 63
- 238000012545 processing Methods 0.000 claims description 58
- 239000000284 extract Substances 0.000 claims description 3
- 238000012790 confirmation Methods 0.000 claims description 2
- 238000012937 correction Methods 0.000 claims description 2
- 238000004364 calculation method Methods 0.000 abstract description 16
- 238000000034 method Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 26
- 238000012015 optical character recognition Methods 0.000 description 13
- 235000008247 Echinochloa frumentacea Nutrition 0.000 description 11
- 240000004072 Panicum sumatrense Species 0.000 description 11
- 230000008569 process Effects 0.000 description 10
- 238000013500 data storage Methods 0.000 description 9
- 230000002093 peripheral effect Effects 0.000 description 8
- 230000015572 biosynthetic process Effects 0.000 description 7
- 239000000203 mixture Substances 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000012795 verification Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000007639 printing Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000007599 discharging Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 210000000707 wrist Anatomy 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003702 image correction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、入力された原稿データに含まれている文字情報の配列規則を判定する機能を備えた画像処理装置に関する。 The present invention relates to an image processing apparatus having a function of determining an arrangement rule of character information included in input document data.
各種の文字情報(文字列)が一覧形式に記載されている書類などを光学式文字読取装置(Optical Character Reader;OCR)で読み取り、そのデータから所望の文字情報を抽出して他の書類に合成して印刷出力する技術は一般に知られている。 A document in which various character information (character strings) is listed is read with an optical character reader (OCR), and the desired character information is extracted from the data and synthesized into another document. A technique for printing out is generally known.
たとえば、特許文献1に記載されている放置自転車管理システムでは、放置自転車に関する情報が記載された書類(防犯回答登録リスト)を読み取って抽出した防犯登録番号、登録者氏名、登録者住所を、放置自転車の持ち主に対する引き取り通知書に合成して自動発行するようにしている。またこの技術では、読み取る書類の書式(フォーマット)が予め決められており、所定の範囲(防犯登録番号、登録者氏名、登録者住所が記載されている範囲)のみを読み取ることで所望の文字情報を抽出するようにしている。
For example, in the abandoned bicycle management system described in
しかしながら、上記の技術では読み取り対象となる書類が特定の書式に限られてしまい、抽出する文字情報の位置や配列が不明である場合は対応することができない。たとえば、一般の名簿などは書式が様々であり、氏名や住所などの位置や配列は様々である。このような様々な書式の名簿などから全員分の氏名のみを抽出するようなことはできないため、汎用性に乏しい問題がある。 However, in the above technique, the document to be read is limited to a specific format, and it is not possible to cope with the case where the position and arrangement of character information to be extracted are unknown. For example, a general name list and the like have various formats, and positions and arrangements of names and addresses are various. Since it is not possible to extract only the names of all the members from a list of various formats, there is a problem of poor versatility.
本発明は、上記の問題を解決しようとするものであり、原稿データに含まれている複数の文字情報の中から所望の文字情報群の配列規則を判定することができる画像処理装置を提供することを目的としている。 The present invention is intended to solve the above problem, and provides an image processing apparatus capable of determining an arrangement rule of a desired character information group from a plurality of character information included in document data. The purpose is that.
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。 The gist of the present invention for achieving the object lies in the inventions of the following items.
[1]原稿データが入力される入力部と、
前記入力部から入力された第1の原稿データに含まれている複数の文字情報の中から内容が同じ種類である文字情報群の配列規則を判定する場合に、前記種類に属する文字情報を使用してその文字情報に該当する第1の文字情報を検索し、その第1の文字情報から所定方向に検索して前記種類に属する第2の文字情報を特定し、前記第1の文字情報と前記第2の文字情報との位置関係に基づいて前記配列規則を判定する制御部と、
を備える
ことを特徴とする画像処理装置。
[1] An input unit for inputting document data;
The character information belonging to the type is used when determining the arrangement rule of the character information group of the same type from among the plurality of character information included in the first document data input from the input unit The first character information corresponding to the character information is searched, the second character information belonging to the type is specified by searching from the first character information in a predetermined direction, and the first character information and A control unit that determines the arrangement rule based on a positional relationship with the second character information;
An image processing apparatus comprising:
上記発明では、入力された原稿データ(第1の原稿データ)に含まれている複数の文字情報の中から、配列規則を判定しようとする文字情報群と同じ種類の文字情報を使用して、その文字情報(検索キーワード)に該当する第1の文字情報を検索する。 In the above invention, character information of the same type as the character information group for which the arrangement rule is to be determined is selected from the plurality of character information included in the input document data (first document data). The first character information corresponding to the character information (search keyword) is searched.
上記の文字情報群の種類とは、文字自体で分類される種類(アラビア数字、ローマ字、漢字など)などではなく、内容(情報内容)で分類される種類(名称、単語など)を指す。検索に使用する文字情報には、たとえば上記種類における代表的な文字情報やユーザが指定した文字情報などを使用することができる。 The type of character information group described above refers to a type (name, word, etc.) classified by content (information content), not a type (Arabic numerals, Roman characters, Chinese characters, etc.) classified by characters themselves. As the character information used for the search, for example, typical character information of the above type or character information designated by the user can be used.
そして、第1の文字情報から所定方向に検索して上記種類に属する第2の文字情報を特定し、第1の文字情報と第2の文字情報との位置関係に基づいて、上記種類に属する文字情報群の配列規則を判定する。たとえば、上記種類に属する文字情報群は、第1の文字情報と第2の文字情報とを含む列方向に第1の文字情報と第2の文字情報の間隔で配列されているなどと判定する。 Then, the second character information belonging to the type is specified by searching from the first character information in a predetermined direction, and belongs to the type based on the positional relationship between the first character information and the second character information. The arrangement rule of the character information group is determined. For example, it is determined that the character information group belonging to the above type is arranged at intervals of the first character information and the second character information in the column direction including the first character information and the second character information. .
これにより、原稿データに含まれている複数の文字情報の中から内容が同じ種類である文字情報群の配列規則を判定することができる。 As a result, it is possible to determine the arrangement rule of the character information group having the same type from among a plurality of character information included in the document data.
[2]前記制御部は、前記第1の文字情報の検索では、その検索における検出確率の高い文字情報から順番に使用して前記第1の原稿データに含まれている複数の文字情報の中から検出された文字情報を前記第1の文字情報に決定する
ことを特徴とする[1]に記載の画像処理装置。
[2] In the search for the first character information, the control unit sequentially uses character information having a high detection probability in the search, and sequentially uses a plurality of character information included in the first document data. The image processing apparatus according to [1], wherein the character information detected from the first character information is determined as the first character information.
上記発明では、第1の原稿データに含まれている複数の文字情報の中から第1の文字情報を検索する場合に、その検索における検出確率の高い文字情報(検索キーワード)から順番に使用して、該当する文字情報を検索する。そして、上記文字情報(検索キーワード)に該当する文字情報が検出された場合にその文字情報を第1の文字情報に決定する。このように、検出確率の高い文字情報から順番に使用して検索を行うことで、第1の文字情報の検索効率を向上することができる。 In the above invention, when the first character information is searched from among a plurality of character information included in the first document data, the character information (search keyword) having a high detection probability in the search is used in order. To search for the corresponding character information. When character information corresponding to the character information (search keyword) is detected, the character information is determined as first character information. Thus, the search efficiency of the 1st character information can be improved by using and searching in order from the character information with a high detection probability.
[3]前記制御部は、前記第1の文字情報と前記第2の文字情報とを含む第1の列に配列された第3の文字情報から、前記第1の列方向とは異なる方向に検索して前記種類に属する第4の文字情報を特定できた場合は、その第4の文字情報の位置も加味して前記配列規則を判定する
ことを特徴とする[1]または[2]に記載の画像処理装置。
[3] The control unit determines, in a direction different from the first column direction, from third character information arranged in a first column including the first character information and the second character information. When the fourth character information belonging to the type can be specified by searching, the arrangement rule is determined in consideration of the position of the fourth character information. [1] or [2] The image processing apparatus described.
上記発明では、第3の文字情報は、第1の文字情報と第2の文字情報とを含んだ第1の列に配列されている文字情報である。この第3の文字情報には、第1の文字情報と、第2の文字情報と、第1の列に配列されているそれ以外の文字情報とが含まれる。この第3の文字情報におけるいずれか1つまたは複数から第1の列とは異なる方向に検索して上記種類に属する第4の文字情報を特定できた場合は、配列規則を判定しようとする文字情報群が複数列で配列(2次元配列)されていると推定でき、その第4の文字情報の位置も加味して配列規則を判定する。これにより、複数列の配列規則も判定可能となる。 In the above invention, the third character information is character information arranged in the first column including the first character information and the second character information. The third character information includes first character information, second character information, and other character information arranged in the first column. If the fourth character information belonging to the above type can be specified by searching from one or more of the third character information in a direction different from that of the first column, the character whose alignment rule is to be determined It can be estimated that the information group is arranged in a plurality of columns (two-dimensional arrangement), and the arrangement rule is determined in consideration of the position of the fourth character information. Thereby, the arrangement rule of a plurality of columns can also be determined.
[4]前記制御部は、前記第4の文字情報から前記第1の列に沿った方向に検索して前記種類に属する第5の文字情報を特定し、前記第4の文字情報と前記第5の文字情報との位置関係に基づいてその第4の文字情報と第5の文字情報とを含む第2の列に対する前記配列規則を判定する
ことを特徴とする[3]に記載の画像処理装置。
[4] The control unit searches the fourth character information in a direction along the first column to identify fifth character information belonging to the type, and includes the fourth character information and the first character information. 5. The image processing according to [3], wherein the arrangement rule for the second column including the fourth character information and the fifth character information is determined based on a positional relationship with the character information of 5. apparatus.
上記発明では、複数列の配列規則の判定において、第1の列に沿った(第1の列と平行な)第2の列における上記文字情報群の配列規則が第1の列とは個別に判定される。 In the above invention, in the determination of the arrangement rule of the plurality of columns, the arrangement rule of the character information group in the second column (parallel to the first column) along the first column is different from the first column. Determined.
[5]前記制御部は、前記第1の列に沿った前記第4の文字情報を含む第2の列に対して前記第1の文字情報と前記第2の文字情報との位置関係に基づいて判定した前記配列規則を適用することでその第2の列に対する前記配列規則を判定する
ことを特徴とする[3]に記載の画像処理装置。
[5] The control unit is based on a positional relationship between the first character information and the second character information with respect to a second column including the fourth character information along the first column. The image processing apparatus according to [3], wherein the arrangement rule for the second column is determined by applying the arrangement rule determined in the above.
上記発明では、複数列の配列規則の判定において、第1の列に沿った(第1の列と平行な)第2の列における上記文字情報群の配列規則が第1の列と同じ配列規則であると判定される。 In the above invention, in the determination of the arrangement rule of a plurality of columns, the arrangement rule of the character information group in the second column (parallel to the first column) along the first column is the same as that of the first column. It is determined that
[6]前記制御部は、前記第3の文字情報と前記第4の文字情報との位置関係に基づいて前記第1の列方向とは異なる方向の前記配列規則を判定する
ことを特徴とする[3]に記載の画像処理装置。
[6] The control unit may determine the arrangement rule in a direction different from the first column direction based on a positional relationship between the third character information and the fourth character information. The image processing device according to [3].
上記発明では、第1の列方向とは異なる方向における上記文字情報群の配列規則を第3の文字情報と第4の文字情報との位置関係に基づいて判定する。たとえば、上記文字情報群は、第1の列方向とは異なる方向には、第3の文字情報と第4の文字情報の間隔で配列されているなどと判定する。 In the above invention, the arrangement rule of the character information group in a direction different from the first column direction is determined based on the positional relationship between the third character information and the fourth character information. For example, it is determined that the character information group is arranged at an interval between the third character information and the fourth character information in a direction different from the first column direction.
これにより、複数列の上記文字情報群に対する配列規則の判定において、第1の列方向とは異なる方向の配列規則を判定することができる。 Thereby, in the determination of the arrangement rule for the character information group of a plurality of columns, it is possible to determine the arrangement rule in a direction different from the first column direction.
[7]前記制御部は、前記第1の原稿データが複数ページのデータである場合は、前記配列規則の判定をページ毎に行う
ことを特徴とする[1]乃至[6]のいずれか1つに記載の画像処理装置。
[7] Any one of [1] to [6], wherein when the first document data is data of a plurality of pages, the control unit determines the arrangement rule for each page. The image processing apparatus described in one.
上記発明では、複数ページの原稿データ(第1の原稿データ)に対しては、ページ毎に上記文字情報群の配列規則が判定される。 In the above invention, for a plurality of pages of document data (first document data), the arrangement rule of the character information group is determined for each page.
[8]前記制御部は、前記第1の文字情報の文字方向に基づいて前記所定方向を決定する
ことを特徴とする[1]乃至[7]のいずれか1つに記載の画像処理装置。
[8] The image processing apparatus according to any one of [1] to [7], wherein the control unit determines the predetermined direction based on a character direction of the first character information.
上記発明では、第1の文字情報の文字方向に基づいて、第1の文字情報から第2の文字情報を検索する所定方向(検索方向)を決定する。この文字方向とは、文字の並び方向であり、横書きや縦書きといった書字方向を指す。たとえば、第1の文字情報が横書きの場合は、配列規則を判定しようとする文字情報群が上下方向(縦方向)に配列されている可能性が高いため、上下方向に検索し、縦書きの場合は、同文字情報群が左右方向(横方向)に配列されている可能性が高いため、左右方向に検索するなどする。これにより、第2の文字情報を効率よく検索して特定できるようになる。 In the said invention, the predetermined direction (search direction) which searches 2nd character information from 1st character information is determined based on the character direction of 1st character information. This character direction is the direction in which characters are arranged, and refers to the direction of writing such as horizontal writing or vertical writing. For example, when the first character information is horizontal writing, there is a high possibility that the character information group for which the arrangement rule is to be determined is arranged in the vertical direction (vertical direction). In this case, since it is highly possible that the same character information group is arranged in the left-right direction (horizontal direction), a search is performed in the left-right direction. As a result, the second character information can be efficiently searched and specified.
[9]前記制御部は、前記第1の文字情報の書式と前記第1の文字情報に隣接する文字情報の書式とを比較し、前記第1の文字情報に対して書式の異なる文字情報が配置されている方向は前記第2の文字情報を検索する方向から除外する
ことを特徴とする[1]乃至[8]のいずれか1つに記載の画像処理装置。
[9] The control unit compares the format of the first character information with the format of character information adjacent to the first character information, and character information having a format different from that of the first character information. The image processing apparatus according to any one of [1] to [8], wherein the arranged direction is excluded from a search direction of the second character information.
上記発明では、第1の文字情報に隣接する文字情報が第1の文字情報と書式(文字の大きさ、書体など)が異なる場合は、配列規則を判定しようとする文字情報群が第1の文字情報からその書式の異なる文字情報の方向に配列されている可能性は低いため、その方向には第2の文字情報の検索を行わないようにする。これにより、第2の文字情報を効率よく検索して特定できるようになる。 In the above invention, when the character information adjacent to the first character information is different in format (character size, typeface, etc.) from the first character information, the character information group for which the arrangement rule is determined is the first character information. Since there is a low possibility that the character information is arranged in the direction of character information having a different format, the second character information is not searched in that direction. As a result, the second character information can be efficiently searched and specified.
また、上記発明を[8]に記載した第1の文字情報の文字方向に基づいて所定方向(第2の文字情報の検索方向)を決定する発明と組み合わせる場合は、たとえば、第1の文字情報が横書きであるため所定方向を上下方向にしようとするが、上下方向における一方向(たとえば上方向)に配置されている文字情報の書式が異なる場合にその一方向へは第2の文字情報を検索しないなどが可能である。 When the above invention is combined with the invention for determining the predetermined direction (the search direction of the second character information) based on the character direction of the first character information described in [8], for example, the first character information Is a horizontal writing, so the predetermined direction is set to the vertical direction, but if the format of the character information arranged in one direction (for example, upward) in the vertical direction is different, the second character information is displayed in the one direction. It is possible not to search.
[10]前記制御部は、前記第1の原稿データに含まれている複数の文字情報の中から前記配列規則に則って前記種類に属する個々の文字情報を抽出し、その文字情報を前記入力部から入力された第2の原稿データに合成して出力する
ことを特徴とする[1]乃至[9]のいずれか1つに記載の画像処理装置。
[10] The control unit extracts individual character information belonging to the type in accordance with the arrangement rule from a plurality of character information included in the first document data, and inputs the character information to the input The image processing apparatus according to any one of [1] to [9], wherein the image data is combined with the second document data input from the scanner unit and output.
上記発明では、第1の原稿データから抽出された内容が同じ種類である個々の文字情報が第2の原稿データに合成されて出力される。 In the above invention, individual character information whose contents extracted from the first document data are of the same type is synthesized with the second document data and output.
[11]前記制御部は、指定された文字情報を使用して前記第2の原稿データからその文字情報に該当する第6の文字情報を検索し、その第6の文字情報の位置と書式とに基づいて、前記第2の原稿データに合成する文字情報の位置と書式とを決定する
ことを特徴とする[10]に記載の画像処理装置。
[11] The control unit retrieves sixth character information corresponding to the character information from the second document data using the designated character information, and the position and format of the sixth character information. The image processing apparatus according to [10], wherein the position and format of character information to be combined with the second document data are determined based on the above.
上記発明では、第2の原稿データから検索した指定の文字情報(第6の文字情報)に対して、第1の原稿データから抽出した文字情報を合成する場合に、その合成する文字情報の位置と書式(文字の大きさ、文字方向など)を、上記指定の文字情報の位置と書式に基づいて決定する。これにより、指定の文字情報に対して合成する文字情報を見栄え良く配置したり、見栄えの良くなる書式にしたりするなどが可能となる。 In the above invention, when the character information extracted from the first document data is combined with the designated character information (sixth character information) retrieved from the second document data, the position of the character information to be combined And the format (character size, character direction, etc.) are determined based on the position and format of the designated character information. As a result, it is possible to arrange the character information to be synthesized with the designated character information in a good-looking manner, or to make the format look good.
[12]前記制御部は、前記種類に属する文字情報が登録されたデータベースを参照して前記特定を行う
ことを特徴とする[1]乃至[11]のいずれか1つに記載の画像処理装置。
[12] The image processing apparatus according to any one of [1] to [11], wherein the control unit performs the specification with reference to a database in which character information belonging to the type is registered. .
上記発明では、上記文字情報(第2〜第5の文字情報)の特定を、上記種類に属する文字情報が登録されたデータベースを参照して簡単に行うことができる。 In the above invention, the character information (second to fifth character information) can be easily identified with reference to a database in which character information belonging to the type is registered.
[13]前記制御部は、前記配列規則に則って前記抽出した文字情報に対し、前記種類に属する文字情報が登録されたデータベースを参照して前記種類に属するか否かを判定する
ことを特徴とする[1]乃至[11]のいずれか1つに記載の画像処理装置。
[13] The control unit determines whether or not the extracted character information according to the arrangement rule belongs to the type by referring to a database in which character information belonging to the type is registered. The image processing device according to any one of [1] to [11].
上記発明では、配列規則に則って抽出した文字情報が上記種類に属するか否かの判定(検証)を、上記種類に属する文字情報が登録されたデータベースを参照して簡単に行うことができる。なお、上記第1および第2の文字情報や第4および第5の文字情報は、上記種類に属することが判明しているため、上記判定を省略するようにしてもよい。これにより、抽出した中に上記種類に属していない文字情報が含まれていた場合はその文字情報を除外するなどが可能となる。 In the above invention, it is possible to easily determine (verify) whether or not the character information extracted in accordance with the arrangement rule belongs to the above type with reference to the database in which the character information belonging to the above type is registered. Since the first and second character information and the fourth and fifth character information have been found to belong to the above type, the determination may be omitted. As a result, if character information that does not belong to the above type is included in the extracted data, the character information can be excluded.
[14]前記制御部は、前記種類に属するか否かの判定では、前記種類に属さないことを示す条件が登録されたデータベースも参照し、前記条件に該当する文字情報は前記種類に属さないと判定する
ことを特徴とする[13]に記載の画像処理装置。
[14] In determining whether or not it belongs to the type, the control unit also refers to a database in which a condition indicating that it does not belong to the type is registered, and character information corresponding to the condition does not belong to the type [13] The image processing device according to [13],
上記発明では、配列規則に則って抽出した文字情報が上記種類に属するか否かの判定においては、上記種類に属さないことを示す条件を登録したデータベースも参照することで、判定を行う上での効率や精度を向上できる。 In the above invention, in determining whether or not the character information extracted according to the arrangement rule belongs to the above type, the determination is made by referring to the database in which the condition indicating that the character information does not belong to the above type is registered. Efficiency and accuracy can be improved.
[15]表示部と、操作部とを備え、
前記制御部は、前記判定の結果を前記表示部に表示し、その判定の結果に対する確定または訂正の操作を前記操作部により受け付ける
ことを特徴とする[13]または[14]に記載の画像処理装置。
[15] A display unit and an operation unit are provided,
The image processing according to [13] or [14], wherein the control unit displays the determination result on the display unit, and accepts a confirmation or correction operation for the determination result by the operation unit. apparatus.
上記発明では、配列規則に則って抽出された文字情報が上記種類に属するか否かを自動判定した結果が表示され、ユーザはその判定結果を確認して確定または訂正できるようになる。これにより、誤判定された文字情報や出力する必要のない文字情報などが第2の原稿データに合成されて出力されるような無駄を抑制することができる。 In the above invention, the result of automatically determining whether or not the character information extracted in accordance with the arrangement rule belongs to the above type is displayed, and the user can confirm or confirm or correct the determination result. Thereby, it is possible to suppress waste such that erroneously determined character information or character information that does not need to be output is combined with the second document data and output.
本発明の画像処理装置によれば、原稿データに含まれている複数の文字情報の中から所望の文字情報群の配列規則を判定できるようになる。したがって、汎用性や利便性が向上する。 According to the image processing apparatus of the present invention, it is possible to determine an arrangement rule of a desired character information group from a plurality of character information included in document data. Therefore, versatility and convenience are improved.
以下、図面に基づき本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[第1の実施の形態]
図1は、本発明の第1の実施の形態に係る画像処理装置としての複合機10(MFP;Multi Function Peripheral/Multi Function Printer)の概略構成を示している。
[First Embodiment]
FIG. 1 shows a schematic configuration of a multifunction peripheral 10 (MFP; Multi Function Peripheral / Multi Function Printer) as an image processing apparatus according to the first embodiment of the present invention.
複合機10は、原稿のコピー機能、プリンタ機能、スキャナ機能、ファクシミリ機能などを備えている。
The
スキャナ機能には、光学的に読み取った原稿に記載されている文字のイメージデータを自動認識してテキストデータに変換するOCR機能が設けられている。 The scanner function is provided with an OCR function for automatically recognizing character image data written on an optically read original and converting it into text data.
コピー機能には、読み取った原稿をデフォルト設定やユーザ設定による条件で複写印刷する通常コピーモードの他に、上記のOCR機能を使用して第1の原稿に含まれている所望の文字情報(文字列)を抽出し第2の原稿に合成して印刷する自動合成モードが設けられている。この自動合成モードは、たとえば第1の原稿(抽出元原稿)としての「名簿」や「住所録」などから所望の文字情報としての「宛名」や「宛先」などを抽出して第2の原稿(合成先原稿)としての「送付状」、「案内状」、「通知書」などに自動的に合成するなどにより、宛名書きや宛先書きなどの作業を軽減できるモードである(自動宛名書きモード/自動宛先書きモード)。 In the copy function, in addition to the normal copy mode in which the read original is copied and printed under conditions according to default settings or user settings, desired character information (characters) included in the first original using the OCR function is used. Column) is extracted, and an automatic composition mode for synthesizing and printing on the second original is provided. In this automatic composition mode, for example, “address” and “destination” as desired character information are extracted from the “name list”, “address book”, etc. as the first original (extraction source original), and the second original. This is a mode that can reduce work such as address writing and address writing by automatically composing it to “Send Letter”, “Guidance Letter”, “Notification Letter”, etc. / Automatic address writing mode).
なお、本明細中で使用する「文字情報」とは、1つまたは複数の文字からなる何らかの意味(情報)を有する名称や単語などを指し、一般的に使われている「文字列」などと同義である。この文字情報は、たとえば、人名(姓、名)、社名、地名(日本の場合は都道府県市区町村名)、郵便番号など、内容(情報内容)による分類が可能である。以下では「文字情報」を単に「文字」と呼ぶ場合がある。 As used herein, “character information” refers to names or words having some meaning (information) made up of one or a plurality of characters, such as “character strings” that are generally used. It is synonymous. This character information can be classified by contents (information contents) such as personal names (last names, first names), company names, place names (in the case of Japan, prefectures, municipalities), and postal codes. Hereinafter, “character information” may be simply referred to as “character”.
また、名簿などに記載されている人名や社名などの名称(名前)は、送付状などのドキュメント(書類)における宛名欄に記入されることで、そのドキュメントにおける宛名となる。ただし本明細中では、便宜的に名簿上でも宛名と称して説明する。 A name (name) such as a person name or a company name described in a name list or the like is entered in the address column of a document (document) such as a cover sheet, thereby becoming the address in the document. However, in the present specification, for convenience, the name list will be referred to as an address.
複合機10は、制御部としてのCPU(Central Processing Unit)11に、バス12を介してROM(Read Only Memory)13と、RAM(Random Access Memory)14と、不揮発メモリ15と、ハードディスク装置(Hard Disk Drive;HDD)16と、操作部17と、表示部18と、ファクシミリ通信部19と、ネットワーク通信部20と、原稿送り装置制御部21と、スキャナ部22と、画像処理部23と、プリンタ部24とを接続して構成される。
The
CPU11は、ROM13に格納されているプログラムに基づいて複合機10の動作を制御する。自動合成モードでは、原稿データに対する文字(文字情報)の抽出と合成も行う。RAM14はCPU11がプログラムを実行する際に各種データを一時的に格納するワークメモリとして使用されるほか、画像データを一時的に保存するための画像メモリなどにも使用される。
The
不揮発メモリ15は、電源がオフされても記憶が保持されるメモリであり、装置固有の情報や各種の設定情報などが記憶される。ハードディスク装置16は、各種の保存データなどを格納するほか、原稿のスキャンやコピーにおける画像データ、クライアント端末から依頼された印刷における画像データ(印刷データ)なども保存する。
The
操作部17は、モード選択ボタン、スタートボタン、ストップボタン、テンキーなどの各種のボタン類などで構成され、ユーザなどが複合機10に対して行う各種の操作を受け付ける機能を果たす。表示部18は、液晶ディスプレイなどで構成され、操作画面、設定画面、案内画面などの各種の画面を表示する機能を果たす。
The
ファクシミリ通信部19は、ファクシミリ機能を備えた外部装置と公衆回線を通じて通信する機能を果たす。ネットワーク通信部20は、クライアント端末やサーバなどの外部装置とLAN(Local Area Network)などのネットワークを通じて通信する機能を果たす。
The
原稿送り装置制御部21は、図示しない自動原稿送り装置(Auto Document Feeder;ADF)の動作を制御する機能を果たす。自動原稿送り装置は、スキャナ部22による読取位置に原稿を自動で送り込む機能を備えている。たとえば、原稿が積載される原稿トレイと、原稿トレイに積載された原稿をスキャナ部22の読取位置に案内し排出するための搬送通路と、原稿トレイに積載された原稿を1枚ずつ搬送通路に送り込み、スキャナ部22の読取位置を通過させて搬送通路から排出する複数の搬送ローラと、スキャナ部22による読み取りの済んだ原稿が搬送通路から排出される排出トレイなどで構成される。
The
スキャナ部22は、原稿を光学的に読み取って画像データ(原稿データ)を取得する機能を果たす。たとえば、原稿に光を照射する光源と、原稿からの反射光を受光して原稿を幅方向(主走査方向)に1ライン分読み取るイメージセンサと、イメージセンサによるライン単位の読み取り位置を原稿の長さ方向(副走査方向)に移動させるスキャン機構と、原稿からの反射光をイメージセンサに導いて結像させるレンズやミラーからなる光学経路(光学系)などを備えている。
The
画像処理部23は画像データに対して、画像補正、回転、拡大/縮小、圧縮/伸張など各種の画像処理を施す機能を果たす。また、クライアント端末から依頼された印刷における印刷データ(ベクタ形式のイメージデータ)に対してラスタライズ処理を施す機能を果たす。
The
プリンタ部24は、入力された画像データに対応する画像を用紙に形成して出力する機能を果たす。たとえば、用紙の搬送装置と、感光体ドラムと、帯電装置と、レーザーユニットと、現像装置と、転写分離装置と、クリーニング装置と、定着装置などを備え、電子写真プロセスによって用紙上に画像を形成するレーザープリンタなどとして構成される。
The
図2は、自動合成モードにおけるCPU11の機能ブロック図を示している。また本図では、自動合成モードに関連する上述した複合機10の主要構成も示している。
FIG. 2 shows a functional block diagram of the
自動合成モードでは、たとえば、宛名が未記入であるドキュメント50と、ドキュメント50に記入する宛名としての人名(姓、名)や社名などが複数記載されている名簿60とを読み取ってOCR機能による文字の自動認識を行う。このOCR処理による文字認識後に、ドキュメント50に記載されている「様」、「殿」、「御中」などの敬称の検索と、名簿60に記載されている複数の宛名(文字情報群)の配列規則の判定(配列予測)やその規則で配列されている文字が宛名であるか否かの判定を行う。そして、名簿60から全ての宛名を抽出し、各宛名を敬称に合わせて合成した宛名数分のドキュメント50を印刷するなどが可能となっている。
In the automatic synthesizing mode, for example, the
データ入力部22は、上記例のような宛名が未記入であるドキュメント50の画像データと、ドキュメント50に記入する宛名が記載された名簿60の画像データとを入力する機能を果たす。ここでは、データ入力部22は上述したスキャナ部22で構成されている。データ入力部22(スキャナ部22)は、自動原稿送り装置にセットされ自動で送り込まれるなどしたドキュメント50と名簿60を光学的に読み取り、各々の画像データ(原稿データ)を取得することでデータ入力を行う。
The
また、上記のような原稿の読み取りによるデータ入力で、ドキュメント50と名簿60の画像データを識別するには、読み取る原稿の種類をユーザが指定して個別に読み取らせるなどの構成により実現できる。
Further, in order to identify the image data of the
たとえば、操作部17に、合成先原稿(ドキュメント50)を指定する合成先原稿指定ボタンと、抽出元原稿(名簿60)を指定する抽出元原稿指定ボタンとを設ける。ユーザは、一方の種類の原稿を複合機10にセットし、その種類に対応する原稿指定ボタンを操作してから読み取り開始ボタン(スタートボタン)を操作する。この原稿の読み取り完了後に、他方の種類の原稿を複合機10にセットし、その種類に対応する原稿指定ボタンを操作してから読み取り開始ボタンを操作する。このような構成により、入力された画像データがユーザの指定した種類の原稿に対応するデータであることを識別できるようになる。
For example, the
また、入力された画像データをOCR処理して原稿の内容を解析し、自動的に識別するようにしてもよい。 Alternatively, the input image data may be subjected to OCR processing to analyze the contents of the document and be automatically identified.
なお、以下ではドキュメントの画像データを「ドキュメントデータ」と略称し、名簿の画像データを「名簿データ」と略称する。また、それらを総称する場合は「原稿データ」と言う。 Hereinafter, image data of a document is abbreviated as “document data”, and image data of a name list is abbreviated as “name list data”. Further, when collectively referring to them, it is referred to as “original data”.
データ保存部14は、データ入力部22から入力されたドキュメントデータと名簿データを保存する機能を果たす。ここでは、データ保存部14は上述したRAM14、もしくは、複合機10内に実装されているDRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)などのメモリで構成される。
The
CPU11は、原稿情報出力部31と、文字照合部32と、文字座標検出部33と、宛名配列予測部34と、宛名読出部35と、宛名判定部36と、宛名貼付部37とを備え、これらの機能部によって名簿データからの宛名の抽出とドキュメントデータへの合成とを行う。
The
データ出力部24は、CPU11によって作成された、宛名が合成されたドキュメントデータを出力する機能を果たす。ここでは、データ出力部24は上述したプリンタ部24で構成されている。データ出力部24(プリンタ部24)は、上記のドキュメントデータに対応する画像を用紙に形成して出力することでデータ出力を行う。
The
CPU11における原稿情報出力部31は、原稿データに含まれている所望の文字(宛名、敬称など)の位置や大きさを判別(計算)するために必要となる原稿に関する情報(原稿情報)を作成して出力する役割を担う。本例では、文字の位置や大きさをライン数(ドット数)で表すようにしている。
A manuscript
詳細には、原稿情報出力部31は、データ入力部22から原稿データが入力されると、その原稿データに係る原稿情報を格納した原稿情報テーブル41を作成する。原稿情報は、原稿サイズと、読み取り解像度と、それらの情報から計算した原稿の幅方向(X方向)および長さ方向(Y方向)のライン数である。原稿情報出力部31は、この原稿情報を格納した原稿情報テーブル41を文字座標検出部33と宛名配列予測部34に出力する。
Specifically, when document data is input from the
たとえば、原稿が上記のドキュメント50と名簿60であって、それらの原稿サイズと読み取り解像度が同じであれば、同一の情報を格納した1つ(共通)の原稿情報テーブルを作成する。原稿サイズと読み取り解像度の少なくとも一方が異なっていてライン数が異なる場合には、1つ原稿情報テーブルに各原稿の情報を個別に格納したり、原稿情報テーブルを原稿毎に作成したりするなどしてもよい。
For example, if the original is the above-described
文字照合部32は、原稿データに含まれている所望の文字の検索に使用する検索キーワードの提示や、所望の文字の特定や判定における照合を行う役割を担う。詳細には、予め設定された検索キーワードとなる文字を文字座標検出部33に提示したり、宛名配列予測部34や宛名判定部36から照合を依頼された文字を照合したりする。
The
上記の提示や照合に用いる文字は、ハードディスク装置16などに格納されたデータベース38に予め登録されている。本例の場合は、データベース38に宛名としての人名(日本で使用されている苗字)と、敬称としての「様」、「殿」、「さん」などが登録されている(宛名リスト/敬称リスト)。また必要に応じて、宛名としての社名や、敬称としての「御中」や、地名、郵便番号、電話番号などの宛先に関する情報(宛先リスト)を登録するようにしてもよい。
The characters used for the above presentation and verification are registered in advance in the
文字照合部32はデータベース38にアクセスすることで、検索キーワードとして提示する文字(敬称検索キーワード/宛名検索キーワード)の取得や、照合を依頼された文字の照合を行う。また検索キーワードは、ユーザが操作部17などを通して指定(設定)することも可能となっている。
The
文字座標検出部33は、原稿データに含まれている所望の文字の検出とその位置(座標位置)および大きさ(文字サイズ)を計算する役割を担う。
The character coordinate
詳細には、文字照合部32から提示された敬称検索キーワードをドキュメントデータから検索し、原稿情報テーブル41に格納されている原稿のXYライン数を使用して、検索した敬称の位置とサイズをXYライン数として算出する。さらに、検索した敬称の文字方向(横書き/縦書き)を判別する。この検索した敬称と、位置を示すXYライン数と、文字サイズを示すXYライン数と、文字方向とを格納した敬称座標テーブル42を作成し、宛名貼付部37に出力する。
More specifically, the title search keyword presented by the
また、文字照合部32から提示された宛名検索キーワードを名簿データから検索し、原稿情報テーブル41に格納されている原稿のXYライン数を使用して、検索した宛名の位置とサイズをXYライン数として算出する。さらに、検索した宛名の文字方向(横書き/縦書き)を判別する。この検索した宛名と、位置を示すXYライン数と、文字サイズを示すXYライン数と、文字方向とを格納した宛名座標テーブル43を作成し、宛名配列予測部34に出力する。
Further, the address search keyword presented by the
宛名配列予測部34は、名簿データに含まれている宛名の配列を予測して(配列規則を判定して)その結果を出力する役割を担う。詳細には、原稿情報テーブル41と宛名座標テーブル43に基づいて、名簿データに含まれている宛名の配列を予測(計算)し、宛名毎に(宛名と推測できる文字毎に)予測配置位置を示すXYライン数と文字サイズを示すXYライン数とを対応付けて格納した宛名配列テーブル44を作成し、宛名読出部35に出力する。
The address
宛名読出部35は、宛名配列予測部34が予測した位置に配置されている文字を名簿データから読み出して出力する役割を担う。詳細には、宛名配列テーブル44に格納されている情報(予測配置位置および対応する文字サイズ)に基づいて名簿データから文字を読み出し、その文字を元の情報に対応付けて宛名配列テーブル44に格納し、宛名判定部36に出力する。
The
宛名判定部36は、名簿データから読み出された文字が宛名であるか否かを判定してその結果を出力する役割を担う。詳細には、宛名配列テーブル44に格納されている文字の照合を文字照合部32に依頼し、その結果を示す宛名判定情報をその文字に対応付けて宛名配列テーブル44に格納することにより、宛名配列テーブル44から新たに宛名判定テーブル45を作成し、宛名貼付部37に出力する。
The
宛名貼付部37は、宛名と判定された文字をドキュメントデータに貼り付けて出力する役割を担う。詳細には、宛名判定テーブル45に格納されている文字の中から、宛名判定情報に基づいて宛名とされた文字を読み出し、敬称座標テーブル42に基づいてドキュメントデータの敬称に合わせて貼り付け、データ出力部24に出力する。
The
またCPU11はプログラムを実行することで、名簿データに含まれている宛名(文字情報群)の配列規則を判定する場合に、宛名に属する文字(宛名検索キーワード)を使用してその文字に該当する第1の文字を検索し、その第1の文字から所定方向に検索して宛名に属する第2の文字を特定し、第1の文字と第2の文字との位置関係に基づいて宛名の配列規則を判定する機能を果たす。所定方向は、本実施の形態では名簿データ(名簿60)における上下左右方向とされており、第1の文字からいずれの方向へ検索するかは、第1の文字の文字方向(横書き/縦書き)などに基づいて決定するようになっている。
In addition, when the
次に、複合機10の動作について説明する。
Next, the operation of the
図3は、複合機10による自動合成モードの処理の流れを示している。図3に示すフローチャートでは処理の概要を説明し、詳細については後述する。
FIG. 3 shows a flow of processing in the automatic synthesis mode by the
複合機10では、ユーザによるモード選択ボタンの操作で自動合成モード(自動宛名書きモード)が選択されると、CPU11は本処理を開始する(Start)。続いて、ユーザによる操作で上述したドキュメント50と名簿60の読み取りを行い、原稿データ(ドキュメントデータ/名簿データ)を入力する(ステップS101)
In the
この原稿データの入力では、ユーザは、たとえばドキュメント50を自動原稿送り装置にセットし、原稿の種類をドキュメント(合成先原稿)に指定してからスタートボタンを押下する。CPU11は、原稿送り装置制御部21を介して自動原稿送り装置によりドキュメント50を送り込む。このドキュメント50をスキャナ部22で読み取り、スキャナ部22から入力された画像データをドキュメント50の画像データ(ドキュメントデータ)であると認識してデータ保存部14に保存する。
In inputting the manuscript data, for example, the user sets the
ドキュメント50の読み取りが完了すると、ユーザは、名簿60を自動原稿送り装置にセットし、原稿の種類を名簿(抽出元原稿)に指定してからスタートボタンを押下する。CPU11は、原稿送り装置制御部21を介して自動原稿送り装置により名簿60を送り込む。この名簿60をスキャナ部22で読み取り、スキャナ部22から入力された画像データを名簿60の画像データ(名簿データ)であると認識してデータ保存部14に保存する。
When the reading of the
CPU11は、ドキュメントデータと名簿データから、それらのデータに含まれている敬称や宛名の位置や大きさを判別(計算)するために必要となる原稿情報を格納した原稿情報テーブル41を作成する(ステップS102)。
The
続いて、ドキュメントデータに対するOCR処理と敬称検索キーワードを使用した検索によって、ドキュメント50に記載されている敬称を検索する。また、名簿データに対するOCR処理と宛名検索キーワードを使用した検索によって、名簿60に記載されている複数の宛名の中から所定数(少なくとも1つ)の宛名を検索する(ステップS103)。この宛名の周辺に配置されている他の宛名をデータベース38を参照して特定し、これらの複数の宛名の位置関係に基づいて全ての宛名の配列位置を予測する(ステップS104)。
Subsequently, the title described in the
CPU11は、名簿データから、予測した配列位置に存在する個々の文字を宛名候補として読み出し(ステップS105)、宛名であるか否かをデータベース38を参照して個々に判定する(ステップS106)。宛名であると判定した文字については、ドキュメントデータにおける敬称の近傍位置に貼り付ける(ステップS107)。このドキュメントデータをプリンタ部24に入力して宛名が合成されたドキュメントを印刷出力し(ステップS108)、本処理を終了する(End)。
The
次に、図3のフローチャートに示した手順に従って自動合成モードの詳細を図4〜図16を用いて説明する。 Next, details of the automatic synthesis mode will be described with reference to FIGS. 4 to 16 in accordance with the procedure shown in the flowchart of FIG.
本実施の形態では、学校の先生が生徒の父兄へ配布する「お知らせ資料」に父兄の名前を個別に記入する場合で説明する。たとえば、お知らせ資料に宛名を1通ずつ手書きすると手間が掛かるため、複合機10の自動合成モードを使用して、図4に示すようなお知らせ資料としてのドキュメント50と、生徒の氏名や住所が記載されたクラス(○年○組)の名簿60を読み取らせることにより、お知らせ資料への宛名書きを自動で行うようにする。
In the present embodiment, a case will be described in which the name of the parents is individually entered in “notification material” distributed to the parents of the students by the school teacher. For example, since it takes time to hand-write the address one by one on the notification material, the
ドキュメント50は、文書全体の書式が横書きとされている。文書の右肩部(右上部)に宛名記入欄が設けられ、「様」と記載された敬称51が配置されている。敬称51のサイズは12ptとなっている。この敬称51の前側(図示の左側)に宛名を横書きで記入するようになっており、宛名自体は未記入で敬称51の前側は空白となっている。
The
名簿60は、書式が横書きとされ、複数の生徒の氏名61と住所62が一覧形式で記載されている。詳細には、生徒1人分の氏名61と住所62が横方向(左右方向)に配列され、氏名61の50音順に縦方向(上下方向)に配列されている。また、文字サイズは8ptとなっている。
In the
本例では、ドキュメント50と名簿60は共に、A4サイズの縦向きであり、600dpi(dot per inch)の解像度で読み取る場合で説明する。また、原稿の幅方向(左右方向)をX方向とし、長さ方向(上下方向)をY方向とすると共に、XY座標における原点位置を図示の左下角部に設定した場合で説明する。
In this example, the
(1)原稿データ(ドキュメント、名簿)入力
図3のステップS101では、図4に示すように、データ入力部22から入力されたドキュメント50の画像データ(ドキュメントデータ70)と名簿60の画像データ(名簿データ80)は、データ保存部14に一旦保存される。
(1) Document data (document, name list) input In step S101 of FIG. 3, as shown in FIG. 4, the image data (document data 70) of the
(2)原稿情報作成
図3のステップS102では、図4に示すように、原稿情報出力部31は、入力されたドキュメントデータ70および名簿データ80の原稿サイズと読み取り解像度から原稿のXY方向のライン数(ドット数)を計算する。
(2) Document Information Creation In step S102 of FIG. 3, as shown in FIG. 4, the document
ドキュメント50と名簿60が共に、A4サイズの縦向きで、解像度が600dpiで読み取られた本例の場合は、XY方向のライン数はそれぞれ[X:Y=4960Line:7015Line]と計算される。原稿情報出力部31は、原稿サイズと、解像度と、XYライン数とを格納した共通の原稿情報テーブル41を作成する。なお、ドキュメント50と名簿60で原稿サイズおよび読み取り解像度の少なくとも一方が異なっていてXYライン数が異なる場合には、上記の原稿情報テーブル41に各々の原稿情報を個別に格納する、もしくは、原稿情報テーブルを個別に作成するなどする。
In the case of this example in which both the
(3)敬称/宛名検索
ここでは、図3のステップS103による、ドキュメントデータ70と名簿データ80から指定の文字(敬称/宛名)を検索する方法について説明する。
(3) Title / Address Search Here, a method for searching for designated characters (name / address) from the
(3−1)ドキュメントデータからの指定敬称検索方法
図5に示すように、データ保存部14に保存されているドキュメントデータ70が文字座標検出部33に入力される。このデータ入力と共に、原稿情報出力部31は原稿情報テーブル41を文字座標検出部33に出力する。文字照合部32は、予め設定されている敬称検索キーワード90をデータベース38から取得して文字座標検出部33に出力する。本例では、敬称検索キーワード90は「様」としている。
(3-1) Method for Retrieving Designated Titles from Document Data As shown in FIG. 5,
文字座標検出部33は、ドキュメントデータ70をOCR処理し、敬称検索キーワード90の「様」という文字がドキュメントデータ70に存在するかを検索する。ドキュメントデータ70に「様」という文字が存在しておらず、検出できなかった場合には、文字座標検出部33は文字照合部32に対して次の敬称検索キーワードの出力を要求し、新たに入力された敬称検索キーワードを使用して再検索する。
The character coordinate
敬称検索キーワードの例としては、「様」の他に、「殿」、「さん」、などが挙げられる。また、宛名が社名などの場合には「御中」なども挙げられる。文字照合部32は、文字座標検出部33から敬称検索キーワードの出力要求を受ける毎に、予め設定されている順番で敬称検索キーワードを文字座標検出部33に出力する。
As an example of the title search keyword, in addition to “sama”, “dono”, “san”, and the like can be cited. In addition, when the address is a company name or the like, “Gochu” or the like may be mentioned. Each time the
本例の場合はドキュメントデータ70に「様」という文字が存在しているため(敬称51)、文字座標検出部33はその文字(検索指定文字)を検出する。そして、検出した文字(「様」)の座標位置と文字サイズを計算する。
In the case of this example, since the character “sama” exists in the document data 70 (honor title 51), the character coordinate
座標位置は、1文字の場合はその文字の中心位置とし、複数文字の場合は先頭の文字の中心位置とする。文字サイズは、1文字の場合はその文字のみのサイズとし、複数文字の場合はその複数文字全体のサイズとする。 The coordinate position is the center position of the character for a single character, and the center position of the first character for a plurality of characters. The character size is the size of only that character in the case of one character, and the size of the entire plurality of characters in the case of a plurality of characters.
本例の場合は、座標位置がX:Y=4600Line:6800Line(180mm:267mm相当)となり、文字サイズがX:Y=105Line:105Line(12ptからの概略換算値)となる。 In this example, the coordinate position is X: Y = 4600 Line: 6800 Line (equivalent to 180 mm: 267 mm), and the character size is X: Y = 105 Line: 105 Line (roughly converted value from 12 pt).
文字座標検出部33は、更に宛名の貼り付けに必要な情報として文字方向も検出する。検索指定文字が複数文字の場合は、文字の並びが左右方向であれば文字方向を横書き(「ヨコ」)として検出し、文字の並びが上下方向であれば文字方向を縦書き(「タテ」)として検出する。
The character coordinate
本例の「様」のように1文字である場合は、その文字のみでは文字方向を検出できないため、文字座標検出部33が再度、他の複数文字を検索して文字方向を検出したり、ユーザによってドキュメント50の横書き/縦書きを指定してもらったりするなどしてもよい。また、複数文字の再検索では、たとえば、「です。」、「ます。」、「である。」など、文章に必ず存在する文字を検索することで、文字方向の検出が可能である。
In the case of a single character like “sama” in this example, since the character direction cannot be detected only by that character, the character coordinate
本例のドキュメント50は横書きであり、上記の文字方向は横書きとして検出される。文字座標検出部33は、検出した文字(敬称51)を敬称欄に格納すると共にその文字の座標位置と文字サイズの計算結果、および、文字方向の検出結果を格納した敬称座標テーブル42を作成する。
The
(3−2)名簿データからの指定宛名検索方法
図6に示すように、データ保存部14に保存されている名簿データ80が文字座標検出部33に入力される。このデータ入力と共に、原稿情報出力部31は原稿情報テーブル41を文字座標検出部33に出力する。文字照合部32は、予め設定されている宛名検索キーワード91をデータベース38から取得して文字座標検出部33に出力する。本例では、宛名検索キーワード91は「佐藤」としている。
(3-2) Designated Address Retrieval Method from Name List Data As shown in FIG. 6,
なお、本例のようにドキュメントデータ70(ドキュメント50)と名簿データ80(名簿60)で原稿情報テーブル41が共通である場合には、名簿データ80の入力に伴う原稿情報出力部31から文字座標検出部33への原稿情報テーブル41の出力を省略し、文字座標検出部33はドキュメントデータ70の入力時に原稿情報出力部31から入力された原稿情報テーブル41を使用して処理を進めるようにしてもよい。
When the document information table 41 is common to the document data 70 (document 50) and the name list data 80 (name list 60) as in this example, the character coordinates are read from the document
文字座標検出部33は、名簿データ80をOCR処理し、宛名検索キーワード91である「佐藤」という文字が名簿データ80に存在するか検索する。名簿データ80に「佐藤」という文字が存在しておらず、検出できなかった場合には、文字座標検出部33は文字照合部32に対して次の宛名検索キーワードの出力を要求し、新たに入力された宛名検索キーワードを使用して再検索する。
The character coordinate
宛名検索キーワードは、たとえば、日本で使用されている苗字を予めデータベース38に登録しておき、文字照合部32が文字座標検出部33から宛名検索キーワードの出力要求を受ける毎に、使用数の多い(検出確率の高い)苗字から順番に宛名検索キーワード91として出力したり、ユーザが設定した苗字を宛名検索キーワード91として出力したりするなどが可能である。
For example, the last name used in Japan is registered in the
前者の場合は、たとえば図7(A)に示すように、日本での使用数が多く、苗字の検索において検出確率の高い苗字から順番に、「佐藤」、「鈴木」、「高橋」、「田中」などが宛名検索キーワードとして出力される。後者の場合は、たとえば図7(B)に示すように、ユーザが操作部17を通じて設定した「鈴木」という苗字が宛名検索キーワードとして出力される。
In the case of the former, for example, as shown in FIG. 7A, “Sato”, “Suzuki”, “Takahashi”, “ "Tanaka" etc. are output as address search keywords. In the latter case, for example, as shown in FIG. 7B, the last name “Suzuki” set by the user through the
本例の場合は名簿データ80に「佐藤」という文字が存在していないため、図7(A)に例示した構成では、文字座標検出部33は文字照合部32に対して次の宛名検索キーワードの出力を要求する。文字照合部32は、次の宛名検索キーワード92として「鈴木」を文字座標検出部33に出力する(図6参照)。
In the case of this example, since the character “Sato” does not exist in the
「鈴木」という文字は本例の名簿データ80に存在しているため(文字63)、文字座標検出部33はその文字(検索指定文字)を検出し、ここで検索を中止する。そして、検出した文字63(「鈴木」)の座標位置と文字サイズを計算する。なお、1文字であるか複数文字であるかに応じた座標位置と文字サイズの計算方法は、敬称の場合と同じである。
Since the character “Suzuki” is present in the
本例の場合は、座標位置(先頭文字の「鈴」の中心位置)がX:Y=800Line:4300Lineとなり、文字サイズ(「鈴木」の2文字の全体のサイズ)がX:Y=140Line:70Line(8ptからの概略換算値)となる。 In the case of this example, the coordinate position (center position of the first character “bell”) is X: Y = 800 Line: 4300 Line, and the character size (total size of two characters “Suzuki”) is X: Y = 140 Line: 70 Line (approximately converted value from 8 pt).
文字座標検出部33は、更に宛名の貼り付けに必要な情報として文字方向も検出する。なお、1文字であるか複数文字であるかに応じた文字方向の検出方法は、敬称の場合と同じである。本例の「鈴木」のように2文字の並びが左右方向であれば文字方向は横書き(「ヨコ」)として検出される。文字座標検出部33は、検出した文字(文字63)を宛名欄に格納すると共にその文字の座標位置と文字サイズの計算結果、および、文字方向の検出結果を格納した宛名座標テーブル43Aを作成する。
The character coordinate
図8は、上述した敬称/宛名検索の処理の流れを示すフローチャートであり、図3のステップS103を詳細に示したサブルーチンである。 FIG. 8 is a flowchart showing a flow of the above mentioned title / address search process, and is a subroutine showing in detail step S103 of FIG.
敬称/宛名検索の処理が開始されると、文字照合部32は敬称検索キーワードを文字座標検出部33に出力する(ステップS111)。文字座標検出部33は、指定された敬称検索キーワードに一致(該当)する文字(敬称)をドキュメントデータ70から検索する(ステップS112)。検索指定文字を検出できない場合は(ステップS113;No)、文字照合部32に次の敬称検索キーワードの出力を要求する(ステップS111以降の繰り返し)。
When the title / address search process is started, the
検索指定文字を検出できた場合は(ステップS113;Yes)、その文字(敬称)の配置位置などを計算する(ステップS114)。詳細は、上述した座標位置と文字サイズの計算および文字方向の検出である。そして文字座標検出部33は、その結果を敬称座標テーブル42に格納する。
When the search designated character is detected (step S113; Yes), the arrangement position of the character (honor title) is calculated (step S114). Details are the above-described calculation of the coordinate position and character size, and detection of the character direction. Then, the character coordinate
続いて、文字照合部32は宛名検索キーワードを文字座標検出部33に出力する(ステップS115)。文字座標検出部33は、指定された宛名検索キーワードに一致(該当)する文字(宛名(苗字))を名簿データ80から検索する(ステップS116)。検索指定文字を検出できない場合は(ステップS117;No)、文字照合部32に次の宛名検索キーワードの出力を要求する(ステップS115以降の繰り返し(図7(A)に例示した構成の場合))。
Subsequently, the
検索指定文字を検出できた場合は(ステップS117;Yes)、その文字(宛名)の配置位置などを計算する(ステップS118)。詳細は、上述した座標位置と文字サイズの計算および文字方向の検出である。そして文字座標検出部33は、その結果を宛名座標テーブル43に格納し、本処理を終了する(Return)。
When the search designated character is detected (step S117; Yes), the arrangement position of the character (address) is calculated (step S118). Details are the above-described calculation of the coordinate position and character size, and detection of the character direction. Then, the character coordinate
(4)宛名配列位置予測
ここでは、図3のステップS104による、名簿データ80に含まれている宛名(名簿60に記載されている氏名)の配列位置を予測する(配列規則を判定する)方法について説明する。上述した(3−2)で「鈴木」という宛名を1つ検出しており、この検出結果に基づいて「鈴木」以外の宛名がどのように配列されているかを予測する。
(4) Address Array Position Prediction Here, a method for predicting the array position of the address (name described in the name list 60) included in the name list data 80 (determining the order rule) in step S104 of FIG. Will be described. In (3-2) described above, one address “Suzuki” is detected, and based on the detection result, how addresses other than “Suzuki” are arranged is predicted.
図9に示すように、一般に名簿に記載されている氏名が横書きの場合は、氏名が上下方向に配列されている可能性が高く、氏名が縦書きの場合は、氏名が左右方向に配列されている可能性が高い。上述した宛名座標テーブル43Aには、検出した宛名の文字方向(横書き/縦書き)が格納されており、この文字方向に基づいて、検出された宛名(本例では「鈴木」)から次の宛名を検索する方向を決定する。 As shown in FIG. 9, in general, when the name written in the name list is written horizontally, it is highly likely that the name is arranged vertically, and when the name is written vertically, the name is arranged horizontally. There is a high possibility. The address coordinate table 43A described above stores the character direction (horizontal writing / vertical writing) of the detected address. Based on this character direction, the next address is detected from the detected address ("Suzuki" in this example). Determine the direction to search.
図10に示すように、文字座標検出部33からOCR処理済みの名簿データ80と宛名座標テーブル43が宛名配列予測部34に入力される。
As shown in FIG. 10, the OCR-processed
本例のように検出した宛名(「鈴木」)が横書きの場合は、それ以外の宛名は上下に配列されていると予測できる。宛名配列予測部34は、OCR処理された名簿データ80の中から宛名座標テーブル43Aの座標位置に基づいて1つ目の宛名(「鈴木」の文字63)の位置を把握し、宛名座標テーブル43Aの文字方向が「ヨコ」である場合は、名簿データ80の中から上記宛名(「鈴木」の文字63)の上側に隣接する「斉藤」の文字64と下側に隣接する「田中」の文字65を検出して、文字照合部32に宛名であるか否かの照合を依頼する。
When the detected address ("Suzuki") is written horizontally as in this example, it can be predicted that the other addresses are arranged vertically. The address
また、宛名座標テーブル43Aの文字方向が「タテ」である場合は、名簿データ80の中から上記の1つ目の宛名の左側に隣接する文字と右側に隣接する文字を検出して、文字照合部32に宛名であるか否かの照合を依頼する。
Further, when the character direction of the address coordinate table 43A is “vertical”, the character adjacent to the left side and the character adjacent to the right side of the first address is detected from the
なお、上下または左右における片側にしか隣接する文字がない場合には、その1つの文字を検出して、文字照合部32に宛名であるか否かの照合を依頼するようにしてもよい。
If there is a character that is adjacent to only one side of the top, bottom, left, or right, that one character may be detected, and the
文字照合部32は、入力された文字64、65をデータベース38の宛名リストと照合し、その結果を適合または不適合で宛名配列予測部34に出力する。本例の場合は、文字64、65について共に適合を出力する。
The
宛名配列予測部34は、この結果を受けて文字64の「斉藤」と文字65の「田中」が宛名(苗字)であると特定(判定)し、文字63の「鈴木」の上下に宛名が配列されていると予測する。続いて宛名配列予測部34は、文字座標検出部33に、文字63(「鈴木」)の上下に隣接する文字64(「斉藤」)と文字65(「田中」)を指定してそれらの配置位置の計算を依頼する。
In response to this result, the address
文字座標検出部33は、保持しているOCR処理済みの名簿データ80から指定の文字64(「斉藤」)と文字65(「田中」)を検出し、上述した文字63(「鈴木」)の場合と同様の手順で宛名座標テーブルをそれぞれ作成し、配置位置の計算結果として宛名配列予測部34に出力する。
The character coordinate
文字64(「斉藤」)については、座標位置(先頭文字の「斉」の中心位置)がX:Y=800Line:4370Lineとなり、文字サイズ(「斉藤」の2文字の全体のサイズ)がX:Y=140Line:70Lineとなり、文字方向が横書きとなる。文字座標検出部33は、文字64の「斉藤」を宛名欄に格納すると共に上記の各情報を格納した宛名座標テーブル43Bを作成し(図12参照)、宛名配列予測部34に出力する。
For the character 64 (“Saito”), the coordinate position (center position of the first character “Sai”) is X: Y = 800 Line: 4370 Line, and the character size (the overall size of the two characters “Saito”) is X: Y = 140 Line: 70 Line, and the character direction is written horizontally. The character coordinate
文字65(「田中」)については、座標位置(先頭文字の「田」の中心位置)がX:Y=800Line:4230Lineとなり、文字サイズ(「田中」の2文字の全体のサイズ)がX:Y=140Line:70Lineとなり、文字方向が横書きとなる。文字座標検出部33は、文字65の「田中」を宛名欄に格納すると共に上記の各情報を格納した宛名座標テーブル43Cを作成し(図12参照)、宛名配列予測部34に出力する。
For the character 65 (“Tanaka”), the coordinate position (center position of the first character “Ta”) is X: Y = 800 Line: 4230 Line, and the character size (the overall size of the two characters “Tanaka”) is X: Y = 140 Line: 70 Line, and the character direction is written horizontally. The character coordinate
これに伴い、原稿情報出力部31は、宛名配列の計算に用いる原稿情報を格納した前述の原稿情報テーブル41を宛名配列予測部34に出力する。
Accordingly, the manuscript
宛名配列予測部34は、図12に示すように、保持している宛名座標テーブル43Aと、入力された宛名座標テーブル43B、43Cおよび原稿情報テーブル41とに格納されている情報を使用して、宛名配列を計算する。詳細には、既に宛名であることが判明している文字63(「鈴木」)、文字64(「斉藤」)、文字65(「田中」)の各座標位置を示すXYライン数と名簿データ80のXYライン数に基づいて、宛名の配置位置と最大配置数を計算する。
As shown in FIG. 12, the address
宛名の配置位置については、本例の場合は上記3つの文字のX方向における位置が全て800Lineであることから、個々の宛名は名簿データ80におけるX=800Lineに沿った上下方向に配列されていると判定する。
As for the arrangement position of the address, in the case of this example, since the positions in the X direction of the above three characters are all 800 lines, the individual addresses are arranged in the vertical direction along X = 800 Line in the
また、上記3つの文字のY方向における位置から宛名の配置間隔を計算する。本例の場合は、「鈴木」とその上側に隣接する「斉藤」とのY方向の距離(間隔)を計算すると、4370Line−4300Line=70Lineとなる。「鈴木」とその下側に隣接する「田中」とのY方向の距離(間隔)を計算すると、4300Line−4230Line=70Lineとなる。このように、隣接する文字同士の間隔が70Lineであることから、宛名の配置間隔は70Lineであると判定する。 Further, the address arrangement interval is calculated from the positions of the three characters in the Y direction. In the case of this example, if the distance (interval) in the Y direction between “Suzuki” and “Saito” adjacent to the upper side is calculated, 4370Line-4300Line = 70Line. When the distance (interval) in the Y direction between “Suzuki” and “Tanaka” adjacent to the lower side is calculated, 4300 Line−4230 Line = 70 Line. Thus, since the interval between adjacent characters is 70 lines, it is determined that the address arrangement interval is 70 lines.
これらを総合して、宛名の配置位置としては、個々の宛名が名簿データ80におけるX=800Lineに沿った上下方向に70Lineの間隔で配列(配置)されていると判定する。
By combining these, it is determined that each address is arranged (arranged) at intervals of 70 lines in the vertical direction along X = 800 lines in the
宛名の最大配置数については、「鈴木」、「斉藤」、「田中」のいずれかの文字の位置を基準に計算する。たとえば、「鈴木」を基準とした場合は、その上側に配列されている宛名の配置数と下側に配列されている宛名の配置数とを以下の式で計算する。なお、下記式の除算結果で端数が生じた場合は切り捨てる。 The maximum number of addresses is calculated based on the position of any of the characters “Suzuki”, “Saito”, and “Tanaka”. For example, when “Suzuki” is used as a reference, the number of addresses arranged above and the number of addresses arranged below are calculated by the following equations. In addition, if a fraction occurs in the division result of the following formula, it is rounded down.
・基準文字に対する上側の配置数:A={原稿のYライン数(7015Line)−基準文字のYライン数(4300Line)}÷宛名の配置間隔(70Line)
・基準文字に対する下側の配置数:B=基準文字のYライン数(4300Line)÷宛名の配置間隔(70Line)
Number of upper arrangements with respect to the reference character: A = {number of Y lines of the original (7015 Line) −number of Y lines of the reference character (4300 Line)} ÷ address arrangement interval (70 Line)
Number of lower arrangements with respect to the reference character: B = number of Y lines of the reference character (4300 lines) ÷ address arrangement interval (70 lines)
宛名の最大配置数は、下記式で示すように、上記のAとBと、基準文字分の「1」とを加算した値となる。 As shown in the following formula, the maximum number of addresses is a value obtained by adding the above A and B and “1” for the reference character.
宛名の最大配置数:Nmax=A+B+1 Maximum number of addresses to be arranged: N max = A + B + 1
なお、本例では宛名の配置位置と最大配置数の計算を、宛名の配列方向が上下方向の場合で説明しているが、宛名の配列方向が左右方向の場合でも、「X」と「Y」を入れ替え、「上下」を「左右」に置き換えるだけで、計算方法自体は同じである。 In this example, the calculation of the address arrangement position and the maximum number of addresses is described in the case where the address arrangement direction is the vertical direction. However, even when the address arrangement direction is the horizontal direction, “X” and “Y ”Is replaced, and“ upper and lower ”is replaced with“ left and right ”, and the calculation method itself is the same.
宛名配列予測部34は、上記の計算を終えると、宛名欄と、座標位置欄(XYライン数)と、文字サイズ欄(XYライン数)とを対応させて宛名数分だけ設けたマトリックス状の宛名配列テーブル44を作成し、宛名毎の座標位置と文字サイズを格納する。また、既に宛名であることが判明している「鈴木」、「斉藤」、「田中」を対応する宛名欄に格納する。
Upon completion of the above calculation, the address
図13は、上述した宛名配列位置予測の処理の流れを示すフローチャートであり、図3のステップS104を詳細に示したサブルーチンである。 FIG. 13 is a flowchart showing a flow of the above-described address array position prediction process, which is a subroutine showing in detail step S104 of FIG.
宛名配列位置予測の処理が開始されると、文字座標検出部33はOCR処理済みの名簿データ80と宛名座標テーブル43Aを宛名配列予測部34に出力する。宛名配列予測部34は、宛名座標テーブル43Aに格納されている宛名(「鈴木」)の文字方向に基づいて、その宛名を基点とした名簿データ80における宛名配列方向を予測する(ステップS121)。
When the address array position prediction process is started, the character coordinate
続いて、上記の宛名(「鈴木」)に対して予測配列方向に配置されている文字(「斉藤」、「田中」)を宛名候補として名簿データ80から検出し(ステップS122)、文字照合部32に宛名であるか否かの照合を依頼する。文字照合部32は、データベース38の宛名リストで照合を行い、その結果を宛名配列予測部34に出力する(ステップS123)。
Subsequently, the characters (“Saito”, “Tanaka”) arranged in the predicted arrangement direction with respect to the above address (“Suzuki”) are detected from the
照合されなかった場合は(ステップS124;No)、予測配列方向に配置されている次の文字を宛名候補として検出し、文字照合部32に同様の照合を依頼する(ステップS122以降の繰り返し)。 If not collated (step S124; No), the next character arranged in the predicted arrangement direction is detected as a candidate address and a similar collation is requested to the character collation unit 32 (repetition after step S122).
照合された場合は(ステップS124;Yes)、文字座標検出部33は、その文字(宛名)の配置位置などを計算する(ステップS125)。詳細は、座標位置と文字サイズの計算および文字方向の検出である。文字座標検出部33は、その結果を宛名座標テーブル43B、43Cに格納し、宛名座標テーブル43B、43Cを宛名配列予測部34に入力する。また原稿情報出力部31は、原稿情報テーブル41を宛名配列予測部34に入力する。
When collation is performed (step S124; Yes), the character coordinate
宛名配列予測部34は、宛名座標テーブル43A、43B、43Cに格納されている各宛名のXYライン数と、原稿情報テーブル41に格納されている名簿60のXYライン数に基づいて、文字(宛名)の配列(宛名の配置位置と最大配置数)を計算し、その結果を宛名配列テーブル44として作成し(ステップS126)、本処理を終了する(Return)。
The address
(5)宛名読み出し
図3のステップS105では、上述した宛名の配列予測(計算結果)に基づいて名簿データ80から宛名を読み出す。図14に示すように、宛名配列予測部34からOCR処理済みの名簿データ80と宛名配列テーブル44が宛名読出部35に入力される。宛名読出部35は、既に宛名であることが判明している「鈴木」、「斉藤」、「田中」を除いて、名簿データ80から宛名配列テーブル44の各座標位置(XYライン数)に配置されている文字を検出し、対応する宛名欄に格納する。検出および格納した結果は図示の通りとなる。なお、「空欄」は空白で文字が無いことを示す。
(5) Address Reading In step S105 in FIG. 3, the address is read from the
(6)宛名判定
名簿60には宛名以外にも様々な文字が記載されているため、名簿データ80から読み出した文字が宛名であるか否か判定する必要がある。図3のステップS106ではその判定を行う。図15に示すように、宛名読出部35から宛名配列テーブル44が宛名判定部36に入力される。宛名判定部36は、宛名配列テーブル44の宛名欄に格納されている文字を順番に文字照合部32に入力して宛名であるか否かの照合を依頼する。
(6) Address determination Since various characters other than the address are described in the
文字照合部32は、入力された文字をデータベース38の宛名リストと照合し、その結果を適合(○)または不適合(×)で宛名判定部36に出力する。
The
たとえば、文字の無い「(空欄)」部分は宛名リストに登録されていないため、不適合となる。「年○組」や「氏名」などの文字も宛名リストに登録されていないため、不適合となる。これに対し、「安藤」、「斉藤」、「鈴木」、「田中」、「渡辺」などは宛名リストに登録されており、適合となる。 For example, the “(blank)” portion without characters is not registered in the address list, and is not suitable. Since characters such as “Year ○ Class” and “Name” are not registered in the address list, they are not suitable. On the other hand, “Ando”, “Saito”, “Suzuki”, “Tanaka”, “Watanabe”, etc. are registered in the address list and are relevant.
宛名判定部36は、宛名配列テーブル44に宛名判定欄を追加した宛名判定テーブル45を作成し、文字照合部32からの適合(○)または不適合(×)を、対応する文字の宛名判定欄に格納して宛名判定テーブル45を完成させる。この宛名判定欄に格納された情報は、「○」が宛名であることを示し(宛名適合)、「×」が宛名ではないことを示す(宛名不適合)。
The
なお、宛名であることが既に判明している「鈴木」、「斉藤」、「田中」については、宛名配列テーブル44の作成時に予め宛名判定欄を設けて適合(○)を格納しておくことにより、文字照合部32への照合依頼を省略するようにしてもよい。
For “Suzuki”, “Saito”, and “Tanaka” that have already been identified as addresses, an address determination column is provided in advance when the address array table 44 is created, and conformance (○) is stored. Thus, the collation request to the
また、日本で使用されている苗字は数万種以上あると推定され、一般的なものでも数千種以上あるとされており、宛名(苗字)の判定精度を高めるためにデータベースの登録数を多くすると、照合に時間を要することが懸念される。また、宛名として取引先の社名を登録し照合するような場合も、登録数が数百社などと多くなる場合は同様の懸念がある。いずれにしても、名簿における宛名の記載数が多くて照合する文字の数(宛名の判定数)が多くなる場合は、全ての文字の照合に要する時間が長くなることが懸念される。 In addition, it is estimated that there are more than tens of thousands of last names used in Japan, and it is said that there are more than several thousand even general ones. To increase the accuracy of address (last name) judgment, the number of registered databases is increased. If it is increased, there is a concern that it takes time for verification. In addition, when the company name of a business partner is registered and collated as an address, there is a similar concern when the number of registrations increases to several hundred companies. In any case, when the number of addresses in the name list is large and the number of characters to be verified (address determination number) is large, there is a concern that the time required for verification of all characters may become long.
そこで、宛名でないことは明確であるが名簿などで多用される文字、たとえば、名簿の名称や記載内容(情報)の種類を示す単語などを、非宛名リストとしてデータベース38に登録し、対象の文字をその非宛名リストで先に検索するようにしてもよい。
Therefore, although it is clear that it is not an address, a character frequently used in a name list or the like, for example, a word indicating the name of the name list or the type of description (information) is registered in the
非宛名リストに登録する文字は、一例として、上記の「年○組」や「氏名」の他に、「名簿」、「名前」、「男性」、「女性」、「学校」(小学校/中学校/専門学校)、「高校」、「大学」、「クラス」(クラス名簿)、「連絡網」(緊急連絡網)、「会社」、「役員」(役員名簿)、「社員」(社員名簿)、「団体」(団体名簿)、「サークル」(サークル名簿)、「自治会」(自治会名簿)などが挙げられる。さらに、「住所」、「郵便番号」、「電話番号」、「生年月日」、「備考」などを加えるようにしてもよい。 For example, in addition to the above “Year ○ Class” and “Name”, the characters to be registered in the non-address list are “name list”, “name”, “male”, “female”, “school” (elementary / junior high school) / Vocational school), "high school", "university", "class" (class list), "contact network" (emergency contact network), "company", "executive" (director list), "employee" (employee list) , “Group” (group list), “circle” (circle list), “resident's association” (local community list), and the like. Furthermore, “address”, “postal code”, “phone number”, “date of birth”, “remarks”, and the like may be added.
このような非宛名リストで対象の文字を先に検索し、該当する場合は不適合(×)とすることで、宛名判定の効率や精度を向上することができる。さらに、この非宛名リストを上述した宛名配列を予測するときの文字(本例では「斉藤」と「田中」)の照合に利用するようにしてもよい。 By searching for the target character first in such a non-address list and making it non-conforming (x) if applicable, the efficiency and accuracy of address determination can be improved. Furthermore, this non-address list may be used for collation of characters (in this example, “Saito” and “Tanaka”) when predicting the above-described address arrangement.
また、宛名判定の結果を表示部18に表示して誤りが無いかをユーザが確認できるようにしたり、操作部17を通して確定や訂正できるようにしたりしてもよい。たとえば、宛名候補として検出した文字とその宛名判定結果(「○」/「×」)を表示する。誤りが無ければ確定し、宛名である文字に誤判定で付けられた「×」は「○」に、宛名でない文字に誤判定で付けられた「○」は「×」に訂正できるように構成するなどしてもよい。
Further, the result of the address determination may be displayed on the
また、ドキュメントの内容などによっては、名簿に記載されている全ての宛名が差し出しの対象ではなく、特定の宛名のみが対象になるようなこともある。このような場合に、ユーザは宛名であるが出力する必要のない文字に対し、意図的に「○」から「×」に変更するようなことも可能になる。 Further, depending on the contents of the document, not all addresses listed in the name list may be targeted, but only specific addresses may be targeted. In such a case, the user can intentionally change from “◯” to “X” for characters that are addressed but do not need to be output.
(7)宛名貼り付け
図3のステップS107では、図16に示すように、文字座標検出部33は敬称座標テーブル42を宛名貼付部37に出力し、宛名判定部36は宛名判定テーブル45を宛名貼付部37に出力する。
(7) Address Pasting In step S107 of FIG. 3, as shown in FIG. 16, the character coordinate
宛名貼付部37は、入力された各テーブルの情報に基づいて宛名の貼り付け位置を計算する。また、貼り付け位置の条件として、本例では以下の3つの条件が予め設定されている。
The
・条件A:宛名と敬称の並びを揃える。
⇒文字方向が横書きの場合はY方向の位置を合わせる。
文字方向が縦書きの場合はX方向の位置を合わせる。
・条件B:宛名と敬称の文字の大きさ(フォントサイズ)を揃える。
・条件C:宛名と敬称の間に1文字分の空白を設ける。
・ Condition A: Align the address and the title.
⇒If the text direction is horizontal writing, align the Y direction.
If the character direction is vertical writing, align the position in the X direction.
Condition B: The size of the address and title characters (font size) are aligned.
Condition C: A space for one character is provided between the address and the title.
敬称座標テーブル42より、敬称51(「様」)の座標位置はX:Y=4600Line:6800Line、文字サイズはX:Y=105Line×105Line、文字方向は横書きとなっている。 According to the title coordinate table 42, the coordinate position of the title 51 (“sama”) is X: Y = 4600 Line: 6800 Line, the character size is X: Y = 105 Line × 105 Line, and the character direction is horizontal writing.
たとえば、「鈴木」という宛名52を貼り付ける場合は、条件AよりY方向の位置が6800Lineとなる。条件Bより、文字の大きさは1文字当たり8pt(70Line×70Line)から12pt(105Line×105Line)へ1.5倍拡大することになり、「鈴木」の2文字全体の文字サイズがX:Y=140Line×70LineからX:Y=210Line×105Lineに変更される。条件Cより、「鈴木」と「様」の間に1文字分に相当するX:Y=105×105Line分の空白が設けられることになる。
For example, when the
その結果、「鈴木」の貼り付け位置(先頭文字の「鈴」の中心位置)はX:Y=4285Line:6800Lineとなる。なお、「木」の貼り付け位置(中心位置)はX:Y=4390Line:6800Lineとなる。 As a result, the position where “Suzuki” is pasted (the center position of the first character “bell”) is X: Y = 4285 Line: 6800 Line. It should be noted that the pasting position (center position) of “tree” is X: Y = 4390 Line: 6800 Line.
また宛名貼付部37は、宛名判定テーブル45における宛名判定の「○」の数をカウントして、最終的に確定された宛名の数を求め、その宛名数分のドキュメントデータ70の出力を要求する。これにより、データ保存部14に保存されているドキュメントデータ70が宛名貼付部37に順次入力される。
Further, the
宛名貼付部37は、宛名判定テーブル45の宛名欄から宛名判定が「○」となっている宛名を順番に読み出し、文字サイズを変更してドキュメントデータ70における上記の位置に貼り付ける。この宛名を貼り付けたドキュメントデータ75をプリンタ部24に出力することを、最後の宛名に対して終えるまで繰り返す。
The
(8)宛名入りドキュメント出力
図3のステップS108では、図16に示すように、プリンタ部24は宛名貼付部37から入力されたドキュメントデータ75に対応する画像を用紙に形成し、宛名入りのドキュメント55として出力する。
(8) Addressed Document Output In step S108 of FIG. 3, as shown in FIG. 16, the
このように、本実施の形態に係る複合機10では、入力された名簿データ80に含まれている複数の文字情報の中から、配列規則を判定しようとする宛名に属する文字情報(宛名検索キーワード)を使用して、その文字情報に該当する第1の文字情報(本例では「鈴木」)を検索する。この第1の文字情報から所定方向(上下左右方向)に検索して宛名に属する第2の文字情報(本例では「斉藤」、「田中」)を特定し、第1の文字情報と第2の文字情報との位置関係に基づいて、宛名の配列規則を判定する。たとえば上述したように、宛名は第1の文字情報と第2の文字情報とを含む列方向に第1の文字情報と第2の文字情報の間隔で配列されているなどと判定する。これにより、名簿データ80に含まれている宛名の配列規則を判定することができる。
As described above, in the
また、名簿データ80から第1の文字情報を検索する場合に、宛名(苗字)の検索における検出確率の高い宛名検索キーワードから順番に使用して(本例では「佐藤」→「鈴木」→「高橋」→「田中」→・・・など)、該当する文字情報を検索し、宛名検索キーワードに該当する文字情報が検出された場合にその文字情報を第1の文字情報に決定する。このように、検出確率の高い宛名検索キーワードから順番に使用して検索を行うことで、第1の文字情報の検索効率を向上することができる。
Further, when searching for the first character information from the
また、第1の文字情報から第2の文字情報を検索する際に、第1の文字情報が横書きの場合には宛名が上下方向に配列されていると予測して上下方向に検索し、縦書きの場合には宛名が左右方向に配列されていると予測して左右方向に検索する。このように、第1の文字情報の文字方向(横書き/縦書き)に基づいて第2の文字情報の検索方向を決定することにより、第2の文字情報を効率よく検索して特定することができる。 Further, when searching for the second character information from the first character information, if the first character information is horizontal writing, the search is performed in the vertical direction by predicting that the address is arranged in the vertical direction. In the case of writing, it is predicted that the address is arranged in the left-right direction and the search is performed in the left-right direction. Thus, by determining the search direction of the second character information based on the character direction (horizontal writing / vertical writing) of the first character information, the second character information can be efficiently searched and specified. it can.
また、名簿データ80(名簿60)から抽出した宛名をドキュメントデータ70(ドキュメント50)に合成する際には、ドキュメントデータ70から検索した敬称(指定の文字情報)に対して、第1の原稿データから抽出した文字情報を合成する場合に、合成する宛名の位置と書式(文字の大きさ、文字方向など)を、上記敬称の位置と書式に基づいて決定する。これにより、敬称に対して合成する宛名を見栄え良く配置したり、見栄えの良くなる書式にしたりすることができる。
When the address extracted from the name list data 80 (name list 60) is combined with the document data 70 (document 50), the first manuscript data for the title (designated character information) searched from the
また、名簿データ80から抽出した文字に対する宛名判定の結果を表示部18に表示してユーザが確認し、操作部17を通して確定や訂正できるように構成した場合は、自動判定で誤って判定された宛名や出力する必要のない宛名などがドキュメントに合成されて出力されるような無駄を抑制することができる。
In addition, when it is configured such that the result of address determination for characters extracted from the
[第2の実施の形態]
第1の実施の形態では名簿に宛名が1列で記載されている場合を説明したが、第2の実施の形態では複数列で記載されている場合について説明する。
[Second Embodiment]
In the first embodiment, the case where the address is described in one column in the name list has been described. In the second embodiment, the case where the address is described in a plurality of columns will be described.
名簿には、宛名(氏名)が複数列で記載されているものがある。その場合は、図17に示すように、宛名が横書きであるか縦書きであるかにかかわらず、最初に検出した宛名(たとえば「鈴木」)の上下左右に他の宛名が配置されている可能性が高い。 Some names have names (names) listed in multiple columns. In this case, as shown in FIG. 17, it is possible that other addresses are arranged on the top, bottom, left and right of the first detected address (for example, “Suzuki”) regardless of whether the address is written horizontally or vertically. High nature.
このような名簿の例としては、図18に示すように、氏名を男女別に記載する場合などが挙げられる。この名簿200を例に、宛名が複数列で配列(2次元配列)されているときの配列規則の判定方法を説明する。
As an example of such a name list, as shown in FIG. Using this
まず、第1の実施の形態で説明した(1)原稿データ入力により、データ入力部22からドキュメント50の画像データ(ドキュメントデータ70)と名簿200の画像データ(名簿データ210)が入力され、データ保存部14に保存される。続いて、(2)原稿情報作成、および、(3−1)ドキュメントデータからの指定敬称検索方法を同様に行う。
First, the image data (document data 70) of the
続いて、文字座標検出部33は名簿データ210をOCR処理し、第1の実施の形態で説明した(3−2)名簿データからの指定宛名検索方法により(図6参照)、宛名検索キーワードに該当する文字を検索する。
Subsequently, the character coordinate
本例の名簿データ210にも1番目の宛名検索キーワードである「佐藤」が存在していないことにより、2番目の宛名検索キーワードである「鈴木」を検索する。「鈴木」は、男性側の列(1列目)に配置されている文字201と、女性側の列(2列目)に配置されている文字202とで2つ存在している。文字座標検出部33は、これらのいずれか1つを検出した時点で検索を中止する。ここでは、1列目の文字201を検出した場合で説明する。
Since the first address search keyword “Sato” does not exist in the
次に、第1の実施の形態で説明した(4)宛名配列位置予測により(図10〜図13参照)、文字座標検出部33からOCR処理済みの名簿データ210が宛名配列予測部34に入力され、宛名配列予測部34は文字201の上下に配列されている各文字を検出し、図19に示すような宛名配列テーブル220を作成する。この宛名配列テーブル220の宛名欄には、第1の実施の形態で説明した(5)宛名読み出しにより(図14参照)、名簿データ210の1列目に配列されている各文字が格納される。
Next, (4) address arrangement position prediction described in the first embodiment (see FIGS. 10 to 13), the OCR-processed
続いて、文字座標検出部33は左右方向(2列目以降)の宛名検索を行う。左右方向の宛名検索は、たとえば、名簿データ210のXY座標における原点位置(左下角部)の直近に配置されている宛名候補の文字(空欄を含む)を基準に開始する。本例の場合は、図19に示すように、「(空欄)」⇒「渡辺」・・・⇒「年○組」⇒「(空欄)」の順番に左右方向の宛名検索を順次行う。
Subsequently, the character coordinate
図20に示すように、最初に空欄203の左右方向に配置されている文字を検出する。本例の場合、空欄203の左右には文字が存在していないため検出できないことになる。このような場合は、次の文字(「渡辺」)に移行する。 As shown in FIG. 20, first, the characters arranged in the left-right direction of the blank 203 are detected. In the case of this example, since there are no characters on the left and right of the blank 203, it cannot be detected. In such a case, the process proceeds to the next character (“Watanabe”).
2番目の「渡辺」の文字204の左右方向に配置されている文字の検出では、本例の場合は、右側に配置されている「渡辺」の文字205を検出する。宛名配列予測部34は、文字照合部32にこの文字が宛名であるか否かの照合を依頼する。
In the detection of the character arranged in the left-right direction of the second “Watanabe”
本例における文字205の「渡辺」は宛名(苗字)であると特定(判定)され、宛名配列予測部34は文字205の上側に宛名が配列されていると予測する。続いて、文字205の上側に隣接する文字を検出し、文字照合部32に宛名であるか否かの照合を依頼する。この文字が宛名であると特定された場合には、宛名配列予測部34は文字座標検出部33に、文字205(「渡辺」)とその上側に位置する文字を指定してそれらの配置位置の計算を依頼する。
In this example, “Watanabe” of the
文字座標検出部33は、指定された文字に対する配置位置の計算結果を宛名座標テーブルとして宛名配列予測部34に出力する。宛名配列予測部34は、この宛名座標テーブルに基づいて、第1列目と同様の手順で第2列目に対する宛名の配置位置と最大配置数を計算する。続いて、第1列目の宛名配列テーブル220に、第2列目の宛名欄と、座標位置欄(XYライン数)と、文字サイズ欄(XYライン数)とを追加した宛名配列テーブルを作成し(図12参照)、宛名読出部35に出力する((4)宛名配列位置予測を参照)。
The character coordinate
宛名読出部35は、名簿データ210から上記の宛名配列テーブルにおける第2列目の各座標位置に配置されている文字を検出し、対応する宛名欄に格納する。これにより、図21に示すような宛名配列テーブル221が作成される((5)宛名読み出しを参照)。
The
以降は、第1の実施の形態で説明した宛名配列テーブル44を上記の宛名配列テーブル221に置き換えた内容で、(6)宛名判定〜(8)宛名入りドキュメント出力を行う。これにより、名簿200に2列で記載されている個々の宛名が記入された宛名数分のドキュメントが複合機10から印刷出力される。
Thereafter, (6) address determination to (8) addressed document output is performed with the contents obtained by replacing the address arrangement table 44 described in the first embodiment with the address arrangement table 221 described above. As a result, as many documents as the number of addresses in which the individual addresses described in two columns in the
このように、本実施の形態では宛名が複数列で記載されている名簿に対して、宛名の配列規則を判定できるようになる。また、ここでは名簿200(名簿データ210)における1列目の文字201を検出した場合で説明したが、2列目の文字202を検出した場合でも、上述した手順で同様に複数列の配列規則を判定することができる。
As described above, according to the present embodiment, it is possible to determine an address arrangement rule for a name list in which addresses are described in a plurality of columns. In addition, here, the case where the first column of
[第3の実施の形態]
第1および第2の実施の形態では名簿が1ページの場合(宛名が1ページに記載されている場合)を説明したが、第3の実施の形態では名簿が複数ページの場合(宛名が複数ページに記載されている場合)について説明する。
[Third Embodiment]
In the first and second embodiments, the case where the name list is one page (when the address is described on one page) has been described. However, in the third embodiment, the name list is composed of a plurality of pages (the number of addresses is plural). (If it is listed on the page).
名簿には、宛名(氏名)が複数ページに亘って記載されているものがある。このような名簿の例としては、図22に示すように、氏名を男女別に異なるページに記載する場合などが挙げられる。この名簿300を例に、宛名が複数ページに記載されているときの配列規則の判定方法を説明する。
Some names have names (names) written over a plurality of pages. As an example of such a name list, as shown in FIG. 22, there is a case where names are described on different pages for each gender. Taking the
本例の名簿300は計2ページとされており、1ページ目301に男性の氏名が記載され、2ページ目302に女性の氏名が記載されている。
The
まず、第1の実施の形態で説明した(1)原稿データ入力により、データ入力部22からドキュメント50の画像データ(ドキュメントデータ70)と、名簿300における1ページ目301の画像データ(名簿1ページ目データ311)および2ページ目302の画像データ(名簿2ページ目データ312)とが入力され、データ保存部14に保存される。
First, as described in the first embodiment (1), by inputting document data, the image data of the document 50 (document data 70) from the
複合機10は、このデータ入力において名簿のページ数を取得する。ページ数の取得は、たとえば、ユーザが操作部17を通して名簿のページ数を入力したり、前述したような読み取る原稿の種類を指定できる構成にて、名簿を指定した読み取りにてページ数をカウントしたりするなどにより行うことができる。
The
続く(2)原稿情報作成では、原稿情報出力部31は、第1の実施の形態で説明した原稿情報テーブル41に追加して、名簿データとして名簿のページ数(本例では2ページ)を格納した原稿情報テーブル320を作成する。
In the subsequent (2) document information creation, the document
(3)敬称/宛名検索における(3−2)名簿データからの指定宛名検索方法、および、(4)宛名配列位置予測では、原稿情報テーブル320の名簿データに格納されているページ数より、名簿300のページ数を把握し、上記の(3−2)および(4)を名簿1ページ目データ311と名簿2ページ目データ312に対して順番に行う。そして、宛名配列予測部34は、宛名配列位置予測の結果として図23に示すような宛名配列テーブル330を作成する。
(3) In the title / address search, in (3-2) the designated address search method from the name list data, and (4) address array position prediction, the name list is determined from the number of pages stored in the name list data of the document information table 320. The number of 300 pages is grasped, and the above (3-2) and (4) are sequentially performed on the name list
本例の宛名配列テーブル330では、座標位置(XYライン数)の格納欄内に宛名数分のページ欄(「page」)が追加して設けられており、宛名を読み出す名簿のページ数がページ欄に格納されている。 In the address arrangement table 330 of this example, a page field (“page”) corresponding to the number of addresses is additionally provided in the storage field of the coordinate position (the number of XY lines), and the number of pages of the name list from which the address is read is the page. Stored in the column.
(5)宛名読み出しでは、宛名読出部35が宛名配列テーブル330を使用して名簿1ページ目データ311と名簿2ページ目データ312から宛名を読み出す。図22に示した2ページの名簿300から宛名を読み出した結果が図23となる。
(5) In the address reading, the
以降は、第1の実施の形態で説明した宛名配列テーブル44を上記の宛名配列テーブル330に置き換えた内容で、(6)宛名判定〜(8)宛名入りドキュメント出力を行う。これにより、2ページの名簿300に記載されている個々の宛名が記入された宛名数分のドキュメントが複合機10から印刷出力される。
Thereafter, (6) address determination to (8) addressed document output is performed with the contents obtained by replacing the address arrangement table 44 described in the first embodiment with the address arrangement table 330 described above. As a result, documents corresponding to the number of addresses in which individual addresses described in the two-
このように、本実施の形態では、宛名が複数ページに亘って記載されている名簿に対して、ページ毎に宛名の配列規則を判定できるようになる。 As described above, according to the present embodiment, it is possible to determine an address arrangement rule for each page with respect to a name list in which the address is described over a plurality of pages.
以上、本発明の実施の形態を図面によって説明してきたが、具体的な構成は実施の形態に示したものに限られるものではなく、本発明の要旨を逸脱しない範囲における変更や追加があっても本発明に含まれる。 The embodiment of the present invention has been described with reference to the drawings. However, the specific configuration is not limited to that shown in the embodiment, and there are changes and additions within the scope of the present invention. Are also included in the present invention.
たとえば、上述の実施の形態では、配列規則を判定する文字情報群の種類として、名簿に記載されている宛名(氏名)を例に説明したが、対象となる文字情報群の種類はこれに限らない。個人名(氏名)以外の宛名や、宛先などとしてもよい。 For example, in the above-described embodiment, the address (name) described in the name list has been described as an example of the type of character information group for determining the arrangement rule. However, the type of character information group to be targeted is not limited to this. Absent. An address other than the personal name (name) or a destination may be used.
前者の例としては、社名、店名、機関名、団体名、法人名などの各種の集団名などが挙げられる。後者の例としては、住所、郵便番号、電話番号、電子メールアドレスなどが挙げられる。 Examples of the former include various group names such as company names, store names, institution names, organization names, and corporate names. Examples of the latter include an address, a postal code, a telephone number, and an e-mail address.
また、名簿から宛名と宛先を抽出してドキュメントに合成するなどのように、第1の原稿データに含まれている複数種類の文字情報群の配列規則を判定すると共に、それらを抽出し組み合わせて第2の原稿データに合成して出力するようにしてもよい。 In addition, an arrangement rule of a plurality of types of character information groups included in the first manuscript data is determined and extracted and combined, such as extracting an address and an address from a name list and combining them into a document. The second original data may be combined and output.
第2の原稿データは、実施の形態で説明したようなドキュメントデータに限らない。たとえば、特定の書式の名簿に記載されている文字情報を抽出して他の書式の名簿に合成するようなことも可能であり、その場合は、第1の原稿データとしての名簿データとは異なる名簿データが第2の原稿データとなる。 The second document data is not limited to document data as described in the embodiment. For example, it is also possible to extract character information described in a name list of a specific format and combine it with a name list of another format. In this case, it is different from name list data as the first document data. The list data becomes the second document data.
具体的には、複数種類の文字情報(たとえば、氏名、住所、郵便番号、電話番号など)が記載されている名簿から所定種類の文字情報のみ(たとえば、氏名と電話番号のみなど)を抽出して他の名簿に転記するような編集や、縦書きの名簿から横書きの名簿に作り替えるような書式変更(フォーマット変更)などが挙げられる。 Specifically, only a certain type of text information (for example, only name and phone number) is extracted from a list that contains multiple types of text information (for example, name, address, postal code, telephone number). Editing to transfer to another name list, format change (format change) to change from a vertically written name list to a horizontally written name list, and the like.
(4)宛名配列位置予測では、最初に検出した宛名の文字方向に基づいて次の宛名の検索方向を決定するようにしているが、決定した方向に検索して2つ目以降の宛名を特定できなかった場合には、その方向とは異なる方向に検索して同宛名を特定するようにしてもよい。たとえば、最初に検出した宛名の文字方向が横書きであり、その宛名から先ず上下方向に検索して2つ目以降の宛名を特定できなかった場合には、次は左右方向に検索して同宛名を特定するなどである。 (4) In the address arrangement position prediction, the search direction of the next address is determined based on the character direction of the address detected first, but the second and subsequent addresses are specified by searching in the determined direction. If not, the address may be specified by searching in a direction different from that direction. For example, if the letter direction of the first detected address is horizontal writing, and if the second and subsequent addresses cannot be specified by first searching up and down from that address, the next address will be searched in the left and right direction. And so on.
また、上記の文字方向以外の条件に基づいて2つ目以降の宛名の検索方向を決定するようにしてもよい。 Further, the search direction of the second and subsequent addresses may be determined based on conditions other than the above character direction.
具体的には、ユーザが指定した検索方向に決定したり、最初に検出した宛名と周囲(上下左右)に隣接配置されている文字の書式を比較し、その比較結果に基づいて検索方向を決定したりするなどが可能である。後者の場合の書式には、文字の大きさや書体などを用いることができる。 Specifically, the search direction specified by the user is determined, or the first detected address is compared with the character format adjacent to the surroundings (up, down, left and right), and the search direction is determined based on the comparison result. It is possible to do. As the format in the latter case, a character size or a typeface can be used.
たとえば、書式の異なる文字が配置されている方向に宛名が配列されている可能性は低いと予測できるため、その方向は検索方向から除外して、残りの方向を検索方向に決定するなどが可能である。また、このような文字の書式による条件と、上記の文字方向による条件とから総合的に判断して2つ目以降の宛名の検索方向を決定するようにしてもよい。 For example, it can be predicted that the address is unlikely to be arranged in the direction in which characters with different formats are arranged, so that direction can be excluded from the search direction and the remaining direction can be determined as the search direction It is. Further, the search direction of the second and subsequent addresses may be determined comprehensively based on the condition based on the character format and the condition based on the character direction.
(7)宛名貼り付けにて説明した貼り付け位置の条件は、上述した3つの条件に限らない。この貼り付け位置の条件は、原稿の書式などに応じた様々な条件を設定することができる。また、管理者やユーザなどが条件の設定や変更を行えるように構成してもよい。 (7) The conditions of the pasting position described in the address pasting are not limited to the above three conditions. Various conditions can be set for the pasting position according to the format of the document. Moreover, you may comprise so that an administrator, a user, etc. can set and change conditions.
第2の実施の形態で説明した複数列に対する配列規則の判定では、1列目の宛名配列予測後に行う2列目以降の宛名の検索(左右方向の宛名検索)を、原稿の原点位置の直近に配置されている宛名から順番に行うようにしているが、順番はこれに限らない。 In the determination of the arrangement rule for a plurality of columns described in the second embodiment, address search (address search in the left-right direction) after the second column performed after the address sequence prediction of the first column is performed immediately after the origin position of the document. The addresses are arranged in order from the addresses arranged in the above, but the order is not limited to this.
また、宛名の配列規則を列毎に行うようにしているが、たとえば、最初の列で判定した配列規則を他の列に適用するようにしてもよい。この場合は、配列規則の判定処理を軽減することができる。 In addition, although the arrangement rule of the address is performed for each column, for example, the arrangement rule determined in the first column may be applied to other columns. In this case, the arrangement rule determination processing can be reduced.
また、3列以上でも配列規則の判定が可能である。その場合は、たとえば、1列目の宛名と2列目の宛名の位置関係(間隔)に基づいて、列に沿った方向(実施の形態における上下方向)とは異なる方向(実施の形態における左右方向)の配列規則を判定するようにしてもよい。 In addition, the arrangement rule can be determined even in three or more columns. In this case, for example, based on the positional relationship (interval) between the first column address and the second column address, the direction (vertical direction in the embodiment) is different from the direction (vertical direction in the embodiment). The direction rule may be determined.
第3の実施の形態で説明した複数ページに対する配列規則の判定では、ページ毎に配列規則を判定するようにしているが、特定のページで判定した配列規則を他のページに適用するようにしてもよい。この場合の特定のページは、1ページ目に限らない。たとえば、最初の検索キーワードに該当する文字情報を含んだページが特定のページとなる。 In the determination of the arrangement rule for a plurality of pages described in the third embodiment, the arrangement rule is determined for each page. However, the arrangement rule determined for a specific page is applied to other pages. Also good. The specific page in this case is not limited to the first page. For example, a page including character information corresponding to the first search keyword is a specific page.
また、文字情報の提示や照合に用いるデータベース38を複合機10の内部に設ける構成としているが、このようなデータベースを外部に設けて複合機10がアクセスするような構成としてもよい。
Further, although the
複合機10に対するデータ入力は、実施の形態で説明した原稿の読み取りによる入力に限らない。たとえば、ネットワークで接続されたクライアント端末などからの印刷データの入力や、USB(Universal Serial Bus)メモリなどの外部接続が可能な情報記憶装置からのファイルデータの入力などとしてもよい。
Data input to the
複合機10からのデータ出力は、実施の形態で説明した印刷による出力に限らない。たとえば、ネットワークで接続されたクライアント端末やサーバなどの外部装置へのデータ転送による出力や、上記のUSBメモリなどへのファイルデータの出力などとしてもよい。
Data output from the
また、複合機10におけるプリンタ部24は、レーザ光に代えてLED(Light Emitting Diode)で感光体ドラムを走査露光するLEDプリンタなどの他の方式のプリンタとしてもよい。
The
また本発明は、実施の形態で説明した複合機に限らず、複写機やプリンタ機などの他の画像処理装置にも適用可能である。 The present invention is not limited to the multi-function device described in the embodiment, but can be applied to other image processing apparatuses such as a copying machine and a printer.
10…複合機(MFP)
11…CPU
12…バス
13…ROM
14…RAM/データ保存部
15…不揮発メモリ
16…ハードディスク装置
17…操作部
18…表示部
19…ファクシミリ通信部
20…ネットワーク通信部
21…原稿送り装置制御部
22…スキャナ部/データ入力部
23…画像処理部
24…プリンタ部/データ出力部
31…原稿情報出力部
32…文字照合部
33…文字座標検出部
34…宛名配列予測部
35…宛名読出部
36…宛名判定部
37…宛名貼付部
38…データベース
41…原稿情報テーブル
42…敬称座標テーブル
43…宛名座標テーブル
43A、43B、43C…宛名座標テーブル
44…宛名配列テーブル
45…宛名判定テーブル
50…ドキュメント
55…ドキュメント
51…敬称
52…宛名
60…名簿
61…氏名
62…住所
63、64、65…文字
70…ドキュメントデータ
75…ドキュメントデータ
80…名簿データ
90…敬称検索キーワード
91、92…宛名検索キーワード
200…名簿
201、202…文字
203…空欄
204、205…文字
210…名簿データ
220、221…宛名配列テーブル
300…名簿
301…1ページ目
302…2ページ目
311…名簿1ページ目データ
312…名簿2ページ目データ
320…原稿情報テーブル
330…宛名配列テーブル
10 ... MFP (MFP)
11 ... CPU
12 ...
DESCRIPTION OF
Claims (15)
前記入力部から入力された第1の原稿データに含まれている複数の文字情報の中から内容が同じ種類である文字情報群の配列規則を判定する場合に、前記種類に属する文字情報を使用してその文字情報に該当する第1の文字情報を検索し、その第1の文字情報から所定方向に検索して前記種類に属する第2の文字情報を特定し、前記第1の文字情報と前記第2の文字情報との位置関係に基づいて前記配列規則を判定する制御部と、
を備える
ことを特徴とする画像処理装置。 An input section for inputting document data;
The character information belonging to the type is used when determining the arrangement rule of the character information group of the same type from among the plurality of character information included in the first document data input from the input unit The first character information corresponding to the character information is searched, the second character information belonging to the type is specified by searching from the first character information in a predetermined direction, and the first character information and A control unit that determines the arrangement rule based on a positional relationship with the second character information;
An image processing apparatus comprising:
ことを特徴とする請求項1に記載の画像処理装置。 In the search for the first character information, the control unit detects the first character information from a plurality of character information included in the first document data in order from character information having a high detection probability in the search. The image processing apparatus according to claim 1, wherein the character information is determined as the first character information.
ことを特徴とする請求項1または2に記載の画像処理装置。 The control unit searches from the third character information arranged in the first column including the first character information and the second character information in a direction different from the first column direction. 3. The image processing apparatus according to claim 1, wherein when the fourth character information belonging to the type can be specified, the arrangement rule is determined in consideration of a position of the fourth character information. .
ことを特徴とする請求項3に記載の画像処理装置。 The control unit searches the fourth character information in a direction along the first column to identify fifth character information belonging to the type, and includes the fourth character information and the fifth character. The image processing apparatus according to claim 3, wherein the arrangement rule for the second column including the fourth character information and the fifth character information is determined based on a positional relationship with the information.
ことを特徴とする請求項3に記載の画像処理装置。 The control unit determines a second column including the fourth character information along the first column based on a positional relationship between the first character information and the second character information. The image processing apparatus according to claim 3, wherein the arrangement rule for the second column is determined by applying the arrangement rule.
ことを特徴とする請求項3に記載の画像処理装置。 The control unit determines the arrangement rule in a direction different from the first column direction based on a positional relationship between the third character information and the fourth character information. An image processing apparatus according to 1.
ことを特徴とする請求項1乃至6のいずれか1つに記載の画像処理装置。 7. The image according to claim 1, wherein when the first document data is data of a plurality of pages, the control unit determines the arrangement rule for each page. Processing equipment.
ことを特徴とする請求項1乃至7のいずれか1つに記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the control unit determines the predetermined direction based on a character direction of the first character information.
ことを特徴とする請求項1乃至8のいずれか1つに記載の画像処理装置。 The control unit compares the format of the first character information with the format of character information adjacent to the first character information, and character information having a different format is arranged with respect to the first character information. The image processing apparatus according to claim 1, wherein the current direction is excluded from a direction in which the second character information is searched.
ことを特徴とする請求項1乃至9のいずれか1つに記載の画像処理装置。 The control unit extracts individual character information belonging to the type according to the arrangement rule from a plurality of character information included in the first document data, and inputs the character information from the input unit. The image processing apparatus according to any one of claims 1 to 9, wherein the image processing apparatus synthesizes and outputs the synthesized second original data.
ことを特徴とする請求項10に記載の画像処理装置。 The control unit retrieves sixth character information corresponding to the character information from the second document data using the designated character information, and based on the position and format of the sixth character information. The image processing apparatus according to claim 10, wherein a position and a format of character information to be combined with the second document data are determined.
ことを特徴とする請求項1乃至11のいずれか1つに記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the control unit performs the identification with reference to a database in which character information belonging to the type is registered.
ことを特徴とする請求項1乃至11のいずれか1つに記載の画像処理装置。 The control unit determines whether or not the extracted character information according to the arrangement rule belongs to the type by referring to a database in which character information belonging to the type is registered. Item 12. The image processing device according to any one of Items 1 to 11.
ことを特徴とする請求項13に記載の画像処理装置。 In determining whether or not it belongs to the type, the control unit also refers to a database in which a condition indicating that the type does not belong is registered, and determines that character information corresponding to the condition does not belong to the type The image processing apparatus according to claim 13.
前記制御部は、前記判定の結果を前記表示部に表示し、その判定の結果に対する確定または訂正の操作を前記操作部により受け付ける
ことを特徴とする請求項13または14に記載の画像処理装置。 A display unit and an operation unit;
The image processing apparatus according to claim 13, wherein the control unit displays the result of the determination on the display unit, and accepts a confirmation or correction operation for the determination result by the operation unit.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008238354A JP2010072850A (en) | 2008-09-17 | 2008-09-17 | Image processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008238354A JP2010072850A (en) | 2008-09-17 | 2008-09-17 | Image processor |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010072850A true JP2010072850A (en) | 2010-04-02 |
Family
ID=42204580
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008238354A Withdrawn JP2010072850A (en) | 2008-09-17 | 2008-09-17 | Image processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2010072850A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015146122A (en) * | 2014-02-03 | 2015-08-13 | シャープ株式会社 | CONVERSION PROCESSING DEVICE, INFORMATION PROCESSING DEVICE EQUIPPED WITH THE SAME, PROGRAM, AND RECORDING MEDIUM |
| JP2017063332A (en) * | 2015-09-25 | 2017-03-30 | シャープ株式会社 | Image forming apparatus and image forming method |
| JP2018142286A (en) * | 2017-02-28 | 2018-09-13 | シナノケンシ株式会社 | Program for making electronic book |
-
2008
- 2008-09-17 JP JP2008238354A patent/JP2010072850A/en not_active Withdrawn
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015146122A (en) * | 2014-02-03 | 2015-08-13 | シャープ株式会社 | CONVERSION PROCESSING DEVICE, INFORMATION PROCESSING DEVICE EQUIPPED WITH THE SAME, PROGRAM, AND RECORDING MEDIUM |
| JP2017063332A (en) * | 2015-09-25 | 2017-03-30 | シャープ株式会社 | Image forming apparatus and image forming method |
| JP2018142286A (en) * | 2017-02-28 | 2018-09-13 | シナノケンシ株式会社 | Program for making electronic book |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4118349B2 (en) | Document selection method and document server | |
| US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
| US5903904A (en) | Iconic paper for alphabetic, japanese and graphic documents | |
| JP4260790B2 (en) | Filing / retrieval apparatus and filing / retrieval method | |
| US20060062453A1 (en) | Color highlighting document image processing | |
| US9805258B2 (en) | Systems and methods for separating documents | |
| CN101178725A (en) | Device, method, and computer program product for information retrieval | |
| CN100411418C (en) | Image forming apparatus and method for printing scanned documents in predetermined order | |
| US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
| JP4364913B2 (en) | Search device, search system, search device control method, search device control program, and computer-readable recording medium | |
| US9898236B2 (en) | Image processing apparatus and program for printing template images using keyword data | |
| US8712155B2 (en) | Device for identifying types of document files | |
| US10638001B2 (en) | Information processing apparatus for performing optical character recognition (OCR) processing on image data and converting image data to document data | |
| JP2010072850A (en) | Image processor | |
| US9152885B2 (en) | Image processing apparatus that groups objects within image | |
| JP2020135095A (en) | Information processing device and program | |
| US11064094B2 (en) | Image forming apparatus for forming image represented by image data on recording paper sheet | |
| US20210287187A1 (en) | Image processing apparatus and non-transitory computer readable medium storing program | |
| JP5436040B2 (en) | Image input / output device and monitoring system | |
| US11363162B2 (en) | System and method for automated organization of scanned text documents | |
| US8867048B2 (en) | Delayed review of scanned documents using unique identification marking on scanned documents | |
| JP4765593B2 (en) | Image forming apparatus, image forming processing program, and image forming processing method | |
| JP6281739B2 (en) | Processing apparatus and program | |
| US11681485B2 (en) | Count destination management apparatus and non-transitory computer readable medium | |
| JPH07146875A (en) | Information retrieval device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20111206 |