JP2003323580A - Field information creation program, field information creation method, and electronic form creation device for form screen - Google Patents
Field information creation program, field information creation method, and electronic form creation device for form screenInfo
- Publication number
- JP2003323580A JP2003323580A JP2002128106A JP2002128106A JP2003323580A JP 2003323580 A JP2003323580 A JP 2003323580A JP 2002128106 A JP2002128106 A JP 2002128106A JP 2002128106 A JP2002128106 A JP 2002128106A JP 2003323580 A JP2003323580 A JP 2003323580A
- Authority
- JP
- Japan
- Prior art keywords
- field
- creating
- line segment
- character string
- horizontal line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Image Analysis (AREA)
Abstract
(57)【要約】
【課題】 従来の帳票画面用電子フォーム作成装置に用
いられるフィールド情報作成方法では、紙帳票上の下線
で示された文字記入領域に対応するフィールド情報を自
動生成する機能がなく、フィールド情報作成効率が悪
い、という課題があった。
【解決手段】 紙帳票上の文字列と罫線に対応する情報
を格納した文字列・罫線データベースに基づいて、独立
した水平な線分を抽出する独立水平線分抽出段階と、該
抽出された独立水平線分に基づいて、フィールド左下端
座標とフィールド幅とを決定したフィールド候補を作成
するフィールド候補生成段階とを有するフィールド情報
作成方法によって、紙帳票上の下線で示された文字記入
領域に対応するフィールド情報を自動生成できる。
(57) [Summary] [Problem] A field information creation method used in a conventional form screen electronic form creation apparatus has a function of automatically generating field information corresponding to an underlined character entry area on a paper form. And the field information creation efficiency is poor. SOLUTION: An independent horizontal line segment extracting step of extracting an independent horizontal line segment based on a character string / ruled line database storing information corresponding to a character string and a ruled line on a paper form, and the extracted independent horizontal line A field corresponding to the underlined character entry area on the paper form by a field information generating method having a field candidate generating step of generating a field candidate in which the lower left coordinate of the field and the field width are determined based on the minute Information can be automatically generated.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、帳票に関する情報
処理をコンピュータに実行させるための帳票定義データ
である帳票画面用電子フォームを作成する帳票画面用電
子フォーム作成技術に係り、特に、文字記入領域を有す
る既存の紙帳票を模した帳票画面上の前記文字記入領域
に対応するフィールド情報を作成するフィールド情報作
成技術に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a form screen electronic form creating technique for creating a form screen electronic form which is form definition data for causing a computer to execute information processing related to a form, and more particularly to a character entry area. The present invention relates to a field information creating technique for creating field information corresponding to the character entry area on a form screen imitating an existing paper form having the above.
【0002】[0002]
【従来の技術】IT技術の進展によって、企業内、企業
間にとどまらず、行政、消費者を含む多くの分野で、従
来の紙帳票に代わり、帳票画面を端末から扱う電子帳票
システムがますます必要となってきた。このようなシス
テムの設計者は、帳票に関する情報処理をコンピュータ
に実行させるための帳票定義データである帳票画面用電
子フォームを設計するが、このとき、設計の効率化の観
点からも、また、エンドユーザの立場からも、できるだ
け既存の紙帳票と等しいデザインの帳票画面が望まし
い。2. Description of the Related Art Due to the progress of IT technology, electronic form systems that handle form screens from terminals instead of conventional paper forms in many fields including companies and companies, as well as in administration and consumers, will be available. It has become necessary. The designer of such a system designs a form screen electronic form, which is form definition data for causing a computer to execute information processing related to a form. At this time, from the viewpoint of design efficiency, From the user's point of view, it is desirable to have a form screen with the same design as the existing paper form as much as possible.
【0003】このような帳票画面用電子フォーム作成に
おいて、未記入紙帳票のビットマップイメージデータを
利用して、文字記入領域を有する既存の紙帳票を模した
帳票画面上の前記文字記入領域に対応するフィールド情
報を自動生成する従来技術がある。例えば、特許第3028
833 号特許公報においては、少なくとも3辺が線パター
ンによって囲まれた矩形領域やプレプリント文字列を前
記ビットマップイメージデータから抽出することによ
り、文字記入領域に対応するフィールド情報を自動生成
する技術が開示されている。In creating such an electronic form for a form screen, bitmap image data of an unfilled paper form is used to correspond to the character entry area on the form screen imitating an existing paper form having a character entry area. There is a conventional technique for automatically generating field information to be used. For example, patent 3028
In the 833 patent publication, there is a technique for automatically generating field information corresponding to a character entry area by extracting a rectangular area or a preprinted character string having at least three sides surrounded by a line pattern from the bitmap image data. It is disclosed.
【0004】本公知例に基づいて、従来の帳票画面用電
子フォーム作成装置とフィールド情報について、図9に
よって説明する。図9(a) は従来の帳票画面用電子フォ
ーム作成装置の構成例である。文字列・罫線抽出手段1
は未記入紙帳票イメージデータファイルimage から文字
列および罫線を認識して、文字列の値、位置、フォント
サイズ、罫線の太さ、種類、位置、長さなどを文字列・
罫線データベースMKDBに格納する。従来のフィールド候
補生成手段2' はこの文字列・罫線データベースMKDBを
もとにフィールド情報mfを抽出する。Based on this publicly known example, a conventional form screen electronic form creating apparatus and field information will be described with reference to FIG. FIG. 9A shows an example of the configuration of a conventional form screen electronic form creation apparatus. Character string / ruled line extraction means 1
Recognizes character strings and ruled lines from the blank paper form image data file image, and displays the character string value, position, font size, ruled line thickness, type, position, length, etc.
Store in the ruled line database MKDB. The conventional field candidate generating means 2'extracts field information mf based on this character string / ruled line database MKDB.
【0005】フィールド情報mfとは、文字記入領域を有
する既存の紙帳票を模した帳票画面上の前記文字記入領
域に対応する情報であって、そのデータ構造例を図9
(b) に示すように、フィールドIDfid 、フィールド左
下端座標(x,y) 、フィールド幅w 、フィールド高さh な
どからなる。従来のフィールド候補生成手段2' では既
存の紙帳票で記入領域あらわすキーワードをキーワード
データベースkwDBとしてもち、記入領域はこのキーワー
ドの近辺にある矩形または空白であるとする。例えばフ
ィールド候補生成手段2' の矩形領域抽出手段22' は図
(a) のイメージを持つ未記入紙帳票イメージデータファ
イルimage に基づく文字列・罫線データベースMKDBから
矩形領域a81 を抽出する。またフィールド候補生成手段
2' のキーワード照合手段24' は文字列・罫線データベ
ースMKDBから『年』『月』『日』『住所』『都道府県』
『市郡』『区』をそれぞれキーワードデータベースkwDB
に合致するキーワードとして抽出する。文字列間隔判定
手段23' は矩形領域抽出手段22' の抽出した矩形内の文
字列間の間隔を判定し、図8(a) の場合は 4つの文字列
間隔に対応するフィールド情報mfを生成する。これは図
8(b) の帳票画面におけるb85 〜b88 に対応するもので
ある。この結果、矩形領域抽出手段22' は図8(b) の文
字入力領域b81 に対応するフィールド情報mf( フィール
ドIDfid2')を、文字列間隔判定手段23' は文字入力領
域b85 〜b88 に対応する4 つのフィールド情報mf( フィ
ールドIDfid3')を、またキーワード照合手段24' は文
字入力領域b82 〜b84 に対応する3 つのフィールド情報
mf( フィールドIDfid3')を生成する。ここにこれらフ
ィールド情報mfは各文字入力領域に対応するフィールド
左下端座標(x,y) 、フィールド幅w 、フィールド高さh
がフィールド候補生成手段2' によって決定されてい
る。そして重なり整理手段3' はこれらのフィールド情
報mfのフィールド左下端座標(x,y) 、フィールド幅w か
らこれらのフィールド情報mfのうち重なっている文字入
力領域b81 対応のフィールド情報mfを削除して、これら
フィールド情報mfを第1のフィールド情報データベース
FDB1' に記入する。The field information mf is information corresponding to the character entry area on a form screen imitating an existing paper form having a character entry area, and its data structure example is shown in FIG.
As shown in (b), it consists of a field ID fid, field lower left bottom coordinates (x, y), field width w, field height h, and the like. The conventional field candidate generating means 2'has a keyword representing an entry area in an existing paper form as a keyword database kwDB, and the entry area is assumed to be a rectangle or a blank near this keyword. For example, the rectangular area extracting means 22 'of the field candidate generating means 2'is
A rectangular area a81 is extracted from the character string / ruled line database MKDB based on the blank paper form image data file image having the image of (a). Further, the keyword matching means 24 'of the field candidate generation means 2'uses the character string / ruled line database MKDB for "year""month""day""address""prefecture".
"City" and "ward" are keyword databases kwDB
Extract as a keyword that matches The character string interval determining means 23 'determines the interval between the character strings in the rectangle extracted by the rectangular area extracting means 22', and in the case of FIG. 8A, generates field information mf corresponding to four character string intervals. To do. This corresponds to b85 to b88 in the form screen of FIG. 8 (b). As a result, the rectangular area extracting means 22 'corresponds to the field information mf (field ID fid2') corresponding to the character input area b81 in FIG. 8B, and the character string interval determining means 23 'corresponds to the character input areas b85 to b88. The four field information mf (field ID fid3 ') and the keyword collating means 24' are three field information corresponding to the character input areas b82 to b84.
Generate mf (field ID fid3 '). Here, these field information mf are the field lower left coordinates (x, y), field width w, field height h corresponding to each character input area.
Are determined by the field candidate generating means 2 '. Then, the overlap organizing means 3 ′ deletes the field information mf corresponding to the overlapping character input area b81 from the field left lower end coordinates (x, y) and the field width w of these field information mf. , These field information mf the first field information database
Fill in FDB1 '.
【0006】紙帳票にユーザが記入する他の領域には選
択肢領域や写真添付領域などがある。例えば、図8(a)
の紙帳票の『都道府県』は該当に〇を付する選択肢であ
る。図8(b) の帳票画面の例ではこれはスクロール選択
肢オブジェクトsoとして実現されている。電子フォーム
生成手段6では第1のフィールド情報データベースFDB
1' のフィールド情報mfの修正や、上記のような選択肢
オブジェクトsoの設定、写真やサインのようなイメージ
領域オブジェクトioの設定を設計者と対話的に行う。こ
のとき、未記入紙帳票イメージデータファイルimage か
らは紙帳票にプレプリントされたロゴや飾りのイメージ
を取り込み、また文字列・罫線データベースMKDBからプ
レプリント文字列、罫線を取り込み、最終的な帳票画面
用電子フォームE-formを完成する。Other areas filled in by the user on the paper form include an option area and a photo attachment area. For example, FIG. 8 (a)
"Prefectures" in the paper form of is an option to attach a circle to the corresponding item. In the example of the form screen of FIG. 8B, this is realized as the scroll option object so. In the electronic form generation means 6, the first field information database FDB
The 1'field information mf is modified, the above-mentioned choice object so is set, and the image area object io such as a photograph or a sign is set interactively with the designer. At this time, the image of the logo or decoration preprinted on the paper form is imported from the blank paper form image data file image, and the preprinted character strings and ruled lines are imported from the character string / ruled line database MKDB to obtain the final form screen. Complete electronic form E-form for use.
【0007】[0007]
【発明が解決しようとする課題】上記の従来の帳票画面
用電子フォーム作成装置では、矩形領域とキーワードに
基づいてフィールド情報mfを設定していた。しかし、キ
ーワードを事前登録していない紙帳票や矩形によらない
記入指示の紙帳票では、従来の帳票画面用電子フォーム
作成装置ではフィールド情報mfを的確に生成することが
できない、という課題があった。また、文字列・罫線抽
出手段1が文字列抽出に失敗してキーワードが得られな
かった場合にも、矩形以外の手がかりがないと設定すべ
きフィールド情報mfが生成できない。例えば、図7のよ
うな下線を多用した紙帳票の場合には、図のA部以外
で、キーワードデータベースkwDBにキーワード登録され
ていないところはフィールド情報mfが設定されない。ま
た、B部のように、仮にWhichがキーワード登録されて
いたとしても、b1〜b9をこのような位置でフィールド情
報mfとして生成することはできない。本発明はこのよう
な課題に鑑み、下線によって文字記入領域を指示するよ
うな紙帳票を模した帳票画面を効率よく設計できるフィ
ールド情報作成方法および帳票画面用電子フォーム作成
装置を提供することを目的とする。In the above-mentioned conventional electronic form creating apparatus for a form screen, the field information mf is set based on the rectangular area and the keyword. However, with a paper form for which keywords are not pre-registered or a paper form for which entry is not based on a rectangle, there is a problem that the field information mf cannot be accurately generated by the conventional form screen electronic form creation device. . Further, even when the character string / ruled line extracting means 1 fails to extract the character string and the keyword cannot be obtained, the field information mf to be set cannot be generated unless there is a clue other than the rectangle. For example, in the case of a paper form using a lot of underlines as shown in FIG. 7, the field information mf is not set in the parts other than the part A in the drawing, which are not registered in the keyword database kwDB. Further, even if Which is registered as a keyword as in the part B, b1 to b9 cannot be generated as the field information mf at such positions. In view of the above problems, the present invention aims to provide a field information creating method and a form screen electronic form creating apparatus capable of efficiently designing a form screen imitating a paper form in which a character entry area is designated by an underline. And
【0008】[0008]
【課題を解決するための手段】上記課題は、図2の動作
フロー図に示す如く、帳票画面用電子フォーム作成装置
において、文字記入領域を有する既存の紙帳票を模した
帳票画面上の前記文字記入領域に対応するフィールド情
報を作成するフィールド情報作成方法であって、前記紙
帳票上の文字列と罫線に対応する情報を格納した文字列
・罫線データベースMKDBに基づいて、独立した水平な線
分を抽出する独立水平線分抽出段階(図2のステップS
202)と、該抽出された独立水平線分に基づいて、フ
ィールド左下端座標(x1,y1) とフィールド幅w1とを決定
したフィールド候補(フィールドIDfid1) を作成する
フィールド候補生成段階(図2のステップS202)
と、を有するフィールド情報作成方法によって解決され
る。As shown in the operation flow chart of FIG. 2, the above problem is solved by the above-mentioned character on a form screen imitating an existing paper form having a character entry area in a form screen electronic form creating apparatus. A field information creating method for creating field information corresponding to a writing area, which is an independent horizontal line segment based on a character string / ruled line database MKDB that stores information corresponding to character strings and ruled lines on the paper form. Independent horizontal line segment extraction step (step S in FIG. 2)
202) and a field candidate generation step (step of FIG. 2) for creating a field candidate (field IDfid1) in which the field lower left corner coordinates (x1, y1) and the field width w1 are determined based on the extracted independent horizontal line segment. S202)
And a field information creating method having:
【0009】すなわち、例えば図7のような未記入紙帳
票イメージデータファイルimage から得られた文字列・
罫線データベースMKDBでは、両端近傍が空白で両端y座
標が等しい罫線が独立水平線分として抽出され、これら
の多くは文字記入領域であるので、たとえキーワード設
定が不十分であっても、従来の帳票画面用電子フォーム
作成装置では得られなかった図7のB部に対応するよう
なフィールド情報mfが作成可能となる。That is, for example, a character string obtained from a blank paper form image data file image as shown in FIG.
In the ruled line database MKDB, ruled lines that are blank near both ends and have the same y-coordinates at both ends are extracted as independent horizontal line segments, and most of these are character entry areas. The field information mf corresponding to the part B of FIG. 7 which cannot be obtained by the electronic form creating apparatus for use can be created.
【0010】さらに、上記課題は、前記フィールド候補
(フィールドIDfid1) のフィールド左下端座標(x1,y
1) とフィールド幅w1で決まる領域に複数文字列が所定
値以上の間隔で存在することを判定する文字列間隔判定
段階(図2のステップS203)と、該判定された間隔
に対応したフィールド左下端座標(x3,y3=y2)とフィール
ド幅w3とを決定したフィールド候補( フィールドIDfi
d3) を生成するフィールド候補生成段階(図2のステッ
プS203)と、を有するフィールド情報作成方法によ
って解決される。Further, the above problem is that the field lower left coordinates (x1, y) of the field candidate (field ID fid1) are
1) and a character string interval determination step (step S203 of FIG. 2) for determining that a plurality of character strings are present in an area determined by the field width w1 at an interval of a predetermined value or more, and a lower left field corresponding to the determined interval. A field candidate (field IDfi that determines the edge coordinates (x3, y3 = y2) and the field width w3)
d3) is generated by the field candidate generation step (step S203 in FIG. 2).
【0011】すなわち、文字列間隔判定段階では、図7
のC部のように下線上に文字列Date,Offense,Court,Dis
positionのように複数文字列が間隔を空けて配置されて
いることを検出するので、c1〜c4に対応するフィールド
情報mfを的確に作成することができる。さらに、上記課
題は、前記独立水平線分( 第1のフィールド情報データ
ベースFDB1の各フィールドIDfid)の上部の空白領域の
高さを判定する上部空白判定段階(図2のステップS2
10)と、該判定された空白の高さに基づいて該フィー
ルド候補のフィールド高さh を設定するフィールド高さ
設定段階(図2のステップS210)と、を有するフィ
ールド情報作成方法によって解決される。That is, in the character string interval determination step, FIG.
Underlined string like Date C, Date, Offense, Court, Dis
Since it is detected that a plurality of character strings are arranged at intervals such as position, the field information mf corresponding to c1 to c4 can be accurately created. Further, the above-mentioned problem is the upper blank judgment step (step S2 in FIG. 2) of judging the height of the blank area above the independent horizontal line segment (each field ID fid of the first field information database FDB1).
10) and a field height setting step (step S210 of FIG. 2) of setting the field height h of the field candidate based on the determined blank height. .
【0012】すなわち、下線によるフィールド情報mf作
成では矩形領域による場合と異なりフィールド高さh を
決める基準が必要であり、一般に上部空白によってその
高さを設定すれば、プレプリント部分と重なることのな
いフィールド情報mfを的確に作成することができる。さ
らに、上記課題は、前記フィールド候補( 第1のフィー
ルド情報データベースFDB1の各フィールドIDfid)のフ
ィールド左下端座標(x,y) とフィールド幅wで決まる領
域の左右の所定範囲に存在する文字列の高さを判定する
左右部文字列判定段階(図2のステップS210)と、
該判定された文字列の高さに基づいて該フィールド候補
のフィールド高さh を設定するフィールド高さ設定段階
(図2のステップS210)と、を有するフィールド情
報作成方法によって解決される。 すなわち、文字記入
領域の状況によっては上部空白が高くても、左右プレプ
リント文字フォントの高さに合わせた文字記入領域を予
定する場合もあるので、このような場合、左右部文字列
判定段階によってフィールド高さh を正しく設定したフ
ィールド情報mfを的確に作成することができる。That is, in the field information mf creation by underlining, unlike the case of the rectangular area, a reference for determining the field height h is necessary, and generally, if the height is set by the upper blank, it does not overlap with the preprinted portion. The field information mf can be created accurately. Furthermore, the above-mentioned problem is that the character strings existing in a predetermined range on the left and right of the area determined by the field lower left corner coordinates (x, y) and the field width w of the field candidate (each field IDfid of the first field information database FDB1). A left and right character string determination step of determining height (step S210 of FIG. 2),
A field height setting step (step S210 of FIG. 2) of setting the field height h of the field candidate based on the determined height of the character string is solved by the field information creating method. That is, depending on the situation of the character entry area, even if the upper space is high, there are cases where the character entry area is planned to match the height of the left and right preprinted character fonts. The field information mf with the correct field height h can be created.
【0013】さらに、上記課題は、前記フィールド候補
(第2 のフィールド情報データベースFDB2の各フィール
ドIDfid )のフィールド下端座標y が等しい複数のフ
ィールド候補のフィールド高さh を比較して、これら複
数個のフィールド候補のフィールド高さを同一値に揃え
るフィールド高さ調整段階(図2のステップS211)
を有するフィールド情報作成方法によって解決される。Further, the above-mentioned problem is to compare the field heights h of a plurality of field candidates having the same field lower end coordinates y of the field candidates (each field IDfid of the second field information database FDB2). A field height adjusting step of aligning the field heights of the field candidates to the same value (step S211 in FIG. 2)
Is solved by the method for creating field information having
【0014】すなわち、図7のB部におけるb7〜b9の部
分は上部空白が大きく、b1〜b3の部分は上部空白が小さ
いが、このB部の文字記入領域はすべて同一高さである
ことが期待されている、と考えられる。このような場
合、フィールド高さ調整段階においておのおののフィー
ルド高さh の分布に基づいて、的確にこれら複数個のフ
ィールド候補のフィールド高さh を同一値に揃えること
ができる。That is, the upper blank is large in the part of b7 to b9 in the part B of FIG. 7 and the upper blank is small in the part of b1 to b3, but the character writing areas of the part B are all the same height. It is considered to be expected. In such a case, the field heights h of the plurality of field candidates can be accurately adjusted to the same value based on the distribution of the field heights h in each field height adjustment stage.
【0015】さらに、上記課題は、前記生成されたフィ
ールド候補(図2のステップS206で得られたフィー
ルドIDfid3およびステップS208で得られたフィー
ルドIDfid4) のフィールド左下端座標(x,y) およびフ
ィールド幅w に基づいて、重なったフィールド候補を判
定して削除する重なり整理段階(図2のステップS20
9)を有するフィールド情報作成方法によって解決され
る。Further, the above problem is that the field left lower end coordinates (x, y) and the field width of the generated field candidate (field IDfid3 obtained in step S206 and field IDfid4 obtained in step S208 of FIG. 2). An overlap sorting step of determining and deleting overlapping field candidates based on w (step S20 in FIG. 2).
This is solved by the field information creating method having 9).
【0016】すなわち、例えば図1のキーワードデータ
ベースkwDBに文字列Dateが登録されている場合、図7の
C部における文字記入領域c1は、ステップS203によ
ってとステップS208によってのいずれによってもフ
ィールド情報mfを生成する。このような場合、重なり整
理段階で検出され、所定の選択ロジックで一つが的確に
選択される。That is, for example, when the character string Date is registered in the keyword database kwDB of FIG. 1, the character entry area c1 in the part C of FIG. 7 stores the field information mf by both step S203 and step S208. To generate. In such a case, it is detected in the overlapping arrangement stage, and one is accurately selected by a predetermined selection logic.
【0017】[0017]
【発明の実施の形態】本発明のフィールド情報作成方法
の実施例を図1〜図9により説明する。なお、本発明に
おけるコンピュータ処理は、当該コンピュータの主記憶
装置上に展開されたコンピュータプログラムにより実行
されるが、このコンピュータプログラムの提供形態は、
当該コンピュータに接続された補助記憶装置をはじめ、
CD−ROM等の可搬型記憶装置やネットワーク接続さ
れた他のコンピュータの主記憶装置及び補助記憶装置等
の各記録媒体に格納されて提供されるもので、このコン
ピュータプログラムの実行に際しては、当該コンピュー
タの主記憶装置上にローディングされ実行されるもので
ある。BEST MODE FOR CARRYING OUT THE INVENTION An embodiment of a field information creating method of the present invention will be described with reference to FIGS. The computer processing in the present invention is executed by a computer program loaded on the main storage device of the computer.
Starting with the auxiliary storage device connected to the computer,
It is provided by being stored in each recording medium such as a portable storage device such as a CD-ROM, a main storage device and an auxiliary storage device of another computer connected to a network, and the computer is executed when the computer program is executed. Is loaded and executed in the main storage device of.
【0018】図1は本発明の帳票画面用電子フォーム作
成装置の一つの実施例の構成を示すものである。この例
では、図9の従来の帳票画面用電子フォーム作成装置と
対比できるように、同一機能の要素は同一番号を付して
示した。図1と図9を対比してわかるように、本発明で
は、従来のフィールド候補生成手段2' 、重なり整理手
段3' に相当するフィールド候補生成手段2、重なり整
理手段3に加えて、フィールド高さ設定手段4およびフ
ィールド高さ調整手段5が付加されている。また、フィ
ールド候補生成手段2を従来のフィールド候補生成手段
2' と対比すると、独立水平線分抽出手段21が新規に付
加され、矩形領域抽出手段22、文字列間隔判定手段23、
キーワード照合手段24は従来と同等(であるが少し異な
る)機能である。すなわち、図9の従来のフィールド候
補生成手段2' ではすでに説明した如く、フィールド情
報mfとしてフィールドIDfid'、フィールド左下端座標
(x,y) 、フィールド幅w に加えてフィールド高さh をも
決定したが、フィールド候補生成手段2においてはフィ
ールド高さh は決定されない。そして、フィールド高さ
h はフィールド高さ設定手段4およびフィールド高さ調
整手段5によって決定される。FIG. 1 shows the configuration of an embodiment of a form screen electronic form creation apparatus of the present invention. In this example, elements having the same functions are shown with the same numbers so as to be compared with the conventional electronic form creating apparatus for form screens of FIG. As can be seen by comparing FIG. 1 and FIG. 9, in the present invention, in addition to the conventional field candidate generating means 2 ′, the field candidate generating means 2 corresponding to the overlap organizing means 3 ′, and the overlap organizing means 3, the field height is increased. A height setting means 4 and a field height adjusting means 5 are added. Further, comparing the field candidate generating means 2 with the conventional field candidate generating means 2 ', an independent horizontal line segment extracting means 21 is newly added, and a rectangular area extracting means 22, a character string interval determining means 23,
The keyword matching means 24 has the same function as the conventional one (although it is slightly different). That is, in the conventional field candidate generating means 2'of FIG. 9, as already described, the field information mf is the field ID fid 'and the field lower left coordinate.
Although the field height h is determined in addition to (x, y) and the field width w, the field height h is not determined in the field candidate generating means 2. And field height
h is determined by the field height setting means 4 and the field height adjusting means 5.
【0019】図1において図9で説明していない部分を
説明すると、フィールド候補生成手段2の独立水平線分
抽出手段21は文字列・罫線データベースMKDBから独立水
平線分を抽出して、そのフィールドIDfid1、フィール
ド左下端座標(x1,y1) 、フィールド幅w1を文字列間隔判
定手段23に与える。文字列間隔判定手段23は独立水平線
分抽出手段21および矩形領域抽出手段22からのフィール
ド情報mfを受け、文字列間隔判定を行い、新たなフィー
ルドIDfid3、フィールド左下端座標(x3,y3)フィール
ド幅w3からなるフィールド情報mfを重なり整理手段3に
与える。重なり整理手段3はキーワード照合手段24から
のフィールドIDfid4、フィールド左下端座標(x4,y4)
、フィールド幅w4からなるフィールド情報mfを交えて
重なり整理を行い、その結果を第1のフィールド情報デ
ータベースFDB1に格納する。この時点で第1のフィール
ド情報データベースFDB1は従来の第1のフィールド情報
データベースFDB1' と異なり、フィールド高さh の情報
を欠いたフィールド情報mfが格納されている。Explaining the parts in FIG. 1 not explained in FIG. 9, the independent horizontal line segment extracting means 21 of the field candidate generating means 2 extracts the independent horizontal line segment from the character string / ruled line database MKDB, and its field IDfid1, The lower left corner coordinates (x1, y1) of the field and the field width w1 are given to the character string interval determining means 23. The character string interval determining means 23 receives the field information mf from the independent horizontal line segment extracting means 21 and the rectangular area extracting means 22, determines the character string interval, and newly determines the field IDfid3, the field lower left coordinate (x3, y3) field width. The field information mf consisting of w3 is given to the overlapping organizing means 3. The overlap organizing means 3 is the field ID fid4 from the keyword collating means 24 and the lower left corner coordinates (x4, y4) of the field.
, And the field information mf having the field width w4 is mixed and arranged, and the result is stored in the first field information database FDB1. At this point, unlike the conventional first field information database FDB1 ', the first field information database FDB1 stores the field information mf lacking the information of the field height h.
【0020】フィールド高さ設定手段4は上部空白判定
手段41および左右部文字列判定手段42からなる。これら
の手段はともに第1のフィールド情報データベースFDB1
の各フィールドIDfid に対してフィールド高さh の設
定を行い、第2 のフィールド情報データベースFDB2に格
納する。フィールド高さ調整手段5は第2 のフィールド
情報データベースFDB2に得られた各フィールドIDfid
に対してフィールド高さh の調整を行い、最終的なフィ
ールド情報mfとして第3 のフィールド情報データベース
FDB3にこれを格納する。これによって従来の第1のフィ
ールド情報データベースFDB1' と等価な第3 のフィール
ド情報データベースFDB3が得られ、従来と同様に電子フ
ォーム生成手段6がこれらをもとに帳票画面用電子フォ
ームE-formを生成する。The field height setting means 4 comprises an upper blank judging means 41 and a left and right character string judging means 42. Both of these means are the first field information database FDB1
The field height h is set for each field ID fid of, and stored in the second field information database FDB2. The field height adjusting means 5 is for each field ID fid obtained in the second field information database FDB2.
The field height h is adjusted for the third field information database as the final field information mf.
Store this in FDB3. As a result, a third field information database FDB3 equivalent to the conventional first field information database FDB1 'can be obtained, and the electronic form generating means 6 can generate the electronic form E for the form screen based on these as in the conventional case. To generate.
【0021】次に、図2の動作フローにより、本発明の
帳票画面用電子フォーム作成装置の動作を説明する。ま
ずステップS201において、文字列・罫線抽出手段1
が未記入紙帳票イメージデータファイルimage からもと
の紙帳票のプレプリント文字列・罫線を抽出し文字列・
罫線データベースMKDBに格納する。これは従来の帳票画
面用電子フォーム作成装置と同様である。図3には文字
列・罫線データベースMKDBのデータ構造例を示す。図3
(a) は文字列の例で、各文字列の位置、左右方向の幅、
そのフォントサイズに対応した高さ(h で表示) を格納
する。図3(b)は罫線の例で、罫線の位置、左右方向の
幅が得られている。これら文字列、罫線の抽出方法につ
いては、前記の特許第3028833 号特許公報に示される技
術や類似の方法が公知である。Next, the operation of the electronic form creating apparatus for a form screen according to the present invention will be described with reference to the operation flow of FIG. First, in step S201, the character string / ruled line extraction means 1
Is the blank paper form image data file image, the preprinted character string / ruled line of the original paper form is extracted and the character string /
Store in the ruled line database MKDB. This is the same as the conventional electronic form creating apparatus for form screens. FIG. 3 shows an example of the data structure of the character string / ruled line database MKDB. Figure 3
(a) is an example of a character string, the position of each character string, the horizontal width,
Stores the height (displayed as h) corresponding to the font size. FIG. 3B is an example of a ruled line, and the position of the ruled line and the width in the left-right direction are obtained. Regarding the method of extracting these character strings and ruled lines, the technique shown in the above-mentioned Japanese Patent No. 3028833 and similar methods are known.
【0022】図2に戻って、次にステップS202にお
いて、フィールド候補生成手段2の独立水平線分抽出手
段21は、文字列・罫線データベースMKDBから独立水平線
分を抽出してフィールドIDfid1, フィールド左下端座
標(x1,y1) 、フィールド幅w1を設定する。独立水平線分
とは、その両端に他の罫線との交点をもたず、かつ、そ
の両端のy座標が等しい(スロープをもたない)罫線で
あり、その抽出方法の詳細については後に図4によって
詳述する。Returning to FIG. 2, next, in step S202, the independent horizontal line segment extraction means 21 of the field candidate generation means 2 extracts the independent horizontal line segment from the character string / ruled line database MKDB to obtain the field IDfid1, the lower left corner coordinates of the field. Set (x1, y1) and field width w1. An independent horizontal line segment is a ruled line that has no intersections with other ruled lines at its both ends and has the same y coordinate at both ends (no slope), and the details of the extraction method will be described later with reference to FIG. Will be described in detail.
【0023】抽出された線分に対応するフィールド情報
mf候補として独立水平線分抽出手段21はフィールドID
fid1を発行し、この線分によって定まるフィールド左下
端座標(x1,y1) 、フィールド幅w1をバッファ上に設定し
て文字列間隔判定手段23を起動する。ここにフィールド
左下端座標(x1,y1) 、フィールド幅w1は罫線線分の値そ
のものではなく、帳票画面上の文字送りピッチ( x 方向
px:y方向py) で正規化された値をとってもよく、その
方法についても前記特許第3028833 号特許公報と同様な
技術による。Field information corresponding to the extracted line segment
The independent horizontal line segment extraction means 21 uses the field ID as an mf candidate.
The fid1 is issued, the field lower left coordinates (x1, y1) determined by this line segment and the field width w1 are set in the buffer, and the character string interval determination means 23 is activated. The field bottom left coordinates (x1, y1) and field width w1 are not the value of the ruled line segment itself, but the character feed pitch (x direction) on the form screen.
px: y direction py) may be taken as a normalized value, and the method is the same as that of the above-mentioned Japanese Patent No. 3028833.
【0024】次に図2のステップS203において、文
字列間隔判定手段23は前記バッファ上のフィールドID
fid1に対して、所定探索高さ(例えば対象罫線の上部ピ
ッチ分pyの2倍)の範囲の文字列についてその間隔を判
定しフィールドIDfid3、フィールド左下端座標(x3,y
3) 、フィールド幅w3を設定する。すなわち、文字列間
隔判定手段23は図3のような文字列・罫線データベース
MKDB中の各文字列の位置座標と文字列幅、高さで決まる
文字列領域が領域(x1,y1)-(x1+w1,y1+py) と重なる部分
をもつかを検査する。このような検査で複数個の文字列
が得られた場合は、この罫線内に複数個の文字列によっ
て分割される複数個のフィールドを設定する。この場
合、文字列間隔値の大きさによってフィールドを設定す
る基準や当該文字列の左、右のいずれをフィールドとす
るか、という知識が必要であるが、これらの技術も前記
特許第3028833 号特許公報に示す方法を用いることがで
きる。このようにして、文字列間隔判定手段23は従来の
文字列間隔判定手段23' と同様に複数個のフィールドI
Dfid3をもつフィールド情報mfをバッファ上においてス
テップS204に移行する。なお、この場合、一般にy3
=y1 である。Next, in step S203 of FIG. 2, the character string interval determination means 23 determines the field ID on the buffer.
For fid1, the interval is determined for character strings in the range of a predetermined search height (for example, twice the upper pitch py of the target ruled line), the field ID fid3, the field lower left coordinate (x3, y
3) Set the field width w3. That is, the character string interval determination means 23 is a character string / ruled line database as shown in FIG.
It is checked whether the character string area determined by the position coordinates of each character string in MKDB and the character string width and height has a part that overlaps the area (x1, y1)-(x1 + w1, y1 + py). When a plurality of character strings are obtained by such an inspection, a plurality of fields divided by the plurality of character strings are set in this ruled line. In this case, it is necessary to know the criteria for setting the field according to the size of the character string spacing value and whether the field is the left or right side of the character string, but these techniques are also related to the patent No. 3028833. The method shown in the publication can be used. In this way, the character string interval determining means 23, like the conventional character string interval determining means 23 ', includes a plurality of fields I.
The field information mf having Dfid3 is moved to step S204 on the buffer. In this case, y3 is generally
= y1.
【0025】ステップS204でフィールド候補生成手
段2はバッファ上のすべてのフィールドIDfid1に対し
て前記ステップS203がなされたかを監視して、残り
があれば次のフィールドIDfid1を文字列間隔判定手段
23に与えてステップS203にループさせる。そして全
フィールドIDfid1に対して終了すると、フィールド候
補生成手段2はステップS205において、従来の矩形
領域抽出手段22' と類似の矩形領域抽出手段22を起動し
て、文字列・罫線データベースMKDBから矩形領域を抽出
してフィールドIDfid2, フィールド左下端座標(x2,y
2),フィールド幅w2をバッファ上に設定して、前記の文
字列間隔判定手段23を起動する。In step S204, the field candidate generation means 2 monitors whether or not step S203 has been performed for all the field IDfid1s in the buffer, and if there is a remaining field, it determines the next field IDfid1 as the character string interval determination means.
23 and loop to step S203. When all the field IDs fid1 are completed, the field candidate generating means 2 activates the rectangular area extracting means 22 similar to the conventional rectangular area extracting means 22 'in step S205 to extract the rectangular area from the character string / ruled line database MKDB. To extract the field ID fid2, field bottom left coordinates (x2, y
2), the field width w2 is set in the buffer, and the character string interval determination means 23 is activated.
【0026】文字列間隔判定手段23はステップS206
において、フィールドIDfid2に対して文字列間隔を判
定し、フィールドIDfid3, フィールド左下端座標(x3,
y3)、フィールド幅w3をバッファ上に設定する。このス
テップおよびステップS207は対象をフィールドID
fid2に換えたのみで前記ステップS203、204と同
様動作を行う。なお、この場合、一般にy3=y2 である。The character string interval determination means 23 is step S206.
In, the character string interval is determined for the field ID fid2, and the field ID fid3, the lower left corner coordinate (x3,
y3), and set the field width w3 on the buffer. In this step and step S207, the target is the field ID.
The same operation as steps S203 and S204 is performed only by changing to fid2. In this case, generally y3 = y2.
【0027】この結果、ステップS207で全フィール
ドIDfid2に対して終了となった場合、バッファ上には
フィールドIDfid3の複数フィールド情報mfが存在す
る。この状態でフィールド候補生成手段2はステップS
208に移行し、キーワード照合手段24を起動し、文字
列・罫線データベースMKDBからキーワードデータベース
kwDB登録のキーワードを照合しフィールドIDfid4, フ
ィールド左下端座標(x4,y4) 、フィールド幅w4を設定す
る。この詳細についても従来のキーワード照合手段24'
と同様であり、前記特許第3028833 号特許公報に示す方
法を用いることができる。この結果、バッファ上にはフ
ィールドIDfid3、およびフィールドIDfid4の複数フ
ィールド情報mfが存在する。As a result, when all fields IDfid2 have been completed in step S207, the plural field information mf of the field IDfid3 exists in the buffer. In this state, the field candidate generating means 2 performs step S
Moving to 208, the keyword matching means 24 is started, and the character string / ruled line database MKDB is changed to the keyword database.
The keyword registered in kwDB is collated to set the field ID fid4, the field lower left coordinate (x4, y4), and the field width w4. For details of this, the conventional keyword matching means 24 '
The method described in the above Japanese Patent No. 3028833 can be used. As a result, the plural field information mf of the field IDfid3 and the field IDfid4 exists in the buffer.
【0028】次いで、重なり整理手段3はステップS2
09において、バッファ上のフィールドIDfid3、フィ
ールドIDfid4のフィールド左下端座標(x3,y3) 、(x4,
y4)を調べ、これらがある許容値の範囲で等しい場合、
いずれかを優先して他を捨てて結果を第1のフィールド
情報データベースFDB1に格納する。この詳細についても
従来の重なり整理手段3' と同様であり、前記特許第30
28833 号特許公報に示す方法を用いることができる。Next, the overlap organizing means 3 performs step S2.
09, the lower left field coordinates (x3, y3) of the field IDfid3 and the field IDfid4 on the buffer (x4, y4,
y4), and if these are equal in some tolerance range,
One is given priority and the other is discarded, and the result is stored in the first field information database FDB1. The details are the same as those of the conventional overlapping arrangement means 3 ', and the above-mentioned Patent No. 30
The method shown in the 28833 patent publication can be used.
【0029】以上によって得られた第1のフィールド情
報データベースFDB1をもとに、フィールド高さ設定手段
4が、次にステップS210において、まず、上部空白
判定手段41を起動して、第1のフィールド情報データベ
ースFDB1の各フィールドIdfid に対し、そのフィール
ド下端(x,y)-(x+w,y) の上部空白を判定してフィールド
高さh を設定する。その詳細については図5によって後
述する。次に、フィールド高さ設定手段4は左右部文字
列判定手段42を起動して、当該フィールドIDfid の左
右に文字列があればその高さを加味してフィールド高さ
h を設定する。その詳細については図6によって後述す
る。このようにしてフィールド高さ設定手段4は上部空
白判定手段41または左右部文字列判定手段42によって各
フィールドIDfid に対するフィールド高さh を設定す
る。なお、このとき、上部空白判定手段41と左右部文字
列判定手段42の両者が異なるフィールド高さh を与える
場合は、本実施例ではより小さい値を与えるフィールド
高さh を採用する。Based on the first field information database FDB1 obtained as described above, the field height setting means 4 first activates the upper blank determination means 41 in step S210 to make the first field. For each field Idfid of the information database FDB1, the upper space of the field lower end (x, y)-(x + w, y) is determined and the field height h is set. The details will be described later with reference to FIG. Next, the field height setting means 4 activates the left and right character string determination means 42, and if there is a character string on the left and right of the field IDfid, the height is taken into consideration.
Set h. The details will be described later with reference to FIG. In this way, the field height setting means 4 sets the field height h for each field IDfid by the upper blank determination means 41 or the left and right character string determination means 42. At this time, if both the upper blank determination means 41 and the left and right character string determination means 42 give different field heights h, the field height h which gives a smaller value is adopted in this embodiment.
【0030】以上によって、ステップS210でフィー
ルド高さh を決定したフィールド情報mfが作られ、フィ
ールド高さ設定手段4はこれを第2 のフィールド情報デ
ータベースFDB2に格納する。次いでフィールド高さ調整
手段5はステップS211において、この第2 のフィー
ルド情報データベースFDB2中の各フィールドIdfidに
ついて、フィールド左下端y 座標y でソートし、同一y
の複数フィールドIdfid についてフィールド高さh を
調整する。これは、図7のB部のように上部空白の高さ
が異なる同一y座標のフィールド情報b1〜b9の場合のよ
うに、本来期待されるフィールド高さh は同一y 座標フ
ィールドIDfid 間で同一であろう、という仮定を実現
する。従って、フィールド高さ調整手段5は最も小さい
フィールド高さh を与える値を採用して、これを該当全
フィールドIDfid に適用する。そしてその修正結果を
第3 のフィールド情報データベースFDB3に格納する。As described above, the field information mf for which the field height h has been determined in step S210 is created, and the field height setting means 4 stores this in the second field information database FDB2. Next, in step S211, the field height adjusting means 5 sorts each field Idfid in this second field information database FDB2 by the lower left corner y coordinate y of the field, and the same y
Adjust the field height h for multiple fields Idfid of. This is because the originally expected field height h is the same between the same y-coordinate field IDfid as in the case of the field information b1 to b9 of the same y-coordinate where the heights of the upper blanks are different as in the part B of FIG. Fulfill the assumption that Therefore, the field height adjusting means 5 adopts a value that gives the smallest field height h and applies it to all the corresponding field IDfid. Then, the correction result is stored in the third field information database FDB3.
【0031】以上によって従来の帳票画面用電子フォー
ム作成装置の第1のフィールド情報データベースFDB1'
と等価な第3 のフィールド情報データベースFDB3が形成
された。本第3 のフィールド情報データベースFDB3に
は、従来の第1のフィールド情報データベースFDB1' に
は収容されなかった独立水平線分に由来するフィールド
情報mfが取り込まれている。最後のステップS212に
おいて、電子フォーム生成手段6は、従来の帳票画面用
電子フォーム作成装置と同様に、未記入紙帳票イメージ
データファイルimage 、文字列・罫線データベースMKD
B、第3 のフィールド情報データベースFDB3に基づい
て、対話的にフィールド情報mfの修正、選択肢オブジェ
クトsoの設定、イメージ領域オブジェクトioの設定を行
い、帳票画面用電子フォームE-formを完成する。As described above, the first field information database FDB1 'of the conventional electronic form creating apparatus for form screens
A third field information database FDB3, which is equivalent to The third field information database FDB3 incorporates field information mf derived from an independent horizontal line segment which is not contained in the conventional first field information database FDB1 '. In the last step S212, the electronic form generating means 6 is similar to the conventional electronic form creating device for form screens, the blank paper form image data file image, the character string / ruled line database MKD.
B. Based on the third field information database FDB3, the field information mf is interactively modified, the choice object so is set, and the image area object io is set to complete the form screen electronic form E-form.
【0032】次に、図4によって独立水平線分抽出手段
21の動作を説明する。左端座標(Lxs,Lys) 、右端座標(L
xe,Lye) をもつ罫線を幅と長さを持つ矩形領域と考える
と、画像データから得た罫線データの情報は以下の形式
で表すことができる。
(Lxs,Lys) - (Lxe,Lye)
図4(a) は、罫線情報の例である。Next, referring to FIG. 4, independent horizontal line segment extraction means
The operation of 21 will be described. Left edge coordinates (Lxs, Lys), right edge coordinates (L
Considering a ruled line having (xe, Lye) as a rectangular area having a width and a length, the ruled line data information obtained from the image data can be represented in the following format. (Lxs, Lys)-(Lxe, Lye) FIG. 4A is an example of ruled line information.
【0033】まず、罫線の方向が水平であるかどうかを
評価する( 評価手段1 ) 。評価手段は様々であるが以下
の2つが代表的である。
評価手段1-1 Lye - Lys≦ Lydif
評価手段1-2 abs(atan((Lye-Lys+1) /(Lxe-Lys+1))) < Lt
のどちらかを用いることが可能である。ここで、Lydif
およびLtは、予め指定可能なパラメータであり, Lydif
は許容するY 座標差、Ltは許容する水平に対する傾きを
表す。また、abs(X)はX の絶対値を表し、atan(X) はX
のアークタンジェントを表す。以上を第1の条件とす
る。First, it is evaluated whether or not the direction of the ruled line is horizontal (evaluation means 1). There are various evaluation means, but the following two are typical. Evaluation means 1-1 Lye-Lys ≤ Lydif Evaluation means 1-2 abs (atan ((Lye-Lys + 1) / (Lxe-Lys + 1))) <Lt can be used. Where Lydif
And Lt are parameters that can be specified in advance.
Is the allowable Y coordinate difference, and Lt is the allowable horizontal inclination. Also, abs (X) represents the absolute value of X, and atan (X) is X
Represents the arc tangent of. The above is the first condition.
【0034】次に、当該罫線が矩形などの図形を成さな
い独立した線分であるかを評価する( 評価手段2 ) 。こ
の評価手段として、以下の2 つの手段が代表的である。
評価手段2-1 図4(b) の斜線部は、罫線左端の調査範
囲の例である。罫線の左右端点の周囲を調査し、黒画素
の量が一定以下なら独立線分と判定する。例えば、mgn
およびthreをそれぞれ、予め設定できるパラメータとし
た場合、矩形領域(Lxs - mgn,Lys - mgn) - (Lxs + mg
n, Lye + mgn)から、矩形領域(Lxs,Lys)- (Lxs + mgn,L
ye) を除いた領域にある黒画素数をBleft とすれば、
Bleft ≦ thre
を満たす場合に、この端点は他の罫線と接続していない
と判定する。Next, it is evaluated whether or not the ruled line is an independent line segment that does not form a figure such as a rectangle (evaluation means 2). The following two means are representative of this evaluation method. Evaluation means 2-1 The shaded area in Fig. 4 (b) is an example of the survey area at the left end of the ruled line. The surroundings of the left and right end points of the ruled line are examined, and if the amount of black pixels is less than a certain value, it is determined as an independent line segment. For example, mgn
If thre and thre are parameters that can be set in advance, rectangular area (Lxs-mgn, Lys-mgn)-(Lxs + mgn
n, Lye + mgn), the rectangular area (Lxs, Lys)-(Lxs + mgn, L
If the number of black pixels in the area excluding (yes) is Bleft, it is determined that this endpoint is not connected to another ruled line if Bleft ≤ thre is satisfied.
【0035】同様に、矩形領域(Lxe - mgn,Lys - mgn)
- (Lxe + mgn, Lye + mgn)から、矩形領域(Lxe - mgn,L
ys) - (Lxe,Lye) を除いた領域にある黒画素数をBright
とすれば、
Bright≦ thre
を満たす場合に、この端点は他の罫線と接続していない
と判定する。以上により両端点とも、接続されていない
と判定されれば独立線分と判定する。Similarly, a rectangular area (Lxe-mgn, Lys-mgn)
-From (Lxe + mgn, Lye + mgn), the rectangular area (Lxe-mgn, L
ys)-The number of black pixels in the area excluding (Lxe, Lye) is Bright
Then, if Bright ≦ thre is satisfied, it is determined that this endpoint is not connected to another ruled line. From the above, if it is determined that neither end point is connected, it is determined as an independent line segment.
【0036】評価手段2-2 他の罫線と交差しないもの
を独立線分と判定する。当該罫線が、他の罫線と交差し
なければ独立線分と言えることから、図4(c) に示すよ
うに線分O-P と線分A-B がある場合、ベクトルOAとベク
トルOBの外積をP _AB、ベクトルOPとベクトルOAの外積
をP _A 、ベクトルOPとベクトルOBの外積をP _B とす
れば、P _A とP _B が同じ符号で且つ abs(P_AB) <
abs(P_B - P _A)成り立つ場合、線分O-P と線分A-B
は交差するという既知の事実を利用して同様の評価計算
を行い判定を行う。Evaluation means 2-2 Those which do not intersect with other ruled lines are judged as independent line segments. If the ruled line does not intersect with other ruled lines, it can be said that it is an independent line segment. Therefore, when there is a line segment OP and a line segment AB as shown in Fig. 4 (c), the outer product of the vector OA and the vector OB is P_AB. , P_A is the cross product of the vector OP and the vector OA, and P_B is the cross product of the vector OP and the vector OB, P _A and P _B have the same sign and abs (P_AB) <
If abs (P_B-P_A) holds, line segment OP and line segment AB
Makes a judgment by performing the same evaluation calculation using the known fact that crosses.
【0037】以上のいずれかの評価を行うことを第2の
条件とする。水平線として第1条件を満たし、且つ独立
線分として第2条件を見たした罫線を、下線フィールド
候補として選定する。次に図5によって、上部空白判定
手段41の動作例を説明する。図5(a) に示す如く、当該
下線(Lxs,Lys)-(Lxe,Lye) と、予め設定可能なパラメー
タであり上方探索距離を表すSh によって求められる探
索範囲(Lxs,Lys - Sh) - (Lxe,Lys)について、文字以外
の図形があるか否かを調査する。文字以外の図形が存在
する場合は、その中で最も下端の位置を検出し、その位
置をL1とする。図5(a) の例では文字以外は検出しな
い。次に当該下線と、別途予め設定可能なパラメータで
あり、上方探索距離を表すSh2 によって求められる探索
範囲(Lxs,Lys-Sh2)- (Lxe,Lye)について、文字列がある
か否かを調査する。文字列が存在する場合は、その中で
最も下端の位置を検出し、その位置をL2とする。The second condition is that any one of the above evaluations is performed. A ruled line that satisfies the first condition as a horizontal line and that meets the second condition as an independent line segment is selected as an underline field candidate. Next, with reference to FIG. 5, an operation example of the upper blank determination means 41 will be described. As shown in Fig. 5 (a), the underline (Lxs, Lys)-(Lxe, Lye) and the search range (Lxs, Lys-Sh)-which is a presettable parameter and represents the upward search distance (Lxs, Lys-Sh)- For (Lxe, Lys), investigate whether there is a figure other than characters. If a figure other than a character exists, the position of the bottom edge is detected and that position is set to L1. In the example of FIG. 5A, only characters are detected. Next, check whether there is a character string in the search range (Lxs, Lys-Sh2)-(Lxe, Lye), which is the underline and a parameter that can be separately set in advance, and is calculated by Sh2 that represents the upward search distance. To do. If there is a character string, the position of the bottom end is detected and that position is set to L2.
【0038】次に、フィールドの上端位置Fys を以下の
様に設定する。
Fys = min( Lys - Fh, min(L1,L2) )
ここで、Fhは罫線に対してフィールド領域がどの程度内
側かを示す予め設定可能なパラメータであり、min(A,B)
はA とB の小さい方の値をとるものとする。これによ
り、上方の文字列等の図形と重ならず適切なサイズのフ
ィールド生成を実現できる。設定した高さはデフォルト
のフィールド高さとして、上方に重なるべき図形が存在
しない場合に用いられることになる。図5(b) は、設定
したフィールド高さh の例である。Next, the upper end position Fys of the field is set as follows. Fys = min (Lys-Fh, min (L1, L2)) where, Fh is a presettable parameter that indicates to what extent the field area is inside the ruled line, and min (A, B)
Takes the smaller value of A and B. As a result, it is possible to realize the field generation of an appropriate size without overlapping the figure such as the upper character string. The set height is used as the default field height when there is no figure to be overlaid above. FIG. 5B is an example of the set field height h.
【0039】なお、上方の図形下端位置を検出する際に
非文字の図形と文字を分けた理由を説明すると、文字列
などは下線の上方直近に自身の項目名として存在する場
合があり、この場合に誤って図5(c) の様に自身の項目
名文字列を避けて設定してしまうことがないように、別
途Sh2 <Shを満たすSh2 により調査範囲を設け、項目名
文字列は上限値計算の算出に影響を与えないようにする
ためである。Explaining the reason why the non-character figure and the character are separated when detecting the lower end position of the upper figure, a character string or the like may exist as its own item name immediately above the underline. In order to avoid accidentally setting your own item name character string as shown in Fig. 5 (c), a survey range is separately set by Sh2 that satisfies Sh2 <Sh, and the item name character string is the upper limit. This is to prevent the calculation of the value calculation from being affected.
【0040】次に図6によって左右部文字列判定手段42
の動作を説明する。図6(a) に示す如く、予め設定可能
なパラメータとして左探索距離を表すSleft および右探
索距離を表すSrightがあるとする。また、当該下線を(L
xs,Lys)-(Lxe,Lye) とする。左右部文字列判定手段42は
まず、左方矩形範囲(Lxs-Sleft,Lys-Sh3)-(Lxs,Lys) を
調査し、当該範囲に一部でも重なる文字を全て検出す
る。ここで文字を検出した場合は、それらの文字の最上
端位置をTitleTopY とする。図6(a) は左方の調査範囲
および検出した文字を示す。Next, referring to FIG. 6, left and right character string determination means 42
The operation of will be described. As shown in FIG. 6A, it is assumed that there are Sleft, which represents the left search distance, and Sright, which represents the right search distance, as parameters that can be set in advance. In addition, the underline
xs, Lys)-(Lxe, Lye). The left and right character string determination means 42 first investigates the left rectangular range (Lxs-Sleft, Lys-Sh3)-(Lxs, Lys) and detects all characters that partially overlap the range. When characters are detected here, the top position of those characters is set to TitleTopY. Figure 6 (a) shows the survey area on the left and the detected characters.
【0041】左方で文字列が検出された場合、その文字
列の最上端位置TitleTopY が求められていて、予め設定
したパラメータとして、余裕距離値を表すYmgnとすれ
ば、フィールドのデフォルト高さは、
Fh = Lys - (TitleTopY - Ymgn)
として、動的に更新する。左方で文字列が検出できなか
った場合は、デフォルト高さは予め設定した値を使うも
のとする。次に、左方と同様に右方を調査した結果を、
左方と併用する。図6(b) は、左方にある文字列を考慮
して設定したフィールドの例である。When a character string is detected on the left side, the top end position TitleTopY of the character string is obtained, and if the preset parameter is Ymgn representing a margin distance value, the default height of the field is , Fh = Lys-(TitleTopY-Ymgn) to update dynamically. If the character string cannot be detected on the left side, the default height uses a preset value. Next, the result of investigating the right side as well as the left side,
Used in combination with the left side. FIG. 6B is an example of a field set in consideration of the character string on the left side.
【0042】(付記1) 帳票画面用電子フォーム作成
装置において、文字記入領域を有する既存の紙帳票を模
した帳票画面上の前記文字記入領域に対応するフィール
ド情報を作成する情報処理をコンピュータに実行させる
フィールド情報作成プログラムであって、前記紙帳票上
の文字列と罫線に対応する情報を格納した文字列・罫線
データベースに基づいて、独立した水平な線分を抽出す
る独立水平線分抽出段階と、該抽出された独立水平線分
に基づいて、フィールド位置座標とフィールド幅とを決
定したフィールド候補を作成するフィールド候補生成段
階と、をコンピュータに実行させることを特徴とするフ
ィールド情報作成プログラム。(Supplementary Note 1) In a form screen electronic form creating apparatus, information processing for creating field information corresponding to the character entry area on the form screen imitating an existing paper form having a character entry area is executed by a computer. A field information creating program for extracting an independent horizontal line segment based on a character string / ruled line database storing information corresponding to the character string and the ruled line on the paper form; A field information creating program for causing a computer to execute a field candidate creating step of creating a field candidate in which field position coordinates and field width are determined based on the extracted independent horizontal line segment.
【0043】(付記2) さらに、前記フィールド候補
のフィールド位置座標とフィールド幅で決まる領域に複
数文字列が所定値以上の間隔で存在することを判定する
文字列間隔判定段階と、該判定された間隔に対応したフ
ィールド位置座標とフィールド幅とを決定したフィール
ド候補を生成するフィールド候補生成段階と、をコンピ
ュータに実行させることを特徴とする付記1記載のフィ
ールド情報作成プログラム。(Supplementary Note 2) Further, a character string interval determination step of determining that a plurality of character strings exist at intervals of a predetermined value or more in an area determined by the field position coordinates and field width of the field candidate, and the determination is made. The field information creating program according to appendix 1, further comprising: a computer executing a field candidate generating step of generating a field candidate in which a field position coordinate and a field width corresponding to an interval are determined.
【0044】(付記3) さらに、前記独立水平線分の
上部の空白領域の高さを判定する上部空白判定段階と、
該判定された空白の高さに基づいて該フィールド候補の
フィールド高さを設定するフィールド高さ設定段階と、
をコンピュータに実行させることを特徴とする付記1ま
たは付記2記載のフィールド情報作成プログラム。(Supplementary Note 3) Further, an upper blank judgment step of judging the height of the blank area above the independent horizontal line segment,
A field height setting step of setting a field height of the field candidate based on the determined blank height;
The field information creation program according to appendix 1 or 2, wherein the program is executed by a computer.
【0045】(付記4) さらに、前記フィールド候補
のフィールド位置座標とフィールド幅で決まる領域の左
右の所定範囲に存在する文字列の高さを判定する左右部
文字列判定段階と、該判定された文字列の高さに基づい
て該フィールド候補のフィールド高さを設定するフィー
ルド高さ設定段階と、をコンピュータに実行させること
を特徴とする付記1または付記2記載のフィールド情報
作成プログラム。(Supplementary Note 4) Further, a left and right character string determination step of determining the height of a character string existing in a predetermined range on the left and right of the area determined by the field position coordinates of the field candidate and the field width, and the determination. 3. The field information creation program according to appendix 1 or 2, further comprising a field height setting step of setting the field height of the field candidate based on the height of a character string.
【0046】(付記5) さらに、前記フィールド候補
のフィールド下端座標が等しい複数のフィールド候補の
フィールド高さを比較して、これら複数個のフィールド
候補のフィールド高さを同一値に揃えるフィールド高さ
調整段階、をコンピュータに実行させることを特徴とす
る付記3または付記4記載のフィールド情報作成プログ
ラム。(Supplementary Note 5) Furthermore, the field heights of the plurality of field candidates having the same field lower end coordinates are compared with each other, and the field heights of the plurality of field candidates are adjusted to the same value. The field information creation program according to note 3 or note 4, wherein the program is executed by a computer.
【0047】(付記6) さらに、前記生成されたフィ
ールド候補のフィールド位置座標およびフィールド幅に
基づいて、重なったフィールド候補を判定して削除する
重なり整理段階、をコンピュータに実行させることを特
徴とする付記1または付記2記載のフィールド情報作成
プログラム。(Supplementary Note 6) Further, the computer is caused to execute an overlap organizing step of judging and deleting overlapping field candidates based on the field position coordinates and field widths of the generated field candidates. The field information creation program according to supplementary note 1 or supplementary note 2.
【0048】(付記7) 帳票画面用電子フォーム作成
装置において、文字記入領域を有する既存の紙帳票を模
した帳票画面上の前記文字記入領域に対応するフィール
ド情報を作成するフィールド情報作成方法であって、前
記紙帳票上の文字列と罫線に対応する情報を格納した文
字列・罫線データベースに基づいて、独立した水平な線
分を抽出する独立水平線分抽出段階と、該抽出された独
立水平線分に基づいて、フィールド位置座標とフィール
ド幅とを決定したフィールド候補を作成するフィールド
候補生成段階と、を有することを特徴とするフィールド
情報作成方法。(Supplementary Note 7) This is a field information creating method for creating field information corresponding to the character entry area on the form screen imitating an existing paper form having a character entry area in the electronic form creating apparatus for a form screen. An independent horizontal line segment extraction step of extracting an independent horizontal line segment based on a character string / ruled line database that stores information corresponding to the character strings and ruled lines on the paper form, and the extracted independent horizontal line segment. And a field candidate generation step of creating a field candidate whose field position coordinates and field width are determined based on the above.
【0049】(付記8) 帳票に関する情報処理をコン
ピュータに実行させるための帳票定義データである帳票
画面用電子フォームを作成する帳票画面用電子フォーム
作成装置であって、未記入紙帳票の文字列と罫線に対応
する情報を格納した文字列・罫線データベースに基づい
て、独立した水平な線分を抽出する独立水平線分抽出手
段と、該抽出された独立水平線分に基づいて、フィール
ド位置座標とフィールド幅とを決定したフィールド候補
を作成するフィールド候補生成手段と、を有することを
特徴とする帳票画面用電子フォーム作成装置。(Supplementary Note 8) A form screen electronic form creating apparatus for creating a form screen electronic form, which is form definition data for causing a computer to execute information processing related to a form, and a character string of an unfilled paper form. Independent horizontal line segment extraction means for extracting an independent horizontal line segment based on a character string / ruled line database storing information corresponding to ruled lines, and field position coordinates and field widths based on the extracted independent horizontal line segment And a field candidate generating unit that creates a field candidate that has been determined to be the electronic form creating apparatus for a form screen.
【0050】[0050]
【発明の効果】以上の説明から明らかなように、本発明
によれば、紙帳票上の文字列と罫線に対応する情報を格
納した文字列・罫線データベースに基づいて、独立した
水平な線分を抽出する独立水平線分抽出段階と、該抽出
された独立水平線分に基づいて、フィールド位置座標と
フィールド幅とを決定したフィールド候補を作成するフ
ィールド候補生成段階とを有するフィールド情報作成方
法によって、紙帳票上の下線で示された文字記入領域に
対応するフィールド情報を自動生成できる、という効果
がある。また、複数文字列が所定値以上の間隔で存在す
ることを判定する文字列間隔判定段階や、左右の所定範
囲に存在する文字列の高さを判定する左右部文字列判定
段階や、独立水平線分の上部の空白領域の高さを判定す
る上部空白判定段階や、フィールド候補のフィールド下
端座標が等しい複数のフィールド候補のフィールド高さ
を比較して、これら複数個のフィールド候補のフィール
ド高さを同一値に揃えるフィールド高さ調整段階や、フ
ィールド候補のフィールド位置座標およびフィールド幅
に基づいて、重なったフィールド候補を判定して削除す
る重なり整理段階、をさらに有することにより、より適
切なフィールド情報を自動生成できる、という効果があ
る。As is apparent from the above description, according to the present invention, an independent horizontal line segment is created based on a character string / ruled line database that stores information corresponding to character strings and ruled lines on a paper form. A horizontal line segment extracting step for extracting a horizontal line segment and a field candidate generating step for generating a field candidate whose field position coordinate and field width are determined based on the extracted horizontal horizontal line segment. There is an effect that the field information corresponding to the underlined character entry area on the form can be automatically generated. In addition, a character string interval determination step of determining that a plurality of character strings exist at intervals of a predetermined value or more, a left and right character string determination step of determining the height of character strings existing in a predetermined left and right range, and an independent horizontal line. The upper blank determination step of determining the height of the blank area above the minute, and the field heights of a plurality of field candidates having the same field bottom end coordinates are compared to determine the field heights of the plurality of field candidates. More appropriate field information can be obtained by further including a field height adjustment step of aligning to the same value and an overlap arrangement step of determining and deleting overlapping field candidates based on the field position coordinates and field widths of the field candidates. The effect is that it can be automatically generated.
【図1】本発明の帳票画面用電子フォーム作成装置の実
施例構成図FIG. 1 is a block diagram of an embodiment of an electronic form creation device for a form screen according to the present invention.
【図2】本発明の帳票画面用電子フォーム作成装置の動
作フロー図FIG. 2 is an operation flow chart of the electronic form creating apparatus for a form screen according to the present invention.
【図3】文字列・罫線データベースMKDBのデータ構造例[Figure 3] Example of data structure of character string / ruled line database MKDB
【図4】独立水平線分抽出手段21の動作例FIG. 4 is an operation example of the independent horizontal line segment extracting means 21.
【図5】上部空白判定手段41の動作例[FIG. 5] Example of operation of upper blank determination means 41
【図6】左右部文字列判定手段42の動作例FIG. 6 is an operation example of left and right character string determination means 42.
【図7】紙帳票例[Figure 7] Paper form example
【図8】紙帳票と帳票画面の対比例[Figure 8] Comparison between paper form and form screen
【図9】従来の帳票画面用電子フォーム作成装置構成例
とフィールド情報mfのデータ構造例[FIG. 9] Example of conventional electronic form creation device for form screen and example of data structure of field information mf
1 文字列・罫線抽出手段 2 フィールド候補生成手段 3 重なり整理手段 4 フィールド高さ設定手段 5 フィールド高さ調整手段 6 電子フォーム生成手段 21 独立水平線分抽出手段 22 矩形領域抽出手段 23 文字列間隔判定手段 24 キーワード照合手段 41 上部空白判定手段 42 左右部文字列判定手段 image 未記入紙帳票イメージデータファイル MKDB 文字列・罫線データベース FDB1 第1のフィールド情報データベース FDB2 第2のフィールド情報データベース FDB3 第3のフィールド情報データベース E-form 帳票画面用電子フォーム fid フィールドID (x,y) フィールド左下端座標 w フィールド幅 h フィールド高さ mf フィールド情報 so 選択肢オブジェクト io イメージ領域オブジェクト 1 Character string / ruled line extraction means 2 Field candidate generation means 3 overlapping arrangement means 4 field height setting means 5 Field height adjustment means 6 Electronic Form Generation Means 21 Independent horizontal line segment extraction means 22 Rectangular area extraction means 23 Character string interval determination means 24 Keyword matching means 41 Upper blank judgment means 42 Left and right character string determination means image Blank paper form image data file MKDB Character string / ruled line database FDB1 First field information database FDB2 Second field information database FDB3 Third Field Information Database E-form Electronic form for form screen fid field ID (x, y) field bottom left coordinate w field width h field height mf field information so choice object io image area object
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5L096 AA07 BA17 EA27 FA03 FA10 FA13 FA16 FA54 FA64 FA66 FA67 FA69 ─────────────────────────────────────────────────── ─── Continued front page F-term (reference) 5L096 AA07 BA17 EA27 FA03 FA10 FA13 FA16 FA54 FA64 FA66 FA67 FA69
Claims (5)
て、文字記入領域を有する既存の紙帳票を模した帳票画
面上の前記文字記入領域に対応するフィールド情報を作
成する情報処理をコンピュータに実行させるフィールド
情報作成プログラムであって、 前記紙帳票上の文字列と罫線に対応する情報を格納した
文字列・罫線データベースに基づいて、独立した水平な
線分を抽出する独立水平線分抽出段階と、 該抽出された独立水平線分に基づいて、フィールド位置
座標とフィールド幅とを決定したフィールド候補を作成
するフィールド候補生成段階と、をコンピュータに実行
させることを特徴とするフィールド情報作成プログラ
ム。1. A field for causing a computer to execute information processing for creating field information corresponding to the character entry area on a form screen imitating an existing paper form having a character entry area in an electronic form creating apparatus for a form screen. An information creating program, an independent horizontal line segment extracting step of extracting an independent horizontal line segment based on a character string / ruled line database storing information corresponding to the character strings and ruled lines on the paper form, and the extraction. A field information creating program, which causes a computer to execute a field candidate creating step of creating a field candidate whose field position coordinates and field width are determined based on the created independent horizontal line segment.
ド位置座標とフィールド幅で決まる領域に複数文字列が
所定値以上の間隔で存在することを判定する文字列間隔
判定段階と、 該判定された間隔に対応したフィールド位置座標とフィ
ールド幅とを決定したフィールド候補を生成するフィー
ルド候補生成段階と、をコンピュータに実行させること
を特徴とする請求項1記載のフィールド情報作成プログ
ラム。2. A character string interval determination step of determining that a plurality of character strings are present at an interval of a predetermined value or more in an area determined by the field position coordinates of the field candidate and the field width, and The field information creating program according to claim 1, further comprising: a field candidate creating step of creating a field candidate in which corresponding field position coordinates and field widths are determined.
領域の高さを判定する上部空白判定段階と、 該判定された空白の高さに基づいて該フィールド候補の
フィールド高さを設定するフィールド高さ設定段階と、
をコンピュータに実行させることを特徴とする請求項1
または請求項2記載のフィールド情報作成プログラム。3. An upper blank determination step of determining a height of a blank area above the independent horizontal line segment, and a field for setting a field height of the field candidate based on the determined blank height. Height setting stage,
The computer is caused to execute the following.
Alternatively, the field information creating program according to claim 2.
て、文字記入領域を有する既存の紙帳票を模した帳票画
面上の前記文字記入領域に対応するフィールド情報を作
成するフィールド情報作成方法であって、 前記紙帳票上の文字列と罫線に対応する情報を格納した
文字列・罫線データベースに基づいて、独立した水平な
線分を抽出する独立水平線分抽出段階と、 該抽出された独立水平線分に基づいて、フィールド位置
座標とフィールド幅とを決定したフィールド候補を作成
するフィールド候補生成段階と、を有することを特徴と
するフィールド情報作成方法。4. A field information creating method for creating a field information corresponding to the character entry area on a form screen imitating an existing paper form having a character entry area in an electronic form creating apparatus for a form screen. An independent horizontal line segment extraction step of extracting an independent horizontal line segment based on a character string / ruled line database storing information corresponding to the character strings and ruled lines on the paper form, and based on the extracted independent horizontal line segment And a field candidate generating step of creating a field candidate whose field position coordinates and field width are determined.
実行させるための帳票定義データである帳票画面用電子
フォームを作成する帳票画面用電子フォーム作成装置で
あって、 未記入紙帳票の文字列と罫線に対応する情報を格納した
文字列・罫線データベースに基づいて、独立した水平な
線分を抽出する独立水平線分抽出手段と、 該抽出された独立水平線分に基づいて、フィールド位置
座標とフィールド幅とを決定したフィールド候補を作成
するフィールド候補生成手段と、を有することを特徴と
する帳票画面用電子フォーム作成装置。5. A form screen electronic form creating apparatus for creating a form screen electronic form, which is form definition data for causing a computer to execute information processing related to a form, comprising: Independent horizontal line segment extraction means for extracting an independent horizontal line segment based on a character string / ruled line database storing corresponding information, and field position coordinates and field widths based on the extracted independent horizontal line segment. An electronic form creating apparatus for a form screen, comprising: a field candidate generating unit that creates the determined field candidate.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002128106A JP2003323580A (en) | 2002-04-30 | 2002-04-30 | Field information creation program, field information creation method, and electronic form creation device for form screen |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002128106A JP2003323580A (en) | 2002-04-30 | 2002-04-30 | Field information creation program, field information creation method, and electronic form creation device for form screen |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2003323580A true JP2003323580A (en) | 2003-11-14 |
Family
ID=29541965
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002128106A Withdrawn JP2003323580A (en) | 2002-04-30 | 2002-04-30 | Field information creation program, field information creation method, and electronic form creation device for form screen |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2003323580A (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005073886A1 (en) * | 2004-02-02 | 2005-08-11 | Mantaro Yajima | Table format data processing method and table format data processing |
| JPWO2009001462A1 (en) * | 2007-06-28 | 2010-08-26 | 富士通株式会社 | Spreadsheet generation program, recording medium recording the program, spreadsheet generation device, and spreadsheet generation method |
| US12374147B2 (en) * | 2022-02-21 | 2025-07-29 | Infosys Limited | Template agnostic document reader |
-
2002
- 2002-04-30 JP JP2002128106A patent/JP2003323580A/en not_active Withdrawn
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005073886A1 (en) * | 2004-02-02 | 2005-08-11 | Mantaro Yajima | Table format data processing method and table format data processing |
| US7996761B2 (en) | 2004-02-02 | 2011-08-09 | Mantaro Yajima | Table format data processing method and table format data processing |
| JPWO2009001462A1 (en) * | 2007-06-28 | 2010-08-26 | 富士通株式会社 | Spreadsheet generation program, recording medium recording the program, spreadsheet generation device, and spreadsheet generation method |
| JP4988842B2 (en) * | 2007-06-28 | 2012-08-01 | 富士通株式会社 | TABLE DATA GENERATION PROGRAM, TABLE DATA GENERATION METHOD, AND TABLE DATA GENERATION DEVICE |
| US12374147B2 (en) * | 2022-02-21 | 2025-07-29 | Infosys Limited | Template agnostic document reader |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6535897B1 (en) | System and methods for spacing, storing and recognizing electronic representations of handwriting printing and drawings | |
| JP3469345B2 (en) | Image filing apparatus and filing method | |
| JP4235286B2 (en) | Table recognition method and apparatus | |
| US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
| CA2718636C (en) | Method and tool for recognizing a hand-drawn table | |
| US7313754B2 (en) | Method and expert system for deducing document structure in document conversion | |
| JP3425408B2 (en) | Document reading device | |
| WO1995034047A1 (en) | System and methods for spacing, storing and recognizing electronic representations of handwriting, printing and drawings | |
| CN111325110A (en) | Form format recovery method and device based on OCR and storage medium | |
| EP2869212A1 (en) | Writing guide for a free-form document editor | |
| JPH04343190A (en) | Character data input method | |
| EP0376420A2 (en) | Method and apparatus for generic form generation | |
| JPS62137671A (en) | Text movement | |
| JPH08249329A (en) | Method and apparatus for discrimination of word stated in portable electronic document | |
| US7996761B2 (en) | Table format data processing method and table format data processing | |
| EP2002352B1 (en) | Applying effects to a merged text path | |
| EP2110758A1 (en) | Searching method based on layout information | |
| JP5661549B2 (en) | Character recognition device for recognizing characters on a form, mask processing method, and mask processing program | |
| JP3105895B2 (en) | Document processing device | |
| JP2003323580A (en) | Field information creation program, field information creation method, and electronic form creation device for form screen | |
| US20250087006A1 (en) | Systems and methods for design aware replacement font suggestions | |
| JPH0689365A (en) | Document image processor | |
| JP2940747B2 (en) | Character segmentation device | |
| JP5667334B2 (en) | Graphic evaluation program and graphic evaluation apparatus | |
| JP4213558B2 (en) | Document layout analysis program, computer-readable storage medium storing document layout analysis program, document layout analysis method, and document layout analysis apparatus |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040610 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040610 |
|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20050705 |