[go: up one dir, main page]

JP2008181485A - 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム - Google Patents

画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム Download PDF

Info

Publication number
JP2008181485A
JP2008181485A JP2007294593A JP2007294593A JP2008181485A JP 2008181485 A JP2008181485 A JP 2008181485A JP 2007294593 A JP2007294593 A JP 2007294593A JP 2007294593 A JP2007294593 A JP 2007294593A JP 2008181485 A JP2008181485 A JP 2008181485A
Authority
JP
Japan
Prior art keywords
area
data
additional
electronic document
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007294593A
Other languages
English (en)
Other versions
JP5181631B2 (ja
Inventor
Yoshio Komaki
由夫 小巻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Business Technologies Inc
Original Assignee
Konica Minolta Business Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Business Technologies Inc filed Critical Konica Minolta Business Technologies Inc
Priority to JP2007294593A priority Critical patent/JP5181631B2/ja
Priority to US12/004,201 priority patent/US8508756B2/en
Publication of JP2008181485A publication Critical patent/JP2008181485A/ja
Application granted granted Critical
Publication of JP5181631B2 publication Critical patent/JP5181631B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)

Abstract

【課題】装置に対する複雑な操作を必要とせずに、手書きで追記された部分を含む原稿から、閲覧性の高い電子文書データを作成する画像形成装置を提案する。
【解決手段】画像形成装置は、手書き追記がなされた原稿をPDFデータに変換するために、原稿をスキャンして読取り(ステップS01)、画像データから追記領域を抽出する(ステップS07)。さらに、追記領域の位置に基づいて、PDFデータに追記領域を注釈として挿入するためのPDFデータ上の領域の大きさおよび表示させる際の位置である注釈枠を設定する(ステップS09)。
【選択図】図3

Description

この発明は画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラムに関し、特に、文書画像データから閲覧用注釈の記述が可能な電子文書フォーマットのデータを作成する画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラムに関する。
従来、MFP(Multi Function Peripherals)のような、原稿画像を読取るスキャナを備えた画像形成装置において、紙媒体の原稿からスキャンして得られた画像データよりPDF(Portable Document Format)等の電子文書を生成するものがある。
このような電子文書は、対応するアプリケーションを用いて閲覧され得る。電子文書が、広く普及しているPDFデータである場合、パーソナルコンピュータ(PC)で動作するアプリケーションであるアクロバットリーダ(登録商標)やWebブラウザ、携帯電話機で動作するビューワ、電子ペーパーで動作するビューワなどを用いて閲覧され得る。
ところで、紙媒体の原稿を閲覧する際に、手書きでコメントやマーカなどを追記することが広く行なわれている。これらの、手書きで追記された情報は、後に閲覧する場合に必要箇所を探す手間を減らすことができる。また、これらの情報は、他人に閲覧させたい箇所を示すこともでき、他人が同じ原稿を閲覧する場合にも有用である場合が多い。
従来の画像形成装置として、紙媒体の原稿上のマーカなどの手書きされた情報を読取るものがある。具体的には、原稿上のマーカ等の手書きで追記された部分をOCR(Optical Character Reader)機能を利用して読取るように指示し得るものや、その部分に対して特定の画像処理を行なうものなどがある。つまり、これらの従来の画像形成装置は、指示に従って追記された部分に対する処理を行なうものである。
たとえば特開平6−162109号公報(以下、特許文献1)は、マーカで検索用のキーワードを指定することのできる電子ファイリングシステムを開示している。
特開平6−162109号公報
しかしながら、特許文献1に開示されているシステム等、上述の従来の画像形成装置は、紙媒体の原稿からスキャンして得られた画像データより生成された電子文書を閲覧する際に、上記原稿にマーカ等の手書きで追記された部分について、閲覧の支援を行なうものではなく、特にその部分に対する高い閲覧性が得られないという問題があった。
本発明はこのような問題に鑑みてなされたものであって、装置に対する複雑な操作を必要とせずに、手書きで追記された部分を含む原稿から、閲覧性の高い電子文書データを作成する画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラムを提供することを目的とする。
上記目的を達成するために、本発明のある局面に従うと、画像形成装置は、原稿画像を読取り、画像データを得る読取手段と、画像データに基づいて、表示装置で画像データを表示させるための電子文書データを生成する電子文書化手段と、画像データより、手書きで追記された部分を含む追記領域を抽出する抽出手段と、追記領域に基づいて注釈用のデータを生成する生成手段と、画像データ上の追記領域の位置に基づいて、表示装置が電子文書データに注釈用データを表示するための位置を算出し、注釈用のデータに対して設定する設定手段とを備える。
好ましくは、抽出手段は、画像データから文字領域を特定する第1特定手段と、文字領域の特徴量を、文字領域の属性として算出する算出手段と、属性に基づいて、文字領域のうちの手書きで追記された部分を囲む領域を追記領域として特定する第2特定手段とを含む。
より好ましくは、上記属性は、文字領域の色である。
また好ましくは、抽出手段は、画像データから文字領域を特定する第1特定手段を含み、設定手段は、文字領域のうち、追記領域に関連付けられている領域を特定する第3特定手段を含む。
より好ましくは、第3特定手段は、追記領域の位置の左右および/または上下の所定範囲内を探索範囲として、探索範囲にある文字領域を追記領域に関連付けられている領域と特定する。
より好ましくは、抽出手段は、文字領域の特徴量を、文字領域の属性として算出する手段をさらに含み、第3特定手段は、追記領域の属性に応じて探索範囲を決定する。
また好ましくは、抽出手段は、文字領域の特徴量を、文字領域の属性として算出する手段と、追記領域の大きさに基づいて追記の種類を判断する手段とをさらに含み、第3特定手段は、追記領域の属性および追記領域の追記の種類に応じて探索範囲を決定する。
好ましくは、生成手段は、画像データより追記領域を切出す手段を含み、切出された追記領域に基づいて注釈用のデータを生成する。
好ましくは、電子文書データはPDF(Portable Document Format)データである。
本発明の他の局面に従うと、電子文書データ作成方法は、原稿画像を読取って得られる画像データに基づいて電子文書データを作成する方法であって、画像データより、手書きで追記された部分を含む追記領域を抽出するステップと、追記領域に基づいて注釈用のデータを生成するステップと、画像データ上の追記領域の位置に基づいて、表示装置が電子文書データに注釈用データを表示するための位置を算出し、注釈用のデータに対して設定するステップとを含む。
本発明のさらに他の局面に従うと、電子文書データ作成プログラムは、原稿画像を読取り、画像データを得る読取手段と、画像データに基づいて、表示装置で画像データを表示させるための電子文書データを生成する電子文書化手段とを備える画像形成装置における電子文書データ作成処理をコンピュータに実行させるプログラムであって、画像データより、手書きで追記された部分を含む追記領域を抽出するステップと、追記領域に基づいて注釈用のデータを生成するステップと、画像データ上の追記領域の位置に基づいて、表示装置が電子文書データに注釈用データを表示するための位置を算出し、注釈用のデータに対して設定するステップとを実行させる。
本発明にかかる画像形成装置は、複雑な操作を必要とせずに、手書きで追記された部分を含む原稿から、閲覧性の高い電子文書データを作成することができる。
以下に、図面を参照しつつ、本発明の実施の形態について説明する。以下の説明では、同一の部品および構成要素には同一の符号を付してある。それらの名称および機能も同じである。
図1は、本実施の形態にかかる画像形成装置1のハードウェア構成の具体例を示すブロック図である。画像形成装置1としては、コピー機、プリンタ、またはそれらの複合機器であるMFP(Multi Function Peripheral)等が該当する。本実施の形態において画像形成装置1は、スキャナ機能とプリント機能とを併せ持つMFPであるものとし、図1には、MFPである画像形成装置1のハードウェア構成の具体例をブロック図で示す。なお、本実施の形態において画像形成装置1はMFPであるものとしたが、上述のようなその他の装置であってもよいし、スキャナ機能を備える装置とプリント機能を備える装置との組合わせ等、複数の装置が組合された形態であってもよい。
図1を参照して、画像形成装置1は、装置全体を制御するCPU(Central Processing Unit)10と、原稿を光学的に読取ってデジタルデータである画像データに変換するスキャナ部30と、画像データからプリント用画像を形成して用紙上に印刷するプリント部35と、画像形成装置1をネットワークや電話回線に接続したり、近距離の無線通信を行なったりするための拡張カードであるNIC(Network Interface Card)15と、HD(Hard Disk)やRAM(Random Access Memory)などから構成されて、ジョブやCPU10で実行される電子文書データ作成プログラムなどを記憶するための記憶部20と、ユーザとのインタフェースである操作パネル25と、消耗品の残量などを検出するセンサ部40とを含んで構成される。
図2は、本実施の形態にかかる画像形成装置1において、紙媒体である原稿から電子文書データを作成するための機能構成の具体例を示すブロック図である。本実施の形態においては、電子文書データとして広く普及しているPDF(Portable Document Format)データが作成されるものとするが、言うまでもなく、作成される電子文書データはPDFデータに限定されず、たとえばHTML(Hypertext Markup Language)で記述されるデータなど、その他の形式のデータであってもよい。図2に示される各機能は、CPU10が記憶部20に記憶される電子文書データ作成プログラムを実行することで主にCPU10に形成される機能であるが、少なくとも一部は図1に示されたハードウェア構成によって形成されてもよい。
図2を参照して、画像形成装置1の上記機能は、スキャナ部30で変換された画像データに前処理を実行する画像前処理部3、画像データ記憶部4、プリント用画像処理部5、JPEG(Joint Photographic Experts Group)圧縮部7、追記領域抽出部2、注釈データ生成部6、PDF変換部8、および送信部9を含んで構成される。
画像前処理部3は、スキャナ部30で変換された画像データに対して、前処理の具体例として、たとえばビューアでの表示に適したRGB(Red Green Blue)画像データに変換する処理を実行し、画像データ記憶部4に格納する。また、前処理の他の具体例として、スキャナ部30の特性情報を用いて補正する処理も挙げられる。
プリント用画像処理部5は、操作パネル25を用いた操作に基づく操作信号に従って、プリント対象の画像データを画像データ記憶部4から読み出し、画像データをプリントに適した画像データに変換する処理を実行し、プリント部35に出力する。プリントに適した画像データに変換する処理の具体例として、たとえばRGB画像データをYMCK(Yellow Magenta Cyan Black)画像に変換する処理が挙げられる。変換された画像データはプリント部35において紙媒体に印刷される。
JPEG圧縮部7は、操作パネル25を用いた操作に基づく操作信号に従って、処理対象の画像データを画像データ記憶部4から読み出し、JPEG形式の画像データとなるよう圧縮処理を行なう。生成されたJPEG形式の画像データはPDF変換部8に入力される。
追記領域抽出部2は、操作パネル25を用いた操作に基づく操作信号に従って、処理対象の画像データを画像データ記憶部4から読み出し、画像データを解析して、原稿に対して手書きで追加された部分を含んだ領域である追記領域を抽出する。注釈データ生成部6は、抽出された追記領域に基づいてPDFデータに挿入する注釈用のデータを生成し、PDF変換部8に入力する。ここで「注釈」とは、電子文書作成/編集アプリケーションの機能を利用して生成される、電子文書データに電子的に挿入するマークアップのことを指す。
PDF変換部8は、PDFデータを作成/編集するためのアプリケーションの機能によって構成される機能であり、JPEG圧縮部7から入力されたJPEG形式の画像データと、注釈データ生成部6から入力された注釈用のデータとからPDFデータを生成し、送信部9に入力する。
送信部9は、入力されたPDFデータを各種の通信プロトコルに従って、操作パネル25を用いた操作に基づく操作信号で指定される送信先に送信する。通信プロトコルとしては、SMB(Server Message Block)、FTP(File Transfer Protocol)、HTTP(Hypertext Transfer Protocol)、およびSMTP(Simple Mail Transfer Protocol)などが挙げられる。
図3は、本実施の形態にかかる画像形成装置1における電子文書データ作成処理の具体的な流れを示すフローチャートである。図3のフローチャートに示される処理は、CPU10が記憶部20に記憶されている電子文書データ作成プログラムを読み出して実行し、図2の示される各機能を制御することによって実現される。なお、ここでは、処理対象の原稿が図4に示された原稿であるものとして、具体例を挙げて説明する。図4に示される原稿は、PC等に搭載されている標準的なフォントを用いて作成された文字を含んだ、横書きの原稿の具体例である。また、元原稿に対して手書きで加えられた追記101,103,105も含まれる。具体的には、赤の太ペンで描かれた記号等のマーカ101、赤の細ペンで書かれた追記である手書き追記103、および青の太ペンで描かれた下線105が含まれる。なお、以降の説明において、太ペンの色(図4の具体例では赤)を、「マーカ色」と称する。
図3を参照して、始めに、スキャナ部30において、原稿台にセットされた原稿をスキャンして、画像データを得る(ステップS01)。取得された画像データは画像前処理部3において前処理が施され(ステップS03)、画像データ記憶部4に記憶される。ステップS03の一例として、画像前処理部3は原稿の天地を判定し、(横書きの原稿であるならば)文字行が水平になるようにする回転処理を実行する。格納された画像データは、必要に応じてJPEG圧縮部7において圧縮処理が施され、JPEG形式の画像データに変換される(ステップS05)。
次に、追記領域抽出部2において、原稿に対して手書き等で追記された領域である追記領域を抽出する処理が実行される(ステップS07)。ここでの処理は本発明において特定の処理には限定されず、あらゆる処理方法が採用され得る。その一例として、たとえば特開2002−319025号公報に開示されている処理が採用され得る。具体的には、図5を参照して、追記領域抽出部2は、上記ステップS01で取得された画像データに対して、水平方向の投影ヒストグラム、および垂直方向の投影ヒストグラムを生成する(ステップS21)。そして、追記領域抽出部2は、上記ステップS21で生成された水平方向および垂直方向の投影ヒストグラムに基づいて、原稿の余白を特定する(ステップS23)。
また、追記領域抽出部2は、上記ステップS01で取得された画像データについて連結成分の解析を行ない、文字領域の境界箱を算出する(ステップS25)。ここで、上記ステップS01で読取られる原稿が図4に示されるものである場合、ステップS25では、図6に示されるような、文字領域の境界箱が算出される。そして、各境界箱について、特徴量として連結成分の平均色が算出されて、算出された特徴量である平均色が当該境界箱の属性として保存される(ステップS27)。
次に、追記領域抽出部2は、ステップS27で算出された境界箱の属性である平均色がマーカ色でない境界箱が所定条件を満たす場合に行方向に連結する(ステップS29)。境界箱が行方向に連結されたものを、以降、「併合テキスト行」と称する。ステップS29では、上端の位置、高さ、および水平方向の距離が、文字の連続を表わす所定条件を満たす2つの境界箱を併合する処理が繰返されることで、併合テキスト行が作成される。
上記ステップS27において図6に示される境界箱が算出された場合に、ステップS29では、図7に示されるような併合テキスト行が作成される。なお、図7において、図4のマーカ101に対応した境界箱201の属性である平均色は、マーカ101のマーカ色である赤、下線105に対応した境界箱205A,205Bの属性である平均色は、下線105のマーカ色である青であるため、これら境界箱201,205A,205BはステップS29において連結されていない。また、手書き追記103に対応した境界箱群203は、上記所定条件を満たしていないためにステップS29において連結されていない。
次に、追記領域抽出部2は、ステップS21で生成された投影ヒストグラムとステップS29で得られた併合テキスト行とを比較してテキスト行と手書き等の追記とを区別し、原稿上のテキストを表わしている併合テキスト行を特定する(ステップS31)。ステップS31では、投影ヒストグラムのピークに対応した位置にある併合テキスト行が、テキストを表わしている併合テキスト行であると特定される。図7に示された併合テキスト行については、図8にハッチングで示された併合テキスト行が原稿上の活字であるテキスト領域を表わしている併合テキスト行であると特定される。
次に、追記領域抽出部2は、上記ステップS31でテキストを表わしている併合テキスト行であると特定された併合テキスト行以外の境界箱に対して、所定距離内にある同じ属性の境界箱を囲む領域を追記領域候補に設定する(ステップS33)。本具体例では、図9に太枠で示された5つの領域が追記領域候補として設定される。具体的には、図7の境界箱201を囲む領域301、境界箱群203を囲む領域303、境界箱205Aを囲む領域305A、境界箱205Bを囲む領域305B、および領域307が追記領域候補として設定されている。
ステップS33では、追記領域抽出部2は、具体的に、図10に示されるように、上記ステップS31でテキストを表わしている併合テキスト行であると特定された併合テキスト行以外の境界箱を、属性ごとにまとめて、一時的に記憶部20の所定記憶領域に格納する(ステップS41)。以降、この処理を「リスト化」と称する。さらに、各リストに含まれる境界箱の相互の距離を算出して(ステップS43)、所定距離内の境界箱を同一グループとして連結し、リスト化する(ステップS45)。ここでは、具体的に所定距離を5mmとしている。また、ステップS45で連結された成分の平均色が算出される(ステップS47)。
次に、追記領域抽出部2は、上記ステップS33で設定された各追記領域候補について、その属性およびサイズより、追記領域と追記のタイプとを決定する(ステップS35)。具体的には、図11を参照して、ステップS33で設定された追記領域候補の属性がマーカ色であり、その領域の高さおよび幅が、共に、所定サイズの具体例としての8mm以上である場合には(ステップS51でYES、かつステップS53でYES)、追記領域抽出部2は当該追記領域候補を追記領域に決定し、追記のタイプがマーカであると判断する(ステップS55)。図9においては、領域301が追記領域に決定され、追記のタイプがマーカであると判断される。
ステップS33で設定された追記領域候補の属性がマーカ色であり、その領域の高さが所定サイズの具体例としての1〜4mmであり、幅が所定サイズの具体例としての12mm以上である場合には(ステップS51でYES、ステップS53でNO、かつステップS57でYES)、追記領域抽出部2は当該追記領域候補を追記領域に決定し、追記のタイプが下線マーカであると判断する(ステップS59)。図9においては、領域305A,305Bが追記領域に決定され、追記のタイプが下線マーカであると判断される。
ステップS33で設定された追記領域候補の属性がマーカ色ではなく、その領域の高さおよび幅が、共に、所定サイズの具体例としての8mm以上である場合には(ステップS51でNO、かつステップS61でYES)、追記領域抽出部2は当該追記領域候補を追記領域に決定し、追記のタイプが手書き追記であると判断する(ステップS63)。図9においては、領域303が追記領域に決定され、追記のタイプが手書き追記であると判断される。
なお、本具体例では、追記領域候補のサイズに基づいて追記領域のタイプが手書き追記であると判断するものとしているが、手書きの特徴と活字の特徴との違いを利用することで追記領域のタイプを手書き追記であると判断してもよい。具体的な特徴の違いとしては、文字領域の境界箱ごとの線の方向性、太さ、直線性、交点や変節点での角度、および左右対称性等が挙げられ、それらを所定の基準値と比較することで追記領域のタイプを手書き追記であると判断するようにしてもよい。また、活字の特徴との違いを利用した判断の他の具体例として、追記領域のタイプが印鑑やスタンプなどであることを判断するようにしてもよい。
上記条件のいずれにも該当しない追記領域候補については(ステップS57でNO、またはステップS61でNO)、ノイズとして以降の処理において無視される(ステップS65)。図9においては、領域307がノイズとして以降の処理において無視される。
上述のステップS07における追記領域の抽出処理の具体例では、特開2002−319025号公報に開示されたような方法も採用され得るとしているが、追記領域の抽出が可能であれば他のあらゆる方法が採用され得る。たとえば、文字領域の境界箱ごとに線の方向性、太さ、直線性、交点や変節点での角度、および左右対称性等に関する特徴を反映した特徴量を求めて基準値と比較することで追記領域が活字であるテキスト領域かを判断するようにしてもよい。
また、上記抽出処理の具体例では追記領域候補の属性がマーカ色であるか否かにより当該追記領域候補が追記領域であるか否かを決定するようにしているが、具体的なマーカ色の種類(赤か青か)によって決定するようにしてもよい。また、上述の具体例では、追記領域候補が追記領域であるか否かの決定や追記のタイプなどを追記領域抽出部2が判断するものとしているが、操作パネル25によるユーザ操作によってそれらが指定されてもよい。または変更されてもよい。
図3のフローチャートに戻って、上述のステップS07の処理によって決定され抽出された追記領域に対して、注釈用のデータを生成し、PDFデータに注釈として挿入するためのPDFデータ上の領域の大きさ、および表示させる際の位置を算出し、設定する(ステップS09)。以降の説明において、PDFデータに注釈として注釈用のデータを挿入するためのPDFデータ上の領域を「注釈領域」と称し、PDFデータに注釈として挿入するためのPDFデータ上の領域の大きさおよび表示させる際の位置を「注釈枠」とする。
具体的には、上記ステップS55で追記のタイプがマーカであると判断された追記領域について、図12および図13を用いて説明する。
図12を参照して、追記領域抽出部2は、当該追記領域の近傍にある併合テキスト行を探索して、リスト化する(ステップS81)。図13(A)に示されるように、マーカである追記領域(領域301)が(X1,Y1)−(X2,Y2)で示される場合、たとえばその領域の上下左右5mm以内の範囲である範囲1にある併合テキスト行を、リスト化する。
なお、上述の内容をより詳しく説明すると、次のような内容を意味している。すなわち、範囲1は、マーカである追記領域の上下を5mmずつ拡張して左右に伸ばした帯状の範囲、または上記追記領域の左右を5mmずつ拡張して上下に伸ばした帯状の範囲となる。図13(A)の例では、ステップS81で、領域301についての前者の範囲に含まれる、領域301の直左に存在する上下2つの併合テキスト行およびその各々の直左に存在する2つの併合テキスト行の計4つの併合テキスト行がリスト化される。
さらに、ステップS81でリスト化された各併合テキストについて、行方向の近傍にある併合テキスト行を探索して、リスト化する(ステップS83)。図13(A)の場合、マーカである追記領域(領域301)(X1,Y1)−(X2,Y2)より探索された併合テキスト行から、たとえば左右5mm以内の範囲である範囲2にある併合テキスト行を、リスト化する。
なお、上述の内容をより詳しく説明すると、次のような内容を意味している。すなわち、先述のように、上記ステップS81で領域301の左の4つの併合テキスト行がリスト化される。この場合、範囲2は、図13(A)に示されるようにステップS81でリスト化された4つの併合テキスト行の左右5mmずつ拡張した範囲となり、ステップS83で、ステップS81でリスト化された併合テキスト行と同じ4つの併合テキスト行がリスト化される。
上記ステップS83における処理は該当する併合テキスト行がすべて探索されてリスト化されるまで繰返されて、すべての併合テキスト行がリスト化されると(ステップS85でNO)、追記領域抽出部2は、ステップS83でリスト化されたすべての併合テキスト行について上下左右方向の最大値および最小値を算出して、これらすべての併合テキスト行を囲む矩形領域を算出する(ステップS87)。そして、ステップS87で算出された矩形領域およびマーカである追記領域に含まれる境界箱を探索して、リスト化する(ステップS89)。図13(B)においては、リスト化された境界箱がハッチングで示されている。追記領域抽出部2は、ステップS89でリスト化されたすべての境界箱について上下左右方向の最大値および最小値を算出して、これらすべての境界箱を囲む矩形領域を算出し、注釈枠に設定する(ステップS91)。図13(B)において、注釈枠は太線で示されている。
以上の処理を原稿に含まれるすべてのマーカである追記領域について実行し(ステップS93でNO)、処理を終了する。
なお、追記のタイプがマーカである場合の注釈枠の設定処理の他の具体例を、図20を用いて説明する。上述のステップS81において、マーカである追記領域(領域301)の上下および左右に各々5mmずつ拡張した、上記追記領域を囲む範囲である、図20(A)に示される範囲1が設定される。そして、範囲1に含まれる、領域301の直左に存在する上下2つの併合テキスト行がリスト化される。次に、ステップS83において、ステップS81でリスト化された2つの併合テキスト行の左右5mmずつ拡張した範囲である、図20(A)に示される範囲2−1が設定される。そして、範囲2−1に含まれる、ステップS81でリスト化された併合テキスト行およびその各々の直左に存在する2つの併合テキスト行の計4つの併合テキスト行がリスト化される。次に、ステップS87において、ステップS83でリスト化されたすべての併合テキスト行(上記4つの併合テキスト行)について上下左右方向の最大値および最小値が算出され、これらすべての併合テキスト行を囲む矩形領域である、図20(B)に示される範囲2−2が算出される。そして、ステップS89で、範囲2−2およびマーカである追記領域(領域301)に含まれる境界箱がリスト化される。図20(C)において、ステップS89でリスト化された境界箱がハッチングで示されている。ステップS91で、ステップS89でリスト化されたすべての境界箱について上下左右方向の最大値および最小値が算出され、これらすべての境界箱を囲む矩形領域が算出され、注釈枠に設定される。図20(C)において、注釈枠は太線で示されている。
また、上記ステップS55で追記のタイプが下線マーカであると判断された追記領域について、図14および図15を用いて説明する。
図14を参照して、追記領域抽出部2は、当該追記領域の近傍にある境界箱を探索して、リスト化する(ステップS101)。図15(A)に示されるように、下線マーカである追記領域(領域305A)が(X3,Y3)−(X4,Y4)で示される場合、その上下方向の中央である(Y3+Y4)/2を基底として、上方向に一定幅、たとえば基底から5mmの高さの矩形範囲である範囲3にある境界箱を、リスト化する。図15(B)においては、領域305Aについてリスト化された境界箱がハッチングで示されている。追記領域抽出部2は、ステップS101でリスト化されたすべての境界箱について上下左右方向の最大値および最小値を算出して、これらすべての境界箱を囲む矩形領域を算出し、注釈枠に設定する(ステップS103)。図15(B)において、領域305Aについての注釈枠は太線で示されている。
以上の処理を原稿に含まれるすべての下線マーカである追記領域について実行し(ステップS93でNO)、処理を終了する。図15に示される具体例では、下線マーカである追記領域が(X3,Y3)−(X4,Y4)で示されるものの他にも含まれるため、上記処理が繰返される。なお、図15(B)においては、下線マーカである追記領域(領域305B)についてリスト化された境界箱が左側のハッチングで示されている。また、領域305Bについての注釈枠は左側の太線で示されている。
なお、上記ステップS55で追記のタイプが手書き追記であると判断された場合には、図16に示されるように、追記領域抽出部2は、その手書き追記である追記領域を含む矩形領域を注釈枠に設定する。図16の具体例では、手書き追記である追記領域(領域303)に含まれる境界箱が実線で示されており、これらを囲む領域303を含む矩形領域、つまり設定された注釈枠が太線で示されている。
上記ステップS09において上述のように注釈枠が設定されると、注釈データ生成部6において、追記領域の情報を解析して注釈用のデータが生成される(ステップS11)。処理対象の原稿が図4に示された原稿である場合には、ステップS11では、図17に示されるような注釈用のデータが生成される。具体的に注釈データ生成部6は、当該追記領域のタイプを示す「コメント」と、その追記がなされた原稿上の位置と、追記領域の形状の種類を示す「タイプ」と、追記領域と原稿のテキスト領域との重なりにおけるテキスト領域の透過度を示す「透明度」と、添付データの有無とを解析し、図17に示されるような、これらを含んだ注釈用のデータを生成する。追記領域の形状の種類である「タイプ」としては、ここでは、追記のタイプが手書き追記である判断された場合には「スタンプ」と設定され、その他の場合には四角形が設定されるものとする。また、「透明度」としては、追記のタイプが手書き追記である判断された場合には「100%」が設定され、その他の場合には「0%」が設定されるものとする。また、手書き追記の内容を示すスタンプとして、画像データから追記領域の該当部分が切出されてビットマップデータとされるものとする。なお、図17に示された注釈用のデータは一例であり、本発明はこの具体例に限定されない。また、本具体例では、注釈データ生成部6が追記領域の情報を解析して注釈用のデータを生成するものとしているが、操作パネル25によるユーザ操作によってそれらが指定されてもよい。または生成された注釈用のデータが変更されてもよい。
ステップS11で生成された注釈用のデータはJPEG圧縮部7で圧縮されたJPEG形式の画像データと共にPDF変換部8においてPDFデータに変換される(ステップS13)。注釈用のデータが図17に示されるものである場合、ステップS13では、図18に構成の具体例示されるような、注釈用のデータと画像データとを含むPDFデータが生成される。生成されたPDFデータは、送信部9より、所定の送信先に送信される(ステップS15)。
ステップS15で送信されたPDFデータが送信先装置のビューアで表示されることで、注釈が、図19において矩形で示される位置に付加されて表示される。
本実施の形態にかかる画像形成装置1において上述の電子文書データ作成処理が実行されることで、画像形成装置1に対して複雑な操作を行なうことなく、原稿への追記に基づいた注釈を、生成される電子文書データに、必要な位置に付加することができる。その結果、生成されたPDF文書等の電子文書の閲覧性を高めることができる。また、注釈の活用性が高まる。なお、上記具体例ではPDFデータの注釈用のデータを生成し電子文書としてのPDFデータに埋込むものとしているが、注釈用のデータに換えて、閲覧支援機能、たとえば「しおり(ブックマーク)」、「スレッド」、「リンク」なども埋込む対象として本発明を適用することができる。それらに本発明を適用した場合であっても、同様に、生成されたPDF文書等の電子文書の閲覧性を高めることができる。
また、上述の処理では、手書きの特徴と活字の特徴との違いを用いて追記領域を抽出するため、精度よく追記領域を抽出することができる。
また、上述の処理では、境界箱の連結成分の平均色を算出することでマーカ色が検出されるため、マーカ色を利用して追記領域を判別することができる。そのため、ユーザは、マーカ色を利用して活字のテキスト領域に注釈を設定することが可能となる。
また、上述の処理では、追記領域と判定された領域の近傍にある併合テキスト行を検索して注釈枠を設定するようにしている。そのため、電子文書データにおいて、原稿に追記したユーザが意図するテキスト領域に的確に注釈を設定することができる。
また、上述の処理では、原稿データを読込んで得られた画像データから追記領域を切出すことで手書き追記の内容を表わすビットマップデータを作成して注釈データに含めることとしている。そのため、電子文書データから注釈データを取出して活用することが可能になる。たとえば、追記がされていない原稿から生成された電子文書データに、追記された原稿から生成された注釈データを取込むことができる。
さらに、本実施の形態にかかる画像形成装置1で実行される電子文書データ作成処理をコンピュータに実行させるためのプログラムを提供することもできる。このようなプログラムは、コンピュータに付属するフレキシブルディスク、CD−ROM(Compact Disk-Read Only Memory)、ROM(Read Only Memory)、RAMおよびメモリカードなどのコンピュータ読取り可能な記録媒体にて記録させて、プログラム製品として提供することもできる。あるいは、コンピュータに内蔵するハードディスクなどの記録媒体にて記録させて、プログラムを提供することもできる。また、ネットワークを介したダウンロードによって、プログラムを提供することもできる。
なお、本発明にかかるプログラムは、コンピュータのオペレーティングシステム(OS)の一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の配列で所定のタイミングで呼出して処理を実行させるものであってもよい。その場合、プログラム自体には上記モジュールが含まれずOSと協働して処理が実行される。このようなモジュールを含まないプログラムも、本発明にかかるプログラムに含まれ得る。
また、本発明にかかるプログラムは他のプログラムの一部に組込まれて提供されるものであってもよい。その場合にも、プログラム自体には上記他のプログラムに含まれるモジュールが含まれず、他のプログラムと協働して処理が実行される。このような他のプログラムに組込まれたプログラムも、本発明にかかるプログラムに含まれ得る。
提供されるプログラム製品は、ハードディスクなどのプログラム格納部にインストールされて実行される。なお、プログラム製品は、プログラム自体と、プログラムが記録された記録媒体とを含む。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
本実施の形態にかかる画像形成装置1のハードウェア構成の具体例を示すブロック図である。 本実施の形態にかかる画像形成装置1において、紙媒体である原稿から電子文書データを作成するための機能構成の具体例を示すブロック図である。 本実施の形態にかかる画像形成装置1における電子文書データ作成処理の具体的な流れを示すフローチャートである。 追記された原稿の具体例を示す図である。 ステップS07での追記領域抽出処理の具体例を示すフローチャートである。 文字領域の境界箱の具体例を示す図である。 併合テキスト行の具体例を示す図である。 テキスト領域を表わしている併合テキスト行の具体例を示す図である。 追記領域候補の具体例を示す図である。 ステップS33での追記領域候補の設定処理の具体例を示すフローチャートである。 ステップS35での追記領域の決定処理の具体例を示すフローチャートである。 追記のタイプがマーカである場合の、ステップS09での注釈枠の設定処理の具体例を示すフローチャートである。 追記のタイプがマーカである場合の注釈枠の設定処理を具体的に説明する第1の図である。 追記のタイプが下線マーカである場合の、ステップS09での注釈枠の設定処理の具体例を示すフローチャートである。 追記のタイプが下線マーカである場合の注釈枠の設定処理を具体的に説明する図である。 追記のタイプが手書き追記である場合の注釈枠の設定処理を具体的に説明する図である。 注釈用のデータの具体例を示す図である。 PDFデータの構成の具体例を示す図である。 PDFデータにおいて注釈が付加される位置を具体的に説明する図である。 追記のタイプがマーカである場合の注釈枠の設定処理の他の具体例を具体的に説明する図である。
符号の説明
1 画像形成装置、2 追記領域抽出部、3 画像前処理部、4 画像データ記憶部、5 プリント用画像処理部、6 注釈データ生成部、7 JPEG圧縮部、8 PDF変換部、9 送信部、10 CPU、15 NIC、30 スキャナ部、35 プリント部、20 記憶部、25 操作パネル、40 センサ部。

Claims (11)

  1. 原稿画像を読取り、画像データを得る読取手段と、
    前記画像データに基づいて、表示装置で前記画像データを表示させるための電子文書データを生成する電子文書化手段と、
    前記画像データより、手書きで追記された部分を含む追記領域を抽出する抽出手段と、
    前記追記領域に基づいて注釈用のデータを生成する生成手段と、
    前記画像データ上の前記追記領域の位置に基づいて、前記表示装置が前記電子文書データに前記注釈用データを表示するための位置を算出し、前記注釈用のデータに対して設定する設定手段とを備える、画像形成装置。
  2. 前記抽出手段は、
    前記画像データから文字領域を特定する第1特定手段と、
    前記文字領域の特徴量を、前記文字領域の属性として算出する算出手段と、
    前記属性に基づいて、前記文字領域のうちの前記手書きで追記された部分を囲む領域を前記追記領域として特定する第2特定手段とを含む、請求項1に記載の画像形成装置。
  3. 前記属性は、前記文字領域の色である、請求項2に記載の画像形成装置。
  4. 前記抽出手段は、
    前記画像データから文字領域を特定する第1特定手段を含み、
    前記設定手段は、前記文字領域のうち、前記追記領域に関連付けられている領域を特定する第3特定手段を含む、請求項1に記載の画像形成装置。
  5. 前記第3特定手段は、前記追記領域の位置の左右および/または上下の所定範囲内を探索範囲として、前記探索範囲にある前記文字領域を前記追記領域に関連付けられている領域と特定する、請求項4に記載の画像形成装置。
  6. 前記抽出手段は、
    前記文字領域の特徴量を、前記文字領域の属性として算出する手段をさらに含み、
    前記第3特定手段は、前記追記領域の前記属性に応じて前記探索範囲を決定する、請求項5に記載の画像形成装置。
  7. 前記抽出手段は、
    前記文字領域の特徴量を、前記文字領域の属性として算出する手段と、
    前記追記領域の大きさに基づいて追記の種類を判断する手段とをさらに含み、
    前記第3特定手段は、前記追記領域の前記属性および前記追記領域の前記追記の種類に応じて前記探索範囲を決定する、請求項5に記載の画像形成装置。
  8. 前記生成手段は、前記画像データより前記追記領域を切出す手段を含み、
    切出された前記追記領域に基づいて前記注釈用のデータを生成する、請求項1に記載の画像形成装置。
  9. 前記電子文書データはPDF(Portable Document Format)データである、請求項1に記載の画像形成装置。
  10. 原稿画像を読取って得られる画像データに基づいて電子文書データを作成する方法であって、
    前記画像データより、手書きで追記された部分を含む追記領域を抽出するステップと、
    前記追記領域に基づいて注釈用のデータを生成するステップと、
    前記画像データ上の前記追記領域の位置に基づいて、表示装置が前記電子文書データに前記注釈用データを表示するための位置を算出し、前記注釈用のデータに対して設定するステップとを含む、電子文書データ作成方法。
  11. 原稿画像を読取り、画像データを得る読取手段と、
    前記画像データに基づいて、表示装置で前記画像データを表示させるための電子文書データを生成する電子文書化手段とを備える画像形成装置における電子文書データ作成処理をコンピュータに実行させるプログラムであって、
    前記画像データより、手書きで追記された部分を含む追記領域を抽出するステップと、
    前記追記領域に基づいて注釈用のデータを生成するステップと、
    前記画像データ上の前記追記領域の位置に基づいて、前記表示装置が前記電子文書データに前記注釈用データを表示するための位置を算出し、前記注釈用のデータに対して設定するステップとを実行させる、電子文書データ作成プログラム。
JP2007294593A 2006-12-28 2007-11-13 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム Expired - Fee Related JP5181631B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007294593A JP5181631B2 (ja) 2006-12-28 2007-11-13 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム
US12/004,201 US8508756B2 (en) 2006-12-28 2007-12-20 Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2006355933 2006-12-28
JP2006355933 2006-12-28
JP2007294593A JP5181631B2 (ja) 2006-12-28 2007-11-13 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム

Publications (2)

Publication Number Publication Date
JP2008181485A true JP2008181485A (ja) 2008-08-07
JP5181631B2 JP5181631B2 (ja) 2013-04-10

Family

ID=39725316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007294593A Expired - Fee Related JP5181631B2 (ja) 2006-12-28 2007-11-13 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム

Country Status (1)

Country Link
JP (1) JP5181631B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041196A (ja) * 2013-08-21 2015-03-02 キヤノン株式会社 情報処理装置及びその制御方法、並びにプログラム
JP2015158726A (ja) * 2014-02-21 2015-09-03 東芝テック株式会社 文書配布サーバ、及び文書配布サーバのプログラム
US9558433B2 (en) 2015-06-30 2017-01-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP2018036794A (ja) * 2016-08-30 2018-03-08 コニカミノルタ株式会社 画像処理装置及びプログラム
JP2023027838A (ja) * 2021-08-18 2023-03-03 コニカミノルタ株式会社 文書処理装置、文書処理方法及びプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002319025A (ja) * 2001-01-31 2002-10-31 Matsushita Electric Ind Co Ltd スキャンした文書イメージの付加情報の検知及び利用方法
JP2006277167A (ja) * 2005-03-29 2006-10-12 Fuji Xerox Co Ltd アノテーションデータ処理プログラム、装置、方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002319025A (ja) * 2001-01-31 2002-10-31 Matsushita Electric Ind Co Ltd スキャンした文書イメージの付加情報の検知及び利用方法
JP2006277167A (ja) * 2005-03-29 2006-10-12 Fuji Xerox Co Ltd アノテーションデータ処理プログラム、装置、方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200300431001; 西村 孝: '色マークの指定による文書画像からの領域およびキーワードの抽出法' 画像電子学会誌 第17巻,第5号, 19881231, page 328-336, 画像電子学会 *
JPN6012064958; 西村 孝: '色マークの指定による文書画像からの領域およびキーワードの抽出法' 画像電子学会誌 第17巻,第5号, 19881231, page 328-336, 画像電子学会 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015041196A (ja) * 2013-08-21 2015-03-02 キヤノン株式会社 情報処理装置及びその制御方法、並びにプログラム
JP2015158726A (ja) * 2014-02-21 2015-09-03 東芝テック株式会社 文書配布サーバ、及び文書配布サーバのプログラム
US9558433B2 (en) 2015-06-30 2017-01-31 Brother Kogyo Kabushiki Kaisha Image processing apparatus generating partially erased image data and supplementary data supplementing partially erased image data
JP2018036794A (ja) * 2016-08-30 2018-03-08 コニカミノルタ株式会社 画像処理装置及びプログラム
JP2023027838A (ja) * 2021-08-18 2023-03-03 コニカミノルタ株式会社 文書処理装置、文書処理方法及びプログラム
JP7767764B2 (ja) 2021-08-18 2025-11-12 コニカミノルタ株式会社 文書処理装置、文書処理方法及びプログラム

Also Published As

Publication number Publication date
JP5181631B2 (ja) 2013-04-10

Similar Documents

Publication Publication Date Title
US8508756B2 (en) Image forming apparatus having capability for recognition and extraction of annotations and additionally written portions
JP5712487B2 (ja) 画像処理装置、画像処理システム、画像処理方法、及びプログラム
EP2162859B1 (en) Image processing apparatus, image processing method, and computer program
JP4227569B2 (ja) 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体
JP2006023945A (ja) 画像処理システム及び画像処理方法
JP2006350867A (ja) 文書処理装置、文書処理方法、プログラム及び情報記録媒体
JP4502385B2 (ja) 画像処理装置およびその制御方法
JP2007042106A (ja) 文書処理方法、文書処理メディア、文書管理方法、文書処理システム及び文書管理システム
JP4983610B2 (ja) 画像処理装置
JP5181631B2 (ja) 画像形成装置、電子文書データ作成方法、および電子文書データ作成プログラム
JP5176416B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
US8199967B2 (en) Image processing apparatus, image processing method, and storage medium
US8634100B2 (en) Image forming apparatus for detecting index data of document data, and control method and program product for the same
JP2020182211A (ja) 情報処理装置、画像形成装置、及びコメント抽出方法
JP5412903B2 (ja) 文書画像処理装置、文書画像処理方法および文書画像処理プログラム
US8181108B2 (en) Device for editing metadata of divided object
US8125689B2 (en) Image processing apparatus and method for associating a plurality of pieces of content data
JP5098614B2 (ja) 文章処理装置の制御方法および文章処理装置
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
US8458590B2 (en) Computer readable medium for creating data, data creating apparatus, printing apparatus and printing system
JP6717229B2 (ja) 情報処理システム、画像形成装置、及び情報処理方法
JP4890178B2 (ja) 画像形成システム及び画像形成方法
JP2005316813A (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
JP2021026604A (ja) 画像処理装置、画像処理方法、及びプログラム
US10264157B2 (en) Image processing apparatus, image processing method and image processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120522

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120627

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120807

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121009

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20121016

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121218

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121231

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160125

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees