JP2004118563A - 文字画像処理方法および装置並びにプログラム - Google Patents
文字画像処理方法および装置並びにプログラム Download PDFInfo
- Publication number
- JP2004118563A JP2004118563A JP2002281511A JP2002281511A JP2004118563A JP 2004118563 A JP2004118563 A JP 2004118563A JP 2002281511 A JP2002281511 A JP 2002281511A JP 2002281511 A JP2002281511 A JP 2002281511A JP 2004118563 A JP2004118563 A JP 2004118563A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character image
- image data
- data
- code data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2203/00—Aspects of automatic or semi-automatic exchanges
- H04M2203/45—Aspects of automatic or semi-automatic exchanges related to voicemail messaging
- H04M2203/4536—Voicemail combined with text-based messaging
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42382—Text-based messaging services in telephone networks such as PSTN/ISDN, e.g. User-to-User Signalling or Short Message Service for fixed networks
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
- Mobile Radio Communication Systems (AREA)
- Telephonic Communication Services (AREA)
- Studio Devices (AREA)
Abstract
【解決手段】カメラ付き携帯電話3により紙等の文字が記載された文字媒体を撮影して文字画像データS0を得、これを文字画像処理装置2に送信する。補正手段22によりカメラ付き携帯電話3のカメラ31のレンズ収差等を補正して補正文字画像データS1を得、文字認識手段23によりこれにOCR技術による文字認識処理を行って文字コードデータT0を得、これをカメラ付き携帯電話3に送信する。カメラ付き携帯電話3において、文字コードデータT0をテキスト文書として液晶モニタ32に表示する。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、文字画像を表す文字画像データに対して処理を施す文字画像処理方法および装置並びに文字画像処理方法をコンピュータに実行させるためのプログラムに関するものである。
【0002】
【従来の技術】
デジタルカメラ等の撮像デバイスにより取得された画像データや、写真フイルムに記録された画像をスキャナにより読み取ることにより得られた画像データを、プリンタやモニタのような出力デバイスを用いて再生するシステムが知られている。ここで、画像データを再生する際には、画像データに対して濃度変換処理、ホワイトバランス調整処理、階調変換処理、彩度強調処理、シャープネス処理等の種々の画像処理を施すことにより、再生画像の画質を向上させることができる。
【0003】
ところで、携帯電話の普及には目覚ましいものがあるが、近年、撮影により画像データを取得する撮影手段を有するカメラ付き携帯電話等のカメラ付き携帯端末装置が普及しつつある(例えば特開平6−233020号公報、同9−322114号公報、同10−150523号公報、特開2000−253290号公報等)。このようなカメラ付き携帯端末装置を用いることにより、撮影により取得した自分の好みの画像データを携帯端末装置の待ち受け画面に設定できる。また、撮影により取得した画像データを電子メールに添付して友人が有する携帯電話やPDA等の携帯端末装置に送信することができるため、約束をキャンセルせざるを得ないような状況になったとき、あるいは待ち合わせ時刻に遅刻しそうなときに、申し訳なさそうな自分の表情を撮影して友人に送信する等、現在の自分の状況を友人に知らせることができることから、友人とのコミュニケーションを図るのに便利である。
【0004】
また、カメラ付き携帯電話において取得された画像データに対して、種々の画像処理を施して処理済み画像データを得る画像処理装置を備えた画像サーバが提案されている。このような画像サーバは、カメラ付き携帯端末装置から送信された画像データを受信し、受信した画像データに対して画像処理を施し、画像処理により得られた処理済み画像データをカメラ付き携帯端末装置においてユーザにより指示された送信先に送信するものである。さらに、画像サーバにおいて画像データを保管しておき、カメラ付き携帯端末装置からの要求に応じてカメラ付き携帯端末装置に画像データを送信することもできる。このような画像サーバにおいて画像データに対して画像処理を行うことにより、高画質の画像を待ち受け画面に設定したり、友人に送信できることとなる。
【0005】
【発明が解決しようとする課題】
ところで、紙や黒板等の文字が記録された媒体(以下文字媒体とする)に記載された文字を情報として出力する場合には、文字をタイプしてテキストデータを生成したり、文字媒体を撮影して文字画像データを生成している。しかしながら、文字をタイプするのは非常に面倒な作業である。また、文字画像データはそれを再生することにより文字画像に含まれる文字を読むことができるが、文字画像データに対してホワイトバランスのような画像処理を施すと、画像に含まれる文字が却って見にくくなるという問題がある。
【0006】
また、文字画像データにはサイズの制限があるため、例えば黒板のような大きなサイズの文字媒体を撮影した場合、文字画像中に含まれる文字が非常に小さくなり、文字が読めなくなるという問題もある。
【0007】
本発明は上記事情に鑑みなされたものであり、紙等の文字媒体に記載された文字を情報として簡易に出力することを目的とする。
【0008】
【課題を解決するための手段】
本発明による文字画像処理方法は、文字が記載された文字媒体を撮影することにより得られた文字画像を表す文字画像データの入力を受け付け、
前記文字画像データに対して文字認識処理を施して、前記文字画像に含まれる文字をコード化して文字コードデータを取得し、
該文字コードデータを出力することを特徴とするものである。
【0009】
「文字認識処理」としては、文字画像に対してパターン認識を行って文字コードを得るOCR技術を用いることができる。
【0010】
なお、本発明による文字画像変換方法においては、前記文字画像データを、前記文字媒体を分割して撮影することにより得られた複数の分割文字画像データが合成されてなるものとしてもよい。
【0011】
また、本発明による文字画像変換方法においては、前記文字画像データを、前記文字媒体を動画撮影することにより得られた動画像データから切り出した、複数の所定のフレームをそれぞれ表すフレーム画像データが合成されてなるものとしてもよい。
【0012】
「所定のフレーム」とは、フレーム画像データを合成することにより文字媒体の全体を表す画像データを得ることが可能なフレームのことをいう。
【0013】
また、本発明による文字画像変換方法においては、前記文字画像データを保存し、
前記文字コードデータとともに、該文字コードデータを取得した前記文字画像データの保存場所を表すリンク情報を出力するようにしてもよい。
【0014】
また、本発明による文字画像変換方法においては、前記文字コードデータを音声データに変換し、
該音声データを前記文字コードデータに代えてまたは前記文字コードデータとともに出力するようにしてもよい。
【0015】
また、本発明による文字画像変換方法においては、カメラ付き携帯端末装置において前記文字画像を撮影することにより取得され、該カメラ付き携帯端末装置から送信された前記文字画像データを受信し、
前記文字コードデータを前記カメラ付き携帯端末装置に送信するようにしてもよい。
【0016】
本発明による文字画像変換装置は、文字が記載された文字媒体を撮影することにより得られた文字画像を表す文字画像データの入力を受け付ける入力手段と、
前記文字画像データに対して文字認識処理を施して、前記文字画像に含まれる文字をコード化して文字コードデータを取得する文字認識手段と、
該文字コードデータを出力する出力手段とを備えたことを特徴とするものである。
【0017】
なお、本発明による文字画像変換装置においては、前記文字媒体を分割して撮影することにより得られた複数の分割文字画像データを合成して前記文字画像データを得る合成手段をさらに備えるものとしてもよい。
【0018】
また、本発明による文字画像変換装置においては、前記文字媒体を動画撮影することにより得られた動画像データから複数の所定のフレームを切り出す切り出し手段と、
該切り出し手段により切り出された前記複数の所定のフレームをそれぞれ表す複数のフレーム画像データを合成して前記文字画像データを得る合成手段とをさらに備えるものとしてもよい。
【0019】
また、本発明による文字画像変換装置においては、前記文字画像データを保存する保存手段と、
前記文字コードデータとともに、該文字コードデータを取得した前記文字画像データの保存場所を表すリンク情報を生成するリンク情報生成手段とをさらに備えるものとし、
前記出力手段を、前記リンク情報をも出力する手段としてもよい。
【0020】
また、本発明による文字画像変換装置においては、前記文字コードデータを音声データに変換する音声変換手段をさらに備えるものとし、
前記出力手段を、該音声データを前記文字コードデータに代えてまたは前記文字コードデータとともに出力する手段としてもよい。
【0021】
また、本発明による文字画像変換装置においては、カメラ付き携帯端末装置において前記文字画像を撮影することにより取得され、該カメラ付き携帯端末装置から送信された前記文字画像データを受信し、前記文字コードデータを前記カメラ付き携帯端末装置に送信する通信手段をさらに備えるものとしてもよい。
【0022】
なお、本発明による文字画像処理方法をコンピュータに実行させるためのプログラムとして提供してもよい。
【0023】
【発明の効果】
本発明によれば、文字画像データの入力が受け付けられ、文字画像データに対して文字認識処理が施されて文字画像に含まれる文字がコード化されて文字コードデータが取得され、この文字コードデータが出力される。したがって、紙や黒板等の文字媒体に記載された文字を、デジタルカメラ等により撮影して文字画像データを取得しさえすれば、文字画像データに対して本発明による文字画像変換方法を適用することにより、文字媒体に記載された文字を文字コードデータにより表されるテキスト情報として出力することができ、その結果、文字媒体に記載された文字をテキスト文書として表示することができる。
【0024】
また、文字画像データを、文字媒体を分割して撮影することにより得られた複数の分割文字画像データを合成して取得することにより、例えば黒板のように非常に広い範囲に亘って文字が記載された文字媒体については、分割して撮影を行うことにより、文字媒体の全体に記載された文字を文字コードデータとして取得することができる。
【0025】
また、文字画像データを、文字媒体を動画撮影することにより得られた動画像データから複数の所定のフレームを切り出し、切り出した複数の所定のフレームをそれぞれ表すフレーム画像データを合成して取得することにより、例えば黒板のように非常に広い範囲に亘って文字が記載された文字媒体については、動画像として撮影を行うことにより、文字媒体の全体に記載された文字を文字コードデータとして取得することができる。
【0026】
また、文字コードデータとともに、文字コードデータを取得した文字画像データの保存場所を表すリンク情報を出力することにより、リンク情報に基づいて文字コードデータを取得した文字画像データを参照することができる。したがって、文字画像データにより表される文字画像と、文字コードデータにより表されるテキスト文書との読み合わせを行うことができ、これにより、文字コードデータに誤りがないか否かの確認を容易に行うことができる。
【0027】
また、文字コードデータを音声データに変換し、音声データを文字コードデータに代えて出力することにより、文字が読めない場合であっても、文字媒体に記載された文字の内容を把握することができる。
【0028】
また、カメラ付き携帯端末装置において文字媒体を撮影して文字画像データを取得することにより、手軽に文字媒体を撮影し、撮影した文字画像の文字コードデータを取得することができる。
【0029】
【発明の実施の形態】
以下図面を参照して本発明の実施形態について説明する。図1は本発明の第1の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図である。図1に示すように、第1の実施形態による文字画像通信システムは、文字画像処理装置2と、カメラ付き携帯電話3との間で携帯電話通信網4を介してデータのやりとりを行うものである。
【0030】
文字画像処理装置2は、カメラ付き携帯電話3と携帯電話通信網4を介したデータ通信を行う通信手段21と、後述するようにカメラ付き携帯電話3から送信された文字画像データS0に対してカメラ付き携帯電話3に設けられたカメラのレンズ収差等により、文字画像データS0により表される文字画像に生じる像の歪みを補正して補正文字画像データS1を得る補正手段22と、補正文字画像データS1に対して文字認識処理を施して、補正文字画像データS1により表される文字画像に含まれる文字をコード化して文字コードデータT0を取得する文字認識手段23と、補正文字画像データS1等の種々の情報を記憶する記憶手段24と、記憶手段24に補正文字画像データS1が記憶される際に、補正文字画像データS1のURLを表すリンク情報L0を生成するリンク情報生成手段25とを備える。
【0031】
なお、カメラ付き携帯電話3から送信されるのは文字画像データS0のみならず、人物や風景等の画像データも含まれる。このため、カメラ付き携帯電話3からは、送信した画像データが文字画像である旨を表す文字情報C0が文字画像データS0とともに送信される。したがって、文字画像処理装置2においては、送信された画像データが文字情報C0とともに送信されている場合に、送信された画像データが文字画像データS0である旨を認識して、文字認識処理を行うことができる。なお、文字情報C0にはカメラ付き携帯電話3の機種情報も含まれる。
【0032】
補正手段22は、カメラ付き携帯電話3のカメラのレンズ収差等によって文字画像に生じる像の歪みを補正する。ここで、記憶手段24にカメラ付き携帯電話3の種類に応じた像の補正情報が記憶されており、補正手段22は、文字画像データS0とともにカメラ付き携帯電話3から送信された文字情報C0に含まれるカメラ付き携帯電話3の機種情報に基づいて、文字画像データS0を得たカメラ付き携帯電話3に対応する補正情報を取得する。そしてこの補正情報に基づいて、文字画像データS0により表される文字画像の像の歪みを補正して補正文字画像データS1を取得する。
【0033】
文字認識手段23は、パターン認識により文字コードを得るOCR技術を用いて文字画像データS1から文字コードデータT0を取得する。
【0034】
文字コードデータT0は補正文字画像データS1の保存場所を表すURLからなるリンク情報L0とともに通信手段21により携帯電話通信網4を介してカメラ付き携帯電話3に送信され、ここで、テキスト文書として表示される。
【0035】
カメラ付き携帯電話3は、被写体を撮像して被写体を表す画像データを得るカメラ31と、画像や操作コマンド等の表示を行う液晶モニタ32と、テンキー等からなる操作ボタン33と、種々の情報を記憶するメモリ34とを備える。
【0036】
カメラ付き携帯電話3のユーザは、紙や黒板等の文字媒体に記載された文字を撮像して文字画像を表す文字画像データS0を取得する。そして、ユーザが操作ボタン33を用いて送信操作を行うことにより、文字画像データS0が携帯電話通信網4を介して文字画像処理装置2に送信される。また、この際、文字画像データS0とともに、送信する画像データが文字画像データS0である旨を表す文字情報C0も送信される。
【0037】
なお、文字画像処理装置2から送信された文字コードデータT0はテキスト文書として液晶モニタ32に表示される。また、リンク情報L0はURLとして液晶モニタ32に表示される。
【0038】
次いで、第1の実施形態の動作について説明する。図2は第1の実施形態において行われる処理を示すフローチャートである。まず、カメラ付き携帯電話3において、紙や黒板等の文字媒体に記載された文字の撮影が行われて文字画像データS0が取得される(ステップS1)。続いて、送信の操作がなされたか否かの監視が開始され(ステップS2)、ステップS2が肯定されると、文字画像データS0および文字情報C0が携帯電話通信網4を介して文字画像処理装置2に送信される(ステップS3)。
【0039】
文字画像処理装置2においては、通信手段21により文字画像データS0および文字情報C0が受信される(ステップS4)。そして、補正手段22により、カメラ付き携帯電話3の機種に応じた補正情報が記憶手段24から読み出されて、カメラのレンズ収差等によって文字画像に生じる像の歪みが補正されて補正文字画像データS1が取得される(ステップS5)。そして、文字認識手段23により、補正文字画像データS1に対してパターン認識が行われて文字コードを表す文字コードデータT0が取得される(ステップS6)。一方、補正文字画像データS1が記憶手段24に記憶されるとともに(ステップS7)、リンク情報生成手段25により補正文字画像データS1の保存場所を表すURLからなるリンク情報L0が生成される(ステップS8)。続いて、文字コードデータT0およびリンク情報L0が、通信手段21により携帯電話通信網4を介してカメラ付き携帯電話3に送信される(ステップS9)。
【0040】
カメラ付き携帯電話3においては、文字コードデータT0およびリンク情報L0が受信され(ステップS10)、文字コードデータT0により表されるテキスト文書が液晶モニタ32に表示される(ステップS11)。一方、操作ボタン33からリンク情報L0により表されるURLの表示指示がなされたか否かの監視が開始され(ステップS12)、ステップS12が肯定されるとリンク情報L0により表されるURLが液晶モニタ32に表示され(ステップS13)、処理を終了する。
【0041】
このように、第1の実施形態によれば、文字画像処理装置2において、文字画像データS1に対して文字認識処理を施して、文字画像データS0により表される文字画像に含まれる文字をコード化して文字コードデータT0を取得し、この文字コードデータT0をカメラ付き携帯電話3に送信するようにしたため、カメラ付き携帯電話3において、紙等の文字媒体に記載された文字を撮影しさえすれば、文字をタイプすることなく、テキスト文書として文字を液晶モニタ32に表示することができる。また、文字画像を表示する場合は、画像処理により文字が見にくくなる場合があるが、本実施形態においては、文字をテキスト文書として表示できるため、文字が見にくいという問題も回避することができる。
【0042】
また、文字コードデータT0とともに、文字コードデータT0を取得した文字画像データS0を補正して得られた補正文字画像データS1のリンク情報L0を出力することにより、リンク情報L0により表されるURLにアクセスすれば、補正文字画像データS1を参照することができる。したがって、補正文字画像データS1により表される補正文字画像と、文字コードデータT0により表されるテキスト文書との読み合わせを行うことができ、これにより、文字コードデータT0に誤りがないか否かの確認を容易に行うことができる。
【0043】
次いで、本発明の第2の実施形態について説明する。図3は本発明の第2の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図である。なお、第2の実施形態において第1の実施形態と同一の構成については同一の参照番号を付し、詳細な説明は省略する。第2の実施形態においては、文字コードデータT0を音声データV0に変換する音声変換手段27を文字画像処理装置2に設けた点が第1の実施形態と異なる。
【0044】
音声変換手段27は、文字コードデータT0により表される文字を人間の声を模倣した音声を表す音声データV0に変換する。なお、この際の声の種類(例えば、男性、女性、著名なキャラクターの声等)をカメラ付き携帯電話3の指示により変更できるようにしてもよい。
【0045】
次いで、第2の実施形態の動作について説明する。図4は第2の実施形態において行われる処理を示すフローチャートである。まず、カメラ付き携帯電話3において、紙や黒板等の文字媒体に記載された文字の撮影が行われて文字画像データS0が取得される(ステップS21)。続いて、送信の操作がなされたか否かの監視が開始され(ステップS22)、ステップS22が肯定されると、文字画像データS0および文字情報C0が携帯電話通信網4を介して文字画像処理装置2に送信される(ステップS23)。
【0046】
文字画像処理装置2においては通信手段21により文字画像データS0および文字情報C0が受信される(ステップS24)。そして、補正手段22により、カメラ付き携帯電話3の機種に応じた補正情報が記憶手段24から読み出されて、カメラのレンズ収差等によって文字画像に生じる像の歪みが補正されて補正文字画像データS1が取得される(ステップS25)。そして、文字認識手段23により、補正文字画像データS1に対してパターン認識が行われて文字コードを表す文字コードデータT0が取得される(ステップS26)。さらに、音声変換手段27により文字コードデータT0が音声データV0に変換される(ステップS27)。
【0047】
一方、補正文字画像データS1が記憶手段24に記憶されるとともに(ステップS28)、リンク情報生成手段25により補正文字画像データS1の保存場所を表すURLからなるリンク情報L0が生成される(ステップS29)。続いて、文字コードデータT0、リンク情報L0および音声データV0が、通信手段21により携帯電話通信網4を介してカメラ付き携帯電話3に送信される(ステップS30)。
【0048】
カメラ付き携帯電話3においては、文字コードデータT0、リンク情報L0および音声データV0が受信され(ステップS31)、文字コードデータT0により表されるテキスト文書が液晶モニタ32に表示されるとともに(ステップS32)、音声データV0が音声として再生される(ステップS33)。一方、操作ボタン33からリンク情報L0により表されるURLの表示指示がなされたか否かの監視が開始され(ステップS34)、ステップS34が肯定されるとリンク情報L0により表されるURLが液晶モニタ32に表示され(ステップS35)、処理を終了する。
【0049】
このように、第2の実施形態においては、文字コードデータT0およびリンク情報L0とともに、音声データV0をカメラ付き携帯電話3に送信し、文字コードデータT0により表されるテキスト文書を液晶モニタ32に表示するとともに、音声データV0を再生するようにしたため、液晶モニタ32に表示されたテキスト文書が読み上げられることとなる。このため、文字が読めない場合であっても、文字画像の内容を把握することができる。
【0050】
次いで、本発明の第3の実施形態について説明する。図5は本発明の第3の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図である。なお、第3の実施形態において第1の実施形態と同一の構成については同一の参照番号を付し、詳細な説明は省略する。第3の実施形態においては、カメラ付き携帯電話3により、紙や黒板等の文字媒体を分割して撮影して複数の分割文字画像データDS0を取得してこれらを文字画像処理装置2に送信するようにし、これら複数の分割文字画像データDS0をそれぞれ補正して得られた補正分割文字画像データDS1を合成して1つの文字画像データS2を生成する合成手段28を備えた点が第1の実施形態と異なる。
【0051】
なお、カメラ付き携帯電話3においては、分割文字画像データDS0とともに、分割撮影がどのように行われたかを表す分割情報D0が生成されて文字画像処理装置2に送信される。図6は分割情報D0の生成を説明するための図である。図6(a)に示すように、文字媒体が領域A1〜A4の4つの領域に分割されて撮影された場合において、カメラ付き携帯電話3においては、各領域A1〜A4の画像を表す分割文字画像データDS0のタグ情報に、その分割文字画像データDS0を得た領域を表す情報(例えばA1等の符号)を付与する。一方、分割情報D0は図6(b)に示すように、分割された画像が合成された場合の全領域の範囲および各領域に挿入される分割文字画像データDS0を特定する符号が付与された画像を表すものとなっている。なお、タグ情報は分割文字画像データDS0を補正して得られた補正分割文字画像データDS1にも付与された状態が維持される。
【0052】
そして、合成手段28は、分割情報D0および各補正分割文字画像データDS1に付与されたタグ情報を参照して分割文字画像データDS1を合成することにより、撮影した紙や黒板等の文字媒体の全体に記載された文字を含む文字画像を表す文字画像データS2を得る。
【0053】
次いで、第3の実施形態の動作について説明する。図7は第3の実施形態において行われる処理を示すフローチャートである。まず、カメラ付き携帯電話3において、紙や黒板等の文字媒体に記載された文字の分割撮影が行われて分割文字画像データDS0が取得される(ステップS41)。続いて、送信の操作がなされたか否かの監視が開始され(ステップS42)、ステップS42が肯定されると、分割文字画像データDS0、文字情報C0および分割情報D0が携帯電話通信網4を介して文字画像処理装置2に送信される(ステップS43)。
【0054】
文字画像処理装置2においては通信手段21により分割文字画像データDS0、文字情報C0および分割情報D0が受信される(ステップS44)。そして、補正手段22により、カメラ付き携帯電話3の機種に応じた補正情報が記憶手段24から読み出されて、カメラのレンズ収差等によって文字画像に生じる像の歪みが補正されて補正分割文字画像データDS1が取得される(ステップS45)。さらに、合成手段28により分割情報D0に基づいて補正分割文字画像データDS1が合成されて、文字画像データS2が取得される(ステップS46)。
【0055】
そして、文字認識手段23により、文字画像データS2に対してパターン認識が行われて文字コードを表す文字コードデータT0が取得される(ステップS47)。
【0056】
一方、文字画像データS2が記憶手段24に記憶されるとともに(ステップS48)、リンク情報生成手段25により文字画像データS2の保存場所を表すURLからなるリンク情報L0が生成される(ステップS49)。続いて、文字コードデータT0およびリンク情報L0が、通信手段21により携帯電話通信網4を介してカメラ付き携帯電話3に送信される(ステップS50)。
【0057】
カメラ付き携帯電話3においては、文字コードデータT0およびリンク情報L0が受信され(ステップS51)、文字コードデータT0により表されるテキスト文書が液晶モニタ32に表示される(ステップS52)。一方、操作ボタン33からリンク情報L0により表されるURLの表示指示がなされたか否かの監視が開始され(ステップS53)、ステップS53が肯定されるとリンク情報L0により表されるURLが液晶モニタ32に表示され(ステップS54)、処理を終了する。
【0058】
このように、第3の実施形態においては、文字媒体を分割して撮影することにより得られた複数の分割文字画像データDS0を合成して文字画像データS2を取得し、これに対して文字認識を行って文字コードデータT0を取得するようにしたため、例えば黒板のように非常に広い範囲に亘って文字が記載されている文字媒体についても、文字媒体を分割して撮影すれば、文字媒体の全体に記載された文字を文字コードデータT0として取得することができる。
【0059】
次いで、本発明の第4の実施形態について説明する。図8は本発明の第4の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図である。なお、第4の実施形態において第1の実施形態と同一の構成については同一の参照番号を付し、詳細な説明は省略する。第4の実施形態においては、カメラ付き携帯電話3により、紙や黒板等の文字媒体に記載された文字を動画として撮影して文字動画像データM0を取得し、これを文字画像処理装置2に送信して文字認識を行うようにしたものである。このため、文字画像処理装置2に、文字動画像データM0から文字画像を合成するために必要な複数のフレームデータDS3を切り出す切り出し手段41と、複数のフレームデータDS3を合成して1つの文字画像データS3を生成する合成手段42とを備えた点が第1の実施形態と異なる。
【0060】
なお、カメラ付き携帯電話3においては、文字動画像データM0にフレームデータDS3の切り出しに必要なマークが付与され、マークが付与された文字動画像データM0が文字画像処理装置2に送信される。図9はマークの付与を説明するための図である。図9(a)に示すように、文字媒体は「あいうえおかきくけこ…」の順に文字をなぞるように撮影がなされて文字動画像データM0が取得される。この際、カメラ付き携帯電話3のファインダに表示されるフレームFが領域A1〜A4の中心位置に移動した際に、操作ボタン33からの指示により文字動画像データM0にマークが付与される。
【0061】
そして、切り出し手段41はマークが付与されたフレームを切り出して、文字画像データS3の合成に必要な複数のフレームデータDS3を生成する。
【0062】
合成手段42は、複数のフレームデータDS3を合成することにより、撮影した紙や黒板等の文字媒体の全体に記載された文字を含む文字画像を表す文字画像データS3を取得する。
【0063】
次いで、第4の実施形態の動作について説明する。図10は第4の実施形態において行われる処理を示すフローチャートである。まず、カメラ付き携帯電話3において、紙や黒板等の文字媒体に記載された文字の動画撮影が行われて文字動画像データM0が取得される(ステップS61)。続いて、送信の操作がなされたか否かの監視が開始され(ステップS62)、ステップS62が肯定されると、文字動画像データM0および文字情報C0が携帯電話通信網4を介して文字画像処理装置2に送信される(ステップS63)。
【0064】
文字画像処理装置2においては通信手段21により文字動画像データM0および文字情報C0が受信される(ステップS64)。そして、補正手段22により、カメラ付き携帯電話3の機種に応じた補正情報が記憶手段24から読み出されて、カメラのレンズ収差等によって文字画像に生じる像の歪みが補正されて補正文字動画像データM1が取得される(ステップS65)。そして、切り出し手段41により、補正文字動画像データM1に付与されたマークに基づいて、複数のフレームデータDS3が切り出される(ステップS66)。さらに、合成手段42により複数のフレームデータDS3が合成されて、文字画像データS3が取得される(ステップS67)。
【0065】
そして、文字認識手段23により、文字画像データS3に対してパターン認識が行われて文字コードを表す文字コードデータT0が取得される(ステップS68)。
【0066】
一方、文字画像データS3が記憶手段24に記憶されるとともに(ステップS69)、リンク情報生成手段25により文字画像データS3の保存場所を表すURLからなるリンク情報L0が生成される(ステップS70)。続いて、文字コードデータT0およびリンク情報L0が、通信手段21により携帯電話通信網4を介してカメラ付き携帯電話3に送信される(ステップS71)。
【0067】
カメラ付き携帯電話3においては、文字コードデータT0およびリンク情報L0が受信され(ステップS72)、文字コードデータT0により表されるテキスト文書が液晶モニタ32に表示される(ステップS73)。一方、操作ボタン33からリンク情報L0により表されるURLの表示指示がなされたか否かの監視が開始され(ステップS74)、ステップS74が肯定されるとリンク情報L0により表されるURLが液晶モニタ32に表示され(ステップS75)、処理を終了する。
【0068】
このように、第4の実施形態によれば、文字認識を行うための文字画像データS3を、文字媒体を動画撮影することにより得られた文字動画像データM1から複数のフレームデータDS3を切り出し、切り出した複数のフレームデータDS3を合成して取得しているため、例えば黒板のように非常に広い範囲に亘って文字が記載されている文字媒体についても、文字媒体を動画像として撮影すれば、文字媒体の全体に記載された文字を文字コードデータT0として取得することができる。
【0069】
なお、第3および第4の実施形態においては、第2の実施形態と同様に音声変換手段27を設け、文字コードデータT0を変換することにより得られた音声データV0をカメラ付き携帯電話3に送信してもよい。
【0070】
また、上記第1から第4の実施形態において、同一人物が書いた文字を撮像する機会が多い場合には、その人の筆跡の特徴を記憶手段24に記憶しておくことが好ましい。この際、文字画像データS0等とともに文字を書いた人を特定するための情報を文字画像処理装置2に送信する。文字画像処理装置2においてはその情報に基づいて、その人の筆跡を考慮して文字認識手段23において文字コードデータT0を取得する。
【0071】
このように、文字を書いた人の筆跡の特徴を考慮することにより、文字認識手段23における文字認識の精度を向上させることができる。
【0072】
また、上記第1から第4の実施形態においては、カメラ付き携帯電話3において文字媒体を撮影しているが、カメラ付きのPDAや、通信機能を有するデジタルカメラ等、任意のカメラ付き携帯端末装置において文字媒体を撮影して文字画像データを取得し、文字画像処理装置2に送信、携帯端末装置において文字コードデータT0をテキスト文書として表示してもよい。
【図面の簡単な説明】
【図1】本発明の第1の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図
【図2】第1の実施形態において行われる処理を示すフローチャート
【図3】本発明の第2の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図
【図4】第2の実施形態において行われる処理を示すフローチャート
【図5】本発明の第3の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図
【図6】分割情報の生成を説明するための図
【図7】第3の実施形態において行われる処理を示すフローチャート
【図8】本発明の第4の実施形態による文字画像処理装置を適用した文字画像通信システムの構成を示す概略ブロック図
【図9】マークの付与を説明するための図
【図10】第4の実施形態において行われる処理を示すフローチャート
【符号の説明】
1 文字画像通信システム
2 文字画像処理装置
3 カメラ付き携帯電話
4 携帯電話通信網
21 通信手段
22 補正手段
23 文字認識手段
24 記憶手段
25 リンク情報生成手段
27 音声変換手段
28,42 合成手段
31 カメラ
32 液晶モニタ
33 操作ボタン
34 メモリ
41 切り出し手段
Claims (18)
- 文字が記載された文字媒体を撮影することにより得られた文字画像を表す文字画像データの入力を受け付け、
前記文字画像データに対して文字認識処理を施して、前記文字画像に含まれる文字をコード化して文字コードデータを取得し、
該文字コードデータを出力することを特徴とする文字画像変換方法。 - 前記文字画像データは、前記文字媒体を分割して撮影することにより得られた複数の分割文字画像データが合成されてなるものであることを特徴とする請求項1記載の文字画像処理方法。
- 前記文字画像データは、前記文字媒体を動画撮影することにより得られた動画像データから切り出した、複数の所定のフレームをそれぞれ表すフレーム画像データが合成されてなるものであることを特徴とする請求項1記載の文字画像処理方法。
- 前記文字画像データを保存し、
前記文字コードデータとともに、該文字コードデータを取得した前記文字画像データの保存場所を表すリンク情報を出力することを特徴とする請求項1から3のいずれか1項記載の文字画像処理方法。 - 前記文字コードデータを音声データに変換し、
該音声データを前記文字コードデータに代えてまたは前記文字コードデータとともに出力することを特徴とする請求項1から4のいずれか1項記載の文字画像処理方法。 - カメラ付き携帯端末装置において前記文字媒体を撮影することにより取得され、該カメラ付き携帯端末装置から送信された前記文字画像データを受信し、
前記文字コードデータを前記カメラ付き携帯端末装置に送信することを特徴とする請求項1から5のいずれか1項記載の文字画像処理方法。 - 文字が記載された文字媒体を撮影することにより得られた文字画像を表す文字画像データの入力を受け付ける入力手段と、
前記文字画像データに対して文字認識処理を施して、前記文字画像に含まれる文字をコード化して文字コードデータを取得する文字認識手段と、
該文字コードデータを出力する出力手段とを備えたことを特徴とする文字画像変換装置。 - 前記文字媒体を分割して撮影することにより得られた複数の分割文字画像データを合成して前記文字画像データを得る合成手段をさらに備えたことを特徴とする請求項7記載の文字画像処理装置。
- 前記文字媒体を動画撮影することにより得られた動画像データから複数の所定のフレームを切り出す切り出し手段と、
該切り出し手段により切り出された前記複数の所定のフレームをそれぞれ表す複数のフレーム画像データを合成して前記文字画像データを得る合成手段とをさらに備えたことを特徴とする請求項7記載の文字画像処理装置。 - 前記文字画像データを保存する保存手段と、
前記文字コードデータとともに、該文字コードデータを取得した前記文字画像データの保存場所を表すリンク情報を生成するリンク情報生成手段とをさらに備え、
前記出力手段は、前記リンク情報をも出力する手段であることを特徴とする請求項7から9のいずれか1項記載の文字画像処理装置。 - 前記文字コードデータを音声データに変換する音声変換手段をさらに備え、
前記出力手段は、該音声データを前記文字コードデータに代えてまたは前記文字コードデータとともに出力する手段であることを特徴とする請求項7から10のいずれか1項記載の文字画像処理装置。 - カメラ付き携帯端末装置において前記文字媒体を撮影することにより取得され、該カメラ付き携帯端末装置から送信された前記文字画像データを受信し、前記文字コードデータを前記カメラ付き携帯端末装置に送信する通信手段をさらに備えたことを特徴とする請求項7から11のいずれか1項記載の文字画像処理装置。
- 文字が記載された文字媒体を撮影することにより得られた文字画像を表す文字画像データの入力を受け付ける手順と、
前記文字画像データに対して文字認識処理を施して、前記文字画像に含まれる文字をコード化して文字コードデータを取得する手順と、
該文字コードデータを出力する手順とを有する文字画像変換方法をコンピュータに実行させるためのプログラム。 - 前記文字媒体を分割して撮影することにより得られた複数の分割文字画像データを合成して前記文字画像データを得る手順をさらに有する請求項13記載のプログラム。
- 前記文字媒体を動画撮影することにより得られた動画像データから複数の所定のフレームを切り出す手順と、
該切り出し手段により切り出された前記複数の所定のフレームをそれぞれ表す複数のフレーム画像データを合成して前記文字画像データを得る手順とをさらに有する請求項13記載のプログラム。 - 前記文字画像データを保存する手順と、
前記文字コードデータとともに、該文字コードデータを取得した前記文字画像データの保存場所を表すリンク情報を出力する手順とをさらに有する請求項13から15のいずれか1項記載のプログラム。 - 前記文字コードデータを音声データに変換する手順と、
該音声データを前記文字コードデータに代えてまたは前記文字コードデータとともに出力する手順とをさらに有する請求項13から16のいずれか1項記載のプログラム。 - カメラ付き携帯端末装置において前記文字媒体を撮影することにより取得され、該カメラ付き携帯端末装置から送信された前記文字画像データを受信する手順と、
前記文字コードデータを前記カメラ付き携帯端末装置に送信する手順とをさらに有する請求項13から17のいずれか1項記載のプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002281511A JP2004118563A (ja) | 2002-09-26 | 2002-09-26 | 文字画像処理方法および装置並びにプログラム |
| US10/669,363 US20040061772A1 (en) | 2002-09-26 | 2003-09-25 | Method, apparatus and program for text image processing |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002281511A JP2004118563A (ja) | 2002-09-26 | 2002-09-26 | 文字画像処理方法および装置並びにプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004118563A true JP2004118563A (ja) | 2004-04-15 |
Family
ID=32025207
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002281511A Pending JP2004118563A (ja) | 2002-09-26 | 2002-09-26 | 文字画像処理方法および装置並びにプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20040061772A1 (ja) |
| JP (1) | JP2004118563A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011227622A (ja) * | 2010-04-16 | 2011-11-10 | Teraoka Seiko Co Ltd | 輸送物情報入力装置 |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7078722B2 (en) | 2004-09-20 | 2006-07-18 | International Business Machines Corporation | NFET and PFET devices and methods of fabricating same |
| US20060204098A1 (en) * | 2005-03-07 | 2006-09-14 | Gaast Tjietse V D | Wireless telecommunications terminal comprising a digital camera for character recognition, and a network therefor |
| DE102005033001A1 (de) * | 2005-07-14 | 2007-01-25 | Siemens Ag | Verfahren zur Optimierung von Kontrollvorgängen beim Einsatz mobiler Endgeräte |
| US20080317346A1 (en) * | 2007-06-21 | 2008-12-25 | Microsoft Corporation | Character and Object Recognition with a Mobile Photographic Device |
| US8705836B2 (en) | 2012-08-06 | 2014-04-22 | A2iA S.A. | Systems and methods for recognizing information in objects using a mobile device |
| US9160946B1 (en) | 2015-01-21 | 2015-10-13 | A2iA S.A. | Systems and methods for capturing images using a mobile device |
| CN117765133B (zh) * | 2024-02-22 | 2024-05-24 | 青岛海尔科技有限公司 | 生成文本的修正方法及装置、存储介质、电子设备 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06215197A (ja) * | 1993-01-19 | 1994-08-05 | Hitachi Ltd | 文字認識方法および装置 |
| JPH11167532A (ja) * | 1997-12-02 | 1999-06-22 | Canon Inc | データ加工システムおよび装置、データ加工方法、記録媒体 |
| JPH11355627A (ja) * | 1998-06-09 | 1999-12-24 | Ricoh Co Ltd | デジタルスチルカメラ |
| JP2002024762A (ja) * | 2000-06-30 | 2002-01-25 | Toshiba Corp | 文書認識装置及びその方法 |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4949391A (en) * | 1986-09-26 | 1990-08-14 | Everex Ti Corporation | Adaptive image acquisition system |
| SE509327C2 (sv) * | 1996-11-01 | 1999-01-11 | C Technologies Ab | Sätt och anordning för registrering av tecken med hjälp av en penna |
| JPH10150523A (ja) * | 1996-11-20 | 1998-06-02 | Fuji Photo Film Co Ltd | デジタルカメラにより撮影された写真画像データの保管活用システム |
| JP2000134662A (ja) * | 1998-10-26 | 2000-05-12 | Fujitsu Ltd | 移動通信システムおよび移動機 |
| US6512539B1 (en) * | 1999-09-29 | 2003-01-28 | Xerox Corporation | Document periscope |
| US6522889B1 (en) * | 1999-12-23 | 2003-02-18 | Nokia Corporation | Method and apparatus for providing precise location information through a communications network |
| US6594503B1 (en) * | 2000-02-02 | 2003-07-15 | Motorola, Inc. | Communication device with dial function using optical character recognition, and method |
| JP2002073827A (ja) * | 2000-08-31 | 2002-03-12 | Fujitsu Ltd | 校正者の能力管理方法、及び装置 |
| JP2002152696A (ja) * | 2000-11-10 | 2002-05-24 | Hitachi Ltd | 携帯端末 |
| US20020156827A1 (en) * | 2001-04-11 | 2002-10-24 | Avraham Lazar | Archival system for personal documents |
| US6876728B2 (en) * | 2001-07-02 | 2005-04-05 | Nortel Networks Limited | Instant messaging using a wireless interface |
| JP4240859B2 (ja) * | 2001-09-05 | 2009-03-18 | 株式会社日立製作所 | 携帯端末装置及び通信システム |
| US7343049B2 (en) * | 2002-03-07 | 2008-03-11 | Marvell International Technology Ltd. | Method and apparatus for performing optical character recognition (OCR) and text stitching |
-
2002
- 2002-09-26 JP JP2002281511A patent/JP2004118563A/ja active Pending
-
2003
- 2003-09-25 US US10/669,363 patent/US20040061772A1/en not_active Abandoned
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06215197A (ja) * | 1993-01-19 | 1994-08-05 | Hitachi Ltd | 文字認識方法および装置 |
| JPH11167532A (ja) * | 1997-12-02 | 1999-06-22 | Canon Inc | データ加工システムおよび装置、データ加工方法、記録媒体 |
| JPH11355627A (ja) * | 1998-06-09 | 1999-12-24 | Ricoh Co Ltd | デジタルスチルカメラ |
| JP2002024762A (ja) * | 2000-06-30 | 2002-01-25 | Toshiba Corp | 文書認識装置及びその方法 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011227622A (ja) * | 2010-04-16 | 2011-11-10 | Teraoka Seiko Co Ltd | 輸送物情報入力装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20040061772A1 (en) | 2004-04-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7154534B2 (en) | Image input apparatus, program executed by computer, and method for preparing document with image | |
| JPWO2004039068A1 (ja) | 画像合成携帯端末およびそれに用いられる画像合成方法 | |
| JP2004128607A (ja) | 携帯電話機 | |
| JP2005094741A (ja) | 撮像装置及び画像合成方法 | |
| JP6108755B2 (ja) | 撮影機器、撮影画像送信方法及び撮影画像送信プログラム | |
| US8290299B2 (en) | Object outputting method and information processing apparatus | |
| JP2004118563A (ja) | 文字画像処理方法および装置並びにプログラム | |
| CN103581548A (zh) | 摄影设备 | |
| JP2010176287A (ja) | 携帯機器および携帯機器の制御方法並びに携帯機器の制御プログラム | |
| JP2009095017A (ja) | 電子機器、及び、プログラム | |
| JP2004032372A (ja) | 画像データ処理方法および携帯端末装置並びにプログラム | |
| JP2010282616A (ja) | 画像情報処理システム、および画像情報処理方法 | |
| JP4912972B2 (ja) | 撮像装置および撮像システム | |
| JP2003348327A (ja) | 情報検出方法および装置並びにプログラム | |
| JP5246592B2 (ja) | 情報処理端末、情報処理方法、及び情報処理プログラム | |
| JP4353467B2 (ja) | 画像サーバおよびその制御方法 | |
| JP4368906B2 (ja) | 情報検出方法および装置並びにプログラム | |
| JP2007336528A (ja) | 画像生成出力装置 | |
| JP2003283819A (ja) | 画像補正方法および装置並びにプログラム | |
| JP2004282709A (ja) | 情報付与装置および方法、情報検出装置および方法並びにプログラム | |
| JP5847230B2 (ja) | 撮像装置、および撮像装置の制御方法 | |
| JP2004192118A (ja) | 電子機器 | |
| JP5345467B2 (ja) | 収録映像指示装置及びその収録映像指示方法 | |
| JP2004120398A (ja) | 画像出力方法および装置、画像処理方法および装置並びにプログラム | |
| JP2005184469A (ja) | デジタルスチルカメラ |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050208 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20061205 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080110 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080122 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090602 |