JP5090330B2 - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP5090330B2 JP5090330B2 JP2008332311A JP2008332311A JP5090330B2 JP 5090330 B2 JP5090330 B2 JP 5090330B2 JP 2008332311 A JP2008332311 A JP 2008332311A JP 2008332311 A JP2008332311 A JP 2008332311A JP 5090330 B2 JP5090330 B2 JP 5090330B2
- Authority
- JP
- Japan
- Prior art keywords
- character input
- input area
- character
- shape
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Character Input (AREA)
Description
(1)検出された直線から一つを選び、直線と隣接する領域に直線があるかを調べる。
(2)(1)の処理で見つけた直線に移動し、(1)と同様に隣接する領域を調べる。
(3)上記の処理を繰り返し、最初に選んだ直線に戻れば、それは閉じた枠線であると判別する。
(4)上記1〜3の処理を、検出された全てのエッジについて調べ終わるまで繰り返す。
(1)4頂点より少ない頂点を持つ領域を除外する。なぜならば、検索窓領域は少なくとも平行な二直線を持つため、4角形以上の多角形、多くは4角形になるためである。
(2) 多角系に含まれる最長の2直線を選択し、それが画面に対して十分に水平であることをチェックする。チェックの方法としては、最長の2直線の始点と終点が、それぞれ、
[直線1について]
始点(x1,y1)、終点(x2,y2)
[直線2について]
始点(x3、y3)、終点(x4、y4)
とするとき、
|y1−y2|<P1 かつ
|y3−y4|<P1
であること。ただし、ここでP1は閾値とする。
||y1−y2|−|y3−y4||<P2
であることを調べる。ただし、ここでP2はP1より小さい閾値とする。
(3)続いて、最長の2直線の長さが大きく離れていないことをチェックする。チェック方法としては、上記の条件において、
||x2−x1|−|x3−x4||<P3であること。P3は閾値とする。
(4)2直線間の距離から、検索窓領域の高さを取得し、検索窓領域の横の長さに対して十分小さいことをチェックする。上記(1)により、すでに2直線が画面に対して水平かつ平行に近いことは確認されているため、検索窓領域の高さは、y座標の平均値を比較することで得られる。すなわち、次の数式で得ることができる。
ここで、P4は係数である。
色ヒストグラム算出部13によって、検出された多角形内の色ヒストグラムを算出する。ヒストグラムの頻度が一番大きい部分が背景色であり、2番目に大きい部分が文字であると判別できる。この2番目に頻度の高い色の値を持つ部分の配置から、中に文字の入った検索窓領域か否かを判別する。
水平方向判別としては、水平方向の座標を、検出された検索窓領域候補内の左上の頂点座標を(x1、y1)、右下の頂点座標を(xn、yn)としたとき、垂直方向座標がy1である全ての画素について、2番目に高い頻度を持つ画素の出現頻度を算出する。画素y+1、y+2についても同様の処理を行ない、出現最終的にynまで頻度を算出する。中に文字の入った検索窓領域の場合、画素の出現頻度が閾値を超えるのは、y座標では座標がynに近い位置(つまり、下詰め)、x座標では、座標がx1に近い方向または中央(つまり、左詰めまたは中央詰め)になる。
(y1付近の出現頻度アベレージ)≧(yn付近の出現頻度アベレージ)
(x1付近の出現頻度アベレージ)≦(xn付近の出現頻度アベレージ)
である場合、検索窓領域で無いと判別する(ステップS13)。
(2)コーナー検出によって文字のコーナーの分布を見る方法
文字はいずれの言語であっても、直線・曲線・点から構成される。そのため、文字領域は大小さまざまなコーナーを含む。従って、このコーナーを検出することで、文字の配置を検出することが可能となる。コーナー検出の手法は、Harrisの手法等既存の手法を利用可能であるが、検出したコーナーから、文字の配置の検索窓領域らしさを判別する部分は、本発明の特徴の一つである。
Empty l=>T1*Empty r
Empty f=>T2*Empty c
の場合、検索窓領域で無いと判断する。ここで、T1、T2は定数である。
「検索窓領域よりも横の長さが小さく、検索窓領域の右に置かれる。」
|yn−ym| < P5 かつ
xn <= xm − wm かつ
wn > wm × P6
を満たすとき、候補mは検索ボタンと判断し、検索窓領域候補から取り除く。ステップS16において、検索ボタンである場合は、検索窓候補でないとされる(ステップS17)。検索ボタンで無い場合は、次の処理へ進む。
(1)全ての文字が最初から入力されている。
(2)文字が徐々に入力されていく。
11 多角形抽出部
12 形状判別部
13 色ヒストグラム算出部
14 文字配置判別部
16 位置判別部
17 文字入力完了判別部
18 文字認識部
19 映像信号入力部
Claims (11)
- 画面に表示された映像に含まれる文字入力領域の映像を検出する画像処理装置であって、
前記画面に表示された映像から文字入力領域の形状に近似する映像を抽出する抽出部と、
前記抽出部により抽出された文字入力領域の形状に近似する映像のうち、文字入力領域の形状を有する映像を抽出する形状判別部と、
前記形状判別部により抽出された文字入力領域の形状を有する映像のうち、文字入力領域の映像内に存在する文字の配列が、キーワード検索時に文字入力領域に入力されるべき文字の配列に近似する配列である文字入力領域の形状を有する映像を抽出する文字配置判別部と、
前記形状判別部により抽出された文字入力領域の形状を有する映像のうち、文字入力領域の映像内の文字数が時間と共に変化する場合、文字数の変化が終了したかどうかを判別する文字入力完了判別部と、を備え、
前記文字配置判別部は、文字数の変化が終了したときにキーワード検索時に文字入力領域に入力されるべき文字の配列に近似する配列である文字入力領域の形状を有する映像を抽出することを特徴とする画像処理装置。 - 前記抽出部は、多角形近似を行なうことにより、前記画面に表示された映像から文字入力領域の形状に近似する映像を抽出することを特徴とする請求項1記載の画像処理装置。
- 前記抽出部は、前記多角形近似の結果のうち、4頂点以上の多角形の中から、最長の2直線が画面に対して水平である多角形を文字入力領域の候補として抽出することを特徴とする請求項2記載の画像処理装置。
- 前記抽出部は、前記多角形近似の結果のうち、4頂点以上の多角形の中から、最長の2直線が画面に対して水平であり、かつ、その2直線の長さが等しい多角形を、文字入力領域の候補として抽出することを特徴とする請求項2記載の画像処理装置。
- 前記抽出部は、前記多角形近似の結果のうち、画面に対して水平な2直線間の距離から、前記多角形の高さを求め、その高さが、前記多角形の横の長さの所定の割合以下の長さである領域を、文字入力領域の候補として抽出することを特徴とする請求項2記載の画像処理装置。
- 前記文字配置判別部は、前記多角形近似によって得られた領域に対して、色ヒストグラムを算出し、その頻度から、背景色、文字色を判別し、文字色の出現頻度から、文字入力領域であるか否かを判別することを特徴とする請求項2記載の画像処理装置。
- 前記文字配置判別部は、前記多角形近似によって得られた領域に対して、コーナー検出を行ない、検出されたコーナーの頻度から領域内の文字の配置を判別し、文字の配置から、文字入力領域であるか否かを判別することを特徴とする請求項2記載の画像処理装置。
- 前記形状判別部により抽出された文字入力領域の形状を有する映像のうち、複数の文字入力領域が抽出された際に、それらの間の横の長さの比および画面内での位置関係から、前記文字入力領域以外の領域を取り除く位置判別部をさらに備えることを特徴とする請求項1または2に記載の画像処理装置。
- 前記文字配置判別部により抽出された文字入力領域の形状を有する映像を、文字認識を行なう文字認識部に出力し、文字認識部によって認識された文字を用いて、キーワード検索を行なうことを特徴とする請求項1から請求項8のいずれかに記載の画像処理装置。
- 画面に表示された映像に含まれる文字入力領域の映像を検出する画像処理方法であって、
抽出部において、前記画面に表示された映像から文字入力領域の形状に近似する映像を抽出するステップと、
形状判別部において、前記抽出部により抽出された文字入力領域の形状に近似する映像のうち、文字入力領域の形状を有する映像を抽出するステップと、
文字入力完了判別部において、前記形状判別部により抽出された文字入力領域の形状を有する映像のうち、文字入力領域の映像内の文字数が時間と共に変化する場合、文字数の変化が終了したかどうかを判別するステップと、
文字配置判別部において、文字数の変化が終了したときに、前記形状判別部により抽出された文字入力領域の形状を有する映像のうち、文字入力領域の映像内に存在する文字の配列が、キーワード検索時に文字入力領域に入力されるべき文字の配列に近似する配列である文字入力領域の形状を有する映像を抽出するステップと、を少なくとも含むことを特徴とする画像処理方法。 - 画面に表示された映像に含まれる文字入力領域の映像を検出するプログラムであって、
前記画面に表示された映像から文字入力領域の形状に近似する映像を抽出する処理と、
前記抽出された文字入力領域の形状に近似する映像のうち、文字入力領域の形状を有する映像を抽出する処理と、
前記抽出された文字入力領域の形状を有する映像のうち、文字入力領域の映像内の文字数が時間と共に変化する場合、文字数の変化が終了したかどうかを判別する処理と、
前記文字数の変化が終了したときに、前記抽出された文字入力領域の形状を有する映像のうち、文字入力領域の映像内に存在する文字の配列が、キーワード検索時に文字入力領域に入力されるべき文字の配列に近似する配列である文字入力領域の形状を有する映像を抽出する処理と、の一連の処理が、コンピュータに読み取りおよび実行可能にコマンド化されたことを特徴とするプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008332311A JP5090330B2 (ja) | 2008-12-26 | 2008-12-26 | 画像処理装置、画像処理方法およびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008332311A JP5090330B2 (ja) | 2008-12-26 | 2008-12-26 | 画像処理装置、画像処理方法およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2010152800A JP2010152800A (ja) | 2010-07-08 |
| JP5090330B2 true JP5090330B2 (ja) | 2012-12-05 |
Family
ID=42571783
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008332311A Expired - Fee Related JP5090330B2 (ja) | 2008-12-26 | 2008-12-26 | 画像処理装置、画像処理方法およびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP5090330B2 (ja) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9567386B2 (en) | 2010-08-17 | 2017-02-14 | Ambrx, Inc. | Therapeutic uses of modified relaxin polypeptides |
| MX346786B (es) | 2010-08-17 | 2017-03-31 | Ambrx Inc | Polipeptidos de relaxina modificados y sus usos. |
| JP5906843B2 (ja) | 2012-03-14 | 2016-04-20 | オムロン株式会社 | キーワード検出装置、その制御方法および制御プログラム、並びに表示機器 |
| JP6155740B2 (ja) * | 2013-03-22 | 2017-07-05 | 富士通株式会社 | 画像処理装置、画像処理プログラムおよび画像処理方法 |
| MY193457A (en) | 2017-02-08 | 2022-10-14 | Bristol Myers Squibb Co | Modified relaxin polypeptides comprising a pharmacokinetic enhancer and uses thereof |
| US12062246B2 (en) * | 2021-09-30 | 2024-08-13 | Konica Minolta Business Solutions U.S.A., Inc. | Extracting text from an image |
| JP7774716B2 (ja) * | 2022-04-20 | 2025-11-21 | 京セラ株式会社 | 信号処理システムおよび信号処理方法 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2893814B2 (ja) * | 1990-03-15 | 1999-05-24 | 住友電気工業株式会社 | 車番自動読取装置におけるプレート切出し装置 |
| JPH11203404A (ja) * | 1998-01-20 | 1999-07-30 | Nippon Telegr & Teleph Corp <Ntt> | 景観画像中文字読み取り方法およびその装置およびその方法を記録した記録媒体 |
| JP2000268291A (ja) * | 1999-03-18 | 2000-09-29 | Nec Corp | ナンバープレート認識装置 |
| JP2007213416A (ja) * | 2006-02-10 | 2007-08-23 | Canon Inc | 手書き文字列検索装置、手書き文字列検索方法及びプログラム |
| JP4853073B2 (ja) * | 2006-03-27 | 2012-01-11 | 沖電気工業株式会社 | 帳票分類処理システム、電子媒体レセプトの作成方法および納入方法 |
| JP4861845B2 (ja) * | 2007-02-05 | 2012-01-25 | 富士通株式会社 | テロップ文字抽出プログラム、記録媒体、方法及び装置 |
-
2008
- 2008-12-26 JP JP2008332311A patent/JP5090330B2/ja not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JP2010152800A (ja) | 2010-07-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7949157B2 (en) | Interpreting sign language gestures | |
| US20220405321A1 (en) | Product auditing in point-of-sale images | |
| JP5090330B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
| EP0720114B1 (en) | Method and apparatus for detecting and interpreting textual captions in digital video signals | |
| CN106254933B (zh) | 字幕提取方法及装置 | |
| US8027550B2 (en) | Image-document retrieving apparatus, method of retrieving image document, program, and recording medium | |
| US7403657B2 (en) | Method and apparatus for character string search in image | |
| US20050196043A1 (en) | Method and apparatus for detecting text associated with video | |
| CN104573675B (zh) | 作业图像的展示方法和装置 | |
| JP5445467B2 (ja) | クレジット情報区間検出方法、クレジット情報区間検出装置及びクレジット情報区間検出プログラム | |
| US20050139782A1 (en) | Face image detecting method, face image detecting system and face image detecting program | |
| CN105260428A (zh) | 图片处理方法和装置 | |
| US8311269B2 (en) | Blocker image identification apparatus and method | |
| CN102802074A (zh) | 从电视信号中提取文字信息并显示的方法及电视机 | |
| JP2000182053A (ja) | 映像処理方法及び装置並びに映像処理手順を記録した記録媒体 | |
| KR20030027953A (ko) | 영상 정보에서의 자동적인 자연 콘텐트 검출 | |
| KR20150100113A (ko) | 영상 처리 장치 및 이의 영상 처리 방법 | |
| EP1612725A1 (en) | Image processing method and image processing device | |
| JP2003346081A (ja) | 文字認識装置 | |
| JP4371306B2 (ja) | カラー画像処理装置及びカラー画像処理プログラム | |
| JP3634248B2 (ja) | 文字領域抽出方法、文字領域抽出装置及び記録媒体 | |
| JP2005215899A (ja) | 対象物検出装置及びその方法 | |
| KR100961136B1 (ko) | 2차원 영상의 그룹화 장치 및 방법 | |
| JP2006268180A (ja) | 画像処理システム | |
| Ganesh | Text Recognition from Images of Big Data |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110826 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120413 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120424 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120607 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120904 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120912 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150921 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |