JP2005032210A - 場面分類を改善するために空間的で一時的な画像の再構成を効果的に使用する方法 - Google Patents
場面分類を改善するために空間的で一時的な画像の再構成を効果的に使用する方法 Download PDFInfo
- Publication number
- JP2005032210A JP2005032210A JP2003358021A JP2003358021A JP2005032210A JP 2005032210 A JP2005032210 A JP 2005032210A JP 2003358021 A JP2003358021 A JP 2003358021A JP 2003358021 A JP2003358021 A JP 2003358021A JP 2005032210 A JP2005032210 A JP 2005032210A
- Authority
- JP
- Japan
- Prior art keywords
- image
- images
- reconstruction
- classification
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000002123 temporal effect Effects 0.000 claims description 5
- 230000009897 systematic effect Effects 0.000 claims description 2
- 238000003384 imaging method Methods 0.000 claims 1
- 238000012986 modification Methods 0.000 abstract 1
- 230000004048 modification Effects 0.000 abstract 1
- 238000012549 training Methods 0.000 description 50
- 238000012360 testing method Methods 0.000 description 36
- 238000012706 support-vector machine Methods 0.000 description 13
- 238000001514 detection method Methods 0.000 description 10
- 238000005286 illumination Methods 0.000 description 9
- 239000000203 mixture Substances 0.000 description 8
- 239000013598 vector Substances 0.000 description 8
- 238000013459 approach Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 4
- 238000003909 pattern recognition Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000003086 colorant Substances 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 238000012952 Resampling Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000005755 formation reaction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- NRNCYVBFPDDJNE-UHFFFAOYSA-N pemoline Chemical compound O1C(N)=NC(=O)C1C1=CC=CC=C1 NRNCYVBFPDDJNE-UHFFFAOYSA-N 0.000 description 1
- 235000021178 picnic Nutrition 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 1
- 229910052721 tungsten Inorganic materials 0.000 description 1
- 239000010937 tungsten Substances 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000010792 warming Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】 (a)画像の提供段階と、(b)画像の拡張されたセットを生成するために画像の系統的な再構成段階と、及び(c)画像の拡張されたセットが少なくとも一つの改善されたクラシファイヤー及び改善された分類結果を提供する、画像における画像分類を決定するためにクラシファイヤーと画像の拡張されたセットを使用する段階とからなるデジタル画像の画像分類を改善する方法。
【選択図】 図9
Description
A.Vailaya, M.Figueiredo, A.Jain, H.J.Zhang著、「Content−based hierarchical classification of vacation images」、Proceedings of IEEE International Conference on Multimedia Computing and Systems, 1999 H.Rowley, S.Baluja, T.Kanade著、「Rotation invariant neural network−based face detection」、Proceedings of IEEE International Conference on Computer Vision and Pattern Recognition, 1998 R.O.Duda, P.E.Hart, D.G.Stock著、「Pattern Classification」、John Wiley&Sons、ニューヨーク、2001年、pp.475−476 R.P.W.Duin著、「The combining classifier: To train or not to train?」、Proceedings of International Conference on Pattern Recognition, 2002 B.Scholkopf, C.Burges, and A.Smola著、「Advances in Kernel Methods: Support Vector Learning」 MIT Press, Cambridge, MA, 1999, pp.263−266 Y.Wang and H.Zhang著、「Content−based image orientation detection with support vector machines」、 Proceedings of IEEE Workshop on Content−Based Access of Image and Video Libraries,2001
本発明によると、効果的な空間及び一時的な再構成と呼ばれる概念は上の問題を提示するために使用される。一般的に、画像の再構成は、空間的な再構成及び色構成を含む、同一画像の改変された変形を系統的に創生する、プロセスとして定義される。空間的な再構成(反映及びクロップ画像)及び効果的である(シミュレートされた)一時的な再構成(画像色のシフト)の異なるタイプ並びに使用は、表1に表され、下記により詳細に説明される。それらは、トレーニングと、テストと、及び両者での再構成として分類される。数多のタイプと使用の組み合わせは、かかる再構成がトレーニング見本の完全性を破壊しないことを保証するために目視検査を必要とする(例えば、積極的なクロップは、ピクチャーの主要な被写体の損失に帰着するかもしれない。)。
トレーニングデータの限定されたサイズセットで再構成を用いることは、見本のより豊富で、より多様なセットを生じうる。目標は、各画像を視覚的に検査する必要なしに、これらの見本を得ることである。1つの技術は垂直軸に関する各画像を反射することで、それによって、見本の数を倍にする。例えば、図3(a)乃至3(c)に示されるように、オリジナル画像(3(b))は、水平な反映(3(a))又はクロップ(3(c)に示されるように底部から20%)によって変換される。明らかに、新規画像の分類は変っておらず、すなわち、画像の左側の太陽の夕焼け画像が右側に太陽を移動させる一方、画像は有効な夕焼け画像のままである。
トレーニングセットの再構成はさらに見本を生じるが、テスト画像を再構成して新たに各々を分類し、再構成された画像はオリジナル画像の複合的な分類を生じる。空間的な再構成に関すると、見本に対してテスト画像の特徴を良好に一致する目的において、画像のエッジはクロップできる。そのような一致を獲得するために、より積極的に(図2に示されるように)クロップすることが必要であるかもしれない。しかしながら、クラシファイヤーが反映画像を用いてトレーニングする場合、クラシファイヤーに既に組み込まれた対称によりテスト画像を反映する必要はない。例えば、1−NNクラシファイヤーを使用した場合、テスト画像の特徴ベクターTは、最も近い例のベクターEから、ある距離で位置するだろう。反映された画像E及びT、E´及びT´のベクターをそれぞれ呼び出す。特徴の対称性により、d(E、T)=d(E´、T´)であり、T´を余分にする。
数多の適用において、再構成は、トレーニング及びテストデータの両者において使用されてよい。各々が異なる目的に役立つために、それらは容易に組み合わせされてよい。両タイプの再構成を使用する必要を質問するかもしれない。すなわち、もしトレーニング見本の十分に豊富なセットを有するのであれば、テスト画像の再構成はなぜ必要だろうか。トレーニング及びテストの両方での再構成を使用する必要は実際的である。トレーニングデータは開始するように十分に多様であるか、又はトレーニング見本の再構成が完全にあらゆる変化を創生しており、完全に画像空間を満たすという保証はない。
トレーニングセットで保守的な再構成を使用する我々の目的は、完全に管理されていない処理をなすことである。しかしながら、さらにトレーニングデータが所望であり、多大なクロップ又は著しい色のシフトなどの積極的な再構成が使用される場合、すべての再構成された画像を検査する反対の極に向かう必要がないように、トレーニング方法論が必要である。
特許文献1によって記載された前述の階層的画像分類スキームで、夕焼けは容易に山脈/森林景色と分離された。色は夕焼けがそれらの光り輝く暖色によって認識可能であるという直観を確認して、エッジ方向が単独のように、他の特徴よりもかかる問題においてより顕著に感じられた。さらに、空間的な情報は、砂漠の岩形成などのような暖色を含んでいる他の景色と夕焼けを識別するために組込まれるべきである。したがって、空間的な色の瞬間は、7x7グリッドを使用し、かつ、Luv変形された画像の各バンドの平均値及び変化を計算して、画像を49領域に分割して使用されてもよい。これは、49x2x3=294の特徴を生じる。
上に記載のシステムは、砂浜、夕焼け、落ち葉、野原、山脈及び都市の6種類の野外景色を識別するために拡張される(図2で定義)。トレーニング及びテストのために使用された画像は、コレル(Corel)及びカメラ使用者の画像を含んでいた。SVMクラシファイヤーは1対すべてのアプローチ(B.Scholkopf, C.Burges, and A.Smola, Advances in Kernel Methods: Support Vector Learning, MIT Press, Cambridge, MA, 1999, pp.256−258を参照のこと)の使用により多数の種類まで拡張されたが、同じ特徴及びクラシファイヤーは夕焼け検出器のためのように使用される。トレーニングセットが未だ制限されていので、トレーニングで使用された場合、空間的な再構成は特に効果的であった。再構成はテストセットでは使用されなかった。
自動的な画像配位検出(Y.Wang and H.Zhang, “Content−based image orientation detection with support vector machines,” Proceedings of IEEE Workshop on Content−Based Access of Image and Video Libraries,2001を参照)の目的は、画像の上部が直面している方向に依存して、4つの磁針方向(N、S、E、W)のうちの1つに任意の画像を分類することである。画像内容だけに基づいてそうすることは、困難な問題である。好ましい実施態様において、Wang等に類似して同様の結果を達成する、ベースラインシステムは空間的な色の瞬間と、1対すべてのSVMクラシファイヤーを使用する。
12 テスト画像の入力
14 入力段階
16 再構成段階
18 空間的な再構成のアルゴリズム
20 一時的な再構成のアルゴリズム
22 画像の拡張されたセット
24 見本画像の拡張されたセット
26 テスト画像の拡張されたセット
28 トレーニング段階
30 分類段階
32 点線
Claims (3)
- デジタル画像の画像分類を改善する方法であって、
(a)画像の提供段階と、
(b)画像の拡張されたセットを生成するために前記画像の系統的な再構成段階と、及び
(c)前記画像の拡張されたセットが少なくとも一つの改善されたクラシファイヤー及び改善された分類結果を提供する、前記画像における画像分類を決定するためにクラシファイヤーと前記画像の拡張されたセットを使用する段階と
を有することを特徴とする方法。 - 前記段階(b)は、空間的に再構成された画像の拡張されたセットを生成するために前記画像の空間的な再構成を含むことを特徴とする請求項1に記載の方法。
- 前記段階(b)は、一時的に再構成された画像の拡張されたセットを生成するために前記画像の一時的な再構成を含み、それによって、前記拡張されたセットの前記画像は、初期又は後期の撮像の外観をシミュレートすることを特徴とする請求項1に記載の方法。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US42266602P | 2002-10-31 | 2002-10-31 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005032210A true JP2005032210A (ja) | 2005-02-03 |
Family
ID=34215755
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003358021A Pending JP2005032210A (ja) | 2002-10-31 | 2003-10-17 | 場面分類を改善するために空間的で一時的な画像の再構成を効果的に使用する方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005032210A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008234624A (ja) * | 2007-02-19 | 2008-10-02 | Seiko Epson Corp | カテゴリー識別装置、カテゴリー識別方法、及び、プログラム |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000172841A (ja) * | 1998-11-30 | 2000-06-23 | Mitsubishi Electric Inf Technol Center America Inc | 画像からの情景の推定方法 |
| JP2002032751A (ja) * | 2000-07-18 | 2002-01-31 | Olympus Optical Co Ltd | 学習型画像分類装置及び方法並びにその処理プログラムを記録した記録媒体 |
-
2003
- 2003-10-17 JP JP2003358021A patent/JP2005032210A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000172841A (ja) * | 1998-11-30 | 2000-06-23 | Mitsubishi Electric Inf Technol Center America Inc | 画像からの情景の推定方法 |
| JP2002032751A (ja) * | 2000-07-18 | 2002-01-31 | Olympus Optical Co Ltd | 学習型画像分類装置及び方法並びにその処理プログラムを記録した記録媒体 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008234624A (ja) * | 2007-02-19 | 2008-10-02 | Seiko Epson Corp | カテゴリー識別装置、カテゴリー識別方法、及び、プログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7313268B2 (en) | Method for using effective spatio-temporal image recomposition to improve scene classification | |
| Matern et al. | Exploiting visual artifacts to expose deepfakes and face manipulations | |
| US10762608B2 (en) | Sky editing based on image composition | |
| US10558884B2 (en) | System and method for creating navigable views | |
| US7760956B2 (en) | System and method for producing a page using frames of a video stream | |
| US8548249B2 (en) | Information processing apparatus, information processing method, and program | |
| US7302113B2 (en) | Displaying digital images | |
| US8897504B2 (en) | Classification and organization of consumer digital images using workflow, and face detection and recognition | |
| JP4234378B2 (ja) | 画像中で素材の領域を検出する方法 | |
| CN101630363B (zh) | 复杂背景下彩色图像人脸的快速检测方法 | |
| Shih et al. | Exemplar-based video inpainting without ghost shadow artifacts by maintaining temporal continuity | |
| US20110026837A1 (en) | Image processing device and method | |
| US20120294514A1 (en) | Techniques to enable automated workflows for the creation of user-customized photobooks | |
| US7904815B2 (en) | Content-based dynamic photo-to-video methods and apparatuses | |
| JP2001195591A (ja) | 画像中の空を検出する方法 | |
| CN111783729A (zh) | 视频分类方法、装置、设备及存储介质 | |
| US9727802B2 (en) | Automatic, computer-based detection of triangular compositions in digital photographic images | |
| CN108513139A (zh) | 视频直播中的虚拟对象识别方法、装置、存储介质和设备 | |
| Bautell et al. | Sunset scene classification using simulated image recomposition | |
| CN111757149B (zh) | 视频剪辑方法、装置、设备及存储介质 | |
| Luo et al. | Image transform bootstrapping and its applications to semantic scene classification | |
| JP3962517B2 (ja) | 顔面検出方法及びその装置、コンピュータ可読媒体 | |
| JP2005032210A (ja) | 場面分類を改善するために空間的で一時的な画像の再構成を効果的に使用する方法 | |
| Hsu et al. | A framework for making face detection benchmark databases | |
| Luo et al. | A probabilistic approach to image orientation detection via confidence-based integration of low-level and semantic cues |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061004 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090721 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20091019 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20091022 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091110 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091215 |