JP6798183B2 - 画像解析装置、画像解析方法およびプログラム - Google Patents
画像解析装置、画像解析方法およびプログラム Download PDFInfo
- Publication number
- JP6798183B2 JP6798183B2 JP2016153492A JP2016153492A JP6798183B2 JP 6798183 B2 JP6798183 B2 JP 6798183B2 JP 2016153492 A JP2016153492 A JP 2016153492A JP 2016153492 A JP2016153492 A JP 2016153492A JP 6798183 B2 JP6798183 B2 JP 6798183B2
- Authority
- JP
- Japan
- Prior art keywords
- interest
- image
- point
- importance
- calculation unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Probability & Statistics with Applications (AREA)
- Image Analysis (AREA)
Description
図2は、本発明の第1実施形態である画像解析装置100の機能ブロックを示す。図2に示すように、画像解析装置100は、画像入力部101と、部分画像分割部102と、特徴量抽出部103と、重要度算出部104と、注目点尤度分布算出部105と、注目点算出部106を含んで構成される。
第2実施形態では、特徴量抽出部103を、部分画像を入力とし、特徴量を出力とするニューラルネットワークとして構成する。例えば、特徴量抽出部103は、図8に例示するように、物体認識の分野で使われるような畳み込みネットワークなどを使用して構成することができる。この場合、畳み込み層では、複数種の重みを持ったフィルタ演算が行われ、畳み込み層で算出された値は活性化関数で変換される。活性化関数としては、ロジスティクス関数、逆正接関数、ReLUなどを例示することができる。一方、プーリングは、変数を間引く処理であり、プーリングとしては、最大値プーリングや平均値プーリングなどを例示することができる。
12…ROM
14…RAM
15…補助記憶装置
16…入出力インタフェース
18…ネットワーク・インターフェース
100…画像解析装置
101…画像入力部
102…部分画像分割部
103…特徴量抽出部
104…重要度算出部
105…注目点尤度分布算出部
106…注目点算出部
Claims (8)
- 入力画像を異なる複数の方向に再投影して複数の部分画像に分割する部分画像分割部と、
各前記部分画像から特徴量を抽出する特徴量抽出部と、
抽出した前記特徴量から所定の回帰モデルに基づいて前記入力画像の位置ごとの重要度を算出する重要度算出部と、
算出した前記重要度から所定の回帰モデルに基づいて注目点の尤度分布を算出する注目点尤度分布算出部と、
前記注目点の尤度分布に基づいて注目点を算出する注目点算出部と
を含む、
画像解析装置。 - 前記注目点算出部は、
前記注目点の尤度分布の最尤値、平均値および局所最大値のうちのいずれかに対応する位置を注目点として算出する、
請求項1に記載の画像解析装置。 - 前記注目点尤度分布算出部は、
前記重要度を加重加算して前記注目点の尤度分布を算出する、
請求項1または2に記載の画像解析装置。 - 前記特徴量抽出部、前記重要度算出部、前記注目点尤度分布算出部、および前記注目点算出部のうちの少なくとも1つがニューラルネットワークで構成される、
請求項1〜3のいずれか一項に記載の画像解析装置。 - 入力画像の注目点を算出する方法であって、
前記入力画像を異なる複数の方向に再投影して複数の部分画像に分割するステップと、
各前記部分画像から特徴量を抽出するステップと、
抽出した前記特徴量から所定の回帰モデルに基づいて前記入力画像の位置ごとの重要度を算出するステップと、
算出した前記重要度から所定の回帰モデルに基づいて注目点の尤度分布を算出するステップと、
前記注目点の尤度分布に基づいて注目点を算出するステップと、
を含む、
方法。 - 前記注目点を算出するステップは、
前記注目点の尤度分布の最尤値、平均値および局所最大値のうちのいずれかに対応する位置を注目点として算出するステップを含む、
請求項5に記載の方法。 - 前記注目点の尤度分布を算出するステップは、
前記重要度を加重加算して前記注目点の尤度分布を算出するステップを含む、
請求項5または6に記載の方法。 - コンピュータに、請求項5〜7のいずれか一項に記載の方法の各ステップを実行させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016153492A JP6798183B2 (ja) | 2016-08-04 | 2016-08-04 | 画像解析装置、画像解析方法およびプログラム |
| US15/664,480 US10635926B2 (en) | 2016-08-04 | 2017-07-31 | Image analyzing apparatus, image analyzing method, and recording medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016153492A JP6798183B2 (ja) | 2016-08-04 | 2016-08-04 | 画像解析装置、画像解析方法およびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018022360A JP2018022360A (ja) | 2018-02-08 |
| JP6798183B2 true JP6798183B2 (ja) | 2020-12-09 |
Family
ID=61069318
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016153492A Active JP6798183B2 (ja) | 2016-08-04 | 2016-08-04 | 画像解析装置、画像解析方法およびプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US10635926B2 (ja) |
| JP (1) | JP6798183B2 (ja) |
Families Citing this family (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6912890B2 (ja) * | 2017-01-13 | 2021-08-04 | キヤノン株式会社 | 情報処理装置、情報処理方法、システム |
| KR102498597B1 (ko) * | 2017-08-22 | 2023-02-14 | 삼성전자 주식회사 | 전자 장치 및 이를 이용하여 관심 영역을 설정하여 오브젝트를 식별하는 방법 |
| JP6912998B2 (ja) * | 2017-10-25 | 2021-08-04 | 株式会社日立製作所 | データ分析装置、データ分析方法、およびデータ分析プログラム |
| JP7118697B2 (ja) * | 2018-03-30 | 2022-08-16 | 株式会社Preferred Networks | 注視点推定処理装置、注視点推定モデル生成装置、注視点推定処理システム、注視点推定処理方法、プログラム、および注視点推定モデル |
| JP7031511B2 (ja) * | 2018-06-22 | 2022-03-08 | 株式会社リコー | 信号処理装置、畳み込みニューラルネットワーク、信号処理方法及び信号処理プログラム |
| WO2020006378A1 (en) * | 2018-06-29 | 2020-01-02 | Zoox, Inc. | Sensor calibration |
| US10991342B2 (en) | 2018-07-04 | 2021-04-27 | Ricoh Company, Ltd. | Terminal apparatus, system, and method of displaying image |
| JP7219915B2 (ja) * | 2019-02-25 | 2023-02-09 | 株式会社ファンテックス | 追尾型照明装置および照明追尾システム |
| US11170789B2 (en) * | 2019-04-16 | 2021-11-09 | Microsoft Technology Licensing, Llc | Attentive adversarial domain-invariant training |
| JP7310252B2 (ja) | 2019-04-19 | 2023-07-19 | 株式会社リコー | 動画生成装置、動画生成方法、プログラム、記憶媒体 |
| EP3977347A1 (en) * | 2019-05-28 | 2022-04-06 | Telefonaktiebolaget LM Ericsson (publ) | Improved object detection |
| CN110191362B (zh) * | 2019-05-29 | 2021-03-16 | 鹏城实验室 | 数据传输方法及装置、存储介质及电子设备 |
| GB2585645B (en) * | 2019-07-08 | 2024-04-17 | Toshiba Kk | Computer vision method and system |
| US10999531B1 (en) * | 2020-01-27 | 2021-05-04 | Plantronics, Inc. | Detecting and framing a subject of interest in a teleconference |
| JP7608826B2 (ja) | 2020-12-25 | 2025-01-07 | 株式会社リコー | 動画生成装置、動画生成方法、プログラム、記憶媒体 |
| CN113032613B (zh) * | 2021-03-12 | 2022-11-08 | 哈尔滨理工大学 | 一种基于交互注意力卷积神经网络的三维模型检索方法 |
| CN115440153B (zh) * | 2021-06-01 | 2025-01-28 | 力领科技股份有限公司 | 显示面板的子像素渲染方法 |
| US12360268B2 (en) * | 2021-08-05 | 2025-07-15 | Saudi Arabian Oil Company | Method and system for determination of seismic propagation velocities using nonlinear transformations |
| JP2024083830A (ja) * | 2022-12-12 | 2024-06-24 | キヤノンメディカルシステムズ株式会社 | 医用情報処理装置、医用情報処理方法、及びプログラム |
Family Cites Families (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP3660108B2 (ja) * | 1997-08-29 | 2005-06-15 | 株式会社リコー | 画像保存方法及び機械読み取り可能媒体 |
| JP3411971B2 (ja) | 2001-02-14 | 2003-06-03 | 三菱電機株式会社 | 人物像抽出装置 |
| KR100682888B1 (ko) * | 2004-02-11 | 2007-02-15 | 삼성전자주식회사 | 가중된 회귀모델 결정 방법 및 이를 이용한 혼합물의 성분농도 예측 방법 |
| EP1923835A4 (en) | 2005-08-12 | 2017-10-25 | Sony Interactive Entertainment Inc. | Face image display, face image display method, and face image display program |
| JP2007143123A (ja) | 2005-10-20 | 2007-06-07 | Ricoh Co Ltd | 画像処理装置、画像処理方法、画像処理プログラム及び記録媒体 |
| JP4902368B2 (ja) * | 2007-01-24 | 2012-03-21 | 三洋電機株式会社 | 画像処理装置及び画像処理方法 |
| JP5158974B2 (ja) | 2009-04-28 | 2013-03-06 | 株式会社ニコンシステム | 注目領域抽出方法、プログラム、及び、画像評価装置 |
| JP2011035634A (ja) * | 2009-07-31 | 2011-02-17 | Casio Computer Co Ltd | 画像処理装置及び方法 |
| JP5330530B2 (ja) * | 2010-01-22 | 2013-10-30 | パナソニック株式会社 | 画像管理装置、画像管理方法、プログラム、記録媒体及び集積回路 |
| JP5934653B2 (ja) * | 2010-11-29 | 2016-06-15 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 画像分類装置、画像分類方法、プログラム、記録媒体、集積回路、モデル作成装置 |
| JP2012146040A (ja) * | 2011-01-11 | 2012-08-02 | Osaka City Univ | 異常事態の検出システム |
| JP5774425B2 (ja) * | 2011-09-16 | 2015-09-09 | Kddi株式会社 | 画像解析装置および画像評価装置 |
| JP5865078B2 (ja) | 2011-12-28 | 2016-02-17 | キヤノン株式会社 | 画像処理装置および画像処理方法 |
| JP5766620B2 (ja) | 2012-01-10 | 2015-08-19 | 日本電信電話株式会社 | 物体領域検出装置、方法、及びプログラム |
| JP6137916B2 (ja) * | 2013-04-01 | 2017-05-31 | キヤノン株式会社 | 信号処理装置、信号処理方法、及び、信号処理システム |
| JP6495254B2 (ja) * | 2013-06-12 | 2019-04-03 | スリーエム イノベイティブ プロパティズ カンパニー | 視覚的注意モデリングの結果の提示 |
| JP6394005B2 (ja) | 2014-03-10 | 2018-09-26 | 株式会社リコー | 投影画像補正装置、投影する原画像を補正する方法およびプログラム |
| JP6330385B2 (ja) * | 2014-03-13 | 2018-05-30 | オムロン株式会社 | 画像処理装置、画像処理方法およびプログラム |
| KR102096410B1 (ko) * | 2014-05-02 | 2020-04-03 | 삼성전자주식회사 | 의료 영상 장치 및 그 제어 방법 |
| US9918082B2 (en) * | 2014-10-20 | 2018-03-13 | Google Llc | Continuous prediction domain |
| US9918094B2 (en) * | 2014-10-20 | 2018-03-13 | Google Llc | Compressing and representing multi-view video |
| CN107169397B (zh) * | 2016-03-07 | 2022-03-01 | 佳能株式会社 | 特征点检测方法及装置、图像处理系统和监视系统 |
| US10789671B2 (en) * | 2016-12-28 | 2020-09-29 | Ricoh Company, Ltd. | Apparatus, system, and method of controlling display, and recording medium |
| US10638039B2 (en) * | 2016-12-28 | 2020-04-28 | Ricoh Company, Ltd. | Apparatus, system, and method of controlling image capturing, and recording medium |
| JP6859765B2 (ja) * | 2017-03-13 | 2021-04-14 | 株式会社リコー | 画像処理装置、画像処理方法およびプログラム |
-
2016
- 2016-08-04 JP JP2016153492A patent/JP6798183B2/ja active Active
-
2017
- 2017-07-31 US US15/664,480 patent/US10635926B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2018022360A (ja) | 2018-02-08 |
| US20180039856A1 (en) | 2018-02-08 |
| US10635926B2 (en) | 2020-04-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6798183B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
| US11644898B2 (en) | Eye tracking method and system | |
| US11232286B2 (en) | Method and apparatus for generating face rotation image | |
| CN110222787B (zh) | 多尺度目标检测方法、装置、计算机设备及存储介质 | |
| CN110574077B (zh) | 利用虚拟三维深层神经网络的影像分析装置及方法 | |
| KR102629380B1 (ko) | 실제 3차원 객체를 실제 객체의 2-차원 스푸프로부터 구별하기 위한 방법 | |
| EP4404148A1 (en) | Image processing method and apparatus, and computer-readable storage medium | |
| WO2022052782A1 (zh) | 图像的处理方法及相关设备 | |
| CN112446270A (zh) | 行人再识别网络的训练方法、行人再识别方法和装置 | |
| Alshehri et al. | Unmanned aerial vehicle based multi-person detection via deep neural network models | |
| JP6756406B2 (ja) | 画像処理装置、画像処理方法および画像処理プログラム | |
| US20240013357A1 (en) | Recognition system, recognition method, program, learning method, trained model, distillation model and training data set generation method | |
| CN119359537A (zh) | 监控视频的拼接方法、装置、设备及存储介质 | |
| KR20240159462A (ko) | 쿼리 이미지 내의 타겟 객체의 자세를 결정하는 방법 및 그 방법을 수행하는 전자 장치 | |
| CN117455972A (zh) | 基于单目深度估计的无人机地面目标定位方法 | |
| JP6717049B2 (ja) | 画像解析装置、画像解析方法およびプログラム | |
| KR20230065125A (ko) | 기계 학습 모델의 트레이닝 방법 및 전자 장치 | |
| US20240362891A1 (en) | Systems and methods for selecting motion models for aligning scene content captured by different image sensors | |
| JP6675584B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
| CN118076984A (zh) | 用于视线估计的方法和设备 | |
| CN118898664B (zh) | 图像生成方法、装置、存储介质及计算机设备 | |
| CN116977235A (zh) | 图像融合方法、电子设备及存储介质 | |
| US20240362802A1 (en) | Systems and methods for determining motion models for aligning scene content captured by different image sensors | |
| CA3122315C (en) | Eye tracking method and system | |
| Kannadhasan et al. | Performance Analysis of Segmentation Techniques Using Digital Image |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190621 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200807 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200825 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201001 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201020 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201102 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6798183 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |