JP7318239B2 - 地図画像背景から位置を推定するためのシステム、方法、及びプログラム - Google Patents
地図画像背景から位置を推定するためのシステム、方法、及びプログラム Download PDFInfo
- Publication number
- JP7318239B2 JP7318239B2 JP2019045894A JP2019045894A JP7318239B2 JP 7318239 B2 JP7318239 B2 JP 7318239B2 JP 2019045894 A JP2019045894 A JP 2019045894A JP 2019045894 A JP2019045894 A JP 2019045894A JP 7318239 B2 JP7318239 B2 JP 7318239B2
- Authority
- JP
- Japan
- Prior art keywords
- map
- nearest neighbor
- image
- captured image
- electronic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/10—Terrestrial scenes
- G06V20/13—Satellite images
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
- G06F18/24133—Distances to prototypes
- G06F18/24143—Distances to neighbourhood prototypes, e.g. restricted Coulomb energy networks [RCEN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/09—Supervised learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/10—Recognition assisted with metadata
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Health & Medical Sciences (AREA)
- Remote Sensing (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Astronomy & Astrophysics (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Instructional Devices (AREA)
- Processing Or Creating Images (AREA)
- Image Analysis (AREA)
Description
Claims (20)
- 非電子情報である地図を電子情報である地図と関連付けるコンピュータで実施される方法であって、
取得されたオンラインデータ集合に対して、畳み込みニューラルネットワークのアプリケーションによってスタイル不変及び位置可変の地図表現のデータベースを生成し、
地理的位置のメタデータをもたないと共に前記非電子情報である地図に関連付けられた取込み画像に対して、最近傍ヒューリスティックを適用して前記取込み画像を前記地図表現と比較し、前記取込み画像と前記地図表現との間の一致を生成し、
前記一致に関連付けられた表示動作を実行すること
を含む、方法。 - 前記表示動作が、前記地図表現と前記取込み画像との一致のオーバーレイを提供することを含む、請求項1に記載の方法。
- 前記畳み込みニューラルネットワークが、各々が同一の畳み込み及び重みを有する複数のサブネットワークを有する深層シャム畳み込みニューラルネットワークを含み、前記サブネットワークの各々の最終レイヤの出力が対比損失比較の対象となり、前記重みが前記対比損失比較の結果に基づいて更新され、前記サブネットワークの各々が、入力として前記地図表現の一つをそれぞれ受信し、複数の連続する畳み込みレイヤを順番に含み、前記対比損失比較への出力を提供する1又は複数の全結合レイヤがこれらに続く、請求項1に記載の方法。
- 前記最近傍ヒューリスティックの適用前に、粗い地理情報を統合することをさらに含み、前記粗い地理情報が、都市レベルの最近の地理情報を含む、請求項1に記載の方法。
- 前記最近傍ヒューリスティックが、問合せとしての前記取込み画像について、局所的に最適化された直積量子化によってインデックス付けされた前記データベースに前記最近傍ヒューリスティックを適用して、所定数の最近傍一致を取得し、真の距離に基づいて前記最近傍一致を並べ替え、前記画像に提案GPS座標を提供することを含む、請求項1に記載の方法。
- 前記スタイル不変の地図表現が色選択及びレンダリングスタイルのうちの少なくとも1つを含み、前記位置可変の地図表現がGPS座標に関連付けられる、請求項1に記載の方法。
- 前記非電子情報である地図及び前記電子情報である地図の少なくとも一つが、ビデオからの1又は複数の画像を含む、請求項1に記載の方法。
- コンピュータに非電子情報である地図を電子情報である地図と関連付ける方法を実行させるプログラムであって、前記方法が、
取得されたオンラインデータ集合に対して、畳み込みニューラルネットワークのアプリケーションによってスタイル不変及び位置可変の地図表現のデータベースを生成し、
地理的位置のメタデータをもたないと共に前記非電子情報である地図に関連付けられた取込み画像に対して、最近傍ヒューリスティックを適用して前記取込み画像を前記地図表現と比較し、前記取込み画像と前記地図表現との間の一致を生成し、
前記一致に関連付けられた表示動作を実行すること
を含む、プログラム。 - 前記表示動作が、前記地図表現と前記取込み画像との一致のオーバーレイを提供することを含む、請求項8に記載のプログラム。
- 前記畳み込みニューラルネットワークが、各々が同一の畳み込み及び重みを有する複数のサブネットワークを有する深層シャム畳み込みニューラルネットワークを含み、前記サブネットワークの各々の最終レイヤの出力が対比損失比較の対象となり、前記重みが前記対比損失比較の結果に基づいて更新され、前記サブネットワークの各々が、入力として前記地図表現の一つをそれぞれ受信し、複数の連続する畳み込みレイヤを順番に含み、前記対比損失比較への出力を提供する1又は複数の全結合レイヤがこれらに続く、請求項8に記載のプログラム。
- 前記最近傍ヒューリスティックの適用前に、粗い地理情報を統合することをさらに含み、前記粗い地理情報が、都市レベルの最近の地理情報を含む、請求項8に記載のプログラム。
- 前記最近傍ヒューリスティックが、問合せとしての前記取込み画像について、局所的に最適化された直積量子化によってインデックス付けされた前記データベースに前記最近傍ヒューリスティックを適用して、所定数の最近傍一致を取得し、真の距離に基づいて前記最近傍一致を並べ替え、前記画像に提案GPS座標を提供することを含む、請求項8に記載のプログラム。
- 前記スタイル不変の地図表現が色選択及びレンダリングスタイルのうちの少なくとも1つを含み、前記位置可変の地図表現がGPS座標に関連付けられる、請求項8に記載のプログラム。
- 前記非電子情報である地図及び前記電子情報である地図の少なくとも一つが、ビデオからの1又は複数の画像を含む、請求項8に記載のプログラム。
- プロセッサ及び記憶装置を含み、1又は複数の画像を取り込んでメディアオブジェクトを生成するように構成された画像取込み装置であって、前記プロセッサが、
地理的位置のメタデータをもたないと共に非電子情報である地図に関連付けられた画像を取り込み、
取得されたオンラインデータ集合に対して最近傍ヒューリスティックを適用して、前記取込み画像を、畳み込みニューラルネットワークの適用によって取得されたスタイル不変及び位置可変の地図表現のデータベースと比較し、前記取込み画像と前記地図表現との間の一致を生成し、
前記一致に関連付けられた表示動作を実行するための命令を受信すること
のために前記取込み画像を提供することを実行する、画像取込み装置。 - 前記表示動作が、前記地図表現と前記取込み画像との一致のオーバーレイを提供することを含む、請求項15に記載の画像取込み装置。
- 前記畳み込みニューラルネットワークが、各々が同一の畳み込み及び重みを有する複数のサブネットワークを有する深層シャム畳み込みニューラルネットワークを含み、前記サブネットワークの各々の最終レイヤの出力が対比損失比較の対象となり、前記重みが前記対比損失比較の結果に基づいて更新され、前記サブネットワークの各々が、入力として前記地図表現の一つをそれぞれ受信し、複数の連続する畳み込みレイヤを順番に含み、前記対比損失比較への出力を提供する1又は複数の全結合レイヤがこれらに続き、前記最近傍ヒューリスティックの適用前に、前記取得されたオンラインデータ集合の範囲を狭めるために粗い地理情報が統合され、前記粗い地理情報が、都市レベルの最近の地理情報を含む、請求項15に記載の画像取込み装置。
- 前記最近傍ヒューリスティックが、問合せとしての前記取り込まれた画像について、局所的に最適化された直積量子化によってインデックス付けされた前記データベースに前記最近傍ヒューリスティックを適用して、所定数の最近傍一致を取得し、真の距離に基づいて前記最近傍一致を並べ替え、前記画像に提案GPS座標を提供することを含む、請求項15に記載の画像取込み装置。
- 前記スタイル不変の地図表現が色選択及びレンダリングスタイルのうちの少なくとも1つを含み、前記位置可変の地図表現がGPS座標に関連付けられる、請求項15に記載の画像取込み装置。
- 前記非電子情報である地図及び電子情報である地図の少なくとも一つが、ビデオからの1又は複数の画像を含む、請求項15に記載の画像取込み装置。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US16/111,065 US10810466B2 (en) | 2018-08-23 | 2018-08-23 | Method for location inference from map images |
| US16/111065 | 2018-08-23 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020030795A JP2020030795A (ja) | 2020-02-27 |
| JP7318239B2 true JP7318239B2 (ja) | 2023-08-01 |
Family
ID=69587239
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019045894A Active JP7318239B2 (ja) | 2018-08-23 | 2019-03-13 | 地図画像背景から位置を推定するためのシステム、方法、及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US10810466B2 (ja) |
| JP (1) | JP7318239B2 (ja) |
| CN (1) | CN110858213A (ja) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20200242736A1 (en) * | 2019-01-29 | 2020-07-30 | Nvidia Corporation | Method for few-shot unsupervised image-to-image translation |
| CN110096647B (zh) * | 2019-05-10 | 2023-04-07 | 腾讯科技(深圳)有限公司 | 优化量化模型的方法、装置、电子设备及计算机存储介质 |
| US11408746B2 (en) * | 2019-12-04 | 2022-08-09 | Toyota Connected North America, Inc. | Systems and methods for generating attributes-based recommendations |
| CN111464938B (zh) * | 2020-03-30 | 2021-04-23 | 滴图(北京)科技有限公司 | 定位方法、装置、电子设备和计算机可读存储介质 |
| US12322121B2 (en) * | 2020-04-28 | 2025-06-03 | Gsi Technology Inc. | Satellite imagery |
| US12505595B2 (en) | 2020-05-15 | 2025-12-23 | Nvidia Corporation | Content-aware style encoding using neural networks |
| CN111986553B (zh) * | 2020-08-19 | 2022-07-26 | 炬星科技(深圳)有限公司 | 基于语义标签进行地图关联的方法、设备及存储介质 |
| CN113704276B (zh) * | 2021-03-17 | 2025-10-03 | 腾讯科技(深圳)有限公司 | 地图更新方法、装置、电子设备及计算机可读存储介质 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012195624A (ja) | 2011-03-14 | 2012-10-11 | Nippon Telegr & Teleph Corp <Ntt> | 登録装置、登録方法及び登録プログラム |
| WO2015191010A1 (en) | 2014-06-12 | 2015-12-17 | Sun Vasan | Searching for a map using an input image as a search query |
| JP2017528685A (ja) | 2014-05-30 | 2017-09-28 | オックスフォード ユニバーシティ イノベーション リミテッドOxford University Innovation Limited | 車両位置の推定 |
| JP2018032078A (ja) | 2016-08-22 | 2018-03-01 | Kddi株式会社 | 他の物体の画像領域も考慮して物体を追跡する装置、プログラム及び方法 |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004012307A (ja) * | 2002-06-07 | 2004-01-15 | Fujitsu Ten Ltd | 画像表示装置 |
| CN101046802A (zh) * | 2006-03-31 | 2007-10-03 | 马飞涛 | 一种地理图片搜索方法 |
| US8483715B2 (en) * | 2009-03-26 | 2013-07-09 | Yahoo! Inc. | Computer based location identification using images |
| US8331611B2 (en) * | 2009-07-13 | 2012-12-11 | Raytheon Company | Overlay information over video |
| US8934008B2 (en) * | 2009-12-07 | 2015-01-13 | Cognitech, Inc. | System and method for determining geo-location(s) in images |
| CN101945327A (zh) * | 2010-09-02 | 2011-01-12 | 郑茂 | 基于数字图像识别和检索的无线定位方法、系统 |
| TW201222288A (en) * | 2010-11-22 | 2012-06-01 | Inst Information Industry | Image retrieving system and method and computer program product thereof |
| US9098229B2 (en) * | 2012-05-04 | 2015-08-04 | Aaron Hallquist | Single image pose estimation of image capture devices |
| CN104422439B (zh) * | 2013-08-21 | 2017-12-19 | 希姆通信息技术(上海)有限公司 | 导航方法、装置、服务器、导航系统及其使用方法 |
| CN104850563B (zh) * | 2014-02-18 | 2019-01-11 | 歌乐株式会社 | 目的地图像比较检索装置、目的地图像比较检索系统、以及目的地图像比较检索方法 |
| US10031925B2 (en) * | 2014-10-15 | 2018-07-24 | Thinkcx Technologies, Inc. | Method and system of using image recognition and geolocation signal analysis in the construction of a social media user identity graph |
| KR101859050B1 (ko) * | 2016-06-02 | 2018-05-21 | 네이버 주식회사 | 내용 기반의 지도 이미지 탐색 방법 및 시스템 |
| US10740596B2 (en) * | 2016-11-08 | 2020-08-11 | Nec Corporation | Video security system using a Siamese reconstruction convolutional neural network for pose-invariant face recognition |
| KR20250007028A (ko) * | 2016-12-09 | 2025-01-13 | 톰톰 글로벌 콘텐트 비.브이. | 비디오 기반 위치결정 및 매핑을 위한 방법 및 시스템 |
| EP3346418A1 (en) * | 2016-12-28 | 2018-07-11 | Volvo Car Corporation | Method and system for vehicle localization from camera image |
| CN107131883B (zh) * | 2017-04-26 | 2021-02-12 | 中山大学 | 基于视觉的全自动移动终端室内定位系统 |
| JP7011472B2 (ja) * | 2018-01-15 | 2022-01-26 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
| US10592780B2 (en) * | 2018-03-30 | 2020-03-17 | White Raven Ltd. | Neural network training system |
-
2018
- 2018-08-23 US US16/111,065 patent/US10810466B2/en active Active
-
2019
- 2019-03-06 CN CN201910166459.1A patent/CN110858213A/zh not_active Withdrawn
- 2019-03-13 JP JP2019045894A patent/JP7318239B2/ja active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012195624A (ja) | 2011-03-14 | 2012-10-11 | Nippon Telegr & Teleph Corp <Ntt> | 登録装置、登録方法及び登録プログラム |
| JP2017528685A (ja) | 2014-05-30 | 2017-09-28 | オックスフォード ユニバーシティ イノベーション リミテッドOxford University Innovation Limited | 車両位置の推定 |
| WO2015191010A1 (en) | 2014-06-12 | 2015-12-17 | Sun Vasan | Searching for a map using an input image as a search query |
| JP2018032078A (ja) | 2016-08-22 | 2018-03-01 | Kddi株式会社 | 他の物体の画像領域も考慮して物体を追跡する装置、プログラム及び方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2020030795A (ja) | 2020-02-27 |
| CN110858213A (zh) | 2020-03-03 |
| US10810466B2 (en) | 2020-10-20 |
| US20200065629A1 (en) | 2020-02-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7318239B2 (ja) | 地図画像背景から位置を推定するためのシステム、方法、及びプログラム | |
| US12175500B2 (en) | Systems and methods for augmented reality navigation | |
| CN114816041B (zh) | 用于姿势指导的方法、系统和存储介质 | |
| US11842514B1 (en) | Determining a pose of an object from rgb-d images | |
| RU2688271C2 (ru) | Поиск изображений на естественном языке | |
| US9542778B1 (en) | Systems and methods related to an interactive representative reality | |
| US10606824B1 (en) | Update service in a distributed environment | |
| US10089762B2 (en) | Methods for navigating through a set of images | |
| Anagnostopoulos et al. | Gaze-Informed location-based services | |
| CN113939813A (zh) | 生成和应用针对图像的对象级关系索引 | |
| Ye et al. | Cross-view image geo-localization with Panorama-BEV Co-Retrieval Network | |
| CN110263746A (zh) | 基于姿势的视觉搜索 | |
| US20190279011A1 (en) | Data anonymization using neural networks | |
| Bamigbade et al. | Computer vision for multimedia geolocation in human trafficking investigation: A systematic literature review | |
| CN108241726A (zh) | 移动物件的虚拟信息远距管理方法与应用系统 | |
| Vasudevan et al. | Image-based recommendation engine using VGG model | |
| Pedersen et al. | Geolocating traffic signs using crowd-sourced imagery | |
| Khan et al. | A review of benchmark datasets and training loss functions in neural depth estimation | |
| Saoud et al. | Visual geo-localization from images | |
| Porzi et al. | An automatic image-to-DEM alignment approach for annotating mountains pictures on a smartphone | |
| Li et al. | Looking into the world on Google Maps with view direction estimated photos | |
| CN120281967B (zh) | 博主直播视频ar眼镜景文标注方法及标注系统 | |
| Milde et al. | Gesture-based machine learning for enhanced autonomous driving: A novel dataset and system integration approach | |
| Li et al. | Where the photos were taken: location prediction by learning from flickr photos | |
| Chang et al. | Extracting driving behavior: Global metric localization from dashcam videos in the wild |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220228 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230111 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230413 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230620 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230703 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7318239 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |