[go: up one dir, main page]

JP2018180638A - Name identification support device - Google Patents

Name identification support device Download PDF

Info

Publication number
JP2018180638A
JP2018180638A JP2017074678A JP2017074678A JP2018180638A JP 2018180638 A JP2018180638 A JP 2018180638A JP 2017074678 A JP2017074678 A JP 2017074678A JP 2017074678 A JP2017074678 A JP 2017074678A JP 2018180638 A JP2018180638 A JP 2018180638A
Authority
JP
Japan
Prior art keywords
information
category
pair
poi
poi information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017074678A
Other languages
Japanese (ja)
Other versions
JP6945325B2 (en
Inventor
健 榎園
Ken Enokizono
健 榎園
佑介 深澤
Yusuke Fukazawa
佑介 深澤
悠 菊地
Yu Kikuchi
悠 菊地
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2017074678A priority Critical patent/JP6945325B2/en
Publication of JP2018180638A publication Critical patent/JP2018180638A/en
Application granted granted Critical
Publication of JP6945325B2 publication Critical patent/JP6945325B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a name identification supporting device which can more precisely determine the same name with the same place information.SOLUTION: A server 10 according to an embodiment includes: a POI information pair acquisition part 12 for acquiring a pair of POI information indicating the same POI from plural pieces of POI information each including category information indicating the category of a POI; and a category pair acquisition part 13 for acquiring a category pair as a pair of category information showing the same category on the basis of the combination of category information included in each piece of POI information included in the pair acquired by the POI information pair acquisition part 12.SELECTED DRAWING: Figure 1

Description

本発明の一側面は、名寄せ支援装置に関する。   One aspect of the present invention relates to a name identification support device.

従来、例えば互いに異なる複数のデータソース(例えば情報サービス事業者)により提供される場所情報(例えばPOI(Point Of Interest)に関する情報)を利用する際に、これらの場所情報をマージすること(いわゆる名寄せ)が行われている。例えば、特許文献1には、2つの場所情報(施設情報)の各々に関連付けられた座標データの差(すなわち場所間の距離)が閾値の範囲内である場合に、当該2つの場所情報の各々が同一の場所を示すと判定する手法が開示されている。   Conventionally, when using location information (for example, information related to POI (Point Of Interest)) provided by, for example, a plurality of different data sources (for example, information service providers), merging these location information ) Has been done. For example, in Patent Document 1, when the difference between coordinate data associated with each of two pieces of place information (facility information) (that is, the distance between places) falls within a threshold range, each of the two pieces of place information There is disclosed a method of determining that indicates the same place.

特開2010−086399号公報JP, 2010-086399, A

特許文献1に開示された手法によれば、各場所情報に関連付けられた座標データに基づいて場所情報同士の同一性(同一の場所を示すか否か)を判定できるが、より精度良く場所情報のマージ(名寄せ)を行うための仕組みが求められている。   According to the method disclosed in Patent Document 1, the identity (whether or not to indicate the same place) of the place information can be determined based on the coordinate data associated with each place information, but the place information is more accurate. There is a need for a mechanism to merge (merge).

そこで、本発明の一側面は、場所情報同士の同一性をより精度良く判定するための名寄せ支援装置を提供することを目的とする。   Therefore, one aspect of the present invention is to provide a name identification support device for more accurately determining the identity of location information.

本発明の一側面に係る名寄せ支援装置は、場所のカテゴリを示すカテゴリ情報をそれぞれ含む複数の場所情報のうちから、同一の場所を示す場所情報のペアを取得する場所情報ペア取得部と、場所情報ペア取得部により取得されたペアに含まれる場所情報の各々に含まれるカテゴリ情報の組み合わせに基づいて、同一のカテゴリを示すカテゴリ情報のペアであるカテゴリペアを取得するカテゴリペア取得部と、を備える。   A location identification support device according to an aspect of the present invention includes a location information pair acquisition unit that acquires a pair of location information indicating the same location from among a plurality of location information each including category information indicating a category of location; A category pair acquisition unit for acquiring a category pair which is a pair of category information indicating the same category based on a combination of category information included in each of the location information included in the pair acquired by the information pair acquisition unit; Prepare.

本発明の一側面に係る名寄せ支援装置では、複数の場所情報のうちから、同一の場所を示す場所情報のペアが取得される。そして、当該ペアに含まれるカテゴリ情報の組み合わせに基づいて同一のカテゴリを示すカテゴリ情報のペアであるカテゴリペアが取得される。このように場所の同一性とカテゴリの同一性とを結び付けることにより、同一のカテゴリを示すカテゴリペアを精度良く生成できる。このようなカテゴリペアは、場所情報同士の同一性を精度良く判定するために用い得る。したがって、上記名寄せ支援装置によれば、場所情報同士の同一性をより精度良く判定することが可能となる。   In the name identification support device according to one aspect of the present invention, a pair of location information indicating the same location is acquired from among the plurality of location information. Then, based on a combination of category information included in the pair, a category pair which is a pair of category information indicating the same category is acquired. By combining the identity of places and the identities of categories in this manner, category pairs indicating the same category can be generated with high accuracy. Such category pairs can be used to accurately determine the identity of location information. Therefore, according to the name identification support device, it is possible to more accurately determine the identity of location information.

本発明の一側面によれば、場所情報同士の同一性をより精度良く判定するための名寄せ支援装置を提供することができる。   According to one aspect of the present invention, it is possible to provide a name identification support device for more accurately determining the identity of location information.

一実施形態に係る名寄せ支援装置を含むサーバの機能構成を示す図である。It is a figure which shows the function structure of the server containing the name identification assistance apparatus which concerns on one Embodiment. POI情報ペア候補管理テーブルの一例を示す図である。It is a figure which shows an example of a POI information pair candidate management table. POI情報ペア管理テーブルの一例を示す図である。It is a figure which shows an example of a POI information pair management table. カテゴリペア候補管理テーブルの一例を示す図である。It is a figure which shows an example of a category pair candidate management table. 比較対象ペア管理テーブルの一例を示す図である。It is a figure which shows an example of a comparison object pair management table. 比較対象ペア管理テーブルの一例を示す図である。It is a figure which shows an example of a comparison object pair management table. 図1のサーバの動作を示すフローチャートである。It is a flowchart which shows operation | movement of the server of FIG. 図1のサーバのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the server of FIG.

以下、添付図面を参照して、本発明の一実施形態について詳細に説明する。なお、図面の説明において同一又は相当要素には同一符号を付し、重複する説明を省略する。   Hereinafter, an embodiment of the present invention will be described in detail with reference to the attached drawings. In the description of the drawings, the same or corresponding elements will be denoted by the same reference symbols, without redundant description.

図1は、一実施形態に係る名寄せ支援装置を含むサーバ10の機能構成を示す図である。サーバ10は、複数のPOI情報(場所情報)の名寄せを実行する装置である。複数のPOI情報は、例えば、互いに異なる複数のデータソース(例えば情報サービス事業者)により提供されるPOI情報の集合である。   FIG. 1 is a diagram showing a functional configuration of a server 10 including a name identification support device according to an embodiment. The server 10 is an apparatus that executes name identification of a plurality of POI information (place information). The plurality of POI information is, for example, a set of POI information provided by a plurality of different data sources (for example, information service providers).

「POI情報」とは、特定の場所(例えば施設等)を示すPOI(Point Of Interest)に関する情報である。POIの例としては、店舗、レジャー施設、及び観光施設等が挙げられる。POI情報は、POIの名称を示す情報(例えば文字列)、POIに関連付けられる位置座標を示す位置情報(例えば緯度及び経度)、及びPOIのカテゴリ(例えば「飲食店」等の施設のジャンル等)を示すカテゴリ情報(例えば文字列)等を含み得る。   The “POI information” is information on a point of interest (POI) indicating a specific place (for example, a facility or the like). Examples of POI include stores, leisure facilities, and tourist facilities. The POI information is information indicating the name of the POI (for example, a character string), positional information indicating the position coordinates associated with the POI (for example, latitude and longitude), and a category of the POI (for example, genre of facilities such as "eater") May include category information (eg, a character string) indicating.

「POI情報の名寄せ」とは、情報の重複を排除するために、同一のPOIを示すPOI情報同士をマージすることを意味する。例えば、互いに異なる複数のデータソースにより提供されるPOI情報の中には、同一のPOIに関する重複した複数のPOI情報が存在し得る。このようなPOI情報に含まれるPOIの名称、位置情報、カテゴリ情報等の詳細情報は、互いに一致する場合もあれば、互いに異なる場合もあり得る。詳細情報の不一致は、各データソースが保有している情報の違いに起因する。このため、複数のPOI情報を適切に名寄せするためには、詳細情報(名称、位置情報、カテゴリ情報等)が完全一致するペアを互いに重複するPOI情報(同一のPOIを示すPOI情報)として特定するだけでは十分ではない。すなわち、詳細情報の一部が互いに異なるペアについても同一のPOIを示す可能性があるため、このようなペアについてもPOI情報同士の同一性(同一のPOIを示すか否か)を適切に判定することが求められる。   The “name identification of POI information” means that POI information indicating the same POI is merged to eliminate duplication of information. For example, in POI information provided by a plurality of different data sources, there may be duplicate POI information related to the same POI. The detailed information such as the POI name, position information, and category information included in such POI information may or may not match each other. Discrepancies in detailed information are attributable to differences in information held by each data source. For this reason, in order to appropriately combine a plurality of POI information, it is specified as a POI information (POI information indicating the same POI) which mutually overlaps a pair in which detailed information (name, position information, category information, etc.) completely matches It is not enough to do just that. That is, since some of the detailed information may indicate the same POI even for different pairs, it is possible to appropriately determine the identity (whether or not the same POI is indicated) between the POI information for such pairs as well. It is required to

サーバ10は、このようなPOI情報の名寄せを支援するための処理として、同一のカテゴリを示すカテゴリ情報のペアであるカテゴリペアを取得し、当該カテゴリペアを用いて比較対象となる第1POI情報と第2POI情報の同一性の判定(名寄せ判定)を実行する。カテゴリペアの具体例としては、例えばカテゴリ情報「すし店」とカテゴリ情報「寿司」等のように、文字列は異なるが同一のカテゴリ(この場合、寿司を提供する店を示すジャンル)を示すカテゴリ情報のペアが挙げられる。なお、文字列が同一のカテゴリ情報は当然に同一のカテゴリを示すため、本実施形態は、文字列が互いに異なるカテゴリ情報同士のペアが同一のカテゴリを示すか否かを判定することを主に想定している。   The server 10 acquires category pairs, which are pairs of category information indicating the same category, as processing for supporting such name identification of POI information, and uses the category pairs to compare with the first POI information to be compared. The determination (identification determination) of the identity of the second POI information is executed. As a specific example of the category pair, a category indicating a same category (in this case, a category indicating a restaurant providing a sushi) but different character strings, such as category information "sushi store" and category information "sushi" There is a pair of information. Note that since category information having the same character string naturally indicates the same category, this embodiment mainly determines whether pairs of category information having different character strings indicate the same category. It is assumed.

図1を参照して、サーバ10の各機能要素について説明する。同図に示されるように、サーバ10は、記憶部11と、POI情報ペア取得部12(場所情報ペア取得部)と、カテゴリペア取得部13と、比較対象取得部14と、判定部15と、を備える。POI情報ペア取得部12及びカテゴリペア取得部13は、カテゴリペアを取得するための機能要素である。比較対象取得部14及び判定部15は、比較対象となる第1POI情報と第2POI情報とについて名寄せ判定を実行するための機能要素である。   Each functional element of the server 10 will be described with reference to FIG. As shown in the figure, the server 10 includes a storage unit 11, a POI information pair acquisition unit 12 (place information pair acquisition unit), a category pair acquisition unit 13, a comparison target acquisition unit 14, a determination unit 15, and And. The POI information pair acquisition unit 12 and the category pair acquisition unit 13 are functional elements for acquiring a category pair. The comparison target acquisition unit 14 and the determination unit 15 are functional elements for performing name identification determination on the first POI information and the second POI information to be compared.

記憶部11は、サーバ10の処理に必要となる各種情報を記憶する。本実施形態では、記憶部11は、POI情報ペア候補管理テーブル(図2参照)、POI情報ペア管理テーブル(図3参照)、カテゴリペア候補管理テーブル(図4参照)、及び比較対象ペア管理テーブル(図5及び図6参照)を記憶する。記憶部11に記憶された各種情報は、POI情報ペア取得部12、カテゴリペア取得部13、比較対象取得部14、及び判定部15からアクセス可能となっている。   The storage unit 11 stores various types of information necessary for the processing of the server 10. In the present embodiment, the storage unit 11 includes a POI information pair candidate management table (see FIG. 2), a POI information pair management table (see FIG. 3), a category pair candidate management table (see FIG. 4), and a comparison target pair management table. (See FIGS. 5 and 6) Various information stored in the storage unit 11 can be accessed from the POI information pair acquisition unit 12, the category pair acquisition unit 13, the comparison target acquisition unit 14, and the determination unit 15.

POI情報ペア取得部12は、複数のPOI情報のうちから、同一のPOIを示すPOI情報のペアを取得する。POI情報ペア取得部12は、例えば、比較対象となる2つのPOI情報(POI情報ペア候補)を入力として受け付け、予め定められた判定基準に基づいて当該2つのPOI情報が同一のPOIを示すか否かを判定する。一例として、POI情報ペア候補は、予めPOI情報ペア候補管理テーブルに格納されている。例えば、POI情報ペア候補管理テーブルには、複数のデータソースが提供する複数のPOI情報のうちから任意の2つのPOI情報を抽出することで得られる全ての組み合わせに対応するPOI情報ペア候補が格納されている。   The POI information pair acquisition unit 12 acquires a pair of POI information indicating the same POI from among a plurality of POI information. For example, the POI information pair acquiring unit 12 receives two POI information (POI information pair candidates) to be compared as inputs, and determines whether the two POI information indicate the same POI based on a predetermined determination criterion It is determined whether or not. As an example, the POI information pair candidate is stored in advance in the POI information pair candidate management table. For example, the POI information pair candidate management table stores POI information pair candidates corresponding to all combinations obtained by extracting arbitrary two pieces of POI information from among a plurality of POI information provided by a plurality of data sources. It is done.

図2は、POI情報ペア候補管理テーブルの一例を示す図である。この例では、POI情報ペア候補管理テーブルは、複数のPOI情報ペア候補を格納している。POI情報ペア候補管理テーブルは、1つのPOI情報ペア候補を示す情報(1レコード分の情報)として、比較対象となる2つのPOI情報(POI情報A及びPOI情報B)を格納している。POI情報Aは、POIの名称A、カテゴリ情報A、及び位置情報(緯度A及び経度A)を含んでいる。POI情報Bは、POIの名称B、カテゴリ情報B、及び位置情報(緯度B及び経度B)を含んでいる。図2の「名称A」列又は「名称B」列のアルファベット“A”〜“E”は、それぞれ一以上の文字からなる文字列を表しており、同一のアルファベットは同一の文字列を表している。また、POI情報ペア候補管理テーブルの「dist」列及び「lcsr」列に格納されている値は、後述するPOI情報ペア取得部12の処理により算出される値である。   FIG. 2 is a diagram showing an example of the POI information pair candidate management table. In this example, the POI information pair candidate management table stores a plurality of POI information pair candidates. The POI information pair candidate management table stores two pieces of POI information (POI information A and POI information B) to be compared as information (information for one record) indicating one POI information pair candidate. POI information A includes POI name A, category information A, and position information (latitude A and longitude A). POI information B includes POI name B, category information B, and position information (latitude B and longitude B). The alphabets “A” to “E” in the “Name A” column or “Name B” column in FIG. 2 each represent a character string consisting of one or more characters, and the same alphabet represents the same character string. There is. Further, the values stored in the “dist” column and the “lcsr” column of the POI information pair candidate management table are values calculated by the processing of the POI information pair acquisition unit 12 described later.

本実施形態では、POI情報ペア取得部12は、POI情報ペア候補(POI情報A及びPOI情報B)において、POIの名称及び位置についての予め定められた第1条件(詳しくは後述)が満たされるか否かを判定する。そして、POI情報ペア取得部12は、当該判定の結果に基づいて、POI情報ペア候補が同一のPOIを示すか否かを判定する。まず、POI情報ペア取得部12は、各POI情報ペア候補について、POI情報Aの位置情報(緯度A及び経度A)及びPOI情報Bの位置情報(緯度B及び経度B)に基づいて、POI情報Aが示すPOIとPOI情報Bが示すPOIとの直線距離である距離distを算出する。例えば、POI情報Aの位置座標を(x1,y1)とし、POI情報Bの位置座標を(x2,y2)とすると、POI情報ペア取得部12は、下記(式1)により、距離distを算出することができる。なお、下記(式1)において、rは赤道半径(6378.137km)を表す。
(式1):dist=r×cos-1(sin(y1)×sin(y2)+cos(y1)×cos(y2)×cos(x2-x1))
In the present embodiment, the POI information pair acquiring unit 12 satisfies, in the POI information pair candidate (POI information A and POI information B), a first predetermined condition (details will be described later) for the name and position of the POI. It is determined whether or not. Then, based on the result of the determination, the POI information pair acquisition unit 12 determines whether or not the POI information pair candidate indicates the same POI. First, for each POI information pair candidate, the POI information pair acquiring unit 12 generates POI information based on position information (latitude A and longitude A) of POI information A and position information (latitude B and longitude B) of POI information B. A distance dist, which is a linear distance between the POI indicated by A and the POI indicated by the POI information B, is calculated. For example, assuming that the position coordinate of POI information A is (x1, y1) and the position coordinate of POI information B is (x2, y2), POI information pair acquiring unit 12 calculates distance dist by the following (formula 1) can do. In the following (Formula 1), r represents the equatorial radius (6378.137 km).
(Expression 1): dist = r × cos−1 (sin (y1) × sin (y2) + cos (y1) × cos (y2) × cos (x2-x1))

POI情報ペア取得部12は、このようにして算出した距離distをPOI情報ペア候補管理テーブルの「dist」列に格納する。図2の例では、1行目のPOI情報ペア候補について、距離「7.81(m)」が算出されている。   The POI information pair acquiring unit 12 stores the distance dist thus calculated in the “dist” column of the POI information pair candidate management table. In the example of FIG. 2, the distance “7.81 (m)” is calculated for the POI information pair candidate in the first row.

また、POI情報ペア取得部12は、各POI情報ペア候補について、名称Aと名称Bとの最長共通部分列比lcsrを算出する。まず、POI情報ペア取得部12は、名称Aと名称Bとの最長共通部分列を抽出する。共通部分列とは、2つの文字列において、互いに同じ要素が連続して出現する部分列である。最長共通部分列とは、取り得る共通部分列のうち、最も長い(最も文字数が多い)部分列である。2つの文字列X,Yの最長共通部分列比lcsrは、下記(式2)に示されるように、2つの文字列X,Yの最長共通部分列の長さ(文字数)である最長共通部分列長(LLCS:Length of Longest Common Subsequence)を、2つの文字列X,Yのうち長い方の文字列の文字列長(文字数)で除算した値である。
(式2):lcsr=LLCS(X,Y)/max(L(X),L(Y))
ここで、L(X)は文字列Xの文字列長を表す。max(x,y)はxとyの大きい方の値を表す。
Further, the POI information pair acquisition unit 12 calculates the longest common subsequence ratio lcsr of the name A and the name B for each POI information pair candidate. First, the POI information pair acquisition unit 12 extracts the longest common subsequence of the name A and the name B. The common substring is a substring in which the same elements appear successively in two strings. The longest common subsequence is the longest (highest number of characters) subsequence among the possible common subsequences. The longest common part, which is the length (number of characters) of the longest common substring of two strings X and Y, as shown in the following (Expression 2), the longest common substring ratio lcsr of the two strings X and Y: It is a value obtained by dividing the column length (LLCS: Length of Longest Common Subsequence) by the string length (number of characters) of the longer one of the two strings X and Y.
(Expression 2): lcsr = LLCS (X, Y) / max (L (X), L (Y))
Here, L (X) represents the string length of the string X. max (x, y) represents the larger value of x and y.

具体例として、一方の文字列Xが「寿司XXXモール戸塚店」であり、他方の文字列Yが「XXXモール戸塚店」である場合について考える。この場合、文字列Xと文字列Yとの最長共通部分列は「XXXモール戸塚店」であり、LLCS(X,Y)は9である。また、L(X)は11であり、L(Y)は9であるため、max(L(X),L(Y))は11である。したがって、この例では、lcsrは0.818(=9/11)となる。   As a specific example, consider a case where one character string X is "Sushi XXX mall Totsuka store" and the other character string Y is "XXX mall Totsuka store". In this case, the longest common partial string of the character string X and the character string Y is “XXX mall Totsuka store”, and the LLCS (X, Y) is 9. Further, L (X) is 11, and L (Y) is 9, so max (L (X), L (Y)) is 11. Therefore, in this example, lcsr is 0.818 (= 9/11).

POI情報ペア取得部12は、上記(式2)により、名称Aと名称Bとの最長共通部分列比lcsrを算出し、算出したlcsrをPOI情報ペア候補管理テーブルの「lcsr」列に格納する。図2の例では、1行目のPOI情報ペア候補について、lcsr「0.800」が算出されている。   The POI information pair acquiring unit 12 calculates the longest common subsequence ratio lcsr between the name A and the name B by the above (formula 2), and stores the calculated lcsr in the “lcsr” column of the POI information pair candidate management table . In the example of FIG. 2, lcsr “0.800” is calculated for the POI information pair candidate in the first row.

続いて、POI情報ペア取得部12は、上述のように算出した距離distと最長共通部分列比lcsrとに基づいて、POI情報ペア候補が同一のPOIを示すか否かを判定する。例えば、POI情報Aが示すPOIとPOI情報Bが示すPOIについて、距離distが小さく、且つ、名称が完全に一致する場合(すなわち、lcsr=1)、POI情報A及びPOI情報Bは同一のPOIを示す可能性が高い。そこで、POI情報ペア取得部12は、例えば下記のように予め定められた第1条件(POIの名称についての条件(lcsr=1)及びPOIの位置についての条件(dist≦30))を満たす場合に、POI情報ペア候補が同一のPOIを示すと判定してもよい。
(第1条件)
・lcsr=1
・dist≦30
Subsequently, the POI information pair acquiring unit 12 determines whether the POI information pair candidate indicates the same POI, based on the distance dist and the longest common subsequence ratio lcsr calculated as described above. For example, with respect to the POI indicated by the POI information A and the POI indicated by the POI information B, when the distance dist is small and the names completely match (namely, lcsr = 1), the POI information A and the POI information B have the same POI. Is likely to indicate. Therefore, in the case where the POI information pair acquiring unit 12 satisfies, for example, the first condition (the condition for the POI name (lcsr = 1) and the condition for the POI position (dist ≦ 30) defined in advance as follows: Alternatively, it may be determined that the POI information pair candidates indicate the same POI.
(First condition)
・ Lcsr = 1
・ Dist ≦ 30

ここで、後述するカテゴリペアを精度良く取得するためには、正しいPOI情報ペアを取得(抽出)することが重視される。このため、第1条件は、実際には同一のPOIを示さないPOI情報同士をPOI情報ペアとして誤って抽出してしまうこと(誤抽出)を防止するために、比較的厳しい条件に設定されている。   Here, in order to obtain category pairs to be described later with high accuracy, it is important to obtain (extract) a correct POI information pair. For this reason, the first condition is set to a relatively severe condition in order to prevent that POI information which does not actually indicate the same POI is erroneously extracted as a POI information pair (false extraction). There is.

POI情報ペア取得部12は、第1条件を満たすと判定されたPOI情報ペア候補を、POI情報ペアとして取得(抽出)する。POI情報ペア取得部12は、取得したPOI情報ペアの情報を、POI情報ペア管理テーブルに格納する。図3は、POI情報ペア管理テーブルの一例を示す図である。なお、POI情報ペア管理テーブルに格納されたPOI情報ペアは、例えばオペレータ等に提示されてもよい。この場合、オペレータは、例えばディスプレイ等に提示されたPOI情報ペアを目視チェックし、同一のPOIを示す可能性が低いと判断したPOI情報ペアをPOI情報ペア管理テーブルから削除してもよい。オペレータによる目視チェックを併用することにより、POI情報ペア管理テーブルに格納されたPOI情報ペアの精度向上が期待できる。   The POI information pair acquiring unit 12 acquires (extracts) POI information pair candidates determined to satisfy the first condition as POI information pairs. The POI information pair acquisition unit 12 stores the acquired information of the POI information pair in the POI information pair management table. FIG. 3 is a diagram showing an example of the POI information pair management table. The POI information pair stored in the POI information pair management table may be presented to an operator, for example. In this case, the operator may visually check, for example, the POI information pair presented on the display or the like, and delete the POI information pair determined to be unlikely to indicate the same POI from the POI information pair management table. By using the visual check by the operator in combination, the accuracy improvement of the POI information pair stored in the POI information pair management table can be expected.

カテゴリペア取得部13は、POI情報ペア取得部12により取得されたPOI情報ペアに含まれるPOI情報の各々に含まれるカテゴリ情報の組み合わせに基づいて、カテゴリペアを取得する。本実施形態では、カテゴリペア取得部13は、POI情報ペア取得部12により取得された複数のPOI情報のペアにおける、カテゴリ情報毎の出現回数とカテゴリ情報の組み合わせ毎の出現回数とに基づいてカテゴリペアを取得する。   The category pair acquisition unit 13 acquires a category pair based on a combination of category information included in each of the POI information included in the POI information pair acquired by the POI information pair acquisition unit 12. In the present embodiment, the category pair acquisition unit 13 determines the category based on the number of appearances of each category information and the number of appearances of each combination of category information in the plurality of pairs of POI information acquired by the POI information pair acquisition unit 12. Get a pair.

まず、カテゴリペア取得部13は、POI情報ペア取得部12により取得された複数のPOI情報ペア(図3のPOI情報ペア管理テーブルに格納された各POI情報ペア)を参照することにより、カテゴリペア候補を抽出する。具体的には、カテゴリペア取得部13は、図3のPOI情報ペア管理テーブルの1行目のPOI情報ペアを参照することにより、カテゴリ情報「すし店」とカテゴリ情報「寿司」とのペアをカテゴリペア候補として抽出する。同様に、カテゴリペア取得部13は、POI情報ペア管理テーブルの2行目及び3行目のPOI情報ペアから、カテゴリ情報「商業施設」とカテゴリ情報「ショッピングモール」とのペアをカテゴリペア候補として抽出する。カテゴリペア取得部13は、このようにして抽出したカテゴリペア候補の情報をカテゴリペア候補管理テーブルに格納する。   First, the category pair acquisition unit 13 refers to the plurality of POI information pairs acquired by the POI information pair acquisition unit 12 (each POI information pair stored in the POI information pair management table of FIG. 3) to make a category pair. Extract candidates. Specifically, the category pair acquisition unit 13 refers to the POI information pair in the first line of the POI information pair management table of FIG. 3 to pair the category information “sushi store” with the category information “sushi”. Extract as a category pair candidate. Similarly, the category pair acquisition unit 13 sets a pair of category information “commercial facility” and category information “shopping mall” as a category pair candidate from the POI information pair in the second and third rows of the POI information pair management table. Extract. The category pair acquisition unit 13 stores the information on the category pair candidates thus extracted in the category pair candidate management table.

図4は、カテゴリペア候補管理テーブルの一例を示す図である。カテゴリペア候補管理テーブルは、一方のカテゴリ情報Xと、他方のカテゴリ情報Yとを格納する。また、カテゴリペア候補管理テーブルには、カテゴリペア候補毎に、後述するカテゴリペア取得部13の処理により算出されるカテゴリ情報X出現回数、カテゴリ情報Y出現回数、同時出現回数、及びDice係数も格納される。   FIG. 4 is a diagram showing an example of a category pair candidate management table. The category pair candidate management table stores one category information X and the other category information Y. The category pair candidate management table also stores, for each category pair candidate, the number of appearances of category information X, the number of appearances of category information Y, the number of simultaneous appearances, and the Dice coefficient calculated by processing of the category pair acquisition unit 13 described later. Be done.

カテゴリペア取得部13は、POI情報ペア管理テーブルに格納された各POI情報ペアを参照することにより、カテゴリ情報毎の出現回数をカウントし、カウントした値をカテゴリペア候補管理テーブルの「カテゴリ情報X出現回数」列及び「カテゴリ情報Y出現回数」列に格納する。また、カテゴリペア取得部13は、カテゴリ情報の組み合わせ毎の出現回数をカウントし、カウントした値をカテゴリペア候補管理テーブルの「同時出現回数」列に格納する。例えば、図4のカテゴリ候補管理テーブルの1行目のカテゴリペア候補の同時出現回数「280」は、カテゴリ情報「すし店」とカテゴリ情報「寿司」との組み合わせを有するPOI情報ペアの個数を表す。   The category pair acquisition unit 13 counts the number of appearances for each category information by referring to each POI information pair stored in the POI information pair management table, and counts the counted value as “category information X in the category pair candidate management table. It is stored in the appearance frequency column and the category information Y appearance frequency column. In addition, the category pair acquisition unit 13 counts the number of appearances for each combination of category information, and stores the counted value in the “number of simultaneous appearances” column of the category pair candidate management table. For example, the simultaneous appearance frequency "280" of category pair candidates in the first line of the category candidate management table in FIG. 4 indicates the number of POI information pairs having a combination of category information "sushi store" and category information "sushi". .

続いて、カテゴリペア取得部13は、各カテゴリペア候補について、一方のカテゴリ情報Xの出現回数(カテゴリ情報X出現回数)と他方のカテゴリ情報Yの出現回数(カテゴリ情報Y出現回数)と同時出現回数とに基づいて、下記(式3)によりDice係数を算出する。ここで、|X|はカテゴリ情報X出現回数、|Y|はカテゴリ情報Y出現回数、|X∩Y|は同時出現回数を表す。
(式3):Dice係数=2×|X∩Y|/(|X|+|Y|)
Subsequently, for each category pair candidate, the category pair acquisition unit 13 simultaneously appears the number of appearances of one category information X (number of appearances of category information X) and the number of appearances of the other category information Y (number of appearances of category information Y). Based on the number of times, the Dice coefficient is calculated by the following (Equation 3). Here, | X | represents the number of appearances of category information X, | Y | represents the number of appearances of category information Y, and | X∩Y | represents the number of simultaneous appearances.
(Equation 3): Dice coefficient = 2 × | X∩Y | / (| X | + | Y |)

上記(式3)により算出されるDice係数は、一方のカテゴリ情報と他方のカテゴリ情報の類似度を示す。具体的には、カテゴリ情報同士の類似度が大きい程、Dice係数は大きくなると考えられる。すなわち、Dice係数が大きい程、2つのカテゴリ情報が同一のカテゴリを示す可能性が高いという関係が成り立つ。そこで、カテゴリペア取得部13は、このようなDice係数の性質を利用して、Dice係数と予め定められた閾値との比較に基づいてカテゴリペアを取得してもよい。例えば、カテゴリペア取得部13は、Dice係数が予め定められた閾値(例えば0.7等)以上である場合に、一方のカテゴリ情報と他方のカテゴリ情報とのペアをカテゴリペアとして取得してもよい。   The Dice coefficient calculated by the above (Equation 3) indicates the similarity between one category information and the other category information. Specifically, the Dice coefficient is considered to be larger as the degree of similarity between category information is larger. That is, as the Dice coefficient is larger, there is a relation that two category information is more likely to indicate the same category. Therefore, the category pair acquisition unit 13 may acquire the category pair based on the comparison between the Dice coefficient and a predetermined threshold value, using the property of such Dice coefficient. For example, even if the category pair acquisition unit 13 acquires a pair of one category information and the other category information as a category pair when the Dice coefficient is equal to or greater than a predetermined threshold (for example, 0.7 or the like). Good.

この場合、図4の例では、Dice係数が「0.903」であるカテゴリ情報「すし店」とカテゴリ情報「寿司」とのペア、及びDice係数が「0.778」であるカテゴリ情報「商業施設」とカテゴリ情報「ショッピングモール」とのペアがそれぞれ、カテゴリペアとして取得される。一方、Dice係数が「0.050」であるカテゴリ情報「居酒屋」とカテゴリ情報「飲食店」とのペアは、カテゴリペアとして取得されない。   In this case, in the example of FIG. 4, a pair of the category information "sushi store" having the Dice coefficient "0.903" and the category information "sushi" and the category information "commercial" having the Dice coefficient "0.778" A pair of “facility” and category information “shopping mall” is acquired as a category pair. On the other hand, a pair of the category information “Japanese-style pub” having the Dice coefficient of “0.050” and the category information “restaurant” is not acquired as a category pair.

カテゴリペア取得部13は、Dice係数が閾値未満であるカテゴリペア候補の情報をカテゴリペア候補管理テーブルから削除することで、カテゴリペアだけを格納するカテゴリペア管理テーブル(不図示)を生成してもよい。ただし、カテゴリペア取得部13は、図4に示すように、各カテゴリペア候補のDice係数をカテゴリペア候補管理テーブルの「Dice係数」列に格納した時点で処理を終了してもよい。この場合にも、カテゴリペア候補管理テーブルの「Dice係数」列を参照することにより、カテゴリペア(すなわちDice係数が閾値以上のペア)を特定可能な状態となる。すなわち、実質的にカテゴリペア取得部13によってカテゴリペアが取得されることになる。   The category pair acquisition unit 13 generates a category pair management table (not shown) that stores only category pairs by deleting from the category pair candidate management table information of category pair candidates whose Dice coefficient is less than the threshold value. Good. However, as illustrated in FIG. 4, the category pair acquisition unit 13 may end the process when the Dice coefficient of each category pair candidate is stored in the “Dice coefficient” column of the category pair candidate management table. Also in this case, by referring to the “Dice coefficient” column of the category pair candidate management table, it becomes possible to specify a category pair (that is, a pair whose Dice coefficient is equal to or more than the threshold). That is, the category pair acquisition unit 13 substantially acquires the category pair.

なお、カテゴリペア取得部13は、上述したDice係数を用いた判定処理を省略してもよい。この場合、カテゴリペア取得部13は、POI情報ペアに含まれる各POI情報のカテゴリ情報同士を、直ちにカテゴリペアとして取得してもよい。ただし、上述したDice係数を用いた判定処理を行うことにより、カテゴリペアをより精度良く抽出することが期待できる。   The category pair acquisition unit 13 may omit the above-described determination process using the Dice coefficient. In this case, the category pair acquisition unit 13 may immediately acquire category information of each piece of POI information included in the POI information pair as a category pair. However, by performing the above-described determination process using the Dice coefficient, it can be expected to extract category pairs with higher accuracy.

また、上記例では、カテゴリペア取得部13は一方のカテゴリ情報と他方のカテゴリ情報との類似度を表す指標としてDice係数を用いたが、カテゴリペア取得部13はDice係数以外の指標を用いてもよい。例えば、カテゴリペア取得部13は、下記(式4)及び(式5)で算出されるJaccard係数及びSimpson係数等をDice係数の代わりに用いてもよい。ここで、|X∪Y|は、カテゴリペア候補管理テーブルに格納されたカテゴリペア候補のうち、カテゴリ情報X及びカテゴリ情報Yの少なくとも一方を含むカテゴリペア候補の数を表す。min(x,y)はxとyの小さい方の値を表す。
(式4):Jaccard係数=|X∩Y|/|X∪Y|
(式5):Simpson係数=|X∩Y|/min(|X|,|Y|)
In the above example, the category pair acquisition unit 13 uses the Dice coefficient as an index indicating the similarity between one category information and the other category information, but the category pair acquisition unit 13 uses an index other than the Dice coefficient. It is also good. For example, the category pair acquisition unit 13 may use the Jaccard coefficient, the Simpson coefficient, and the like calculated by the following (Expression 4) and (Expression 5) instead of the Dice coefficient. Here, | X∪Y | represents the number of category pair candidates including at least one of the category information X and the category information Y among the category pair candidates stored in the category pair candidate management table. min (x, y) represents the smaller value of x and y.
(Equation 4): Jaccard coefficient = | X∩Y | / | X∪Y |
(Equation 5): Simpson coefficient = | X∩Y | / min (| X |, | Y |)

上述したPOI情報ペア取得部12及びカテゴリペア取得部13の処理により、同一のカテゴリを示すカテゴリペアが取得(抽出)される。   By the processing of the POI information pair acquiring unit 12 and the category pair acquiring unit 13 described above, category pairs indicating the same category are acquired (extracted).

比較対象取得部14は、比較対象となる第1POI情報(第1場所情報)と第2POI情報(第2場所情報)とを取得する。第1POI情報及び第2POI情報は、例えばオペレータ等によって入力される。   The comparison target acquisition unit 14 acquires first POI information (first location information) and second POI information (second location information) to be compared. The first POI information and the second POI information are input by an operator, for example.

また、上述した通り、POI情報ペア取得部12によって利用される第1条件は、比較的厳しい条件に設定されている。このため、実際には同一のPOIを示すPOI情報ペア候補が、POI情報ペア取得部12によってPOI情報ペアとして抽出されない可能性がある。そこで、比較対象取得部14は、POI情報ペア候補管理テーブルに含まれるPOI情報ペア候補のうち、POI情報ペア取得部12によってPOI情報ペアとして取得されなかったPOI情報ペア候補を、第1POI情報及び第2POI情報として取得してもよい。   Further, as described above, the first condition used by the POI information pair acquisition unit 12 is set to a relatively severe condition. Therefore, there is a possibility that POI information pair candidates indicating the same POI are not actually extracted as POI information pairs by the POI information pair acquisition unit 12. Therefore, the comparison target acquiring unit 14 selects, from among the POI information pair candidates included in the POI information pair candidate management table, the POI information pair candidate not acquired as a POI information pair by the POI information pair acquiring unit 12 as the first POI information and You may acquire as 2nd POI information.

比較対象取得部14は、このようにして取得した第1POI情報(名称A、カテゴリ情報A、緯度A、経度A)及び第2POI情報(名称B、カテゴリ情報B、緯度B、経度B)のペア(以下「比較対象ペア」)の情報を、比較対象ペア管理テーブルに格納する。   The comparison target acquiring unit 14 pairs the first POI information (name A, category information A, latitude A, longitude A) and second POI information (name B, category information B, latitude B, longitude B) thus acquired. Information of (hereinafter, "compared pair") is stored in the compared pair management table.

図5は、比較対象ペア管理テーブルの一例を示す図である。比較対象ペア管理テーブルは、比較対象ペアの情報として、第1POI情報及び第2POI情報と共に、POI情報ペア取得部12により算出された距離(dist)及び最長共通部分列比(lcsr)の情報を格納している。図5の比較対象ペア管理テーブルの1〜3行目の比較対象ペアは、POI情報ペア取得部12によってPOI情報ペアとして取得されなかったPOI情報ペア候補(図2のPOI情報ペア候補管理テーブルの1,2,4行目のPOI情報ペア候補)に相当する。   FIG. 5 is a diagram showing an example of the comparison target pair management table. The comparison target pair management table stores information of the distance (dist) and the longest common subsequence ratio (lcsr) calculated by the POI information pair acquiring unit 12 as information of the comparison target pair, together with the first POI information and the second POI information. doing. The comparison target pairs in the first to third rows of the comparison target pair management table of FIG. 5 are POI information pair candidates that were not acquired as POI information pairs by the POI information pair acquisition unit 12 (POI information pair candidate management table of FIG. This corresponds to the POI information pair candidate in the first, second, and fourth lines.

判定部15は、第1POI情報に含まれるカテゴリ情報Aと、第2POI情報に含まれるカテゴリ情報Bと、カテゴリペア取得部13により取得されたカテゴリペアとに基づいて、第1POI情報と第2POI情報とが同一のPOIを示すか否かを判定する。   The determination unit 15 determines the first POI information and the second POI information based on the category information A included in the first POI information, the category information B included in the second POI information, and the category pair acquired by the category pair acquisition unit 13. Determine whether or not the same POI is indicated.

まず、判定部15は、カテゴリ情報Aとカテゴリ情報Bとのペアが、カテゴリペア取得部13により取得されたカテゴリペアに該当するか否かを判定する。上述したカテゴリペア管理テーブルが生成されている場合には、判定部15は、当該カテゴリペア管理テーブルを参照することにより、カテゴリ情報Aとカテゴリ情報Bとのペアがカテゴリペアに該当するか否かを判定できる。一方、カテゴリペア管理テーブルが生成されておらず、カテゴリペア候補管理テーブルの「Dice係数」列にカテゴリペア取得部13により算出されたDice係数が格納されている場合には、判定部15は、以下のようにしてカテゴリ情報Aとカテゴリ情報Bとのペアがカテゴリペアに該当するか否かを判定できる。すなわち、判定部15は、カテゴリ情報Aとカテゴリ情報Bとのペアがカテゴリペア候補管理テーブルに格納されており、且つ、当該ペアのDice係数が閾値以上である場合に、カテゴリ情報Aとカテゴリ情報Bとのペアがカテゴリペアに該当すると判定できる。なお、カテゴリ情報Aとカテゴリ情報Bとが同一の文字列である場合には、判定部15は、そのことをもって直ちに、カテゴリ情報Aとカテゴリ情報Bとのペアがカテゴリペアに該当すると判定してもよい。   First, the determination unit 15 determines whether the pair of the category information A and the category information B corresponds to the category pair acquired by the category pair acquisition unit 13. When the category pair management table described above is generated, the determination unit 15 refers to the category pair management table to determine whether the pair of the category information A and the category information B corresponds to the category pair. Can be determined. On the other hand, when the category pair management table is not generated and the Dice coefficient calculated by the category pair acquisition unit 13 is stored in the “Dice coefficient” column of the category pair candidate management table, the determination unit 15 Whether or not a pair of category information A and category information B corresponds to a category pair can be determined as follows. That is, if the pair of category information A and category information B is stored in the category pair candidate management table and the Dice coefficient of the pair is equal to or greater than the threshold, determination unit 15 determines category information A and category information. It can be determined that the pair with B corresponds to the category pair. If the category information A and the category information B are the same character string, the determination unit 15 immediately determines that the pair of the category information A and the category information B corresponds to the category pair. It is also good.

判定部15は、カテゴリ情報Aとカテゴリ情報Bとのペアがカテゴリペアに該当すると判定した場合、当該比較対象ペアに対してカテゴリフラグ「1」を付与する。一方、判定部15は、カテゴリフラグ「1」が付与されない比較対象ペアに対して、カテゴリフラグ「0」を付与する。   When determining that the pair of the category information A and the category information B corresponds to a category pair, the determination unit 15 assigns a category flag “1” to the comparison target pair. On the other hand, determination unit 15 assigns category flag “0” to the comparison target pair to which category flag “1” is not assigned.

次に、判定部15は、比較対象ペア(第1POI情報及び第2POI情報)間において、名称が同一ではなく(すなわちlcsr<1)、一方の名称が他方の名称を含んでおり、一方の名称の予め定められた文字位置に予め定められた文字が含まれているか否かを判定する。例えば、判定部15は、一方の名称の最終文字列として、予め定められた文字列「店」が含まれているか否かを判定する。一方の名称の最終文字列に「店」が含まれている場合、一方の名称を有するPOIは、他方の名称を有するPOI(例えば商業施設等)内のテナントである可能性がある。このように、名称同士の比較によって、一方の名称を有するPOIと他方の名称を有するPOIとが特別な関係(上記例では、一方が個々の商店等のテナントであり、他方がテナントを収容するオーナー施設である関係)を有することが推測可能な場合がある。そこで、判定部15は、このような名称の比較に基づいて特別な関係が推測される比較対象ペアが同一のPOIを示すと誤判定されてしまうことを防ぐために、当該比較対象ペアに対して例外フラグ「1」を付与する。一方、判定部15は、例外フラグ「1」が付与されない比較対象ペアに対して、例外フラグ「0」を付与する。なお、上記の判定は一例であり、判定部15は、予め定められた文字列として上述した「店」以外の文字列(例えば「支店」、「支社」等)を含めて、上述同様に判定してもよい。   Next, the determination unit 15 determines that the names are not identical (i.e., lcsr <1) between the comparison target pairs (the first POI information and the second POI information), and one of the names includes the other's name. It is determined whether or not the predetermined character position of includes a predetermined character. For example, the determination unit 15 determines whether or not a predetermined character string “store” is included as the final character string of one of the names. If “store” is included in the final character string of one of the names, the POI having one of the names may be a tenant within the POI having the other name (for example, a commercial facility or the like). As described above, by comparing the names, the POI having one name and the POI having the other name have a special relationship (in the above example, one is a tenant such as an individual store, and the other accommodates a tenant). In some cases, it can be inferred to have a relationship that is an owner facility. Therefore, the determination unit 15 makes it possible to prevent the comparison target pair whose special relationship is inferred based on the comparison of such names from being erroneously determined to indicate the same POI. The exception flag "1" is given. On the other hand, the determination unit 15 assigns the exception flag "0" to the comparison target pair to which the exception flag "1" is not assigned. Note that the above determination is an example, and the determination unit 15 determines in the same manner as described above including a character string other than "store" described above as a predetermined character string (for example, "branch", "branch", etc.) You may

なお、第1POI情報の名称A及び第2POI情報の名称Bの文字数が同一の場合には、判定部15は、名称Aを一方の名称とした場合の判定と、名称Bを一方の名称とした場合の判定との両方を実行してもよい。また、判定部15は、当該判定を行うにあたって、名称A及び名称Bに対する事前処理を行ってもよい。事前処理は、例えば文字列同士の比較を適切に行うために曖昧性を解消する処理であり、文字列内に含まれるスペース表記の削除及び公知のステミング処理等を含み得る。   When the number of characters of the name A of the first POI information and the number B of the name B of the second POI information is the same, the determination unit 15 determines the name A as one name and the name B as one name. Both of the case determination and the determination may be performed. Moreover, the determination part 15 may perform the pre-processing with respect to the name A and the name B, when performing the said determination. The pre-processing is, for example, processing for disambiguating in order to appropriately compare character strings, and may include deletion of space notation included in the character strings, known stemming processing, and the like.

図6は、上述の判定部15の処理によって比較対象ペア管理テーブルに格納された各比較対象ペアに対してカテゴリフラグ及び例外フラグが付与された状態を示す図である。なお、図6では、各POI情報の位置情報(緯度及び経度)の図示を省略している。   FIG. 6 is a diagram showing a state in which a category flag and an exception flag are added to each comparison target pair stored in the comparison target pair management table by the process of the determination unit 15 described above. In FIG. 6, illustration of position information (latitude and longitude) of each POI information is omitted.

判定部15は、比較対象ペアについてのPOI間の距離(dist)、最長共通部分列比(lcsr)、カテゴリフラグ、及び例外フラグに基づいて、当該比較対象ペアが同一のPOIを示すか否かを判定する。判定部15は、予め定められたルールに基づいて比較対象ペアが同一のPOIを示すか否かを判定してもよい。例えば、判定部15は、以下の第2条件(POIの名称についての条件(lcsr≧0.8)及びPOIの位置についての条件(dist≦100))及びフラグ条件を満たす比較対象ペアを、POI情報ペアであると判定してもよい。
(第2条件)
・lcsr≧0.8
・dist≦100
(フラグ条件)
・カテゴリフラグ=1
・例外フラグ=0
The determination unit 15 determines whether or not the comparison target pair indicates the same POI, based on the distance (dist) between POIs of the comparison target pair, the longest common partial sequence ratio (lcsr), the category flag, and the exception flag. Determine The determination unit 15 may determine whether the comparison target pair indicates the same POI based on a predetermined rule. For example, the determination unit 15 may set a POI to be compared using the second condition (condition for POI name (lcsr ≧ 0.8) and condition for POI position (dist ≦ 100)) and the flag condition. It may be determined that it is an information pair.
(Second condition)
・ Lcsr ≧ 0.8
・ Dist ≦ 100
(Flag condition)
-Category flag = 1
・ Exception flag = 0

ここで、第2条件は、POI情報ペア取得部12の判定に利用される上記第1条件よりも緩和された条件である。このように、判定部15は、POIの名称及び位置についての判定条件(第2条件)をPOI情報ペア取得部12が利用する判定条件(第1条件)よりも緩和することで、POI情報ペアの抽出漏れの発生を抑制し得る。一方、判定部15は、上述したフラグ条件も併用して判定を行うことにより、POIの名称及び位置についての判定条件の緩和に起因するPOI情報ペアの誤抽出の発生を抑制し得る。このようにカテゴリの同一性に基づく判定を行うことにより、POI情報ペアの誤抽出を抑制しつつ抽出漏れも抑制することができ、POI情報ペアを適切に抽出できる。   Here, the second condition is a condition relaxed than the first condition used for the determination of the POI information pair acquisition unit 12. As described above, the determination unit 15 relaxes the determination condition (second condition) on the POI name and position as compared with the determination condition (first condition) used by the POI information pair acquisition unit 12 to obtain the POI information pair. Occurrence of the extraction leakage of On the other hand, the determination unit 15 can suppress the occurrence of the erroneous extraction of the POI information pair caused by the relaxation of the determination condition on the name and position of the POI by performing the determination in combination with the above-described flag condition. By performing the determination based on the identity of the category in this manner, extraction omission can be suppressed while suppressing erroneous extraction of the POI information pair, and the POI information pair can be appropriately extracted.

また、判定部15は、公知の機械学習によって予め生成された判定モデルを用いて上記判定を行ってもよい。このような判定モデルは、例えば、同一のPOIを示すか否かが判明しているPOI情報同士のペアを学習データとして用いた機械学習を実行することにより生成される。判定モデルは、例えば、説明変数として距離(dist)、最長共通部分列比(lcsr)、カテゴリフラグ、及び例外フラグを入力し、目的変数として同一のPOIを示すか否か(例えば同一のPOIを示す場合には「1」、同一のPOIを示さない場合には「0」を取る変数)を出力するモデルである。   Further, the determination unit 15 may perform the above determination using a determination model generated in advance by known machine learning. Such a determination model is generated, for example, by performing machine learning using as a learning data a pair of POI information whose whether or not to indicate the same POI is known. The judgment model inputs, for example, distance (dist), longest common subsequence ratio (lcsr), category flag, and exception flag as explanatory variables, and whether or not the same POI is indicated as an objective variable (for example, the same POI) This is a model that outputs "1" when shown, and a variable that takes "0" when not showing the same POI.

次に、図7に示されるフローチャートを参照して、サーバ10の動作を説明する。ステップS1及びS2の処理は、カテゴリペアを取得するための処理である。ステップS3及びS4の処理は、ステップS2で取得されたカテゴリペアを利用して比較対象となる第1POI情報と第2POI情報との名寄せ判定を実行するための処理である。   Next, the operation of the server 10 will be described with reference to the flowchart shown in FIG. The processes of steps S1 and S2 are processes for acquiring category pairs. The processes of steps S3 and S4 are processes for executing name identification determination of the first POI information and the second POI information to be compared using the category pair acquired in step S2.

ステップS1において、POI情報ペア取得部12が、複数のPOI情報のうちから、同一のPOIを示すPOI情報ペアを取得する。本実施形態では、POI情報ペア取得部12は、POIの名称及び位置についての第1条件を用いた判定により、POI情報ペア候補管理テーブル(図2参照)に格納された各POI情報ペア候補について、同一のPOIを示すか否かを判定する。   In step S1, the POI information pair acquisition unit 12 acquires a POI information pair indicating the same POI from among a plurality of POI information. In the present embodiment, the POI information pair acquiring unit 12 determines each POI information pair candidate stored in the POI information pair candidate management table (see FIG. 2) by the determination using the first condition on the POI name and position. It is determined whether or not the same POI is indicated.

ステップS2において、カテゴリペア取得部13が、同一のカテゴリを示すカテゴリ情報のペアであるカテゴリペアを取得する。本実施形態では、カテゴリペア取得部13は、POI情報ペア取得部12により取得されたPOI情報ペアに基づいてカテゴリペア候補を取得する。そして、カテゴリペア取得部13は、各カテゴリペア候補について、一方のカテゴリ情報の出現回数(カテゴリ情報X出現回数)と他方のカテゴリ情報の出現回数(カテゴリ情報Y出現回数)と同時出現回数とに基づいてカテゴリペアを取得する。より具体的には、例えば、カテゴリペア取得部13は、上記(式3)により算出されたDice係数が予め定められた閾値(例えば0.7等)以上である場合に、一方のカテゴリ情報と他方のカテゴリ情報とのペアをカテゴリペアとして取得する。   In step S2, the category pair acquisition unit 13 acquires a category pair which is a pair of category information indicating the same category. In the present embodiment, the category pair acquisition unit 13 acquires category pair candidates based on the POI information pair acquired by the POI information pair acquisition unit 12. Then, for each category pair candidate, the category pair acquisition unit 13 displays the number of appearances of one category information (number of appearances of category information X), the number of appearances of category information of the other (number of appearances of category information Y) and the number of simultaneous appearances. Get category pair based on. More specifically, for example, if the Dice coefficient calculated by the above (Equation 3) is equal to or greater than a predetermined threshold (for example, 0.7 or the like), the category pair acquisition unit 13 The pair with the other category information is acquired as a category pair.

ステップS3において、比較対象取得部14が、比較対象となる第1POI情報と第2POI情報とを取得する。例えば、比較対象取得部14は、POI情報ペア候補管理テーブルに含まれるPOI情報ペア候補のうち、POI情報ペア取得部12によってPOI情報ペアとして取得されなかったPOI情報ペア候補を、第1POI情報及び第2POI情報として取得する。   In step S3, the comparison target acquisition unit 14 acquires the first POI information and the second POI information to be compared. For example, among the POI information pair candidates included in the POI information pair candidate management table, the comparison target acquiring unit 14 selects the POI information pair candidate not acquired as a POI information pair by the POI information pair acquiring unit 12 as the first POI information and Acquire as second POI information.

ステップS4において、判定部15が、第1POI情報に含まれるカテゴリ情報と、第2POI情報に含まれるカテゴリ情報と、カテゴリペア取得部13により取得されたカテゴリペアとに基づいて、第1POI情報と第2POI情報とが同一のPOIを示すか否かを判定する。例えば、判定部15は、第1POI情報及び第2POI情報のペア(比較対象ペア)が上述した第2条件及びフラグ条件を満たす場合に、第1POI情報と第2POI情報とが同一のPOIを示すと判定する。   In step S4, based on the category information included in the first POI information, the category information included in the second POI information, and the category pair acquired by the category pair acquisition unit 13, the determination unit 15 determines the first POI information and the first POI information. 2) It is determined whether or not the POI information indicates the same POI. For example, when the pair of the first POI information and the second POI information (the comparison target pair) satisfies the above-described second condition and flag condition, the determining unit 15 indicates that the first POI information and the second POI information indicate the same POI. judge.

以上述べたサーバ10では、複数のPOI情報のうちから、同一のPOIを示すPOI情報ペアが取得される。そして、当該POI情報ペアに含まれるカテゴリ情報の組み合わせに基づいて同一のカテゴリを示すカテゴリ情報のペアであるカテゴリペアが取得される。このようにPOIの同一性とカテゴリの同一性とを結び付けることにより、同一のカテゴリを示すカテゴリペアを精度良く生成できる。このようなカテゴリペアは、POI情報同士の同一性を精度良く判定するために用い得る。本実施形態では、カテゴリペアは、上述したカテゴリフラグに基づく判定に利用され得る。したがって、サーバ10によれば、POI情報同士の同一性をより精度良く判定することが可能となる。   In the server 10 described above, the POI information pair indicating the same POI is acquired from the plurality of POI information. And based on the combination of the category information contained in the said POI information pair, the category pair which is a pair of the category information which shows the same category is acquired. By linking the identity of POI and the identity of categories in this manner, category pairs indicating the same category can be generated with high accuracy. Such category pairs can be used to accurately determine the identity of POI information. In the present embodiment, category pairs may be used for determination based on the category flag described above. Therefore, according to the server 10, it is possible to more accurately determine the identity of the POI information.

また、カテゴリペア取得部13は、POI情報ペア取得部12により取得されたPOI情報ペアにおける、カテゴリ情報毎の出現回数とカテゴリ情報の組み合わせ毎の出現回数とに基づいて、カテゴリペアを取得する。本実施形態では一例として、カテゴリペア取得部13は、上記(式3)により算出されるDice係数と閾値との比較に基づいて、カテゴリペアを取得(抽出)する。この構成により、カテゴリペアをより精度良く抽出できる。   Further, the category pair acquisition unit 13 acquires a category pair based on the appearance frequency for each category information and the appearance frequency for each combination of category information in the POI information pair acquired by the POI information pair acquisition unit 12. In the present embodiment, as an example, the category pair acquisition unit 13 acquires (extracts) a category pair based on the comparison between the Dice coefficient calculated by the above (Equation 3) and the threshold. With this configuration, category pairs can be extracted more accurately.

また、サーバ10は、比較対象となる第1POI情報と第2POI情報とを取得する比較対象取得部14と、第1POI情報に含まれるカテゴリ情報と、第2POI情報に含まれるカテゴリ情報と、カテゴリペア取得部13により取得されたカテゴリペアとに基づいて、第1POI情報と第2POI情報とが同一のPOIを示すか否かを判定する判定部15と、を備える。このような構成によれば、カテゴリペア取得部13により取得されたカテゴリペアに基づいて第1POI情報と第2POI情報とのカテゴリの同一性を判定し、その判定結果に基づいて、POI情報同士の同一性を適切に判定できる。   In addition, the server 10 acquires the first POI information and the second POI information to be compared, the comparison target acquiring unit 14, the category information included in the first POI information, the category information included in the second POI information, and the category pair And a determination unit that determines whether the first POI information and the second POI information indicate the same POI based on the category pair acquired by the acquisition unit. According to such a configuration, the identity of the category of the first POI information and the category of the second POI information is determined based on the category pair acquired by the category pair acquisition unit 13, and the POI information is determined on the basis of the determination result. The identity can be determined appropriately.

具体的には、本実施形態では、比較対象となるPOI情報のペアのカテゴリ情報の組み合わせが、例えば「すし店」と「寿司」のようにカテゴリペアに合致する場合には、当該POI情報のペアにカテゴリフラグ「1」が設定される。一方、POI情報のペアのカテゴリ情報の組み合わせが、例えば「すし店」と「ショッピングモール」のようにカテゴリペアに合致しない場合には、当該POI情報のペアにカテゴリフラグ「0」が設定される。その後、上述したように、カテゴリフラグにも基づいてPOI情報同士の同一性が判定される。このように、カテゴリの同一性に基づいて判定することにより、POI情報同士の同一性を精度良く判定することが可能となる。   Specifically, in the present embodiment, when the combination of the category information of the pair of POI information to be compared matches the category pair, for example, “sushi store” and “sushi”, the POI information The category flag "1" is set to the pair. On the other hand, when the combination of the category information of the pair of POI information does not match the category pair as in, for example, “sushi store” and “shopping mall”, the category flag “0” is set to the pair of POI information. . Thereafter, as described above, the identity of the POI information is determined based on the category flag as well. As described above, the determination based on the identity of the categories makes it possible to accurately determine the identity of the POI information.

また、POI情報ペア取得部12は、複数のPOI情報間において、名称及び位置についての予め定められた第1条件が満たされるか否かを判定し、当該判定の結果に基づいてPOI情報ペアを取得する。判定部15は、第1POI情報と第2POI情報との間において、名称及び位置についての予め定められた第2条件が満たされるか否かを判定し、当該判定の結果にも基づいて第1POI情報と第2POI情報とが同一のPOIを示すか否かを判定する。ここで、第2条件は、第1条件よりも緩和された条件である。この構成により、上述したように、POI情報ペアの抽出漏れの発生を抑制すると共に、名称及び位置についての判定条件の緩和に起因するPOI情報ペアの誤抽出の発生を抑制できる。   Further, the POI information pair acquiring unit 12 determines whether or not a first predetermined condition regarding the name and position is satisfied among the plurality of POI information, and the POI information pair is determined based on the result of the determination. get. The determination unit 15 determines whether or not a predetermined second condition for the name and position is satisfied between the first POI information and the second POI information, and the first POI information is also based on the result of the determination. It is determined whether the second POI information and the second POI information indicate the same POI. Here, the second condition is a condition relaxed than the first condition. According to this configuration, as described above, it is possible to suppress the occurrence of the extraction omission of the POI information pair and to suppress the occurrence of the false extraction of the POI information pair due to the relaxation of the determination condition for the name and the position.

また、判定部15は、第1POI情報と第2POI情報との間において、名称が同一ではなく、一方の名称が他方の名称を含んでおり、一方の名称の予め定められた文字位置に予め定められた文字が含まれているか否かを判定し、当該判定の結果にも基づいて、第1POI情報と第2POI情報とが同一のPOIを示すか否かを判定する。本実施形態では、判定部15は、上述した例外フラグを設定することにより、このような判定を実行する。この構成により、第1POI情報及び第2POI情報が同一のPOIを示さない特別な関係にあることが推測される場合に、POI情報ペアの誤抽出を適切に防止できる。   In addition, the determination unit 15 does not have the same name between the first POI information and the second POI information, and one name includes the other name, and is determined in advance at a predetermined character position of one name. It is determined whether the designated character is included, and it is determined whether the first POI information and the second POI information indicate the same POI based on the result of the determination. In the present embodiment, the determination unit 15 performs such determination by setting the above-described exception flag. According to this configuration, it is possible to appropriately prevent the erroneous extraction of the POI information pair when it is presumed that the first POI information and the second POI information are in a special relationship that does not indicate the same POI.

以上、本発明の一実施形態について説明したが、本発明は上記実施形態に限定されない。例えば、サーバ10は、比較対象取得部14及び判定部15を備えなくてもよい。この場合、サーバ10により生成されたカテゴリペアが他の装置に出力され、当該他の装置が当該カテゴリペアを利用して、上述した比較対象取得部14及び判定部15の処理を実行してもよい。   As mentioned above, although one embodiment of the present invention was described, the present invention is not limited to the above-mentioned embodiment. For example, the server 10 may not include the comparison target acquisition unit 14 and the determination unit 15. In this case, even if the category pair generated by the server 10 is output to another device, and the other device executes the processing of the comparison target acquisition unit 14 and the determination unit 15 described above using the category pair. Good.

なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線で)接続し、これら複数の装置により実現されてもよい。   The block diagram used for the explanation of the above-mentioned embodiment has shown the block of a functional unit. These functional blocks (components) are realized by any combination of hardware and / or software. Moreover, the implementation means of each functional block is not particularly limited. That is, each functional block may be realized by one physically and / or logically coupled device, or directly and / or indirectly two or more physically and / or logically separated devices. It may be connected (for example, wired and / or wirelessly) and realized by the plurality of devices.

例えば、上記実施形態におけるサーバ10は、上記実施形態のサーバ10の処理を行うコンピュータとして機能してもよい。図8は、本実施形態に係るサーバ10のハードウェア構成の一例を示す図である。上述のサーバ10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、及びバス1007等を含むコンピュータ装置として構成されてもよい。   For example, the server 10 in the above embodiment may function as a computer that performs the processing of the server 10 in the above embodiment. FIG. 8 is a diagram showing an example of the hardware configuration of the server 10 according to the present embodiment. The above-described server 10 may be physically configured as a computer device including a processor 1001, a memory 1002, a storage 1003, a communication device 1004, an input device 1005, an output device 1006, a bus 1007 and the like.

なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニット等に読み替えてもよい。サーバ10のハードウェア構成は、図8に示された各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。   In the following description, the term "device" may be read as a circuit, a device, a unit, or the like. The hardware configuration of the server 10 may be configured to include one or more of the devices illustrated in FIG. 8 or may be configured without including some devices.

サーバ10における各機能は、プロセッサ1001、メモリ1002等のハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。   Each function in the server 10 performs a calculation by causing the processor 1001 to read predetermined software (program) on hardware such as the processor 1001, the memory 1002, etc., communication by the communication device 1004, data in the memory 1002 and the storage 1003 This is realized by controlling the reading and / or writing of

プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタ等を含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。   The processor 1001 operates, for example, an operating system to control the entire computer. The processor 1001 may be configured by a central processing unit (CPU) including an interface with a peripheral device, a control device, an arithmetic device, a register, and the like.

また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、及び/又はデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、サーバ10の判定部15は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよく、図1に示した他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されてもよい。   Also, the processor 1001 reads a program (program code), a software module, and / or data from the storage 1003 and / or the communication device 1004 to the memory 1002, and executes various processing according to these. As a program, a program that causes a computer to execute at least a part of the operations described in the above embodiments is used. For example, the determination unit 15 of the server 10 may be realized by a control program stored in the memory 1002 and operated by the processor 1001, or may be realized similarly for other functional blocks shown in FIG. The various processes described above have been described to be executed by one processor 1001, but may be executed simultaneously or sequentially by two or more processors 1001. The processor 1001 may be implemented by one or more chips. The program may be transmitted from the network via a telecommunication line.

メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)等の少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)等と呼ばれてもよい。メモリ1002は、上記実施形態に係る情報処理方法(図7のフローチャートに示される手順等)を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュール等を保存できる。   The memory 1002 is a computer readable recording medium, and includes, for example, at least one of a ROM (Read Only Memory), an EPROM (Erasable Programmable ROM), an EEPROM (Electrically Erasable Programmable ROM), and a RAM (Random Access Memory). It may be done. The memory 1002 may be called a register, a cache, a main memory (main storage device) or the like. The memory 1002 can store a program (program code), a software module, and the like that can be executed to implement the information processing method (the procedure and the like shown in the flowchart of FIG. 7) according to the above embodiment.

ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)等の光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップ等の少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバ、その他の適切な媒体であってもよい。   The storage 1003 is a computer readable recording medium, and is, for example, an optical disk such as a CD-ROM (Compact Disc ROM), a hard disk drive, a flexible disk, a magneto-optical disk (for example, a compact disk, a digital versatile disk, Blu-ray A (registered trademark) disk, a smart card, a flash memory (for example, a card, a stick, a key drive), a floppy (registered trademark) disk, a magnetic strip, and the like may be used. The storage 1003 may be called an auxiliary storage device. The above-described storage medium may be, for example, a database including the memory 1002 and / or the storage 1003, a server, or any other suitable medium.

通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュール等ともいう。   The communication device 1004 is hardware (transmission / reception device) for performing communication between computers via a wired and / or wireless network, and is also called, for example, a network device, a network controller, a network card, a communication module, or the like.

入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサ等)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプ等)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。   The input device 1005 is an input device (for example, a keyboard, a mouse, a microphone, a switch, a button, a sensor, and the like) that receives external input. The output device 1006 is an output device (for example, a display, a speaker, an LED lamp, etc.) that performs output to the outside. The input device 1005 and the output device 1006 may be integrated (for example, a touch panel).

また、プロセッサ1001及びメモリ1002等の各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。   Also, each device such as the processor 1001 and the memory 1002 is connected by a bus 1007 for communicating information. The bus 1007 may be configured by a single bus or may be configured by different buses among the devices.

また、サーバ10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)等のハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。   The server 10 is configured to include hardware such as a microprocessor, a digital signal processor (DSP), an application specific integrated circuit (ASIC), a programmable logic device (PLD), and a field programmable gate array (FPGA). Some or all of the functional blocks may be realized by the hardware. For example, processor 1001 may be implemented in at least one of these hardware.

以上、本発明について詳細に説明したが、当業者にとっては、本発明が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本発明は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更された態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本発明に対して何ら制限的な意味を有するものではない。   Although the present invention has been described above in detail, it is apparent to those skilled in the art that the present invention is not limited to the embodiments described herein. The present invention can be implemented as a modified and changed embodiment without departing from the spirit and scope of the present invention defined by the description of the claims. Accordingly, the description in the present specification is for the purpose of illustration and does not have any limiting meaning on the present invention.

本明細書で説明した各態様/実施形態の処理手順、フローチャート等は、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。   As long as there is no contradiction, the processing procedure of each aspect / embodiment, flow chart, etc. which were explained to this specification may be replaced. For example, for the methods described herein, elements of the various steps are presented in an exemplary order and are not limited to the particular order presented.

入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理されてもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。   The input / output information may be stored in a specific place (for example, a memory) or may be managed by a management table. Information to be input or output may be overwritten, updated or added. The output information etc. may be deleted. The input information or the like may be transmitted to another device.

判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。   The determination may be performed by a value (0 or 1) represented by one bit, may be performed by a true / false value (Boolean: true or false), or may be compared with a numerical value (for example, a predetermined value). Comparison with the value).

本明細書で説明した各態様/実施形態は単独で用いられてもよいし、組み合わせて用いられてもよいし、実行に伴って切り替えて用いられてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)によって行われてもよい。   Each aspect / embodiment described in the present specification may be used alone, may be used in combination, and may be switched and used along with execution. In addition, notification of predetermined information (for example, notification of "it is X") is not limited to what is explicitly performed, but may be performed implicitly (for example, not notifying of the predetermined information) Good.

ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能等を意味するよう広く解釈されるべきである。   Software may be called software, firmware, middleware, microcode, hardware description language, or any other name, and may be instructions, instruction sets, codes, code segments, program codes, programs, subprograms, software modules. Should be interpreted broadly to mean applications, software applications, software packages, routines, subroutines, objects, executables, threads of execution, procedures, functions, etc.

また、ソフトウェア、命令等は、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)等の有線技術及び/又は赤外線、無線及びマイクロ波等の無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。   Also, software, instructions and the like may be transmitted and received via a transmission medium. For example, software may use a wireline technology such as coaxial cable, fiber optic cable, twisted pair and digital subscriber line (DSL) and / or a website, server or other using wireless technology such as infrared, radio and microwave When transmitted from a remote source, these wired and / or wireless technologies are included within the definition of transmission medium.

本明細書で説明した情報及び信号等は、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップ等は、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。   The information, signals, etc. described herein may be represented using any of a variety of different techniques. For example, data, instructions, commands, information, signals, bits, symbols, chips etc that may be mentioned throughout the above description may be voltage, current, electromagnetic waves, magnetic fields or particles, light fields or photons, or any of these May be represented by a combination of

なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。   The terms described in the present specification and / or the terms necessary for the understanding of the present specification may be replaced with terms having the same or similar meanings.

本明細書で使用する「システム」及び「ネットワーク」という用語は、互換的に使用される。   The terms "system" and "network" as used herein are used interchangeably.

また、本明細書で説明した情報、パラメータ等は、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。   In addition, the information, parameters, and the like described in the present specification may be represented by an absolute value, may be represented by a relative value from a predetermined value, or may be represented by corresponding other information. .

上述したパラメータに使用される名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。   The names used for the parameters described above are in no way limiting. In addition, the formulas etc. that use these parameters may differ from those explicitly disclosed herein.

本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」との両方を意味する。   As used herein, the phrase "based on" does not mean "based only on," unless expressly stated otherwise. In other words, the phrase "based on" means both "based only on" and "based at least on."

本明細書で使用する「第1の」、「第2の」等の呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみがそこで採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。   Any reference to an element using the designation "first," "second," etc. as used herein does not generally limit the quantity or order of those elements. These designations may be used herein as a convenient way of distinguishing between two or more elements. Thus, reference to the first and second elements does not mean that only two elements can be taken there, or that in any way the first element must precede the second element.

「含む(including)」、「含んでいる(including)」、及びそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。   Insofar as "including", "including", and variations thereof are used in the present specification or claims, these terms as well as the term "comprising" are inclusive. Intended to be Further, it is intended that the term "or" as used in the present specification or in the claims is not an exclusive OR.

本明細書において、文脈又は技術的に明らかに1つのみしか存在しない装置であることが示されていなければ、複数の装置をも含むものとする。   In the present specification, a plurality of devices are also included unless a context or technically apparent device is shown as having only one.

本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。   Throughout this disclosure, unless the context clearly indicates otherwise, it is intended to include the plural.

10…サーバ、11…記憶部、12…POI情報ペア取得部、13…カテゴリペア取得部、14…比較対象取得部、15…判定部、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置。   DESCRIPTION OF SYMBOLS 10 ... Server, 11 ... Storage part, 12 ... POI information pair acquisition part, 13 ... Category pair acquisition part, 14 ... Comparison object acquisition part, 15 ... Determination part, 1001 ... Processor, 1002 ... Memory, 1003 ... Storage, 1004 ... Communication device, 1005 ... input device, 1006 ... output device.

Claims (5)

場所のカテゴリを示すカテゴリ情報をそれぞれ含む複数の場所情報のうちから、同一の場所を示す場所情報のペアを取得する場所情報ペア取得部と、
前記場所情報ペア取得部により取得されたペアに含まれる場所情報の各々に含まれるカテゴリ情報の組み合わせに基づいて、同一のカテゴリを示すカテゴリ情報のペアであるカテゴリペアを取得するカテゴリペア取得部と、
を備える名寄せ支援装置。
A location information pair acquisition unit for acquiring a pair of location information indicating the same location from among a plurality of location information each including category information indicating a category of location;
A category pair acquisition unit for acquiring a category pair which is a pair of category information indicating the same category based on a combination of category information included in each of the location information included in the pair acquired by the location information pair acquisition unit; ,
A name identification support device provided with
前記カテゴリペア取得部は、前記場所情報ペア取得部により取得された場所情報のペアにおける、カテゴリ情報毎の出現回数とカテゴリ情報の組み合わせ毎の出現回数とに基づいて、前記カテゴリペアを取得する、
請求項1に記載の名寄せ支援装置。
The category pair acquisition unit acquires the category pair based on the number of appearances for each category information and the number of appearances for each combination of category information in the location information pairs acquired by the location information pair acquisition unit.
The name identification support device according to claim 1.
比較対象となる第1場所情報と第2場所情報とを取得する比較対象取得部と、
前記第1場所情報に含まれるカテゴリ情報と、前記第2場所情報に含まれるカテゴリ情報と、前記カテゴリペア取得部により取得されたカテゴリペアとに基づいて、前記第1場所情報と前記第2場所情報とが同一の場所を示すか否かを判定する判定部と、
を更に備える、
請求項1又は2に記載の名寄せ支援装置。
A comparison target acquisition unit that acquires first place information and second place information to be compared;
The first place information and the second place are based on the category information included in the first place information, the category information included in the second place information, and the category pair acquired by the category pair acquisition unit. A determination unit that determines whether the information indicates the same place;
Further comprising
The name identification support device according to claim 1.
前記場所情報は、場所の名称を示す情報と場所の位置を示す情報とを更に含み、
前記場所情報ペア取得部は、前記複数の場所情報間において、名称及び位置についての予め定められた第1条件が満たされるか否かを判定し、当該判定の結果に基づいて前記場所情報のペアを取得し、
前記判定部は、前記第1場所情報と前記第2場所情報との間において、名称及び位置についての予め定められた第2条件が満たされるか否かを判定し、当該判定の結果にも基づいて前記第1場所情報と前記第2場所情報とが同一の場所を示すか否かを判定し、
前記第2条件は、前記第1条件よりも緩和された条件である、
請求項3に記載の名寄せ支援装置。
The place information further includes information indicating the name of the place and information indicating the position of the place,
The place information pair acquiring unit determines whether a first predetermined condition regarding a name and a position is satisfied among the plurality of place information, and the pair of the place information is based on a result of the determination. Get
The determination unit determines whether or not a second predetermined condition regarding a name and a position is satisfied between the first place information and the second place information, and is also based on the result of the determination. Determining whether the first place information and the second place information indicate the same place,
The second condition is a condition relaxed than the first condition,
The name identification support device according to claim 3.
前記判定部は、前記第1場所情報と前記第2場所情報との間において、名称が同一ではなく、一方の名称が他方の名称を含んでおり、一方の名称の予め定められた文字位置に予め定められた文字が含まれているか否かを判定し、当該判定の結果にも基づいて、前記第1場所情報と前記第2場所情報とが同一の場所を示すか否かを判定する、
請求項3又は4に記載の名寄せ支援装置。
The determination unit does not have the same name between the first place information and the second place information, and one of the names includes the other's name, and the predetermined character position of one of the names is determined. It is determined whether or not a predetermined character is included, and it is determined whether the first place information and the second place information indicate the same place based on the result of the determination.
The name identification support device according to claim 3 or 4.
JP2017074678A 2017-04-04 2017-04-04 Name identification support device Expired - Fee Related JP6945325B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017074678A JP6945325B2 (en) 2017-04-04 2017-04-04 Name identification support device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017074678A JP6945325B2 (en) 2017-04-04 2017-04-04 Name identification support device

Publications (2)

Publication Number Publication Date
JP2018180638A true JP2018180638A (en) 2018-11-15
JP6945325B2 JP6945325B2 (en) 2021-10-06

Family

ID=64275486

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017074678A Expired - Fee Related JP6945325B2 (en) 2017-04-04 2017-04-04 Name identification support device

Country Status (1)

Country Link
JP (1) JP6945325B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221026A (en) * 2020-02-06 2021-08-06 腾讯科技(深圳)有限公司 Point of interest (POI) -based classification method, classification device and storage medium

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193358A (en) * 2005-04-08 2007-08-02 Matsushita Electric Ind Co Ltd Map information updating apparatus and map information updating method
JP2010027031A (en) * 2008-06-18 2010-02-04 Yahoo Japan Corp Apparatus, method, and program for name identification using note data
WO2011013177A1 (en) * 2009-07-31 2011-02-03 三菱電機株式会社 Facility search device
US20150339406A1 (en) * 2012-10-19 2015-11-26 Denso Corporation Device for creating facility display data, facility display system, and program for creating data for facility display

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007193358A (en) * 2005-04-08 2007-08-02 Matsushita Electric Ind Co Ltd Map information updating apparatus and map information updating method
JP2010027031A (en) * 2008-06-18 2010-02-04 Yahoo Japan Corp Apparatus, method, and program for name identification using note data
WO2011013177A1 (en) * 2009-07-31 2011-02-03 三菱電機株式会社 Facility search device
US20150339406A1 (en) * 2012-10-19 2015-11-26 Denso Corporation Device for creating facility display data, facility display system, and program for creating data for facility display

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113221026A (en) * 2020-02-06 2021-08-06 腾讯科技(深圳)有限公司 Point of interest (POI) -based classification method, classification device and storage medium

Also Published As

Publication number Publication date
JP6945325B2 (en) 2021-10-06

Similar Documents

Publication Publication Date Title
CN110516248A (en) Method for correcting error of voice identification result, device, storage medium and electronic equipment
JP6666521B2 (en) Place popularity estimation system
CN113553309A (en) Log template determination method and device, electronic equipment and storage medium
CN108092667B (en) Method and device for compressing time series data and querying time series data
CN110413904A (en) Method, device, server and medium for processing point-of-interest address data
US20210285776A1 (en) Destination extrapolation device
CN112699272A (en) Information output method and device and electronic equipment
CN110688434A (en) Method, device, equipment and medium for processing interest points
JP6945325B2 (en) Name identification support device
US20210123765A1 (en) Pastime preference estimation device and pastime preference estimation method
CN111339776B (en) Resume parsing method and device, electronic equipment and computer-readable storage medium
JP7365334B2 (en) Area popularity calculation device
JP7228573B2 (en) Visited destination estimation device and visited destination estimation method
JP6677601B2 (en) Translation system
JP6811849B2 (en) App usage estimation device and rule creation device
JP7254070B2 (en) Visited destination estimation device and visited destination estimation method
JP6891342B2 (en) POI information updater
US20210248196A1 (en) Interest estimation device
JP6809971B2 (en) Name identification device
CN114519110A (en) Public opinion text display method and device
JP2018055345A (en) Priority determination device
JPWO2019202786A1 (en) Visit destination estimation device and visit destination estimation method
WO2021010290A1 (en) Search device
JP6654539B2 (en) Area determination device
JP7339148B2 (en) Search support device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201127

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210112

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210216

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210405

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210824

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210914

R150 Certificate of patent or registration of utility model

Ref document number: 6945325

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees