CN103198135A - 一种地理区域格网划分的微博签到数据在线获取方法 - Google Patents
一种地理区域格网划分的微博签到数据在线获取方法 Download PDFInfo
- Publication number
- CN103198135A CN103198135A CN2013101268291A CN201310126829A CN103198135A CN 103198135 A CN103198135 A CN 103198135A CN 2013101268291 A CN2013101268291 A CN 2013101268291A CN 201310126829 A CN201310126829 A CN 201310126829A CN 103198135 A CN103198135 A CN 103198135A
- Authority
- CN
- China
- Prior art keywords
- registering
- poi
- microblogging
- user
- geographic area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 238000013507 mapping Methods 0.000 abstract description 3
- 230000018109 developmental process Effects 0.000 description 5
- 230000006855 networking Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 239000011800 void material Substances 0.000 description 3
- 244000097202 Rathbunia alamosensis Species 0.000 description 2
- 235000009776 Rathbunia alamosensis Nutrition 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及测绘技术领域,尤其涉及一种地理区域格网划分的微博签到数据在线获取方法。包括以下步骤:步骤1:配置数据库;步骤2:对地理区域进行格网划分;步骤3:获取所述的格网区域内的POI点的基本信息;步骤4:获取所述的每个POI点的位置动态信息;步骤5:获取用户的签到历史轨迹。本发明实现了微博签到数据的在线、快速、高效、批量下载,满足了社会及LBS等行业领域对大量签到数据的需求;本发明使用微博平台免费提供的接口作为数据下载的媒介,方法效率高,成本低,易于实现。
Description
技术领域
本发明涉及测绘技术领域,尤其涉及一种地理区域格网划分的微博签到数据在线获取方法。
背景技术
随着科技的快速发展,移动社交网络由于其无缝地将移动计算和社会计算结合起来, 极大地增强了用户的真实性、地域性和交互的实时性,使得移动社交网络成为了当下最有影响力的社交平台,其中便以微博的用户群体最为庞大。
微博,即微博客的简称,是一个基于用户关系信息分享、传播以及获取平台,用户可以通过WEB、WAP等各种客户端组建个人社区,以140字左右的文字更新信息,并实现即时分享。微博作为当下最流行的社会化网络服务媒体,微博设计的出发点是满足日益增长的用户社交的基本需求,他是基于交往而产生价值的网络产品,其设计与运营的核心是用户关系,即人与人的关系。
同时随着Web2.0技术的日益成熟和普及,LBS(Location Based Service,基于位置服务)成为了当下发展最为迅猛的科技应用之一。基于位置的服务是当今发展比较成熟、普及程度较高的地理位置服务业务。
签到(Check In)是LBS所提供的服务之一,其与微博的结合使得“签到”成为了人们标记自我,记录生活轨迹的一种方式。与此同时微博位置签到数据应运而生,其是指通过微博签到操作所获取并存储管理的地理位置数据,其内容包括了名称、属性以及地理坐标等信息。
利用微博位置签到数据为研究个人社交关系提供了一种基于时空关系的新思路,也得到了人们越来越多的关注。
不过,随着LBS的快速发展,其对位置信息数量以及时效性的要求也越来越高。POI(Point Of Interest,兴趣点)作为当前位置信息的重要载体,已被广泛应用于车载导航系统等LBS应用中,POI数据的实时性、数据来源的可靠性和广泛性直接影响着LBS业务的发展, POI的更新也就成了一项关键性工作。
传统POI更新主要依靠人工现场采集后入库的方法,与其他类型GIS数据一样主要通过专业测绘部门采集管理,不仅费时费力、效率低下,其现势性也已无法满足位置服务和行业GIS应用的整体需求。
依靠移动社交网络提供的位置签到数据来获取更新POI的数据源成为了一个新的研究方向。位置签到数据来自大量用户带有GPS定位功能的智能移动终端上传的信息,具有数据量大、现势性高、具有社会化属性等特点,使其成为实现POI高效高质更新的一种潜在可用数据源。
无论是基于位置签到数据的社交关系,还是基于位置签到数据的POI更新,亦或是其他基于位置签到数据的应用,其实现前提都是如何获取位置签到数据。但是由于移动社交网络用户基数大,用户上传的位置签到数据的数据量十分庞大,使得如何有效的、合理的、高效的获取位置签到数据成为了难题,同时如和将获取的位置签到数据进行批量化、规范化的信息提取,以及如何快速的更新位置签到数据数据库等问题,也都成为了使用位置签到数据的难题。
当前主流的微博平台都提供了免费的接口,支持多种SDK,包括多种SDK,包括C++、PHP、JAVA、Android等流行语言的软件开发工具包。开发者在经过授权之后可以通过调用微博平台提供的API进行数据获取。
发明内容
本发明的目的是提供一种快速、高效、批量式的微博签到数据在线获取方法,以满足社会及LBS等行业领域对大量签到数据的需求。
本发明的技术方案为一种地理区域格网划分的微博签到数据在线获取方法,其特征在于,包括以下步骤:
步骤1:配置数据库;
步骤2:对地理区域进行格网划分;
步骤3:获取所述的格网区域内的POI点的基本信息;
步骤4:获取所述的每个POI点的位置动态信息;
步骤5:获取用户的签到历史轨迹。
作为优选,其所述的步骤1进一步包括以下子步骤:
步骤1.1:选择合适的数据库管理系统;
步骤1.2:使用所述的数据库管理系统建立不同的数据表,以存储不同类型的数据。
作为优选,所述的步骤2进一步包括以下子步骤:
步骤2.1:获取所述的地理区域的经纬度坐标范围;
步骤2.2:设置合适的格网划分阈值;
步骤2.3:对整个所述的地理区域进行格网划分。
作为优选,所述的POI点的基本信息,是通过循环调用微博平台提供的接口而获取的。
作为优选,所述的每个POI点的位置动态信息,是根据所诉的每个POI点的ID号,循环调用微博平台提供的接口获取在此POI点进行过签到的操作信息和用户信息。
作为优选,所述的步骤5进一步包括以下子步骤:
步骤5.1:对在所有POI点进行过签到操作的用户ID进行排序,可以得到按签到频率排序的用户ID序列,排名第一的用户即为在该地理区域进行过签到操作最多的用户;
步骤5.2:根据需求,选择不同频率签到操作的用户,通过调用微博平台提供的接口获取所述用户的签到历史轨迹。
本发明具有以下优点和积极效果:
1.实现了微博签到数据的在线、快速、高效、批量下载,满足了社会及LBS等行业领域对大量签到数据的需求;
2.本发明使用微博平台免费提供的接口作为数据下载的媒介,方法效率高,成本低,易于实现。
附图说明
图1:是本发明的实施例流程图。
具体实施方式
本发明利用微博平台免费提供的接口作为数据在线获取的媒介,提出了一种地理区域格网划分的微博签到数据在线获取方法。以下以新浪微博平台为例结合附图和实施例详细说明本发明技术方案。
请见图1,本发明的技术方案为一种地理区域格网划分的微博签到数据在线获取方法,包括以下步骤:
步骤1:配置数据库;本步骤进一步包括以下子步骤,
步骤1.1:选择合适的数据库管理系统;具体实施时,本领域技术人员可以根据不同的应用需求选择不同的数据库管理系统,并且在本地计算机安装;
步骤1.2:使用数据库管理系统建立不同的数据表,以存储不同类型的数据,并根据不同数据表所需的表属性为每一个数据表设置好响应的数据结构和主属性。
步骤2:对地理区域进行格网划分;本步骤进一步包括以下子步骤:
步骤2.1:获取地理区域的经纬度坐标范围,以上海市区域为例,起始经纬度为(31.44226389,121.0112722),终止经纬度为(30.70359444,121.9588444);
步骤2.2:设置合适的格网划分阈值;以新浪微博为例,其“place/nearby/pois”接口允许的最大查询半径为10000米,为了保证能将地理区域内所有数据都能无遗漏地获取,所以格网的划分阈值也应在10000米内;
步骤2.3: 按照设置的格网划分阈值和经纬度坐标范围,对整个区域范围进行格网划分。本实施例采用增量式的方法进行格网划分;
NewLat=Lat+AddLat
NewLon=Lon+AddLon
式中NewLat和NewLon是下一个格网中心坐标,Lat和Lon是前一个格网中心坐标,AddLat和AddLon是格网划分增量。
步骤3:获取格网区域内的POI点的基本信息;POI点的基本信息,是通过循环调用微博平台提供的接口而获取的;具体包括以下子步骤:
步骤3.1:将Lat、Lon、最大查询半径range等参数传入“place/nearby/pois”接口,接口会返回以(Lat,Lon)坐标为中心的格网范围内所有的POI点的信息,信息是一个Json字符串,主要属性包括poiid(POI点唯一标识符),title(名称),address(地址),lon(经度),lat(纬度),category(类别),city(所在城市),province(所在省份),country(所在国家),url(网址),phone(电话),postcode(邮编),checkin_num(签到次数),checkin_user_num(签到人数)等;
步骤3.2:循环调用该接口,获取不同地理格网范围内的POI信息。该方法的伪代码如下:
Void poisinfo_collector()
{
for (float lat = startlat; lat <finallat; lat +=addlat)
for (float lon = startlon; lon < finallon; lon += addlon)
Jsontype POIsinfo=Place.nearby(lat,lon,range);
}
步骤3.3:将获取的POI信息存储到数据库对应的表中。
步骤4:获取所述的每个POI点的位置动态信息;每个POI点的位置动态信息,是根据每个POI点的ID号,循环调用微博平台提供的接口获取在此POI点进行过签到的操作信息和用户信息。具体包括以下子步骤:
步骤4.1:将上一步骤得到的poiid传入“place/poi_timeline”接口,接口会返回在该POI点进行过签到的操作信息和用户信息,信息是一个Json字符串,操作信息主要是指用户签到的时间、签到所发的文本内容、评论转发数目等,用户信息主要是指签到用户的个人信息,主要属性包括id(用户唯一标识符),name(姓名),city(所在城市),province(所在省份),descroption(描述),url(网址),gender(性别),followers_count(关注人数),friends_count(粉丝数),statuses_count(微博数)等;
步骤4.2:循环调用该接口,获取不同POI点的用户签到信息。该方法的伪代码如下:
Void usersinfo_collector()
{
for (int num=0;num <count; num++){
string poiid=allpoiid[num];
Jsontype usersinfo=Place.poitimeline(poiid);}
}
步骤5:获取用户的签到历史轨迹。该步骤进一步包括以下子步骤:
步骤5.1:对在所有POI点进行过签到操作的用户ID进行排序,可以得到按签到频率排序的用户ID序列,排名第一的用户即为在该地理区域进行过签到操作最多的用户;
步骤5.2:根据应用或研究的需求,可以选择不同频率签到操作的用户,通过调用微博平台提供的接口获取特定用户的签到历史轨迹。将特定用户的ID传入“place/user_timeline”接口,接口会返回在该用户所有的历史位置签到动态,信息是一个Json字符串,主要属性包括created_at(签到时间),text(签到内容),coordinates(签到坐标)等信息。如果该地理位置是一个标准的POI点,返回的数据中还包含相关POI的基本信息。该方法的伪代码如下:
Void userhistoryinfo_collector()
{
for (int num=0;num <count; num++){
string userid=alluserid[num];
Jsontype userhistorysinfo=Place.usertimeline(userid);}
}
本发明的基本原理是利用微博平台免费提供的接口作为数据下载的媒介,通过地理格网划分进行微博签到数据快速高效获取,进而可以满足社会及LBS等行业领域对大量签到数据的需求。
本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
Claims (6)
1.一种地理区域格网划分的微博签到数据在线获取方法,其特征在于,包括以下步骤:
步骤1:配置数据库;
步骤2:对地理区域进行格网划分;
步骤3:获取所述的格网区域内的POI点的基本信息,所述的POI点为兴趣点;
步骤4:获取所述的每个POI点的位置动态信息;
步骤5:获取用户的签到历史轨迹。
2.根据权利要求1所述的地理区域格网划分的微博签到数据在线获取方法,其特征在于:所述的步骤1进一步包括以下子步骤:
步骤1.1:选择合适的数据库管理系统;
步骤1.2:使用所述的数据库管理系统建立不同的数据表,以存储不同类型的数据。
3.根据权利要求1所述的地理区域格网划分的微博签到数据在线获取方法,其特征在于:所述的步骤2进一步包括以下子步骤:
步骤2.1:获取所述的地理区域的经纬度坐标范围;
步骤2.2:设置合适的格网划分阈值;
步骤2.3:对整个所述的地理区域进行格网划分。
4.根据权利要求1所述的地理区域格网划分的微博签到数据在线获取方法,其特征在于:所述的POI点的基本信息,是通过循环调用微博平台提供的接口而获取的。
5.根据权利要求1所述的地理区域格网划分的微博签到数据在线获取方法,其特征在于:所述的每个POI点的位置动态信息,是根据所诉的每个POI点的ID号,循环调用微博平台提供的接口获取在此POI点进行过签到的操作信息和用户信息。
6.根据权利要求1所述的地理区域格网划分的微博签到数据在线获取方法,其特征在于:所述的步骤5进一步包括以下子步骤:
步骤5.1:对在所有POI点进行过签到操作的用户ID进行排序,可以得到按签到频率排序的用户ID序列,排名第一的用户即为在该地理区域进行过签到操作最多的用户;
步骤5.2:根据需求,选择不同频率签到操作的用户,通过调用微博平台提供的接口获取所述用户的签到历史轨迹。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2013101268291A CN103198135A (zh) | 2013-04-12 | 2013-04-12 | 一种地理区域格网划分的微博签到数据在线获取方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN2013101268291A CN103198135A (zh) | 2013-04-12 | 2013-04-12 | 一种地理区域格网划分的微博签到数据在线获取方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN103198135A true CN103198135A (zh) | 2013-07-10 |
Family
ID=48720692
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN2013101268291A Pending CN103198135A (zh) | 2013-04-12 | 2013-04-12 | 一种地理区域格网划分的微博签到数据在线获取方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN103198135A (zh) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104422443A (zh) * | 2013-09-09 | 2015-03-18 | 阿尔派株式会社 | 导航装置及信息提供方法 |
| CN104978334A (zh) * | 2014-04-04 | 2015-10-14 | 华为技术有限公司 | 一种时空行为数据的处理方法和装置 |
| CN105183870A (zh) * | 2015-09-17 | 2015-12-23 | 武汉大学 | 一种利用微博位置信息的城市功能区探测方法及系统 |
| CN105509743A (zh) * | 2015-11-24 | 2016-04-20 | 上海汽车集团股份有限公司 | 定位处理方法、业务平台和网络系统 |
| CN108628896A (zh) * | 2017-03-22 | 2018-10-09 | 腾讯科技(深圳)有限公司 | 签到行为热度处理方法及装置 |
| CN108985598A (zh) * | 2018-06-29 | 2018-12-11 | 中国地质大学(武汉) | 一种基于用户生成内容的poi空间影响力评价方法及系统 |
| CN109032342A (zh) * | 2018-07-02 | 2018-12-18 | 浙江大学 | 一种融合运动、生理和位置传感数据的复杂活动识别方法 |
| CN112396441A (zh) * | 2019-08-14 | 2021-02-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102291435A (zh) * | 2011-07-15 | 2011-12-21 | 武汉大学 | 一种基于地理时空数据的移动信息搜索及知识发现系统 |
-
2013
- 2013-04-12 CN CN2013101268291A patent/CN103198135A/zh active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102291435A (zh) * | 2011-07-15 | 2011-12-21 | 武汉大学 | 一种基于地理时空数据的移动信息搜索及知识发现系统 |
Non-Patent Citations (2)
| Title |
|---|
| YAOYAO: "新浪微博LBS服务开放接口", 《HTTP://WWW.CHINAZ.COM/NEWS/2012/0529/254484.SHTML》 * |
| 毋一舟等: "基于LBS签到数据更新POI的数据预处理研究", 《计算机与数字工程》 * |
Cited By (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN104422443A (zh) * | 2013-09-09 | 2015-03-18 | 阿尔派株式会社 | 导航装置及信息提供方法 |
| CN104978334A (zh) * | 2014-04-04 | 2015-10-14 | 华为技术有限公司 | 一种时空行为数据的处理方法和装置 |
| CN105183870A (zh) * | 2015-09-17 | 2015-12-23 | 武汉大学 | 一种利用微博位置信息的城市功能区探测方法及系统 |
| CN105183870B (zh) * | 2015-09-17 | 2018-07-27 | 武汉大学 | 一种利用微博位置信息的城市功能区探测方法及系统 |
| CN105509743A (zh) * | 2015-11-24 | 2016-04-20 | 上海汽车集团股份有限公司 | 定位处理方法、业务平台和网络系统 |
| CN105509743B (zh) * | 2015-11-24 | 2018-12-28 | 上海汽车集团股份有限公司 | 定位处理方法、业务平台和网络系统 |
| CN108628896A (zh) * | 2017-03-22 | 2018-10-09 | 腾讯科技(深圳)有限公司 | 签到行为热度处理方法及装置 |
| CN108985598A (zh) * | 2018-06-29 | 2018-12-11 | 中国地质大学(武汉) | 一种基于用户生成内容的poi空间影响力评价方法及系统 |
| CN108985598B (zh) * | 2018-06-29 | 2021-11-05 | 中国地质大学(武汉) | 一种基于用户生成内容的poi空间影响力评价方法及系统 |
| CN109032342A (zh) * | 2018-07-02 | 2018-12-18 | 浙江大学 | 一种融合运动、生理和位置传感数据的复杂活动识别方法 |
| CN112396441A (zh) * | 2019-08-14 | 2021-02-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
| CN112396441B (zh) * | 2019-08-14 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、装置以及可读存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN103198135A (zh) | 一种地理区域格网划分的微博签到数据在线获取方法 | |
| US10089653B2 (en) | System and method for estimating mobile device locations | |
| CN103220376B (zh) | 利用移动终端的位置数据来定位ip位置的方法 | |
| US8260553B2 (en) | Methods, apparatuses, and computer program products for providing user location information | |
| CN103631888B (zh) | 基于位置的多数据源的数据搜索方法和装置 | |
| US10911888B1 (en) | Pattern matching in point-of-interest (POI) traffic analysis | |
| WO2019072092A1 (zh) | Ip地址定位方法及装置,电子设备及存储介质 | |
| WO2013075583A1 (zh) | 添加好友的方法、装置及存储介质 | |
| CN103888895B (zh) | 信息处理方法、服务器设备及移动终端 | |
| CN106210163B (zh) | 基于ip地址的定位方法及装置 | |
| CN102769821A (zh) | 用于确定移动终端的位置的方法和设备 | |
| CN102811481A (zh) | 用于确定无线接入点的位置的方法和设备 | |
| CN108574715A (zh) | 信息推荐方法、装置及系统 | |
| CN104331812A (zh) | 一种移动环境下基于位置服务的定时拼团方法 | |
| CN107464074A (zh) | 一种精确物流配送方法 | |
| CN104320848B (zh) | 基于云计算实现室内定位的系统及方法 | |
| CN104158885A (zh) | 一种基于位置信息流式加载应用的方法和系统 | |
| CN103258356A (zh) | 一种自动签到的方法 | |
| CN101207880A (zh) | 一种基于服务器客户机模式的手机指路导航系统 | |
| CN101713657B (zh) | 导航电子地图双向Delta信息更新方法 | |
| US10182307B2 (en) | System for providing location-based social networking services to users of mobile devices | |
| CN119622123B (zh) | 一种融合用户移动方向的轻量级兴趣点推荐方法及装置 | |
| US9449110B2 (en) | Geotiles for finding relevant results from a geographically distributed set | |
| CN102917310A (zh) | 信息推送系统 | |
| CN110348896A (zh) | 划分地理网格的方法、商圈确定方法及设备 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130710 |