采集百度地图、腾讯地图等要点

  最近一客户要求在地图上采集全国高校的信息,包括电话、地址、经纬度等,还要包括分校区的地址经纬度等。

 

  找了几个地图采集软件,都是软件一旦退出后,要重新开始采集,这个太麻烦又浪费时间。于是决定自己写个采集脚本。

 

  思路决定出路!!!

 

  做地图类采集,首先把全国地名列出来。这是句正确的废话。具体怎么罗列呢?

 

  现在地图商,都对搜索结果有所保留。比如腾讯地图,搜索北京的学校,个人申请的API密钥每次搜索结果显示200条,如果是大城市,数量肯定不止。那就把搜索范围精细化,把全国的一线城市、新一线城市、二线城市、三线城市,按区、县市采集,四、五线城市,按地级市采集。比如采集北京的大学,那种使用“大学”作为关键词,分类为大学,地区为北京海淀区,依次把北京的每个区都搜罗一遍,这样数据就比较完整了;而采集西藏的拉萨时,就不用分得那么详细了,只采整个拉萨就可以。如此一来,采集数据完整又有效率。

 

  这里的地区分类,应按照采集任务的不同,具体分类也不同。典型的比如采集餐饮店,像北上广深,有大量的餐饮店,就算按县区轮流采集也不全面,应该以某个商圈或道路为中心,进行周边搜索。具体商圈,可以上美团查询。而且搜索的分类也要细,比如餐饮店中,也有很多分类,火锅、西餐、自助餐等。比如:

 http://apis.map.qq.com/ws/place/v1/suggestion/?boundary=nearby(31.154130,121.353610,500)&keyword=自助餐&key=OB4BZ-D4W3U-B7VVO-4PJWW-6TKDJ-WPB77

 

  这是以上海七宝老街为中心,搜索500内的自助餐店。

 

  以上是本人的一些看法,如有偏差,还请指正!

 

  有需要做地图采集商家数据的,可以联系我!

 

猜你喜欢

转载自www.cnblogs.com/etashi/p/9030755.html
今日推荐