爬虫采集全国的街道办事处代码和名称的思路（2017年最新版城乡区划代码） - 代码天地

爬虫采集全国的街道办事处代码和名称的思路（2017年最新版城乡区划代码）

其他 2018-12-24 14:34:21 阅读次数: 0

最近一篇《我们分析了67万个村名，找到了中国地名的秘密》特别火，我来探究一下这个村名是怎么获得的

让我们看一下原文

数读菌利用爬虫爬取了国家统计局2017年最新版城乡区划代码中的67万余个村名。
在对其进行了匹配分析后，发现高度的重复是中国村一级行政区名称的最大特色之一。

我们去国家统计局网站上找一下这个地址

http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/index.html

一级一级点开是很有规律的，点到最后，就出现村了

http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2017/11/01/01/110101001.html

这是典型的多级网址的爬取的方式，也就是说，我们最先是要把一级一级的链接爬下来，一直到最后一级时，再爬取内容

因为村名实在是太多，而方法又是很类似，我就以街道办事处为例实验一下，哈哈

实验结果

0级网址1个，1级网址31个（除去港澳台地区），2级网址344个，3级网址3083个，4级网址43447

有了网址剩下的事就简单了

猜你喜欢

转载自blog.csdn.net/qq_912917507/article/details/85080482

爬虫采集全国的街道办事处代码和名称的思路（2017年最新版城乡区划代码）

python爬取2017年统计用区划代码和城乡划分代码(截止2017年10月31日)

国家统计局全国统计用区划代码和城乡划分代码Python爬虫样例

全国省市区区划代码以及邮政编码数据最新版--Mysql版（下）

全国省市区区划代码以及邮政编码数据最新版--Mysql版（上）

2018年统计用区划代码和城乡划分代码(截止2018年10月31日)（数据及python爬虫代码）

2022年度全国五级行政区划代码、城乡划分代码（省-市-县-乡-村）

2022年最新全国各省五级行政区划代码及名称数据（省-市-区县-乡镇-村）

[数据][json格式] 2016年统计用区划代码和城乡划分代码

Python爬虫练习一：爬取国家统计局 2016年统计用区划代码和城乡划分代码

统计用区划代码和城乡划分代码

2018年统计用区划代码和城乡划分代码(截止2018年10月31日)

Python获取[2016年统计用区划代码和城乡划分代码(截止2016年07月31日)]

国家统计局统计用区划代码和城乡划分代码---爬虫、详细分析

三级联动——最新版行政区划代码

Python爬取行政区划代码（最新版）

行业分类代码 2017 最新版创建sql语句

pmdtechnologies ag在首尔和上海开设办事处

协程实践及应用(获取区划代码和城乡划分代码)

天赐宝贝北京办事处

天赐宝贝深圳办事处

天赐宝贝上海办事处

vba 抓取统计用区划和城乡划分代码到电子表格

最新全国省市区县乡镇街道行政区划数据提取(2022年)

2022年最新版Mybatis-plus3.5.0全面攻略(一）代码生成器和初步使用

数据库-最新版全国城市行政区划分数据源

硬卷完了！低代码打怪升级进阶成神之路（2023年最新版）

2017年全国数学建模国赛B题题目、解题思路、matlab代码（三）

python爬虫区划代码表

全国行政区划代码SQL

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)