2020 最新 Python3.8 爬国家统计局区域、省、市、区，街道乡镇代码 - 代码天地

2020 最新 Python3.8 爬国家统计局区域、省、市、区，街道乡镇代码

其他 2020-09-14 10:03:49 阅读次数: 0


import urllib.request
import time
from bs4 import BeautifulSoup
indexs = 'index.html'
url = 'http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2019/'
txt = urllib.request.urlopen(url + indexs).read().decode('gbk')
soup = BeautifulSoup(txt, 'html.parser')
lista = soup.find_all('a')
lista.pop()
for a in lista:
    print("========" +a['href'][0:2] + "," + a.text + "========" )
    time.sleep(1)
    txt = urllib.request.urlopen(url + a['href'],timeout=5000).read().decode('gbk')
    soup = BeautifulSoup(txt, 'html.parser')
    listb = soup.find_all('a')
    listb.pop()
    bb = {}
    l = len(listb)
    #print("----->>>>> "+str(l/2)+" <<<<<<------")
    strName = ''
    for i in range(0,l-1):
        if(listb[i].text == strName) :
            continue
        strIndex = listb[i]['href']
        code = listb[i].text
        strName = name = listb[i+1].text
        print(strIndex+","+code +"," + name)
        time.sleep(1)
        ctxt = urllib.request.urlopen(url + strIndex,timeout=5000).read().decode('gbk')
        soup = BeautifulSoup(ctxt, 'html.parser')
        listc = soup.find_all('a')
        listc.pop()
        lc = len(listc)
        print("----->>>>> "+str(lc/2)+" <<<<<<------")
        cstrName = ''
        for c in range(0,lc-1):
            if(listc[c].text == cstrName) :
                continue
            strIndex = listc[c]['href']
            code = listc[c].text
            cstrName = name = listc[c+1].text
            print("   ["+code +"," + name+"]")

猜你喜欢

转载自blog.csdn.net/jintaocccq/article/details/105299220

2020 最新 Python3.8 爬国家统计局区域、省、市、区，街道乡镇代码

2020 最新 Python3.8 + Mysql 爬取国家统计局区域代码，省、市、区街道乡镇区域代码

用python3的pyspider爬取国家统计局的行政区域（只到乡镇级）

Python爬取国家统计局官网最新全国所有城市县镇数据

python3爬取国家统计局，区域城乡代码

macos系统的python3.8（最新版）安装及python编辑器使用

（python3.8）pygraphviz的下载安装配置（在python下）最新

最新国家行政区划代码,来自国家统计局2018年底最新数据

国家统计局,(省/市/县/区/街道)五级联动数据

JAVA爬虫爬取国家统计局行政区划数据（2021年最新数据）

Python爬取——国家统计局省份加城市并写入数据库

Python爬虫练习一：爬取国家统计局 2016年统计用区划代码和城乡划分代码

python3.8 微信发送服务器监控报警代码

python3.8安装

Python3.8的安装

安装python3.8

python3.8

Android 实现三级联动国家统计局全国省市县行政区域最新划分数据库

国家统计局全国统计用区划代码和城乡划分代码Python爬虫样例

根据国家统计局发布的“最新县及县以上行政区划代码”生成省地市区字典表

用goquery从国家统计局拉取最新省市区3级行政区划代码，生成SQL文件导入数据库

python环境安装（最新3.8）

智慧交通day03-车道线检测实现09：车道线检测代码汇总（Python3.8）

python3.8 新特性

centos安装python3.8

CentOS下载Python3.8

docker运行python3.8

linux 更新python3.8

Python3.8安装PIL

Python3.8的下载与安装

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)