python_爬虫爬取库房无忧网的库房数量 - 代码天地

python_爬虫爬取库房无忧网的库房数量

其他 2020-04-18 15:49:47 阅读次数: 0

原创不易，转发请带本文链接
爬虫爬取库房无忧网每个城市的库房数量
爬取前请到高德地图找到自己城市的起始经纬度和终止经纬度

import os

import requests
from utils.read_write import writeOneCSV, writeOneJSON, readJson

'''
    此文件用于抓取库房无忧网的库房数据
'''
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko)'
                  ' Chrome/49.0.2623.221 Safari/537.36 SE 2.X MetaSr 1.0'}
os.chdir(r'D:\project\jianguiyuan\\')

def count(district, houseType):
    url = 'http://sz.kufangwuyou.com/house/count'
    data = {
        "level": 3,
        "houseType": "5",
        "city": "440300",
        "start": 0,
        "pageSize": 1000,
        "longitudeStart": 113.33913,
        "latitudeStart": 22.046212,
        "longitudeEnd": 114.83276,
        "latitudeEnd": 23.045959
    }
    r = requests.post(url, headers=headers, json=data)
    response = r.json()
    if response['result']['data']:
        file = str(houseType) + '_' + str(district) + '_' + '.json'
        writeOneJSON(response['result'], json_dir + file )


if __name__ == "__main__":
    json_dir = 'D:\data\深圳政府数据\深圳库房数据\count\json\level3\\'
    child_json = 'data\\child.json'
    child = readJson(child_json)
    result = child['result']
    for houseType in [1, 2, 5]:
        for one in result:
            district = one['areaId']
            # street = one['child']['areaId']
            count(district, houseType)

如需帮忙抓取数据，请私聊我，我这暂时只有深圳的

抓数据、处理数据、分析数据

发布了16 篇原创文章 · 获赞 9 · 访问量 7131

私信关注

猜你喜欢

转载自blog.csdn.net/qq_30803353/article/details/105547524

python_爬虫爬取库房无忧网的库房数量

python_爬虫爬取库房无忧网的库房数据

一个简单Python爬虫实例（爬取的是前程无忧网的部分招聘信息）

python爬虫 requests+lxml爬取前程无忧网之模拟浏览器登录

R语言爬取前程无忧网招聘职位

python获取无忧网的招聘数据

Python爬取前程无忧网站上python的招聘信息

python爬虫--爬取前程无忧的工作岗位

Python爬虫：爬取招聘网站系列 - 前程无忧

Python Scrapy 爬取前程无忧招聘网

[Python] 前程无忧招聘网爬取软件工程职位网络爬虫 https://www.51job.com

python_爬虫_scrapy_爬取360图片实例

python_爬虫爬取高德地理编码

python爬虫：爬取拉勾网数据

Python拉勾网爬虫-翻页爬取

python爬虫爬取诗词名句网

Python爬虫：爬取抽屉网

Python 爬虫爬取煎蛋网图片

前程无忧网站，职位信息一步到位函数爬取！！！真一步到位

库房-添加用户

【库房】——SQL语句优化

python_爬虫（爬图片）

爬虫实战：爬取前程无忧（51job）python相关职位信息

Python爬虫新手入门教学（四）：爬取前程无忧招聘信息

【Python爬虫】招聘网站实战合集第一弹：爬取前程无忧

最新 Python3 爬取前程无忧招聘网 mysql和excel 保存数据

scrapy爬虫进阶案例--爬取前程无忧招聘信息

爬虫（6）：爬取岗位数量

python_爬虫_爬取7*24小时财经新闻

python_爬虫_腾讯新闻app 单页新闻数据分析爬取

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)