利用高德API + Python爬取链家网租房信息 01 - 代码天地

利用高德API + Python爬取链家网租房信息 01

其他 2018-10-31 17:41:59 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/Kompany4/article/details/77842719

看了实验楼的项目发现五八同城爬取还是有点难度所以转战链家

实验代码如下

from bs4 import BeautifulSoup
from urllib.request import urlopen
import csv

url = 'https://gz.lianjia.com/zufang/rs{page}/'

page = 0

csv_file = open('fang.csv','w')
#这里open打开需要‘w’不要‘wb’，使用‘wb’会出现一下错误：
#TypeError: a bytes-like object is required, not 'str'


csv_write = csv.writer(csv_file,delimiter=',')

while True:
    page += 1
    print('正在下载网页：',url.format(page=page))
    respone = urlopen(url.format(page=page))
    html = BeautifulSoup(respone)    
    house_list = html.find('div',class_='list-wrap').find_all('div',class_="info-panel")
    #采用先取大后取小的原则
    #这里提取记得爬取有用的，在这我是提取‘info-panel’这的
    
    

    for house in house_list:
        house_title = house.find('a',target='_blank').get_text()
        house_url = house.find('div',class_='where').a['href']
        house_money = house.find('div',class_='price').span.get_text()
        house_location = house.find('div',class_='con').a.get_text()
        csv_write.writerow([house_title,house_location,house_money,house_url])
        
    

csv_file.close()

这个代码并不完善爬取10页就会出现 HTTPError: Not Found

明显的网站对IP的限制，下一步我将完善代码进行IP代理池以及请求的设置

猜你喜欢

转载自blog.csdn.net/Kompany4/article/details/77842719

利用高德API + Python爬取链家网租房信息 01

利用python爬取贝壳网租房信息

利用Python爬取租房信息

Python E化-利用高德地图API

Python爬取链家网获取二手房数据并调用高德api获得经纬度

爬取链家租房信息

[Python]利用高德地图api实现经纬度与地址的批量转换

高德API+Python解决租房问题

分享项目-python基于高德地图Api实现租房

高德地图API——信息窗体InfoWindow

python爬虫：利用BeautifulSoup爬取链家深圳二手房首页的详细信息

Python玩转高德地图API（二）

Python玩转高德地图API（一）

uniapp利用高德api接口将getLocation经纬度转化到省市区街道信息

爬取链家网租房信息（万级数据的简单实现）

链家深圳租房信息爬取练习附加源码

爬取链家网站的北京租房信息

50 行代码爬取链家租房信息

实战—爬取网站链家租房信息

python爬虫-selenium爬取链家网房源信息

python正则表达式爬取链家租房信息

高德地图api获取路况信息（python版）

利用 Python 爬取高德地图数据，打造属于自己的世界地图！

基于djang、vue、scrapy-redis、高德地图的豆瓣租房租房信息爬取、存储、可视化综合项目

利用高德地图获取经纬度-python

利用高德地图api进行定位

Python爬取租房信息

小生不才，真实记录爬取链家网2584条租房信息，聊一聊框架爬取大量数据防止被ban的事

Python 爬取赶集网租房信息

Python突破高德API限制爬取交通态势数据+GIS可视化（超详细）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)