python爬虫--小猪短租的租房信息 - 代码天地

python爬虫--小猪短租的租房信息

其他 2019-06-19 03:13:24 阅读次数: 0

利用requests获取网页
利用Beautifulsoup4和lxml解析网页

具体代码如下

from bs4 import BeautifulSoup
import requests
'''
遇到python不懂的问题，可以加Python学习交流群：1004391443一起学习交流，群文件还有零基础入门的学习资料
'''
url = 'http://bj.xiaozhu.com/fangzi/1508951935.html'
web_data = requests.get(url)
soup = BeautifulSoup(web_data.text, 'lxml')

title = soup.select('div.pho_info > h4 ')[0].text
address = soup.select('div.pho_info > p ')[0].get('title')
price = soup.select('div.day_l > span')[0].text
first_pic = soup.select('#curBigImage')[0].get('src')
landlord_pic = soup.select('div.member_pic > a > img')[0].get('src')
landlord_name = soup.select('div.w_240 > h6 > a')[0].text

if soup.select('span[class="member_girl_ico"]'):
    landlord_gender = 'female'
else:
    landlord_gender = 'male'

data = {
'title': title,
'address': address,
'price': price,
'first_pic': first_pic,
'landlord_pic': landlord_pic,
'landlord_name': landlord_name,
'landlord_gender': landlord_gender
}
print(data)

猜你喜欢

转载自blog.csdn.net/qq_40925239/article/details/92794773

python爬虫--小猪短租的租房信息

Python爬虫入门 | 5 爬取小猪短租租房信息

Python爬虫实战--小猪短租爬虫

python3爬取“小猪短租-北京”租房信息

爬小猪短租发布的房子信息

爬取小猪短租网信息

爬取网站小猪短租的少量信息及详细介绍--爬虫案例篇

小猪短租网requests库使用，爬虫案例

爬虫项目1[爬取小猪短租数据]

python爬虫(一) 爬取北京短租房信息

python爬虫--租房信息

爬虫写法及状态码的认知,以小猪短租为例---爬虫案例

python网络爬虫-爬取北京地区短租房信息源码

Python爬虫：设置Cookie解决网站拦截并爬取蚂蚁短租

Python爬虫：一个完整的爬取多页短租房的案例！

2018小猪短租年终数据报告：自驾+民宿成近郊游标配

我用Python爬取了租房网站的信息，再也不怕租不到舒适的房啦

Python爬虫——开封市58同城租房信息

python3爬虫抓取链家上海租房信息

Python爬虫之路-爬取北、上、广租房信息

python爬虫58同城租房

Python-爬虫-租房Ziroom

Python爬取租房信息

Python爬虫实战(1)-爬取“房天下”租房信息(超详细)

[python爬虫]爬取我爱我家租房信息

Python爬虫：爬取淮安出租房源信息56页1111套

Python 如何通过网络爬虫简单爬取“安居客”网站的租房信息

python爬虫项目(scrapy-redis分布式爬取房天下租房信息)

python3爬虫-爬取58同城上所有城市的租房信息

python爬虫：找房助手V1.0-爬取58同城租房信息

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)