贝壳租房Xpath爬虫+数据分析实战 - 代码天地

贝壳租房Xpath爬虫+数据分析实战

其他 2019-12-06 16:34:08 阅读次数: 0

sadsadsadsa

import requests
from lxml import etree

url = "https://xa.zu.ke.com/zufang/"
header = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36"}

html = requests.get(url=url,headers=header).text
tree = etree.HTML(html)

# 获取div标签列表
div_list = tree.xpath('//div[@class="content__list"]/div')
for div in div_list:
    # 获取p标签列表
    p_list = div.xpath('./div[1]/p')
    target_url = p.xpath('.//p[1]/a/@href')[0]
    print(target_url)
    '''
    for p in p_list:
        
        title = p.xpath('./a/text()')[0]
        area = p.xpath('./a[1]/text()')[0]
        
        print(title)
        print(area)
        break
        '''
'''
print(list)
for li in list:
    #title = li.xpath('./div[1]/p[1]/a/text()')[0]
    #rurl = li.xpath('./div[1]/p[1]/a/@href')[0]
    #area = li.xpath('./div[1]/p[2]/a[1]/text()')[0]
    #fx = li.xpath('./div[1]/p[2]/a[2]/text()')[0]
    #name = li.xpath('./div[1]/p[2]/a[3]/text()')[0]
    #space = li.xpath('./div[1]/p[2]/text()')[4]
    #cx = li.xpath('./div[1]/p[2]/text()')[5]
    #gj = li.xpath('./div[1]/p[2]/span/text()')[6]
    #lc = li.xpath('./div[1]/p[2]/text()')[6]
    #uptime =li.xpath('./div[1]/p[3]/text()')[0]
    uptype = li.xpath('./div[1]/p[4]//text()')
    #uptype = li.xpath('./div[1]/p[4]/i[0]/text()')[0]
    #zx = li.xpath('./div[1]/p[4]/i[1]/text()')[0]
    #gn = li.xpath('./div[1]/p[4]/i[2]/text()')[0]
    #kf = li.xpath('./div[1]/p[4]/i[3]/text()')[0]
    #print(title)
    #print(rurl)
    #print(space)
    #print(fx)
    #print(name)
    #print(area)
    #print(cx)
    #print(gj)
    #print(lc)
    #print(uptime)
    print(uptype)
    #print(zx)
    #print(gn)
    #print(kf)
    break
'''

猜你喜欢

转载自www.cnblogs.com/Iceredtea/p/11995922.html

贝壳租房Xpath爬虫+数据分析实战

爬虫实战：深圳租房数据分析

Python租房数据分析爬虫全国租房数据

广州租房数据分析

数据分析实战----北京租房数据统计分析

Python 爬虫和数据分析实战

Python爬虫、数据分析实战演练

租房数据分析,knn算法使用

北京链家网租房信息的数据分析项目实战

scrapy抓取贝壳找房租房数据

python爬虫中的数据分析------xpath表达式的详解

租房大数据采集以及数据分析

链家租房-深圳租房分析（2/2）数据分析

自如网杭州市租房数据分析(2)

自如网杭州市租房数据分析(1)

Python爬虫与数据分析之爬虫技能：urlib库、xpath选择器、正则表达式

爬虫实战--拿下最全租房数据 | 附源码

python爬虫实战+数据分析+数据可视化（分析豆瓣《飞驰人生》影评）

[python爬虫之路day4]：xpath基本知识&&lxml结合xpath进行数据分析&&爬取豆瓣电影

【数据分析师-数据分析项目案例一】600w+条短租房数据案例分析

离线数据分析--实战

数据分析实战(二)

数据分析实战（1）

Python数据分析实战

python之爬虫的入门05------实战：爬取贝壳网（用re匹配需要的数据）

Python爬虫实战+数据分析+数据可视化（汽车之家）

Python爬虫实战+数据分析+数据可视化（世纪佳缘）

Python爬虫实战+数据分析+数据可视化（NBA_腾讯体育）

Python爬虫实战+数据分析+数据可视化（腾讯新闻实时疫情）

Python爬虫实战+数据分析+数据可视化（美团美食信息）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)