一个简单的恋家的信息爬取 - 代码天地

一个简单的恋家的信息爬取

编程语言 2018-08-19 22:13:53 阅读次数: 0

import requests
from lxml import etree
from day03.pymysql_text import Mysql_text

#封装一个函数
def lainjia(url):
    response = requests.get(url)

    # with open('lianjia.html','wb')as f:
    #     f.write(response.content)
    # 调用etree的HTML函数返回一个ele对象
    lj_ele = etree.HTML(response.text)
    #先找到总的li的path
    lj_list = lj_ele.xpath('//ul[@id="house-lst"]/li')
    #循环所有的li
    for li_list in lj_list:
        #依次获取自己想要的内容
        li_title = li_list.xpath('./div[2]/h2/a')[0].text
        print(li_title)
        li_region = li_list.xpath('./div[2]/div[1]/div[1]/a/span')[0].text
        print(li_region)
        li_zone = li_list.xpath('./div[2]/div[1]/div[1]/span[1]/span')[0].text
        print(li_zone)
        li_dx = li_list.xpath('./div[2]/div[1]/div[1]/span[2]')[0].text
        print(li_dx)
        li_price = li_list.xpath('./div[2]/div[2]/div[1]/span[1]')[0].text
        print(li_price)
        #把获取到的数据组成一个元组
        data = (li_title,li_region,li_zone,li_dx,li_price)
        #调用实例化pymysql对象的执行sql语句的方法
        m.sqlzz(sql,data)

#实例化对象，这个封装的类就是之前写的博客的数据库操作的类
m = Mysql_text()
sql = 'insert into lianjia(title,region,zone,dx,price) VALUE (%s,%s,%s,%s,%s)'
#循环url路径
for i in range(1,4):
    url = 'https://bj.lianjia.com/ditiezufang/pg%srp1/'%i

    lainjia(url)

猜你喜欢

转载自blog.csdn.net/yangbenhao/article/details/81779634

一个简单的恋家的信息爬取

python之简单爬取一个网站信息

很简单的一个爬取豆瓣音乐前250的一些信息。

一个简单Python爬虫实例（爬取的是前程无忧网的部分招聘信息）

一个简单的爬虫：爬取豆瓣的热门电影的信息

一个爬取股票信息的爬虫程序

python简单爬取一个blogs内容

python 一个简单的爬取程序

一个简单的蟒蛇爬取知乎

爬虫：一个简单的数据爬取统计实例

一个简单的爬取b站up下所有视频的所有评论信息的爬虫

一个简单的爬取一个电影网的磁力链接

小菜鸟的第一个爬虫：豆瓣爬取电影信息

帮朋友写一个爬取地区信息的脚本

第一个python爬虫示例——爬取天气信息

一个大胆的想法，爬取简书所有的文章信息

这是一个爬虫—爬取天眼查网站的企业信息

网络爬虫---爬取MOOC课程信息并做一个可视化

第一个爬虫——豆瓣新书信息爬取

分享一个B站爬虫(爬取视频信息相关数据)

分享一个B站爬虫(爬取视频信息相关数据)

Jsoup爬取简单信息

python3.6+scrapy 1.5爬取网站一个简单实例

一个简单的爬虫代码爬取糗事百科段子（selenium+ChromeDriver）

一个简单的爬取小说的python程序彻底搞懂Python的字符编码

php-Curl扩展一个简单示例-爬取新闻网站数据

【转】写一个简单的爬虫来批量爬取新浪网的新闻

这是一个简单的爬虫代码，却能爬取英雄联盟全皮肤！

用Python构建一个简单的爬虫系统：爬取妹纸图片，建议收藏

一个简单的使用scrapy爬取小说的例

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)