Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析 - 代码天地

Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析

其他 2020-02-10 10:33:37 阅读次数: 0

一、使用Python爬取房价信息

1.话不多说先看代码

from bs4 import BeautifulSoup
import requests


class SpiderHours(object):
    def __init__(self):
        self.url = "http://www.creprice.cn/rank/cityforsale.html"
        self.headers = {
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",
            "Cookie": "cityredata=1245960d33d174122151e3280a2630a2; city=sq; userchannel=EL-cityhouse; Hm_lvt_c2a7a3cec6f9dd8849155424efab19c7=1562643454,1562643606,1562644057; Hm_lpvt_c2a7a3cec6f9dd8849155424efab19c7=1562644057"}

    def request_page(self):
        response = requests.get(self.url, headers=self.headers)
        ret = response.content.decode("utf-8")
        soup = BeautifulSoup(ret, features="lxml")
        content = soup.find_all("th")
        temp_list = list()
        for info in content:  # 遍历数据
            temp_info = info.text.strip()  # 删除\n转义符
            temp_info = temp_info.replace(",", "")  # 删除数据中的","
            if len(temp_list) < 5:  # 整理数据
                temp_list.append(temp_info)
            else:
                with open("2019年全国房价.csv", "a") as f:  # 写入csv文件
                    f.write(",".join(temp_list) + "\n")
                    print(",".join(temp_list))
                temp_list = list()
                temp_list.append(temp_info)


if __name__ == '__main__':
    spider = SpiderHours()
    spider.request_page()

获取到的数据:

序号,城市名称,平均单价（元/㎡）,同比,环比
1,北京,63905,-0.23%,+0.2%
2,深圳,62987,+12.49%,+0.89%
3,上海,51877,-0.85%,-0.48%
4,厦门,45257,+2.61%,+1.84%
5,三亚,34185,-10.67%,-1.74%
6,广州,33858,+1.62%,+2.17%
7,南京,30540,+5.21%,-0.86%
8,杭州,30248,-6.3%,-4.26%
9,陵水,29052,-16.47%,-4.77%
10,福州,26145,-5.61%,-2.46%
…

进行数据分析-全国房价排名top30

在这里插入图片描述

好了今天就介绍到这里吧!

Fantasy!

发布了18 篇原创文章 · 获赞 15 · 访问量 2792

私信关注

猜你喜欢

转载自blog.csdn.net/qq_42768234/article/details/95228016

Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析

python爬取安居客地图页信息，并保存为csv文件

python爬取多个网页表格并保存为csv

python爬取中国天气网天气并保存为csv格式文件

Vue组件-爬取页面表格中的数据并保存为csv文件

python入门访问网站并将爬回来的数据保存为csv文件

Python爬虫学习笔记(2) _豆瓣电影TOP250(2)爬取详细数据，保存为CSV文件【urllib、request、bs4、error、CSV】

python爬取数据保存为图片

python爬取数据保存为MySQl格式

python爬取数据保存为txt格式

python爬取数据保存为Json格式

【Python爬虫】使用美味汤BeautifulSoup爬取数据并保存为Excel文件

用beautifulsoup，re，xpath爬取文章并保存为csv文件

爬取某网站景区列表并保存为csv文件

python爬36选7并保存为.csv

房价集体上扬？最新房价数据分析看房价走势

python scrapy爬取腾讯招聘网站保存为csv文件，而且设定其表头顺序(csv默认是无序的)

python 利用scrapy爬取豆瓣TOP250部电影信息分别保存为csv、json、存入mysql、下载海报图片

Python 爬取数电教案并保存为pdf

python爬取昵称并保存为vss

用逗号隔开简单数据保存为csv

python--爬取豆瓣热门国产电视剧保存为文件

python中Scrapy实战之爬取网页并保存为json文件

python爬取中国天气网天气并保存为word格式文件

Android爬虫Jsoup爬取某招聘网站数据并保存为exceL文件

爬取表格类网站数据并保存为excel文件

python读取Json文件保存为csv格式

提取网页数据保存为csv文件

将列表数据类型保存为csv文件

python用akshare批量爬取金融数据并保存为excel格式

今日推荐

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

“开源信徒”周鸿祎开源360智脑大模型

周排行

Ubuntu 14.04 下Fuel6.0安装部署

香港一小巴侧翻致1死16伤警方：未见机件故障

pikachu--XSS盲打

阅读深入理解JVM虚拟机笔记一

java.sql.SQLException: ORA-00932: 数据类型不一致: 应为 -, 但却获得 CLOB

oracle delete all object under an user

[LeetCode]20 Valid Parentheses 有效的括号

树形DP求树的直径【模板】

Context propagation over HTTP in Go

【PAT】（B）1053 住房空置率 (20)*

每日归档

更多

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)

2024-04-12(38)

2024-04-11(14)

2024-04-10(68)

2024-04-09(5)