使用matplotlib.pyplot + xlrd + pandas使租房价格面积数据关系可视化

最近本想接触pandas,然而我发现自己在数据可视化方面能力的欠缺的,所以我要恶补这方面的知识才能继续学习更深入的数据分析知识。

而matplotlib是个强大的工具,大家可以参考http://matplotlib.org 这个网站学习,又或者是这个https://www.pythonprogramming.net里面是一个有才华的pyhton程序员提供了非常多免费的学习视频,而且涉及面非常广泛,值得大家一看。

import requests
import matplotlib.pyplot as plt
import xlrd
import pandas
res = requests.get(r'https://rent.591.com.tw/home/search/rsList?is_new_list=1&type=1&kind=0&searchtype=1&region=1')
df = pandas.DataFrame(res.json()['data']['data'])
df.to_excel('house.xlsx')
myBook = xlrd.open_workbook('house.xlsx')
myShreet = myBook.sheet_by_index(0)
area = myShreet.col(12)
area.pop(0)
price = myShreet.col(65)
price.pop(0)
x = [int(i.value) for i in area]
y = []
for i in price:
    i=i.value
    i = float(''.join(i.split(',')))
    print(i)
    y.append(i)
plt.xlabel('Area')
plt.ylabel('Price')
plt.title('The relationgship bretween area and price\n Data from https://rent.591.com.tw')
plt.scatter(x, y)
plt.show()
迫不及待地想要展示一下成果:

图片一图片一

图片二

图片二

第一张图是可视化的结果,第二张图是收集的网址数据然后利用pandas这个方便的工具整理成excel文件。

可以发挥的空间有很多,比如样本不够多(我只下载了一页),还有怎么呈现数据,怎么吸引人都是我值得思考的。

继续学习。

猜你喜欢

转载自blog.csdn.net/sinat_33487968/article/details/69842244