波士顿房价问题可视化:散点图感受价格相关因素数据分布

波士顿房价问题也是机器学习中的一个入门问题,sklearn这个模块中包含了500多条波士顿房价的数据,其中包括13个相关的因素。类似于鸢尾花数据可视化的处理(参考博文鸢尾花数据进行可视化展示)的处理方式,我们先把datasets的数据转换成我们熟悉的DF数据,这一次,我们是用python自带的matplot库中的方法来绘制散点图。具体的代码如下所示,其中用到了一些python的技巧,总结如下:

1.双重for循环列表生成式生成二维的数据列表;
2.zip方法打包两个列表并且转换成字典类型;
3.pandas的DataFrame的数据创建与读取;
4.matplotlib的绘图方法。

from sklearn import datasets
import pandas as pd
import matplotlib.pyplot as plt
import math
boston = datasets.load_boston()
factor_list = list(boston.feature_names)
facvals = [ [boston.data[i][index] for i in range(len(boston.data))] for index in range(len(factor_list)) ]
factor_list.append('TARGET')
facvals.append(boston.target)
factor_dict = dict(zip(factor_list,facvals))
boston_df = pd.DataFrame(
			factor_dict, # columns = ['CRIM','CHAS','AGE','TARGET'],
			)
def plot(strfac):
	x_axis = list(boston_df[strfac])
	y_axis = list(boston_df['TARGET'])
	plt.title(strfac)
	plt.ylabel('Price')
	plt.scatter(x_axis,y_axis,s=3)

for i in range(len(factor_list)):
	index = i+1
	factor = factor_list[i]
	plt.subplot(3,5,index)
	plot(factor)

plt.show()

我们最终生成了以下图形:
在这里插入图片描述

发布了179 篇原创文章 · 获赞 9 · 访问量 5557

猜你喜欢

转载自blog.csdn.net/weixin_41855010/article/details/104506218