【KNN算法实战】基于KNN的房屋价格预测实战 - 代码天地

【KNN算法实战】基于KNN的房屋价格预测实战

其他 2020-02-15 13:34:12 阅读次数: 0

总体思路：

1.拿到数据后，首先查看数据基本情况，筛选需要的列。

2.进行数据预处理：数据去重、缺失值处理、异常值处理【该案例中'price'列需要进行格式清晰与数据类型转换】

3.建模与评估：首先需要对数据进行Z-score标准化，然后进行训练集与测试集的划分，用训练集训练模型，用测试集预测和对模型评估。

新知：

【数据格式清洗】

模版：

DataFrame['target_col'] = DataFrameDataFrame['target_col'].str.replace('old str', 'new str').astype(data_type)

【异常值的判断标准】

标准分判断（Zscore）

标准分：衡量数据距离均值多少个标准差；公式：(x_i- x_mean) / x_std

经验法则：约68%的数据位于距离均值1标准差范围内；约95%数据位于距离均值2标准差范围内；几乎全部数据位于距离均值3标准差范围内

模版：

z_score = (DataFrame['target_col'] - DataFrame['target_col'].mean()) / DataFrame['target_col'].std()
drop_index = DataFrame[z_score.abs() > 3].index

DataFrame.drop(drop_index, inplace = True)

【对数据进行Zscore标准化】

目的是为了去量纲

标准化所在库： from sklearn.preprocessing import StandardScaler

模版： DataFrame[target_cols] = StandardScaler().fit_transform(DataFrame[target_cols])

【回归模型的评估标准】

回归模型常使用均方误差（MSE）、均方根误差（RMSE）、平均绝对误差（MAE）进行评估，三个指标的值越小越好

注意：分类模型和回归模型使用的评估方法不同，不能混用！

模型评估所在库： sklearn.metrics

模版：

from sklearn.metrics import mean_squared_error, r2_score, mean_absolute_error
print(mean_squared_error(y_test, y_predict))
print(pow(mean_squared_error(y_test, y_predict), 0.5))
print(mean_absolute_error(y_test, y_predict))
print(r2_score(y_test, y_predict))  # R方值

猜你喜欢

转载自www.cnblogs.com/yangzhehan/p/12311352.html

【KNN算法实战】基于KNN的房屋价格预测实战

【项目实战】：Python：基于随机森林算法的房屋价格预测模型

实战KNN算法

KNN算法实战

sklearn实战：糖尿病预测（knn算法）

机器学习实战——KNN算法预测电影类型

【TensorFlow实现机器学习方法】KNN（K近邻算法）实现预测房屋价格（tensorflow、matplotlib、numpy、pandas）

机器学习实战-KNN算法

机器学习实战 knn算法

机器学习实战——KNN算法

[机器学习实战] KNN算法

机器学习实战---KNN算法

Kaggle竞赛入门实战——机器学习预测房屋价格

机器学习算法及实战——kNN算法

机器学习实战之KNN算法

《机器学习实战》——kNN（k近邻算法）

机器学习实战笔记（一）KNN算法

机器学习实战中的KNN算法

《机器学习实战》—— KNN(K近邻算法)

机器学习实战笔记——KNN算法

Python实战之KNN算法实现

机器学习实战——KNN分类算法

机器学习实战 -- kNN分类算法

机器学习实战-K近邻算法（KNN）

【机器学习实战】—KNN分类算法

机器学习实战笔记--KNN近邻算法

《机器学习实战》（一）knn算法

【ML2】KNN算法讲解及实战

机器学习实战（笔记）------------KNN算法

机器学习-KNN算法详解与实战

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)