The First Project:boston_housing
项目概述
波士顿房地产市场竞争激烈,你想成为该地区最好的房地产经纪人。 为了与同行竞争,你决定利用一些基本的机器学习概念来帮助你和客户为他们的家寻找最佳销售价格。
幸运的是,你现在拥有一个 Boston Housing 数据集,其中包含有关波士顿社区房屋的汇总数据,其中包括每个区域的房屋价格中位数的值。 你的任务是基于可用工具的统
计分析来构建一个最佳模型。 这一模型将被用来预测你客户房屋的最佳销售价格。
项目要点
此项目旨在让你熟练地掌握 sklearn 中的多种技能,包括训练、测试、评估与优化模型。
通过完成此项目你将掌握以下知识:
- 如何探索数据并观察特征。
- 如何训练和测试模型。
- 如何发现潜在问题,如由于偏差或方差导致的误差。
- 如何应用技术来改进模型,如交叉验证和网格搜索。
开始项目
对于本项目,你可以在机器学习项目 GitHub找到 boston_housing
文件夹,里面包含了本项目的必备文件。你可以从这个代码库中直接下载本纳米学位所有项目需要的文件。在完成项目时,请确保你使用了这些项目文件的最新版本!
项目链接:https://github.com/udacity/cn-machine-learning
本项目包含三个文件:
boston_housing.ipynb
: 这是主文件,你将在此完成你的项目。housing.csv
: 这是项目数据集。你将在 notebook 中加载这些数据。visuals.py
: 这是一个 Python 脚本,它提供了本项目的补充可视化内容,请勿修改此文件。
在终端或命令行提示符窗口中,转到包含项目文件的文件夹,然后使用命令 jupyter notebook boston_housing.ipynb
打开浏览器窗口或标签页来处理你的 notebook。此外,你可以使用命令 jupyter notebook
或 ipython notebook
在打开的浏览器窗口中转到该 notebook 文件。按照 notebook 中的说明操作,并回答其中的每个问题,这样才能成功完成项目。除了项目文件外,我们还提供了 README 文件,其中可能包含关于项目的其他必要信息或说明。
提交项目
评估
优达学城的审阅专家将根据预测波士顿房价项目的审阅标准来审阅你的项目。在提交项目之前,确保仔细阅读该审阅标准并对项目进行自我评估。必须满足该审阅标准中的所有规范条件,才能通过审阅。
审阅标准:https://review.udacity.com/#!/rubrics/268/view
提交文件
准备好提交项目后,收集以下文件并将它们压缩成一个文件以准备上传。此外,你可以在 GitHub Repo 上叫做 boston_housing
的文件夹中提供以下文件,以便我们能轻松访问你的文件:
boston_housing-zh.ipynb
notebook 文件,回答了所有问题,执行了所有代码单元格并显示输出。- 项目 notebook 的 HTML 导出文件,名称为 report.html。在提交项目以供评估时,必须包含此文件。
你可以使用工作区(在下一部分)直接提交项目以供审阅。在处理完 Jupyter notebook 后,记得向工作区上传 HTML 报告,然后再提交报告。
收集好这些文件并阅读项目审阅标准后,转到项目提交页面。