一个完整的机器学习项目——代码解析（一） - 代码天地

一个完整的机器学习项目——代码解析（一）

其他 2019-04-10 03:32:20 阅读次数: 0

版权声明：转载请联系博主、标明出处 https://blog.csdn.net/jyfbug/article/details/88862409

下载了《机器学习实战：基于Scikit-Learn和TensorFlow》，然后阅读，对里面的代码给出一点注释和解析，从头开始吧！
先学习第一个项目中的第一块（下载数据集）：
把自己加注释的代码放上：

import os
import tarfile
from six.moves import urllib
import pandas as pd

DOWNLOAD_ROOT = "https://raw.githubusercontent.com/ageron/handson-ml/master/"  #网站路径
HOUSING_PATH = "datasets/housing"   #存储路径
HOUSING_URL = DOWNLOAD_ROOT + HOUSING_PATH + "/housing.tgz" #文件名

def fetch_housing_data(housing_url = HOUSING_URL,housing_path = HOUSING_PATH):      #默认下载url和存储路径
    if not os.path.isdir(housing_path):   #如果不存在当前路径文件夹
        os.makedirs(housing_path)          #创建路径文件夹
    tgz_path = os.path.join(housing_path,"housing.tgz")   #连接路径，最终tgz_path为"datasets/housing/housing.tgz"
    urllib.request.urlretrieve(housing_url,tgz_path)   #下载到本地
    housing_tgz = tarfile.open(tgz_path)            #打开压缩包
    housing_tgz.extractall(path=housing_path)       #解压到路径
    housing_tgz.close()                             #关闭压缩包

def load_housing_data(housing_path = HOUSING_PATH):
    csv_path = os.path.join(housing_path,"housing.csv")  #连接到csv的路径
    return pd.read_csv(csv_path)      #读取csv文件

下面放上每个函数的作用：

os.path.isdir():  判断某一路径是否为目录
os.makedirs():  用于递归创建目录(可以一次创建多个目录)
os.path.join():  连接两个或更多的路径名组件
urllib.request.urlretrieve(): 将URL表示的网络对象复制到本地文件
tarfile.open()、extractall()、close()： 三个函数配合解压文件
pd.read_csv():  读取csv文件

努力坚持更，希望能写完。。。

猜你喜欢

转载自blog.csdn.net/jyfbug/article/details/88862409

一个完整的机器学习项目——代码解析（一）

一个完整的机器学习项目——代码解析（二）

一个完整的机器学习项目

二、一个完整的机器学习项目

机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)

机器学习项目入门篇：一个完整的机器学习项目

一个完整的机器学习目录

机器学习笔记（三）：一个完整的机器学习项目

一个完整的机器学习项目在Python中的演练（一）

（原创）一个完整的机器学习项目是怎么建立起来的

BAT面试题精选 | 一个完整机器学习项目的流程（视频）

简要说说一个完整机器学习项目的流程

二、《Hands-On Machine Learning with Scikit-Learn and TensorFlow》一个完整的机器学习项目

Hands on Machine Learning with sklearn and TensorFlow —— 一个完整的机器学习项目（加州房地产）

一个完整机器学习项目的基本流程

chapter2 一个完整的机器学习项目实战

手把手带你建立一个完整的机器学习项目

一个完整机器学习项目的流程-ML EveryDay

[Hands On ML] 2. 一个完整的机器学习项目

一个机器学习项目流程

sklearn&Tensorflow机器学习02 ---用一个完整的项目来进行机器学习入门

Scikit-Learn & TensorFlow机器学习实用指南(二)：一个完整的机器学习项目【上】

Scikit-Learn&TensorFlow机器学习实用指南(三)：一个完整的机器学习项目【下】

如何完整地掌握一个机器学习模型

【100天精通Python】Day76：Python机器学习-第一个机器学习小项目_鸾尾花分类项目，预测与可视化完整代码（下）

从头到尾学习一个完整 SLAM 项目

一个完整的URL 解析过程

搭建一个完整的javaweb项目

一个完整的Vue项目

一个完整的项目管理流程

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)