一个完整的机器学习项目——代码解析（二） - 代码天地

一个完整的机器学习项目——代码解析（二）

其他 2019-04-10 03:31:05 阅读次数: 0

版权声明：转载请联系博主、标明出处 https://blog.csdn.net/jyfbug/article/details/88958936

基于《机器学习实战：基于Scikit-Learn和TensorFlow》
今天完成第二次代码解析，包括数据分析、绘图和创建测试集
1、数据分析

housing = load_housing_data()
print(housing.head())
print(housing.info())

函数作用：

head():方法查看该数据集的前5行
info():快速查看数据的描述，特别是总行数、每个属性的类型和非空值的数量

2、绘图

import matplotlib.pyplot as plt
housing.hist(bins=50,figsize=(20,15))
plt.show()

函数作用：

hist()绘制直方图
bins是指直方图的总个数，个数越多，条形带越紧密 figsize是设置大小

3、创建测试集

import numpy as np

def split_train_test(data,test_ratio):
    shuffled_indices = np.random.permutation(len(data)) #随机排列一个序列
    test_set_size = int(len(data) * test_ratio)         #测试集大小
    test_indices = shuffled_indices[:test_set_size]     #前面的test_set_size个为测试集
    train_indices = shuffled_indices[test_set_size:]    #后面的test_set_size个为训练集
    return data.iloc[train_indices],data.iloc[test_indices]  #返回训练集、测试集

train_set,test_set = split_train_test(housing,0.2)
print(len(train_set),"train+",len(test_set),"test")

函数作用：

np.random.permutation() ：随机排列一个序列
[:x]：选取数组前x个
[x:]：选区数组后x个
iloc：主要是通过行号获取行数据

今天就到这里，继续加油欧！

猜你喜欢

转载自blog.csdn.net/jyfbug/article/details/88958936

一个完整的机器学习项目——代码解析（二）

一个完整的机器学习项目——代码解析（一）

二、一个完整的机器学习项目

一个完整的机器学习项目

二、《Hands-On Machine Learning with Scikit-Learn and TensorFlow》一个完整的机器学习项目

Scikit-Learn & TensorFlow机器学习实用指南(二)：一个完整的机器学习项目【上】

机器学习项目入门篇：一个完整的机器学习项目

机器学习入门系列(2)--如何构建一个完整的机器学习项目(一)

一个完整的机器学习目录

机器学习笔记（三）：一个完整的机器学习项目

一个完整的机器学习项目在Python中的演练（一）

（原创）一个完整的机器学习项目是怎么建立起来的

BAT面试题精选 | 一个完整机器学习项目的流程（视频）

简要说说一个完整机器学习项目的流程

一个完整机器学习项目的基本流程

Hands on Machine Learning with sklearn and TensorFlow —— 一个完整的机器学习项目（加州房地产）

chapter2 一个完整的机器学习项目实战

手把手带你建立一个完整的机器学习项目

一个完整机器学习项目的流程-ML EveryDay

[Hands On ML] 2. 一个完整的机器学习项目

sklearn&Tensorflow机器学习02 ---用一个完整的项目来进行机器学习入门

Scikit-Learn&TensorFlow机器学习实用指南(三)：一个完整的机器学习项目【下】

一个机器学习项目流程

【100天精通Python】Day76：Python机器学习-第一个机器学习小项目_鸾尾花分类项目，预测与可视化完整代码（下）

如何完整地掌握一个机器学习模型

完成一个springboot项目的完整总结-------二

Intellij Idea 搭建一个完整的JavaWeb项目（二）

从头到尾学习一个完整 SLAM 项目

一个完整的URL 解析过程

flutter学习二：亲测实现官网构建布局第一个例子完整代码

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)