《Python机器学习基础教程》第二章笔记：用于多分类的线性模型-三分类数据集

其他 2020-06-22 12:01:04 阅读次数: 0

《Python机器学习基础教程》第二章笔记：用于多分类的线性模型-三分类数据集

一、疑问
二、理解

一、疑问

第一个数据集的可视化：

from sklearn.linear_model import LogisticRegression
from sklearn.svm import LinearSVC
import mglearn
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split

X, y = mglearn.datasets.make_forge()
print(y)

fig, axes = plt.subplots(1, 2, figsize=(10, 3))

for model, ax in zip([LinearSVC(), LogisticRegression()], axes):
clf = model.fit(X, y)

mglearn.plots.plot_2d_separator(clf, X, fill=False, eps=0.5,
                                ax=ax, alpha=.7)#画线的命令
mglearn.discrete_scatter(X[:, 0], X[:, 1], y, ax=ax)#画点的命令
ax.set_title(clf.__class__.__name__)
ax.set_xlabel("Feature 0")
ax.set_ylabel("Feature 1")
axes[0].legend()
plt.show()

其实就是45页的图2-15的Logistic回归
在这里插入图片描述

第二个数据集的可视化：

from sklearn.datasets import make_blobs
import mglearn
from matplotlib import pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.svm import LinearSVC


X, y = make_blobs(random_state=42)#random_state=42报持随机一致

mglearn.discrete_scatter(X[:, 0], X[:, 1], y)
#plt.scatter(X[:, 0], X[:, 1], y)#这也是两个数据集
plt.xlabel("Feature 0")
plt.ylabel("Feature 1")
plt.legend(["Class 0", "Class 1", "Class 2"])
plt.show()

就是50页图2-19：
在这里插入图片描述

问题：

都是：mglearn.discrete_scatter(X[:, 0], X[:, 1], y)

问什么一个是两类一个是三类

为此还专门对第二个数据集利用matplotlib进行可视化，发现确实是两个数据，
在这里插入图片描述

应该一样啊！为什么第二个数据集会有三类

二、理解

命令行中X为二维数据集因而[:, 0]第一列# 输入X第0列和第1列作为x轴,将y作为y轴，纯数据上来说是应该与matplotlib进行可视化一样只有两类，

但是mglearn绘图并不是xy绘图，即y不是x的值，y就是类别本身

第一个数据集只有两类是因为y值只有0、1
例如第一个数据集的y
在这里插入图片描述

第二个数据集的y
在这里插入图片描述

这个0、1、2就像鸢尾花数据集中的[‘target’]一样只是一个类别代数

猜你喜欢

转载自blog.csdn.net/python__reported/article/details/106843771

《Python机器学习基础教程》第二章笔记：用于多分类的线性模型-三分类数据集

《Python机器学习基础教程》第二章笔记：random_state的作用

最新版学习笔记---Python机器学习基础教程（4）线性模型（分类）---附完整代码

《Python机器学习》笔记---第二章：机器学习分类算法

机器学习——鸢尾花数据集的线性多分类

第二章-2.1分类问题的提出

《Python机器学习基础教程》第二章笔记:ValueError: cannot reshape array of size 4000000 into shape (1000,1000)

SQL基础教程第二章笔记

【机器学习】第二章：K近邻（分类）

吴恩达机器学习（三）逻辑回归 1/2 —— 二分类与多分类

机器学习之深度学习二分类、多分类、多标签分类、多任务分类

使用机器学习和深度学习对PE进行二分类和多分类

Python数据分析基础教程：NumPy学习指南第二章常用函数

吴恩达机器学习（四）逻辑回归（二分类与多分类）

【机器学习详解】SVM解二分类,多分类,及后验概率输出

【机器学习】：利用二分类解决多分类

《机器学习_03_二分类转多分类的一般实现》

python基础教程读书笔记--第二章列表和元祖

python基础教程第二章数据类型

python机器学习基础教程-鸢尾花分类

Python机器学习基础教程鸢尾花分类

二分类、多分类

keras学习笔记----简单的两个小例子（多分类与二分类）

01-二分类-多分类学习笔记

【机器学习】SVM支持向量机在手写体数据集上进行二分类、采⽤ hinge loss 和 cross-entropy loss 的线性分类模型分析和对比、网格搜索

小白学习机器学习---第三章(3)：二分类LDA的python实现

[斯坦福大学2014机器学习教程笔记]第二章-模型描述

最新版学习笔记---Python机器学习基础教程（5）朴素贝叶斯分类模型---附完整代码

[DataAnalysis]机器学习中如何用二分类学习器解决多分类问题

使用感知机进行二类分类的线性分类模型测试（minst数据集）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)