【NumPy】数组的维度变换在DL|ML数据集处理时的妙用

编程语言 2023-01-29 03:00:02 阅读次数: 0

记录

近日老师布置的作业中提供了一个csv文件，里面有59列，其中前面58个是数据的属性，也就是决定该某个该数据数据类别的58个变量，最后列是该数据的分类结果。比如：同样的数字手写体“1”和“8”，他们的属性就是形状、粗细等，类别就是对应的1, 8。

但是当我读取完数据并且划分好了数据集，打印出训练集的shape是这样的：（28,2760）——（数据维度+数据数量）很明显这是错误的，那么该如何解决呢？

【NumPy】数组的维度变换在DL|ML数据集处理时的妙用

np,swapaxes——交换维度！

正文

众所皆知：对于投喂给模型(fit操作)的X（数据），Y（标签）中的X，不论是深度学习还是机器学习格式都是这样的：第一个维度都是数量，后面的维度是数据的维度，也就是数据数量+数据维度的格式。

比如：Mnist数据中的X.shape=(70000, 28, 28）正是说有7W个（28,28）的数据，所以毫无疑问我的数据集X必须是（2760,28）——（数据数量+数据维度）而不是(28, 2760）——（数据维度+数据数量）。

最后有一点差点忘记讲的是：数据集一般都是np.array的格式。

np,swapaxes——交换维度！

这个时候就终于轮到我们的正主：np,swapaxes登场啦!

方法	说明
numpy.swapaxes(array,ax1,ax2)	将数组array的维度ax1和维度ax2的数据进行调换

刚刚我们提到，现在的数据是（数据维度+数据数量），而我的数据维度毫无疑问只是简单的1，所以说解决的办法显而易见：交换数据集维度1和维度0！

那我们该如何去做呢？第一反可能会是用for循环之类的暴力交换，实际上，我们不需要这么麻烦，我也是想到了numpy的作者考虑到了维度交换的问题，会有这样一个函数，一查果然有！所以我们只需要在处理完数据集后对x_trian和x_test做以下操作：

x_train = np.swapaxes(x_train, 0, 1)
x_test = np.swapaxes(x_test, 0, 1)

便可以达到我们的目的。

当然还有一种特别的情况: 就是我们的数据集是一维的，这个样子就更简单了，我们只需要：

x_train = x_train.reshape(-1,1)

除此之外，还有一些函数也会起到作用，在此处一一列出来，供大家参考使用！

猜你喜欢

转载自blog.csdn.net/qq_51831335/article/details/127595006

【NumPy】数组的维度变换在DL|ML数据集处理时的妙用

numpy三维数组维度变换/提取

Python NumPy ndarray 数组的维度变换拼接拆分

numpy数据集处理

numpy的数组维度问题

Numpy中的数组维度

判断numpy数组的维度

python—transpose( ) 处理高维度数组的轴变换

【七天入门ML与DL-01】加载sklearn自带的数据集数据集划分

pytorch 数据维度变换

Numpy入门-数据的维度

Numpy：数据的维度

3.2Python数据处理篇之Numpy系列(二)--- ndarray数组的创建与变换

python】numpy库ndarray多维数组的维度变换方法：reshape、resize、swapaxes、flatten

使用numpy解决图像维度变换问题

numpy 数组维度，形状，大小

numpy 数组维度操作汇总

numpy 数组的形状与维度 200309

numpy 修改数组维度

numpy 数组维度大小形状

Numpy给数组增加维度的操作

numpy数组——数据处理

使用NumPy处理数组数据

Data Set：ML/DL常用数据集大集合(持续更新)

使用catboost解决ML中高维度不平衡数据集挑战的解决方案

数组对象处理，根据两个维度处理数据

Python数据分析：numpy修改数组维度和连接数组

Numpy数组随机生成/维度增加/维度转换

numpy多维数组维度及添加轴的理解

python numpy--改变数组的维度

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)