Python DataFrame数据重排(重塑)，将数据的列旋转为行

其他 2020-04-07 17:32:47 阅读次数: 0

场景和模拟数据：

excel里有一份产品详情表，包含SKU编码、SKU名称、颜色和尺码，属性是按列排放的，但是部分SKU的属性是空的。这次的任务是把这份excel数据读到Python里面，并且要把属性转成按行排列，excel里面的原始数据形式和最终要转化成的dataframe形式如图所示。

处理过程：

每一步的处理可以参考注释理解。

import pandas as pd
# 读取excel文件，index_col=0，实现把第1列SKU设置为索引，后面就不用再写代码行：df = df.set_index(['SKU'])
df = pd.read_excel('D:/pyCharm2019.1/PythonProject/EverydayStudy/test.xlsx', sheet_name='Sheet1', index_col=0)
# stack将数据的列旋转为行(自动剔除null)，延申一下：unstack将数据的行旋转为列
df = df.stack()
# stack列转行后出现层次化索引
print('stack列转行后数据形式：', '\n', df.head())
# reset_index还原索引，把层次化索引变为默认的整型索引，层次化索引被还原成普通列
df = df.reset_index()
# 设置数据列名
df.columns = ['SKU', 'ATTRIBUTE', 'ATTRIBUTE_VALUE']
print('\n最终dataframe形式：', '\n',  df)

结果显示如下：

stack列转行后数据形式： 
 SKU       
A    NAME       aa
     COLOR     red
     SIZE        L
B    NAME       bb
     COLOR    blue
dtype: object

最终dataframe形式： 
    SKU ATTRIBUTE ATTRIBUTE_VALUE
0    A      NAME              aa
1    A     COLOR             red
2    A      SIZE               L
3    B      NAME              bb
4    B     COLOR            blue
5    B      SIZE               M
6    C      NAME              cc
7    C     COLOR           green
8    C      SIZE              XL
9    D      NAME              dd
10   D     COLOR           black
11   D      SIZE               S
12   E     COLOR             red
13   E      SIZE               L
14   F      NAME              ff
15   F      SIZE               M
16   G      NAME              gg
17   G     COLOR           green

如果你有更好的方法和技巧，请让我也了解学习下。

小步积

发布了34 篇原创文章 · 获赞 4 · 访问量 3374

私信关注

猜你喜欢

转载自blog.csdn.net/lvhuike/article/details/99694580

Python DataFrame数据重排(重塑)，将数据的列旋转为行

利用Python将数据库提取的数据转为DataFrame格式

python 将dataframe的某一列离散数据转换为数值数据

Python数据分析实战-依次遍历dataframe行和列（附源码和实现效果）

python的pandas中如何在dataframe中插入一行或一列数据？

【Python】dataframe列数据的修改(map函数)

python pymysql链接数据库查询结果转为Dataframe

运用python将数据转为refworks格式

python3将dict转为dataframe

python：DataFrame连续取前23列数据，或者连续取前2行数据，或者取某行某列数据

利用Python将dataframe格式的所有列的数据类型转换为分类数据类型

吴裕雄--天生自然python学习笔记：pandas模块用 dataframe.loc 通过行、列标题读取数据

python 列输出转为行输出

【Python】DataFrame按照规则批量修改某列的数据

python中Dataframe数据结构新加列

python对dataframe列内的数据处理 str

Python将DataFrame增加一列

python数据合并、重塑、移除

python数据处理——dataframe删除首行并修改index

【Python】DataFrame 查看数据

python将字典转换成dataframe数据框

利用Python将Json数据转为表格并写入Excel

Python 将Excel数据转为arxml格式示例代码

Python编程语言学习：将多个列表数据保存为dataframe格式数据并按照指定列进行降序排序之详细攻略

Python读取mysql数据，转为DataFrame格式并根据原TABLE中的COLUMNS指定columns，index

python pandas dataframe 的按列或者按行合并

Python取行和列数据及切片操作

【python pandas】数据框行转列，列转行

Python数据分析实战-将dataframe某一列的去重并统计去重后数量（附源码和实现效果）

Python数据处理分析（三）——分类统计，dataframe复制，每一行列数据计算，一列不同元素个数统计，matplotlib画饼图，以数学建模（2011 A）为例

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)