pandas中创建多级索引的方法 - 代码天地

pandas中创建多级索引的方法

编程语言 2018-11-03 16:33:34 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/HQ1356466973/article/details/83588993

（1）方法一：使用pandas.MultiIndex.from_arrays()

In [25]: pd.MultiIndex.from_arrays([['a', 'a', 'b', 'b'],[1, 2, 1, 2]])
Out[25]:
MultiIndex(levels=[['a', 'b'], [1, 2]],
           labels=[[0, 0, 1, 1], [0, 1, 0, 1]])

上例中，多级索引的对应关系是：

通俗的说就是a1，a2和b1，b2。

（2）方法2：使用pd.MultiIndex.from_tuples()

In [26]: pd.MultiIndex.from_tuples([('a', 1),('a', 2),('b', 1),('b', 2)])
Out[26]:
MultiIndex(levels=[['a', 'b'], [1, 2]],
           labels=[[0, 0, 1, 1], [0, 1, 0, 1]])

（3）上面两种方法都很烦，最简单的方法是使用笛卡尔乘积：pd.MultiIndex.from_product()

In [27]: pd.MultiIndex.from_product([['a', 'b'], [1, 2]])
Out[27]:
MultiIndex(levels=[['a', 'b'], [1, 2]],
           labels=[[0, 0, 1, 1], [0, 1, 0, 1]])

还可以为创建的索引指定名称

In [28]: pop
Out[28]:
广东  2017    3387964
    2018     658964
广西  2017     458752
    2018     698256
湖南  2017     125874
    2018     658963
dtype: int64

In [29]: pop.index.names = [ '省份','年份']

In [30]: pop
Out[30]:
省份  年份
广东  2017    3387964
    2018     658964
广西  2017     458752
    2018     698256
湖南  2017     125874
    2018     658963
dtype: int64

既然行索引可以有多级的，那么，自然而然地，列也有多级索引。下面我们创建一个多行多列的索引。举例如下：

In [33]: index = pd.MultiIndex.from_product([['广东', '广西'], [2017, 2018]], n
    ...: ames=['province', 'year'])

In [34]: column = pd.MultiIndex.from_product([['IT行业','制造业'], ['软件','硬
    ...: 件']], names=['行业', '岗位'])

我们模拟一组数据：

In [41]: data = np.random.randint(100,2000,size=(4,4))
In [42]: industry_data = pd.DataFrame(data, index=index,colum

In [43]: industry_data
Out[43]:
行业             IT行业         制造业
岗位               软件    硬件    软件    硬件
province year
广东     2017     1632     847    200     1495
         2018     176     1179    718     973
广西     2017     1995     1973   1096     1111
         2018     1209     668    1128     1330

多级索引的切片与普通索引类似。下载我们再讲。

猜你喜欢

转载自blog.csdn.net/HQ1356466973/article/details/83588993

pandas中创建多级索引的方法

pandas中Series的多级索引

Python: pandas中多级索引的高级操作讲解

pandas多级目录的层次索引

pandas pivot_table数据透视表、MultiIndex多级索引创建

python中pandas.DataFrame的简单操作方法（创建、索引、增添与删除）

python中pandas.DataFrame（创建、索引、增添与删除）的简单操作方法介绍

pandas中的多级index操作

Pandas详解十三之多级索引MultiIndex（层次化索引）

pandas中Series数组创建方法

Pandas索引方法介绍

Pandas中DataFrame索引

pandas —Series创建和索引

Pandas Series的创建和索引

idea中创建多级目录和多级包

Pandas索引操作及高级索引——reindex()方法

Pandas的Series类型的介绍及常见的Series创建、索引、切片、修改的使用方法

pandas中dataframe的索引问题

pandas入门（二）————DataFrame的创建和索引

pandas 19 - 分层索引创建（MultiIndex）( tcy)

03 -1 pandas 中 DataFrame理解与创建、索引、运算的详解以及实例

索引创建方法

创建索引的方法

MySql 创建索引方法

hive中的索引创建

Matlab中访问部分元胞的多级索引

pandas中的.update()方法

Pandas:DataFrame数据选择方法（索引）

7-Pandas之索引调整方法

pandas层次化索引 ---- 创建多层行索引、多层索引对象的索引与切片操作

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)