超强图解Pandas

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

72eaec6c65f693fbd5748659c6a58a62.png

91f1f58f03e33345a318fefa5c894377.png

e22b9c2fb2d0528648c023fbb38ecd36.png

2064eb3a9b77e129a64d11d493a6f553.png

selecting a column

dogs['longevity']

730f046b7ef545cda6240a1c44ebe261.png

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

9b3c1f3e76d112b6cbafaad8adbc68d8.png

1b1fdcbb5e4f72c50aaa05b182581125.png

grouping multiple columns

dogs.groupby(['type', 'size'])

c56e0776441668039b0b6fe82a994f16.png

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

fb32c223bc84e61a88e8f4f8cda2df35.png

e95ab79c571fc085d75dd81e9ec24548.png

8da65480385c3b05550a7a221652502b.png

e742ae636560ba43811c5bd92c602354.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]

686d3424a70ab63ea1d89d2bd2ea0fae.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

42755d43295d91c72f0157fd2cea39a6.png

dropping columns

dogs.drop(columns=['type'])

59cb557aa29f8ec95e4735f46c931904.png

joining

ppl.join(dogs)

2ce51ed33bea1d3515d406b0ad832902.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

2be0f5529f191bd87489c9fdbabb3785.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')

ea1c720e998566d6dcd46305a14ae895.png

melting

dogs.melt()

b2957225e43a649b3fd76ab5342cba61.png

pivoting

dogs.pivot(index='size', columns='kids')

04f577390e897df2d90c3b0c7f67f9a8.png

stacking column index

dogs.stack()

8b2684dbe93bfc939ef49d0cd6c8ed23.png

unstacking row index

dogs.unstack()

f52ff5d270236888f35147917b322779.png

resetting index

dogs.reset_index()

22eae049dcfe4ce6881c74fffaa9615c.png

setting index

dogs.set_index('breed')

ba0a4902ecbd8b71cbb6e8fc50aaba83.png

文章原文:https://pandastutor.com/index.html

推荐阅读:

我的2022届互联网校招分享

我的2021总结

浅谈算法岗和开发岗的区别

互联网校招研发薪资汇总
2022届互联网求职现状,金9银10快变成铜9铁10!!

公众号:AI蜗牛车

保持谦逊、保持自律、保持进步

发送【蜗牛】获取一份《手把手AI项目》(AI蜗牛车著)
发送【1222】获取一份不错的leetcode刷题笔记

发送【AI四大名著】获取四本经典AI电子书

猜你喜欢

转载自blog.csdn.net/qq_33431368/article/details/125108845