新手数据分析看这篇就足够了----pandas库总结

数据结构很重要的哇,不过这里简述一下就ok了, (嘿嘿)

下面我们开整

原理:pandas库是基于NUMPY库开发的,所以基本的对narray数组的操作在pandas库中也是可行的,如索引,切片,四则运算

1.数据结构
Serise(一维数据, 通过index索引)和DataFrame(二维数据, 通过行列进行访问, 可以是行列名,也可以是数字下标(0开始)
Serise

DATAFRAME

2.那些常遇到的问题

  • 2.1我的DataFrame中有些列数据没有用?我想抽取几列重新形成一个新的DataFrame

  • 这样搞:

  • 用colums参数指定你想要的就可以了

  • 2.2我想要取到特殊行和列的数据?

  • 采集行的数据就直接指定index的值,比如可以这样

  • 指定一行

  • gg

  • 指定多行

  • ff

  • 采集到列,可以这样:

  • 列名作索引

  • 列名

  • 列名作属性

  • 列名

  • 2.3 JSON数据读取不了怎么办?(本人亲自遇到, md, 超级难受

  • JSON文件中的数据进常不是列表形式,这时就要转化成列表,这叫规范化,哎,我也不懂

  • 最简单的加个列表符:[json]

  • 或者

  •   ![hh](https://img-blog.csdnimg.cn/84adedc8817d45c580191bca8c2ea248.png)
    

最后pandas数据处理还涉及一些数据处理
比如下面
在这里插入图片描述
这些都可以在pandas官方文档中找到啊,大家可以详细去了解!

## 最后,好久没写了,这次下定决心定期写blog了,大家觉得有帮助,喜欢的话,记得点赞!

猜你喜欢

转载自blog.csdn.net/m0_56022510/article/details/125881320