pandas 总结

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/sinat_22659021/article/details/80881879

read_table 函数:

    功能: 从文件、url、文件型对象中加载带分隔符的数据,默认为'\t'。(read_csv默认分隔符是逗号)

    可以通过制定sep 参数来修改默认分隔符。

    读取没有标题的文件时,默认为第一行作为列标题,列索引(即行的标题)为0开始的数字,设置header=None, 则列索引也     变为0开始的数字,通过names=['a','b','c']可以自己设置列标题。

    通过index_col可以设置列索引,默认使用0开始的整数为列索引。index_col的值是整数,代表第几列作为列索引。


获取行列的个数:

行:len(data.index), len(data)

列:len(data.columns)

或者直接data.shape

value_counts()计数: 对Series中出现的每个值进行计数并排序。

删除行和列:

两种方法:

df.drop(['B', 'C'], axis=1), 默认axis为0, 即默认删除行

或者使用df.drop(columns=['B', 'C']) inplace=True不加的话不会改变原数据


猜你喜欢

转载自blog.csdn.net/sinat_22659021/article/details/80881879