Python3--我的代码库之Pandas库之DataFrame(二)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/c_air_c/article/details/81280953
import pandas as pd
import numpy as np

1.导入数据

df = pd.read_csv("outschool.csv",encoding = 'gbk')
df.head(5)
df = df.iloc[:,:8].head(116)
df.head(5) #查看前五条记录
日期 姓名 职业 工作单位 来馆目的 联系方式 身份证号 备注
0 2018年3月13日 宁俊 教师 A lokk 待填写 待填写 NaN
1 2018年3月16日 沈娟 教师 B view 待填写 待填写 NaN
2 2018年3月19日 于竹青 学生 A lokk 18811012345 1.30205E+17 NaN
3 2018年3月19日 赵巾豪 学生 B view 18811011720 1.52628E+17 NaN
4 2018年3月19日 王寅平 学生 A lokk 18811011721 11022719830225152X NaN
df.head() #查看前五条记录。default = 5
日期 姓名 职业 工作单位 来馆目的 联系方式 身份证号 备注
0 2018年3月13日 宁俊 教师 A lokk 待填写 待填写 NaN
1 2018年3月16日 沈娟 教师 B view 待填写 待填写 NaN
2 2018年3月19日 于竹青 学生 A lokk 18811012345 1.30205E+17 NaN
3 2018年3月19日 赵巾豪 学生 B view 18811011720 1.52628E+17 NaN
4 2018年3月19日 王寅平 学生 A lokk 18811011721 11022719830225152X NaN
df.tail() #查看最后五条记录,default = 5 
日期 姓名 职业 工作单位 来馆目的 联系方式 身份证号 备注
111 2018年7月26日 李子敬 个人 A view 18811011828 NaN 1人
112 2018年7月26日 吴上琳 个人 B lokk 18811011829 NaN 1人
113 2018年7月26日 刘甜甜 个人 B view 18811011830 NaN 1人
114 2018年7月26日 敬瑞 个人 A lokk 18811011831 NaN 1人
115 2018年7月26日 蒲佳 个人 B view 18811011832 NaN 1人
df.tail(3)
日期 姓名 职业 工作单位 来馆目的 联系方式 身份证号 备注
113 2018年7月26日 刘甜甜 个人 B view 18811011830 NaN 1人
114 2018年7月26日 敬瑞 个人 A lokk 18811011831 NaN 1人
115 2018年7月26日 蒲佳 个人 B view 18811011832 NaN 1人
df.index # 查看索引
RangeIndex(start=0, stop=116, step=1)
df.columns #查看各字段名称
Index([‘日期’, ‘姓名’, ‘职业’, ‘工作单位’, ‘来馆目的’, ‘联系方式’, ‘身份证号’, ‘备注’], dtype=’object’)
df.shape #查看数据表型号,116行数据,八个字段
(116, 8)
df['日期'].dtypes 
dtype(‘O’)
df['联系方式'].dtypes
dtype(‘O’)
df.fillna('空').head()
日期 姓名 职业 工作单位 来馆目的 联系方式 身份证号 备注
0 2018年3月13日 宁俊 教师 A lokk 待填写 待填写
1 2018年3月16日 沈娟 教师 B view 待填写 待填写
2 2018年3月19日 于竹青 学生 A lokk 18811012345 1.30205E+17
3 2018年3月19日 赵巾豪 学生 B view 18811011720 1.52628E+17
4 2018年3月19日 王寅平 学生 A lokk 18811011721 11022719830225152X
np.count_nonzero(df['日期'].unique())
54

猜你喜欢

转载自blog.csdn.net/c_air_c/article/details/81280953