pandas读取文件常用方法与参数

常用方法

df = pd.read_excel()
df = pd.read_csv()
df.to_csv()
df.to_excel()

header

header默认为0,表示第一行是表头,如果header设置为None表示没有表头

header也可以是其他整数n,表示n+1行是表头,并且前n行的数据并不会读取

header0
header1
header2
header-none

usecols

需要选择哪些列,默认None

  1. None,读取所有列
  2. int,读取第几列
  3. list,int列表,表示读取这个列表中的列
  4. string,excel的方式读取,例如:"A:F"表示A到F列,"A,D,E:H"表示A和D和E到H列

names

对读取的列重命名

也可以读取数据之后再重命名:

df = pd.read_csv('data.csv')
df.columns = ['A','B','C']

或者:

df = pd.read_csv('data.csv')
df.rename(columns = {
    
    'A':'AN','B':'BN','C':'CN'})

其他读取文件常用参数

sheet_name:读Excel的时候读取指定名称的表单,也可以是索引,默认0
index_col:指定索引列,int类型
nrows:读取哪些行
skiprows:跳过哪些行
keep_default_na:是否保留空值,默认True
dtype:设置列的类型,例如,{‘a’: np.float64, ‘b’: np.int32}

写文件的常用参数

float_format:写浮点数的格式,’%.0f’
columns:列名称
header:是否输出表头,默认True
index:是否输出索引,默认True

对于csv文件还可以设置:
sep:设置分隔符,默认","
mode:设置写入模式,默认"w"

对于Excel还可以设置:
sheet_name:表单名称,默认"Sheet1"

扫描二维码关注公众号,回复: 11743698 查看本文章

猜你喜欢

转载自blog.csdn.net/trayvontang/article/details/103787535