版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Norsaa/article/details/77618771
打开数据文件
read_csv | 从文件,URL、文件型对象中加载带分隔符数据,默认分隔符为逗号,输出为字典集 | 1:需要确定文件的路径,格式,数据分隔符,有无列标题,编码格式,该方式只能适用于打开数据文件 ratings=pd.read_csv( '/user/u.data', #路径及文件名 sep='\t', #使用的分隔符 names=r_cols, #设置列标题,r_cols提前命名好了 index_col='name' #设置索引列 encoding='ISO-8859-1') #编码方式,在源网站可以查到 注: 参数na_values 可以替换缺失值, 如 na_values=['null'] 参数nrows可以规定读出的行的数量,如 nrows=5 |
to_csv | 存储数据文件 | 需要存储的文件名.to_csv('存储的文件路径及文件名.csv', sep='|', #指定分隔符,默认为逗号 na_rep='null', #规定缺失值的输出结果,默认为空字符串 headers=False, #列标签是否保存,默认为保存 cols=['列名','列名']) #制定要保存的列,默认为全部列 |