本文是数据分析的第三课,教大家如何在python中对数据框进行简单操作,包括更改列名、显示某列中的部分字符、对某列的数值型数据进行取整等。
注意:本文采用的数据框
date_frame
:
1 更改列名
更改列名有两种方法。第一种方法:数据框的名字.columns = 新列名对应的列表。第二种方法:数据框的名字.rename(columns = {‘旧列名1’:‘新列名1’, ‘旧列名2’:‘新列名2’, …}),这种方法可以更改部分列名,也可以更改全部的列名。假设我想更改date_frame中的列名,可以在jupyter中输入如下代码:
date_frame.columns = ['学号', '姓名', '性别', '年龄', '身高'] #方法一
得到结果如下:
也可以在jupyter中输入如下代码:
date_frame.rename(columns = {
'ID':'学号', 'height':'身高'}) #方法二
得到结果如下:
2 显示某列中的部分字符
假设我要取班上所有同学的姓,可以在jupyter中运行如下语句:
date_frame.name.str[0:1]
得到结果如下:
其中.name表示要取的列,.str[0:1]表示取该列中每个字符的第一个字。如果要取每个同学的名字,可以在jupyter中运行如下语句:
date_frame.name.str[1:]
得到结果如下:
其中.name表示要取的列,.str[1:]表示取该列中第二个字符后的所有字符。同样的办法大家可以试试取学号的前几位,看看下面这个语句在jupyter中会得到什么结果:
date_frame.ID.str[2:5]
3 抽取某列的部分字符,加别的字符构成新列
假设我要把对应列中的姓+’同学‘两个字符构成数据框的新列,可以在jupyter中运行如下语句:
date_frame.name.str[0:1] + '同学'
得到结果如下:
可以把上述结果用如下语句保存到原数据框中。
date_frame['new_name'] = date_frame.name.str[0:1] + '同学'
得到结果如下:
4 对数值型的列取四舍五入
假设我要对身高数值取四舍五入到小数点后一位,可以在jupyter中运行如下语句:
date_frame.height.round(1)
得到结果如下:
其中.height表示要取的列,.round(1)表示四舍五入保留1位小数,括号中的数表示要保留的小数位数。特别的,如果括号里面的是负数,例如round(-1),表示四舍五入到10位,其它依此类推。至此,在python中对数据框进行简单操作已经完成,大家可以动手练习一下,思考一下还有没有别的数据框操作的方法。
你可能感兴趣:
用Python绘制皮卡丘
用Python绘制词云图
Python人脸识别—我的眼里只有你
Python画好看的星空图(唯美的背景)
用Python中的py2neo库操作neo4j,搭建关联图谱
Python浪漫表白源码合集(爱心、玫瑰花、照片墙、星空下的告白)