Python数据分析—数据框的简单操作

  本文是数据分析的第三课,教大家如何在python中对数据框进行简单操作,包括更改列名、显示某列中的部分字符、对某列的数值型数据进行取整等。
  


  
注意:本文采用的数据框 date_frame
  
在这里插入图片描述

  
  

1 更改列名

  
更改列名有两种方法。第一种方法:数据框的名字.columns = 新列名对应的列表。第二种方法:数据框的名字.rename(columns = {‘旧列名1’:‘新列名1’, ‘旧列名2’:‘新列名2’, …}),这种方法可以更改部分列名,也可以更改全部的列名。假设我想更改date_frame中的列名,可以在jupyter中输入如下代码:
  

date_frame.columns = ['学号', '姓名', '性别', '年龄', '身高']  #方法一

  
得到结果如下:
  
在这里插入图片描述  
  
也可以在jupyter中输入如下代码:
  

date_frame.rename(columns = {
    
    'ID':'学号', 'height':'身高'})  #方法二

  
得到结果如下:
  
在这里插入图片描述

  
  

2 显示某列中的部分字符

  
假设我要取班上所有同学的姓,可以在jupyter中运行如下语句:
  

date_frame.name.str[0:1]

  
得到结果如下:
  
在这里插入图片描述
  
其中.name表示要取的列,.str[0:1]表示取该列中每个字符的第一个字。如果要取每个同学的名字,可以在jupyter中运行如下语句:
  

date_frame.name.str[1:]

  
得到结果如下:
  
在这里插入图片描述
  

其中.name表示要取的列,.str[1:]表示取该列中第二个字符后的所有字符。同样的办法大家可以试试取学号的前几位,看看下面这个语句在jupyter中会得到什么结果:
  

date_frame.ID.str[2:5]

  
  

3 抽取某列的部分字符,加别的字符构成新列

  
假设我要把对应列中的姓+’同学‘两个字符构成数据框的新列,可以在jupyter中运行如下语句:
  

date_frame.name.str[0:1] + '同学'

  
得到结果如下:
  
在这里插入图片描述
  
可以把上述结果用如下语句保存到原数据框中。
  

date_frame['new_name'] = date_frame.name.str[0:1] + '同学'

  
得到结果如下:
  
在这里插入图片描述

  
  

4 对数值型的列取四舍五入

  
假设我要对身高数值取四舍五入到小数点后一位,可以在jupyter中运行如下语句:
  

date_frame.height.round(1)

  
得到结果如下:
  
在这里插入图片描述
  
其中.height表示要取的列,.round(1)表示四舍五入保留1位小数,括号中的数表示要保留的小数位数。特别的,如果括号里面的是负数,例如round(-1),表示四舍五入到10位,其它依此类推。至此,在python中对数据框进行简单操作已经完成,大家可以动手练习一下,思考一下还有没有别的数据框操作的方法。
  
你可能感兴趣:
用Python绘制皮卡丘
用Python绘制词云图
Python人脸识别—我的眼里只有你
Python画好看的星空图(唯美的背景)
用Python中的py2neo库操作neo4j,搭建关联图谱
Python浪漫表白源码合集(爱心、玫瑰花、照片墙、星空下的告白)

长按(扫一扫)识别上方二维码学习更多Python和建模知识,让你的学习和工作更出彩。

Guess you like

Origin blog.csdn.net/qq_32532663/article/details/110563301