Python数据分析—数据更新

在对海量数据进行分析的过程中,可能需要增加行和列,也可能会删除一些行和列。今天教大家如何在python中对数据框进行一些更新操作。

  


  
注意:本文采用的数据框 date_frame
  
在这里插入图片描述

  
  

1 在数据框最后追加一行

  
假设要在原数据框中增加一行,可先定义该行对应的字典,具体语句如下:
  

new_row = {
    
    'ID':['1000009'],
           'name':['唐诗诗'],
           'gender':['女'],
           'age':[21],
           'height':[1.68]
          }

  
注意:格式要和原数据框一致。把新增行用append函数追加到原数据框中去,具体语句如下:
  

new_row1 = pd.DataFrame(new_row)  
date_frame.append(new_row1)

  
得到结果如下:
  
在这里插入图片描述
  
  

2 在数据框中插入一列

  
既然可以在数据框中加入行,那么也可以在数据框中加入列。可以用insert函数在数据框中任意位置加入一列。比如我想在数据框的第一列插入新的列,可以在python中运行如下语句:
  

date_frame.insert(0, 'calss', ['class1','class1','class1','class1','class2','class2','class2','class2','class2'])

  
得到结果如下:
  
在这里插入图片描述
  
其中,.insert中的0表示新插入列所在的位置,'calss'表示新加列名称,['class1',...,'class2']表示新加列的内容,注意新加列要和原数据框的长度一致。既然可以在数据框中加入行和列,那么也可以在数据框中删除行和列。首先来看下在数据框中删除行。
  
  

3 删除数据框中的行

  
可以用drop函数删除某一行,也可以删除多行。首先来看下删除第一行的具体代码:
  

date_frame.drop([0])

  
得到结果如下:
  
在这里插入图片描述
  
.drop([0])表示删除索引号为0(第一行)的行。要删除其它行可以把0改成对应行的索引号。接着来看下删除第一行和第五行的具体代码:
  

date_frame.drop([0,4])

  
得到结果如下:
  
在这里插入图片描述
  
.drop([0,4])表示删除索引号为0和4的行,实际代表第一行和第五行。需删除更多的行,可以参照删除两行的代码。
  
  

4 删除数据框中的列

  
同样可以用drop函数来删除列。首先来看下删除name列的具体代码:
  

date_frame.drop(columns = 'name')
date_frame.drop('name', axis = 1)  #axis = 1表示对列进行操作

  
得到结果如下:
在这里插入图片描述
  
如果想删除name列和gender列,可以输入如下代码:
  

date_frame.drop(columns = ['name','gender'])
date_frame.drop(['name','gender'], axis = 1)

  
得到结果如下:
在这里插入图片描述
  
删除多列的代码,同样可以参照删除两列的代码。
  
  

5 删除满足某种条件的行

  
假设要删除所有年龄大于18岁的记录,可以在python中输入如下语句:
  

date_frame.drop(index = (date_frame.loc[(date_frame.age>18)].index))

  
得到结果如下:
  
在这里插入图片描述
  
其中,.loc[(date_frame.age>18)].index表示取年龄大于18的索引。至此,在python中对数据框进行更改操作已介绍完毕,大家可以动手练习一下,思考一下还可不可以对数据框进行别的操作。
  
你可能感兴趣:
用Python绘制皮卡丘
用Python绘制词云图
Python人脸识别—我的眼里只有你
Python画好看的星空图(唯美的背景)
用Python中的py2neo库操作neo4j,搭建关联图谱
Python浪漫表白源码合集(爱心、玫瑰花、照片墙、星空下的告白)

长按(扫一扫)识别上方二维码学习更多Python和建模知识,让你的学习和工作更出彩。

猜你喜欢

转载自blog.csdn.net/qq_32532663/article/details/110564045