Python基础——csv文件中某列数据替换为数字

csv文件中某列数据替换为数字

来源——机器学习读取数据
在这里插入图片描述

方法一:正则表达式,replace()

import pandas as pd
data = pd.read_csv("data2.csv")
print(data)
#      用户编号   性别   年龄(岁)   年收入(元)  是否购买
# 0   15624510    Male     19         19000       0
# 1   15810944    Male     35         20000       0
# 2   15668575  Female     26         43000       0
# 3   15603246  Female     27         57000       0
# 方法一:replace
data.replace("Male",1,inplace=True)
data.replace("Female",2,inplace=True)
print(data)
#      用户编号   性别   年龄(岁)   年收入(元)  是否购买
# 0   15624510      1     19         19000         0
# 1   15810944      1     35         20000         0
# 2   15668575      2     26         43000         0
# 3   15603246      2     27         57000         0

方法二:map()

import pandas as pd
data = pd.read_csv("data2.csv")
gender = {'Male':1,'Female':2}
data["性别"] = data["性别"].map(gender)
print(data)
#      用户编号    性别   年龄(岁)   年收入(元)  是否购买
# 0   15624510      1     19         19000         0
# 1   15810944      1     35         20000         0
# 2   15668575      2     26         43000         0
# 3   15603246      2     27         57000         0

另补充:方法二是在原有的基础上直接将csv表格中的数据更改,若需要生成一列新的数据,则有:
在这里插入图片描述

发布了27 篇原创文章 · 获赞 7 · 访问量 2109

猜你喜欢

转载自blog.csdn.net/lucky_shi/article/details/105321426