如何用python实现哑变量的转换

在数据样本中有一类特征属性彼此是平行的关系,不能简单的以数值或字符赋予其含义。例如 职业:教师 工人 商人… 面对这种情况可以通过构建哑变量来解决。例如含有三个因子的特征可以将其转化为三列每列都只有0-1构成的向量。这样的向量就是哑变量。下面来看一下再python中的实现

import pandas as pd
 #dummy = pd.get_dummies(iris['Species'],prefix='species') #这里是对iris的Species列进行了哑变量变化,参数是prefix是对新生成列名的前缀
df=pd.DataFrame([[1,'a'],[2,'b'],[3,'c'],[1,'d'],[3,'e'],[2,'f']],columns=['lie1','lie2'])
print(df)
df1=pd.get_dummies(df['lie1'],prefix='lie1')
print(df1)

在这里插入图片描述

发布了23 篇原创文章 · 获赞 6 · 访问量 4680

猜你喜欢

转载自blog.csdn.net/qq_34211618/article/details/103709157