机器学习-类型特征转换1-of-k(哑编码)

功能:将非数值型的特征值(类别特征值)转换为数值型的数据
描述:假设变量的取值有K个,如果对这些值用1到K编序,则可用维度为K的向量来表示一个变量的值。在这个向量中,该取值所对应的序号所在的元素为1,其它元素均为0。
形如:A B C
1 2 3
则 A:1 0 0 所以AB之间的距离为√2
B:0 1 0 AC之间的距离为√2 因此,AB和AC之间的相似度是一样的。
C:0 0 1

猜你喜欢

转载自blog.csdn.net/Yangwenyi115615/article/details/89702949