python将csv表格的某列 用唯一的数字id表示

       data = pd.read_csv("学生信息与成绩数据.csv",encoding='gbk')  # 1 3 7 是 预测列
       data = data.fillna(0)
       # 选择需要转换为唯一数字ID的列

       # 使用 Pandas 的 factorize 函数将列转换为唯一的数字ID
       data['民族'] = pd.factorize(data['民族'])[0]
       data['父母教育程度'] = pd.factorize(data['父母教育程度'])[0]
       data['午餐'] = pd.factorize(data['午餐'])[0]
       data['课程完成情况'] = pd.factorize(data['课程完成情况'])[0]
       print(data.head())

猜你喜欢

转载自blog.csdn.net/qq_38735017/article/details/135296130