字符串类型数据预处理的一个简单小方法 - 代码天地

字符串类型数据预处理的一个简单小方法

其他 2018-11-02 11:48:35 阅读次数: 0

今天开始试着去做kaggle上的入门竞赛House Prices，因为数据集有81列，即81个特征，一列一列处理数据很头疼，于是想自己写几个方法
先写了一个简单的，可以自动把字符串类型的特征按数字顺序编码，如果数据中含有NAN或空元素就填入0，方便之后的处理
写出来之后发现运行效率很低，处理一列需要十秒，更头疼了……
还有就是弹出了SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame，是因为链式运算的问题，现在还不理解，先马一下。

def com(column):
    a = train[column].value_counts().index
    if train.isnull().any()[column]==True:
        train[column] = train[column].fillna(0)
    for i in range(0, train.shape[0]):
        if train[column][i] != 0:
            train[column][i] = list(a).index(train[column][i]) + 1

在这里插入图片描述
Neighborhood这列按如下编码：

猜你喜欢

转载自blog.csdn.net/Ramer42/article/details/83242467

字符串类型数据预处理的一个简单小方法

JAVA写一个简单的泛型方法比较Stirng、StringBuffer、StringBuilder处理字符串效率

LeetCode 2698. 求一个整数的惩罚数【字符串,回溯,预处理,打表】1678

67. Add Binary(字符串补0预处理，数据类型的转换)

String常用方法之String.valueOf(x)是一个将各种类型的数据转换为字符串类型的静态方法

写一个给字符串根据长度添加换行符的处理方法

一个简单而精彩的方法获取中文字符串长度

怎样判断一个char类型的字符串与一个string类型的字符串是否相等

Java 字符串类型数据的一些处理

一个对字符串处理的SQL

一个处理字符串的工具类StringEscapeUtils

编写一个方法，求字符串长度~~~

数据类型之字符串字符串格式化及字符串的一些方法

java 判断一个字符串是数字类型还是字符类型

关闭Tomcat的一个小方法

一个简单的类型转换实现：C++中字符串String类型转换成整型int类型

利用Pandas进行数据预处理的一个简单小案例

写一个方法，传入字符串，字符串日期添加10天，并返回一个字符串

字符串中的第一个唯一字符---简单

第一个只出现一次的字符(简单，字符串)

平常遇到的问题——char类型的指针和数组表示的字符串，怎么把字符串指针的字符串一个个输出

从键盘输入任意一个String类型的字符串将其进行字符串反串

视频怎么去除水印？教你一个简单的小方法！

上述getword函数不能正确处理下划线、字符串常量、注释及预处理器控制指令。请编写一个更完善的getword函数

ES 6中判断字符串是否为子串的一个方法

简单IO,将一段字符串存入一个记事本

JQ 删除字符串最后一个或几个字符的方法

java删除字符串最后一个字符的几种方法

oracle 中创建一个字符串数组类型的语句

括号匹配深度，交错01字符串（一个类型代码）

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)