数据规整化——字符串操作

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Jakob_Hu/article/details/88807597

回顾Python内置的字符串方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

1)strip方法和split方法

在这里插入图片描述

2)join方法

在这里插入图片描述

3)in判断、index方法、find方法

在这里插入图片描述
在这里插入图片描述
index方法与 find方法的区别是,如果找不到字符串,index方法会报错,而find方法会返回一个异常。

4)count方法

在这里插入图片描述

5)replace方法

在这里插入图片描述

Python正则表达式

在这里插入图片描述
正则表达式参见博客单独的笔记。

pandas矢量化字符串方法

在这里插入图片描述
这些方法都是元素级的方法,且可以有效避免缺失值造成的程序运行错误。虽然一般的map或者applymap方法也能针对Series和Dataframe进行元素级操作,但是一旦有缺失值出现,在没有设置异常处理的情况下,程序就会报错。
在这里插入图片描述
在这里插入图片描述
pandas对象的str属性可以调用这些字符串方法,
在这里插入图片描述
正则表达式也可以运用在pandas对象的字符串处理上,
在这里插入图片描述
矢量化获取元素的两种方法,
在这里插入图片描述
对Series而言,可以直接通过所以获取字符串的子串,
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/Jakob_Hu/article/details/88807597