【Python数据分析-8】数据清洗与整理-字符串处理

字符串处理

首先导入所需要的模块

from pandas import DataFrame,Series
字符串方法

如下:

# 字符串方法
df_1=DataFrame(['朱元璋.男','李世民.男','武则天.女','阴丽华.女','刘协.男'],columns=['name'])
print(df_1)
print('*'*30)
obj_1=df_1['name'].apply(lambda x:Series([x[:x.find('.')],x[x.find('.')+1:]]))
print(obj_1)
print('*'*30)

# pandas中字段的str属性可以轻松调用字符串的方法
df_2=df_1['name'].str.split('.')
print(df_2)
print('*'*30)
df_1['name_1']=df_2.str[0]
df_1['sex']=df_2.str[1]
print(df_1)
print('*'*30)

运行结果:
在这里插入图片描述

正则表达式
df_3=DataFrame({
    'unicode_com':['ue234$.com','ueas3¥.com','ue56h¥.com']
})
print(df_3)
str_1=df_3['unicode_com'].str.findall(r'(.{5})[¥,$]')
print(str_1)
print('*'*30)
df_3['unicode']=str_1.str.get(0)
print(df_3)

在这里插入图片描述

发布了51 篇原创文章 · 获赞 299 · 访问量 9193

猜你喜欢

转载自blog.csdn.net/qq_45404396/article/details/104310412
今日推荐