字符串处理
首先导入所需要的模块
from pandas import DataFrame,Series
字符串方法
如下:
# 字符串方法
df_1=DataFrame(['朱元璋.男','李世民.男','武则天.女','阴丽华.女','刘协.男'],columns=['name'])
print(df_1)
print('*'*30)
obj_1=df_1['name'].apply(lambda x:Series([x[:x.find('.')],x[x.find('.')+1:]]))
print(obj_1)
print('*'*30)
# pandas中字段的str属性可以轻松调用字符串的方法
df_2=df_1['name'].str.split('.')
print(df_2)
print('*'*30)
df_1['name_1']=df_2.str[0]
df_1['sex']=df_2.str[1]
print(df_1)
print('*'*30)
运行结果:
正则表达式
df_3=DataFrame({
'unicode_com':['ue234$.com','ueas3¥.com','ue56h¥.com']
})
print(df_3)
str_1=df_3['unicode_com'].str.findall(r'(.{5})[¥,$]')
print(str_1)
print('*'*30)
df_3['unicode']=str_1.str.get(0)
print(df_3)