15.数据转换之字符串数据处理

  • pandas中提供了字符串的函数,但只对字符型变量进行使用
  • 通过str方法访问相关属性
  • 可以使用字符串的相关方法进行数据处理
函数名称 说明
contain() 返回表示各str是否含有指定模式的字符串
replace() 替换字符串
lower() 返回字符串的副本,其中所有字母都转换为小写
upper() 返回字符串的副本,其中所有字母都转换为大写
split() 返回字符串中的单词列表
strip() 删除前导和后置空格
join() 返回一个字符串,该字符串是给定序列中所有字符串的连接。
df1=pd.read_csv('MotorccycleData.csv',encoding='gbk')
df1.head(5)
df1.info()
#将文本型价格转换为浮点型
#字符串str切片方法
df1['price'].str[1:3]
df1['price'].astype(float)

#str方法:
df1['价格']=df1['price'].str.strip('$')
df1['价格']=df1['价格'].str.replace(',','')
df1['价格']=df1['价格'].astype(int)
df1.info()


#先分割,再用字符串的方法
##将多个字符串分割为列表('nihao,nih,haome')
df1['location'].str.split(',')#分割
##提取分割为列表后的数据:
df1['location'].str.split(',').str[0]#字符串方法.str[0]
#字符串长度方法
df1['location'].str.len()

发布了65 篇原创文章 · 获赞 20 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/l641208111/article/details/104235873