- pandas中提供了字符串的函数,但只对字符型变量进行使用
- 通过str方法访问相关属性
- 可以使用字符串的相关方法进行数据处理
函数名称 |
说明 |
contain() |
返回表示各str是否含有指定模式的字符串 |
replace() |
替换字符串 |
lower() |
返回字符串的副本,其中所有字母都转换为小写 |
upper() |
返回字符串的副本,其中所有字母都转换为大写 |
split() |
返回字符串中的单词列表 |
strip() |
删除前导和后置空格 |
join() |
返回一个字符串,该字符串是给定序列中所有字符串的连接。 |
df1=pd.read_csv('MotorccycleData.csv',encoding='gbk')
df1.head(5)
df1.info()
#将文本型价格转换为浮点型
#字符串str切片方法
df1['price'].str[1:3]
df1['price'].astype(float)
#str方法:
df1['价格']=df1['price'].str.strip('$')
df1['价格']=df1['价格'].str.replace(',','')
df1['价格']=df1['价格'].astype(int)
df1.info()
#先分割,再用字符串的方法
##将多个字符串分割为列表('nihao,nih,haome')
df1['location'].str.split(',')#分割
##提取分割为列表后的数据:
df1['location'].str.split(',').str[0]#字符串方法.str[0]
#字符串长度方法
df1['location'].str.len()