版权声明:本文为连鹏伟原创文章,未经博主允许不得转载。 https://blog.csdn.net/lpwmm/article/details/80875922
任务介绍:
有这么一个xls文件,里面包含多个工作簿,每个工作簿中的数据格式都一样,需要将所有的工作簿拼接到一起,然后取出Tel列,将包围的括号去掉,并且判断如果是0372开头的,那么也将开头的0372去掉,最终获得纯电话号码数据
代码撸起:
import pandas as pd
# 将Excel中每个Sheet拼接到一起
file = pd.ExcelFile('0629.xls')
df = []
for sheet in file.sheet_names:
df.append(file.parse(sheet))
cdf = pd.concat(df)
tel = cdf['Tel'].str[1:-1]
# 去除电话号码外面的括号,判断如果是0372开头则去除
for idx, t in enumerate(tel):
if t[0:4] == '0372':
tel[idx] = t[4:]
tel.to_csv('tel.csv')
怼完后输出的csv效果: