往往写爬虫的时候,有些需求是需要直接将数据存入excel文档,或者读取出来并处理的,所以如何用python操作excel将会非常方便我们将数据可视化非常方便。
python首先安装openpyxl模块,据我来说,其它操作excel的模块没有openpyxl简洁。下面会体会到。
pip install openpyxl
写入数据
如果是要创建新的文档需要导入Workbook
from openpyxl import Workbook
# 生成新的excel文档
workbook = Workbook()
# 获取第一张工作表
sheet = workbook.active
# # 添加一整行数据
sheet.append(['用户id','性别','昵称','市代码','省代码'])
# 本地保存test.xlsx
workbook.save("test.xlsx")
如果是要加载并追加已经存在的xlsx文档,就要导入load_workbook
from openpyxl import load_workbook
# 加载已经存在的excel文档
workbook = load_workbook('test.xlsx')
# 获取第一张工作表
sheet = workbook.active
# 添加一整行数据
sheet.append(['用户id','性别','昵称','市代码','省代码'])
# 保存
workbook.save()
加入数据话,一般采用的是一整行一整行的添加,非常方便高效
sheet.append(['用户id','性别','昵称','市代码','省代码'])
sheet.append(['78459037','1','Roger卓','441200','440000'])
读取数据
读取的话,同样的先打开一个工作表
workbook = openpyxl.load_workbook("创新积分核心指标所需数据.xlsx")
# 可以使用workbook对象的sheetnames属性获取到excel文件中哪些表有数据
table = workbook.active
# 获取最大列数
rows = table.max_row
# 获取最大行数
cols = table.max_col
如果要获取哪行哪列的数据,然后使用这个就行了
table.cell(4, 5).value
即获取第4行5列的数据