Python数据处理:Excel文件的读取

Python数据处理:Excel文件的读取

处理Excel文件的主要三个库

  • xlrd
    读取Excel文件
  • xlwt
    向Excel文件写入,并设置格式
  • xlutils
    一组Excel高级操作工具(首先需要先安装xlrd和xlwt)

示例数据:https://cloud.189.cn/t/2ANNJraIrim2(访问码:5948)

"""
本次提取的是Excel文件中的child_labor和child_marriage统计数据
"""

import xlrd

# 打开的文件保存到book变量中
book = xlrd.open_workbook('SOWC 2014 Stat Tables_Table 9.xlsx')

# Excel工作簿中可以有多个标签或工作表,因此需要首先找到包含目标数据的工作表
sheet = book.sheet_by_name('Table 9 ')

data = {}

# 14是目标信息国家数据的起点,sheet.nrows返回工作表总行数
for i in range(14, sheet.nrows):
    #每一行内容组成的列表保存到row变量中
    row = sheet.row_values(i)
    # 提取出遍历每一行国家名称
    country = row[1]
    #将国家设为data字典的键,对应的值保存在另一个字典
    data[country] = {
        'child_labor': {
        'total':[row[4], row[5]],
        'male':[row[6], row[7]],
        'female':[row[8], row[9]],
    },
        'child_marriage':{
            'married_by_15':[row[10], row[11]],
            'married_by_18':[row[12], row[13]],
            }
        }

    # 去除最后一个国家之后的无用内容
    if country == 'Zimbabwe':
        break

# pprint可在终端在美化输出数据,适用于复杂数据结构
import pprint
pprint.pprint(data)

运行结果:
在这里插入图片描述
参考:《data wrangling with Python》Jacqueline kazil

猜你喜欢

转载自blog.csdn.net/weixin_41792682/article/details/89429354