xlrd安装与入门常用指令归纳

前言

在近期的数据处理实战中,从excel中快速提取数据是提升效率的关键。我之前从来没有系统学习过python中关于excel的包,这篇文章算是一个常用命令入门归纳吧。

安装xlrd

pip install xlrd==1.2.0
之所以不安装最新版本,是因为最新的2.1.0版本无法支持读取xlsx(我也不懂为啥就不支持了),实在是很不方便。

常用指令与参数

统一一下,excel表为workbook, 表单为sheet. 具体的API可以直接参照文档

xlrd.open_workbook

  • 功能:打开一个excel表
  • 参数
    • filename: excel文件的路径
    • 还有好多返回值,但如果只是要读数据倒也用不上
  • 返回值
    • 一个Book类的实例

workbook.sheet_by_name()和workbook.sheet_by_index()

sheet_by_name(sheet_name)

  • 功能:根据名字找sheet
  • 参数
    • sheet_name:表单的名字
  • 返回值
    • 一个Sheet

sheet_by_index(sheetx)

  • 功能:根据index找sheet
  • 参数
    • sheetx:表单的index
  • 返回值
    • 一个Sheet

sheet.row_values()和sheet.col_values()

sheet.row_values(rowx, start_colx=0, end_colx=None)

  • 功能:找到一整行的值
  • 参数
    • rowx:第几行
    • start_colx:从哪一列开始
    • end_colx:在哪一列结束
  • 返回值
    • 返回一整行的值

sheet.col_values(colx, start_rowx=0, end_rowx=None)

  • 功能:找到一整列的值
  • 参数
    • colx:第几列
    • start_rowx:从哪一行开始
    • end_rowx:在哪一行结束
  • 返回值
    • 返回一整列的值

sheet.cell_values(rowx, colx)

  • 功能:返回一个格子的值
  • 参数:
    • rowx:行数
    • colx:列数
  • 返回值
    • 返回格子的值

xlrd.xldate.xldate_as_datetime(xldate,datemode)

  • 功能:将Excel的日期/时间转为datetime.datetime对象
  • 参数
    • xldate:Excel
    • datemode:0:从1900年开始,1:从1904年开始
  • 返回值
    • datetime.datetime对象

读取有合并单元格的数据

如果有合并单元格的数据,读取行或列的时候只有第一个位置是有值的,其余都是空的。例如:
我们看到的excel表格是:

John的CV
姓名 身份证号
而读取的时候是:
John的CV
姓名 身份证号

(0,1)位置就是空的。这点要注意。

猜你喜欢

转载自blog.csdn.net/skywuuu/article/details/112668052