27.python excel in processing library uses detailed openpyxl

openpyxl is a third-party library that can handle Excel file xlsx format. pip install openpyxl installation.

Read Excel files

Need to import related functions

?
1
2
3
from openpyxl import load_workbook
# 默认可读写,若有需要可以指定write_only和read_only为True
wb = load_workbook( 'pythontab.xlsx' )

The default open file to be read, if necessary you can specify parameters read_only to True.

Gets the worksheet --Sheet

?
1
2
3
4
5
6
7
8
# 获得所有sheet的名称
print (wb.get_sheet_names())
# 根据sheet名字获得sheet
a_sheet = wb.get_sheet_by_name( 'Sheet1' )
# 获得sheet名
print (a_sheet.title)
# 获得当前正在显示的sheet, 也可以用wb.get_active_sheet()
sheet = wb.active

Get a cell

?
1
2
3
4
5
6
7
# 获取某个单元格的值,观察excel发现也是先字母再数字的顺序,即先列再行
b4 = sheet[ 'B4' ]
# 分别返回
print (f '({b4.column}, {b4.row}) is {b4.value}' ) # 返回的数字就是int型
# 除了用下标的方式获得,还可以用cell函数, 换成数字,这个表示B2
b4_too = sheet.cell(row = 4 , column = 2 )
print (b4_too.value)

b4.column return B, b4.row returns 4, value is the value of that cell. Further there is a cell attribute coordinate, as this cell b4 returns coordinates B4.

For maximum rows and maximum columns

?
1
2
3
# 获得最大列和最大行
print (sheet.max_row)
print (sheet.max_column)

Gets rows and columns

sheet.rows as generator, which is data for each row, each row consists of a tuple package.

sheet.columns similar, but there is and each tuple is the cell of each column.

?
1
2
3
4
5
6
7
8
# 因为按行,所以返回A1, B1, C1这样的顺序
for row in sheet.rows:
  for cell in row:
   print (cell.value)
# A1, A2, A3这样的顺序
for column in sheet.columns:
  for cell in column:
   print (cell.value)

The above code data can be obtained for all cells. If you want to get the data in a row it? To which an index on the line, because the type sheet.rows generated, and then using the index can not be used after the index, converted into a list, list (sheet.rows) [2] This object is obtained tuple second row.

?
1
2
for cell in list (sheet.rows)[ 2 ]:
  print (cell.value)

How to get any cell range?

Range function may be used, the following wording, all cells obtained in the upper left corner A1, B3 for the lower right corner of the rectangular area. Note that range from the beginning, because in order and consistent expression in Excel, and programming languages ​​are not accustomed to 0 for the first value in openpyxl in.

?
1
2
3
4
5
6
7
8
9
10
11
for i in range ( 1 , 4 ):
  for j in range ( 1 , 3 ):
   print (sheet.cell(row = i, column = j))
    
# out
<Cell pythontab.A1>
<Cell pythontab.B1>
<Cell pythontab.A2>
<Cell pythontab.B2>
<Cell pythontab.A3>
<Cell pythontab.B3>

Use can also be used like a slice. sheet [ 'A1': 'B3'] returns a tuple, the tuple or tuple inside, constitute a tuple of the cells of each row.

?
1
2
3
4
5
6
7
8
9
10
for row_cell in sheet[ 'A1' : 'B3' ]:
  for cell in row_cell:
   print (cell)
    
for cell in sheet[ 'A1' : 'B3' ]:
  print (cell)
# out
(<Cell pythontab.A1>, <Cell pythontab.B1>)
(<Cell pythontab.A2>, <Cell pythontab.B2>)
(<Cell pythontab.A3>, <Cell pythontab.B3>)

根据字母获得列号,根据列号返回字母

需要导入, 这两个函数存在于openpyxl.utils

?

 

1
2
3
4
5
from openpyxl.utils import get_column_letter, column_index_from_string
# 根据列的数字返回字母
print (get_column_letter( 2 )) # B
# 根据字母返回列的数字
print (column_index_from_string( 'D' )) # 4

将数据写入Excel

工作表相关

需要导入WorkBook

?
1
2
from openpyxl import Workbook
wb = Workbook()

这样就新建了一个新的工作表(只是还没被保存)。

若要指定只写模式,可以指定参数write_only=True。一般默认的可写可读模式就可以了。

?
1
2
3
4
5
6
7
8
print (wb.get_sheet_names()) # 提供一个默认名叫Sheet的表,office2016下新建提供默认Sheet1
# 直接赋值就可以改工作表的名称
sheet.title = 'Sheet1'
# 新建一个工作表,可以指定索引,适当安排其在工作簿中的位置
wb.create_sheet( 'Data' , index = 1 ) # 被安排到第二个工作表,index=0就是第一个位置
# 删除某个工作表
wb.remove(sheet)
del wb[sheet]

写入单元格

还可以使用公式

?
1
2
3
4
# 直接给单元格赋值就行
sheet[ 'A1' ] = 'good'
# B9处写入平均值
sheet[ 'B9' ] = '=AVERAGE(B2:B8)'

但是如果是读取的时候需要加上data_only=True这样读到B9返回的就是数字,如果不加这个参数,返回的将是公式本身'=AVERAGE(B2:B8)'

append函数

可以一次添加多行数据,从第一行空白行开始(下面都是空白行)写入。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
# 添加一行
row = [ 1 , 2 , 3 , 4 , 5 ]
sheet.append(row)
# 添加多行
rows = [
  [ 'Number' , 'data1' , 'data2' ],
  [ 2 , 40 , 30 ],
  [ 3 , 40 , 25 ],
  [ 4 , 50 , 30 ],
  [ 5 , 30 , 10 ],
  [ 6 , 25 , 5 ],
  [ 7 , 50 , 10 ],
]

由于append函数只能按行写入。如果我们想按列写入呢。append能实现需求么?如果把上面的列表嵌套看作矩阵。只要将矩阵转置就可以了。使用zip()函数可以实现,不过内部的列表变成了元组就是了。都是可迭代对象,不影响。

?
1
2
3
4
5
list ( zip ( * rows))
# out
[( 'Number' , 2 , 3 , 4 , 5 , 6 , 7 ),
  ( 'data1' , 40 , 40 , 50 , 30 , 25 , 50 ),
  ( 'data2' , 30 , 25 , 30 , 10 , 5 , 10 )]

解释下上面的list(zip(*rows))首先*rows将列表打散,相当于填入了若干个参数,zip从某个列表中提取第1个值组合成一个tuple,再从每个列表中提取第2个值组合成一个tuple,一直到最短列表的最后一个值提取完毕后结束,更长列表的之后的值被舍弃,换句话,最后的元组个数是由原来每个参数(可迭代对象)的最短长度决定的。比如现在随便删掉一个值,最短列表长度为2,data2那一列(竖着看)的值全部被舍弃。

?
1
2
3
4
5
6
7
8
9
10
11
rows = [
  [ 'Number' , 'data1' , 'data2' ],
  [ 2 , 40 ],
  [ 3 , 40 , 25 ],
  [ 4 , 50 , 30 ],
  [ 5 , 30 , 10 ],
  [ 6 , 25 , 5 ],
  [ 7 , 50 , 10 ],
]
# out
[( 'Number' , 2 , 3 , 4 , 5 , 6 , 7 ), ( 'data1' , 40 , 40 , 50 , 30 , 25 , 50 )]

最后zip返回的是zip对象,看不到数据的。使用list转换下就好了。使用zip可以方便实现将数据按列写入。

保存文件

所有的操作结束后,一定记得保存文件。指定路径和文件名,后缀名为xlsx。

?
1
wb.save(r 'D:\example.xlsx' )

设置单元格风格--Style

先导入需要的类

?
1
from openpyxl.styles import Font, colors, Alignment

分别可指定字体相关,颜色,和对齐方式。

字体

?
1
2
bold_itatic_24_font = Font(name = '等线' , size = 24 , italic = True , color = colors.RED, bold = True )
sheet[ 'A1' ].font = bold_itatic_24_font

上面的代码指定了等线24号加粗斜体,字体颜色红色。直接使用cell的font属性,将Font对象赋值给它。

对齐方式

也是直接使用cell的属性aligment,这里指定垂直居中和水平居中。除了center,还可以使用right、left等等参数。

?
1
2
# 设置B1中的数据垂直居中和水平居中
sheet[ 'B1' ].alignment = Alignment(horizontal = 'center' , vertical = 'center' )

设置行高和列宽

有时候数据太长显示不完,就需要拉长拉高单元格。

?
1
2
3
4
# 第2行行高
sheet.row_dimensions[ 2 ].height = 40
# C列列宽
sheet.column_dimensions[ 'C' ].width = 30

合并和拆分单元格

所谓合并单元格,即以合并区域的左上角的那个单元格为基准,覆盖其他单元格使之称为一个大的单元格。

相反,拆分单元格后将这个大单元格的值返回到原来的左上角位置。

?
1
2
3
# 合并单元格, 往左上角写入数据即可
sheet.merge_cells( 'B1:G1' ) # 合并一行中的几个单元格
sheet.merge_cells( 'A1:C3' ) # 合并一个矩形区域中的单元格

合并后只可以往左上角写入数据,也就是区间中:左边的坐标。

如果这些要合并的单元格都有数据,只会保留左上角的数据,其他则丢弃。换句话说若合并前不是在左上角写入数据,合并后单元格中不会有数据。

以下是拆分单元格的代码。拆分后,值回到A1位置。

?

1
sheet.unmerge_cells( 'A1:C3' )

Guess you like

Origin www.cnblogs.com/ubuntu1987/p/11941475.html