Python操作Excel实例(xlrd、xlwt模块)

一、前言

关于Python的xlrd、xlwt模块的使用,推介另一位博客主的博文:https://www.cnblogs.com/zhoujie/p/python18.html

这篇里面有详细介绍这两个模块的基本用法。

以下是关于我运用xlrd、xlwt模块的一个实例。需求如下:

需求是用宏去做的,但是因为时间比较紧急,我用了1天去“研究”怎么用宏去写,发现作为一个VBA入门者,比较难短时间学习并解决这个问题,因为VBA的可读性比较差的缘故吧。

于是我选择用Python去实现。


二、主体

这个需求还算比较简单,主要是分为“读”和“写”两部分。

(一)读取部分

 从Excel文件“测试题.xls”里面的“表格数据1”,“表格数据2”,“数据透视表”三个sheet中提取区域和各区域的店铺,并要求同一区域内的店铺名称不重复。

需求也很简单,就是“区域”和“店铺名称”两个元素进行去重和读取。

1.读取思路

1.1读取范围

读取范围主要是从“表格数据1”,“表格数据2”,“数据透视表”三个sheet中提取区域和各区域的店铺,如下:

三个表都是从A1,B1或者A2,B2开始,但是表的末尾有些其他文字注释,于是我用的判断条件设为是否中文和是否为空值。

#构造一个函数判断是否中文
def is_Chinese(word):
    for ch in word:
        if '\u4e00' <= ch <= '\u9fff':
            return True
    return False

1.2去重判断

读取到的数据需要一个临时的“容器”,打算利用单个区域和店铺放到一个元组里面,然后把所有的元组放到一个列表里面。

然后将每个新元组和列表里面的元组对比,看是否已经存在于列表中,从而达到去重的目的。

def read_excel():
    # 打开文件
    workbook = xlrd.open_workbook(r'D:\安装包\测试题.xls')

    #写一个循环体,筛选出不重复的区域和店铺
    #将涉及到区域和店铺的三个sheet中,不重复的区域和店铺名称写入元组内并存于一个列表内
    sheet_name = ['表格数据1','表格数据2','数据透视表']
    tup1 = []
    for j in range(3):
        sheet_source = workbook.sheet_by_name(sheet_name[j])
        nrows = sheet_source.nrows
        for i in range(nrows):
            if is_Chinese(sheet_source.cell(i,0).value) == False and sheet_source.cell(i,0).value != "":
                a = (sheet_source.cell(i,0).value,sheet_source.cell(i,1).value)
                if a not in tup1 :
                    tup1.append(a)
                else:
                    pass
            else:
                 pass

 读取完数据,按照它的需求,是要弹出一个提示框的

#python弹出窗口,提示“读取完成!”
    msg.showinfo("Excel_Reading","读取已经完成!")

1.3统计店铺数量

“容器”tup1列表里面,放的是原始的数据,需要写个循环,去统计不同区域内的店铺数量。

    #利用将元组转为字典,并统计各个区域的店铺数量
    dict1 = {}
    for i in tup1:
        if i[0] not in dict1.keys():
            dict1[i[0]] = 1
        else:
            dict1[i[0]] += 1

 读取部分完成。完整代码如下:

import xlrd
import xlwt
import tkinter.messagebox as msg

def is_Chinese(word):
    for ch in word:
        if '\u4e00' <= ch <= '\u9fff':
            return True
    return False

#读取数据
def read_excel():
    # 打开文件
    workbook = xlrd.open_workbook(r'D:\安装包\测试题.xls')

    #写一个循环体,筛选出不重复的区域和店铺
    #将涉及到区域和店铺的三个sheet中,不重复的区域和店铺名称写入元组内并存于一个列表内
    sheet_name = ['表格数据1','表格数据2','数据透视表']
    tup1 = []
    for j in range(3):
        sheet_source = workbook.sheet_by_name(sheet_name[j])
        nrows = sheet_source.nrows
        for i in range(nrows):
            if is_Chinese(sheet_source.cell(i,0).value) == False and sheet_source.cell(i,0).value != "":
                a = (sheet_source.cell(i,0).value,sheet_source.cell(i,1).value)
                if a not in tup1 :
                    tup1.append(a)
                else:
                    pass
            else:
                 pass

    #python弹出窗口,提示“读取完成!”
    msg.showinfo("Excel_Reading","读取已经完成!")

    #利用将元组转为字典,并统计各个区域的店铺数量
    dict1 = {}
    for i in tup1:
        if i[0] not in dict1.keys():
            dict1[i[0]] = 1
        else:
            dict1[i[0]] += 1
    return (dict1)

 (二)写入部分

需要新建一个Excel,创建一个叫“总表”的sheet,写入标题、表头,以及根据上述的read_excel函数返回的字典,写入内容。

1、样式部分

因为写入函数.write()里面有多个参数是用来设定你写入内容的样式的,所以这里做一个函数,把需要设定的参数做一个封包。

def set_style(height,bold=False):
    style = xlwt.XFStyle()  # 初始化样式
    
    font = xlwt.Font()  # 为样式创建字体
    font.name = 'Times New Roman' 
    font.bold = bold
    font.color_index = 4
    font.height = height
    style.font = font

    alignment = xlwt.Alignment()# 为样式创建居中方式
    alignment.horz = xlwt.Alignment.HORZ_CENTER
    style.alignment = alignment

    
    borders = xlwt.Borders()  # 为样式创建边框
    borders.left = xlwt.Borders.MEDIUM  
    borders.right = xlwt.Borders.MEDIUM  
    borders.top = xlwt.Borders.MEDIUM  
    borders.bottom = xlwt.Borders.MEDIUM  

    borders.left_colour = 0x40 # 边框上色
    borders.right_colour = 0x40
    borders.top_colour = 0x40
    borders.bottom_colour = 0x40
    style.borders = borders

    return style

2、写入excel

def write_excel(**dd): #两个**代表输入一个字典作为参数
    f = xlwt.Workbook() #创建工作簿

    '''
    创建第一个sheet:
        sheet1
    '''
    sheet1 = f.add_sheet(u'总表',cell_overwrite_ok=True) #创建sheet

    sheet1.col(1).width = 256 * 20 #调整列宽,256是一个固定的单位

    row1 = [u'区域',u'店铺数量(家)']

    #生成标题
    sheet1.write_merge(0,0,0,1,u'总表',set_style(300,True))

    #生成第二行表头
    for i in range(0,len(row1)):
        sheet1.write(1,i,row1[i],set_style(220,True))

    #写入数据
    i = 2
    for a,b in dd.items():
        if b>=10: #将店铺数量大于10的数据,写入Excel
            sheet1.write(i,0,a,set_style(220))
            sheet1.write(i,1,b,set_style(220))
            i +=1
        else:
            pass

    f.save('总表.xlsx') #保存文件,文件会保存在此Python脚本所在的文件夹内。

最后执行:

write_excel(**read_excel())

效果图:

猜你喜欢

转载自www.cnblogs.com/10sxluo/p/10338122.html