用Python将多个excel表格合并为一个表格

#下面这些变量需要您根据自己的具体情况选择
biaotou=['学号','学生姓名','第一志愿','第二志愿','第三志愿','第四志愿','第五志愿','联系电话','性别','备注']
#在哪里搜索多个表格
#C:\\Users\\lihwa11\\Desktop\\Python\\filename
filelocation="C:\\Users\\lihwa11\\Desktop\\Python\\filename\\"
#当前文件夹下搜索的文件名后缀
fileform="xls"
#将合并后的表格存放到的位置
filedestination="C:\\Users\\lihwa11\\Desktop\\Python\\filename\\"
#合并后的表格命名为file
file="carson"
 
#首先查找默认文件夹下有多少文档需要整合
import glob
from numpy import *
filearray=[]
for filename in glob.glob(filelocation+"*."+fileform):
    filearray.append(filename)
#以上是从pythonscripts文件夹下读取所有excel表格,并将所有的名字存储到列表filearray
print("在默认文件夹下有%d个文档哦"%len(filearray))
ge=len(filearray)
matrix = [None]*ge
#实现读写数据
 
#下面是将所有文件读数据到三维列表cell[][][]中(不包含表头)
import xlrd
for i in range(ge):
    fname=filearray[i]
    bk=xlrd.open_workbook(fname)
    try:
        sh=bk.sheet_by_name("Sheet1")
    except:
        print ("在文件%s中没有找到sheet1,读取文件数据失败,要不你换换表格的名字?" %fname)
    nrows=sh.nrows 
    matrix[i] = [0]*(nrows-1)
    
    ncols=sh.ncols
    for m in range(nrows-1):  
        matrix[i][m] = ["0"]*ncols
 
    for j in range(1,nrows):
        for k in range(0,ncols):
            matrix[i][j-1][k]=sh.cell(j,k).value
#下面是写数据到新的表格test.xls中哦
import xlwt
filename=xlwt.Workbook()
sheet=filename.add_sheet("hel")
#下面是把表头写上
for i in range(0,len(biaotou)):
    sheet.write(0,i,biaotou[i])
#求和前面的文件一共写了多少行
zh=1
for i in range(ge):
    for j in range(len(matrix[i])):
        for k in range(len(matrix[i][j])):
            sheet.write(zh,k,matrix[i][j][k])
        zh=zh+1
print("我已经将%d个文件合并成1个文件,并命名为%s.xls.快打开看看正确不?"%(ge,file))
filename.save(filedestination+file+".xls")

 

 

 奇了怪了,这里出现了一个问题,就是文件后缀名为xlsx则会出现失败!等会看看怎么回事!

----------------------------------------------------更新-------------------------------------------------

# -*- coding: utf-8 -*-

#将多个Excel文件合并成一个
import xlrd
import xlsxwriter

#打开一个excel文件
def open_xls(file):
    fh=xlrd.open_workbook(file)
    return fh

#获取excel中所有的sheet表
def getsheet(fh):
    return fh.sheets()

#获取sheet表的行数
def getnrows(fh,sheet):
    table=fh.sheets()[sheet]
    return table.nrows

#读取文件内容并返回行内容
def getFilect(file,shnum):
    fh=open_xls(file)
    table=fh.sheets()[shnum]
    num=table.nrows
    for row in range(num):
        rdata=table.row_values(row)
        datavalue.append(rdata)
    return datavalue

#获取sheet表的个数
def getshnum(fh):
    x=0
    sh=getsheet(fh)
    for sheet in sh:
        x+=1
    return x


if __name__=='__main__':
    #定义要合并的excel文件列表
    allxls=['C:/Users/lihwa11/Desktop/Python/filename/2.xlsx',
            'C:/Users/lihwa11/Desktop/Python/filename/4.xlsx','C:/Users/lihwa11/Desktop/Python/filename/34.xlsx',
           'C:/Users/lihwa11/Desktop/Python/filename/54.xlsx','C:/Users/lihwa11/Desktop/Python/filename/b4.xlsx']
    #存储所有读取的结果
    datavalue=[]
    for fl in allxls:
        fh=open_xls(fl)
        x=getshnum(fh)
        for shnum in range(x):
            print("正在读取文件:"+str(fl)+"的第"+str(shnum)+"个sheet表的内容...")
            rvalue=getFilect(fl,shnum)
    #定义最终合并后生成的新文件
    endfile='demo.xlsx'
    wb1=xlsxwriter.Workbook(endfile)
    #创建一个sheet工作对象
    ws=wb1.add_worksheet()
    for a in range(len(rvalue)):
        for b in range(len(rvalue[a])):
            c=rvalue[a][b]
            ws.write(a,b,c)
    wb1.close()
    print("文件合并完成")

补充链接:https://blog.csdn.net/Together_CZ/article/details/86689272 

更新:还有利用pandas来处理的;

import  pandas as pd
file1='C:/Users/lihwa11/Desktop/Python/filename/2.xlsx'
file2='C:/Users/lihwa11/Desktop/Python/filename/4.xlsx'
file3='C:/Users/lihwa11/Desktop/Python/filename/34.xlsx'
file=[file1,file2,file3]
li=[]
for i in file:
    li.append(pd.read_excel(i))
writer = pd.ExcelWriter('C:/Users/lihwa11/Desktop/Python/filename/output.xlsx')
pd.concat(li).to_excel(writer,'Sheet1',index=False)
 
writer.save()

#综上所述,还是pandas好用
import pandas as pd
file1='C:/Users/lihwa11/Desktop/Python/filename/a.xlsx'
file2='C:/Users/lihwa11/Desktop/Python/filename/b.xlsx'
file3='C:/Users/lihwa11/Desktop/Python/filename/c.xlsx'
file4='C:/Users/lihwa11/Desktop/Python/filename/d.xlsx'
file5='C:/Users/lihwa11/Desktop/Python/filename/e.xlsx'
dfs = []
for fn in (file1,file2,file3,file4,file5):
    dfs.append(pd.read_excel(fn))
df = pd.concat(dfs)
df.to_excel('C:/Users/lihwa11/Desktop/Python/filename/sun.xlsx',index = False)

参考链接 :https://zhuanlan.zhihu.com/p/36031795   对应的数据包

猜你喜欢

转载自blog.csdn.net/OYY_90/article/details/88711411